Você está na página 1de 128

ANLISE DE DADOS EM CINCIAS SOCIAIS

INTRODUO S TCNICAS UTILlZNDO O SPSS PARA WINDOWS


Ttulo Anlise de dodos em Cincios Sociois
CELTA
www.celtaeditora.pt
Ruo Vera Cruz, 28 I 2780-305 Oeiras
Apartado 151 12781-901 Oeiras
Tel: 2144174331 Fax: 214467304
mail@celtaeditora.pt
Autor Alon Brymon e Duncon Creme r
Distribuidor HT - Rua Rodrigues Sampaio, 77, c/v Lisboa
Tel: 213529006/08 I Fax; 213159259
ISBN 972-774-169-X
Preo 28,35
ALAN BRYMAN E DUNCAN CRAMER
ANLISE DE DADOS
EM CINCIAS SOCIAIS
INTRODUO S TCNICAS UTILIZANDO O SPSS PARA WINDOWS
Traduo
Alexandra Figueiredo de Barros (La edio)
Diniz Lopes (3: edio)
Reviso tcnica
Lusa Pedroso de Lima (La edio)
Diniz Lopes (3: edio)
CELTA EDITORA
OEIRAS / 2003
Ttulo original: QuantitativData Analysis with SPSS Release 10for Windows:
A Cuide for Social Scientists
Routledge, 2001
Alan Bryman e Duncan Cramer
Anlise de Dados em Cincias Sociais: Introduo s Tcnicas Utilizando
o SPSS O para Windows
Primeira edio portuguesa: Novembro de 1992
Tiragem: 1000 Exemplares
Segunda edio portuguesa: Novembro de 1993
Tiragem: 1000 Exemplares
Terceira edio portuguesa: Maro de 2003
Tiragem: 1000 Exemplares
Traduo do ingls: Alexandra Figueiredo de Barros (La edio) e Diniz Lopes (3.a edio)
Reviso tcnica: Lusa Pedroso de Lima (La edio) e Diniz Lopes (3: edio)
ISBN: 972-774-169-X
Depsito legal: 192457/03
ISBN da edio original: 0-415-24400-5, Londres, Routledge
Composio: Celta Editora, utilizando caracteres Palatino, corpo 10
Capa: Mrio Vaz I Arranjo: Paula Neves
Impresso e acabamentos: Tipografia Lousanense, Lda.
Reservados todos os direitos para a lngua portuguesa,
de acordo com a legislao em vigor, por Celta Editora, Lda.
CeIta Editora, Rua Vera Cruz, 2B, 2780-305 Oeiras, Portugal
Endereo postal: Apartado 151, 2781-901 Oeiras, Portugal
Te!.: (+351) 214 417 433
Fax: (+351) 214467304
E-mail: mai!@celtaeditora.pt
Pgina: www.celtaeditora.pt
PLANO DA OBRA
ndice de figuras, caixas e quadros Xl
Prefcio xxi
1 Aanlise de dados e o processo de investigao 1
2 Analisar dados com o computador: os primeiros passos
com o SPSS10para Windows 19
3 Analisar dados com o computador: dominar melhor
o SPSS10para Windows 47
4 Os conceitos e a sua medio 63
5 Resumir os dados 81
6 Arnostragem e significncia estatstica 111
7 Anlise bivariada: explorar diferenas entre valores
de duas variveis 131
8 Anlise bivariada: identificar associaes entre variveis 183
9 Anlise multivariada: explorar diferenas entre trs
ou mais variveis 225
10 Anlise multivariada: caracterizar relaes entre trs
ou mais variveis 259
11 Agregar variveis: anlise fadorial exploratria 297
Respostas aos exerccios 313
Referncias bibliogrficas 325
NDICE
Plano da obra v
ndice de figuras, caixas e quadros xi
Prefcio xxi
A ANLISE DE DADOS E O PROCESSO DE INVESTIGAO. 1
A anlise de dados quantitativos e o processo de investigao 2
Plano de investigao e causalidade 8
Inqurito/plano correlacional e causalidade 14
Exerccios 16
ANALISAR DADOS COM O COMPUTADOR: OS PRIMEIROS
PASSOS COM O SPSS 10 PARA WINDOWS 19
O ficheiro de dados 20
Como ter acesso ao SPSS 25
A introduo e edio de dados no Data Editor 29
Procedimentos estatsticos 37
Guardar e imprimir o Output 40
Sistema de ajuda 40
Terminar uma sesso de trabalho no SPSS 41
Exerccios 41
Apndice 2.1 Questionrio do Trabalho 43
ANALISAR DADOS COM O COMPUTADOR:
DOMINAR MELHOR O SPSS 10 PARA WINDOWS 47
Seleccionar casos 48
Operadores relacionais 49
Combinar operadores lgicos 50
Recodificar os valores das variveis 51
Criar uma nova varivel 56
viii
ANLISE DE DADOS EM CINCIAS SOCIAIS
Dados omissos e clculo de valores para formar medidas
compostas 57
Exerccios 60
4 OS CONCEITOS E A SUA MEDIO 63
Tipos de variveis 66
Dimenses dos conceitos 70
Validade e fidelidade das medidas 73
Exerccios 78
5 RESUMIR OS DADOS 81
Distribuies de frequncia 81
Medidas de tendncia central 92
Medir a disperso 95
Mtodos de apresentao dos dados: diagramas
troncos-e-folhas e diagramas extremos-e-quartis 98
A forma de uma distribuio 104
Exerccios 108
6 AMOSTRAGEM E SIGNIFICNCIA ESTATSTICA 111
Amostragem 111
Problemas relacionados com a amostragem 116
Significncia estatstica 118
A inferncia a partir de amostras da populao 126
Exerccios 129
7 ANLISE BIVARIADA: EXPLORAR DIFERENAS
ENTRE VALORES DE DUAS VARIVEIS 131
Critrios para seleccionar testes bivariados de diferenas 132
Testes paramtricos versus no paramtricos 133
Variveis nominais e testes no paramtricos 136
Variveis no nominais e testes no paramtricos 147
Variveis no nominais e testes paramtricos 159
Anlise de varincia a um factor para trs ou mais mdias no
relacionadas 165
Anlise de varincia multivariada para trs ou mais mdias
relacionadas 174
Exerccios 180
8 ANLISE BIVARIADA: IDENTIFICAR ASSOCIAES ENTRE
VARIVEIS 183
Tabelas de contingncia (crosstabulation) 184
Tabelas de contingncia e significncia estatstica: o teste do
qui-quadrado (X2) 190
Correlao 195
NDICE
ix
Outras abordagens de associaes entre duas variveis 207
Regresso 211
Abordagem geral sobre os diferentes tipos de variveis
e mtodos de anlise das suas relaes 220
Exerccios 222
9 ANLISE MULTIVARIADA: EXPLORAR DIFERENAS
ENTRE TRS OU MAIS VARIVEIS 225
Planos de estudo multivariados 225
Anlise multi variada 235
Exerccios 256
10 ANLISE MULTIVARIADA: CARACTERIZAR RELAES
ENTRE TRS OU MAIS VARIVEIS 259
Anlise multivariada atravs de tabelas de contingncia 261
Anlise multivariada e correlao 270
Regresso e anlise multivariada 275
Path analysis 287
Exerccios 293
11 AGREGAR VARIVEIS: ANLISE FACTORIAL
EXPLORATRIA 297
Matriz de correlaes (correlation matrix) 299
Componentes principais ou factores? 300
Nmero de factores a manter 303
Rotao de factores 305
O procedimento do SPSS para a anlise factorial 308
Exerccios 309
Respostas aos exerccios 313
Referncias bibliogrficas 325
NDICE DE FIGURAS, CAIXAS E QUADROS
Figuras
~.1 Oprocesso de investigao 3
~.2 Uma relao espria 10
~.3 Um estudo experimental 12
~.4 Trs tipos de planos experimentais 13
~.5 Uma relao entre duas variveis 15
~.6 Arelao ser espria? 15
~.7 Duas possibilidades de interpretao causal de uma relao 16
~.1 Deciso da natureza de uma varivel 67
~.2 Conceitos, dimenses e medidas 71
:-.1 Grfico de barras referente distribuio dos estudantes
por faculdades 83
:-.2 Histograma para os valores da varivel rendim
(dados do Questionrio do Trabalho) 85
5.3 Diagrama de "queijo" para gpracial (dados do Questionrio
do Trabalho) 90
5.4 Amplitude interquartis 97
.5 Diagrama de troncos-e-folhas para a varivel necess 102
5.6 Diagrama de extremos-e-quartis 104
5.7 Diagrama extremos-e-quartis da varivel necess
(output do SPSS) 104
Duas distribuies normais 106
5.9 Mdia e distribuio normal 106
:-.10 Propriedades da distribuio normal 107
5.11 Distribuies positiva e negativamente enviesada 108
, .1 Resultados tericos similares de dois lanamentos de
uma moeda 119
xii
ANLISE DE DADOS EM CINCIAS SOCIAIS
6.2
6.3
6.4
7.1
8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9
8.10
8.11
8.12
8.13
8.14
8.15
8.16
8.17
9.1
9.2
9.3
9.4
9.5
9.6
10.1
10.2
10.3
10.4
Distribuio de resultados tericos similares obtidos por 64
lanamentos de moeda .
Nvel de significncia de 5% para hiptese unicaudal
ou bicaudal .
Intervalos de confiana .
Uma comparao da distribuio do erro padro da diferena
de mdias para amostras relacionadas .
Diagrama de disperso mostrando uma associao negativa:
satis por rotina .
Diagrama de disperso mostrando uma associao positiva .
Uma associao perfeita .
Ausncia de associao entre duas variveis .
Trs associaes curvilineares .
Duas associaes positivas .
Duas associaes negativas .
Fora e direco dos coeficientes de correlao .
Tipos de associaes entre duas variveis .
A recta de regresso .
Regresso: uma associao negativa .
Regresso: um ponto de intercepo negativo .
Regresso: uma associao perfeita .
A preciso da recta de regresso .
Diagramas de disperso correspondentes a dois nveis
de correlao idnticos .
Heterocedasticidade .
Diagrama de disperso do SPSS com recta de regresso
(Dados do Questionrio de Trabalho) .
Exemplo de uma interaco entre duas variveis .
Exemplos de outros tipos de interaco entre duas variveis .
Exemplos de ausncia de interaco entre duas variveis .
Representao esquemtica de um efeito significativo
de um factor .
Nveis de depresso ps-teste em mulheres e homens (Projecto
Depresso) .
Nveis de depresso pr e ps-teste nos trs tratamentos
(Projecto Depresso) .
Ser que a relao entre a variedade nas funes e a satisfao
no trabalho espria? .
Ser a relao entre a variedade das funes e a satisfao
no trabalho afectada por uma varivel interveniente? .
Ser que a relao entre a variedade das funes e a satisfao
no trabalho moderada pelo sexo? .
Causalidade mltipla .
119
125
128
173
196
197
197
197
198
199
199
200
201
213
214
214
215
215
216
217
222
226
227
228
230
239
252
262
265
267
269
NDICE DE FIGURAS, CAIXAS E QUADROS xiii
0.3 Os efeitos do controlo de uma varivel em teste 272
10.6 Diagrama de path para satis 288
:0.7 Diagrama path para satis, especificando os coeficientes path 291
:0.8 Diagrama path para absent 292
_1.1 Varincia comum e varincia nica 301
_1.2 Teste scree dos valores prprios (Questionrio do Trabalho) 304
,
Caixas
:.1 A janela de abertura do Windows 95/98 26
_.2 O Editor de Dados (Data Editor) do SPSS 27
_.3 O men drop-down da opo Data 27
_A A caixa de dilogo Select Cases 28
_.3 A janela Variable View do Data Editor 30
_.6 A caixa de dilogo Missing values 32
_.7 A caixa de dilogo Value labels 33
_.8 O menu drop-down File 34
_.9 A caixa de dilogo Save Data As 35
_.10 A caixa de dilogo Open File 36
_.11 A caixa de dilogo Text Import Wizard 37
_.12 A caixa de dilogo Descriptives 38
_.13 A subcaixa de dilogo Descriptive: Options 39
_.14 A caixa de dilogo Help Topics Content 41
_.15 A caixa de dilogo Help Topics Find 42
_.16 A caixa de informao Help 42
3.1 A caixa de dilogo Select Cases 47
3.2 A subcaixa de dilogo Select Cases: If : 48
3.3 A caixa de dilogo Recode into Different Variables 51
3.4 A subcaixa de dilogo Recode into Different Variables:
Old and New Values 52
3.5 A caixa de dilogo Summarize Cases 53
3.6 A caixa de dilogo Recode into Same Variables 55
3.7 A subcaixa de dilogo Recode into Same Variables:
Old and New Values 55
3.8 A caixa de dilogo Compute Variable 56
4.1 A caixa de dilogo Reliability Analysis 76
-t2 A subcaixa de dilogo Reliability Analysis: Statistics 77
3.1 A recodificao de rendim para rendimgp 87
3.2 A subcaixa de dilogo Recode into Different Variables:
Old and New Values 87
3.3 A caixa de dilogo Frequencies 88
3.4 A caixa de dilogo Bar Charts 89
xiv ANLISE DE DADOS EM CINCIAS SOCIAIS
5.5
5.6
5.7
5.8
5.9
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
7.19
7.20
7.21
7.22
7.23
8.1
8.2
8.3
8.4
8.5
8.6
8.7
8.8
8.9
9.1
A subcaixa de dilogo Define Simple Bar: Summaries
for Groups of Cases .
A caixa de dilogo Pie Charts .
A subcaixa de dilogo Define Pie: Summaries for
Groups of Cases .
A caixa de dilogo Explore .
A subcaixa de dilogo Frequencies: Statistics .
A caixa de dilogo Binomial Test .
A caixa de dilogo Chi-Square Test .
A caixa de dilogo Crosstabs .
A subcaixa de dilogo Crosstabs: Cell Display .
A subcaixa de dilogo Crosstabs: Statistics .
A caixa de dilogo Two-Related Samples Tests .
A caixa de dilogo Tests for Several Related Samples .
A caixa de dilogo One-Sample Kolmogorov-Smirnov Test .
A caixa de dilogo Two-Independent-Samples Tests .
A subcaixa de dilogo Two Independent Samples:
Define Groups .
A caixa de dilogo Tests for Several Independent Samples .
A subcaixa de dilogo Several Independent Samples:
Define Range .
A caixa de dilogo One-Sample T Test .
A caixa de dilogo Independent-Samples T Test .
A subcaixa de dilogo Define Groups .
A caixa de dilogo One-Way ANOVA .
A subcaixa de dilogo One-Way ANOVA .
A subcaixa de dilogo One-Way ANOVA: Contrasts .
A subcaixa de dilogo One-Way ANOVA: Post Hoc Multiple
Comparisons .
A caixa de dilogo Paired-Samples T Test .
A caixa de dilogo Repeated Measures Define Factor[s] .
A subcaixa de dilogo Repeated Measures .
A subcaixa de dilogo Repeated Measures: Options .
A caixa de dilogo Crosstabs .
A subcaixa de dilogo Crosstabs: Statistics .
A subcaixa de dilogo Crosstabs: Cell Display .
A caixa de dilogo Scatterplot .
A subcaixa de dilogo Simple Scatterplot .
A caixa de dilogo Bivariate Correlations .
A caixa de dilogo Means .
A subcaixa de dilogo Means: Options .
A caixa de dilogo Linear Regression .
A caixa de dilogo Univariate .
90
91
91
98
108
137
139
143
143
144
146
148
149
151
151
152
153
160
163
163
167
168
169
170
173
176
176
177
189
189
190
203
204
204
210
210
220
236
NDICE DE FIGURAS, CAIXAS E QUADROS
xv
9.2 A subcaixa de dilogo Univariate: Options 237
.3 A subcaixa de dilogo Univariate: Profile Plots 237
.-l A subcaixa de dilogo Univariate: Model 242
9.3 A caixa de dilogo Multivariate 245
9.6 A subcaixa de dilogo Multivariate: Options 246
9.7 A caixa de dilogo Repeated Measures Define Factor[s] 249
9.8 A subcaixa de dilogo Repeated Measures 250
.9 A subcaixa de dilogo Repeated Measures: Options 25
9.10 A subcaixa de dilogo Repeated Measures: Profile Plots 251
9.11 A caixa de dilogo completa Repeated Measures:
Define Factor[s] 253
9.12 A subcaixa de dilogo Repeated Measures
(anlise de plano combinado) 254
10.1 A caixa de dilogo Partial Correlations 274
"1.0.2 A subcaixa de dilogo Partial Correlations: Options 274
:0.3 A caixa de dilogo Linear Regression 285
:0.4 A subcaixa de dilogo Linear Regression: Statistics 285
:1.1 A caixa de dilogo Factor Analysis 310
11.2 A subcaixa de dilogo Factor Analysis: Descriptives 310
"1.1.3 A subcaixa de dilogo Factor Analysis: Extraction 310
11.4 A subcaixa de dilogo Factor Analysis: Rotation 311
11.5 A subcaixa de dilogo Factor Analysis: Options 311
Quadros
.1 Violncia na televiso e agresso 10
_.1 Os dados do Questionrio do Trabalho 22
2.2 Nomes e localizao das variveis do Questionrio
de Trabalho no SPSS 25
_.3 O output do comando Descritptives 38
2.4 O output Mean Descriptive 39
3.1 Idade mdia dos sujeitos do sexo masculino do Questionrio
de Trabalho 49
3.2 O output do comando Case Summaries mostrando os valores
recodificados de rsatis2 e rsatis4 54
3.3 O output do comando Case Summaries mostrando os valores
de satisl, rsatis2, satis3, rsatis4 e satis 57
3.4 Os dados transformados do Questionrio de Trabalho 61
';.1 Tipo de variveis 67
.. 1,,2 O ouput da anlise de fidelidade da varivel satis
(Questionrio do Trabalho) 76
xvi ANLISE DE DADOS EM CINCIAS SOCIAIS
5.1 Faculdades a que pertencem cinquenta e seis alunos
(Dados Fictcios) 82
5.2 Tabela de frequncia referente aos dados apresenados
no quadro 5.1 83
5.3 Distribuio de frequncias para os valores de rendim (dados
do Questionrio do Trabalho) 85
5.4 Tabela de frequncias para rendimgp (output do SPSS) 88
5.5 Resultados de um teste de aptido matemtica aplicado
aos alunos de dois professores (Dados Fictcios) 96
5.6 O output do comando Explore para a varivel rendim 99
5.7 Percentagem de necessidades satisfeitas pelas autarquias
num perodo de seis meses em Inglaterra e Esccia, 1993-1994.... 101
6.1 Definio de uma amostra estratificada: trabalhadores
no manuais de uma empresa 116
6.2 Os quatro resultados que se podem obter a partir de dois
lanamentos da moeda 118
6.3 Resultados tericos correspondentes ao lanamento de uma
moeda 64vezes: probabilidade de resultados similares 120
6.4 Erros do Tipo I e do Tipo II 126
7.1 Testes de diferenas para duas variveis 134
7.2 Comparao da proporo de homens e mulheres atravs
do teste binomial (Questionrio de Trabalho) 138
7.3 Comparao da proporo de brancos e no brancos atravs
do teste binomial (Questionrio do Trabalho) 138
7.4 Comparao do nmero de pessoas em cada um dos grupos
tnicos atravs do teste de qui-quadrado para uma amostra
(Questionrio de Trabalho) 140
7.5 Teste de qui-quadrado comnmero insuficiente de casos
(Questionrio de Trabalho) 141
7.6 O teste de qui-quadrado efectuado pelo procedimento Crosstabs,
comparando o nmero de homens e mulheres branco
e no brancos 144
7.7 Os dados do estudo de painel 145
7.8 Teste de McNemar comparando a comparncia s reunies
em dois meses (Estudo de Painel) 146
7.9 Teste Q de Cochran comparando a comparncia s reunies
em trs meses (Estudo de Painel) 149
7.10 Teste de Kolmogorov-Smirnov para uma amostra comparando
a distribuio da qualidade do trabalho
(Questionrio de Trabalho) 150
7.11 Teste de Kolmogorov-Smirnov para dua':;amostras comparando
a distribuio da qualidade do trabalho em homens e mulheres
(Questionrio do Trabalho) 152
DICE DE FIGURAS, CAIXAS E QUADROS xvii
-0-
.~::>
- -9
- 31
-23
168
171
167
174
169
168
179
177
178
160
164
179
179
165
159
158
154
153
155
157
Teste de medianas comparando a qualidade de trabalho
em homens e mulheres (Questionrio do Trabalho) .
Teste de Mann-Whitney comparando a qualidade do trabalho
em homens e mulheres (Questionrio do Trabalho) .
Teste de Kruskal-Wallis comparando a qualidade do trabalho
entre grupos tnicos (Questionrio do Trabalho) .
Teste dos sinais comparando a qualidade do trabalho em dois
meses (Estudo de Painel) .
Teste das ordens de Wilcoxon comparando a qualidade
do trabalho nos dois primeiros meses (Estudo de Painel) .
Teste de Friedman comparando a qualidade do trabalho em
trs meses (Estudo de Painel) .
Teste t para uma amostra da qualidade do trabalho
(Questionrio do Trabalho) .
Teste t para amostras no relacionadas comparando a satisfao
no trabalho em homens e mulheres (Questionrio do Trabalho) .
Teste t comparando a qualidade no trabalho em homens
e mulheres (Questionrio do Trabalho) .
Tabela da anlise de varincia a um factor comparando
a satisfao no trabalho em diferentes grupos tnicos
(Questionrio do Trabalho) .
Estatsticas descritivas grupais numa anlise de varincia
a um factor comparando a satisfao no trabalho em diferentes
grupos tnicos (Questionrio do Trabalho) .
Teste de homogeneidade de varincias de Levene
(Questionrio do Trabalho) .
Estatsticas relativas aos contrastes a um factor comparando
a satisfao no trabalho nos grupos 1 e 2
(Questionrio do Trabalho) .
Estatsticas relativas aos testes de Scheff a um factor
comparando a satisfao no trabalho em diferentes grupos
tnicos (Questionrio do Trabalho) .
Teste t para amostras relacionadas comparando a satisfao
no trabalho nos primeiros dois meses (Questionrio do
Trabalho) .
_/ Mdias e desvios padres de medidas repetidas da satisfao no
trabalho (Estudo de Painel) .
Testes multivariados de medidas repetidas (Estudo de Painel) .
Teste de esfericidade de Mauchly de medidas repetidas
(Estudo de Painel) .
Testes univariados de significncia de medidas repetidas para
as variveis transformadas (Estudo de Painel) .
Testes de significncia mdios de medidas repetidas .
- ~)
xviii
ANLISE DE DADOS EM CINCIAS SOCIAIS
8.1 Dados relativos satisfao no trabalho e ao absentismo de 30
empregados 185
8.2 Quatro combinaes possveis 185
8.3 A relao entre a satisfao no trabalho e o absentismo 186
8.4 Dois tipos de associao entre variveis 186
8.5 Tabela de contingncia especial por sexo (output do SPSS) 188
8.6 Nvel de especializao dos trabalhadores por sexo 194
8.7 A matriz de coeficientes de correlao produto-momento
de Pearson (output do SPSS) 205
8.8 A matriz de coeficientes de correlao rho de Spearman 207
8.9 O output Means para satis por especial 211
8.10 O impacto dos valores extremos: a associao entre a dimenso
da empresa e o nmero de funes especializa das 218
8.11 Anlise de regresso: satis por rotina (output do SPSS) 221
9.1 Dados do projecto depresso 234
9.2 Mdias da depresso ps-teste (doepos) nos trs tratamentos
para homens e mulheres (Projecto Depresso) 238
9.3 Output dos Homogeneity tests (Projecto Depresso) 239
9.4 Testes de significncia para efeitos principais e de interaco
num plano factorial no relacionado (Projecto Depresso) 240
9.5 Testes de significncia para os efeitos da depresso pr-teste
(Projecto Depresso) 241
9.6 Resultados da anlise de covarincia mostrando o teste de
homogeneidade do declive da recta de regresso intra-clulas
(Projecto Depresso) 243
9.7 Anlise de covarincia (Projecto Depresso) 244
9.8 Mdias ajustadas de depresso ps-teste nos trs tratamentos
(Projecto Depresso) 244
9.9 Mdias e desvios-padro dos nveis de depresso ps-teste para
os doentes (doepos) e informadores (infpos) para os trs
tratamentos (Projecto Depresso) 247
9.10 O teste M de Box (Projecto Depresso) 247
9.11 O teste de Levene (Projecto Depresso) 247
9.12 O teste de esfericidade de Bartlett (Projecto Depresso) 248
9.13 Testes multivariados de significncia para os efeitos do tratamento
(Projecto Depresso) 248
9.14 Testes univariados de significncia para as duas variveis
dependentes (Projecto Depresso) 248
9.15 Teste de significncia para a interaco entre tempo
e tratamento (Projecto Depresso) 251
9.16 Mdias e desvios-padro dos nveis de depresso pr-teste
(Doepre) e ps-teste (Doepos) nos trs tratamentos
(Projecto Depresso) 252
l'-UICE DE FIGURAS, CAIXAS E QUADROS
xix
Relao entre a covarivel idade e as duas variveis
transformadas (Projecto Depresso) 255
Teste multivariados para a interaco entre tempo, tratamento
e sexo (Projecto Depresso) 255
- 19 Testes univariados para o efeito de interaco entre tempo,
tratamento e sexo (Projecto Depresso) 256
--=a Variveis transformadas (Projecto Depresso) '2.56
Relao entre variedade e satisfao no trabalho
(Dados Fictcios) 262
Urna relao espria: a relao entre a variedade das funes
e a satisfao no trabalho controlando a dimenso da amostra
(Dados Fictcios) 263
__ 3 Urna relao no espria: a relao entre a variedade das funes
e a satisfao no trabalho controlando a dimenso da empresa
(Dados Fictcios) 264
:: -! Urna varivel interveniente: relao entre a variedade das
funes e a satisfao no trabalho, controlando
a varivel interesse pelo trabalho (Dados Fictcios) 265
~_J Urna relao moderada: a relao entre a variedade das funes
e a satisfao no trabalho controlando o sexo (Dados Fictcios) ... 267
: = Causalidade mltipla: urna relao entre variedade e satisfao
no trabalho controlando a participao no trabalho 269
h I Rendimento, idade e posio face economia de mercado
(Dados Fictcios) 273
~o A matriz de coeficientes de correlao parcial (Questionrio
do Trabalho) 275
__9 Comparao de coeficientes de regresso no estandardizados
e estandardizados, com satis corno varivel dependente 279
:.= 100 output do SPSS para a regresso mltipla
(Questionrio do Trabalho) 282
~:E.IRelao entre a concordncia com a legislao que defende
a igualdade de salrios e sexo dos inquiridos 294
::E.2Relao entre a concordncia com a legislao que defende
a igualdade de salrios e sexo dos inquiridos 294
:~ 1 Matrizes de correlaes e nveis de significncia para os itens
de satisfao e rotina (Questionrio do Trabalho) 300
Comunalidades das componentes principais
(Questionrio do Trabalho) 302
~~3 Comunalidades dos eixos principais
(Questionrio do Trabalho) 302
:: -! Componentes principais iniciais e sua varincia
(Questionrio do Trabalho) 303
xx
ANLISE DE DADOS EM CINCIAS SOCIAIS
11.5 Pesos dos itens nas duas primeiras componentes principais
(Questionrio do Trabalho) 305
11.6 Pesos dos itens nos dois primeiros eixos principais
(Questionrio do Trabalho) 305
11.7 Pesos dos itens nas duas primeiras componentes principais
rodadas ortogonalmente (Questionrio do Trabalho) 307
11.8 Pesos dos itens nas duas primeiras componentes principais
rodadas obliquamente (Questionrio do Trabalho) 307
11.9 Correlaes entre as duas primeiras componentes principais
rodadas obliquamente (Questionrio do Trabalho) 308
PREFCIO
;= ":e livro procura iniciar os leitores nas tcnicas fundamentais de anlise
3:atistica utilizadas por psiclogos e socilogos. No entanto, no conside-
':"=.::10S que ele seja uma introduo estatstica semelhante ao que habi-
..:a1; pensamos antes que a sua natureza diferente, j que no nos preocu-
-:-=.::nos em incluir as complexas frmulas subjacentes aos mtodos estats-
:..:uS abordados. frequente os estudantes considerarem essas frmulas e
:;clculos que se lhes associam muito assustadores, especialmente quan-
:.~ as suas bases matemticas so mais fracas. Alm disso, nos dias de hoje,
~':;?omos de poderosos computadores e de conjuntos de programas esta-
'=':;:::(os,parecendo desnecessrio confrontar os estudantes com a ansieda-
~=:-elacionada com clculos complexos quando podem ser as mquinas a
:.=sempenhar a maior parte do trabalho. De facto, a maioria dos utilizado-
_::-:; dispe de programas estatsticos que permitem que sejam os computa-
- -:-es a efectuar os clculos havendo, assim, poucas razes para se consi-
,_=:-aremas frmulas e a sua aplicao como um ritual de passagem para os
-s::ldantes de cincias sociais. Acresce ainda que poucos estudantes che-
=::....~ama compreender plenamente o racional da frmula que teriam que
-:-:-ender. Na realidade, preferimos a designao "anlise de dados quan-
-:ativos" em vez de "estatstica", devido imagem adversa que esta lti-
;: ?alavra suscita em muitos potenciais leitores.
Tendo em conta o facto de termos disponveis programas de estatstica e
_~:nputadores, achamos que as duas reas em que os estudantes mais preci-
de adquirir competncias so, em primeiro lugar, como decidir quais os
,__~<edimentos estatsticos que se devem usar para responder a cada necessi-
-ie e, em segundo lugar, como interpretar os resultados obtidos. Neste li-
o::! procuramos enfatizar estes dois factores.
, ainda, necessrio que o estudante aprenda a utilizar o software que
-= ?ermitir operar com os procedimentos estatsticos descritos neste li-
~. Para esse fim, iniciamos os leitores naquele que , provavelmente, o
xxi
xxii
ANLISE DE DADOS EM CINCIAS SOCIAIS
mais amplamente utilizado conjunto de programas para anlise estatstica
nas cincias sociais - o SPSS(Statistical Package for the Social Sciences).
Este programa foi criado nos anos 60e constituiu a primeira grande tenta-
tiva de desenvolver software para as cincias sociais, tendo, desde a, pas-
sado por vrias revises e aperfeioamentos. As primeiras duas edies
deste livro (Bryman & Cramer, 1990, 1994) referiam-se a verses do SPSS
desenvolvidas para computadores de grande porte (manframe) e para o
sistema operativo Microsoft MS-DOS.No entanto, h uns anos atrs, apa-
receu uma verso de SPSSdesenvolvida para o ambiente Microsoft Win-
dows. Esta passou, tambm, por algumas revises. Uma das edies ante-
riores deste livro (Bryman & Cramer, 1997) dizia respeito verso 6 para
Windows, desenvolvida para o Microsoft Windows 3.11. Aps a introdu-
o do Windows 95, uma nova verso do SPSS(verso 7) foi desenvolvida
para correr neste sistema operativo. Altima verso para o Windows 95 a
verso 10. Opresente livro descreve a utilizao desta verso, a que nos re-
feriremos abreviadamente por SPSS.Autilizao das verses 8e 9 descri-
ta numa edio anterior desta obra (Bryman e Cramer, 1999).
Para fazer a distino entre os mtodos de anlise de dados e os coman-
dos do SPSS,apresentamos os ltimos emnegrito. Apresentamos, ainda, da-
dos para os estudantes utilizarem, aparecendo os nomes das variveis tam-
bm em negrito [bold] (por exemplo, rendim, isto , rendimento). As bases
de dados podem ser retiradas do endereo da editora Routledge na internet;l
http://www.routledge.com/textbooks/ titles/ quant10.html
Na parte final de cada captulo inclumos exerccioscuja soluo se en-
contra no fim do livro. Esperamos que estudantes e professores lhes encon-
trem utilidade; facilmente podero ser adaptadas de modo a constiturem
exerccios adicionais.
O facto de termos combinado mtodos de anlise de dados usados
por psiclogos e por socilogos prende-se com a nossa crena de que as
necessidades dos estudantes das duas reas se sobrepem substancial-
mente. No entanto, os professores podem omitir algumas tcnicas, se as-
sim o entenderem.
Agradecemos a David Stonestreetpelo seu apoio nas edies anteri-
ores deste livro, e nossa presente editora, Vivien Ward, pelo seu apoio
na presente edio. Gostaramos de agradecer, tambm, a Louis Cohen,
Max Hunt e Tony Westaway por terem lido o manuscrito da primeira edi-
o deste livro, e por terem feito sugestes para o seu aperfeioamento.
Obviamente eles no podem ser responsabilizados por quaisquer erros
que, eventualmente, apaream neste livro: esses erros sero de nossa
1 Neste endereo, oleitor encontrar as bases de dados emlngua inglesa. Para aceder a es-
tas mesmas bases de dados em verso portuguesa, o leitor dever dirigir-se a
http://www.celtaeditora.pt/materiais/ adados.
?REFACIO xxiii
:.:.t5ivaresponsabilidade, apesar de, inevitavelmente, cada um de ns
~CU5aro outro de os ter cometido.2
Alan Bryman e Duncan Cramer
Universidade de Loughborough
Os erros de edio encontrados na obra original foram corrigidos na presente verso.
Captulo 1
:\. ANLISE DE DADOS EO PROCESSO DE INVESTIGAO
e 11no abrange amplamente o campo que se designa, em geral, por "esta-
' ..:a" mas, como procurmos salientar no prefcio, afastmo-nos em vrios
_dos da forma convencionalmente usada para ensinar este tema a estu-
:es pr e ps-graduados. Especificando, foi nossa inteno combinar a
L:se de dados com as competncias no domnio da utilizao de computa-
_5, sem sobrecarregar o leitor com frmulas. Esta inteno afasta-nos de
.... :as, ou mesmo da maior parte, das formulaes deste tema. Preferimos o
:T.J "anlise de dados quantitativos" porque a nfase posta na compreen-
:: na anlise de dados e no tanto na natureza das prprias tcnicas
a::sticas.
Por que razo devem os estudantes de cincias sociais aprender a fa-
. ="""1lise de dados quantitativos, especialmente numa poca em que a in-
>2.gao qualitativa est a assumir, cada vez mais, uma posio diantei-
~~'man, 1988a)? Afinal j todos ns ouvimos falar da forma como os
- 25 estatsticos podem ser distorcidos, como pode ser ilustrado pelas
~"ras de Disraeli: "H mentiras, grandes mentiras e estatsticas". Por
= :notivo se devero preparar investigadores e estudantes para se envol-
~;:::1numa actividade que pode ser to ingrata? Se considerarmos a pri-
....::-a questo - por que que os estudantes de cincias sociais devem
_=:1der a fazer anlise de dados quantitativos - devemos lembrar-nos
;: '.lIDagrande parte da pesquisa emprica desenvolvida no mbito das
:-.cias sociais planeada para gerar dados quantitativos ou apoia-se ne-
ara poderem apreciar o tipo de anlises que se utilizou com esses da-
" e para analisarem os seus prprios dados (especialmente porque mui-
; :-:-ecisam de desenvolver projectos), os estudantes de cincias sociais
~ '-antagem em conhecer os mtodos de anlise adequados. Alm disso,
_sar da investigao qualitativa se ter tornado uma estratgia proemi-
::: em Sociologia e nalgumas outras reas das cincias sociais, ela no
~"1iYersalcomo a investigao quantitativa. De qualquer forma, vrios
2
ANLISE DE DADOS EM CINCIAS SOCIAIS
autores reconhecem que haver muito a ganhar se se fundirem as duas tra-
dies de pesquisa (Bryman, 1988a).
Em relao questo da capacidade dos estatsticos de distorcer as an-
lises que executam, o panorama substancialmente exagerado por livros com
ttulos desconcertantes do gnero "Como mentir com estatsticas" (Huff, 1973),
devendo ser reconhecido que uma compreenso das tcnicas abordadas no
nosso livro dar aos leitores uma capacidade acrescida de ver para alm das
representaes erradas que preocupam tantas pessoas. De facto, a aquisio
de uma capacidade de avaliao da anlise de dados quantitativos benfica,
face perspectiva de uma utilizao universal de dados estatsticos na vida
quotidiana, j que somos constantemente sujeitos a uma srie deles na forma
de resultados de estudos de opinio, estudos de mercado, inventrios de ati-
tudes, estatsticas de sade e de criminalidade, etc. O domnio da anlise de
dados quantitativos aumenta a nossa capacidade para reconhecermos con-
cluses deficientes ou manipulaes da informao. Existe, ainda, a hiptese
de uma parte substancial dos nossos leitores virem a desempenhar funes
em que sejam confrontados com a necessidade de analisar ou apresentar da-
dos estatsticos. A anlise de dados quantitativos no consiste numa aplica-
o mecanizada de tcnicas pr-determinadas, sendo, antes, um tema que ali-
menta controvrsias e debates, semelhana do que acontece com as prprias
cincias sociais. Quando for apropriado apresentaremos ao leitor alguns dos
aspectos que fomentam essas discusses.
A anlise de dados quantitativos e o processo de investigao
Nesta seco, vamos explorar a forma como a anlise de dados quantitativos
se adequa ao processo de investigao - especificamente o processo de in-
vestigao quantitativa. Como veremos, a rea de conhecimentos abordada
por este livro no se limita a responder questo de como lidar com dados
quantitativos, centrando-se tambm noutros aspectos ligados investigao
que afectam a anlise de dados.
A figura 1.1 ilustra os passos principais da investigao quantitativa.
Embora se possa levantar a questo de se ela, de facto, se conforma sempre a
uma sequncia linear bem ordenada (Bryman, 1988a; 1998b), os componentes
apresentados na figura 1.1fornecem um modelo de representao til. Nesse
modelo, so delineadas as etapas a seguir referenciadas.
Teoria
O ponto de partida do processo o enquadramento terico. As teorias, nas
cincias sociais, podem situar-se entre as abordagens abstractas e gerais
A ANLISE DE DADOS E O PROCESSO DE INVESTIGAO
-----------.~ Teoria

Hipteses

Operacionalizao
de conceitos

Seleco de sujeitos ou
de respondentes
li ~
3
Plano correlacionaVlnqurito
1- -Conduo de entr"e;;stas-I
I ou aplicao de :
~ ..9,,:~i':.n~i~s I
\
Plano experimental
--------------1
I Definio de grupos de I
: controlo e de grupos I
I experimentais I
I. :
I Realizao de observaes I
: elou aplicao de testes I
I ou questionrios I
______________ J
Recolha de dados

Anlise de dados

Concluses
~ 1.1 O processo de investigao
_:"0, por exemplo, o funcionalismo) e as abordagens de um nvel de abs-
-70 inferior que procuram explicar fenmenos especficos (como o com-
:?mento de voto, a delinquncia ou a agressividade). De um modo geral,
rias que tendem a receber mais ateno directa so as que tm um baixo
::. de generalidade. Merton (1967) referiu-se a teorias de mdio alcance
designar as construes que se situam entre as teorias gerais e abstractas
. ':'escobertas empricas. Hirschi (1969), por exemplo, formulou uma teoria
_ a delinquncia juvenil que prope que os actos de delinquncia so
- ?rovveis quando os laos da criana sociedade esto quebrados. Esta
- derivou, em grande parte, de outras teorias e de dados de investigao
-onados com a delinquncia juvenil.
_'ipteses
~;ir do momento em que uma teoria formulada, provvel que os in-
-'5-adores a queiram testar. Ser que a teoria continua a revelar-se adequa-
te as evidncias empricas? No entanto, raramente possvel testar
-eoria no seu todo. Em vez disso mais frequente deduzir-se, a partir da
=, uma hiptese que se relacione com uma faceta limitada daquela e que
_:ilimetida ao teste da investigao. Hirschi, por exemplo, baseando-se
4 ANLISE DE DADOS EM CINCIAS SOCIAIS
na teoria que j referimos, verificou que as crianas que se encontram ligadas
a uma sociedade convencional (no sentido em que aderem aos valores con-
vencionais, participando ou aspirando a participar desses valores) tero me-
nos probabilidade de cometer actos de delinquncia do que as crianas que
no se encontram nessa situao. Muitas vezes, as hipteses apresentam-se
como uma relao entre duas ou mais entidades -neste caso, o envolvimen-
to com a sociedade convencional e a delinquncia juvenil. Essas" entidades"
so, geralmente, designadas por "conceitos" - isto , categorias onde se ar-
rumam as nossas ideias e observaes sobre os elementos comuns do mundo.
A natureza dos conceitos ser discutida com maior pormenor no captulo 4.
Apesar das hipteses terem a vantagem de forar os investigadores a pensar
de forma sistemtica sobre o que pretendem estudar e a estruturar os seus
planos de investigao de acordo com isso, tm uma potencial desvantagem
que consiste em poderem afastar a ateno do investigador de outras facetas
interessantes dos dados recolhidos.
Operacionalizao de conceitos
Para se avaliar a validade de uma hiptese necessrio desenvolver formas
de medir os conceitos a que ela se refere. Aeste processo chama-se, geralmen-
te, operacionalizao, seguindo o exemplo do processo de medida utilizado em
medicina (Bridgman, 1927). De facto, o que se passa nesta fase a traduo
dos conceitos em variveis - isto , em atributos que estabeleam diferenas
entre objectos relevantes (indivduos, empresas, naes, etc.). Hirschi opera-
cionalizou de diversas formas a ideia de envolvimento com a sociedade con-
vencional. Uma dessas formas consistiu em incluir num questionrio, que vi-
ria a ser aplicado s crianas, um item em que lhes perguntava se gostavam
ou no da escola. A delinquncia foi medida inquirindo as crianas sobre o
nmero de actos de delinquncia que tinham cometido (i.e., atravs do nme-
ro de actos de delinquncia auto-relatados). Amedida de conceitos, em mui-
tos estudos experimentais no mbito da psicologia, consegui da atravs da
observao de pessoas e no tanto a partir da aplicao de questionrios. Se o
investigador est interessado na agresso, por exemplo, pode criar uma si-
tuao laboratorial que permita observar variaes no comportamento agres-
sivo. Uma outra forma de operacionalizar os conceitos consiste na anlise de
estatsticas existentes; foi, por exemplo, o que fez Durkheim (1898/1952) na
sua anlise das taxas de suicdio. No captulo 4 discutir-se-o outros aspectos
ligados medio de conceitos e algumas das propriedades que as medidas
devem possuir.
~.;AUSE DE DADOS E O PROCESSO DE INVESTIGAO
5
.=e!2code inquiridos ou de sujeitos
~er um estudo de opinio, o investigador necessita de encontrar as
-s certas para aplicar o instrumento de medida que se construiu (por
_~o,um questionrio de auto-aplicao ou um protocolo de entrevista).
:; considerar, novamente, o caso de Hirschi que seleccionou aleatoria-
-= ::aais de 5500 crianas em idade escolar de uma zona da Clifrnia.
_ :acto da seleco ser feita aleatoriamente importante porque reflecte
_~se do investigador em chegar a concluses que se possam generalizar
a:' crianas que no tenham participado no estudo. Raramente poss-
:actar todos os elementos de uma populao e, por isso, imperativo
_Laruma amostra. Para que os resultados se possam generalizar a uma
2.omais ampla, essa amostra tem que ser uma amostra representativa, o
iXc.e ser garantido atravs de uma escolha aleatria dos sujeitos. Alm
::-.uitas das tcnicas estatsticas a que nos referiremos ao longo deste li-
~encem ao domnio da estatstica inferencal que permite ao investiga-
- =sde que a amostra constituda seja aleatria, determinar a probabilida-
- .:::::eos resultados que obteve a partir de uma amostra coincidam com os
:-..arn obtidos para a populao de onde a amostra foi retirada. Estes
:; sero abordados no captulo 6.
-. ,;reparao de um plano de investigao
e socilogos utilizam basicamente dois tipos de planos de investi-
primeiros tendem a usar estudos experimentais, em que o investiga-
-:::pula aspectos da situao, quer no laboratrio quer no campo, e ob-
:;efeitos dessa manipulao nos sujeitos experimentais. Este tipo de es-
~ge, ainda, que exista um "grupo de controlo", servindo como base de
~;;o com o grupo de sujeitos submetidos manipulao experimental.
,/ano correlaconal ou inqurito, o investigador no manipula qualquer
.:::. e todos os dados relacionados com todas as variveis so recolhidos si-
~?:nente. O termo correlao tambm se refere a uma tcnica para anali-
-6es entre variveis (ver captulo 8) mas, no presente contexto, designa
.: .:ieplano de investigao. Nem sempre o investigador pode escolher
::::'--:25 dois tipos de estudos vai utilizar. Hirschi, por exemplo, no podia
::"?IDas crianas mais envolvidas com a escola e outras menos para ob-
:; efeitos deste envolvimento na sua predisposio para cometer actos
0lncia. Algumas variveis, como a maior parte daquelas que so ob-
-:~lUdo por parte dos socilogos, no se podem manipular. No entanto,
-'-5 .:ieestudo em que os temas e as hipteses podem ser abordados com
"5 um destes planos (por exemplo, o estudo dos efeitos da participao
.=\":10 na satisfao e desempenho profissional - ver Bryman, 1986;
6
ANLISE DE DADOS EM CINCIAS SOCIAIS
Locke e Schweiger, 1979). importante realar que, na maior parte dos casos, a
natureza do plano de investigao - experimental ou correlacional- conhe-
cida no princpio da sequncia representada na figura LI, de modo que as ca-
ractersticas do plano escolhido influenciam vrias fases do processo de inves-
tigao. A natureza do plano de estudo tem tambm implicaes no tipo de
manipulao estatstica que pode ser executada com os dados que dele resul-
tam. Na prxima seco, sero abordadas com maior pormenor as diferenas
entre os dois planos de estudo.
A recolha de dados
Nesta fase, o investigador recolhe dados a partir da realizao de entrevistas,
da aplicao de questionrios, da observao ou de qualquer outro mtodo.
Num livro com as caractersticas do nosso no seria pertinente abordar os as-
pectos tcnicos ligados a esta recolha de dados. No caso do leitor no estar fa-
miliarizado com este terna dever consultar um livro sobre mtodos de inves-
tigao sociolgica e psicolgica.
A anlise de dados
Esta fase tem urna relao muito directa com o terna deste livro. provvel
que o investigador queira descrever os sujeitos com que trabalhou pelo me-
nos em termos das variveis inerentes ao estudo. Pode, por exemplo, estar in-
teressado em conhecer qual a proporo de crianas que referem nunca ter co-
metido actos de delinquncia ou das que referem j ter cometido um ou dois
ou mais deste tipo de comportamentos. As diversas formas de anlise e apre-
sentao da informao relacionada com uma s varivel (chamada, por ve-
zes, anlise univariada) sero examinadas no captulo 5. No entanto, a anlise
de uma s varivel raramente suficiente e o investigador provavelmente
ter interesse em conhecer a ligao entre essa varivel e cada uma das outras
variveis, i.e., em fazer uma anlise bivariada. O estudo das ligaes entre va-
riveis pode ser feito de uma de duas formas. Um investigador que tenha con-
duzido uma experincia pode estar interessado em saber qual a magnitude
da diferena entre o grupo experimental e o grupo de controlo em relao a al-
gum aspecto. Pode querer saber, por exemplo, se o facto dos sujeitos verem
filmes violentos lhes aumenta a agressividade. O grupo experimental (que v
os filmes violentos) e o grupo de controlo (que no os v) podem, ento, ser
comparados para se avaliar a extenso da diferena existente entre eles. As
tcnicas para a verificao destas diferenas sero exploradas no captulo 7. O
investigador pode, tambm, estar interessado nas relaes existentes entre
variveis - ser que duas variveis estaro ligadas entre si de forma a que
A A"'LISE DE DADOS E O PROCESSO DE INVESTIGAO
7
a variar ao mesmo tempo? Hirschi (1969:121), por exemplo, apresen-
quadro que ilustra como o facto de gostar da escola e os actos de delin-
.a auto-relatados se encontram em interconexo: enquanto apenas 9%
;:rianas que diziam gostar da escola referiam ter cometido dois ou mais
-'""5 de delinquncia, 49% das que diziam no gostar afirmavam estar den-
-"--sa mesma condio. Os mtodos que permitem analisar as relaes en-
_;:-aresde variveis sero explicados no captulo 8. Muito frequentemente,
estigador pretende explorar as conexes entre mais que duas variveis
do a chamada anlise multivariada. O captulo 9 aborda esse tipo de
. -se no sentido da explorao das diferenas, enquanto o captulo 10 se
-=-ana anlise multivariada de relaes entre mais do que duas variveis.
,,::no entre estudar as diferenas e estudar as relaes nem sempre cla-
- .xl.eramos, por exemplo, verificar que os rapazes apresentam, mais fre-
-emente que as raparigas, comportamentos de delinquncia concluindo
que os rapazes e as raparigas diferem em relao tendncia para co-
em esse tipo de actos ou, em alternativa, que existe uma relao entre o
~o sujeito e a delinquncia.
Resultados
~lise dos dados recolhidos sugere que uma hiptese confirmada, es-
_saltados podem servir de apoio teoria que a suscitou. Os prximos in-
~dores poder-se-o interessar quer por reproduzir essa mesma conclu-
_::erpor estudar outras implicaes da teoria. No entanto, o facto de uma
ser refutada pode ser igualmente importante, j que sugere que a
:. :lo adequada ou, no mnimo, que precisa de ser revista. Por vezes,
=05 alguns pontos da hiptese so confirmados. Uma anlise multivaria-
-'e indicar que a relao entre duas variveis s se verifica para alguns
.~S da amostra mas no para os outros (por exemplo, verifica-se para as
2:'eS e no para os homens ou para os jovens e no para pessoas mais ve-
:;m resultado deste tipo poder exigir uma reformulao da teoria.
:od.os os resultados se relacionam directamente com uma hiptese.
_.qurito, por exemplo, o investigador pode recolher dados sobre de-
~.ados tpicos cuja relevncia poder s ser evidente num contexto
:or.
orno foi dito atrs, a sequncia ilustrada na figura 1.1 constitui um mo-
processo de investigao que nem sempre pode ser reproduzido
,,::uao real. No entanto, serve para salientar a importncia de proces-
E'eI1tes investigao quantitativa como o desenvolvimento de formas
-..:.rr os conceitos e a posterior anlise dos dados assim recolhidos. Um
tos que ainda no foi focado o que se prende com a discusso da
-:~e a hiptese e as concluses tendem a assumir. Um dos principais
8
ANLISE DE DADOS EM CINCIAS SOCIAIS
objectivos de muita da investigao quantitativa nas cincias sociais a
demonstrao de causalidade, i.e., de que uma varivel tem impacto sobre
outra varivel. Os termos varivel independente e varivel dependente so
frequentemente, utilizados neste contexto. O primeiro diz respeito a uma
varivel que influencia a segunda, sendo assim esta ltima um efeito da va-
rivel independente. Esta relao causal bastante explorada ao nvel das
cincias sociais e um dos principais papis da anlise multivariada , precisa-
mente, elucid-Ia (Bryman 1988a). Apossibilidade do investigador estabele-
cer uma relao de causa-efeito fortemente afectada pela natureza do plano
de investigao que utiliza. sobre este assunto que nos vamos debruar em
seguida.
Plano de investigao e causalidade
Como vimos, no ltimo pargrafo, um dos principais objectivos da investiga-
o quantitativa estabelecer relaes de causalidade. Este facto decorre, em
grande parte, do interesse em estabelecer concluses semelhantes s das cin-
cias naturais que, frequentemente, tomam a forma de relaes de causa-efei-
to. Alm disso, as concluses que estabelecem relaes deste tipo tm uma
importncia prtica considervel: se soubermos que uma coisa afecta outra,
podemos manipular a causa para obter um efeito. Da mesma forma que se de-
monstrou que o comportamento de fumar pode provocar um certo nmero
de doenas, como o cancro de pulmo e certas afeces cardacas, o investiga-
dor das cincias sociais, se demonstrar relaes de causalidade em contextos
adequados, pode providenciar informaes que podem ter importantes apli-
caes prticas.
Dizer que uma coisa causa outra no quer dizer que a varivel depen-
dente (o efeito) seja totalmente influenciada pela varivel independente (a
causa). Se se fumar no se adquire, necessariamente, uma doena e muitas
das doenas contradas pelas pessoas que fumam tambm atingem os no fu-
madores. Assim, a palavra" causa" deve ser encarada como uma forma de re-
ferir que uma alterao na varivel independente conduz a uma alterao na
varivel dependente. Aqueles que fumam muito tm mais probabilidade do
que aqueles que fumam pouco de contrair uma srie de doenas associadas
ao tabaco. Os que fumam pouco, por sua vez, tm mais probabilidade de ter
essas doenas do que aqueles que no fumam. Do mesmo modo, se verificar-
mos que o facto de ver actos de violncia na televiso induz comportamentos
agressivos, isso no significa que s as pessoas que assistem a programas vio-
lentos na televiso que se vo comportar de forma agressiva, nem que as
pessoas agressivas se expem a programas violentos na televiso. Invariavel-
mente, as relaes de causalidade referem-se probabilidade de ocorrer um
efeito em funo dos diferentes nveis da causa: ser mais provvel que se
A ANLISE DE DADOS E O PROCESSO DE INVESTIGAO 9
manifestem comportamentos agressivos quando se vem muitos programas
olentos do que quando se relativamente pouco exposto a esse tipo de
programao.
Estabelecer a causalidade
Para estabelecer uma relao causal h que cumprir trs condies. Primeiro,
necessrio demonstrar que existe uma relao visvel entre duas variveis, o
que significa que preciso provar que a distribuio dos valores de uma va-
rivel estabelece uma correspondncia com a distribuio de valores da ou-
rra. O quadro 1.1 mostra-nos o nmero de comportamentos agressivos exibi-
dos por dez crianas quando brincam, em grupos de cinco, durante duas ho-
ras. Verifica-se que existe uma relao entre as duas variveis, j que a distri-
buio de valores relativos ao nmero de actos agressivos coincide com a dis-
tribuio da quantidade de horas em que os sujeitos estiveram expostos a ac-
tOS de violncia na televiso - as crianas expostas a mais violncia manifes-
(am mais actos agressivos do que as que estiveram expostas a menos violn-
cia. Arelao no perfeita: trs pares de crianas - a 3 e a 4, a 6 e a 7 e a 9 e a
10- tiveram o mesmo nmero de actos agressivos, mesmo tendo assistido a
diferentes quantidades de violncia na televiso. Alm disso, a criana n.o 8
exibe mais comportamentos agressivos do que a 6 ou a 7, embora estas lti-
mas tenham estado expostas a mais violncia. Apesar disto, evidente que
existe uma relao entre as duas variveis.
Em segundo lugar, necessrio demonstrar que essa relao no esp-
ria. Falamos em relao espria quando duas variveis que parecem estar li-
gadas no tm uma "verdadeira" relao entre si. Avariao que ambas ma-
nifestam afectada por uma varivel comum a estas duas. Suponhamos que
as primeiras cinco crianas eram rapazes e as outras cinco raparigas. Isto po-
deria querer dizer que o sexo dos sujeitos teria um forte impacto nas duas va-
riveis. Os rapazes tendem a ver mais programas violentos na televiso e a
exibir maior agressividade do que as raparigas. No nosso exemplo, continua
a existir uma relao entre assistir violncia filmada e a agresso quer para o
grupo dos rapazes, quer para o grupo das raparigas; no entanto, essa relao
muito menos marcada do que quando considervamos o grupo total das
crianas. Isto significa que o sexo da criana afecta cada uma das duas vari-
\'eis estudadas e , precisamente, porque os rapazes tm mais tendncia a as-
sistir a programas violentos e a comportar-se de forma agressiva que existe,
aqui, uma relao espria. Esse tipo de relao ilustrado na figura 1.2.
Em terceiro lugar, necessrio demonstrar que a causa precede o efeito,
i.e., estabelecer a ordem temporal das duas variveis que se relacionam. Por ou-
tras palavras, devemos demonstrar que o que se passa que a agresso resul-
ta do facto de se assistir violncia filmada nos programas de televiso e no
10 ANLISE DE DADOS EM CINCIAS SOCIAIS
Quadro 1.1 Violncia na televiso e agresso
Criana
1
2
3
4
5
6
7
8
9
10
Nmero de horas de
exposio violncia
filmada
Nmero de horas semanais de
exposio violncia filmada
9.50
9.25
8.75
8.25
8.00
5.50
5.25
4.75
4.50
4.00
Nmero de actos agressivos
registados
9
8
7
7
6
4
4
5
3
3
Nmero de actos
agressivos
Figura 1.2 Uma relao espria
o inverso. De facto, um efeito nunca pode preceder a causa. Este critrio pode
parecer bvio e extremamente fcil de testar mas, como veremos, torna-se um
problema importante quando se trabalha com planos de investigao no
experimentais.
Planos experimentais e causalidade
Um plano de investigao define a estrutura bsica do estudo. Embora se
possam delinear vrios tipos de planos, costuma fazer-se uma distino fun-
damental entre planos experimentais e no experimentais, dos quais se desta-
ca o inqurito. Num estudo experimental, fundamental elucidar a relao
de causa e efeito. Usa-se o termo validade interna para referir um atributo do
estudo que indique se as relaes causais delineadas a partir de uma investi-
gao so relativamente inequvocas. Um estudo com elevada validade
A ANLISE DE DADOS E O PROCESSO DE INVESTIGAO
11
:,:-"erna aquele que aponta, com clareza, a causa e o efeito. No , ento, surpre-
:::1denteque os estudos experimentais sejam especialmente fortes em validade in-
zna, j que foram criados especificamente para darem origem a dados que indi-
:::5semrelaes de causalidade.
Se quisermos demonstrar que o facto das crianas verem violncia na te-
.2\'iso aumenta a agresso que manifestam, podemos fazer o seguinte estu-
':'0: juntamos um grupo de dez crianas que podem interagir e brincar duran-
-2duas horas, Nesse perodo de tempo, observadores registam o nmero de
:omportamentos agressivos exibidos por cada criana. Em seguida, as mes-
::-..ascrianas assistem a um programa de televiso muito violento - poden-
':'0 designar-se esta condio de exposio violncia filmada por tratamento
~'\perimental- aps o que voltam a interagir por duas horas. Os comporta-
::"entos agressivos que manifestam so registados tal como na primeira fase
':0 estudo. Na verdade, estamos aqui a seguir uma sequncia do tipo:
~:n que OBS1 corresponde medida inicial do comportamento agressivo (fre-
~uentemente designada por pr-teste), EXP representa o tratamento experi-
:nental em que introduzida a varivel independente e OBS2 a medida sub-
~quente do comportamento agressivo (frequentemente chamada ps-teste).
Consideremos, agora, que o valor correspondente OBS2 30% mais
elevado que o relativo OBS1, o que significa que a quantidade de comporta-
:nento agressivo aumentou consideravelmente. Ser que podemos dizer que
aumento da agresso foi provocado pela violncia a que os sujeitos assisti-
::'am?De facto, no podemos fazer essa atribuio uma vez que a relao que
=-quiaparece, e que supomos ser causal, pode ter outras explicaes alterna ti-
"as: as crianas podem ter-se tornado mais agressivas apenas como conse-
~uncia de estarem juntas acabando por se irritarem mutuamente, ou ficaram
de mau humor porque tinham fome ou sede e os experimentadores lhes de-
:-ampouca comida ou bebida. Pode at acontecer que os diferentes observa-
dores presentes na fase de pr e de ps-teste tenham utilizado critrios dife-
:-entes de agresso. Sendo assim, e como no podemos excluir estas explica-
.;es alternativas, no podemos tirar uma concluso definitiva sobre a causa
o aumento do nmero de comportamentos agressivos.
Qualquer pessoa que esteja familiarizada com as cincias naturais sabe-
:- que uma experincia bem conduzida dever ser controlada de forma a mi-
:1mizar os factores de contaminao. Para os controlar (e, assim, poder rejei-
:ar as explicaes alternativas), necessrio trabalhar com um grupo de contro-
:0. Este grupo passar exactamente pelas mesmas situaes que o grupo em
que se introduz a varivel independente - conhecido por grupo experimental
- mas no recebe o tratamento experimental. No contexto do estudo que es-
-vamos a imaginar teramos, agora, dois grupos de crianas expostas s
12
ANLISE DE DADOS EM CINCIAS SOCIAIS
Obs1
Exp Obs2 Grupo
Experimental
(Agresso
(Assistir a (Agresso
~ registada)
violncia) registada)
Distribuio
aleatria
------.
(Agresso
(No assistir (Agresso
registada)
a violncia) registada)
No-Exp
Grupo de
Obs3
Obs4
Controlo
Figura 1.3
Um estudo experimental
mesmas condies mas s um deles assistiria ao filme violento - o grupo ex-
perimental - enquanto que o outro no receberia este tratamento experi-
mental- o grupo de controlo. O plano do estudo ilustrado pela figura 1.3.
As situaes vividas pelos dois grupos tm que ser to semelhantes quanto
possvel de modo a que a nica diferena entre as duas condies seja o pr-
prio tratamento experimental.
, tambm, necessrio assegurar que os membros dos dois grupos se-
jam to semelhantes quanto possvel. Para o conseguir, pode-se partir de uma
amostra de crianas e distribu-las aleatoriamente pelo grupo experimental e
pelo grupo de controlo. 5e esta distribuio aleatria no for feita, existir
sempre a possibilidade das diferenas encontradas entre os dois grupos se-
rem atribuveis diversidade de caractersticas pessoais ou a quaisquer ou-
tras diferenas entre os grupos. Pode, por exemplo, haver um grupo com
mais rapazes que raparigas ou pode haver diferenas na composio tnica
dos dois grupos. Nesse caso, os resultados que obtivermos podem no estar a
ser determinados pela varivel independente e unicamente por ela.
Vamos considerar que a diferena entre o valor da OB51 e o da OB52 de
30%, e que entre o valor da OB53 e o da OB54 de 28%. 5e assim fosse, conclui-
ramos que a diferena entre os resultados dos dois grupos to pequena que
parece que o tratamento experimental (EXP) no afectou o comportamento
agressivo; por outras palavras, a agresso teria aumentado no grupo experi-
mental independentemente da observao do filme. O aborrecimento decor-
rente de estarem juntas por um perodo demasiado longo ou a insuficincia
de comida ou bebida ou qualquer outro factor justificaria a diferena entre os
valores da OB51 e os da OB52 Contudo, se a diferena entre os valores da OB53
e os da OB54 fosse apenas de 3%, estaramos em muito melhores condies
para afirmarmos que observar o filme violento tinha aumentado o nmero de
comportamentos agressivos, no grupo experimental. Os 27% do aumento do
comportamento agressivo no grupo experimental (30%-3%) poderiam ser
atribudos ao tratamento experimental. Nas situaes reais, as diferenas en-
contradas entre os resultados dos dois grupos raramente so to acentuadas
-\ .~"LISE DE DADOS E O PROCESSO DE INVESTIGAO 13
______ Exp
Obs1
(1)
Distribuio
aleatria
---- No-Exp
Obs2
~ObS1
EXP1 Obs2
(2)
Distribuio Obs3
EXP2 Obs4
aleatria
~Obss
EXP3
Obs6
Obs7
No-exp Obse
~
Obs1
EXP1+A Obs2
(3)
Distribuio Obs3
EXP1+B Obs4
aleatria
~ Obss
EXP2+A
Obs6
Obs7
EXP2+B Obse
1.4
Trs tipos de planos experimentais
_~::J.ono nosso exemplo, tendo mais frequentemente uma menor extenso. ,
:2.0, necessrio utilizar testes estatsticos que permitam determinar a pro-
~..0ilidade dessa diferena ocorrer por acaso. Esses testes sero descritos nos
-:-:1ulos7 e 9.
Nesta investigao que imaginmos, cumprem-se os trs critrios que
--=:m.itemestabelecer a causalidade e, por isso, se de facto verificssemos que
~'...;ffientona varivel dependente tinha sido bastante maior para o grupo ex-
.rmental do que para o grupo de controlo, poderamos afirmar com uma
_~-ianaconsidervel que assistir violncia atravs da televiso tinha cau-
:'0 mais agresso. Em primeiro lugar, verificmos a existncia de uma reIa-
-=0 demonstrando que os sujeitos expostos violncia filmada exibiram
~ comportamentos agressivos do que aqueles que no assistiram. Em se-
=_""1dolugar, o facto de termos simultaneamente um grupo de controlo e uma
.:...5:ribuioaleatria dos sujeitos pelos grupos permite-nos eliminar a hip-
. - da relao ser apenas espria, uma vez que se houvesse outros factores a
:=--.-tar os resultados, eles influenciariam de forma idntica os dois grupos.
-.::: terceiro lugar, a ordem temporal das variveis demonstrada pelo au-
-:ltO do comportamento agressivo aps a exposio do grupo experimental
colncia na televiso. Como a varivel independente manipulada pelo
?rimentador a sequncia temporal facilmente demonstrada, j que os
-e:tos da manipulao podem ser medidos directamente. Assim, como o es-
_;:ioapresenta um elevado grau de validade interna, podemos afirmar com
:iliana que "ver violncia na televiso" ~ "comportamento agressivo".
Existem vrios tipos de planos experimentais. Esquematizamo-Ios na
:::;..ua 1.4. No primeiro tipo de plano, no existe pr-teste comparando-se
14 ANLISE DE DADOS EM CINCIAS SOCIAIS
apenas OgrupO experimental e o grupo de controlo em relao varivel deper-
dente. No segundo caso, utilizam-se vrios grupos o que, alis, frequente nz -
cincias sociais, porque mais provvel que o experimentador esteja interessa .
em estudar diferentes nveis ou tipos de variveis independentes do que em V-
rificar os efeitos da presena ou da ausncia de uma s. Assim, no exemplo da t-
leviso e da violncia filmada, poderamos considerar quatro grupos que assi5-
tissem a diversos graus de violncia. O terceiro plano experimental, o plano fa:-
tarial, usado quando o investigador pretende conhecer os efeitos sobre a varia-
vel dependente de mais do que uma varivel independente. Suponhamos qu:::
ele quer saber se a presena de adultos perto da criana reduz a sua tendno.:
para se comportar de forma agressiva. Poderia ento fazer quatro combina~
possveis resultantes da manipulao de cada uma das duas variveis indeper-
dentes. Por exemplo, EXP1+A seria a condio em que se combinava a exposio -
violncia com a proximidade dos adultos e EXPl+B seria a condio de exposi
violncia e de ausncia de adultos perto da criana.
Inqurito/plano correlacional e causalidade
Quando se realiza um inqurito, a natureza do plano de investigao utiliza-
do muito diferente da do plano experimental. Normalmente, o inqurito er.-
volve a recolha simultnea de dados sobre diferentes variveis. O investiga-
dor pode estar interessado na relao entre as atitudes polticas e os compor-
tamentos das pessoas por um lado, e um certo nmero de outras variveis-
por outro, como a profisso do sujeito, o seu enquadramento social, a sua
raa, sexo, idade e vrias atitudes no polticas. Contudo, nenhuma destas
variveis manipulada como acontece no estudo experimental. De fact
muitas delas no podem mesmo s-lo, tornando-se necessrio utilizar um in-
qurito para analisar a sua relao com outras variveis. No podem05
mudar a idade dos sujeitos tornando uns mais velhos, outros mais novos e
dando a outros idades intermdias para depois analisar o efeito da idade nas
atitudes polticas. Alm disso, num estudo deste tipo no s no se manipu-
lam variveis como se recolhem simultaneamente os dados sobre todas elas
o que torna impossvel estabelecer uma ordem temporal entre as variveis
que se esto a considerar. Com um plano experimental, pode determinar---
uma ordem temporal quando o efeito da manipulao da varivel indepen-
dente sobre a varivel dependente directamente observado. As caractersti-
cas dos inquritos de opinio no esto apenas associadas a investigaes que
utilizem as tcnicas de entrevista ou os questionrios. Muitos estudos - que
utilizam dados estatsticos sobre a populao como os que so conduzid05
por empresas ou por instituies estatais - exibem as mesmas caractersticas
uma vez que os valores relativos a um determinado ano referem-se a dad~
sobre diferentes variveis num mesmo momento.
,"> A,....-ALISEDE DADOS E O PROCESSO DE INVESTIGAO 15
Satisfao no trabalho
. I Produtividade
1.5 Uma relao entre duas variveis
Satisfao no trabalho
Antiguidade na empresa
1.6 A relao ser espria?
Produtividade
Frequentemente, este tipo de plano de estudo designado por plano cor-
-::onal para salientar a sua tendncia para revelar relaes entre variveis e
",:.lalimitao no que diz respeito possibilidade de estabelecer processos
~;;.ais.Precisamente porque neste tipo de investigao as variveis no so
=_Lpuladas(e muitas vezes no so susceptveis de o ser) a possibilidade do
-estigador determinar a causa e o efeito fica limitada. Vamos supor, por
2illplo, que estamos a recolher dados sobre os nveis de satisfao com o
-=:"'alhoe a produtividade dos operrios de uma empresa. Podemos verifi-
.: atravs das tcnicas examinadas no captulo 8, que existe uma forte asso-
.=.oentre as duas variveis, o que quer dizer que os trabalhadores que ma-
~estam nveis elevados de satisfao tm tambm altos valores de produti-
'::ade. Podemos, assim, dizer que existe uma associao entre as duas vari-
::..5 ver figura 1.5), mas como j vimos, isto apenas um primeiro passo para
:;.,::monstraode que existe causalidade. tambm necessrio provar que a
2.o no espria. Poderia acontecer que os trabalhadores mais antigos na
_"-a fossem, precisamente, os mais satisfeitos e os mais produtivos (ver figu-
~.6).Os mtodos atravs dos quais se pode verificar a possibilidade da rela-
=' ser ou no ser espria so analisados no captulo 10.
No entanto, o terceiro obstculo - estabelecer que a potencial causa
-e.:ede o potencial efeito - extremamente difcil de superar. O problema
_e qualquer das duas hipteses delineadas na figura 1.7pode ser verdadei-
A.satisfao com o trabalho pode aumentar a produtividade, mas tambm
. reconhece h muito que se pode passar precisamente o contrrio (isto ,
.:e o facto de se ser competente no trabalho pode aumentar a satisfao).
::':110 os dados relativos a cada uma das variveis foram recolhidos simulta-
::ill1ente, no possvel decidir qual das verses de causalidade ilustradas
" figura 1.7 corresponder realidade. Uma das formas de lidar com este
16
Satisfao no trabalho
Satisfao no trabalho I.
ANLISE DE DADOS EM CINCIAS soe
.1 Produtividade I
I Produtividade
Figura 1.7 Duas possibilidades de interpretao causal de uma relao
problema atravs de uma reconstruo da ordem causal que se supi
entre as variveis. Muitas vezes, este processo de inferncia pode se
voco. o que se passa, por exemplo, quando encontramos uma rela
raa e o nmero de anos de escolaridade e inferimos que a segunda
afecta a primeira. Contudo, este modelo de conexes causais provve
frgil quando no bvio qual das variveis afecta a outra, como (
ligao entre satisfao e produtividade. Quando surgem estas dific
pode ser necessrio incluir uma nova etapa de recolha de dados relal
mesmos sujeitos de modo a verificar, por exemplo, se o impacto da S
com o trabalho na produtividade subsequente maior que o impact<
dutividade na subsequente satisfao com o trabalho. Este tipo de pL
signado por estudo de painel (Cramer, 1988), mas no muito comum]
cias sociais. Neste livro, a discusso sobre investigao no experime
trar-se-, essencialmente, nos planos correlacionais/inquritos de
em que se recolhem, em simultneo, dados sobre diferentes varivE
Os mtodos relacionados com a possibilidade de fazer infern
sais, tendo como base dados obtidos atravs de inquritos, so anal
captulo lO, onde se aborda a anlise multivariada das relaes ent
veis. O aspecto principal a reter da discusso anterior que a infernc
nexes causais entre variveis pode ser feita, com maior facilidade, SE
mos perante dados provenientes de investigaes em que se utilizou
no experimental, do que se dispusermos de resultados recolhidos a ]
um plano correlacional.
Exerccios
1 Qual a principal diferena entre anlise de dados quantitativo
riada, bivariada e multivariada?
2 Por que razo essencial haver uma distribuio aleatria dos
nos grupos, para se poder falar de um verdadeiro estudo experiI
3 Um investigador entrevista uma amostra de donas de casa par
car se as pessoas que lem jornais dirios de "qualidade" tm
A ANLISE DE DADOS E O PROCESSO DE INVESTIGAO
17
so sintetizadas e pouco aprofundadas. A hiptese foi confirmada: os
leitores do primeiro tipo de jornais tm urna probabilidade duas vezes
maior de responder correctamente a urna srie de questes destinadas a
avaliar os seus conhecimentos de poltica. O investigador conclui que os
dirios de "qualidade" induzem maiores nveis de conhecimentos so-
bre poltica do que o segundo tipo de jornais. Avalie este raciocnio.
Captulo 2
ANALISAR DADOS COM O COMPUTADOR
Os primeiros passos com o SPSS 10 para Windows
_ diferentes mtodos estatsticos descritos neste livro sero abordados no con-
~.co de um dos mais - ou mesmo, o mais -largamente utilizados e abrangen-
- programas estatsticos para as cincias sociais: o SPSS. Por essa razo comea-
::.:..'105 por nos debruar sobre as suas caractersticas. SPSS significa Statistical
-:.-.:kage for the Social Sciences (Conjunto de Programas Estatsticos para as
-'ncias Sociais). Este programa pode ser utilizado em computadores de grande
:;~rte (manframes) ou em computadores pessoais, e existem vrias verses por-
,=:-:eos programas que o constituem esto constantemente a ser actualizados.
':.::rualmente, existem dois tipos de sistemas operativos para computadores: o
~--:ema tradicional, ainda utilizado em computadores de grande porte (manfra-
_.os), que requer a escrita de comandos. O sistema mais recente utiliza menus e
.3:..xasde dilogo, a partir das quais os comandos podem ser seleccionados com a
:.Ida de um teclado ou de um rato. No entanto, este ltimo sistema permite,
2:T\bm, a escrita de comandos.
O sistema que recorre utilizao de janelas foi desenvolvido, primeira-
c:ente, para os computadores pessoais Macintosh e encontra-se, agora, dis-
ponvel para o ambiente Windows ou para computadores pessoais
3~1-compatveis, com um processador do tipo 386 ou superior. A verso
:-irra Windows 3.1 conhecida como SPSS verso 6, e j foi alvo de explanao
:-:una edio anterior deste livro (Bryman & Cramer, 1997). Aps a introdu-
:lo do Windows 95, uma nova verso do SPSS (verso 7) foi desenvolvida
::-.araeste sistema operativo. A verso mais actual para Windows 95 a verso
- = : Este livro descreve a utilizao desta verso, referida abreviadamente por
---5. A utilizao das verses 8 e 9 j foi descrita numa edio anterior deste
_-oro (Bryman e Cramer, 1999).
data da edio deste livro, encontrava-se j disponvel a verso 11do SPSS, Contudo, as
rotinas e procedimentos descritos neste livro no sofrem alteraes, de um modo geral,
da verso 10 para a verso 11 deste software, (N, do RJ
19
20 ANLISE DE DADOS EM CINCIAS SOCIAIS
Amaior vantagem de se utilizar um programa como o SPSSconsiste err
poder registar e analisar dados quantitativos de muitas formas diferentes e
com grande rapidez, a partir do momento em que se adquire domnio sobre
programa. Por outras palavras, ele ser uma grande ajuda para o leitor livran-
do-o das interminveis horas gastas a registar dados e a fazer clculos e d05
inevitveis erros que, geralmente, se cometem durante essas operaes. Vai
permitir-lhe tambm a aplicao de tcnicas estatsticas mais complexas - e
frequentemente, mais adequadas - que, de outro modo, no se aventuraria a
usar.
Existe, claro, uma forte desvantagem em usar programas de computa-
dor para analisar dados - que temos que aprender a trabalhar com eles
Contudo, o tempo gasto nessa aprendizagem ser muito menor do que o que
seria necessrio para analisar os mesmos dados sem a sua ajuda. Acresce que
ao mesmo tempo que aprende a dominar o programa, adquire uma srie de
conhecimentos que lhe sero teis num mundo em que a utilizao de com-
putadores se vai tornando cada vez mais generalizada. Apossibilidade de fa-
zer o mesmo com maior velocidade e menor esforo torna-se tambm diverti-
da e frequentemente mais fcil do que se sups no incio.
Quando se procura aprender algo de novo inevitvel fazer erros que se
podem revelar frustrantes e desencorajadores. Inclusivamente pode pare-
cer-nos que fazemos mais erros quando aprendemos a trabalhar com tur.
computador do que quando desempenhamos qualquer outra actividade. Iss
justifica-se porque para que os programas de computador funcionem neces-
srio que as instrues sejam dadas de um modo muito preciso e muitas vezes
de acordo com uma ordem especfica. Esta forma de dar as ordens ao compu-
tador pode parecer-nos menos bvia do que a de concretizarmos outras acti-
vidades que realizamos no dia a dia. importante notar, no entanto, que os
erros que eventualmente se faam durante a aprendizagem no danificam de
forma alguma o computador ou o programa.
Para conseguir fazer um nmero mnimo de erros importante que
nesta fase, se sigam exactamente as instrues enunciadas nos exemplos da-
dos neste e nos captulos subsequentes, respeitando os caracteres e os espaos
utilizados para cada ordem. Embora, por vezes, possam ocorrer falhas, na-
tural que os erros que vierem a surgir sejam resultado de algum engano do
leitor e no de um defeito da mquina ou do programa. O prprio programa
dir-lhe- qual o erro cometido se a sua falha tiver sido cometida ao dar as ins-
trues; se, pelo contrrio, lhe deu uma instruo correcta mas se enganou a
especificar os dados que queria considerar, o computador no lho indicar.
Por outras palavras, o programa questiona a forma da instruo mas no 0_
seus objectivos.
"-=.3.-\R DADOS COM O COMPUTADOR 21
- cheiro de dados
. ::::> poder analisar os seus dados, necessita de criar um ficheiro onde
2--o armazenados. Para ilustrar a maneira de criar esses ficheiros va-
---:.un conjunto de dados fictcios que, hipoteticamente, foram recolhi-
::-.~-:irde um questionrio conhecido como Questionrio do Trabalho.
':2.'::05 derivam de duas fontes: um questionrio aos empregados que
.::=:na perguntas sobre eles prprios e um questionrio aos superviso-
- :-~-pondem a questes sobre cada um dos empregados. As perguntas
=::' apresentadas no apndice 2.1, no fim deste captulo, e a codificao
:.aoou dos dados recolhidos ilustrada pelo quadro 2.1. Neste es-
,:=-,ectode anlise era a pessoa, normalmente designada por sujeito pe-
:::::::ugose por inquirido pelos socilogos. Apesar de se terem usado
;.~=::nplo dados recolhidos atravs de um questionrio, importante
~u SPSSe os procedimentos de anlise de dados descritos neste livro
;:icar-se a outras formas de dados quantitativos, como sejam estats-
~;:;" ou medidas de observao.
o conjunto destes dados relativamente grande, pode ser mais
..-;.~~:e pedir a algum experiente que os introduza num ficheiro apro-
'=-= ::alfor possvel, basta criar um simples ficheiro de texto em formato
~"~gla ASCII significa American Standard for Information Interchan-
;::urmato utilizado, frequentemente, para transferir informao de
_ ..::ador para outro. Uma vez realizada esta tarefa, o SPSS pode ler
. Se no conseguir aceder a ningum que lhe crie um ficheiro des-
_ 3e o conjunto de de dados for pequeno, pode ser mais fcil introdu-
?::--amente no SPSS, numa janela chamada Data Editor. Tanto um
-:::;,rocomo o outro sero discutidos no final deste captulo.
T:"endoa um simples ficheiro de texto, os dados so introduzidos
=~ definido por um grande nmero de linhas e, na maioria dos com-
"t!:: ~.?Or 80 colunas. Cada coluna em linha pode, apenas, comportar
ou seja, um nico dgito. Os dados referentes mesma varivel
::~rroduzidzas na(s) mesma(s) coluna(s) e uma determinada linha
::-'-e:las, os dados relativos a um mesmo objecto de interesse ou caso.
~=:'......cnte, os casos so pessoas mas qualquer entidade de interesse -
:::ia, a escola, o hospital, a regio, ou o pas - pode constituir um
:eresse.
cmais simples analisar dados que sejam representados s por n-
-._c lidar com uma mistura de nmeros e de outros caracteres, como
:etras do alfabeto, todas as variveis ou respostas ao question-
__.:.ificadas na forma de nmeros. Assim, por exemplo, fez-se cor-
~, :.:~~~2da uma das cinco respostas possveis primeira questo um al-
:tr:::::=:==:::.::?<Xie variar entre 1e 5. Se o sujeito tiver respondido: Branco jEu-
= :esposta cotada com um 1. (Embora o uso destas categorias
22
ANLISE DE DADOS EM CINCIAS SOCIAIS
Quadro 2.1
Os dados do Questionrio do Trabalho
01
11 16600 29 1 4O3442 42 222 3223 O17
02
21 14600 26 5 2OO23221 2344 41 3448
03
31 17800 40 5 444 41 21 2221 231 43 4O
04
31 16400 4615 22 5241 22 2322323 344
05
22 18600 6336 4 3 441 233345 541 353O
06
11 16000 5431 2 2 533211 2444 41 1341
07
11 16600 29 2 O3323223 2354223 52O
08
31 17600 35 2 52242343 2333223 442
09
22 17600 33
4 331 2423
41 22 3222115
10
22 13800 27 6 43 23321 323
4351 2244
11
11 14200 29 4 22 41 421 1 25
43 422 238
12
21 O 19 2 11 5241 111 343 31 3234
13
41 18000 5535 3 3342223 255 541 4351
14
12 17000 29 1 234242231 43 4411 22O
15
31 18200 48 8 33221 3244 23 3324 551
16
21 15800 32 7 33422 231 242 2222234
17
11 16600 4814 3 33241 222 45 441 2531
18
12 13400 18 1 22424232255 51 12336
19
32 15000 28 2 44232343 3323223 443
20
3 2 17600 37 1 32333321 2544 511 413
21
11 O 43 16 1 4433323
,
3
324424 526
22
11 17400 39 6 32323322 343 5321 155
23
11 18000 53 5 1434443 2235
421 335 13
24
22 16000 34 9
1341 51 21 1 344 321 339
25
3 2 17000 4317 43 45331 3232441 3522
26
11 14000 21 1 44 22343 3423 221 2553
27
11 16200 5028 3 23 3421 1 2555 41 2248
28
1 2 12400 31 9 125
1 4221 2445 423 55O
29
11 13600 3112 3 34333223 231 21 35 46
30
22 16400 5221 2 3232333322222 443 10
31
11 14400 5412 3 53333
23243 4424 42 99
32
32 12400 2810 2 241 51 22 233321 2449
33
22 16600 5023 4 4 343 423 43 33323 455
34
22 16000 5221 5 43 33 343 323 321 3254
35
1 2 15000 4021 1 1 3433 43 223221 22 36
36
21 11800 19 1 2252421 22555 5223 23
37
21 17600 38 4 541 43533321 21 24448
38
21 18000 6141 5 3241 322221 222 3543
39
1 2 15600 37 8 32423233245 451 344 08
40
21 13400 3115 2 25252221 555421 125
41
22 15000 4321 4 3 222342 3333311 42O
42
31 13600 23 3
125 351 1 21 44 451 3228
43
22 14000 27 5 11 41 41 11 245 4421 219
44
1 1 15000 28 7 331 3335331 221 12439
45
11 13200O 101 1 41 42222425 51 41 310
46
31 13400 18 1 423 42233243541 43 43
47
1 2 20600 4823 3 4333223221 322 4438
48
1 2 13600 2910 2 35442221 34221 344 11
49
1 2 14600 4210 2 2333221 2555521 44O
50
11 18200 5312 45 251 453422 2224 441
51
11 15200 3212 3 241 43 223 33421 2321
52
1 2 13000 31 2 1351 5223 25445 21 318
53
11 19000 5519 5 43 53 543 3343 31 343O
54
32 14800 26 8 441 33 45231 21 22 43 32
55
1 2 17200 5322 3 4231 344321 221 355O
56
1 1 15600 5131 2 33 333 24454551 4118
57
11 00 48 23 3 1 434222255451 1326
(continua na pgina seguinte)
ANALISAR DADOS COM O COMPUTADOR
23
"~'m>~"'~"'" '1>""',,,,,, """-""'<1
58
1 2 13800 4828
1 1 41 52221 555521 434 59 22 15800 6240
1 23 25 223 2544 52I I 57 60' 2
I 1740057 13 23 4 23 23J 23 34 3J 44I4
61 1 2 1780042 20 5 42 22 333321 242
3 332
62
11 1420021 2 I231 42 321 3333I 422O
63
32 12800 268 3I 3241 21 1 23 32I 4I 14
64
12 1360046 O 125 2431 225555223 45
65
1 2 21000 59
21 4 3242223 323 2224514
56
42 1420030 8 O3324 23 2254441 22
32
67
1 1 1460029 8 322 332321 5343 2I 45 10
38
31 1380045 9 23 4343333 343 322 349
39
31 1600053 30 3 25 3221 2245 3422I 42
'J
11 13800 4722 2 3 4252342435 41 24411
possa ser posto em causa, tal como muitos conceitos das Cincias Sociais, elas
::orrespondem a um tipo de informao que, por vezes, recolhido nos inqu-
:::os e funcionam, aqui, como exemplo de uma varivel nominal; ao longo do
lIVro, e para simplificar, passaremos a designar a primeira categoria apenas
por "branco"). Sempre que possvel, quando se constri um questionrio,
aconselhvel fazer corresponder nmeros s vrias respostas previsveis
para que, depois de recolhidos, no seja preciso trabalhar os dados antes de
os dar a introduzir a outra pessoa. Antes de fazer cpias do questionrio,
convm verificar sempre com a pessoa que vai lanar os dados se a cada
resposta foi, de facto, atribudo um nmero.
tambm importante reservar um valor numrico para dados omissos,
ou seja, para as situaes em que temos que registar uma resposta que amb-
gua ou que no suficientemente clara. Esse nmero no pode ser igual a
qualquer outro que tenha sido designado para codificar dados reais ou no
omissos. Por exemplo, se se utilizou os valores de 1a 5para representar as res-
postas questo sobre o grupo tnico de pertena, necessrio considerar um
nmero diferente para as respostas omissas. Neste questionrio todos os da-
dos omissos, excepto os referentes ao absentismo, foram codificados com um
Ouma vez que esse valor no pode ser confundido com os nmeros escolhi-
dos para corresponder aos dados reais. Como houve alguns empregados que
nunca estiveram ausentes do trabalho (i.e., cuja ausncia de Odias), as res-
postas omissas a esta pergunta no poderiam ser representadas por um "O".
Em vez disso, foram codificadas com "99" j que nenhum empregado se au-
sentou por tanto tempo. Como veremos mais tarde, usar o "O"tem, ainda, a
vantagem de tornar mais fcil o processamento desses dados quando algu-
mas variveis similares so combinadas. Por vezes, poder ser necessrio dis-
tinguir vrios tipos de respostas omissas como, por exemplo, distinguir uma
resposta "No Sei" de uma resposta "No se Aplica"; neste caso, estas duas
categorias de respostas devem corresponder a valores numricos distintos .
.,<, ~ ~ ~11~~_._1 _>-_:1. ..:_ ~ ~~rl~ ~";D;t,...l11'l'1n,1'l'1prn c]piclentificaco para,
24 ANLISE DE DADOS EM CINCIAS SOCIAIS
quando for necessrio, ser mais fcil ter acesso a um determinado caso. Este
nmero de sujeito deve ser colocado nas primeiras colunas de cada linha.
Corno no nosso exemplo ternos apenas setenta sujeitos, basta-nos ocupar as
colunas 1e 2. Se tivssemos 100sujeitos j teramos que utilizar as trs primei-
ras colunas para registar essa informao, urna vez que o nmero correspon-
dente ao ltimo sujeito seria constitudo por trs dgitos. Pode deixar-se -
embora no seja necessrio - um espao em branco entre as colunas onde so
introduzidos dados correspondentes a diferentes variveis.
De acordo com este formato, s precisamos de urna linha para registar
toda a informao sobre um sujeito; assim, essa linha fica reservada para ele e
os dados referentes ao prximo sujeito sero inscritos na linha seguinte. Se
para os dados referentes a cada inquirido forem necessrias mais do que urna
linha, as linhas ocupadas com a informao adicional devem ser as subse-
quentes. Neste caso, pode haver vantagem em dar a cada urna das linhas
onde se encontram os dados de um mesmo sujeito, um nmero de identifica-
o que nos ajude a ler mais rapidamente a informao; chamaramos, ento,
primeira linha nmero I, segunda nmero 2 e assim por diante. Cada linha
de dados relativos a um sujeito chamada, no SPSS, um registo (recard).
A primeira varivel do nosso questionrio e do nosso ficheiro de dados
refere-se origem racial ou tnica dos inquiridos. Corno ela s pode tornar um
de seis valores alternativos (se incluirmos a possibilidade de eles no terem
respondido a esta questo), podemos colocar esta informao numa nica co-
luna. Se deixarmos um espao entre os dois dgitos correspondentes ao n-
mero de identificao do sujeito e o dgito que representa o nmero do seu
grupo tnico de pertena, este ltimo dado ficar inscrito na coluna 4. Sendo
tambm a segunda varivel - o sexo - passvel de ser codificada apenas
com um dgito, o seu valor ser registado na coluna 6. Contudo, a terceira va-
rivel- rendimento bruto anual- requer que utilizemos cinco colunas para
o seu registo, urna vez que dois sujeitos (o 47 e o 65) receberam mais do que
10,000 libras. Deste modo, os dados referentes a esta varivel iro ocupar as
colunas 8 a 12, inclusive (de notar que, ao introduzir os dados, a vrgula que
sinaliza o separador dos milhes e o smbolo que representa as libras no se-
ro considerados).
Urna lista completa das variveis e das colunas que elas ocupam forne-
cida no quadro 2.2. O ficheiro de dados designado por qtb.dat que urna
abreviatura de "questionrio (q) do trabalho (t) dados (dat) brutos (b)". Corno
o SPSS aceita letras maisculas (por exemplo, QTB.DAT) ou minsculas
(qtb.dat) mais simples usar as minsculas. As restries e convenes relati-
vas ao formato destes nomes sero descritas posteriormente neste captulo.
ANALISAR DADOS COM O COMPUTADOR
dro 2.2 Nomes e localizao das variveis do Questionrio de Trabalho no SPSS
25
1e da varivel
1ero de identificao
)0 racial
o
dimento Anual Bruto
le
guidade na empresa
olvimento com a empresa
ala de satisfao no trabalho
Item 1
Item 2
Item 3
Item 4
ala de autonomia no trabalho
Item 1
Item 2
Item 3
Item 4
ala de rotina no trabalho
Item 1
Item 2
Item 3
Item 4
sena na reunio
.ecializao
dutividade
,lidade
;entismo
Como ter acesso ao SPSS
Nome no SPSS
id
gpracial
sexo
rendim
idade
anos
envolv
satis1
satis2
satis3
satis4
autonom1
autonom2
autonom3
autonom4
rotina1
rotina2
rotina3
rotina4
reuniao
especial
produtiv
qualid
absent
Colunas em que se localiza
1-2
4
6
8-12
14-15
17-18
20
22
24
26
28
30
32
34
36
38
40
42
44
46
48
50
52
54-55
.Ia usar O SPSS, necessrio dispor de um computador pessoal. Um compu-
:lor pessoal constitudo por um teclado, atravs do qual se escrevem as ins-
les, um rato, que fornece uma forma alternativa de movimentao no
ran e de seleco de instrues, e um monitor (VDU) ou cran que permite
sualizar aquilo que se digitou. Na medida em que a informao apresenta-
I, a cada momento, no monitor , necessariamente, limitada, informao
licional pode ser obtida atravs da utilizao apropriada do teclado ou do
to. Os computadores pessoais dispem ainda, habitualmente, de uma im-
'essora que pode ser utilizada para imprimir informao guardada no com-
ltador. Aimpressora pode, ento, servir para imprimir registos daquilo que
rezo
Os teclados so usados para escrever ou introduzir os dados (input) que
pretende analisar, bem como os nomes de variveis e ficheiros criados.
O sistema Windows permite que os comandos sejam seleccionados a
,--rir de palavras ou cones, apresentados em mens ou janelas mostradas
: icran. Estes comandos podem ser, normalmente, seleccionados atravs da
26 ANLISE DE DADOS EM CINCIAS SOCIAIS
movimentao de um ponteiro, chamado cursor, cursar este que operado
atravs de um teclado ou de um rato. O comando efectivado pressionando a
tecla ente r ou o boto esquerdo do rato ou ainda, no sistema Windows 95 / 98,
seleccionando a opo next. Aseleco de opes com o rato , pois, mais fcil
do que atravs do teclado, na medida em que envolve movimentos simples.
Com o teclado, algumas opes so selecciona das atravs das teclas de cursor
apropriadas, enquanto outras so seleccionadas atravs da utilizao de ou-
tras teclas. As teclas de cursor encontram-se, habitualmente, localizadas no
lado direito do teclado, e possuem setas que indicam a direco para a qual o
cursar movimentado. Em resumo, o rato pode ser prefervel para realizar
determinadas operaes, enquanto que o teclado pode ser til para outras.
Para aceder ao SPSSno ambiente Windows, basta seleccionar o boto .:gftf!
no fundo do cran, o que abre a primeira coluna (ou men) apresentado na ca-
ixa 2.1. Seleccionar Programs neste men, o que abre o segundo men (colu-
nas 2 e 3 da caixa 2.1). Note-se que, na maior parte dos computadores, estes
mens podem conter menos programas do que os mostrados na caixa 2.1.
~onrneService$:
ta PUleVoice
ta s, 'Up
@Jw~
O eudo!.
f! 10000000e
'i!J I_EI<I'I
l~ Microsoft Acce<,
~ M"'o,.f'E><eeI
iIi!ilM",osoftO_
~M",osoftP_
li!! MictosoftW d
,ia MS.flOS F10mpl
i~ O_El<pIe"
Illi S'~l'Iin
~W_EI<l'I<>"
m WIrlTun91
'.~ Wmip32
~ MictosoftOfflCeT""'"
'1!ilI MCfooof, FrontPege
:[ta EQSf W_
@l NortonAntlVlrus
ta QuickTine
'@l USRELf Win<:lowo95
ti SPSS for Windows ~
. ,@J Tine Zooe Corwert
,ta QuickTine forWlrldow,
ta Net.cape Communical
)oiGa D. ~
Caixa 2.1
A janela de abertura do Windows 95/98
ANALISAR DADOS COM O COMPUTADOR 27
:aixa 2.2
o Editor de Dados (Data Editor) do SPSS
:3eleccionar SPSS for Windows, o que faz surgir um ltimo men (localizado
::-,0 fundo da coluna 3 da caixa 2.1). Seleccionar SPSS 10.0 for Windows, o que
=.:'rea janela Data Editor apresentada na caixa 2.2. A caixa de dilogo SPSS
~ Unlilled - SPSS Dala Editor
Cases .
Transpose .
MergeFiles
tJggregate ...
Ortbogonal Design
""'~
Sp6tEe ...
Se!ect ,ases .
:!Iieighl Cases .
l!3r
I
~-
:aixa 2.3
o men drop-down da opo Data
28
ANLISE DE DADOS EM CINCIAS SOCIAIS
Caixa 2.4
A caixa de dilogo Select Cases
for Windows, que abre sobre o Data Editor cada vez que se acede ao SPSS,
pode ser eliminada seleccionando Don't show this dialog in the future no
fundo desta caixa de dilogo. Em opo, e de forma a introduzir dados direc-
tamente nas clulas do Data Editor, podemos seleccionar Cancel.
No topo da janela do Data Editor encontram-se os nomes de diferentes
procedimentos, tais como File, Edit, ete. Para verificar o contedo destes pro-
cedimentos basta mover o cursor para uma destas opes e pressionar uma
vez o boto esquerdo do rato. Um menu drop-down aparecer, tal como exem-
plificado na caixa 2.3 para a opo Data. Para ver as restantes opes, basta
deslocar o cursor at elas.
As opes dos mens drop-down seguidas de reticncias (... ), tal como
na opo Select Cases ... , indicam que uma caixa de dilogo aparecer uma
vez selecionada a opo. Por exemplo, se seleccionarmos a opo Select Ca-
ses ... , surgir uma caixa de dilogo com o mesmo nome (ver caixa 2.4).
Note-se que este procedimento conseguido uma vez que alguns dados te-
nham sido introduzidos no Data Editor. Para remover esta caixa de dilogo,
carregar no boto Cancel.
Aponta de uma seta apontando para a direita (~) seguida de uma opo,
tal como acontece no procedimento Merge Files, indica que, aps selecciona-
do, aparecer um submenu direita (tal como mostrado na caixa 2.8). Uma
ANALISAR DADOS COM O COMPUTADOR 29
:-"o sem qualquer tipo de sinais significa que no aparecero novos menus
. -::>rJ-down para seleccionar.
Ainda imediatamente abaixo destas opes existe uma barra de ferra-
::-.entas com botes. Estes permitem a realizao de procedimentos sem ter
~e passar pela seleco de menus e opes. As funes destes botes so
::-.ostradas colocando o rato sobre cada um deles (aparecer uma caixa amare-
...2. e uma descrio da funo no seu interior. Esta descrio surge, tambm, no
:-.:ndo do cran). Assim, por exemplo, o primeiro boto diz respeito opo
Open File. Podem adicionar-se mais botes a esta barra. A opo Help (des-
=:ra nas pp. 40-41) fornece instrues para realizar este procedimento.
A introduo e edio de dados no Data Editor
-. orma mais simples de introduzir dados no SPSS ser a de inscreve-los di-
=-",,--tamente na matriz de colunas e de linhas numeradas da janela do Data
~ditor, apresentada na caixa 2.2. Note-se que, neste caso, cada coluna pode
,::mter mais do que um dgito. Quando se acede ao SPSS, o curso r encontra-se
:-2. clula correspondente primeira linha da primeira coluna. O contorno
::;?staclula apresentado a negrito de forma a evidenciar que esta se encon-
::-aactiva. Para introduzir um valor em qualquer das clulas ser necessrio,
==n primeiro lugar, torn-las activas movendo as teclas de cursor ou o rato ins-
::-evendo, de seguida, o valor e, por ltimo, deslocando o cursor para outra
:;?:ula em que se deseje repetir esta operao. As colunas so consecutiva-
::-,ente numeradas uma vez introduzido um valor. Assim, se introduzirmos
.....:::1 nmero na quinta coluna, as colunas 1 a 5 sero nmeradas varOOOOla
arOOOOS. Para modificar um valor j introduzido, deslocar o curso r para a c-
.":":aque contm o valor a modificar e introduzir o novo valor. Se quisermos
::::ixar uma clula em branco, basta remover o valor com a tecla Backspace ou
;:}elete e mover o cursar para outra clula. Na clula em branco dever, agora,
=gurar um ponto (.), o que denota a presena de um valor omisso.
Nomear variveis no Data Editor
?:rra dar um nome a uma varivel no Data Editor, seleccionamos Variable
lew no canto inferior esquerdo da janela. De seguida, e sob a coluna Name,
_scolhemos a linha onde queremos introduzir o nome da varivel (por exem-
:-;0, e tal como apresentado na caixa 2.5, gpracial na primeira linha).
30
ANLISE DE DADOS EM CINCIAS SOCIAIS
Caixa 2.5
A janela Variable View do Data Editor
Os nomes no SPSS
Os nomes usados para designar ficheiros de dados ou quaisquer variveis
no SPSS tm que estar de acordo com determinadas condies. No podem
ser formados por mais do que oito caracteres e preciso que comecem com
uma letra (A-Z). Os restantes caracteres permitidos podem ser letras, nme-
ros, pontos,@,$ou_.2Nopermitido, tambm, deixar espaos em branco e
os nomes no devem terminar com um ponto nem, de preferncia, com _.
Adicionalmente, algumas palavras, as chamadas palavras-chave (key-
words), no podem ser utilizadas porque poderiam ser interpretadas pelo
SPSS como se fossem comandos. Por exemplo, esto nesta situao palavras
como add (somar), and (e ), any (qualquer), or (ou) e to (a). Se se utilizar, aci-
dentalmente, uma dessas palavras como nome, o programa avisar-nos-
que se trata de um procedimento invlido. Nenhuma das palavras-chave in-
clui nmeros, o que significa que um nome de varivel que contenha nme-
ros ser sempre reconhecido como tal. importante lembrar que no se
2 Os nomes de variveis no podem incluir caracteres portugueses como o ""ou o "".
(N. do T.)
ANALISAR DADOS COM O COMPUTADOR 31
?ode utilizar o mesmo nome para designar variveis ou ficheiros diferentes.
_\ssim, no possvel usar a palavra satis para referir as quatro questes re-
~ativas satisfao no trabalho, mas deve-se diferenci-las de alguma forma,
?odendo, por exemplo, acrescentar o nmero da pergunta. Nesse caso, o
:1ome das variveis seria satisl, para a resposta primeira questo, satis2,
?ara a resposta segunda, e assim por diante. Os nomes do SPSS dados s va-
:iveis do questionrio de trabalho so apresentados no quadro 2.2.
A definio de outros aspectos das variveis no Data Editor
Para alm do seu nome, podemos definir nove tipos de caractersticas das va-
riveis presentes no Data Editor. Estas caractersticas encontram-se listadas
nas colunas da matriz de dados e variam entre o tipo de varivel (Type) es-
querda e o seu nvel de mensurao (Measure) direita. Na medida em que
pode no ser possvel ver todas estas caractersticas de uma s vez no moni-
ror, podemos modificar a largura de cada coluna seleccionando a linha adja-
cente ao seu nome e colocando-a na posio desejada, tal como fizemos na
caixa 2.5.
As definies previamente existentes criao de uma base de dados no
SPSSencontram-se apresentadas e so conhecidas como as opes por defei-
to. Se desejarmos modificar quaisquer destas definies, podemos seleccio-
nar a linha e coluna apropriada e proceder s alteraes desejadas. De uma
forma geral, e para aquilo que nos interessa neste momento, a definio mais
importante a alterar a relativa aos dados omissos (Missing values).
A definio de dados omissos (missing values)
No questionrio do Trabalho, existem valores omissos para as avriveis
rendim (casos 12 e 21), idade (caso 45), satisl (casos 1 e 2), satis2 (caso 2),
produtiv (caso 1) e absent (caso 31). Assim, teremos que especificar os va-
lores omissos apropriados para estas variveis, e que so O para as primei-
ras cinco (rendim, idade, satisl, satis 2 e produtiv) e 99 para a sexta vari-
vel (absent). Para realizar esta operao, basta seleccionar, no Variable
View do Data Editor, a linha apropriada da coluna Missing, seguida da se-
leco da elipse ou das reticncias que aparecem nessa clula. Este ltimo
comando abre a caixa de dilogo Missing Values apresentada na caixa 2.6.
Para as nossas variveis, escolhemos a opo Discrete Missing Values, in-
troduzimos o valor correspondente na primeira coluna em branco e selec-
cionamos OK. Se, por exemplo, escrevermos O nesta ltima caixa, a pala-
vra None da clula correspondente do Variable View ser substituda por
O, tal como mostrado na caixa 2.5.
32 ANLISE DE DADOS EM CINCIAS SOCIAIS
Missing Values IIIilEJ
No missing values
o:l Qiscrete missing values
I~ ,1
Caixa 2.6
A caixa de dilogo Missing values
Se os dados foram introduzidos por outra pessoa, ser conveniente
dar-lhe a conhecer a forma como planemos a codificao dos dados omissos.
A definio de casas decimais
onmero de casas decimais definidas por defeito pelo SPSS de duas. Para a
maior parte das utilizaes, mais fcil codificar as variveis atravs de n-
meros, tal como fizemos para o Questionrio do Trabalho. Como todas os va-
lores destas variveis assumem nmeros inteiros, poderamos alterar o n-
mero de casas dcimais de 2 para Ona coluna DecimaIs da janela Variable
View. Para tal, bastaria seleccionar a linha correspondente a esta coluna (uma
linha de cada vez) e pressionar o boto com a seta apontando para baixo at
surigir o valor O.
A definio de etiquetas das variveis e dos seus valores (value labels)
Os nomes das variveis no SPSSso restringidos a 8caracteres, oque significa que,
a maior parte das vezes, teremos que os alterar, tomando o seu significado menos
claro. Usando esta opo, podemos criar etiquetas (labels) das variveis que apa-
recero no output. Estas etiquetas podem ser bastante extensas, ainda que a maior
parte dos outputs no as apresentem. Por exemplo, a varivel do SPSS gpracial
pode ser etiquetada grupo racial. Para realizar esta operao, introduzimos, na ja-
nela Variable View, aquela etiqueta na primeira linha da coluna Labels. Desta for-
ma, o nome completo da varivel ser apresentado nas caixas de dilogo em que
exista listagem de variveis (por exemplo, ver caixa 2.12), seguido do seu nome
abreviado entre parentesis. Na presente obra, optmos pela utilizao dos nomes
abreviados das variveis do Questionrio do Trabalho.
.-\.."lALISAR DADOS COM O COMPUTADOR 33
-. 'alue Labelss;;;;;;7=.
1 = "Branco"
2 = "Asitico"
3 = "Indiano"
4 = "Africano"
A caixa de dilogo Value labels
Podemos, tambm, etiquetar os valores de uma dada varivel, esco-
_-'endo a linha apropriada na coluna Values (por exemplo, gpracial), seguido
':a seleco da elipse, ou das reticncias, presentes nessa clula. Este procedi-
=:ento faz abrir a caixa de dilogo Value Labels apresentada na caixa 2.7. De-
:-ois, basta escrever o valor (por exemplo, 1) na caixa designada Value:, a eti-
~:leta (por exemplo, branco) na caixa designada Value Label: e seleccionar
Add. As etiquetas dos valores de uma varivel podem conter at 60 caracte-
:-.:s,ainda que a maior parte dos outputs no os mostrem na ntegra. Para re-
:::lOver uma determinada etiqueta basta seleccion-la e escolher Remove.
?ara modificar uma etiqueta, teremos que seleccion-la, introduzir as altera-
;es desejadas e escolher Change. Terminadas estas operaes, pressiona-
::lOSOK para fechar a caixa de dilogo Value Labels.
A definio do formato e alinhamento das colunas
-=: pouco provvel que desejemos modificar a largura de uma coluna do Data
Editor. Contudo, se o quisermos fazer basta seleccionar a linha apropriada na
:oluna Columns e pressionar o boto com as setas apontando para cima e
?ara baixo at obter o valor desejado. Se pretendermos alterar o alinhamento
;:iosdados numa determinada coluna, teremos que seleccionar a linha apro-
?riada na coluna Align, pressionar a seta apontando para baixo seguida de
-..unadas duas opes que aparecem na sequncia desta operao.
Definir variveis consecutivas em simultneo
Sedesejarmos definir o mesmo formato para variveis consecutivas (como por
exemplo, satis1 a rotina4), teremos que definir a primeira varivel ( satis1),
34
ANLISE DE DADOS EM CINCIAS SOCIAIS
copiar esta linha, seleccionar as linhas subsequentes a modificar (9 a 19), selec-
cionar Paste ou Paste Variables ... e renome ar as variveis de acordo com o
seu nome original.
Guardar os dados no Data Editor
Quando pretendemos encerrar uma sesso de trabalho no SPSS, ou utilizar
outra base de dados numa mesma sesso, devemos guardar os dados, ou
qualquer alterao que tenhamos operado sobre os mesmos, num ficheiro.
Podemos, portanto, gravar este ficheiro no disco rgido do computador. Con-
tudo, se outras pessoas utilizam este equipamento podem, inadvertidamen-
te, apagar o nosso trabalho. Mesmo que mais ningum utilize o computador,
sempre conveniente fazer uma cpia de segurana do nosso ficheiro numa
ou mais disquetes formatadas. Adisquete , normalmente, inserida numa dri-
ve do computador.
Para que o ficheiro seja identificvel, necessrio dar-lhe um nome. O
nome de um ficheiro consiste de uma prefixo com o mximo de oito caracte-
res, seguido de um ponto e de um sufixo (ou extenso) com trs caracteres. O
nome do ficheiro refere-se, usualmente, ao seu contedo (tal como no nosso
'lar
View al3LIranslorfl!_~naiYzeJraphs
.-1ia'J'iiia
-Dsta ...
fulntax. ..
QutpuL
SJ;<ripl .
Olher .
' Untilled - SPSS Data Editor
~.
S~itch Server...
RecenUyUsed Da!a .
Recently Used files .
Ej!it
Caixa 2.8
o menu drop-down File
ANALISAR DADOS COM O COMPUTADOR
: Save Data As 6 EJ
35
GjJaldar em: IGi Disquele de 3li (A:)
_orne do ficheiro:
Guardalcorno!ipo:!SPSS (".sav)
qardat
:e'Siew~
Cncelar k.
::aixa 2.9
A caixa de dilogo Save Data As
:.asoqtb refere-se a questionrio de trabalho - dados brutos), enquanto que o
:-.orneda extenso refere-se ao tipo de ficheiro. Os ficheiros criados no Data
Editor possuem, por defeito, uma extenso sav. Assim, o nosso ficheiro de da-
':'ospode tomar o nome de qtb.sav. Nos sistemas operativos mais recentes, as
~,tenses aparecem representadas sob a forma de smbolos e no de nomes
:al como mostrado na caixa 2.10).
Ao longo desta obra, vamos utilizar uma notao particular para des-
:::-everos passos envolvidos num procedimento do SPSS. Aseleco de um
-;asso ou de uma opo ser indicada por uma seta apontando para a direi-
-2. ?, o que indica as opes dos menus ou caixas de dilogo a serem esco-
_---:idas. Todas as explicaes adicionais aos procedimentos sero introdu-
.::das entre parntesis rectos. Os passos referentes a uma caixa de dilogo,
::1 a uma subcaixa de dilogo (que uma caixa que s pode ser acedida
=?s ter sido aberta uma caixa de dilogo principal) comeam numa linha
- .)\Oa. Atotalidade da sequncia de procedimentos ser identada. Assim, a
- ;)tao dos procedimentos para gravar o ficheiro que referimos anterior-
::-.ente numa disquete introduzi da na drive A :
?File [apresentado na caixa 2.8] ? Save As ... [abre a caixa de dilogo
Save Data As apresentada na caixa 2.9]
escrever a:\qtb.sav na caixa situada ao lado de File name: ~ Save
36
ANLISE DE DADOS EM CINCIAS SOCIAIS
Nome do ficheiro: [qtb
Ficheiros do !ipo: I5Ps 5 [".sav J
Caixa 2.10 A caixa de dilogo Open File
'~ii'~'~'l
l'
Eailte'
Recuperar um ficheiro guardado no Data Editor
Se quisermos recuperar o ficheiro anterior numa fase posterior, vamos utili-
zar o procedimento seguinte:
~ File ~ Open Data [abre a caixa de dilogo Open File apresentada na
caixa 2.10f
escrever a:\qtb.sav na caixa situada ao lado de File name: ~ Open
Abrir um ficheiro de dados em ASCII no Data Editor
Se os dados foram guardados numa disquete sob a forma de um ficheiro
ASCII chamado qtb.dat, ento teremos que seguir o procedimento seguinte
para abrir este ficheiro no Data Editor:
~ File ~ Read Text Data ... [abre a caixa de dilogo Open File apresen-
tada na caixa 2.10]
3 Esta instruo est omissa no original. Contudo, como o leitor pode verificar, o procedi-
mento "File" seguido de "Open" exige a escolha de uma opo adicional, isto , a opo
entre abrir um ficheiro de dados (Data), de sintaxe (Sinta x), de resultados (Output), ete.
(N. do R)
ANALISAR DADOS COM O COMPUTADOR
Ield Imporl Wrzard - Slep 1 016
Welcome lo lhe texl imporl wizard!
Ths wizerd wili help you read dale f,omyour lexl file end
specify informlion ebout lhe variables.
oes your text file match e predefined formei?
CJYes
37
Textfile:
O
I
~~11660029 140342242222322301
2 11460026 520023221234441344
3 11780040 544245212221231434
4 116400461522122122232232334
~
:aixa 2.11 A caixa de dilogo Tex! Impor! Wizard
Help
escrever a:\qtb.dat na caixa situada ao lado de File name: ~ Open
[abre a caixa de dilogo Text Import Wizard - Step 1 of 6apresentada na
caixa 2.11]
~ Next> [abre a caixa de dilogo Text Import Wizard - Step 2 of 6]
~ Fixed width ~ Next> [abre a caixa de dilogo Text Import Wizard-
Step 3 of 6]
~ Next> [abre a caixa de dilogo Text Import Wizard - Step 4 of 6]
~ Next> [abre a caixa de dilogo Text Import Wizard - Step 5 of 6]
~ Next> [abre a caixa de dilogo Text Import Wizard - Step 6 of 6]
~ Finish [fecha a caixa de dilogo Text Import Wizard - Step 6 of 6 e
apresenta os dados no Data View]
~ Variable View [para definir os dados]
Procedimentos estatsticos
:=;.epoisde termos introduzido os dados no Data Editor, estamos preparados
-:~a analisar os dados. O resto do livro procura descrever as diferentes for-
::-..3.5 de o fazer. Para lhe mostrarmos como isto se faz, vamos pedir ao SPSS
38 ANLISE DE DADOS EM CINCIAS SOCIAIS
~Descriplives E!
<t> gpracial
<t> sexo
<t> rendim
<t> anos
<iI') envolv
<t> satis1
<t> satis2
/#L~atis3
Save standardged values as variables
Caixa 2.12 A caixa de dilogo Descriptives
Quadro 2.3 O output do comando Descritptives
Descriptive Statistics
)
IDADE 69 18 63
12,32
Valid N
69
que calcule a idade mdia (mean) da amostra. Podamos faz-lo a partir de v-
rios comandos do programa mas vamos usar apenas o que aparece com o
nome de Descriptives Satistics (estatsticas descritivas). Este fornece-nos,
tambm, acesso a outras estatsticas descritivas da varivel. O procedimento
para realizar este comando :
~ Analyze 7 Descriptive Statistics ~ Descriptives ... [abre a caixa de
dilogo Descriptives apresenada na caixa 2.12]
~ varivel [por exemplo, idade; note-se que as variveis encontram-se
listadas por ordem no Data Editor]
~~[boto] [coloca a varivel seleccionada na caixa abaixo de Varia-
ble[s]:] ~ OK
O output deste comando mostrado na janela Viewer, tal como apresentado
no quadro 2.3. A idade mdia da amostra de 39,19. As restantes estatsticas
descritivas, apresentadas por defeito, so o desvio-padro (ver captulo 5), a
idade mnima, a idade mxima e o nmero total de casos (N) sobre o qual as
"-"ALISAR DADOS COM O COMPUTADOR 39
:Bescriplives: Options D
Help
rlSke~ness
r~~um
_Minimum
C. Ma]!imum
riS.&.. mean
.:1ean
rsion
-spla!,! Order
VariaQle list
lphabetic
As.Qending means
Qescending means
-.:. xa 2.13 A subcaixa de dilogo Descriptive: Options
- ..adro 2.4 O ou/pu/ Mean Descriptive
Descriptive Statistics
IDADE
Valid N
3:atsticas descritivas foram calculadas. Se olharmos para as idades do Qu-
_::ionriode Trabalho, podemos confirmar que a idade mnima , de facto, 18
.:'.os(caso nmero 1), enquanto que a idade mxima de 63 anos (caso nme-
- = 3). Devemos notar, tambm, que a idade de um dos respondentes (caso n-
=-.ero45) omissa, o que faz com que o nmero total de dados vlidos para
_3,avarivel seja 69 e no 70.
Como se pode observar no quadro 2.3, o output apresentado na janela
'lewer sempre precedido pelo nome do procedimento estatstico realizado.
,) presente caso, o procedimento que utilizmos foi o Descriptive. Por ra-
= ~sde espao de edio, os outputs que apresentaremos ao longo desta obra
-io contm este tipo de ttulos.
ANLISE DE DADOS EM CINCIAS SOCIAIS
?re:emiessemos obter, apenas, a mdia das idades da nossa amos-
tra sem as :-e::.'"i:ch".tes estatsticas, poderamos proceder do seguinte modo: se-
leccionar Options ... na caixa de dilogo Descriptive: Options apresent~a
na caixa 2.13. Depois, remover a seleco Std. deviation, Minimum e Maxl-
mum, ffim'e:'.cio o cursor para as caixas adjacentes a cada uma destas opes.
O Oll:pl..; corre:,,-pondente a este procedimento apresentado no quadro 2.4.
Se ::ecessitarmos de voltar ao Data Editor, podemos optar por um de
dois procedimentos: seleccionar qtb-S ... no fundo do cran ou a opo Win-
dow segmeia de 1 qtb-SPSS Data Editor do men drop-down. Se uma opera-
o do SPSS ioi comea da e no concluda (por exemplo, se todas as caixas de
dilogo r~-peitantes a uma dada operao no foram encerradas), no ser
poss,,:,el percorrer o contedo da janela Viewer.
Guardar e imprimir o Output
Para imprimir o contedo de uma janela, basta torn-la activa e executar a se-
quncia seguinte:
~ File ~ Print ... ~ OK
Se quisermos guardar os contedo de uma janela numa disquete, podemos
seguir os passos seguintes:
~ File ~ Save As ~ janela [abre-se a caixa de dilogo Save As]
~ identificar a drive e nomear o ficheiro na caixa ao lado de File name:
[por exemplo, a:\qtb.spo] ~ Save
O nome, por defeito, das extenses dos ficheiros de output spo, ou seja, a
abreviatura de ficheiro spss output. Estes ficheiros podem ser editados antes
de serem gravados: por exemplo, pode desejar apagar-se determinadas anli-
ses ou escrever comentrios adicionais s anlises efectuadas.
Sistema de ajuda
O SPSS possui um sistema de ajuda que pode ser muito til para evitar o re-
curso constante a um livro como o presente, ou ao manual do programa.
Como este sistema foi concebido para ser auto-explicativo, o leitor dever
ser capaz de o utilizar depois de adquirida alguma experincia. Para obter
ajuda num tpico como file (ficheiro), vamos realizar a sequncia
seguinte:
.. ' .. .'\lALISAR DADOS COM O COMPUTADOR
'"' . ' ..
.. "
I~~t
.
I
I
~.::I
= l<! tique robre livro e, em ;egufd, sobreAbJir, Pode ~ fazer dique
""O..C1:> _odor como, polel<et'llpio, ndice remissivo',
'1\ .'
'. Getting Help
"
I
Tliorials
Dist,;buted Analysis Data management
I
5 tatistical anal}lsis
Graphical analysis Inleractive charts Output management Saving Files I
Printing Files
.:::.
Customizing SPSS
l~~~:~~:e~~r~~~~~o,~ .. __
'.'l'.
fj
Ir
Ali1r
1I1'!~~llr~1
2.14 A caixa de dilogo Help Topics Content
41
~ Help ~ Topics [abre a janela Help Topics Contents apresentada na
caixa 2.14]
~ Find [abre a janela Help Topics Find apresentada na caixa 2.15] ~ na
primeira caixa escrever o termo a pesquisar, ou o mais prximo possvel
do desejado [por exemplo, file] ~ Select some matching topics to nar-
row your search [por exemplo, File] ~ Click a topic, then click Display
[por exemplo, Open file] ~ Display [abre a caixa de informao Help
apresentada na caixa 2.16]
~ ? [para minirnizar (Minimise) ou fechar (Close) o sistema de ajuda]
::ecessitarmos de ajuda enquanto se trabalha numa caixa de dilogo, selec-
_:.ar a opo Help nessa mesma caixa.
Terminar uma sesso de trabalho no SPSS
-==. terminar uma sesso no SPSS, seleccionar File seguido de Exit. Se tive-
-sido editados ou analisados dados numa dada sesso, o SPSS envia uma
sagem de aviso para gravar os contedos do data editor ou do output vi e-
Se no desejarmos gravar a nossa sesso de trabalho, seleccionar No. Se
:.~jar gravar, seleccionar Yes e dar um nome ao ficheiro (no caso de ainda
42
ANLISE DE DADOS EM CINCIAS SOCIAIS
Lcaizar I
~ CiQua num tpico e, em seguida. sobre 'tAoollar'
Add Cases
Add Cases 01 Variables: Rename
Add Cases: Dictionary Information
Add Files Command Synla.
Add Variables
AJJding T\,xt
!Jmpor
~u
"B
ftecoristruit.u
"111X
/
Caixa 2.15
A caixa de dilogo Help Topics Find
Opens lhe selected data file.
Onl~ one dala file can be open ai a lime. The current dala
file is aulomaticall~ c10sed when a new dala file is opened.
If ~ou wanllo have mulliple data files open ai lhe same
time, ~ou can starl mulliple sessions.
Click See Also above for addilional information on
opening data files.
Caixa 2.16
A caixa de informao Help
no existir nenhum ficheiro j previamente gravado). O leitor deve notar bem
que se sairmos do SPSS sem guardar quaisquer alteraes, todo o trabalho
realizado na sesso ser perdido.
ANALISAR DADOS COM O COMPUTADOR
Exerccios
43
Voc pretende recolher informao sobre as preferncias religiosas dos
seus inquiridos e lembrou-se das seguintes alternativas: agnstico,
ateu, budista, catlico, hindu, judeu, muulmano, protestante e taosta.
Que outra categoria deveria ainda ser includa?
Voc pretende gravar esta informao num ficheiro de dados, para ficar
armazenada num computador. Como deveria codific-la?
Depois de ter os questionrios preenchidos, voc repara que num deles
o sujeito no respondeu a esta pergunta. Quando introduzir os dados no
ficheiro de dados, como que vai referir este facto?
Suponha que um outro sujeito assinalou duas categorias em vez de uma
s. O que faria nesta situao?
Os primeiros dois sujeitos da sua amostra de cinquenta descrevem-se
como agnsticos e os dois seguintes como ateus. As idades destes sujei-
tos so, respectivamente, 25, 47, 33 e 18. Como escreveria esta informa-
o no ficheiro de dados?
Quantas colunas de um ficheiro ASCII so necessrias para codificar as
respostas dos sujeitos pergunta sobre a sua filiao religiosa, se todas
as opes tiverem sido escolhidas pelo menos uma vez?
Como que o SPSS sabe o que representam os diferentes nmeros que
constituem o ficheiro de dados?
Em cada linha, qual o nmero de colunas disponvel para colocar dados
ou comandos que existe na maior parte dos computadores?
Qual o nmero mximo de caracteres que podem ser usados para desig-
nar uma varivel no SPSS?
Apndice 2.1 Questionrio do Trabalho
Questionrio aos Empregados
:=.stequestionrio foi construdo para estudar alguns factos sobre si e sobre o
seu trabalho. Por favor, responda com sinceridade. No existem respostas
:ertas ou erradas.
Cdigo
Qual o grupo racial ou tnico a que pertence? (Assinale um)
Coluna
4
__ Branco / europeu
--Asitico
1
2
44 ANLISE DE DADOS EM CJ~NCJAS SOCIAIS
--Indiano 3
-- Africano 4
--outro 5
2. Qual o seu sexo? 6
-- Masculino 1
-- Feminino 2
3. Actualmente, qual o seu rendimento anual bruto (antes dos descontos
e impostos)?
- 8-12
4. Quantos anos tem?
--anos 14-15
5. H quantos anos trabalha nesta empresa?
--anos 17-18
6. Por favor, indique em relao a cada uma das afirmaes seguintes se (1)
discorda totalmente, (2) discorda, (3) est indeciso, (4) concorda, ou (5)
concorda totalmente. Para cada afirmao, assinale s uma resposta.
(a) No deixaria esta empresa mesmo
que pudesse ganhar um pouco mais noutra (1) (2) (3) (4) (5) 20
(b) Para mim, o meu emprego como
umhobby (1)(2)(3)(4)(5) 22
(c) A maior parte das vezes tenho
que meforar a ir para o trabalho (1)(2)(3)(4)(5) 24
(d) Quase todos os dias me sinto entusiasmado
como meu trabalho (1)(2)(3)(4)(5) 26
(e) Omeu trabalho muito desinteressante (1)(2)(3)(4)(5) 28
(f) Tenho autorizao para executar
o meu trabalho da forma que me
parecer melhor (1)(2)(3)(4)(5) 30
(g) Posso tomar decises sobre a forma
de executar o meu trabalho (1)(2)(3)(4)(5) 32
(h) Na seco da empresa onde estou inserido,
as pessoas podem executar o seu trabalho
da forma que mais lhes agradar (1) (2) (3) (4) (5) 34
(i) Se eu quiser fazer uma pequena alterao
na minha forma de trabalhar, no preciso
deconsultarosupervisor (1)(2)(3)(4)(5) 36
(j) Fao o meu trabalho praticamente
da mesma maneira todos os dias (1)(2)(3)( 4)(5) 38
(k) H pouca variedade no meu trabalho (1) (2) (3) (4) (5) 40
(1) O meu trabalho repetitivo (1) (2) (3) (4) (5) 42
(m) H poucos aspectos do meu trabalho
que se alterem de dia para dia (1)(2)(3)(4)(5) 44
ANALISAR DADOS COM O COMPUTADOR
Estevepresente na reunio da empresa, este ms?
--sim 1
--no 2
Questionrio ao Supervisor
45
46
::car-lhe-a grato se pudesse responder s perguntas que se seguem sobre
~a das pessoas cujo trabalho supervisiona:
_;ome do Empregado.)
Por favor, descreva o nvel de especializao que lhe parece
exigir o trabalho que essa pessoa desempenha.
Qual das seguintes descries seria mais adequada?
(Assinale uma das alternativas)
-- no especializado 1
-- semi-especializado 2
-- bastante especializado 3
-- muito especializado
Como classificaria a sua produtividade? (Assinale uma das
alternativas)
-- muito fraca 1
--fraca 2
--Mdia 3
--Boa 4
Muito boa 5
Como classificaria a qualidade do trabalho dele(a)?
(Assinaleuma das alternativas)
-- muito fraca 1
--fraca 2
--Mdia 3
--boa 4
muito boa 5
Nos ltimos doze meses, quantos dias ele(a)faltou?
--dias
48
4
50
52
54-55
Captulo 3
ANALISAR DADOS COM O COMPUTADOR
Dominar melhor o SPSS 10 para Windows
-_gora que j sabe como se cria um ficheiro de comandos para o SPSS, pode-
=:05 apresentar-lhe outros procedimentos que lhe podem vir a ser muito
.::eis Estes procedimentos permitir-lhe-o fazer o seguinte: seleccionar casos
~-pecficos (por exemplo, os homens brancos com menos de 40 anos), para fa-
=er anlises separadas; criar novas variveis (por exemplo, a classificao
-'..lffia escala de atitudes ou de personalidade) e novos ficheiros de dados
?ara as guardar); criar descries mais completas das variveis; e
Select Cases S
3.1 A caixa de dilogo Select Cases
47
48
1!>gpr acial
1!>~
1!>rendim
1!>idade
~anos
~envolv
1!>satis'
1!>satis2
<%> satis3
.~ satis4
,to) autonom'
.:;jp autonom2
A~
Caixa 3.2
ANLISE DE DADOS EM CINCIAS SOCIAIS
A subcaixa de dilogo Selecl Cases: 11
acrescentar comentrios que lhe permitam recordar aquilo que j fez. O SPSS
pode tambm executar operaes que no so descritas neste livro, como seja
combinar ficheiros de diversas maneiras. Se precisar de utilizar operaes
que no sejam mencionadas neste livro, dever consultar o menu Help (aju-
da) ou o Guia do SPSS.
Seleccionar casos
Para seleccionar casos com determinadas caractersticas, usa-se o menu Data
e a opo Select cases ... , o que abrir uma caixa de dilogo Select Cases (se-
leccionar casos) tal como pode ser observado na caixa 3.1. Se quiser descobrir,
por exemplo, a idade mdia dos homens da amostra que respondeu ao Ques-
tionrio do Trabalho, dever seleccionar If condition is satisfied (se a condi-
o for satisfeita), seguido de If, o que abrir a subcaixa de dilogo Select ca-
ses: If (seleccionar casos: se) apresentada na caixa 3.2. Na caixa em branco de-
ver introduzir as condies que deseja que os seus dados satisfaam para se-
rem seleccionados. De acordo com o nosso exemplo, vamos introduzir a con-
dio sexo = 1, na medida em que, na base de dados, os homens foram codifi-
cados com o nmero 1. De seguida, seleccionamos Continue (continuar) de
forma a fechar a subcaixa de dilogo Select cases: If, e OK para fechar a caixa
de dilogo Select Cases.
Para calcular a mdia de idades dos homens da amostra, vamos proce-
der realizao da sequncia seguinte de instrues:
~ Analyze ~ Descriptive Statistics ~ Descriptives ... [abre a caixa de
dilogo Descritptives apresentada na caixa 2.12]
ANALISAR DADOS COM O COMPUTADOR
Quadro 3.1 Idade mdia dos sujeitos do sexo masculino do Questionrio de Trabalho
Descriptive Statistics
49
IDADE
Valid N
7 idade 7~ [boto] 7 Options [abre a subcaixa de dilogo Descripti-
ve: Options apresentada na caixa 2.13]
Std.deviation [para remover a seleco] 7 Minimum 7 Maximum
7 Continue
70K
o resultado deste procedimento apresentado no quadro 3.1.
A seleco dos casos mantm-se activa at ser dada uma instruo para
a terminar. Se se pretender levar a cabo anlises estatsticas com a totalidade
da amostra ou, somente, com mulheres, deve alterar-se a seleco dos casos.
Para realizar anlises com a totalidade da amostra deve seleccionar-se All ca-
ses (na caixa de dilogo Select Cases); se se desejar, apenas, utilizar sujeitos
do sexo feminino deve introduzir-se a condio sexo = 2 na subcaixa de dilo-
go Select cases: If.
Operadores relacionais
Um operador relacional como = (igual) compara o valor sua esquerda (por
exemplo, sexo) com o da sua direita (por exemplo, 1). H seis operadores rela-
cionais que podem ser representados pelos smbolos que se seguem:
= igual a (equal to)
no igual a (not equal to)
< menor que (less than)
<= menor ou igual a (less than or equal to)
> maior que (greater than)
> = maior ou igual a (greater than or equal to)
.-\escolha do operador mais indicado para cada caso depender do critrio de
seleco que se considerar. Para seleccionar sujeitos com menos de 40 anos,
?oderamos usar menor que ):
idade < 40
50 ANLISE DE DADOS EM CINCIAS SOCIAIS
Claro que tambm se obteria o mesmo resultado se se usasse menor ou igual a
=) 39, uma vez que estamos a lidar com nmeros inteiros:
idade < = 39
Para seleccionar sujeitos no brancos, poderamos usar no igual (- =) a 1, j
que os brancos foram codificados com o nmero 1:
gpracial - = 1
Combinar operadores lgicos
Podemos combinar expresses lgicas com os operadores lgicos & (and) e I
(or). Podemos, por exemplo, seleccionar os homens brancos com menos de 40
anos, usando a seguinte expresso condicional:
gpracial = 1 & sexo = 1 & idade < 40
Para escolher apenas sujeitos indianos ou africanos, precisaramos utilizar o
operador lgico I (or):
gpracial = 3 I gpracial = 4
Note-se que necessrio repetir toda a relao lgica. No possvel abreviar
o comando do seguinte modo:
gpracial = 3 14
Uma forma alternativa de fazer o mesmo usar a funo lgica any (qual-
quer) em que se seleccionam valores da varivel gpracial iguais a 3 ou 4:
any (gpracial, 3, 4)
A varivel e os valores pretendidos colocam-se entre parntesis.
Para seleccionar sujeitos com idades entre 30 e 40, inclusive, podemos
usar a expresso:
age> = 30 & age < = 40
Neste caso, temos que usar o operador lgico & (and). Se usssemos I (or) es-
taramos de facto a seleccionar toda a amostra, dado que toda a gente tem
mais de 30 ou menos de 40 anos de idade.
.... "ALISAR DADOS COM O COMPUTADOR 51
Uma outra forma de fazer esta escolha de sujeitos entre os 30 e os 40 anos
':'e idade inclusive, consiste em utilizar a funo lgica range (amplitude), em
?e ser seleccionado qualquer caso em que a varivel idade apresente um
alor dentro desse intervalo de idades:
~ge(age,30,40)
Recodificar os valores das variveis
Por vezes, necessrio mudar ou recodificar os valores de algumas variveis.
_~sim, por exemplo, recomendvel que a-construo das questes que vo
servir para criar uma escala, um ndice ou uma medida composta que varie
"::eforma a que as pessoas que respondam sim a todas as perguntas ou, pelo
-ontrrio, no a todas, no tenham um valor extremo. Repare-se, por exem-
?lo, que construmos duas das quatro questes destinadas avaliao da sa-
:isfao no trabalho no Questionrio do Trabalho - pergunta 6c ("A maior
?arte das vezes, tenho que me forar a ir para o trabalho") e pergunta 6e ("0
~eu trabalho muito desinteressante") - na direco oposta das outras duas
- pergunta 6b ("Para mim, o meu emprego como um hobby") e pergunta 6d
"Quase todos os dias sinto-me entusiasmado com o meu trabalho"). A res-
?osta a estas questes dada numa escala de cinco pontos que vai desde 1
"discorda totalmente") at 5 ("concorda totalmente"). Poderamos inverter a
escala para os itens 6c e 6e, mas talvez os sujeitos percebessem o que ns pre-
tendamos. Assim, mais simples inverter os cdigos quando se analisam os
dados. Se quisermos que a um resultado mais elevado corresponda uma
maior satisfao no trabalho, deveremos recodificar as respostas destes dois
itens, de modo a que o 1 seja o 5, o 2 seja o 4, o 4 seja o 2 e o 5 seja o 1. Para o
Recode inlo D.f1erenl Vaflables Ei
,o ...... v__ ;
satis2 u> rsatis2
JI ~ame: I
. ; Change
. rsalls4 Jrl _
I LabeI:
iIt =
,~
I'"
NumericVariable) OutpulVariable:
() gpracial
~sexo
~rendim
'IF>idade
,~ anos
~envolv
~salis1
~salis3
~autonom1
~autonom2
~aulonom3
~aulonom4
Caixa 3.3
A caixa de dilogo Recode into Different Variables
52 ANLISE DE DADOS EM CINCIAS SOCIAIS
Caixa 3.4
A subcaixa de dilogo Recode inlo Differenl Variables: Old and New Values
fazermos, poderemos usar o comando Recode (recodificar) que se encontra
no menu Transform (transformar). Podemos recodificar valores utilizando a
mesma (Into Same Variables ... ) ou uma varivel diferente (Into Different
Variables ... ).
Se quisermos comparar os valores originais de uma varivel com os re-
codificados, ou se pretendermos guardar os valores originais, podemos utili-
zar a opo Into Different Variables ... , a qual abre a caixa de dilogo Recode
into Different Variables (recodificar para uma varivel diferente) apresenta-
da na caixa 3.3. Por exemplo, se pretendermos recodificar as variveis satis2 e
satis4 noutras variveis novas rsatis2 e rsatis4, transferimos satis2 para a cai-
xa intitulada Numeric Variable ~ Output Variable:, escrevendo o nome da
nova varivel (rsatis2) na caixa Name: e seleccionamos Change. Podemos re-
petir esta mesma operao para a varivel satis4, recodificando-a para uma
nova varivel rsatis4.
De seguida, seleccionamos Old and New Variables ... , o que abre a sub-
caixa de dilogo Recode into Different Variables: Old and New Values apre-
sentada na caixa 3.4. Na caixa intitulada Value (na seco Old Value, onde o v
de Value: se encontra sublinhado para o distinguir de Value: da seco New
Value, onde o I de Value se encontra sublinhado), escrevemos o primeiro va-
lor a ser modificado (por exemplo, I), enquanto na caixa intitulada Value (na
seco New VaIue) escrevemos o novo valor (por exemplo, 5), seleccionando,
no final, Add. Repetimos esta operao consecutivamente para os trs restan-
tes valores originais 2, 4 e 5. Para os valores que se mantm idnticos (por
exemplo,3), podemos escrever o valor original na caixa intitulada Value: e se-
leccionar Copy Old Value[s] e Add. Os valores para cada caso so registados
~-
ANALISAR DADOS COM O COMPUTADOR
S ummarize Cases EJ i
53
(~ rotina1
<%>rotina2
<%>rotina3
<%>rolina4
<%>reuniao
(t;> especial
<%>produtiv
<%>qualid
<:~ absent
<%>,rsalis4
<%>satis
<:'t> ethnigpc
Show ,ase numbers
~ariables:
<%>salis2
<%>rsatis2
<%>satis4
!irouping Variable(s):
Help
Caixa 3.5
A caixa de dilogo Summarize Cases
da esquerda para a direita e modificados somente uma vez. Neste sentido,
quando 1, inicialmente, recodificado para 5 (1~ 5) no , subsequentemen-
te, reconvertido para 1(5 ~ 1).No caso de existirem valores omissos (missing
values), como no presente exemplo, deve seleccionar-se System- or
User-missing (na seco Old Value) e System-missing (na seco New
Value).
Aps estes procedimentos, seleccionamos Continue para fechar a sub-
caixa de dilogo Recode into Different Variables: Old and New Values e OK
para fechar a caixa de dilogo Recode into Different Variables. Podemos, en-
to, verificar os valores recodificados nas colunas correspondentes (satis2,
rsatis2, satis4 e rsatis4) do editor de dados (Data Editor).
Em alternativa, podemos verificar os valores recodificados de rsa-
tis2 e rsatis4 seleccionando Summarize Cases, de forma a obter uma lis-
tagem dos valores de satis2, rsatis2, satis4 e rsatis4 para, por exemplo, os
primeiros 10 casos. O resultado deste procedimento apresentado no
quadro 3.2.
~ Analyze ~ Reports ~ Case Summaries ... [abre a caixa de dilogo
Summarize Cases apresent1da na caixa 3.5]
54 ANLISE DE DADOS EM CINCIAS SOCIAIS
Quadro 3.2 O ou/pu/ do comando Case Summaries mostrando os valores recodificados de rsatis2 e
rsatis4
Case Summaries"
""TI"?
1
3 3,00 4 2,00
2
O 3 3,00
3
4 2,00
1
5,00
4
5 1,004
2,00
5
4 2,00 1
5,00
6
5 1,003 3,00
7
3 3,00 3
3,00
8
2 4,00
2
4,00
9
1 5,00 4
2,00
10
2 4,00 3 3,00
Tolal
N 9 9 10 10
a. limiled lo firsll0 cases.
-+ seleccionar variveis [por exemplo, satis2] -+~ [boto] -+ Limitcases
to first e escrever um nmero [por exemplo, 10]
-+OK
Se no pretendermos guardar os valores originais, podemos seleccionar a
opo Into Same Variables ... que abre a caixa de dilogo Recode Into Same
Variables apresentada na caixa 3.6. Por exemplo, se quisermos recodificar as
variveis satis2 e satis4 temos que as seleccionar e colocar na caixa intitulada
Variables:,
De seguida, procedemos, como anteriormente, seleccionado Old and
New Values ... , o que abre a caixa de subdilogo Recode Into Same Varia-
bles: Old and New Values apresentada na caixa 3.7. Na caixa intitulada Va-
lue: (na seco Old Value), escrevemos o primeiro valor a recodificar (por
exemplo, 1), enquanto que na caixa Value (na seco New Value) escrevemos
o novo valor (por exemplo, 5) e seleccionamos Add. Repetimos este procedi-
mento consecutivamente para os outros trs valores a recodificar (2,4 e 5). Po-
demos fazer o mesmo para o valor 3. Se existirem valores omissos (missing va-
lues), como o caso deste exemplo, devemos seleccionar System- or
User-missing (na seco Old Value) e System-missing (na seco New
Value).
Em alternativa, podemos seleccionar All other values, escrever o valor
3 na caixa intitulada Value: (na seco New Value) e seleccionar Add.
Aps este procedimento, seleccionamos Continue para fechar a subcai-
xa de dilogo Recode into Same Variables: Old and New Values, e OK para
fechar a caixa de dilogo Recode into Same Variable.
Para cada varivel dever existir, apenas, um valor novo, ao passo que
ANALISAR DADOS COM O COMPUTADOR 55
<%> gpracial
<$> sexo
<%> rendim
<%> idade
<%> anos
<t- envolv
'$> salis'
<%> satis3
.-
<%> aulonom'
lf...
.Qldand New Values ...
Caixa 3.6
A caixa de dilogo Recode into Same Variables
Aecode ;nlo Same Variables OId and New Values ~ I
O!sj-> New:
1 ..> 5
2 ..> 4
4 ..> 2
5 ..> 1
MISSING ..> SYSMIS
.~.k~(::.~ ~ J
Caixa 3.7
A subcaixa de dilogo Recode into Same Variables: Old and New Values
podem existir diversos valores originais. Por exemplo, se desejarmos cons-
truir uma escala de 3 pontos (concordo, discordo, indeciso), podemos faze-lo
recodificando os valores 1 e 2para 1, 3para 2, e 4 e 5para 3. Na medida em que
s podemos introduzir um valor na caixa intitulada Value de cada vez, tere-
mos que realizar esta operao sequencialmente.
Podemos, tambm, especificar um intervalo de valores originais a recodifi-
car atravs da seleco da opo Range (que se distingue por possuir o n de Ran-
ge sublinhado). De seguida, introduz-se o valor original inferior desse intervalo
na primeira caixa e o superior na segunda. Por exemplo, podemos recodificar o
grupo racial (gpracial) em dois grupos (brancos e no brancos), escrevendo 3 na
primeira caixa e 5 na segunda e recodificando 3 a 5 (3 through 5) em 2.
56 ANLISE DE DADOS EM CINCIAS SOCIAIS
Se no desejarmos especificar qual o limite inferior do intervalo de valo-
res, podemos faze-lo atravs do comando Range:. Se no desejarmos especifi-
car o limite superior do intervalo, podemos seleccionar Range:. Por exemplo,
podemos utilizar estas opes para categorizar a nossa amostra em sujeitos
acima e abaixo dos 40 anos de idade, recodificando lowest through 39 para 1 e
40 through highest para 2.
Se a nossa amostra possusse idades no expressas em nmeros inteiros,
isto , idades compreendidas entre os 39 e os 40 anos (por exemplo, 39,9), es-
tas no seriam recodificadas pelo procedimento anterior. Para evitar este pro-
blema, podemos especificar limites superiores e inferiores coincidentes no
comando Range, ou seja, lowest through 40 recodificado para 1 e 40 through
highest para 2. Neste exemplo, todos os sujeitos com idade inferior a 40 anos
seriam recodificados para o valor 1. Como os valores so codificados conse-
cutivamente e de uma vez s, o valor 40 anos no seria recodificado para 2.
Criar uma nova varivel
Por vezes podemos pretender criar uma nova varivel. Por exemplo, us-
mos quatro itens para avaliar aspectos ligeiramente diferentes de satisfa-
o no trabalho e, em vez de tratarmos estes itens como medidas separa-
das, podemos achar prefervel e at mais razovel combin-los num nico
ndice, constituindo assim uma medida composta. Para o fazermos deve-
mos usar o comando Compute no menu Transform, o que abre a caixa de
dilogo Compute Variable apresentada na caixa 3.8. Podemos, assim, cri-
ar uma varivel nova satis que corresponde somas das variveis satisl,
rsatis2, satis3 e rsatis4. Deste modo, comeamos por escrever o nome da
<~ rolinal
~rolina2
(~ rolina3
~rOlina4
<i> reuniao
.,~ especial
~produliv
<19 qualid
~absenl
~rsalis2
.1IIlllII
Caixa 3.8
A caixa de dilogo Compute Variable
ANALISAR DADOS COM O COMPUTADOR 57
Quadro 3.3 O output do comando Case Summaries mostrando os valores de satis1, rsatis2, satis3,
rsatis4 e satis
Case SummarieS'
1
O 3,00 4 2,00 9,00
2
O 2
3,00 5,00
3
4 2,00 4 5,00 15,00
4
2 1,00
2
2,00 7,00
5
3 2,00
4
5,00 14,00
6
2 1,00
3
3,00 9,00
7
3 3,00
2
3,00 11,00
8
2 4,00
4
4,00 14,00
9
3 5,00
2
2,00 12,00
10
3 4,00
3 3,00 13,00
Total
N 8 9 1010 8
a. Limited to firs! 10 cases.
nova varivel (satis) na caixa intitulada Target Variable:. Depois, seleccio-
namos SUM (numexpr, numexpr ... ) na caixa Functions. Esta funo ser ins-
crita na caixa Numeric Expression:. Nesta ltima caixa, substitumos ?,? por
satis1, rsatis2, satis3, rsatis4 e seleccionamos OK. Se o nome dos itens deri-
vasse sempre da palavra satis, bastaria substituir ?,? pelo primeiro item a so-
mar (satis1), seguido do ltimo (satis4).
Se olharmos para os valores de satis no editor de dados (Data Editor),
verificamos que o valor do primeiro caso 9,00 (3+4+2 = 9,00), 5,00 para o se-
gundo (2+3 = 5,00) e 15,00 para o terceiro (4+2+4+5 = 15,00). Para listar os va-
lores desta varivel, podemos usar o comando Case Summaries ... O quadro
3.3 apresenta os resultados deste procedimento para os primeiros 10 casos.
Dados omissos e clculo de valores para formar medidas compostas
Como vimos, faltam o valor satis1 para o primeiro sujeito e o valor satis1 e sa-
tis2 para o segundo, Em investigao, muito frequente que haja alguns da-
dos omissos. Os sujeitos podem no responder a algumas questes, podem
assinalar duas respostas diferentes mesma pergunta, o experimentador
pode esquecer-se de registar um dado, etc. importante determinar cuidado-
samente de que forma iremos lidar com esses dados omissos. Se, para uma
varivel especfica, faltarem os dados de muitos sujeitos, isso significa que
talvez haja algum problema - que deve ser ultrapassado - com a forma
como se decidiu avali-la. Por exemplo, pode haver uma questo que no se
aplique maior parte das pessoas e, se assim for, prefervel omiti-la. Se, para
um determinado indivduo, faltam muitas respostas, talvez seja rnlhor
58 ANLISE DE DADOS EM CINCIAS SOCIAIS
omitir os dados desse sujeito uma vez que pode haver algum problema com a
forma como esses dados foram obtidos. Pode acontecer, por exemplo, que o
sujeito no estivesse a prestar ateno ao que estava a fazer.
Na medida em que os dados disponveis para construir um ndice de ro-
tina no trabalho so omissos para alguns indivduos, no ser apropriado uti-
lizar a funo somatrio das respostas para calcular este mesmo ndice. De
facto, um sujeito que responda "concordo totalmente" (codificao 5) nos
quatro itens de rotina no trabalho, ter uma pontuao total de 20, enquan-
to que um que concorde totalmente com todos os itens mas que, por algu-
ma' razo, no tenha respondido a um deles, ter, apenas, uma pontuao
de 15. Por outras palavras, quando existem valores omissos nos itens que
constituem um ndice, necessitamos de tom-los em considerao. Neste
sentido, um ndice mais apropriado para esta situao ser calculado com
base na mdia dos valores no omissos, isto , cinco para o primeiro caso
(20/4 = 5) e para o segundo (15/3 = 5) sujeitos. Outra vantagem de utilizar
a mdia de uma escala, como a da rotina no trabalho, a de que o resultado
mdio corresponde s respostas dos itens individualmente, ou seja, um re-
sultado de 4,17 indica que um sujeito respondeu, de uma forma geral,
"concordo" a estes itens.
Contudo, no ser aconselhvel calcular o resultado mdio de um sujei-
to com um nmero significativamente grande de dados omissos. Podemos
aplicar, nestes casos, uma regra prtica que consiste em verificar se, para um
sujeito, faltam 10 por cento ou mais dos dados referentes a um determinado
ndice. Se for esse o caso, ento o prprio ndice definido como omisso para
esse sujeito. Se aplicssemos este princpio aos dois primeiros sujeitos do nos-
so exemplo, no deveramos calcular o valor da satisfao no trabalho para
estes indivduos. Pelo contrrio, poderamos calcular os valores de rotina no
trabalho e de autonomia.
Para calcular o resultado mdio utilizamos a funo MEAN (numexpr,
numexpr,,,.) que se encontra na caixa de dilogo Compute Variable (seco
Functions). Se quisermos especificar um nmero mnimo de valores no
omissos para que a mdia seja calculada, inserimos um ponto final aps a fun-
o MEAN seguido do nmero mnimo de valores. Utilizaremos os quatro
itens da escala satis para ilustrar este procedimento. Com apenas quatro itens
no podemos utilizar um ponto de cut-of! de excluso de valores omissos aci-
ma dos 10%. Utilizaremos, ento, um critrio mais leniente de 50%. Se mais de
50% (isto , dois ou mais) das respostas de um sujeito aos itens de satisfao
no trabalho forem omissas, codificaremos a varivel satis como omissa para
este sujeito. Por outras palavras, o nmero mnimo de valores no omissos
para que a mdia seja calculada trs. Como anteriormente, a nova varivel a
criar designa-se satis, mas a expresso numrica a inserir na caixa Numeric
Expression: MEAN.3 (satisl, rsatis2, satis3, rsatis4). Se examinarmos os
novos valores de satis no editor de dados (Data Editor), podemos verificar
ANALISAR DADOS COM O COMPUTADOR 59
que, para o primeiro caso, ele de 3,00 (9,00/3=3,00),. para o segundo caso
(na medida em que s existem dois valores vlidos) e 3,75 para o terceiro
(15,00/4=3,75).
Para recodificarmos os resultados mdios omissos da varivel satis para o
valor zero, utilizamos o procedimento Recode into Same Variables, seleccio-
nando System-missing na caixa intitulada Old Value e escrevendo zero na caixa
intitulada Value: (na seco New Value) e, por fim, seleccionado Add.
Para converter os resultados mdios de uma varivel em resultados to-
tais (que consideram o nmero de resultados vlidos variando, portanto, en-
tre 3 e 4), multiplicamos cada resultado mdio pelo nmero mximo de itens,
isto , 4. Assim, utilizamos o procedimento Compute Variable, no qual a
nova varivel toma, novamente, o nome de satis e a expresso numrica a in-
troduzir satis*4.
Na medida em que desejamos criar trs variveis novas (satisfao no
trabalho, autonomia no trabalho e rotina no trabalho), teremos que repetir o
procedimento Compute Variable para os itens da escala de rotina no trabalho
e de autonomia no trabalho. Ainda que se saiba, de antemo, que no existem
valores omissos neste dois conjuntos de variveis, podemos ter alguma cau-
tela e assumir que, na realidade, podem existir alguns. Se quisermos determi-
nar a presena ou ausncia destes valores, podemos utilizar o procedimento
Frequences (ver captulo 5).
As medidas compostas de satisfao no trabalho, autonomia no traba-
lho e rotina no trabalho, que usaremos nos captulos seguintes, foram criadas
atravs da soma dos 4 itens de cada escala, especificando como omisso o re-
sultado total da escala baseado em mais de 10%de valores omissos nos itens
correspondentes. Na medida em que dois dos 70 casos do Questionrio de
Trabalho possuam uma ou duas respostas omissas nos itens da escala de sa-
tisfao no trabalho, o nmero de casos para os quais foi possvel calcular um
resultado global foram 68. As variveis que contemplam os resultados totais
das escalas de satisfao no trabalho, autonomia no trabalho e rotina no tra-
balho intitulam-se satis, autonom e rotina respectivamente. Uma vez mais,
para a varivel satis, por exemplo, calculmos, em primeiro lugar, a mdia
dos itens da escala atravs da expresso numrica MEAN.4 (satis1 to satis4),1
convertendo-a, em seguida, para um resultado total atravs da expresso nu-
mrica satis*4.
Quando a nossa amostra possui um nmero elevado de variveis as
quais, por alguma razo, podemos prescindir, pode revelar-se mais conveni-
ente criar um novo ficheiro que contemple, apenas, as variveis que vamos
sujeitar a anlise. Por exemplo, se quisermos analisar, somente, as variveis
Na realidade, esta expresso numrica dever ser MEAN.4 (satisl, rsatis2;-satis3,fsa-
tis4). (N. do R.)
60 ANLISE DE DADOS EM CINCIAS SOCIAIS
satis, rotina e autonom, e no os itens que as constituem, podemos criar um
novo ficheiro que contm, apenas, estas variveis (juntamente com outras
que possamos necessitar). Para tal, apagamos os itens individuais seleccio-
nando as variveis satisl a rotina4 no editor de dados (Data Editor) e selec-
cionando Edit, seguido de eut. Podemos, ento, gravar estes dados num
novo ficheiro, que designaremos por qtt.sav (Questionrio (q) do Trabalho (t)
/ dados totais (t)) e que utilizaremos em anlises subsequentes. Os dados des-
te ficheiro so apresentados n~ quadro 3.4.
Exerccios
1 Qual o comando do SPSS que serve para seleccionar, entre os sujeitos
que responderam ao Questionrio do Trabalho, homens e mulheres de
origem africana?
2 Escreva um comando do SPSS que sirva para seleccionar, entre os sujei-
tos que responderam ao Questionrio do Trabalho, mulheres asiticas
ou das ndias ocidentais que tenham 25 anos ou menos.
3 Para seleccionar sujeitos que no tenham respostas omissas em relao
satisfao no trabalho no Questionrio aplicado, qual o comando do
SPSS que usaria?
4 Qual o procedimento do SPSSpara recodificar a varivel do Question-
rio do Trabalho especial na mesma varivel, mas de forma a que passe
apenas a duas categorias (no especializado / semi-especializado versus
bastante / muito especializado).
5 Qual o procedimento do SPSS para recodificar a varivel rendim numa
nova varivel gprendim, com trs grupos: os que ganham menos que
5,000 libras, os que ganham entre 5,000 libras e 10,000 libras e os que ga-
nham mais de ElO,OOO, considerando os valores omissos como zero.
6 Usando o operador aritmtico *,exprima a varivel semanas em dias-
por outras palavras, converta o nmero de semanas no nmero de dias
correspondente.
Quadro 3.4
Os dados transformados do Questionrio de Trabalho
id
gpracial
sexo
rendim
idade anos
envolv
satis autonom rotina reuniao
especial produtiv qualid
absent
1
1 1 8.300 29 1 4O 109 23 O1 7
2
2 1 7.300 26 5 2O7 15 1 3448
3
3 1 8.900 40 5 4 157 81 43 4 O
4
3 1 8.200 46 15 2 77 102 3 344
5
2 2 9.300 63 364 1411 181 353 O
6
1 1 8.000 54 312 9 6 161 1 341
7
1 1 8.300 29 2 O 119 142 3 52O
8
3 1 8.800 35 2 5 1412 11 2 3442
9
2 2 8.800 33 4 3 12109 221 1 5
10
2 2 6.900 27 6 4 138 15 1 2244
11
1 1 7.100 29 4 2 76 162 2 238
12
2 1O 19 2 1 64 131 3234
13
4 1 9.000 55 353 149 191 4351
14
1 2 8.500 29 1 29 8 151 1 22 O
15
3 1 9.100 48 8 3 1413 11 2 4551
16
2 1 7.900 32 7 3 118 102 22 34
17
1 1 8.300 48 143 107 171 2531
18
1 2 6.700 18 1 28 9 161 2336
19
3 2 7.500 28 2 4 1513 10 2 3 443
20
3 2 8.800 37 1 3 118 18 1 1 41 3
21
1 1 43 161 1211 132 4526
22
1 1 8.700 39 6 3 1010 15 2 1 1 55
23
1 1 9.000 53 5 1 1311 141 335 13
24
2 2 8.000 34 9 1 7 5 142 1 339
25
3 2 8.500 43 174 139 131 3522
26
1 1 7.000 21 1 4 13149 1 2553
27
1 1 8.100 50 283 106 19 1 2248
28
1 2 6.200 31 9 1 67 172 3 55 O
29
1 1 6.800 31 12 3 11 108 1 35 46
30
2 2 8.200 52 212 14 128 2443 10
31
1 1 7.200 54 123 1410 152 4 42 99
32
3 2 6.200 28 102 6 7 111 2449
33
2 2 8.300 50 234 1413 12 2 3 455
(continua)
(continuao)
34
2 2 8.000 52 215 1313 101 3254
35
1 2 7.500 40 211 11 109 1 2236
36
2 1 5.900 19 1 277 20 2 2 323
37
2 1 8.800 38 4 5 16146 24 44
8
38
2 1 9.000 61 415 169 7235 43
39
1 2 7.800 37 8 39 10181 3448
40
2 1 6.700 31 5 267 192 1 125
41
2 2 7.500 43 214 1312 121 1 42O
42
3 1 6.800 23 3 1 75 171 3228
43
2 2 7.000 27 5 1 65 172 1 21 9
44
1 1 7.500 28 7 3 14146 1 2439
45
1 1 6.600 O 101 68 161 41 3 10
46
3 1 6.700 18 1 4 1310 161 43 43
47
1 2 10.300 48 233 139 8 24438
48
1 2 6.800 29 10 2 107 111 344 11
49
1 2 7.300 42 10 2 117 20 2 1 44O
50
1 1 9.100 53 12 4 19168 2 4441
51
1 1 7.600 32 12 3 7 10121 23 21
52
1 2 6.500 31 2 1 69 182 1 31 8
53
1 1 9.500 55 19 5 1515 131 343 O
54
3 2 7.400 26 8 4 15146 243 32
55
1 2 8.600 53 223 16147 1 35 5O
56
1 1 7.800 51 312 1213 191 41 18
57
1 1 7.700 48 233 88 191 1 326
58
1 2 6.900 48 281 57 20 2 1 434
59
2 2 7.900 62 401 89 182 1 15 7
60
2 1 8.700 57 13 2 108 131 441 4
61
1 2 8.900 42 205 14129 23 332
62
1 1 7.100 21 2 1 88 121 422O
63
3 2 6.400 26 8 385 101 41 1 4
64
1 2 6.800 46 O 1 78 20 2 23 45
65
1 2 10.500 59 214 15109 2451 4
66
4 2 7.100 30 8 O 109 171 22 32
67
1 1 7.300 29 8 3 128 152 1 45 10
68
3 1 6.900 45 9 2 1012 13 2 23 49
69
3 1 8.000 53 303 107 162 21 42
70
1 1 6.900 47 222 8 11 161 244 11
Captulo 4
OS CONCEITOS EA SUA MEDIO
Os conceitos representam um aspecto fundamental na investigao social. As
hipteses contm conceitos que so, afinal, produtos das nossas reflexes so-
bre o mundo. Os conceitos exprimem elementos comuns do mundo aos quais
atribudo um nome. Podemos verificar que algumas pessoas no gostam de
membros de raas diferentes da sua, atribuindo-lhes, muitas vezes, caracte-
rsticas negativas. Outros indivduos apoiam fortemente os outros grupos ra-
ciais, talvez vendo-os como elementos que podem enriquecer a cultura acres-
centando-lhe novos aspectos. Ainda h outros que so apenas tolerantes, no
defendendo um ponto de vista radical nem a favor nem contra os outros gru-
pos raciais. Por outras palavras fcil apercebermo-nos de que as pessoas po-
dem assumir uma grande diversidade de posies face aos grupos raciais. Po-
demos considerar que, entre estas atitudes, existe algo em comum embora as
atitudes em si possam ser antagnicas. O ponto de contacto entre essas orien-
taes diversas que qualquer delas reflecte uma posio em relao ao "pre-
conceito racial". Quando atribumos um nome s diferentes orientaes que
as pessoas podem tomar face aos membros de outras raas estamos a trat-los
como um conceito, isto , como uma entidade que est para alm das observa-
es sobre a hostilidade e o apoio raciais que desencadearam a formulao de
um nome para essas ob ervaes. O conceito de preconceito racial envolve al-
guma abstraco que o fa transcender as reflexes que conduziram sua for-
mulao. Assim, o conceito e preconceito racial torna-se algo que os outros
podem utilizar para dar forma as suS-prprias reflexes sobre o mundo so-
cial. Deste modo, podem formular-se hipteses que postulem conexes entre
o preconceito racial e outros conceitos: por exemplo, pode supor-se que ele se
relaciona com a classe social ou com o autoritarismo.
Uma vez formulado o conceito, ele prprio e os conceitos que se supe
estarem com ele relacionados, como a classe social ou o autoritarismo, preci-
sam de ser definidos operacionalmente para que se possa conduzir uma investi-
gao sistemtica. Uma definio operacional especifica os procedimentos
63
64 ANLISE DE DADOS EM CINCIAS SOCIAIS
(operaes) que permitem que as diferenas entre indivduos em relao a es-
ses conceitos possam ser especificadas com preciso. Aquilo a que, de facto,
nos estamos a referir medio - isto , ao acto de fazer corresponder nme-
ros a unidades de anlise - sejam elas pessoas, organizaes ou naes - a
que um conceito se refere. Amedio permite que seja possvel especificar pe-
quenas diferenas entre unidades. Podemos dizer que algum que, de uma
forma activa, faz afirmaes contra membros de outras raas tem um precon-
ceito racial enquanto algum que defende activamente esses membros de ou-
tros grupos raciais tem um posicionamento oposto, mas difcil especificar as
diferentes posies entre estes dois extremos que as pessoas podem assumir.
A medio proporciona a possibilidade de especificar essas diferenas, per-
mitindo determinar as diferenas sistemticas entre pessoas.
Para providenciar definies operacionais dos conceitos so necess-
rios indicadores que correspondam a esses conceitos. Pode acontecer que um
nico indicador seja suficiente para medir um conceito, mas em muitos casos
no o ser. Assim, por exemplo, seria suficiente medir o "fervor religioso"
atravs de um questionrio em que se pedisse s pessoas que dissessem qual
a frequncia com que vo missa? Evidentemente que no, uma vez que ir
missa apenas uma das formas com que um indivduo pode exprimir o seu
fervor religioso. Essa medida no contempla a devoo pessoal, o comporta-
mento secular coerente com a sua religio, o facto de estar informado sobre a
sua prpria religio ou o grau de adeso aos dogmas centrais dessa religio
(Glock e Stark, 1965). Estas reflexes implicam que, em muitos casos, para se
medir conceitos seja necessrio utilizar vrios indicadores; de outra forma,
pode argumentar-se que os resultados da nossa investigao no so exactos
porque apenas considermos uma das facetas do conceito em anlise.
Se vamos analisar mais do que um indicador do conceito, podemos pre-
cisar de testar hipteses em relao a cada um desses indicadores. Imagine-
mos uma hiptese em que o conceito estudado a "dimenso da organiza-
o". Podemos medir (i.e., definir operacionalmente) este conceito atravs do
nmero de funcionrios da empresa, do seu movimento comercial ou dos
seus lucros lquidos. Embora estes trs potenciais indicadores est .am, prova-
velmente, interligados no estabelecero entre si uma relao per . a (Child,
1973). Sendo assim, as hipteses acerca da dimenso da organizao m
ter que ser testadas usando cada um dos trs indicadores. Do mesmo modo,
se quisermos medir o "fervor religioso", para alm de avaliarmos a frequn-
cia com que o sujeito vai missa, podemos ter que usar indicadores que re-
flictam todas as facetas desse envolvimento com a religio. Assim, por exem-
plo, para avaliarmos at que ponto os sujeitos aderem s crenas associadas
sua religio, podemos perguntar aos indivduos qual o seu grau de acordo
com os aspectos centrais da sua f.
Quando medem conceitos atravs de questionrios, como no caso do
envolvimento com a religio, os investigadores frequentemente preferem
05 CONCEITOS E A SUA MEDIO
65
--~;das compostas, que se constroem a partir de uma multiplicidade de
o Questionrio do Trabalho a varivel satis um exemplo de medida
,;::css de mltiplos itens. Obtm-se esta medida perguntando aos sujeitos
::aI a sua posio face a um certo nmero de indicadores que, todos juntos,
3c:-:-"empara avaliar o conceito. De um modo semelhante, existem quatro in-
~.:adores, quer para rotina, quer para autonom. Poder-se-ia testar uma hip-
t::se com cada um dos indicadores. Contudo, se usarmos os dados do Ques-
::;:mrio do Trabalho para examinar uma hiptese relacionada com a varivel
satis e a varivel autonom - uma vez que cada uma delas tem quatro indica-
':'ores - precisaramos de dezasseis testes diferentes. A maneira de analisar
~-:as medidas constitudas por mltiplos itens agregar a resposta de cada
:::divduo a cada questo e tratar a medida total como uma escala em relao
=. qual cada unidade de anlise tem um valor. No caso das variveis satis, au-
:onom e rotina usada uma escala de Likert, o que constitui uma abordagem
~'1abitualquando se trata de criar medidas compostas com base em mltiplos
':ens. Na escala de Likert, apresentam-se aos indivduos um certo nmero de
2...c'1nnaes que parecem relacionar-se com um tema comum; em seguida, eles
:""ldicamo seu grau de acordo ou desacordo numa escala de cinco ou de sete
?Ontos. Aresposta a cada uma das questes que compem a escala (ou seja, a
.:.adaitem) quantificada, podendo ir, por exemplo, de 1 para Desacordo To-
:al at 5 para Acordo Total se a escala escolhida for de cinco pontos. Os resul-
:ados individuais so somados para formar um valor total para cada sujeito .
.-\S escalas com mltiplos itens podem ser muito longas; as quatro questes
referentes a satis foram retiradas de uma escala criada por Brayfield e Rothe
1951) que compreende dezoito questes.
Estas escalas de itens mltiplos so populares por vrias razes. Em pri-
meiro lugar, mais provvel que se consiga captar a totalidade de um concei-
to abrangente como a satisfao no trabalho atravs de vrios itens do que a
partir de uma nica pergunta. Em segundo lugar, estas escalas permitem de-
linear diferenas mais precisas entre sujeitos. A medida satis compreende
quatro questes que podem tomar valores de 1a 5, de forma que os valores to-
tais para cada inquirido podem variar entre 4 e 20. Se s se fizesse uma per-
gunta a cada um, a variao seria entre 1e'5 - um intervaloJle~ariao poss-
vel muito mais restrito. Em terceiro lugar~--um--sujef no compreender
bem alguma questo e se essa pergunta for a nica a que ele tem que respon-
der, ento ele ser mal classificado; se se utilizarem vrias perguntas, a falta
de compreenso de uma delas pode ser compensada pelo facto das outras te-
rem sido bem compreendidas.
frequente falar das medidas como variveis, para salientar o facto do
conceito abordado poder assumir diferentes valores. Se no houver variao
numa medida temos uma constante. bastante invulgar encontrar conceitos
cujas medidas sejam constantes. Em geral, as cincias sociais interessam-se
pelas variveis e pela expresso e anlise da variao que essas variveis
66
ANLISE DE DADOS EM CINCIAS SOCIAIS
manifestam. Quando se conduz uma anlise univariada, pretende conhecer-se
a forma como os indivduos se distribuem em relao a uma s varivel.
Assim, por exemplo, podemos querer saber quantos casos podem ser encon-
trados em cada uma das categorias ou nveis da medida em anlise, ou pode-
mos querer saber qual a resposta mdia. Na anlise bivariada, o nosso interes-
se centra-se nas conexes entre duas variveis ao mesmo tempo. Dessa for-
ma, por exemplo, podemos pretender saber se as alteraes na varivel satis
esto associadas s alteraes de uma outra varivel como a autonom, ou se
os homens e as mulheres diferem em relao a essa varivel. Em qualquer dos
casos, o foco de interesse a variao.
Tipos de variveis
Um dos mais importantes factores da compreenso das operaes estatsticas
a capacidade de avaliar se possvel aplicar determinados testes. Para esta
avaliao, importante a aptido para reconhecer as diferentes formas que as
variveis tomam, porque os diversos testes estatsticos s so aplicveis a cer-
tos tipos de variveis. Este ponto ser retomado mais frente, em captulos
posteriores.
A maioria dos autores de livros de estatstica segue uma distino cria-
da por Stevens (1946) entre nveis de medida ou escalas nominais, ordinais e
de intervalo / proporcionais. Aprimeira, a escala nominal (tambm designada
categorial), conduz classificao do indivduo em relao a um conceito. No
Questionrio do Trabalho, a varivel gpracial, que classifica os inquiridos
numa de cinco categorias - branco, asitico, indiano, africano ou outro -
um exemplo de uma varivel nominal. Os indivduos podem ser colocado~
numa categoria, mas a medida no permite mais do que isso; enquanto forma
de medida no h mesmo muito mais a dizer sobre esta escala. Por exemplo
no podemos sequer utiliz-la para ordenar as categorias de alguma forma
Esta impossibilidade contrasta com as possibilidades oferecidas pela:'
variveis ordinais que permitem que os indivduos sejam categorizados ma:'
tambm permitem que essas categorias possam ser ordenadas em termos d
"mais" ou "menos" face ao conceito abordado. No Questionrio do Trabalh
as variveis especial, produtiv e qualid so ordinais. Se considerarmos a pr:-
meira das trs, i.e., a varivel especial, podemos verificar que as pessoas n~
se limitam a ser categorizadas numa de quatro categorias - muito especial:-
zado, bastante especializado, semi-especializado, no especializado - j q
possvel dizer que algum que classificado como bastante especializado 5
encontra num ponto mais elevado da escala do que algum que foi considero:-
do semi-especializado. No possvel fazer a mesma inferncia no caso c
varivel gpracial, uma vez que as categorias que essa varivel compreen .:
no podem ser colocadas em sequncia, i.e., no podem ser ordenad~
OS CONCEITOS E A SUA MEDIO
Quadro 4.1 Tipo de variveis
Tipos Descrio
Nominal Classificao de objectos (pessoas, firmas, naes, etc)
em categorias descontnuas.
Ordinal As categorias associadas varivel podem ser ordenadas.
Os objectos podem ser ordenados do maior para o menor.
Intervalo (a) Nas 'verdadeiras' variveis de intervalo, as categorias
associadas varivel podem ser ordenadas, como no caso
das variveis ordinais, mas as distncias entre categorias
so iguais.
intervalo (b) So variveis que, em rigor, so ordinais mas que incluem
um grande nmero de categorias como o caso das medidas
de mltiplos items em questionrios. Assume-se que estas
variveis tm propriedades similares s 'verdadeiras' variveis
de intervalo.
Jicotmicas So variveis que tm apenas duas categorias.
"onte: Lazarsfeld (1958); Hall (1968); Snizek (1972).
67
Exemplo nos dados
do Quest. do
Trabalho
gpracial
Envolv
especial
produtiv
qualid
Rendim
idade
anos
absent
Satis
rotina
autonom
Sexo
reuniao
A varivel ordinal ~.----
A varivel de intervalo/rcio ----
9gura 4.1
Mais do que duas categorias?
A"ri"l'dlootml". No~ r
As distncias entre
s'm~r'""'?
A 1. d .
s categonas po em
~m~r?
A varivel nominal No
Deciso da natureza de uma varivel
68
ANLISE DE DADOS EM CINCIAS SOCIAIS
Apesar de podermos ordenar as categorias que constituem a varivel espe-
cial, continuamos a estar limitados em relao quilo que podemos dizer so-
bre elas. Assim, por exemplo, no podemos dizer que a diferena entre ser
muito especializado e bastante especializado igual que separa a categoria
bastante especializado e semi-especializado. Tudo o que nos possvel dizer
que aqueles que forem considerados muito especializados tm uma especi-
alizao maior do que aqueles que foram classificados como bastante especi-
alizados e que estes, por sua vez, so mais especializados que os semi-especi-
alizados e assim por diante. Alm disso, embora codifiquemos os semi-espe-
cializados com o algarismo 2 e os muito especializados com um 4, no pode-
mos dizer que as pessoas classificadas como muito especializadas tenham o
dobro da especializao das semi-especializadas. Por outras palavras, deve
ter-se o cuidado de no atribuir uma qualidade aritmtica - que o uso de n-
meros parece implicar - aos nmeros usados para a codificao das categori-
as de uma escala ordinal.
Com as variveis de intervalo/proporcionais, podemos dizer muito mais
em relao s suas qualidades aritmticas. De facto, esta categoria compreen-
de dois tipos de variveis - as de intervalo e as proporcionais. Ambos os ti-
pos se caracterizam por apresentarem iguais diferenas entre categorias -
por exemplo, algum com 20 anos tem mais um ano do que algum que tem
19 e algum que tem 50 anos mais velho um ano do que quem tem 49. Em
cada caso, a diferena entre as categorias idntica - um ano. Uma escala
designada como escala de intervalo quando os intervalos entre as categorias
so iguais. As medidas proporcionais, alm disso, tm um ponto fixo que
constitui o zero. Assim, as variveis idade, absent e rendim tm pontos nulos
lgicos. Esta caracterstica significa que se pode dizer que algum que tem 40
anos tem o dobro da idade de quem tem 20 anos. Do mesmo modo, algum
que faltou seis vezes no ano ao trabalho faltou trs vezes mais do que uma
pessoa que s deu duas faltas. Contudo, habitual que os autores no estabe-
leam a distino entre escalas de intervalo e escalas proporcionais porque,
nas cincias sociais, as verdadeiras variveis de intervalo so, com frequn-
cia, tambm variveis proporcionais ( o caso, por exemplo, do rendimento e
da idade). Neste livro, o termo varivel de intervalo ser, por vezes, empregue
para considerar tambm as variveis proporcionais.
As variveis de intervalo/proporcionais correspondem, reconhecida-
mente, ao mais elevado nvel de medida porque permitem muito mais opera-
es do que os outros dois tipos de variveis, existindo um leque mais vasto
de testes estatsticos que se lhes aplicam. importante notar que quando uma
varivel de intervalo/proporcional, como a idade, agrupada em categorias
- como 20-29, 30-39, 40-49,50-59, etc. - torna-se uma varivel ordinal. De
facto, no podemos dizer que a diferena entre algum que esteja no grupo
40-49 e algum do grupo 50-59 seja a mesma do que a diferena entre algum
na categoria 20-29 e algum na categoria 30-39, uma vez que no conhecemos
OS CONCEITOS E A SUA MEDIO 69
pontos em que as pessoas se localizam dentro desses grupos. Por outro
.:.ado,estes agrupamentos de indivduos so, por vezes, teis para a apresen-
:ao e fcil assimilao da informao. Deve notar-se ainda que a posio
das variveis dicotmicas face a estas trs categorias de variveis algo amb-
gua. Nestas variveis h, apenas, duas categorias, como, por exemplo, ho-
::!leme mulher para a varivel sexo. Habitualmente, pensa-se numa varivel
iicotmica como uma varivel nominal, mas por vezes ela pode ser conside-
:-ada ordinal. Quando, por exemplo, existe uma ordem inerente a essas cate-
50rias parecem estar presentes as caractersticas inerentes a uma varivel or-
iinal, como no caso das categorias "passar" e "falhar".
Rigorosamente falando, medidas como satis, autonom e rotina, que de-
::\'am de escalas de itens mltiplos, so variveis ordinais. Assim, por exem-
?lo, no sabemos se a diferena entre um valor de 20 na escala satis e um valor
'::e18 a mesma diferena que existe entre 10 e 8. Isto coloca um problema aos
::n'estigadores, uma vez que a impossibilidade de tratar estas variveis como
scndo de intervalo, implica que determinados mtodos de anlise como a
:orrelao e a regresso (ver Captulo 8), que so mtodos conhecidos e
:0rangentes, no possam ser utilizados para avaliar as suas relaes por se-
:-emapenas aplicveis a variveis de intervalo. Por outro lado, muitas das me-
.::idas de itens mltiplos criadas pelos investigadores so tratadas por eles
:0mo se fossem variveis de intervalo, porque essas medidas permitem que
x considere um vasto nmero de categorias. Quando uma varivel compre-
:?:1deapenas um pequeno nmero de categorias ordenadas, como no caso de
envolv, produtiv, especial e qualid no Questionrio do Trabalho, em que
:ada uma compreende apenas quatro ou cinco categorias, seria pouco razo-
o'el, aos olhos da maior parte dos analistas, trat-las como se fossem variveis
:'e intervalo. Quando o nmero de categorias consideravelmente maior,
:omo no caso das variveis satis, autonom e rotina, em que cada uma pode
:;)rresponder a dezasseis categorias de 5 at 20, mais aceitvel trat-las
:;)mo variveis de intervalo.
Parece haver um certo movimento na direco deste procedimento mais
~ral em relao s escalas de mltiplos itens, tratando-as como se possus-
xm as caractersticas das variveis de intervalo. No entanto, muitos puristas
::msiderariam esta posio incorrecta. Alm disso, no parece haver uma re-
~a precisa que permita ao analista decidir se a varivel ordinal ou de in-
'::,:yalo. Contudo, ao longo deste livro, vamos ao encontro da prtica corrente
::':rataremos as medidas baseadas em mltiplos itens como o caso de satis,
tonom e rotina como se fossem escalas de intervalo. Labovitz (1970) ainda
:ti mais longe ao sugerir que quase todas as variveis ordinais podem e de-
::m ser tratadas como variveis de intervalo. Argumenta que o erro que
::':xieocorrer mnimo, especialmente se se tiver em conta as vantagens con-
-:'::erveis que o analista pode obter pelo facto de usar tcnicas de anlise
:":>:110 a correlao e regresso que so mtodos poderosos e relativamente
70 ANLISE DE DADOS EM CINCIAS SOCIAIS
simples de interpretar. No entanto, esta perspectiva controversa (Labovitz,
1971) e embora muitos investigadores pudessem aceitar tratar variveis
como satis como se fossem variveis de intervalo, j poderiam hesitar no caso
das variveis envolv, especial, produtiv e qualid. O quadro 4.1 sintetiza as
caractersticas principais dos tipos de escala discutidos nesta seco, usando
exemplos de variveis do Questionrio do Trabalho.
De forma a poder identificar se as variveis so nominais, ordinais, di-
cotmicas ou de intervalo / proporcionais, podemos seguir os passos da figu-
ra 4.1. Vamos utilizar as variveis do Questionrio de Trabalho para ilustrar
como que este diagrama pode ser utilizado. Tome-se, por exemplo, a vari-
vel especial. Esta varivel possui mais do que duas categorias; as distncias
entre as categorias no so iguais; as categorias podem ser ordenadas; desta
forma, a varivel ordinal. Vejamos, agora, a varivel rendim. Esta possui
mais do que duas categorias; as distncias entre as categorias so iguais; desta
forma a varivel intervalar ou proporcional. O sexo uma varivel que no
possui mais do que duas categorias; neste sentido ela dicotmica. Finalmen-
te, vamos analisar a varivel gpracial. Esta varivel possui mais do que duas
categorias; as distncias entre as categorias no so iguais; as categorias no
podem ser ordenadas; desta forma, a varivel nominal.
Dimenses dos conceitos
Quando um conceito muito abrangente, preciso ter em conta que existe a
possibilidade de ele compreender vrias dimenses subjacentes que reflic-
tam diferentes aspectos do conceito em causa. Muito frequentemente, poss-
vel especificar essas dimenses a priori, de modo a que as potenciais dimen-
ses sejam identificadas antes da formao de indicadores do conceito. bas-
tante recomendvel que se pense na possibilidade de existirem essas dimen-
ses subjacentes, uma vez que uma forma de facilitar a reflexo sistemtica
sobre a natureza do conceito que vai ser medido.
A abordagem de Lazarsfeld (1958), sobre a medio de conceitos, consi-
derava a procura de dimenses subjacentes como um dos seus aspectos im-
portantes. Afigura 4.2 ilustra os passos que considerou. Inicialmente, o inves-
tigador forma uma imagem a partir de um domnio terico. Essa imagem re-
flecte um certo nmero de caractersticas comuns, como no exemplo prvio
acerca da satisfao no trabalho que denota a tendncia das pessoas a ter um
leque de experincias especfico face s suas funes. Da mesma forma, HaU
(1968) desenvolveu a ideia de "profissionalismo" como resultado da sua no-
o de que pessoas com uma determinada profisso tm uma constelao de
atitudes prprias face natureza do seu trabalho. Em qualquer destes casos
neste estdio de imaginao, podemos ver um conceito que se comea a deli-
near. No estdio seguinte, especificao do conceito, o conceito elaborado de
I .'01.11 1" 101I11'nl.
Imaginao
Especificao do Seleco de Formao de
conceito (dimenses)

indicadores

escalas ou
ndices
Escala de
Associao

Estou presente, com



Escala I
profissionalismo de
Jf
profissional como

regularidade, nas reunies


Hall
refernciaprofissionais

Crena no

Penso que a minha profisso,



Escala 11
servio ao

mais do que qualquer outra,
pblico

essencial para a sociedade
Conceito de
Y
Crena na
Os meus colegas da mesma

Escala 111
profissonalismo

auto-regulao

profisso julgam de forma
~

adequada a competncia uns


dos outros
Sensao de

As pessoas desta profisso Escala IV


vocao

sentem um verdadeiro

profissional

chamamento para a exercer
Autonomia

No meu trabalho, tomo as


Escala V

minhas prprias decises

em relao ao que vou


fazer
(cinco dimenses)
(dez indicadores por
dimenso - um indicador
como exemplo de cada)
Figura 4.2 Conceitos, dimenses e medidas
Fontes: Lazarsfeld (1958); Hall (1968); Snizek (1972).
72 ANLISE DE DADOS EM CINCIAS SOCIAIS
modo a que se verifique se inclui diferentes aspectos ou dimenses. A pa
gem por este estdio permite reconhecer a complexidade do conceito. ]
prope cinco dimenses do profissionalismo:
1) O uso da associao profissional como uma referncia fundamental.
significa que, para o profissional no contexto do seu trabalho, a asse
o profissional e os colegas da mesma profisso so uma fonte pri
paI de ideias e opinies.
2) Acreditar que se est a servir o pblico. De acordo com este aspecto, a
fisso vista como indispensvel sociedade.
3) Acreditar que existe uma auto-regulao. Esta noo implica que o trabo
de um profissional pode e deve ser julgado apenas por outros meml
da profisso porque s eles tm a qualificao necessria para er
avaliaes adequadas.
4) A sensao de ter vocao para essa funo. O profissional algum qt
dedica ao seu trabalho e que, provavelmente, quereria ter essa profi
mesmo que as recompensas materiais fossem menores.
5) Autonomia. Esta dimenso final indica que o profissional tem que se
paz de tomar decises e fazer julgamentos sem presses quer dos c:
tes, quer das organizaes onde trabalha, quer ainda de pessoas dE
tras profisses.
O estdio de especificao do conceito no s til para se reflectir e apr
der a complexidade dos conceitos, mas tambm como forma de fazer a p
entre a formulao geral do conceito e a sua medio, uma vez que o estal
cimento de dimenses reduz o grau de abstraco dos conceitos.
O estdio seguinte o da seleco de indicadores, em que o investiga
procura indicadores para cada uma das dimenses. No caso de Hall, fe
seleccionados dez indicadores para cada dimenso. Cada indicador foi
cretizado numa afirmao que os inquiridos teriam que classificar -
muito correcta, correcta, pouco correcta ou muito pouco correcta - de ao
com a forma como achavam que descrevia o seu comportamento e os
sentimentos enquanto membros da sua profisso. H tambm uma cate~
neutra. A figura 4.2 apresenta as cinco dimenses do "profissionalisml
para cada dimenso, um dos seus dez indicadores. Por fim, Lazarsfeld afi
que os indicadores tm que ser integrados atravs da formao de ndices o
calas. Este estdio pode concretizar-se de duas maneiras. Pode formar-se
escala total que compreenda todos os indicadores de todas as dimenses (
que mais frequente, pode formar-se uma escala separada para cada dir
so. Assim, na investigao de Hall, os indicadores relacionados com cad
menso foram combinados para criar escalas individuais, de forma que
sultado final acabou por ser um conjunto de cinco escalas separadas de 11
fissionalismo". Como Hall demonstra, as diferentes profisses exi
OS CONCEITOS E A SUA MEDIO 73
diferentes" perfis" em relao a essas dimenses - nalgumas, pode ter-se um
resultado elevado nas dimenses 2, 3 e 5, moderado na 1e baixo na 4, enquan-
to noutras profisses podem aparecer outras combinaes.
Para verificar se os indicadores se agrupam da forma proposta pela de-
finio a priari das dimenses, utiliza-se com frequncia a anlise factarial, uma
tcnica que ser examinada no captulo 11. A anlise factorial permite ao in-
vestigador verificar se, por exemplo, os dez indicadores criados para avaliar a
"autonomia" esto, de facto, relacionados uns com os outros e no com os in-
dicadores que foram escolhidos para medir outras dimenses. Pode desco-
brir-se que um indicador que suposto medir a autonomia parea estar asso-
ciado com muitos dos indicadores de "crena no servio ao pblico", enquan-
to um ou dois dos indicadores desta ltima dimenso apaream relacionados
com os que deveriam corresponder dimenso" crena na auto-regulao", e
assim por diante. De facto, quando se fez uma anlise factorial em relao
escala de profissionalismo de Hall, verificou-se que a correspondncia entre
as cinco dimenses e os seus supostos indicadores era fraca (Snizek, 1972;
Bryman, 1985). Contudo, o aspecto fundamental a reter sobre este assunto
que a especificao de dimenses para os conceitos , frequentemente, um
passo importante para a formulao de uma definio operacional.
Em psicologia e em sociologia h algumas medidas que so construdas
com pouca (se existe alguma) ateno questo das dimenses dos conceitos.
Assim, por exemplo, a medida da satisfao no trabalho constituda por de-
zoito itens e desenvolvida por Brayfield e Rothe (1951) - que j foi referida-
:'toespecifica dimenses, embora seja possvel aplicar a anlise factorial para
'::eterminar as suas dimenses de facto. O objectivo fulcral desta seco sa-
:':entar que a procura de dimenses pode dar um importante auxlio na com-
?reenso da natureza dos conceitos, e que quando elas so identificadas
- 'Jriari podem constituir um passo significativo no caminho a percorrer des-
:'e a complexidade e abstraco do conceito at s formas como ele pode ser
=:edido.
Validade e fidelidade das medidas
-.ceita-se, em geral, que quando um conceito foi definido operacionalmente,
-:::1.dosido proposta uma forma de o medir, o instrumento usado para essa
==dio deve ser fiel e vlido.
Fidelidade
::delidade de uma medida refere-se sua consistncia. Esta noo, em ge-
- utilizada para abarcar dois aspectos diferentes - a fidelidade externa e
74 ANLISE DE DADOS EM CINCIAS SOCIAIS
interna. A fidelidade externa a noo que se usa mais vulgarmente e refe-
re-se ao grau de consistncia de uma medida ao longo do tempo. Se tivermos
uma balana de cozinha que registe pesos diferentes cada vez que se pesa o
mesmo saco de acar temos uma medida do peso que no tem fidelidade ex-
terna, j que o valor obtido flutua ao longo do tempo quando no deviam sur-
gir diferenas de acordo com o momento em que o saco pesado. Da mesma
forma, se aplicarmos um teste de personalidade a um grupo de pessoas, pas-
sarmos o mesmo teste s mesmas pessoas pouco tempo depois e houver uma
fraca correspondncia entre os valores obtidos nos dois momentos de aplica-
o, provavelmente teremos que considerar que o teste no tem fidelidade ex-
terna porque as medidas que proporciona parecem flutuar. Quando avalia-
mos a fidelidade externa desta forma, ou seja, administrando o mesmo teste
em duas ocasies distintas ao mesmo grupo de sujeitos, estamos a avaliar afi-
delidade teste-reteste. Poderamos prever que as pessoas que, na primeira apli-
cao, tivessem valores elevados os teriam, tambm, na segunda; por outras
palavras, esperamos que a posio relativa do resultado de cada pessoa se
mantenha relativamente constante. O problema de usar este procedimento
consiste na impossibilidade de sabermos se os acontecimentos que medeiam
as duas aplicaes podem justificar, pelo menos em parte, a discrepncia en-
tre os dois conjuntos de resultados. Assim, por exemplo, se a satisfao no tra-
balho de um grupo de pessoas for avaliada agora e voltar a ser testada da a
trs meses pode verificar-se que, de um modo geral, os inquiridos tenham
manifestado nveis mais elevados de satisfao na segunda do que da primei-
ra vez. Pode acontecer que, no perodo de intervalo entre as duas avaliaes
eles tenham recebido um aumento ou que tenha havido uma alterao na or-
ganizao do trabalho ou at que, no momento da primeira avaliao, tives
havido algum motivo de descontentamento que entretanto teria sido resolvi-
do. Alm disso, se o teste e o reteste forem muito prximos no tempo, os sujei-
tos podem reproduzir as respostas que tinham dado antes havendo, assim
uma consistncia entre os dois testes que , apenas, aparente. Contudo, a fide-
lidade teste-reteste um dos principais meios de avaliar a fidelidade externa
Afidelidade interna particularmente importante em relao s escal~
de mltiplos itens. Levanta a questo de se saber se cada escala est a med1:
uma nica ideia e se os itens que constituem a escala tm consistncia intelTh:.
Existem vrios procedimentos para avaliar a fidelidade interna e dois dele-
podem ser conduzidos a partir do SPSS. Em primeiro lugar, a avaliao da :-
delidade atravs do coeficiente de bi-partio (split-halj reliability) feita dh-:-
dindo os itens de uma escala em dois grupos (ao acaso ou com base nos ite:-.
pares ou mpares) e examinando a relao entre os valores dos sujeitos e~
cada uma das metades. Assim, a medida de satisfao no trabalho de Bra:.-
field e Rothe que contm dezoito itens seria dividida em dois grupos de n
e seria calculada a relao entre os resultados dos sujeitos a cada uma .
duas metades. Chega-se, assim, a um coeficiente que pode ser interpreta -
OS CONCEITOS E A SUA MEDIO 75
da mesma maneira que o coeficiente de correlao de Pearson (ver o Captulo
8), na medida em que varia de O a 1; quanto mais perto estiver de 1 - ideal-
mente, sendo maior ou igual a 0.8 - maior fidelidade interna tem a escala.
Em segundo lugar, o vulgarmente usado alfa de Cronbach (alpha) traduz, es-
sencialmente, a mdia de todos os coeficientes de bi-partio possveis. Mais
uma vez, a regra bsica que se deve situar entre 0.8 e 1. Esta regra , tambm,
usada em relao fidelidade teste-reteste. Quando um conceito e a sua me-
dida compreendem vrias dimenses, habitual calcularem-se os coeficien-
tes de fidelidade para cada uma das dimenses subjacentes em vez de calcu-
lar um s para a medida no seu todo. De facto, se uma anlise factorial confir-
ma que existe um certo nmero de dimenses, a fidelidade interna da escala,
se for considerada na totalidade, ter provavelmente um valor baixo, j que
os coeficientes de bi-partio sero certamente reduzidos.
Os valores alfa ou o coeficiente de bi-partio podem ser, facilmente,
calculados com o SPSS. necessrio assegurarmo-nos de que todos os itens
esto codificados na mesma direco. Assim, no caso da varivel satis preci-
so verificar se os itens que esto na forma inversa (como o satis2 e o satis4) fo-
~amrecodificados (utilizando Recode) de modo a que o acordo com a frase in-
iique falta de satisfao no trabalho. Estes dois itens j foram recodificados
?ara rsatis2 e rsatis4, e sero utilizados no exemplo seguinte. Para calcular o
:este de fidelidade dos 4 itens que constituem o valor satis, teramos que reali-
2ar este procedimento:
~ Analyze ~ Scale ~ Reliability Analysis ... [abre a caixa de dilogo
Reliability Analysis apresentada na caixa 4.1]
~ Seleccionar satisl, rsatis2, satis3 e rsatis4 enquanto se pressiona a te-
cla ctrl [as quatro variveis devem ficar selecciona das no cran] ~ ~ [bo-
to] [coloca satisl, rsatis2, satis3 e rsatis4 na caixa Items:] ~ Model ~
Alpha no menu drop-down.
~OK
:.::desejarmos determinar a fidelidade atravs de um coeficiente de bi-parti-
~o (Spli-half), devemos seleccionar esta opo no menu Model, em vez de
~..ipha.O resultado do clculo do coeficiente alpha (quadro 4.2) sugere que a
':.rivel satis internamente fivel, na medida em que o coeficiente determi-
ado de 0,76. Este valor est pouco abaixo do critrio de 0,8, e pode ser consi-
-~ado como garante da fidelidade desta varivel. Se uma escala lemonstrar
-:.a fidelidade interna reduzida, a estratgia a adoptar para esta eventuali-
- - .:iepode passar por retirar um ou mais itens que constituem esta escala e
=2.....'lalisar a sua fidelidade. Para tal, podemos seleccionar a opo ~ Sta-
.(s..., na caixa de dilogo Reliability Analysis, o que abre a subcaixa
- - iilogo Reliability Analysis: Statistics apresentada na caixa 4.2. Depo-
selecciona-se ~ Scale if item deleted. Os resultados mostram o nvel de
76
ANLISE DE DADOS EM CINCIAS SOCIAIS
: Reliability Analysis EJ
o@> especial
o@> produtiv
o@> qualid
o@> absent
'~satis
o@> ethnigpc
Items:
- o@> sa;is1
o@> satis3
o@> rsatis2

Caixa 4.1 A caixa de dilogo Reliability Analysis


Quadro 4.2 O ouput da anlise de fidelidade da varivel satis (Questionrio do Trabalho)
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Reliability Caefficients
N af Cases; 68.0 N af Items ; 4
Alpha; .7618
fidelidade alpha medida que se vo retirando itens. Como se pode verificar,
todo este procedimento revela-se desnecessrio para a varivel satis.
Para alm da fidelidade interna e externa, importante mencionar ou-
tros dois aspectos ligados fidelidade. Em primeiro lugar, quando o material
est a ser codificado por temas deve testar-se a fidelidade do esquema de co-
dificao. Isto pode ocorrer quando o investigador, com o intuito de encon-
trar temas gerais subjacentes s respostas, necessita de codificar as respostas
das pessoas s perguntas de uma entrevista que no chegaram a ser pr-codi-
ficadas, ou quando conduz uma anlise de contedo de anncios de jornais
para estudar a forma como os tpicos das notcias tendem a ser abordados.
Em qualquer dos casos, deve utilizar-se mais do que um codificador e calcu-
lar-se afidelidade inter-juizes, para garantir que o esquema de codificao est
a ser interpretado da mesma forma pelas duas pessoas. Este procedimento
permite avaliar o grau de acordo dos codificadores face forma como codifi-
cam os temas que derivam do material analisado. Em segundo lugar, tambm
deve ser calculada afidelidade inter-observaes quando o investigador necessi-
ta de classificar comportamentos. Se, por exemplo, se est a observar o com-
portamento agressivo, deve apresentar-se uma estimativa da fidelidade in-
ter-observaes para assegurar que os critrios de agressividade esto a ser
interpretados de um modo consistente. Para medir a fidelidade
os CONCEITOS E A SUA MEDIO
77
Beiabilily Analysis: Slalislics I&I
Continue
Etesl
_~ Friedman chis,guare
Cochran chi'square
Interlle
CorreJations
O. Covarianc~s
HOlellin,g's T-square
In!r aclass correlalion coefficienl
escriplives for
!lem
.s.cale
~~i~O!.(.(~i.n.:..~i~.~
-Slnmaries
Means
yariances
CQvariances
Co!relations
:.aixa 4.2
A subcaixa de dilogo Reliability Analysis: Statistics
_'1ter-observaes e inter-codificadores, podem utilizar-se mtodos de anli-
5<? bivariada (ver Captulo 8). Pode encontrar-se uma discusso de alguns m-
:odos concebidos especificamente para a avaliao destes dois tipos de fideli-
iade na obra de Cramer (1998).
Validade
_-\validade refere-se avaliao do grau em que uma determinada medida
:::1ede,de facto, o que se pretende medir. Como que podemos saber que uma
:::1edidade satisfao no trabalho mede mesmo a satisfao no trabalho e no
Jutro conceito qualquer? No mnimo, um investigador que crie uma nova
:::1edida deve garantir que ela tenha validade facal - ou seja, que aparente-
:::1entea medida reflicta o contedo do conceito em questo.
O investigador pode tentar calcular, ainda, a validade concorrente do con-
.:eito. Neste caso, o investigador utiliza um critrio que seja reconhecido
.:omo relevante para o conceito em causa e que diferencie as pessoas. Assim,
?or exemplo, h pessoas que faltam mais frequentemente ao emprego do que
Jutras (no por doena mas por outras razes). Para estabelecer a validade
.:oncorrente da nossa medida de satisfao no trabalho, podemos ver em que
~au as pessoas que esto satisfeitas com o seu trabalho faltam menos ao
78 ANLISE DE DADOS EM CINCIAS SOCIAIS
trabalho do que as que no esto satisfeitas. Se no se encontrar correspon-
dncia, por exemplo, se os que no esto satisfeitos faltarem com a mesma fre-
quncia que os que esto satisfeitos, podemos ser tentados a interrogar-
mo-nos sobre se a nossa medida estava realmente a avaliar a satisfao no tra-
balho. Outra forma de se avaliar a validade da nova medida calcular a vali-
dade preditiva, caso em que o investigador usa um critrio relacionado com o
futuro e no com o presente como acontecia na validade concorrente. No caso
da validade preditiva, o investigador examinaria a validade da satisfao no
trabalho com base no critrio de nveis futuros de absentismo.
Alguns autores defendem que o investigador tambm deve calcular a
validade de constructo de uma medida (Cronbach e Meehl, 1955). Aqui, o inves-
tigador encorajado a deduzir hipteses que decorram de uma teoria rele-
vante para o conceito. Apartir das suas noes sobre o impacto da tecnologia
na experincia do trabalho (por exemplo, Blauner, 1964), o investigador pode
antecipar que as pessoas que esto satisfeitas com os seus trabalhos so me-
nos frequentemente aquelas que tm funes rotineiras; e que aquelas que
no esto satisfeitos so, com mais frequncia, os que tm trabalhos rotinei-
ros. De acordo com isso, podemos investigar essa deduo terica examinan-
do a relao entre satisfao no trabalho e rotina da funo. Por outro lado,
necessrio ter algum cuidado quando se interpreta a ausncia de uma relao
entre a satisfao no trabalho e a rotina da funo. Em primeiro lugar, a teoria,
ou a deduo que feita a partir dela, pode no ser correcta. Em segundo lu-
gar, a medida criada para a rotina da funo pode ser uma forma invlida de
avaliar o conceito.
Todas as abordagens da investigao sobre a validade que foram discu-
tidas at agora so procedimentos para avaliar aquilo que Campbell e Fiske
(1959) designam como validade convergente. Em qualquer dos casos, o investi-
gador preocupa-se em demonstrar que a medida se harmoniza com outra me-
dida. Campbell e Fiske argumentam que este processo, em geral, no vai sufi-
cientemente longe, uma vez que o investigador deveria usar diferentes medi-
das do mesmo conceito para ver o grau em que existe convergncia. Assim,
por exemplo, alm de usar uma medida baseada num questionrio sobre a ro-
tina da funo, o investigador poderia utilizar observadores que classificas-
sem as caractersticas das funes para distinguir entre os graus de rotina das
funes existentes numa empresa (por exemplo, Jenkins et aI., 1975). Avalida-
de convergente poderia levar demonstrao de que existe uma convergn-
cia entre as duas medidas, embora seja difcil interpretar uma falta de conver-
gncia j que qualquer das duas medidas pode ser inadequada. Muitos exem-
plos de validao convergente, que surgiram depois do artigo de Campbell e
Fiske (1959), no envolveram, de facto, mtodos diferentes mas utilizaram di-
ferentes questionrios (Bryman, 1989). Assim, por exemplo, podem usar-se
duas medidas de rotina da funo baseadas em questionrios em lugar de se
utilizarem dois mtodos diferentes. Campbell e Fiske foram ainda mais longe
OS CONCEITOS E A SUA MEDIO
79
quando sugeriram que se deve ainda demonstrar que uma medida tem vali-
iade discriminante. Ainvestigao sobre a validade discriminante implica que
:ambm se deve procurar baixos nveis de correspondncia entre uma medida
e outras medidas que se supe corresponderem a outros conceitos. Embora a
validade discriminante seja uma importante faceta da validade de uma medi-
da, provavelmente mais importante que o estudante se centre nos diferentes
aspectos, j discutidos, da validade convergente. Para investigar os vrios ti-
?OS de validade convergente e de validade discriminante, podem utilizar-se
as tcnicas abordadas no Captulo 8 que se centram nas relaes entre pares
de variveis.
Exerccios
1 Qual das afirmaes est correcta? Uma escala de Likert :
a) um teste de validade;
b) um procedimento que d origem a medidas de itens mltiplos;
c) um teste de fidelidade;
d) um mtodo para identificar as dimenses dos conceitos
Por que razo til considerar a hiptese de que um conceito compre-
ende vrias dimenses quando se pretende operacionaliz-Io?
3 Considere as seguintes questes utilizadas num questionrio acerca de
hbitos de consumo de bebidas alcolicas. Decida se cada uma das va-
riveis nominat ordinat intervalar / proporcional ou dicotmica:
a) Alguma vez consumiu bebidas alcolicas?
Sim__
No __ (siga para a pergunta 5)
b) Se respondeu sim na questo anterior, qual das seguintes bebidas
alcolicas consumiu mais frequentemente (escolha uma s categoria)?
Cerveja __
Bebidas Brancas __
Vinho __
Licores __
Outras __
c) Com que frequncia consome bebidas alcolicas? Assinale
a resposta que mais se aproxima do seu comportamento habitual
Diariamente __
A maior parte dos dias __
Uma ou duas vezes por semana __
Uma ou duas vezes por ms __
Algumas vezes por ano__
Uma ou duas vezes por ano __
d) Quantas unidades de lcool consumiu na passada semana?
80 ANLISE DE DADOS EM CINCIAS 50
(Assumimos que o entrevistador pode ajudar os respond~
a traduzir aquilo que consomem em unidades de lcool)
Nmero de unidades __
4 No Questionrio do Trabalho, a varivel absent nominal, O]
intervalo ou dicotmica?
5 Afidelidade teste-reteste um teste da fidelidade interna ou
6 Que procedimento do SPSSse deveria usar para que o output
sente o alfa de Cronbach para autonom?
7 O que fez para a pergunta 6 seria um teste da fidelidade J
externa?
8 Um investigador cria uma nova medida de mltiplos itens pa
servadorismo poltico". Administra a medida a uma amostra
duos e pergunta-lhes, tambm, como votaram nas ltimas el
rais, para validar a sua medida. O investigador relaciona as
dos sujeitos como seu voto. Oque est ele a avaliar? a) a vali
corrente da medida, b) a validade preditiva da medida ou c)
discriminante da medida?
Captulo 5
RESUMIR OS DADOS
Quando os investigadores so confrontados com um conjunto de dados refe-
~entes a cada uma das mltiplas variveis usadas, necessitam de reduzir a in-
:vrmao que recolheram. Se pudermos reduzir grandes quantidades de da-
.:10S, torna-se possvel detectar padres e tendncias que, de outra forma, fica-
:-iamocultos. bastante simples determinar o padro de uma varivel quan-
io temos, por exemplo, dados sobre dez casos. Contudo, se formos alm dos
--inte casos comea a tornar-se difcil discriminar esses padres, a menos que
- 5 dados sejam sintetizados de alguma forma. Alm disso, quando queremos
~presentar os dados que recolhemos a outras pessoas, temos que ter conscin-
=a de que seria extremamente difcil aos nossos leitores reter a informao re-
:e"ante. Este captulo centra-se nos vrios procedimentos que se podem utili-
::ar para resumir uma varivel.
Distribuies de frequncia
~aginemos que dispomos de dados relativos a cinquenta e seis sujeitos que
:"'i.dicama que faculdade, de uma determinada Universidade, cada um deles
"?-ertence(ver quadro 5.1). A Universidade tem apenas quatro faculdades:
'::"lgenharia, Cincias Puras, Arte e Cincias Sociais. Apesar de cinquenta e
~is ser um pequeno nmero de sujeitos, no muito fcil ver como esses es-
-..:.dantesse distribuem pelas diferentes faculdades. Um p~il~~iro passo que
"?0de ser considerado quando se reduzem dados referentes a uma varivel
:".)minal como esta (uma vez que cada faculdade corresponde a uma catego-
:""2 discreta) a construo de uma distribuio de frequncias ou de uma tabela
--.=.'Tequncias. Uma distribuio de frequncias mostra-nos quantos casos ca-
:..:m em cada categoria. Por" frequncia" entende-se simplesmente o nmero
'::2 \'ezes que algo ocorre. habitual precisarmos tambm de calcular percen-
:=.~ensque nos indicam qual a proporo de casos que correspondem a cada
81
82
ANLISE DE DADOS EM CINCIAS -
Quadro 5.1
Faculdades a que pertencem cinquenta e seis alunos (Dados Fictcios)
Caso nO
Faculdade Caso nO Fa~u.~_
1
Arte 29
Eng
2
CP 30 CS
3
CS 31
CP
4
Eng
32 CS
5
Eng
33 Arte
6
CS 34 CS
7
Arte 35
Eng
8
CP 36 CP
9
Eng
37
Eng
10
CS 38 CS
11
CS 39 Arte
12
CP 40 CS
13
Eng
41
Eng
14
Arte 42 CP
15
Eng
43 CS
16
CP 44 CP
17
CS 45
Eng
18
Eng
46 Arte
19
CP 47
Eng
20
Arte 48 CP
21
Eng
49
Eng
22
Eng
50 Arte
23
CP 51 CS
24
Arte 52
Eng
25
Eng
53 Arte
26
CP 54 Eng
27
Arte 55 CS
28
CP 56 CS
Nota: (Eng) Engenharia; (CP) Cincias Puras; (CS) Cincias Sociais.
uma das frequncias, i.e, afrequncia relativa. O quadro 5.2 mostra-nos':._
nmero 11 a frequncia com que aparece a categoria Arte, o que sig:: -
que h onze alunos da amostra que estudam Arte e que esse nmero c
ponde a 20 por cento do nmero total de alunos.
O procedimento que permite criar uma distribuio de frequncias :
o SPSSser explicado posteriormente, mas entretanto deve ficar compre:;
do que para construir uma tabela de frequncias tem apenas que se cor,~
nmero de casos que cabem dentro de cada categoria. Habitualmente, .:-
tambm a percentagem que corresponde a cada categoria. Isto fornece-nc-;:
formao sobre afrequncia relativa da ocorrncia de cada categoria nwr_=
rivel, o que nos d uma boa indicao da preponderncia relativa COIr.
uma categoria surge numa amostra. O quadro 5.2 mostra-nos a distrib
de frequncias dos dados apresentados em 5.1. As percentagens foram I
dondadas, por defeito ou por excesso, at ao nmero inteiro correspon .
(usando a regra de que 0.5 ou mais corresponde ao nmero inteiro segui:-
que para valores abaixo de 0.5 o nmero arredondado por defeito :
RESUMIR OS DADOS
Quadro 5.2 Tabela de frequncia referente aos dados apresenados no quadro 5.1
n
Percentagem
Engenharia
18
32
Cincias Puras
13 23
Arte
11 20
Cincias Sociais
14 25
-otal
56
100
aJ
18
16
14
12
n 10
8
6
4
2
o Engenharia Cincias Puras Artes Cincias Sociais
83
Figura 5.1
Grfico de barras referente distribuio dos estudantes por faculdades
tornar mais fcil a leitura do quadro. Aletra n , muitas vezes, utilizada para
referir o nmero de casos de cada categoria (ou seja, a frequncia). Uma forma
alternativa de apresentar uma distribuio de frequncias referente aos da-
dos apresentados em 5.2 consistiria em omitir as frequncias de cada catego-
ria e apresentar, apenas, as percentagens relativas. Esta abordagem reduz a
quantidade de informao que o utilizador tem de reter. Quando se faz essa
opo, necessrio indicar o nmero total de casos (Le, n=56) por baixo da co-
luna das percentagens.
O quadro 5.2 pode ser facilmente adaptado a uma apresentao diagra-
mtica dos dados. Estes diagramas so, em geral, designados por grficos de
barras (bar chart ou bar diagrams) e so frequentemente escolhidos em detri-
mento dos quadros por serem de assimilao mais fcil. Um grfico de barras
apresenta uma coluna referente ao nmero ou percentagem de casos que
corresponde a cada categoria. A figura 5.1 representa um grfico de barras
que ilustra os dados do quadro 5.1 e os valores que indicam referem-se ao n-
mero de casos. No eixo das abcissas (horizontal) est escrito o nome de cada
84 ANLISE DE DADOS EM CINCIAS SOCIAIS
categoria. No preciso organiz-las por qualquer tipo de ordem (por exem-
plo, das maiores para as mais pequenas ou vice-versa). As barras no devem
ficar encostadas umas s outras, sendo prefervel mant-las nitidamente se-
paradas. necessrio salientar que o grfico de barras no fornece mais infor-
mao do que o quadro 5.2; de facto, at se perde alguma informao - as
percentagens. A vantagem principal deste tipo de representao a facilida-
de com que pode ser interpretada, caracterstica que pode ser particularmen-
te til quando a apresentao dos dados se dirige a indivduos pouco familia-
rizados com material estatstico.
Quando uma varivel intervalar que se pretende apresentar numa ta-
bela de frequncias, os dados tm que ser agrupados. Deve calcular-se o n-
mero de casos que cabem em cada intervalo. Como exemplo, podemos anali-
sar os dados respeitantes varivel rendim do Questionrio do Trabalho.
Dispomos de dados de sessenta e oito indivduos (faltam os dados de dois),
mas se no agruparmos os dados ficamos com trinta e trs categorias de ren-
dimentos, o que excessivo para permitir construir uma tabela de frequn-
cias. Alm disso, as frequncias de cada categoria acabariam por ser demasia-
do pequenas. No quadro 5.3, apresenta-se a distribuio de frequncias dos
valores que a varivel rendim assume. Foram utilizadas seis categorias. Na
construo destas categorias deve ter-se em conta um certo nmero de princ-
pios. Em primeiro lugar, h autores que sugerem que o nmero de categorias
consideradas se deve situar entre seis e vinte, uma vez que um nmero de
classes demasiado grande ou demasiado pequeno pode distorcer a forma da
distribuio da varivel em anlise (ver, por exemplo, Bohrnstedt e Knoke,
1982). Contudo, no necessariamente verdade que o nmero de categorias
afecte a forma da distribuio. Alm disso, quando os casos so poucos o n-
mero de categorias tem que ser inferior a seis, para que em cada categoria cai-
ba um nmero razovel de sujeitos. Por outro lado, um grande nmero de ca-
tegorias no tornar fcil a assimilao dos dados e, neste aspecto, a regra
prtica de Bohrnstedt e Knoke, ao considerar que as categorias podem ser
vinte, um pouco exagerada. Em segundo lugar, as categorias devem ser dis-
cretas. Nunca se deve agrupar os dados de modo a ter categorias como estas
12.000 ou menos, 12.000-14.000, 14.000-16.000, e assim por diante. Em que ca-
tegoria se incluiria o valor 12.000 ou 14.000libras? Isto significa que as catego-
rias devem ser discretas, como no quadro 5.3, de modo a que no haja qual-
quer dvida em relao ao grupo a que corresponde cada caso. Repare-se que
no quadro 5.3 se chama a ateno do leitor para o facto de haver dois caso~
omissos. A presena de dois casos omissos levanta a questo de saber se ~
percentagens devem ser calculadas tendo em conta os setenta sujeitos qU
responderam ao Questionrio do Trabalho, ou os sessenta e oito que fornece-
ram os valores do seu rendimento. Amaior parte dos autores prefere a ltirn..:.
hiptese, j que a incluso de todos os casos como base para o clculo das per-
centagens pode resultar em interpretaes errneas, especialmente quand -
RESUMIR OS DADOS 85
Quadro 5.3 Distribuio de frequncias para os valores de rendim (dados do Questionrio do
Trabalho)
Libras
at 12,000
12,000-13,999
14,000-15,999
16,000-17,999
18,000-19,999
20,000 e mais
Total
Nota: faltam dois casos.
30
20
10
C
::l
o
o O
n
1
16
20
22
7
2
68
Percentagem
1,5
23,5
29,4
32,4
10,3
2,9
100,0
/
Figura 5.2
at \:12000 1:14000-\:15999 \:18000-1:19999
1:12000-\:13999 \:16000-\:17999 \:20000e mais
GPRENDIM
Histograma para os valores da varivel rendim (dados do Questionrio do Trabalho)
houver um grande nmero de casos omissos relativos a urna determinada
--arivel.
Ainformao dada pelo quadro 5.3 pode, com vantagem, ser apresenta-
da na forma diagramtica atravs de um histograma (histogram). Um histogra-
:na igual a um grfico de barras excepto no facto de as barras estarem em
.:ontacto urnas com as outras; essa forma de representao pretende eviden-
;:iar a natureza contnua das categorias da varivel em questo. A figura 5.2
3.presenta um histograma para os dados relativos varivel rendim. As suas
--antagens so as mesmas que foram referidas para o grfico de barras.
Quando se analisa urna varivel ordinal, raramente necessrio agru-
?ar os seus valores. No caso do Questionrio do Trabalho e de urna varivel
:omo especial, que apenas pode assumir quatro categorias, no preciso
86 ANLISE DE DADOS EM CINCIAS SOCIAIS
agrupar os valores que ela toma. Pode, simplesmente, contar-se o nmerc
casos em cada uma das quatro categorias e calcular-se as percentagens cor
pondentes. possvel utilizar-se um histograma para apresentar os dac
uma vez que as categorias da varivel esto ordenadas.
Utilizar o SPSS para criar tabelas defrequncias e histogramas
Para criar uma distribuio de frequncias para a varivel rendim do Q1
tionrio do Trabalho, vamos necessitar de agrupar os dados. Caso contri
obteremos uma frequncia e uma percentagem para cada valor da vari
obteremos, tambm, um grfico onde cada barra corresponde a um valor (
sa varivel o que, numa amostra de grande dimenso, tornaria este gr
ilegvel. Para agrupar os dados da varivel rendim vamos utilizar o proo
mento Reeode. Assim, vamos criar uma nova varivel designada rendill
(isto , grupos de rendimento). O objectivo desta recodificao o de agru
os sujeitos da nossa amostra em seis grupos de rendimento: at f 12,000, d
12,000-13,999; das f 14,000-15,999; das f 16,000-17,999; das f 18,000-19,95
20,000 e mais. O procedimento seguinte permite realizar esta recodifica
7 Transform 7 Reeode 7 Into Different Variables ... [abre a caix
dilogo Reeode into Different Variables apresentada na caixa 5.1]
7 rendim 7~[boto] [transfere a varivel rendim para a caixa NU!
rie Variable70utput Variable:] 7 caixa abaixo de Output Varia
Name escrever gprendim 7 Change [tranfere gprendim para a C
NumericVariable70utputVariable:] 7 OldanNewValues ... [ab
subcaixa de dilogo Reeode into Different Variables: Old and New
lues apresentada na caixa 5.2]
7 Na caixa direita de Value [na seco Old Value] inserir O7 seleCl
nar Value na seco New Value e escrever 0.7 Seleccionar Range:
west through e escrever 11999na caixa a seguir a through 7 seleccio
Value na seco New Value e escrever 1 7 Add [onovo valor aparec
na caixa Old 7 New:] 7 seleccionar Range: e escrever 12000, bem co
13999 na caixa a seguir a through 7 seleccionar Value na seco N
Value e escrever 27 Add 7 seleccionar Range: e escrever 14000, b
como 15999 na caixa a seguir a through 7 seleccionar Value na seo
New Value e escrever 37 Add 7 seleccionar Range: e escrever 16(
bem como 17999 na caixa a seguir a through 7 seleccionar Value na!
o New Value e escrever 4 7 Add 7 Range: e escrever 18000, b
como 19999 na caixa a seguir a through 7 seleccionar Value na sec
New VaIue e escrever 5 7 Add 7 seleccionar Range: through highe
escrever 20000 na caixa 7seleccionar Value na seco New Value e
crever 67 Add 7 Continue [fecha a subcaixa de dilogo Reeode i
RESUMIR OS DADOS
Resode inlo DIHerenl Vallables EI
87
:t> gpraeial
~ se"o
i> idade
i> anos
.-i> envolv
~satis1
'~sa!is2
i> satis3
.:11) satis4
i> autonom1
i> autonom2
:'$) autonom3
Numeric:-!ariable) OulpulVariable:
Caixa 5.1 A recodificao de rendim para rendimgp
nff~'I~:II!~IJ['i"TTIi
-OldValue
r Yalue:
r ~lem;riSSing
r Syslem- or J,!sermissing
r Ra.tJge:
L
r Range:
[i:l.~'l\f'tt~r(jYg
lo Aall9!l:
120000 L tnrough highest
r AliQlher "alues
:aixa 5.2
A subcaixa de dilogo Recode into Different Variables: Old and New Values
Different Variables: Old and New Values]
~OKl
:)e seguida necessrio definir os rtulos de cada uma das seis categorias da
""arivel rendimgp (ver captulo 2 para uma descrio deste procedimento).
Para se obter o output apresentado no quadro 5.4, ser, ainda, necessrio definir o valor O
como valor omisso (rnissing value). Esta operao pode ser executada na janela Variable
View, na coluna rnissing correspondente varivel rendirngp, na caixa de dilogo Mis-
sing Values seleccionar Discrete Missing Values e introduzir O na primeira caixa.
(N. do R.)
88
Variable{s}:
.-
ANLISE DE DADOS EM CINCIAS SOCIAIS
Caixa 5.3 A caixa de dilogo Frequencies
Quadro 5.4
Tabela de frequncias para rendimgp (outputdo SPSS)
GPRENDIM
,
, I
Cumulative
Percent
Valid
at E12000 1
1,4 1,5 1,5
E12000-E13999
16
22,9 23,5 25,0
E14000-E15999
20
28,6 29,4 54,4
E16000-E17999
22 31,4 32,4 86,8
E18000-E19999
7
10,0 10,3 97,1
E20000 e mais
2
2,9 2,9 100,0
Total
68
97,1 100,0
Missing
,00 2
2,9
Total
70 100.0
A sequncia seguinte d origem tabela de frequencias apresenta(
quadro 5.4.
~ Analyze ~ Descriptive Statistics ~ Frequences ... [abre a cai:
dilogo Frequences apresentada na caixa 5.3]
~ grupos de rendimento [rendimgp] ~~ [boto] [transfere rendi
para a caixa Variable[s]:]
~OK
oquadro 5.4 mostra o nmero de sujeitos em cada categoria da varivel
dimgp (Frequency) e trs tipos de percentagens: a frequncia associe
,.."",....1"", ....... .J. ........,..,.~~...." -n..-." f'" ... TY"I':lo ..40. l1TY"1'::l "Y'\OT't""CU.,T-::lCTDrn n11(:). t('\rn~ rnrnn h;l~P tnt1
llSl.:'VIIR OS DADOS 89
~==Slacked
SLnlI1lariesfor grbups of cases
SLnlI1lariesof se~arate yariables
Values of individual cases
~-'~a 5.4
A caixa de dilogo Bar Charts
:asas (Percent); a frequncia associada com cada categoria na forma de uma
?rcentagem que toma como base todos os casos de cujos dados dispomos
Valid Percent); e a percentagem acumulada (Cumulative Percent).
Para obtermos um histograma da varivel rendimgp, devemos realizar
.) procedimento seguinte:
7 Graphs 7 Histogram ... [abre a caixa de dilogo Histogram]
7 rendimgp 7~ [boto] [coloca rendimgp na caixa Variable:] 7 OK
o histograma resultante apresentar barras de rendimento tal como defini-
das pelos critrios por defeito do SPSS.
Para produzir um grfico de barras para uma varivel nominal como
gpracial, podemos realizar o seguinte:
7 Graphs 7 Bar ... [abre a caixa de dilogo Bar Charts apresentada na
caixa 5.4]
7 Simple 7 Summaries for groups of cases 7 Define [abre a subcaixa
de dilogo Define Simple Bar: Summaries for Groups of Cases apre-
sentada na caixa 5.5]
7 gpradal 7 ~ [boto] prximo da caixa Category Axis [coloca gpra-
dal nesta caixa] 7 N of cases por baixo de Bar Represent [se esta opo
no estiver seleccionada, caso contrrio proceder sem seleccionar] 7
OK
Uma forma alternativa de apresentar dados relativos a variveis nominais
ser a de recorrer a grficos de tipo" queijo" (Pie chart), que mostram o nme-
ro de casos em cada categoria atravs de fatias de um crculo. Esta pode ser
90 ANLISE DE DADOS EM CINCIAS SOCIAIS
. Oeline S.mple Bar Summalles fOI GlOupS 01 Cases - Ei
~ sexo
~rendim
(fP idade
~anos
~envolv
.iP salis1
~salis2
~salis3
'iP salis4
~aulonom1
~aulonom2
,~ autonom3
~aulonom4
~rolina1
'?> rolina2
"
Caixa 5.5
%of~e$
Curo. % 01 cases
A subcaixa de dilogo Define Simple Bar: Summaries for Groups of Cases
Africano
2,9%
Indiano
20,0%
Asiatico
25.7%
Branco
51,4%
Figura 5.3
Diagrama de "queijo" para gpracial (dados do Questionrio do Trabalho)
uma forma de apresentao de dados muito til quando o objectivo salien-
tar o tamanho relativo de cada fatia em comparao com a totalidade da
amostra. A figura 5.3 apresenta um grfico de tipo queijo para a varivel
gpracial, gerado pelo SPSS. Para obter este tipo de grfico, devemos proceder
da seguinte forma:
7 Graphs 7 Pie ... [abre a caixa de dilogo Pie Charts apresentada na
caixa 5.6]
RESUMIR OS DADOS
Pie Challs lEi
91
Data in Chart Are~
(o' [s.,~~IT.i~if~,s.:!~i:,iio.,~,p',s.':,.r..~.~~~~
riSummaries of separate yariables
r. Values of jndividual cases
,e
Caixa 5.6
A caixa de dilogo Pie Charls
Define Pie' Summalies 101Groups 01 Cases Ei
.. t> sexo
.t> rendim
,ir idade
<~ anos
~envolv
~satis1
~satis2
'*> sal;s3
~sal;s4
<@> autonom 1
<ir autonom2
<t> autonom3
~autonom4
<@> rotina1
~rotina2
..,
C. % of c,Ses
C eu!!). % of cases
Caixa 5.7
A subcaixa de dilogo Define Pie: Summaries for Groups of Cases
~ Summaries for groups of cases ~ Define [abre a subcaixa de dilo-
go Define Pie: Summaries for Groups of Cases apresentada na caixa
5.7]
~ gpradal ~ ~ [boto] prximo da caixa Define slices by [coloca gpra-
daI nesta caixa] ~ N of cases por baixo de Slices Represent: [se esta op-
o no estiver seleccionada, caso contrrio proceder sem seleccionar]
~OK
Este procedimento d origem a um grfico de tipo queijo, no qual cada fatia
do crculo possui uma cor diferente. Se a impressora no estiver preparada
para imprimir a cores, ser necessrio proceder sua edio para que cada
92
ANLISE DE DADOS EM CINCIAS SOCIAIS
fatia possa ser distinguida de outra. O grfico da figura 5.3 foi editado at
de dois passos essenciais: a cor branca foi aplicada a todas as fatias e pai
diferentes foram aplicados a cada uma delas. Os procedimentos segt
permitem realizar este tipo de edies:
~ Duplo dique em qualquer parte do grfico. Isto abre a caixa l
Editor. O grfico aparecer no Chart Editor a sombreado
Para encher cada fatia de cor branca:
~ seleccionar cada fatia do grfico (pequenos pontos aparecero
mite da fatia)
~ Format ~ Color ... [uma paleta de cores aparecero] ~ Fill ~ ,
~ Apply ~ outra fatia e aplicar s restantes, ainda que possa ser
uma fatia numa cor mais escura ~ CIos e
Para criar um padro diferente em cada fatia:
~ seleccionar cada fatia do grfico (pequenos pontos aparecero
mite da fatia)
~ Format ~ Fill pattern ... [uma palete de padres aparecero pa
leccionar] ~ seleccionar padres ~ Apply ~ outra fatia
~ outro padro [lembre-se que deve aplicar um padro diferente a
fatia] ~ Apply [continua at que cada fatia branca tenha um padr,
ferente] ~ Close
Note-se que os rtulos dos valores sero necessrios para produzir as I,
das apresentadas na figura 5.3. Podemos adicionar as percentagens da e
tra que cada fatia representa (tal como se pode observar na figura 5.3) (
guinte forma: quando posicionados no Chart Editor, dicar em Chart e d
em Options ... ; seleccionar Percents [a caixa ao lado de Text deve, tarr
encontrar-se seleccionada]. Podemos, ainda, criar efeitos no grfico
como destacar uma das fatias do crculo de modo a salientar a sua impc
cia. Para fazer isto, dique na fatia pretendida e:
~ Format ~ Explode Slice
De um modo geral, podemos efectuar alteraes semelhantes em todas
guras geradas pelo SPSS (por exemplo, grficos de barras), fazendo, sim
mente, um duplo dique no grfico em questo e escolhendo as alterne
do Chart Editor. Desta forma, podemos alterar cores, introduzir pad
{'o r _ ~.
RESUMIR OS DADOS
Medidas de tendncia central
93
Uma das formas mais importantes de sintetizar a distribuio de valores de
urna varivel estabelecer a sua tendncia central- o vaIar tpico da distribui-
o. Perguntamo-nos, por exemplo, onde tendem a concentrar - se os valo-
res da distribuio? Para muitos leitores, isto pode significar que se procura a
"mdia" de uma distribuio de vaiares. Contudo, quando os estatsticos fa-
lam de valores mdios referem-se a vrias medidas. Discutiremos aqui trs
medidas dos valores mdios (i.e., medidas de tendncia central): a mdia
aritmtica, a mediana e a moda. Sephan J. Gould, um paleontlogo conhecido
pelos seus escritos cientficos, ilustra duas destas medidas da seguinte forma:
Um poltico do partido do poder pode dizer, com algum orgulho: "O rendimen-
to mdio dos nossos cidados de $15,000 por ano". O lder da oposio pode
retorquir: "Contudo, metade dos cidados ganha menos de $10,000 por ano".
Ambos esto correctos, mas nenhum cita as estatsticas com objectividade. O
primeiro utiliza a mdia, enquanto o segundo a mediana (Gould, 1991: 473).
~o fundo, este comentrio no nos assegura relativamente possvel utiliza-
o indevida das estatsticas, mas ilustra bem as diferentes formas de apre-
sentar um resultado mdio.
A mdia aritmtica (arithmetic mean)
Amdia aritmtica um mtodo de calcular a mdia da distribuio que cor-
responde noo comum de mdia. Consideremos a seguinte distribuio de
"alares:
12 10 7 9 8 15 2 19 7 10 8 16
Determinar a mdia aritmtica consiste em adicionar todos os valores (neste
caso, o resultado 123) e dividir esse total pelo nmero de valores (no nosso
exemplo, 12). Neste caso, a mdia aritmtica 10.25. este tipo de clculo que
conduz a afirmaes to bizarras como: "o nmero mdio de crianas 2.37" .
. :0 entanto, a mdia aritmtica que , frequentemente, simbolizada por x ,
de longe, a mais utilizada medida de tendncia central. Muitos dos testes es-
:atsticos que sero abordados em captulos posteriores deste livro relacio-
.,am-se directamente com a comparao das mdias de diferentes amostras
au grupos de sujeitos (por exemplo, a anlise de varincia - ver captulo 7). A
:ndia aritmtica fcil de compreender e de interpretar, o que aumenta a sua
3.tractividade. Asua maior limitao liga-se ao facto de ser vulnervel aos va-
:ores extremos, podendo ser enviesada por valores muito altos ou muito
94
ANLISE DE DADOS EM CINCIAS SOCIAIS
baixos cujo efeito , respectivamente, o de aumentar ou diminuir de forma en-
ganosa a sua magnitude. Isto tende a acontecer particularmente quando se
dispe de relativamente poucos dados; quando se tem muitos dados preciso
que esteja presente um valor muito exagerado para distorcer o valor da m-
dia. Assim, por exemplo, se na distribuio de doze valores que j apresent-
mos substituirmos o 19por 59, a mdia seria 13.58em vez de 10.25, valor subs-
tancialmente diferente e que constitui uma fraca representao da amostra no
seu todo.
De uma forma semelhante, no quadro 8.10 do captulo 8, a varivel "ta-
manho da empresa" contm um valor extremo (outlier; caso nmero 20), ou
seja, uma empresa com 2700 empregados. Note-se que a empresa seguinte
possui, somente, 640. Amdia desta varivel de 499, mas se exclurmos o va-
lor extremo ela passa para 382,6. Como se depreende deste exemplo, um valor
extremo pode ter um impacto substancial na mdia aritmtica, especialmente
quando o nmero de casos de uma amostra pequeno.
A mediana (median)
Amediana o ponto mdio de uma distribuio de valores. Parte uma distri-
buio de valores em duas partes. Imaginemos que os valores de uma distri-
buio so ordenados de forma crescente - por exemplo, 2, 4, 7, 9, 10: neste
exemplo, a mediana o valor central, isto , 7. Quando o nmero de valores
par, a mediana a mdia dos dois valores do meio. Assim, no primeiro grupo
de doze valores, para calcular a mediana poderamos orden-los deste modo:
2 7 7 8 8 ~ 10 12 15 16 19
Neste conjunto de valores, tomamos os dois valores sublinhados - o sexto e o
stimo - somamo-los e dividimos o total por 2, i.e. (9+10)/2=9.5. Este valor
ligeiramente inferior mdia a'ritmtica de 10.25, o que se deve provavelmen-
te presena de trs valores elevados no extremo final-15, 16 e 19. Se, em
vez do 19 tivssemos o 59, a mdia seria 13.58 mas a mediana no seria afecta-
da porque enfatiza o centro da distribuio e ignora os extremos. Por esta ra-
zo, muitos autores sugerem que, quando existe um valor desviante que dis-
torce a mdia, se deve considerar a mediana por ser um indicador mais repre-
sentativo da tendncia central de um grupo de valores. Por outro lado, a me-
diana de mais difcil compreenso do que a mdia e o seu clculo no utiliza
todos os valores da distribuio. Alm disso, a vulnerabilidade da mdia
distoro por existncia de valores anmalos menor quando se trabalha
com um grande nmero de casos.
RESUMIR OS DADOS
A moda (mode)
95
~te ltimo indicador de tendncia central raramente utilizado na investi-
;ao mas frequentemente mencionado nos livros. Amoda , simplesmen-
:e, o valor que ocorre com maior frequncia numa distribuio. No exemplo
ie distribuio de doze valores que apresentmos h trs modas - 7, 8 elO .
.-\0 contrrio da mdia, que s se pode utilizar com variveis de intervalo, a
::nada pode ser utilizada a qualquer nvel de medio. A mediana pode ser
:.:sada para variveis ordinais e de intervalo mas no para variveis nominais .
.-\ssim, embora a moda parea um indicador mais flexvel pouco utilizada
?orque no usa todos os valores da distribuio e porque, no caso de existir
::1ais do que uma moda na distribuio, no fcil de interpretar.
Medir a disperso
?ara alm de se interessarem pelo valor tpico ou representativo de uma dis-
:ribuio de valores, os investigadores tambm procuram conhecer a quanti-
dade de variao que a distribuio evidencia. isto que se designa por dis-
::erso - a extenso da distribuio. A disperso pode dar-nos informaes
:mportantes: por exemplo, podemos encontrar duas empresas em que o ren-
dimento mdio dos trabalhadores manuais seja semelhante. Contudo, numa
delas os salrios podem ser mais variados com valores consideravelmente su-
?eriores e inferiores aos da outra firma. Assim, embora a mdia de salrios
seja similar, uma das empresas apresenta muito maior disperso do que a ou-
:ra. Pode ser til acrescentar esta informao aos valores de medida de ten-
dncia central.
A mais bvia medida de disperso consiste em considerar o valor mais
alto e o valor mais baixo da distribuio e subtrair o segundo do primeiro. Ao
,esultado assim obtido chama-se amplitude da distribuio (range). Embora de
:cil compreenso, tem a desvantagem de ser susceptvel distoro por in-
]uncia de valores extremos. Isto pode ser ilustrado com os dados fictcios
apresentados pelo quadro 5.5que mostram as notas, numa escala de 100, obti-
das por duas classes de vinte alunos num teste de matemtica. Cada uma das
classes orientada por um professor diferente. As duas turmas tm mdias
semelhantes mas os padres das duas distribuies de valores so muito dife-
,entes. Aturma do professor Atem uma distribuio de notas pouco diversi-
:'icada enquanto que a do professor B apresenta muito maior disperso.
::nquanto a nota mais baixa obtida na turma do professor Afoi 57, a mais bai-
xa na turma do professor Bfoi 45. De facto, no caso do professor Bh oito no-
~asinferiores a 57. Contudo, enquanto a nota mais elevada dada pelo profes-
sor A 74 na turma de Bh trs notas superiores a esta - uma atinge o valor
93. Embora a ltima distribuio seja mais dispersa, o clculo da amplitude
96 ANLISE DE DADOS EM CINCIAS SOCIAIS
Quadro 5.5 Resultados de um teste de aptido matemtica aplicado aos alunos de dois professore,
(Dados Fictcios)
Mdia aritmtica
Desvio-padro
Mediana
Professor (A)
65
70
66
59
57
62
66
71
58
67
61
68
63
65
71
69
67
74
72
60
65.55
4.91
66
Professor (B)
57
49
46
79
72
54
66
65
63
76
45
95
62
68
50
53
58
65
69
72
63.2
12.37
64
parece exagerar essa disperso. Para o professor A esse intervalo 74-57, i
17. Para B, o intervalo 95-45, i.e. 50. Este valor exagera a quantidade de d
perso uma vez que todos os valores excepto trs se situam entre 72 e 45, o q
implica que para a maioria dos valores o intervalo de variao seja igual a 2:
Uma soluo para este problema consiste em eliminar os valores ext
mos. A amplitude interquartis (inter-quartil range), por exemplo, por ve:i
recomendada neste sentido (ver figura 5.4). Isto implica organizar os vaIo]
numa ordem crescente. O intervalo dividido em quatro partes iguais,
modo a que os primeiros 25% fiquem na primeira parte e os 25% maiores
quem na ltima. Estas divises servem para definir quartis. Consideremo
primeira distribuio que utilizmos para o clculo da mediana:
2 7 7 8 8 9 10 10 12 15 16 19
11
Primeiro quartil
11
Terceiro quartil
O primeiro quartil (Q1), por vezes intitulado "quartil inferior" ficar entre I
e o 8. De acordo com o SPSS, o seu valor de 7.25. O terceiro quartil (Q3), f
vezes intitulado "quartil superior", ser 14.25. Assim, a amplitude interquar
RESUMIR OS DADOS
Mediana
97
01 02 03
1 1
25% das
observaes
t
Valor
mnmo
25% das
observaes
25% das
observaes
25% das
observaes
t
Valor
mximo
Amplitude interquartis
Observaes por ordem crescente
Figura 5.4 Amplitude interquartis
a diferena entre o primeiro e o terceiro quartis, ou seja, 14.25-7.25 = 7. Como
a figura 5.4 indica, a mediana o segundo quartil mas no um componente
:tecessrio para o clculo da amplitude interquartis. A principal vantagem
desta medida de disperso eliminar os valores extremos e a sua grande limi-
:ao ignorar 50% dos valores da distribuio, o que significa uma grande
?erda de informao. Um compromisso possvel entre estes dois aspectos
?ode ser atingido atravs da diviso da distribuio em dez partes (decis) e
do clculo da amplitude interdecis. De um modo similar ao que se fazia para a
amplitude interquartis eliminam-se os valores mais altos e os mais baixos.
:\reste caso, s se perde 20% da distribuio.
Sem dvida que o mais utilizado mtodo de avaliar a disperso o des-
:'io-padro (standart deviation). Na essncia, o desvio-padro reflecte a quanti-
dade mdia de desvio em relao mdia. O seu clculo , de algum modo,
mais complicado do que esta definio sugere. No captulo 7, pode encon-
trar-se uma descrio mais pormenorizada do desvio-padro. O desvio-pa-
dro evidencia o grau em que os valores de uma distribuio se afastam da
mdia aritmtica. O seu valor , em geral, apresentado em conjunto com a m-
dia, uma vez que difcil compreender o seu significado sem fazer aluso a
esta segunda medida.
Podemos comparar as duas distribuies do quadro 5.5 Apesar das m-
dias serem muito semelhantes o desvio-padro na turma do professor B
12.37) muito maior do que o da turma do professor A (4.91). Deste modo, o
desvio-padro permite a comparao directa dos graus de disperso quando
se consideram medidas e amostras comparveis. Uma das suas vantagens
adicionais consiste no facto do seu clculo considerar todos os valores da dis-
tribuio. Alm disso, resume a quantidade de disperso da distribuio
num nico valor que, quando utilizado em conjunto com a mdia, fcil de
98 ANLISE DE DADOS EM CINCIAS SOCIAIS
interpretar. O desvio-padro pode ser afectado pelos valores extremos mas
como o seu clculo depende de todos os valores envolvidos, a distoro me-
nos pronunciada do que no caso da amplitude. Por outro lado, no devemos
ignorar a possibilidade de distoro por efeito dos valores extremos. No en-
tanto, a menos que haja boas razes para no querer usar o desvio-padro, a
sua utilizao recomendada sempre que se pretenda obter uma medida de
disperso. uma medida referida, em geral, nos relatrios de investigao e
amplamente reconhecida como a principal medida de disperso.
Anossa abordagem da disperso destacou as variveis de intervalo. S
com esse tipo de variveis se pode utilizar o desvio-padro. A amplitude e a
amplitude interquartis podem ser usadas com variveis ordinais, embora
essa no seja uma prtica vulgar. Tambm com as variveis nominais pouco
frequente a utilizao de testes de disperso. Provavelmente, a melhor mane-
ira de avaliar a disperso das variveis nominais e ordinais usar grficos de
barras, histogramas e distribuies de frequncias.
Medir a tendncia central e a disperso com o SPSS
Todas estas medidas podem ser geradas no SPSS.Tomando a varivel rendim
a ttulo de exemplo, vamos realizar a seguinte sequncia de procedimentos:
~ Analyze ~ Descriptive Statistics ~ Explore ... [abre a caixa de di-
logo Explore apresentada na caixa 5.8]
~ rendim ~ ~[boto] prximo da caixa Dependent List [coloca a vari-
vel rendim na caixa Dependent List:]
~OK
Explore E1
Eil
~~:
facto! Lisl:
GO
T=_
I
_J
Caixa 5.8
A caixa de dilogo Explore
RESUMIR OS DADOS
99
uadro 5.6 O output do comando Explore para a varivel rendim
Descriptives
~t"ti<tic
c." ~"M
RENDIM
Mean
15638,2353
242,0376
95% Confidence
Lower Bound
15155,1261
Ioterv ai for Mean
Upper Bound
16121,3444
5% Trimmed Mean
15582,3529
Median
15600,0000
Variance
3983590,869
Std. Deviation
1995,8935
Minimum
11800
Maximum
21000
Range
9200
InterquartiJe Range
3500,0000
Skewness
,370
,291
Kurtosis
- 294
574
P10t
Leaf
8
448
0244466668888
0022246668
0000246688
00002446666
00244666688
000226
O
6
O
Stem &
11
12
13
14
15
16
17
18
19
20
21
1000
1 case(s)
RENDIM Stem-and-Leaf
Frequency
1. 00
3.00
13.00
10.00
10.00
11. 00
11. 00
6.00
1. 00
1. 00
1. 00
Stem width:
Each 1eaf:
o resultado deste procedimento apresentado no quadro 5.6; atravs dele
obtemos a mdia aritmtica, a mediana, a amplitude, os valores mnimo e m-
ximo, o desvio-padro e a amplitude interquartlica da varivel rendim.
Mtodos de apresentao dos dados: diagramas troncos-e-folhas
e diagramas extremos-e-quartis
:::m1977, John Tukey publicou um importante livro, com o ttulo Exploratory
Jata Analysis, em que pretendia apresentar aos leitores uma srie de tcnicas
~ue ele prprio tinha desenvolvido, enfatizando o clculo aritmtico simples
e a apresentao diagramtica dos dados. Apesar da abordagem por ele de-
:endida ser a anttese de muitas das tcnicas convencionalmente utilizadas
?elos analistas de dados, incluindo o conjunto de tcnicas examinadas neste
:.ivro, algumas das representaes de Tukey podem ser acrescentadas, com
100
ANLISE DE DADOS EM CINCIAS SOCIAIS
vantagem, aos procedimentos ortodoxos. Para a presente discusso, so bas-
tante relevantes duas representaes dia gramticas dos dados - o diagrama
troncos-e-folhas (stem and leaj) e o diagrama extremos-e-quartis (box and whiskers
ou boxplot).
Mtodo troncos-e-folhas de classificao dos dados
Este tipo de representao um modo muito simples de apresentar dados re-
ferentes a uma varivel de intervalo, utilizando uma forma semelhante a um
histograma mas sem se sofrer a perda de informao que este ltimo tipo de
grfico implica. Pode ser facilmente construdo mo, embora isso seja mais
difcil quando se trabalha com grandes quantidades de dados De forma a
ilustrar a construo de um diagrama de troncos-e-folhas, vamos utilizar os
dados de um indicador de desempenho de uma autoridade local. Durante
um certo perodo de tempo, o governo britnico encarregou uma Comisso
de Auditoria com a tarefa de recolher dados relativos ao desempenho de au-
toridades locais, de modo a poder comparar o seu desempenho. Um dos crit-
rios para medir este desempenho era a percentagem de necessidades satisfei-
tas aos muncipes num perodo de seis meses. Este critrio demonstrou uma
grande variabilidade entre as diversas autarquias, tal como foi salientado, na
altura, por um jornalista do The Times:
Se uma criana em Sunderland necessitasse de educao especial, no teria qu~-
quer probabilidade de ver esta necessidade satisfeita nos seis meses mais prxi-
mos. Contudo, se esta mesma criana mudasse de residncia para Durnham, -
cerca de uma ou duas milhas de distncia, teria 80% de probabilidade desta ne-
cessidade ser satisfeita num curto espao de tempo (Murray, 1995: 32).
Se estes dados medem eficincia ou no um problema de validade das medi-
das utilizadas nesta auditoria (ver captulo 4), mas no existe margem p~
dvida de que h uma grande variao relativamente percentagem de ne-
cessidades satisfeitas no espao de seis meses. Como podemos observar r.
quadro 5.7, esta percentagem varia entre Oe 95%
A figura 5.5 mostra o diagrama de troncos-e-folhas relativo a esta va.ru-
vel, que passamos a designar por necess. O grfico possui duas componen
essenciais: em primeiro lugar, os nmeros esquerda da linha vertical cons::
tuem o tronco e servem de pontos de partida para a apresentao de cada ---
lar da distribuio. Cada um dos dgitos que formam o tronco representa u;""
dades de 10 pontos. Assim, o primeiro dgito do tronco Oe refere-se a pon
abaixo das dezenas; 1 a dezenas; 2 a duas dezenas; 3 a trs dezenas e assim s
cessivamente. Ao lado direito do tronco est afolha, cada uma das quais reF --
senta um item dos dados que est ligado ao tronco. Desta forma, o O dire
RESUMIR OS DADOS
101
o 5.7 Percentagem de necessidades satisfeitas pelas autarquias num perodo de seis meses
em Inglaterra e Esccia. 1993-1994
londrinos
I Condados ingleses Autoridades metropolitanas
Condados escoceses
Avon
11 Great Manchester
Clwyd
30
Bedfordshire
25 Bolton 9
Dyfed
67
48
Berkshire 16
Bury
16 Gwent 17
.... = ...... h
14
Buckinghamshire 69 Manchester 35
Gwynedd
88
-::"=,
36
Cambridgeshire
7 Oldham 50 Mid Glamorgan
48
,- '1- .5.=ulham
6 Cheshire 25 Rochdale O
powys
80
~'''l
44 Cleveland 32 Salford 10 South Glamorgan 45
! Chelsea
8 Cornwall 3
Stockport
16
West Glamorgan
4
"i.-o;:h
4 Cumbria 35 Tameside 16
s-am
12
Derbyshire
17 Traflord 11
ark
10 Devon 55
Wigan
21
-
:' -lamlets 37 Dorset 33
Merseyside
-;::SNorth
4 Durham 72
Knowsley
8
::-inster
63 East Susses 8
Liverpool
95
=--3fes de Londres
Essex 29 St Helens 21
-g & Dagenham
22 Gloucestershire 45 Selton 37
.:.z-=:
40 Hampshire
12 Wirral 13
_':.o :;J
37
Hereford & Worcs 3 South Yorkshire
- ,
23
Hertlordshire 61
Barnsley
15
::-:c- ey
24 Humberside 14 Doncaster 1
: jQn
27
I sle of Wight 60 Rotherham 10
~ '-
3
Kent 15 Sheflield 4
~:d
2 Lancashire 14
Tyne & Wear
-"'-'1ley
10 Leicestershire
.
Gateshead 4
-a-:;w
1
Lincolnshire 36
Newcastle upon Tyne
30
-2 2ing
O Norfolk 1
North Tyneside
48
-
-gdon 7
Northamptonshire
48
South Tyneside
5
-:-'_-slow
20 Northumberland 79 Sunderland O
- ;s:on upon Thames
27 North Yorkshire 34 West Midfands
~-::m
16
Nottinghamshire
10
Birmingham
5
l? ~m
3 Oxfordshire 22
Coventry
20
=:::::ridge
34 Shropshire
15
Dudley
41
=- c-:nond upon Thames
27 Somerset 50 Sandwell 1
~_-:n
6 Staflordshire 20 Solihull 31
=- -"'am Forest
24 Suflolk 27 Walsall 3
Surrey
55 Wolverhampton
3
Warwickshire
26 West Yorkshire
West Sussex
14 Bradford 25
Wiltshire
30 Calderdale 2
Kirklees
38
Leeds
17
Wakefield
15
I
::a: ninformao omissa ou duvidosa.
=:-:e: adaptado do The Times. 30 de Maro 1995. p. 32.
~o valor Orefere-se ao valor mais baixo da distribuio, ou seja, O.Podemos
erificar que trs autoridades locais no satisfizeram quaisquer necessidades
~os muncipes durante o perodo de seis meses, enquanto quatro apenas sa-
--sfizeram 1% de necessidades. Quando chegamos linha que comea por um
102 ANLISE DE DADOS EM CINCIAS soe
P10t
Leaf
00011112233333344444
5566778889
00000112234444
555566666777
001122344
555677779
00012344
55667778
014
558888
00
55
013
79
2
(>=79 )
NECESS Stem-and-Leaf
Frequency Stem &
20.00 O
10.00 O
14.00 1
12.00 1
10.00 2
9.00 2
8.00 3
8.00 3
3.00 4
6.00 4
2.00 5
2.00 5
3.00 6
2.00 6
1. 00 7
4.00 Extremes
Stem width: 10.00
Each leaf: 1 case(s)
Figura 5.5 Diagrama de troncos-e-folhas para a varivel necess
ponto percentual, podemos observar que apenas cinco autoridades ~
ram 10%das necessidades em seis meses. Todos os nmeros direita
devem ficar alinhados na vertical. No necessrio que os seus valor
ordenados de O a 9, mas faz-lo torna a leitura mais fcil. Note-se qUE
buio achatada no fundo. Aapresentao deste diagrama foi contr
forma a que os incrementos nos valores da varivel fossem de 10 1.:
percentuais. Podemos pedir, tambm, que os valores extremos (out]
jam apresentados separadamente. Os investigadores experientes en
de dados exploratria utilizam um critrio especfico para a iden
destes valores extremos: os que se posicionam prximo do valor m
distribuio podem ser identificados atravs da frmula seguinte:
primeiro quartil- (1,5 x amplitude interquartlica)
Os valores extremos prximos do valor mximo da distribuio
cam-se atravs da frmula:
terceiro quartil- (1,5 x amplitude interquartlica)
O primeiro quartil da varivel necess de 8.0e o terceiro quartil 36.(
tuindo estes valores nas equaes anteriores obtm-se resultados q
tram que os valores extremos devem encontrar-se posicionados al
-36.0 e acima de 78.0. Utilizando este critrio, identificamos, na fil
quatro valores extremos (Extremes). Para obter um diagr
RESUMIR OS DADOS
103
::-onco-e-folhas seguimos o mesmo procedimento do utilizado para produzir
~ medidas de tendncia central e de disperso (ver caixa 5.5):
~ Analyze ~ Descriptive Statistics ~ Explore ... [abre a caixa de di-
logo Explore apresentada na caixa 5.8]
~ necess ~~ [boto] prximo de Dependent List: [tranfere a varivel
necess para a caixa Dependent List:]
~ Plots na caixa prximo de Display ~ OK
J output resultante apresentado na figura 5.5. Os valores da coluna mais
::-squerda representam a frequncia de cada ocorrncia. Podemos, tambm,
='9servar que existem dados omissos para duas autoridades locais.
Este mtodo proporciona-nos uma apresentao semelhante ao histo-
~ama, na medida em que nos d uma ideia da forma da distribuio (se, por
::xemplo, os valores se centram num extremo), o grau de disperso que apre-
-entame a existncia ou no de valores extremados. Contudo, ao contrrio do
_--.lstograma,mantm toda a informao de modo a que os dados possam ser
.:n-ectamente analisados para se verificar quais os valores predominantes.
Diagrama extremos-e-quartis
-.:,. figura 5.6 mostra-nos a estrutura de um diagrama de extremos-e-quartis. O
-2ctngulo representa os 50% centrais das observaes. Assim, o seu extremo
_Lferior,em termos da medida a que se refere, o primeiro quartil e o seu ex-
::-emo superior o terceiro quartil. Por outras palavras, este diagrama com-
:,:-eende a amplitude interquartlica. A linha assinalada a mediana. As li-
:-.hastracejadas dirigem-se para baixo at ao valor mnimo da distribuio e
:-ara cima at ao valor mximo, excluindo valores extremos (outliers) que so
_-:dicados separadamente. Este tipo de apresentao tem um certo nmero de
u311tagens. Tal como foi discutido anteriormente, este mtodo d-nos infor-
::-:aosobre a forma e a disperso da distribuio - por exemplo, o rectn-
;..Jloest mais prximo de um extremo ou do meio? Se se desse o primeiro
~,,-so, isso indicar-nos-a que os valores tendiam a concentrar-se num plo. A
:-:-imeira situao mostraria que os valores tendem a concentrar-se no limite
_-:feriorda distribuio, como o caso da mediana. Isto proporciona-nos indi-
:3.esadicionais sobre a forma da distribuio, j que nos mostra se a media-
:-3. est mais perto de algum dos extremos da caixa. Por outro lado, este mto-
.:.) no conserva toda a informao como no caso da representao tron-
~')5-e-folhas. Afigura 5.7 apresenta um diagrama extremos-e-quartis dos da-
':os do quadro 5.6. Os quatro valores extremos encontram-se assinalados. A
:.ladeteco foi feita recorrendo-se ao critrio discutido anteriormente. Atra-
-25deste diagrama, torna-se claro que apenas 20% (ou menos) de metade das
104
ANLISE DE DADOS EM CINCIAS
Valor
mnimo
50% de
observaes
(centro), i.e.,
arrplitude
interquartis
1
3' Ouartil
Mediana
l' Ouartil
Figura 5.6 Diagrama de extremos-e-quartis
12
10
114
NECESS
C64
0112
)
~'4
)
)
)
,
)
I
o
4
6
2
8
-2
N=
Figura 5.7
Diagrama extremos-e-quartis da varivel necess (outputdo SPSS)
RESUMIR OS DADOS
105
?!"ocedimento referido na pgina 103, o SPSSvai gerar um diagrama de tron-
:~-folhas e um de extremos-e-quartis.
Qualquer destas tcnicas de anlise exploratria dos dados pode ser re-
:omendada como um passo til no sentido de conhecer os dados quando co-
:::1eamosa estud-los. Devero elas ser utilizadas como alternativa aos histo-
~amas e a outras abordagens mais comuns? De facto, elas tm a desvanta-
~em de serem pouco conhecidas. Das duas, o diagrama de troncos-e-folhas ,
:alvez, o mais fcil de assimilar, uma vez que o diagrama extremos-e-quartis
:equer a compreenso da noo de quartil e de mediana. Qualquer um deles,
~ for usado para um pblico pouco familiarizado com estas tcnicas, pode
::iar algumas dificuldades; se, pelo contrrio, o pblico os dominar, estes m-
:odos de apresentao dos dados tm muito a seu favor.
A forma de uma distribuio
- fizmos referncia em vrias ocasies forma da distribuio. Assim, por
exemplo, os valores de uma distribuio podem tender para um dos extremos
)u concentrar-se no centro. Nesta seco, vamos especificar melhor os aspec-
:05 ligados forma da distribuio e introduzir conhecimentos fundamentais
::>araa compreenso de alguns mtodos de anlise de dados que sero abor-
iados em captulos posteriores.
Os estatsticos descreveram uma srie de curvas de distribuio. Amais
:.mportante sem dvida, a distribuio normal. A distribuio normal tem a
:orma de um sino. Pode tomar uma variedade de aspectos diferentes, depen-
jendo do grau de disperso dos dados. Na figura 5.8 temos exemplificadas
iuas curvas caractersticas da distribuio normal. O termo "normal" pode
~'lduzir em erro, porque na realidade muito raro encontrarem-se distribui-
;es perfeitamente normais. Contudo, os valores da varivel podem aproxi-
:nar-se da distribuio normal e, quando isso acontece, tendemos a pensar
:ceIes como se tivessem, de facto, as propriedades da distribuio normal.
~.luitas das tcnicas estatsticas mais comuns usadas nas cincias sociais pre-
5umem que as variveis analisadas tm uma distribuio prxima da normal
\-er a discusso de testes paramtricos e no paramtricos no captulo 7).
A distribuio normal resulta de todos os casos que abarca debaixo da
5ua curva. Cinquenta por cento dos casos ficaro de um lado da mdia
=.ritmtica; os outros cinquenta por cento ficaro do outro lado (ver figura
~.9).Amediana ser igual mdia: por isso que a curva tem o seu pico no va-
.::lI da mdia. Esta distribuio implica que a maior parte dos valores se situ-
-:emperto da mdia. Contudo, o prolongamento para cada um dos lados, a um
:tivel cada vez mais baixo, indica que, medida que nos afastamos da mdia,
-:encontramos cada vez menos casos. Nas caudas da distribuio s aparecer
..Jt1aproporo mnima de valores. A altura das pessoas uma varivel que
106 ANLISE DE DADOS EM CINCIAS SOCIAIS
A B
Figura 5.8 Duas distribuies normais
50%
dos
casos
Figura 5.9 Mdia e distribuio normal
pode ilustrar perfeitamente este tipo de curva. Aaltura mdia de uma mulher
adulta no Reino Unido 160.9em. Se a altura das mulheres seguir uma distri-
buio normal, a maior parte delas ter uma altura prxima da mdia. Muitc
poucas sero muito altas ou muito baixas. Sabemos que a altura das mulheres
tem estas propriedades; agora, se essa varivel tem uma distribuio norma:
perfeita, j um assunto diferente.
Adistribuio normal tem algumas propriedades interessantes identifi-
cadas em Estatstica. Estas propriedades so ilustradas na figura 5.10. Numa
distribuio normal perfeita:
1) 68.26 por cento dos casos estaro entre a mdia e um desvio-padro;
2) 95.44 por cento dos casos estaro entre a mdia e dois desvios-padro;
3) 99.7 por cento dos casos estaro entre a mdia e trs desvios-padro.
RESUMIR OS DADOS 107
~:~g~: I ~:8~oSOS
~~:~~: I~~7~oSOS
:- --~.~~~l-~~ -~~S- 34.13% 34.13%
3
dp
2
dp
.,
dp
+,
dp
+2
dp
+3
dp
Nmero de desvios-padro a partir da mdia
-igura 5.10 Propriedades da distribuio normal
Estas propriedades da distribuio normal so extremamente importantes
quando o investigador pretende fazer inferncias sobre a populao a partir
de uma amostra. Esta questo o ponto central em anlise no captulo 6.
importante ter em conta que h variveis que no seguem o formato
da curva da distribuio normal. Por vezes, podem at afastar-se bastante
dessa disposio. Essa tendncia muito clara quando os valores de uma dis-
rribuio so assimtricos ou enviesados, isto , quando tendem a concentrar-se
num extremo. Quando isso acontece, a mdia e a mediana deixam de coinci-
dir. Estas ideias so ilustradas pela figura 5.11. O diagrama da esquerda mos-
tra uma curva que positivamente assimtrica na medida em que os valores ten-
dem a concentrar-se esquerda e existe uma" cauda" longa no lado direito. A
varivel necess ilustra uma distribuio positivamente as simtrica, tal como
o diagrama extremos-e-quartis da figura 5.7 sugere (a mdia 24,75 e a me-
diana 20,00). No diagrama da direita, a curva negativamente enviesada ou
negativamente assimtrica. Outro tipo de disposio a de uma distribuio
com mais do que um pico.
Apesar de se reconhecer que algumas variveis, em cincias sociais, no
tm as caractersticas da curva normal elas so, apesar disso, muitas vezes
tratadas como se as tivessem; , no entanto, necessrio algum cuidado quan-
do existe uma discrepncia marcada em relao curva normal, como aconte-
ce nos dois casos da figura 5.10. Assim, por exemplo, muitos autores
108 ANLISE DE DADOS EM CINCIAS SOCIAIS
y
Mediana Mdia
x
y
Mdia Mediana
x
Distribuio positivamente
assimtrica
Distribuio negativamente
assimtrica
Figura 5.11 Distribuies positiva e negativamente enviesada
argumentariam que no seria correcto aplicar testes estatsticos que pressu-
pem que os dados seguem uma distribuio normal quando as variveis se:
distribuem de forma pronunciadamente enviesada. Muito frequentemente
pode examinar-se se as curvas se afastam da curva caracterstica da distribui-
o normal atravs da anlise de uma distribuio de frequncias ou de urr
histograma.
O SPSSpermite-nos avaliar o enviesamento (Skewness), atravs do proce-
dimento seguinte (a varivel rendim vai ser utilizada a ttulo de ilustrao):
~ Analyze ~ Descriptive Statistics ~ Frequencies ... [abre a caixa de
dilogo Fequences apresentada na caixa 5.3]
Frequencies: Slalislics I&'J
Continue
entral TeriOencl
_.VaJues are group roidponts
D
Percentae Values
t1)Quartiles
01Cyt points forllQJl equal groups
Caixa 5.9
A subcaixa de dilogo Frequencies: Statistics
RESUMIR OS DADOS 109
~ rendim ~ ~ [boto] ~ Statistics [abre a subcaixa de dilogo Fre-
quences: Statistics apresentada na caixa 5.9]
~ Skewness na caixa Distribution ~ Continue [fecha a subcaixa de
dilogo Statistics]
~OK
3e no houver assimetria, ou seja, se a varivel for normalmente distribuda,
5-rregistado um valor de zero ou prximo de zero. Se o valor for negativo os
d.ados so negativamente assimtricos; se for positivo so positivamente assi-
:ntricos. Por outro lado, este teste no fcil de interpretar e importante
.:onfrontar a possibilidade de uma assimetria excessiva a partir da observa-
;o directa dos dados. Isto pode ser feito atravs de uma distribuio de fre-
-iuncias ou atravs de uma representao diagramtica, como um histogra-
:na ou um diagrama troncos-e-folhas.
Exerccios
Qual o procedimento do SPSSnecessrio para criar uma distribuio de
frequncias para os dados do Questionrio do Trabalho referentes a
produtiv, acompanhada dos valores percentuais e da mediana?
Faa correr, novamente, o procedimento que utilizou na pergunta 1.
Qual a percentagem de sujeitos que fica na categoria "fraca"?
Que problema pensa que poderia ocorrer se utilizasse a mdia como
medida de tendncia central e a amplitude como medida de disperso
da varivel "dimenso da firma" no quadro 8.11?
Qual das seguintes representaes no deve ser usada para uma vari-
vel de intervalo: a) um diagrama extremos-e-quartis; b) um diagrama
troncos-e-folhas; c) um grfico de barras ou d) um histograma?
Qual o procedimento do SPSS necessrio para calcular a amplitude in-
terquartis da varivel rendim do Questionrio do Trabalho?
Qual a amplitude interquartis de satis?
Em que medida o desvio-padro uma medida de disperso melhor do
que a amplitude interquartis?
Considerando, de novo, a varivel satis, qual o leque provvel de valo-
res de satis que se situa entre a mdia e dois desvios-padro? Qual a per-
centagem de casos que provavelmente caira dentro desse intervalo de
valores?