Escolar Documentos
Profissional Documentos
Cultura Documentos
Introdução À Análise Estatística Utilizando o SPSS 13 - 0 PDF
Introdução À Análise Estatística Utilizando o SPSS 13 - 0 PDF
INSTITUTO DE MATEMTICA
Cadernos de Matemtica e Estatstica
Srie B: Trabalho de Apoio Didtico
Elsa Mundstock
Jandyra Maria Guimares Fachel
Suzi Alves Camey
Marilyn Agranonik
Srie B, Nmero XX
Porto Alegre - maio de 2006
NDICE
1. INTRODUO AO SPSS ........................................................................................................ 3
1.1 - BANCO DE DADOS: Definio ............................................................................... 4
1.2 - COMO CRIAR UM BANCO DE DADOS................................................................. 4
1.3 - COMO DAR NOME AOS NVEIS DE UMA VARIVEL ......................................... 5
1.4 - COMO ACESSAR UM BANCO DE DADOS J EXISTENTE ................................ 6
2. INTRODUO AOS MTODOS ESTATSTICOS.................................................................. 7
2.1 - TIPOS DE VARIVEIS: Definio........................................................................... 7
2.2 - DESCRIO E EXPLORAO DE DADOS.......................................................... 7
2.3 - CATEGORIZAO DE VARIVEIS ....................................................................... 8
2.3.1 - COMO CATEGORIZAR UMA VARIVEL QUANTITATIVA................................ 8
2.3.2 - COMO DAR NOME AOS NVEIS DE UMA VARIVEL .................................... 10
2.4 - COMO CRIAR UMA VARIVEL A PARTIR DE UMA DATA................................ 10
2.5 - COMO CRIAR UMA VARIVEL ATRAVS DA COMBINAO DE OUTRAS
DUAS ............................................................................................................................. 10
3. ANLISE UNIVARIADA ......................................................................................................... 12
3.1 - VARIVEIS QUANTITATIVAS .............................................................................. 12
3.1.1 - COMO OBTER AS ESTATSTICAS DESCRITIVAS ......................................... 12
3.1.2 - COMO OBTER UM HISTOGRAMA ................................................................... 12
3.2 - VARIVEIS CATEGRICAS (QUALITATIVAS)................................................... 13
3.2.1 - COMO OBTER A DISTRIBUIO DE FREQNCIAS ................................... 13
3.2.2 - COMO OBTER GRFICOS ............................................................................... 14
4. ANLISE BIVARIADA ............................................................................................................ 16
4.1 - VARIVEIS QUANTITATIVAS X QUANTITATIVAS............................................. 16
4.1.1 - COMO CALCULAR A CORRELAO ENTRE DUAS VARIVEIS
QUANTITATIVAS........................................................................................................... 16
4.1.2 - COMO OBTER GRFICO DE PONTOS (SCATTERPLOT) ................. 16
4.1.3 - COMO OBTER O COEFICIENTE DE CORRELAO DE PEARSON ............ 18
4.1.4 - COMO FAZER REGRESSO LINEAR SIMPLES............................................. 19
4.2 - VARIVEIS CATEGRICAS X CATEGRICAS ................................................. 22
4.2.1 - COMO VERIFICAR A EXISTNCIA DE ASSOCIAO ENTRE VARIVEIS
CATEGRICAS: Teste Qui - Quadrado........................................................................ 23
4.2.2 - COMO CALCULAR OS RESDUOS AJUSTADOS ........................................... 26
4.3 - VARIVEIS QUANTITATIVAS X CATEGRICAS ............................................... 27
4.3.1 - COMO FAZER O BOX-PLOT............................................................................. 28
5. COMPARAO DE MDIAS................................................................................................. 31
5.1 - COMO COMPARAR MDIAS ENTRE DOIS GRUPOS: Teste t para Amostras
Independentes. .............................................................................................................. 31
5.2 - COMO COMPARAR AS MDIAS DE TRES OU MAIS GRUPOS: Anlise de
Varincia ANOVA para um fator ............................................................................. 33
7. MANIPULAO DE DADOS ................................................................................................. 36
7.1 SORT CASES.......................................................................................................... 36
7.2 SELECT CASES...................................................................................................... 37
7.3 SPLIT FILE............................................................................................................... 39
7.4 MANIPULAO DE ARQUIVOS............................................................................. 41
7.5 COMO APAGAR ANLISES NO DESEJADAS NO ARQUIVO DE RESULTADOS
*.spo............................................................................................................................. 41
7.6 COMO REALIZAR ALTERAES DE DADOS PARA CONSTRUO DE
GRFICO....................................................................................................................... 41
8. ESTATSTICA NO PARAMTRICA .................................................................................... 43
8.1 TESTE DE KOLMOGOROV-SMIRNOV.................................................................. 43
9. AMOSTRAGEM...................................................................................................................... 45
2
1. INTRODUO AO SPSS
O pacote estatstico SPSS (Statistical Package for Social
Sciences) uma ferramenta para anlise de dados utilizando tcnicas
estatsticas bsicas e avanadas. um software estatstico de fcil
manuseio internacionalmente utilizado h muitas dcadas, desde suas
verses para computadores de grande porte.
(a)
3
(b)
Figura 1: Tela inicial do SSPS 13.0 for Windows. 1(a): Planilha Data View;
1(b): Planilha Variable View.
4
(VAR001, VAR002, etc.), e uma margem vertical numerada a partir
de 1 (como mostrado na Figura1a).
b) Na primeira coluna, correspondendo VAR001, vamos criar uma
varivel, por exemplo, NumCaso com o nmero do questionrio
ou do caso em estudo.
c) Para registrar as caractersticas da varivel, clicar duas vezes
sobre o nome da coluna. Aparece a planilha variable view na
qual cada varivel est definida em uma linha.
d) Na primeira coluna (Name), digitar o nome da varivel
(NumCaso). Para o nome das variveis utilize 8 dgitos no mximo,
no utilize espao em branco nem os smbolos -, . e /.
e) Clicar na coluna Type para definir o tipo de varivel, aparece a
janela Variable Type onde se deve deixar a opo Numeric.
Se a varivel for alfa-numrica (texto) escolha a opo String.
Preferencialmente use sempre a modalidade Numeric para
variveis categricas, como por exemplo, sexo, estado civil,
municpio, etc. criando-se um cdigo para as categorias.
f) No caso de no-resposta ou respostas que no se desejam
considerar para o tratamento estatstico, como por exemplo,
respostas no corretas, etc..., clicar na coluna Missing, abre-se a
janela (Missing Values), registrar, na opo Discrete Missing
Values, o cdigo de no-resposta, preferencialmente 9, 99, 999,
etc. Clicar em "OK". A melhor opo para no resposta deixar o
espao em branco no banco de dados.
g) Retornar planilha data view e passar a digitar, em cada linha
da coluna identificada, o valor da varivel.
h) medida que o BANCO DE DADOS vai sendo registrado
importante salvar as informaes digitadas, para tanto se procede
da seguinte forma: Clicar em File, Save as... (abre-se a janela
do caminho desejado) e criar um nome para o Banco de dados, que
ter automaticamente a terminao .sav.
5
a) Clicar em Values. Abre-se a janela Value Labels:
b) Em Value, digitar 0;
c) Em Value Label, digitar masculino;
d) Clicar em ADD;
e) Procede-se da mesma forma para os demais nveis de
categorizao: digitar 1 para Value e feminino para Value
Label, seguindo-se por ADD
f) Clicar em OK.
OBSERVAO:
A manipulao do BANCO DE DADOS nos permite:
Criar e recodificar variveis;
Realizar anlise de dados atravs de estatsticas descritivas,
grficos, etc;
Selecionar casos para anlise, repetir a anlise para grupos de
casos diferentes.
6
2. INTRODUO AOS MTODOS ESTATSTICOS
OBSERVAO:
No podemos calcular mdia, varincia ou desvio-padro de
variveis qualitativas ou variveis categricas.
7
2.3 - CATEGORIZAO DE VARIVEIS
RESULTADOS:
Frequencies
Statistics
Population in thousands
N Valid 109
Missing 0
Percentiles 25 5000,00
50 10400,00
75 37100,00
8
2. Criar uma varivel com 4 categorias, definidas pelos quartis, da
seguinte maneira:
9
2.3.2 - COMO DAR NOME AOS NVEIS DE UMA VARIVEL
10
Para criar uma varivel a partir da combinao de outras duas,
como por exemplo, combinar a varivel sexo (sex) e a varivel raa
(race) utilizaremos o seguinte procedimento para criar a varivel
SEXRACE.
Sabendo que a varivel SEX categorizada da seguinte forma:
1-Male e 2-Female
e a varivel RACE categorizada da seguinte forma:
1- White, 2-Black e 3-Other
pode-se criar a varivel SEXRACE com as seguintes categorias:
1- White Male,
2- White Female,
3- Black Male
4- Black Female
5- Other Male
6- Other Female
11
3. ANLISE UNIVARIADA
3.1 - VARIVEIS QUANTITATIVAS
3.1.1 - COMO OBTER AS ESTATSTICAS DESCRITIVAS
EXEMPLO:
Descriptives
Descriptive Statistics
12
EXEMPLO: Histograma da varivel Infant Mortality
Infant Mortality
30
25
20
Frequency
15
10
Mean =42,313
Std. Dev. =38,0792
0 N =109
0,0 50,0 100,0 150,0 200,0
Frequencies
Statistics
13
Region or economic group
Valid Cumulative
Frequency Percent Percent Percent
Valid OECD 21 19,3 19,3 19,3
East Europe 14 12,8 12,8 32,1
Pacific/Asia 17 15,6 15,6 47,7
Africa 19 17,4 17,4 65,1
Middle East 17 15,6 15,6 80,7
Latn America 21 19,3 19,3 100,0
Total 109 100,0 100,0
OBSERVAO:
Com variveis categricas, o adequado fazer grfico de
setores (Pie), de Colunas
14
RESULTADO:
Region or economic
group
OECD
East Europe
Pacific/Asia
Africa
Middle East
Latn America
RESULTADO:
Region or economic
group
OECD
East Europe
Pacific/Asia
Africa
Middle East
19,27% 19,27%
Latn America
12,84%
15,6%
15,6%
17,43%
15
4. ANLISE BIVARIADA
Para realizar uma anlise bivariada, ou seja, anlise da relao
entre duas variveis, utilizam-se testes estatsticos e/ou grficos
adequados:
16
Atravs deste grfico podemos visualizar empiricamente a relao
entre as variveis.
Para se obter o grfico Scatterplot (grfico de pontos) procede-
se da seguinte maneira:
RESULTADO:
Graph
200,0
Infant mortality (deaths per 1000 live births)
150,0
100,0
50,0
0,0
0 20 40 60 80 100
17
4.1.3 - COMO OBTER O COEFICIENTE DE CORRELAO DE
PEARSON
OBSERVAO:
O coeficiente de Correlao Linear de Pearson (r) uma
medida que varia de 1 a +1.
O coeficiente fornece informao do tipo de associao
das variveis atravs do sinal:
Se r for positivo, existe uma relao direta entre as
variveis (valores altos de uma varivel correspondem
a valores altos de outra varivel);
Se r for negativo, existe uma relao inversa entre as
variveis (valores altos de uma varivel correspondem
a valores baixos de outra varivel);
Se r for nulo ou aproximadamente nulo, significa que
no existe correlao linear.
RESULTADO:
18
Correlations
Correlations
Infant mortality
People who (deaths per
read (%) 1000 live births)
People who read (%) Pearson Correlation 1 -,900**
Sig. (2-tailed) , ,000
N 107 107
Infant mortality (deaths Pearson Correlation -,900** 1
per 1000 live births) Sig. (2-tailed) ,000 ,
N 107 109
**. Correlation is significant at the 0.01 level (2-tailed).
CONCLUSO:
Ao analisarmos os dados obtidos, rejeita-se H0 (hiptese nula)
de que no h correlao entre Literacy e Babymort, uma vez
que o valor de p (Sig. 2-tailed) menor que 0,001 (muito pequena,
neste caso) e conclui-se em favor da hiptese alternativa de que h
correlao entre as variveis em estudo.
Este resultado confirma a configurao do grfico Scatterplot,
mostrando que medida que a taxa de pessoas alfabetizadas
aumenta, a mortalidade infantil tende a diminuir.
19
devemos definir a priori a varivel explicativa ou independente (X) e a
varivel explicada ou dependente (Y). A relao entre as variveis
deve ser explicada teoricamente dentro da rea de estudo.
RESULTADO:
Regression
Variables Entered/Removedb
Variables Variables
Model Entered Removed Method
1 People
whoa read , Enter
(%)
a. All requested variables entered.
b. Dependent Variable: Infant mortality
(deaths per 1000 live births)
Model Summaryb
20
infantil (Babymort) explicada pela varivel taxa de pessoas
alfabetizadas (Literacy) atravs do modelo de regresso linear
simples.
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 126066,8 1 126066,834 450,226 ,000a
Residual 29400,822 105 280,008
Total 155467,7 106
a. Predictors: (Constant), People who read (%)
b. Dependent Variable: Infant mortality (deaths per 1000 live births)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 160,732 5,794 27,740 ,000
People who read (%) -1,507 ,071 -,900 -21,219 ,000
a. Dependent Variable: Infant mortality (deaths per 1000 live births)
21
Casewise Diagnosticsa
Infant mortality
(deaths per 1000 Predicted
Case Number Std. Residual live births) Value Residual
1 3,046 168,0 117,027 50,973
a. Dependent Variable: Infant mortality (deaths per 1000 live births)
Residuals Statisticsa
22
4.2.1 - COMO VERIFICAR A EXISTNCIA DE
ASSOCIAO ENTRE VARIVEIS CATEGRICAS: Teste Qui -
Quadrado
RESULTADOS:
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
SEXRACE * Total Family
1500 100,0% 0 ,0% 1500 100,0%
Income
23
SEXRACE * Total Family Income Crosstabulation
24
RESULTADOS:
SEXRACE * Total Family Income Crosstabulation
OBSERVAO:
Sugere-se que, num relatrio final de pesquisa, seja selecionado
apenas o valor observado e um destes percentuais.
25
RESULTADO:
Chi-Square Tests
Asymp.
Sig.
Value df (2-sided)
Pearson Chi-Square 42,956a 15 ,000
Likelihood Ratio 44,902 15 ,000
Linear-by-Linear
6,226 1 ,013
Association
N of Valid Cases 1500
a. 2 cells (8,3%) have expected count less than 5. The
minimum expected count is 3,53.
26
RESULTADOS:
SEXRACE * Total Family Income Crosstabulation
27
4.3.1 - COMO FAZER O BOX-PLOT
RESULTADO:
Explore
Cases
Region or Valid Missing Total
economic group N Percent N Percent N Percent
Infant mortality (deaths OECD 21 100,0% 0 ,0% 21 100,0%
per 1000 live births) East Europe 14 100,0% 0 ,0% 14 100,0%
Pacific/Asia 17 100,0% 0 ,0% 17 100,0%
Africa 19 100,0% 0 ,0% 19 100,0%
Middle East 17 100,0% 0 ,0% 17 100,0%
Latn America 21 100,0% 0 ,0% 21 100,0%
28
Infant mortality (deaths per 1000 live births)
INTERPRETAO:
29
LEGENDA:
d: diferena interquartlica
(d = Q3 Q1)
o : outlier
(valores acima de 1,5 x d)
x : outlier
(valores acima de 3,0 x d)
30
5. COMPARAO DE MDIAS
31
RESULTADO:
T-Test
Group Statistics
32
As hipteses do teste t para igualdade de mdias entre
Amostras Independentes so:
Hiptese Nula (H0): As mdias dos dois grupos so iguais.
Hiptese Alternativa (H1): As mdias dos dois grupos so
diferentes
33
RESULTADOS:
Oneway
Descriptives
ANOVA
34
Post Hoc Tests
Multiple Comparisons
35
7. MANIPULAO DE DADOS
7.1 SORT CASES
36
7.2 SELECT CASES
37
Voc tem duas opes para o tratamento dos casos que no
sero selecionados. atravs do quadro Unselected Cases Are que
podemos fazer a escolha:
Filtered os casos (linhas) que no so selecionados no so
includos nas anlises posteriores, porm, permanecem na janela
de dados; caso voc mude de idia e queira usar os casos no
selecionados na mesma sesso do SPSS, basta desligar o filtro;
Deleted os casos (linhas) no selecionados so apagados da
janela de dados; caso voc mude de idia e queira usar os casos
no selecionados, voc dever ler novamente o arquivo de dados
original. Neste caso deve-se tomar o cuidado de salvar o banco de
dados com outro nome (File...Save As).
38
Voc pode perceber que, depois de feita a seleo, a janela
de dados sofre algumas alteraes. As linhas (casos) que no foram
selecionadas apresentam uma listra no canto esquerdo da janela de
dados. A barra localizada na parte inferior da janela apresenta a
mensagem Filter On. Alm disso, uma coluna de nome filter$
adicionada janela de dados. Essa nova coluna apresenta valor 0
para as linhas que no foram selecionadas e valor 1 para as linhas
que foram selecionadas.
39
opo selecionada na janela Analyze all cases. Para repetir a
anlise para as categorias de uma determinada varivel, clicamos em
Compare groups ou Organize output by groups, e ento o quadro
Groups Based on fica disponvel.
40
7.4 MANIPULAO DE ARQUIVOS
41
b) Clica-se sobre a seta correspondente que dever estar com o
sentido voltado para a esquerda; com este procedimento deixa-
se o campo livre para a prxima varivel;
c) Completa-se este campo de acordo com o item "d" do
procedimento "COMO OBTER GRFICO DE CORRELAO.
OBSERVAO:
Se o campo destinado varivel estiver ocupado, no h
disponibilidade para substituio automtica (a flecha indicativa estar
em cinza claro, da mesma forma que ficam quaisquer botes quando
no esto em disponibilidade).
42
8. ESTATSTICA NO PARAMTRICA
RESULTADO:
NPar Tests
Descriptive Statistics
Std.
N Mean Deviation Minimum Maximum
Infant mortality (deaths
109 42,313 38,079 4,0 168,0
per 1000 live births)
43
One-Sample Kolmogorov-Smirnov Test
44
9. AMOSTRAGEM
45
amostragem ou terminar por aqui. Se a escolha for o ltimo caso,
concluir.
RESULTADOS:
No output:
46