Você está na página 1de 19

Apostila: Anlise Estatstica utilizando SPSS

Juliana-Bahiense

Anlise Estatstica Utilizando o SPSS


Guia prtico de comandos

Juliana-Bahiense de Sousa Guimares.


Salvador/BA

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Sumrio

1. Introduo.....................................................................................................................................3
2. Primeiro Passo ............................................................................................................................3
3. As Janelas ....................................................................................................................................4
4. Os Menus ......................................................................................................................................6
4.1 Data Editor..............................................................................................................................6
4.2 Output......................................................................................................................................9
5. Anlise de Dados......................................................................................................................10
6. Bibliografia Consultada ..............................................................................................................19

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

1. Introduo
O Statistical Package for Social Science for Windows (SPSS) um software para anlise estatstica
de dados, em um ambiente amigvel, utilizando-se de menus e janelas de dilogo, que permite realizar
clculos complexos e visualizar seus resultados de forma simples e autoexplicativas.
Segundo o site Wikipedia, SPSS um software aplicativo (programa de computador) do tipo
cientfico, acrnimo de Statistical Package for the Social Sciences - pacote estatstico para as cincias
sociais. Pacote este de apoio a tomada de deciso que inclue: aplicao analtica, Data Mining, Text
Mining e estatstica que transformam os dados em informaes importantes que proporcionam reduzir
custos e aumentar a lucratividade. Um dos usos importantes deste software para realizar pesquisa de
mercado.
A primeira verso data de 1968 e, a mais recente a SPSS for Windows 16 (2007).
Para exemplificar utilizaremos os bancos de dados 1991 U.S. General Social Survey.sav
anorectic.sav que se encontra no diretrio SPSS.

Para um melhor aproveitamento das rotinas apresentadas nesta apostila faz-se necessrio um
prvio conhecimento de tcnicas estatsticas de explorao de dados.

2. Primeiro Passo
Assim que voc inicia o programa aparece a seguinte tela:

Nela voc poder abrir um arquivo j existente (banco de dados ou sintaxe ou output), ir ao tutorial,
criar um novo banco de dados.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

3. As Janelas
No SPSS existem 7 tipos de janelas, so elas:


SPSS Data Editor: permite a entrada, modificao e visualizao dos dados.

Output SPSS Viewer: a janela de resultados, tabelas e grficos.

Syntax SPSS Syntax Editor: janela onde guardamos os comandos do SPSS para reutilizarmos
em outra ocasio.

SPSS Pivot Table Object: permite editar e modificar tabelas.

SPSS Chart Object: permite editar e modificar grficos.

Script Editor: cria e modifica scripts para automatizar tarefas.

Text Output Editor: altera texto no visveis no Pivot Table Editor.

Porm, ele trabalha basicamente com as trs primeiras, que estaro expostas nesta apostila.
O aspecto inicial do editor apresentado nas figuras a seguir.
Na Figura 1 temos o Data View (Data Editor), em que as colunas so as variveis e as linhas os
casos (ou indivduos). As clulas podem conter valores numricos ou alfanumricos, mas no podem conter
frmulas.

Figura 1 - Tela dos dados banco anorectic.sav

Na Figura 2 temos o Variable View (Data Editor), local onde definimos as caractersticas das
variveis:
Name: nome da varivel, mximo de 64 caracteres, letras maisculas e minsculas so iguais.
Type: tipo da varivel (numrica, data, monetria, alfanumrica (string))
Width: comprimento da varivel, isto , a quantidade de dgitos que possui.
Decimals: nmero de casas decimais que a varivel possui.
Label: descritivo da varivel

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
Values: rtulos dos valores das variveis (pe, 1=feminino e 2=masculino).
Missing: para indicar a codificao dos valores perdidos, aqueles que no sero considerados para
efeito de clculo estatstico.
Columns: indica o numero de caracteres que formam a coluna, ou seja, a largura da coluna.
Align: alinhamento dos dados.
Measure: seleciona a escala de medida da varivel (intervalar/razo, ordinal ou nominal).

Figura 2 - Tela das variveis banco anorectic.sav

Na Figura 3 temos o View (Output), que mostra todas as sadas solicitadas, como grficos, tabelas,
e resultados estatsticos. Na Figura 4 temos a tela de sintaxe do comando Frequencies do tpico
Descriptive Statistics.

Figura 3 - Tela de sada Output banco anorectic.sav

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Figura 4 - Tela de sintaxe Syntax banco anorectic.sav

4. Os Menus
4.1 Data Editor

File tem as funes de criar, abrir, ler, imprimir, salvar, mostra os arquivos recentemente
utilizados, para o processo, sai do programa.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Edit gerencia comandos de edio dos arquivos, modificar, copiar, colar, cortar, apagar, localizar
e manipula o formato de sada (default).

View formato das telas: barras de ferramentas, fontes, status e linha de grade e rtulos de
variveis.

Data inserir varivel ou dados, define formato dos dados, ordena o arquivo segundo valores de
uma varivel, transpe variveis (em um novo arquivo transpose), agrupa arquivos (merge files), cria novo
arquivo com valores agregados das variveis originais, divide um arquivo segundo uma varivel qualitativa,
seleciona casos em que cumprem uma certa condio, pondera os valores da varivel.

Transform para alterar variavel selecionada, calcular novas variveis a partir das existentes, gera
amostra aleatria, cria nova varivel atravs de uma existente, recodifica variveis, transforma varivel
qualitativa em categrica, atribui postos aos valores de uma varivel (segundo outra), cria varivel Lag de
uma srie temporal, substitui valores perdidos, roda as transformaess pendentes.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Analyze Funes estatsticas como Anlise Descritiva, Tabelas de Freqncias, Anlise de


Varincia, Correlao, Regresso, Anlise Fatorial, Anlise de confiabilidade, Anlise de respostas
mltiplas, Testes No-paramtricos, Anlise de Sobrevivncia, etc.

Graphs Criar grficos de barras, setorial, Boxplot, linha, histograma, etc.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
Utilities para obteno de informaes acerca das variveis, alterar menus, scripts...

Window comutar entre as vrias janelas do SPSS que esto abertas.

Help Tpicos de ajuda, tutorial, Home page do SPSS.

4.2 Output

A barra de menus do Output similar a da janela Data Editor, acrescido dos itens Insert e Format

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

5. Anlise de Dados
No SPSS podemos criar um banco novo no prprio programa ou importar de um outro software, tais
com Excel, Acess, DBase.
Aps carregar o banco de dados o SPSS est pronto para ser explorado.
Iniciaremos com procedimentos mais simples de estatstica descritiva.
Para esta anlise utilizaremos o banco de dados 1991 U.S. General Social Survey.sav

Tabela de Distribuio de Freqncia


Para gerar a tabela de freqncia seguimos os seguintes comandos na barra de menu nas janelas Data
Editor ou Output:
Analyze >> Descriptive Statistics >> Frequecies

Ou, podemos utilizar os comandos diretamente da janela Syntax, como segue:


FREQUENCIES
VARIABLES=sex
/ORDER= ANALYSIS .

Para este exemplo selecionamos a varivel sex (sexo dos respondentes), obtendo a seguinte
sada:
Respondent's Sex

Frequency
Valid

Percent

Valid Percent

Cumulative
Percent

Male

636

41,9

41,9

41,9

Female

881

58,1

58,1

100,0

1517

100,0

100,0

Total

Podemos formatar os dados da tabela, como nmero de casas decimais, incluir %, fonte, etc. Para
isto, necessrio, ainda na janela Output, darmos duplo clique com o boto esquerdo do mouse na tabela,
para que se abra a ilha de edio, selecionamos os dados que queremos formatar e damos um clique com
o boto direito para que se abra a lista de opes do menu.
Tambm possvel solicitar a tabela de freqncia de diversas variveis ao mesmo tempo,
bastando seleciona-las na janela de dilogo, ou acrescent-las nos comandos do Syntax:
FREQUENCIES
VARIABLES=sex sibs
/ORDER= ANALYSIS .

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Ainda neste item, podemos solicitar, atravs do boto Statistics e Charts algumas estatsticas
resumo e grficos para representar as variveis.

Quando necessitamos descrever variveis quantitativas atravs de estatsticas gerais podemos


utilizar o comando:
Analyze >> Descriptive Statistics >> Descriptives

Ou mesmo os comandos em:


Analyze >> Descriptive Statistics >> Explore

Neste item do menu Analyze podemos obter alm de parmetros estatsticos, grficos boxplot e
ramo-e-folha e testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilk (em que a hiptese nula, H0, nos
diz que a varivel estudada segue distribuio Normal, versus a hiptese alternativa, Ha, a varivel no

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
segue uma distribuio Normal, cuja regra de deciso se p-valor < ento rejeitamos H0) e a analise
visual utilizando os grfico QQ e QQ detrended (normalidade quando os pontos esto distribudos de forma
aleatria em torno da reta).
Para fazermos a analise da varivel X segundo os fatores da varivel Y devemos inserir X em
Dependent list e Y em Factor List.

Para analisarmos variveis quantitativas em funo de uma qualitativa, por exemplo, queremos
saber se o sexo (sex) pode explicar variaes no tempo de estudo (educ). Podemos fazer esta verificao
usando:
I.

Analyze >> Explore

II.

Analyze >> Reports >> Report Summary in Row

III.

Analyze >> Compare Means >> Means

IV.

Analyze >> Compare Means >> Independet Sample T Test

V.

Graphs >> Boxplot

Para aplicarmos o test t-Student devemos verificar se a varivel testada atendem aos pressupostos
de normalidade e homocedasticidade, este ltimo pode ser verificado pelo teste Levene cuja hiptese nula
diz no existir diferena entre as varincias. O teste t-student tem como hiptese nula a no existncia de
diferena entre a mdia da varivel por grupo (fator). Para os dois testes temos como regra de deciso se
p-valor < ento rejeitamos H0.
Cruzamento de Variveis pode ser feito atravs dos comandos:
Analyze >> Descriptive Statistics >> Crosstable
Ento selecionamos as variveis que iro compor as linhas e as colunas. Podemos acrescentar as
percentagens clicando no Cell Display.

Podemos ainda usar um dos comandos do Tables, por exemplo:


Analyze >> General Tables >> General Tables

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
Anlise de Correlao pode ser feita para responder como as variveis se relacionam. Podemos obter os
coeficientes de Correlao de Pearson e o Coeficiente de Correlao de Spearman (variveis cujas
distribuio no seja Normal).
Analyze >> Correlate >> Bivariate

Correlations

Number of
Children
Spearman's rho

Number of Children

Correlation Coefficient
Sig. (2-tailed)
N

Highest Year of School


Completed

Highest Year School


Completed, Father

Correlation Coefficient

Highest Year of
School Completed

Highest Year School


Completed, Father

1,000

-,262(**)

,000

-,297(**)
,000

1509

1507

1064
,450(**)

-,262(**)

1,000

Sig. (2-tailed)

,000

,000

1507

1510

1065

-,297(**)

,450(**)

1,000

Correlation Coefficient
Sig. (2-tailed)

,000

,000

1064

1065

1069

** Correlation is significant at the 0.01 level (2-tailed).

A hiptese nula testada de correlao nula (teste bicaudal).

Anlise de Regresso pode ser feita para modelar uma varivel em funo de outra (s).
Analyze >> Regression >> (selecionamos o tipo de modelo)

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
A seguir apresentamos a sada do comando Regresso Linear Em que a varivel dependente
educ e as variveis independentes so: sex, paeduc e maeduc.

Variables Entered/Removed(b)

Model
1

Variables Entered

Variables
Removed

Method

Highest Year
School Completed,
Mother,
Respondent's Sex,
Highest Year
School Completed,
Father(a)

. Enter

a All requested variables entered.


b Dependent Variable: Highest Year of School Completed

Model Summary(b)
R Square
Model
1

Adjusted R Square

R
,486(a)

,236

Coeficiente de determinao:
R2= 23,6%. Este modelo
explica 23,6% da variao de
educ.

Std. Error of the


Estimate

,234

2,448

a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father
b Dependent Variable: Highest Year of School Completed

ANOVA(b)

Com p-valor= 0,000


rejeitamos H0 e educ pode
ser modelado por uma reta
com os preditores
selecionados.

Model
Sum of Squares
1

df

Mean Square

Sig.
,000(a)

Regression
1796,560

598,853

Residual

5806,745

969

5,993

Total

7603,305

972

99,934

a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father
b Dependent Variable: Highest Year of School Completed

Coefficients(a)
Standardized
Coefficients

Unstandardized Coefficients
B
1

Std. Error

Sig.
t

Beta

(Constant)

9,902

,384

25,782

,000

Respondent's Sex

-,380

,160

-,067

-2,381

,017

Highest Year School


Completed, Father

,196

,026

,288

7,574

,000

Highest Year School


Completed, Mother

,189

,031

,231

6,085

,000

a Dependent Variable: Highest Year of School Completed

A equao do modelo proposto :

educ = 9,902 0,380sex + 0,196 paeduc + 0,189maeduc


julianabahiense@gmail.com

Todos os preditores so
estatisticamente
significantes.

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Residuals Statistics(a)
Minimum
Predicted Value

Maximum

Mean

Std. Deviation

9,14

17,22

13,54

1,360

973

-3,239

2,707

,000

1,000

973

,104

,379

,151

,041

973

9,11

17,20

13,54

1,359

973

Residual

-9,603

8,277

,000

2,444

973

Std. Residual

-3,923

3,381

,000

,998

973

Stud. Residual

-3,930

3,399

,000

1,001

973

Deleted Residual

-9,636

8,365

,000

2,455

973

Stud. Deleted Residual

-3,959

3,418

,000

1,002

973

Mahal. Distance

,744

22,354

2,997

2,499

973

Cook's Distance

,000

,045

,001

,003

973

,001

,023

,003

,003

973

Std. Predicted Value


Standard Error of Predicted
Value
Adjusted Predicted Value

Centered Leverage Value


a Dependent Variable: Highest Year of School Completed

Normal P-P Plot of Regression Standardized Residual

Dependent Variable: Highest Year of School Completed


1,0

Anlise
visula
dos
resduos para avaliar a
qualidade do ajuste.

Expected Cum Prob

0,8

Indica normalidade dos


dados educ.

0,6

0,4

0,2

0,0
0,0

0,2

0,4

0,6

0,8

1,0

Observed Cum Prob

A Anlise Fatorial tem como objetivo principal descrever a variabilidade de um conjunto de


variveis em termos de um nmero menor de variveis que esto relacionadas com o grupo original atravs
do modelo linear, sem perda de informao. O SPSS usa os comandos a seguir:
Analyze >> Data Reduction >> Factor

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Nesta caixa de dilogo,


podemos especificar
estatsticas descritivas e
coeficientes e correlao.

Selecionamos o mtodo
de extrao dos fatores.

Initial solution apresenta as


comunalidades, os valores
prprios e a percentagem
de varincia explicada.

Matriz de correlao: variveis em


escalas diferentes.
Matriz de covarincia: mltiplos
grupos, com diferentes varincias
para cada varivel.

Testes para validade da


aplicao da anlise fatorial.
.
Interpretao do teste KMO:
<0,50
0,50 0,60
0,60 0,70
0,70 0,80
0,80 0,90
0,90 1

Inaceitvel
M
Razovel
Mdia
Boa
Muito boa

A hiptese nula do teste de Esfericidade de Bartlett afirma no haver correlao entre as variveis
iniciais.
Na mesma caixa de dilogo podemos definir tambm a Rotao (Rotation), que aplicada para
transformar os coeficientes das componentes principais numa estrutura simplificada pelos mtodos:
Varimax: alguns pesos significativos e os outros prximos de zero
Quartimax: pesos elevados para um nmero reduzido de componentes e prximos a zero para as restantes.
Equamax: combinao do Varimax e Quartimax.
Direct Oblimin e Promax: mtodos no ortogonais, observa-se o pressuposto de independncia das
componentes.
Os mtodo de clculo dos escores so definidos em Scores. E em Options podemos escolher como
ser tratado o valor missing, por exemplo.

No SPSS temos alguns testes de hipteses, por exemplo, temos com testes paramtricos
disponveis o teste t e o ANOVA e como testes no paramtricos, o teste dos sinais, McNemar, Wilcoxon,
Mann-whitney, Kruskal-wallis, Aleatoriedade, Binomial e o Qui-quadrado.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
O teste t pode ser feito atravs dos comandos:
Analyze >> Compare Means >> Independent Samples T test

Os grupos da varivel definido em Define Groups.

Esses valores correspondem


aos cdigos usados na varivel,
neste caso, sex, 1=masculino e
2=feminino

A sada apresentada :

Group Statistics

Highest Year of
School
Completed

Respondent's
Sex
Male
Female

Std. Deviation

Std. Error Mean

633

Mean
13,23

3,143

,125

877

12,63

2,839

,096

% de possibilidade de observar
uma diferena de mdias desse
valor, se H0 for verdadeira.
Independent Samples Test
Levene's Test for Equality of
Variances

Highest Year of
School
Completed

Equal variances assumed


Equal variances not
assumed

F
11,226

Sig.

t-test for Equality of Means

3,887

1508

Sig. (2-tailed)
,000

Mean Difference
,602

Std. Error
Difference
,155

3,824

1276,454

,000

,602

,157

t
,001

df

Teste da igualdade de
varincias. H0 varincias iguais.

julianabahiense@gmail.com

95% Confidence Interval of


the Difference
Lower
,298

Upper
,906

,293

,911

Mdia de anos para as amostras


(mas. e fem.) difere de 0,602
anos.

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense
A ANOVA pode ser feita atravs dos comandos:
Analyze >> Compare Means >> One-Way ANOVA

Obter resumo dos


dados.
Obter testes de comparao
mltipla de Bonferroni.

Para os Testes No PAramtricos procedemos da seguinte maneira:


Analyze >> Nonparametric Tests

Temos, nesta ordem, os testes Qui-quadrado, Binomial, Aleatoriedade, Kolmogorov-Smirnov, testes


para duas amostras independentes, testes para duas amostras relacionadas, Kruskal-Wallis e Mediana (k
Independent Samples)

Para fazermos Anlise de Cluster, seguimos os seguintes comandos:


Analyze >> Classify >> Hierarchical Cluster

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS


Juliana-Bahiense

Para colocar as variveis numa mesma escala devemos padroniz-la atravs do mtodo de transformao
encontrado na caixa de dilogo
. Para dendogramas,

6. Bibliografia Consultada

CAZORLA, Irene M. Curso de Pacotes Estatsticos. UESC. Ilheus. Ago 2003.

FERREIRA, Armando M. SPSS Manual de Utilizao. Escola Superior Agrria de Castelo Branco. 1999.

PEREIRA, Alexandre. Guia Prtico de Utilizao do SPSS. Anlise de dados para Cincias Sociais e
Psicologia. 4 ed. Edies Silabo. Lisboa. Mar 2003.

SANTANA, Cora. LISBOA, Graa. Manual Bsico do SPSS para Windows. CPD/ UFBA.

SPSS Inc. Statistical Analysis Using SPSS. Chicago. 2001

Wikipedia. SPSS. Disponvel em: <http://pt.wikipedia.org/wiki/SPSS>.

julianabahiense@gmail.com

Você também pode gostar