Você está na página 1de 19

Apostila: Anlise Estatstica utilizando SPSS

Juliana-Bahiense

Anlise Estatstica Utilizando o SPSS


Guia prtico de comandos

Juliana-Bahiense de Sousa Guimares.


Salvador/BA

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Sumrio

1. Introduo.....................................................................................................................................3
2. Primeiro Passo ............................................................................................................................3
3. As Janelas ....................................................................................................................................4
4. Os Menus ......................................................................................................................................6
4.1 Data Editor..............................................................................................................................6
4.2 Output......................................................................................................................................9
5. Anlise de Dados......................................................................................................................10
6. Bibliografia Consultada ..............................................................................................................19

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

1. Introduo

O Statistical Package for Social Science for Windows (SPSS) um software para anlise estatstica
de dados, em um ambiente amigvel, utilizando-se de menus e janelas de dilogo, que permite realizar
clculos complexos e visualizar seus resultados de forma simples e autoexplicativas.
Segundo o site Wikipedia, SPSS um software aplicativo (programa de computador) do tipo
cientfico, acrnimo de Statistical Package for the Social Sciences - pacote estatstico para as cincias
sociais. Pacote este de apoio a tomada de deciso que inclue: aplicao analtica, Data Mining, Text
Mining e estatstica que transformam os dados em informaes importantes que proporcionam reduzir
custos e aumentar a lucratividade. Um dos usos importantes deste software para realizar pesquisa de
mercado.
A primeira verso data de 1968 e, a mais recente a SPSS for Windows 16 (2007).
Para exemplificar utilizaremos os bancos de dados 1991 U.S. General Social Survey.sav e
anorectic.sav que se encontra no diretrio SPSS.
Para um melhor aproveitamento das rotinas apresentadas nesta apostila faz-se necessrio um
prvio conhecimento de tcnicas estatsticas de explorao de dados.

2. Primeiro Passo

Assim que voc inicia o programa aparece a seguinte tela:

Nela voc poder abrir um arquivo j existente (banco de dados ou sintaxe ou output), ir ao tutorial,
criar um novo banco de dados.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

3. As Janelas

No SPSS existem 7 tipos de janelas, so elas:


 SPSS Data Editor: permite a entrada, modificao e visualizao dos dados.
 Output SPSS Viewer: a janela de resultados, tabelas e grficos.
 Syntax SPSS Syntax Editor: janela onde guardamos os comandos do SPSS para reutilizarmos
em outra ocasio.
 SPSS Pivot Table Object: permite editar e modificar tabelas.
 SPSS Chart Object: permite editar e modificar grficos.
 Script Editor: cria e modifica scripts para automatizar tarefas.
 Text Output Editor: altera texto no visveis no Pivot Table Editor.

Porm, ele trabalha basicamente com as trs primeiras, que estaro expostas nesta apostila.
O aspecto inicial do editor apresentado nas figuras a seguir.
Na Figura 1 temos o Data View (Data Editor), em que as colunas so as variveis e as linhas os
casos (ou indivduos). As clulas podem conter valores numricos ou alfanumricos, mas no podem conter
frmulas.

Figura 1 - Tela dos dados banco anorectic.sav

Na Figura 2 temos o Variable View (Data Editor), local onde definimos as caractersticas das
variveis:
Name: nome da varivel, mximo de 64 caracteres, letras maisculas e minsculas so iguais.
Type: tipo da varivel (numrica, data, monetria, alfanumrica (string))
Width: comprimento da varivel, isto , a quantidade de dgitos que possui.
Decimals: nmero de casas decimais que a varivel possui.
Label: descritivo da varivel
julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
Values: rtulos dos valores das variveis (pe, 1=feminino e 2=masculino).
Missing: para indicar a codificao dos valores perdidos, aqueles que no sero considerados para
efeito de clculo estatstico.
Columns: indica o numero de caracteres que formam a coluna, ou seja, a largura da coluna.
Align: alinhamento dos dados.
Measure: seleciona a escala de medida da varivel (intervalar/razo, ordinal ou nominal).

Figura 2 - Tela das variveis banco anorectic.sav

Na Figura 3 temos o View (Output), que mostra todas as sadas solicitadas, como grficos, tabelas,
e resultados estatsticos. Na Figura 4 temos a tela de sintaxe do comando Frequencies do tpico
Descriptive Statistics.

Figura 3 - Tela de sada Output banco anorectic.sav

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Figura 4 - Tela de sintaxe Syntax banco anorectic.sav

4. Os Menus

4.1 Data Editor

File tem as funes de criar, abrir, ler, imprimir, salvar, mostra os arquivos recentemente
utilizados, para o processo, sai do programa.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Edit gerencia comandos de edio dos arquivos, modificar, copiar, colar, cortar, apagar, localizar
e manipula o formato de sada (default).

View formato das telas: barras de ferramentas, fontes, status e linha de grade e rtulos de
variveis.

Data inserir varivel ou dados, define formato dos dados, ordena o arquivo segundo valores de
uma varivel, transpe variveis (em um novo arquivo transpose), agrupa arquivos (merge files), cria novo
arquivo com valores agregados das variveis originais, divide um arquivo segundo uma varivel qualitativa,
seleciona casos em que cumprem uma certa condio, pondera os valores da varivel.

Transform para alterar variavel selecionada, calcular novas variveis a partir das existentes, gera
amostra aleatria, cria nova varivel atravs de uma existente, recodifica variveis, transforma varivel
qualitativa em categrica, atribui postos aos valores de uma varivel (segundo outra), cria varivel Lag de
uma srie temporal, substitui valores perdidos, roda as transformaess pendentes.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Analyze Funes estatsticas como Anlise Descritiva, Tabelas de Freqncias, Anlise de


Varincia, Correlao, Regresso, Anlise Fatorial, Anlise de confiabilidade, Anlise de respostas
mltiplas, Testes No-paramtricos, Anlise de Sobrevivncia, etc.

Graphs Criar grficos de barras, setorial, Boxplot, linha, histograma, etc.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
Utilities para obteno de informaes acerca das variveis, alterar menus, scripts...

Window comutar entre as vrias janelas do SPSS que esto abertas.

Help Tpicos de ajuda, tutorial, Home page do SPSS.

4.2 Output

A barra de menus do Output similar a da janela Data Editor, acrescido dos itens Insert e Format

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

5. Anlise de Dados

No SPSS podemos criar um banco novo no prprio programa ou importar de um outro software, tais
com Excel, Acess, DBase.
Aps carregar o banco de dados o SPSS est pronto para ser explorado.
Iniciaremos com procedimentos mais simples de estatstica descritiva.
Para esta anlise utilizaremos o banco de dados 1991 U.S. General Social Survey.sav

Tabela de Distribuio de Freqncia


Para gerar a tabela de freqncia seguimos os seguintes comandos na barra de menu nas janelas Data
Editor ou Output:
Analyze >> Descriptive Statistics >> Frequecies

Ou, podemos utilizar os comandos diretamente da janela Syntax, como segue:


FREQUENCIES
VARIABLES=sex
/ORDER= ANALYSIS .

Para este exemplo selecionamos a varivel sex (sexo dos respondentes), obtendo a seguinte
sada:
Respondent's Sex

Cumulative
Frequency Percent Valid Percent Percent
Valid Male 636 41,9 41,9 41,9
Female 881 58,1 58,1 100,0
Total 1517 100,0 100,0

Podemos formatar os dados da tabela, como nmero de casas decimais, incluir %, fonte, etc. Para
isto, necessrio, ainda na janela Output, darmos duplo clique com o boto esquerdo do mouse na tabela,
para que se abra a ilha de edio, selecionamos os dados que queremos formatar e damos um clique com
o boto direito para que se abra a lista de opes do menu.
Tambm possvel solicitar a tabela de freqncia de diversas variveis ao mesmo tempo,
bastando seleciona-las na janela de dilogo, ou acrescent-las nos comandos do Syntax:

FREQUENCIES
VARIABLES=sex sibs
/ORDER= ANALYSIS .

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Ainda neste item, podemos solicitar, atravs do boto Statistics e Charts algumas estatsticas
resumo e grficos para representar as variveis.

Quando necessitamos descrever variveis quantitativas atravs de estatsticas gerais podemos


utilizar o comando:
Analyze >> Descriptive Statistics >> Descriptives

Ou mesmo os comandos em:


Analyze >> Descriptive Statistics >> Explore

Neste item do menu Analyze podemos obter alm de parmetros estatsticos, grficos boxplot e
ramo-e-folha e testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilk (em que a hiptese nula, H0, nos
diz que a varivel estudada segue distribuio Normal, versus a hiptese alternativa, Ha, a varivel no

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
segue uma distribuio Normal, cuja regra de deciso se p-valor < ento rejeitamos H0) e a analise
visual utilizando os grfico QQ e QQ detrended (normalidade quando os pontos esto distribudos de forma
aleatria em torno da reta).
Para fazermos a analise da varivel X segundo os fatores da varivel Y devemos inserir X em
Dependent list e Y em Factor List.

Para analisarmos variveis quantitativas em funo de uma qualitativa, por exemplo, queremos
saber se o sexo (sex) pode explicar variaes no tempo de estudo (educ). Podemos fazer esta verificao
usando:
I. Analyze >> Explore
II. Analyze >> Reports >> Report Summary in Row
III. Analyze >> Compare Means >> Means
IV. Analyze >> Compare Means >> Independet Sample T Test
V. Graphs >> Boxplot

Para aplicarmos o test t-Student devemos verificar se a varivel testada atendem aos pressupostos
de normalidade e homocedasticidade, este ltimo pode ser verificado pelo teste Levene cuja hiptese nula
diz no existir diferena entre as varincias. O teste t-student tem como hiptese nula a no existncia de
diferena entre a mdia da varivel por grupo (fator). Para os dois testes temos como regra de deciso se
p-valor < ento rejeitamos H0.

Cruzamento de Variveis pode ser feito atravs dos comandos:


Analyze >> Descriptive Statistics >> Crosstable
Ento selecionamos as variveis que iro compor as linhas e as colunas. Podemos acrescentar as
percentagens clicando no Cell Display.

Podemos ainda usar um dos comandos do Tables, por exemplo:


Analyze >> General Tables >> General Tables

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
Anlise de Correlao pode ser feita para responder como as variveis se relacionam. Podemos obter os
coeficientes de Correlao de Pearson e o Coeficiente de Correlao de Spearman (variveis cujas
distribuio no seja Normal).
Analyze >> Correlate >> Bivariate

Correlations

Number of Highest Year of Highest Year School


Children School Completed Completed, Father
Spearman's rho Number of Children Correlation Coefficient
1,000 -,262(**) -,297(**)
Sig. (2-tailed) . ,000 ,000
N 1509 1507 1064
Highest Year of School Correlation Coefficient
-,262(**) 1,000 ,450(**)
Completed
Sig. (2-tailed) ,000 . ,000
N 1507 1510 1065
Highest Year School Correlation Coefficient
Completed, Father -,297(**) ,450(**) 1,000
Sig. (2-tailed) ,000 ,000 .
N 1064 1065 1069
** Correlation is significant at the 0.01 level (2-tailed).

A hiptese nula testada de correlao nula (teste bicaudal).

Anlise de Regresso pode ser feita para modelar uma varivel em funo de outra (s).
Analyze >> Regression >> (selecionamos o tipo de modelo)

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
A seguir apresentamos a sada do comando Regresso Linear Em que a varivel dependente
educ e as variveis independentes so: sex, paeduc e maeduc.

Variables Entered/Removed(b)

Variables
Model Variables Entered Removed Method
1

Highest Year
School Completed,
Mother,
Respondent's Sex, . Enter
Highest Year
School Completed,
Father(a)

a All requested variables entered.


b Dependent Variable: Highest Year of School Completed

Model Summary(b)
Coeficiente de determinao:
R Square Adjusted R Square R2= 23,6%. Este modelo
Std. Error of the
Model R Estimate
explica 23,6% da variao de
1 ,486(a) ,236 ,234 2,448
educ.
a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father
b Dependent Variable: Highest Year of School Completed

ANOVA(b)

Model Com p-valor= 0,000


Sum of Squares df Mean Square F Sig. rejeitamos H0 e educ pode
1 Regression ,000(a) ser modelado por uma reta
1796,560 3 598,853 99,934
com os preditores
Residual 5806,745 969 5,993 selecionados.
Total 7603,305 972
a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father
b Dependent Variable: Highest Year of School Completed

Coefficients(a)

Standardized Sig.
Unstandardized Coefficients
Coefficients t
B Std. Error Beta
1 (Constant) 9,902 ,384 25,782 ,000
Respondent's Sex -,380 ,160 -,067 -2,381 ,017
Highest Year School
Completed, Father ,196 ,026 ,288 7,574 ,000

Highest Year School


Completed, Mother ,189 ,031 ,231 6,085 ,000

a Dependent Variable: Highest Year of School Completed

A equao do modelo proposto : Todos os preditores so


estatisticamente
educ = 9,902 0,380sex + 0,196 paeduc + 0,189maeduc significantes.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Residuals Statistics(a)

Minimum Maximum Mean Std. Deviation N


Predicted Value 9,14 17,22 13,54 1,360 973
Std. Predicted Value -3,239 2,707 ,000 1,000 973
Standard Error of Predicted
Value ,104 ,379 ,151 ,041 973

Adjusted Predicted Value


9,11 17,20 13,54 1,359 973

Residual -9,603 8,277 ,000 2,444 973


Std. Residual -3,923 3,381 ,000 ,998 973
Stud. Residual -3,930 3,399 ,000 1,001 973
Deleted Residual -9,636 8,365 ,000 2,455 973
Stud. Deleted Residual -3,959 3,418 ,000 1,002 973
Mahal. Distance ,744 22,354 2,997 2,499 973
Cook's Distance ,000 ,045 ,001 ,003 973
Centered Leverage Value
,001 ,023 ,003 ,003 973

a Dependent Variable: Highest Year of School Completed

Normal P-P Plot of Regression Standardized Residual

Dependent Variable: Highest Year of School Completed


1,0
Anlise visula dos
resduos para avaliar a
0,8
qualidade do ajuste.
Expected Cum Prob

0,6
Indica normalidade dos
dados educ.
0,4

0,2

0,0
0,0 0,2 0,4 0,6 0,8 1,0

Observed Cum Prob

A Anlise Fatorial tem como objetivo principal descrever a variabilidade de um conjunto de


variveis em termos de um nmero menor de variveis que esto relacionadas com o grupo original atravs
do modelo linear, sem perda de informao. O SPSS usa os comandos a seguir:
Analyze >> Data Reduction >> Factor

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Nesta caixa de dilogo, Selecionamos o mtodo


podemos especificar de extrao dos fatores.
estatsticas descritivas e
coeficientes e correlao.

Matriz de correlao: variveis em


escalas diferentes.
Matriz de covarincia: mltiplos
Initial solution apresenta as grupos, com diferentes varincias
comunalidades, os valores para cada varivel.
prprios e a percentagem
de varincia explicada.

Testes para validade da


aplicao da anlise fatorial.

.
Interpretao do teste KMO:
<0,50 Inaceitvel
0,50 0,60 M
0,60 0,70 Razovel
0,70 0,80 Mdia
0,80 0,90 Boa
0,90 1 Muito boa
A hiptese nula do teste de Esfericidade de Bartlett afirma no haver correlao entre as variveis
iniciais.
Na mesma caixa de dilogo podemos definir tambm a Rotao (Rotation), que aplicada para
transformar os coeficientes das componentes principais numa estrutura simplificada pelos mtodos:
Varimax: alguns pesos significativos e os outros prximos de zero
Quartimax: pesos elevados para um nmero reduzido de componentes e prximos a zero para as restantes.
Equamax: combinao do Varimax e Quartimax.
Direct Oblimin e Promax: mtodos no ortogonais, observa-se o pressuposto de independncia das
componentes.
Os mtodo de clculo dos escores so definidos em Scores. E em Options podemos escolher como
ser tratado o valor missing, por exemplo.

No SPSS temos alguns testes de hipteses, por exemplo, temos com testes paramtricos
disponveis o teste t e o ANOVA e como testes no paramtricos, o teste dos sinais, McNemar, Wilcoxon,
Mann-whitney, Kruskal-wallis, Aleatoriedade, Binomial e o Qui-quadrado.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
O teste t pode ser feito atravs dos comandos:
Analyze >> Compare Means >> Independent Samples T test

Os grupos da varivel definido em Define Groups.

Esses valores correspondem


aos cdigos usados na varivel,
neste caso, sex, 1=masculino e
2=feminino

A sada apresentada :

Group Statistics

Respondent's N Mean Std. Deviation Std. Error Mean


Highest Year of Sex
Male 633 13,23 3,143 ,125
School
Female 877 12,63 2,839 ,096
Completed

% de possibilidade de observar
uma diferena de mdias desse
valor, se H0 for verdadeira.
Independent Samples Test

Levene's Test for Equality of


Variances t-test for Equality of Means
95% Confidence Interval of
Std. Error the Difference
F Sig. t df Sig. (2-tailed) Mean Difference Difference Lower Upper
Highest Year of Equal variances assumed 11,226 ,001 3,887 1508 ,000 ,602 ,155 ,298 ,906
School Equal variances not
Completed 3,824 1276,454 ,000 ,602 ,157 ,293 ,911
assumed

Teste da igualdade de Mdia de anos para as amostras


varincias. H0 varincias iguais. (mas. e fem.) difere de 0,602
anos.

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense
A ANOVA pode ser feita atravs dos comandos:
Analyze >> Compare Means >> One-Way ANOVA

Obter resumo dos


dados.

Obter testes de comparao


mltipla de Bonferroni.

Para os Testes No PAramtricos procedemos da seguinte maneira:


Analyze >> Nonparametric Tests

Temos, nesta ordem, os testes Qui-quadrado, Binomial, Aleatoriedade, Kolmogorov-Smirnov, testes


para duas amostras independentes, testes para duas amostras relacionadas, Kruskal-Wallis e Mediana (k
Independent Samples)

Para fazermos Anlise de Cluster, seguimos os seguintes comandos:


Analyze >> Classify >> Hierarchical Cluster

julianabahiense@gmail.com
Apostila: Anlise Estatstica utilizando SPSS
Juliana-Bahiense

Para colocar as variveis numa mesma escala devemos padroniz-la atravs do mtodo de transformao
encontrado na caixa de dilogo . Para dendogramas,

6. Bibliografia Consultada

CAZORLA, Irene M. Curso de Pacotes Estatsticos. UESC. Ilheus. Ago 2003.

FERREIRA, Armando M. SPSS Manual de Utilizao. Escola Superior Agrria de Castelo Branco. 1999.

PEREIRA, Alexandre. Guia Prtico de Utilizao do SPSS. Anlise de dados para Cincias Sociais e
Psicologia. 4 ed. Edies Silabo. Lisboa. Mar 2003.

SANTANA, Cora. LISBOA, Graa. Manual Bsico do SPSS para Windows. CPD/ UFBA.

SPSS Inc. Statistical Analysis Using SPSS. Chicago. 2001

Wikipedia. SPSS. Disponvel em: <http://pt.wikipedia.org/wiki/SPSS>.

julianabahiense@gmail.com

Você também pode gostar