Você está na página 1de 19

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Anlise Estatstica Utilizando o SPSS Guia prtico de comandos

Juliana Bahiense de Sousa Guimares. Salvador/BA

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Sumrio

1. Introduo.....................................................................................................................................3 2. Primeiro Passo ............................................................................................................................3 3. As Janelas ....................................................................................................................................4 4. Os Menus ......................................................................................................................................6 4.1 Data Editor..............................................................................................................................6 4.2 Output......................................................................................................................................9 5. Anlise de Dados......................................................................................................................10 6. Bibliografia Consultada ..............................................................................................................19

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

1. Introduo
O Statistical Package for Social Science for Windows (SPSS) um software para anlise estatstica de dados, em um ambiente amigvel, utilizando-se de menus e janelas de dilogo, que permite realizar clculos complexos e visualizar seus resultados de forma simples e autoexplicativas. Segundo o site Wikipedia, SPSS um software aplicativo (programa de computador) do tipo cientfico, acrnimo de Statistical Package for the Social Sciences - pacote estatstico para as cincias sociais. Pacote este de apoio a tomada de deciso que inclue: aplicao analtica, Data Mining, Text Mining e estatstica que transformam os dados em informaes importantes que proporcionam reduzir custos e aumentar a lucratividade. Um dos usos importantes deste software para realizar pesquisa de mercado. A primeira verso data de 1968 e, a mais recente a SPSS for Windows 16 (2007). Para exemplificar utilizaremos os bancos de dados 1991 U.S. General Social Survey.sav anorectic.sav que se encontra no diretrio SPSS. e

Para um melhor aproveitamento das rotinas apresentadas nesta apostila faz-se necessrio um prvio conhecimento de tcnicas estatsticas de explorao de dados.

2. Primeiro Passo
Assim que voc inicia o programa aparece a seguinte tela:

Nela voc poder abrir um arquivo j existente (banco de dados ou sintaxe ou output), ir ao tutorial, criar um novo banco de dados.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

3. As Janelas
No SPSS existem 7 tipos de janelas, so elas: SPSS Data Editor: permite a entrada, modificao e visualizao dos dados. Output SPSS Viewer: a janela de resultados, tabelas e grficos. Syntax SPSS Syntax Editor: janela onde guardamos os comandos do SPSS para reutilizarmos em outra ocasio. SPSS Pivot Table Object: permite editar e modificar tabelas. SPSS Chart Object: permite editar e modificar grficos. Script Editor: cria e modifica scripts para automatizar tarefas. Text Output Editor: altera texto no visveis no Pivot Table Editor.

Porm, ele trabalha basicamente com as trs primeiras, que estaro expostas nesta apostila. O aspecto inicial do editor apresentado nas figuras a seguir. Na Figura 1 temos o Data View (Data Editor), em que as colunas so as variveis e as linhas os casos (ou indivduos). As clulas podem conter valores numricos ou alfanumricos, mas no podem conter frmulas.

Figura 1 - Tela dos dados banco anorectic.sav

Na Figura 2 temos o Variable View (Data Editor), local onde definimos as caractersticas das variveis: Name: nome da varivel, mximo de 64 caracteres, letras maisculas e minsculas so iguais. Type: tipo da varivel (numrica, data, monetria, alfanumrica (string)) Width: comprimento da varivel, isto , a quantidade de dgitos que possui. Decimals: nmero de casas decimais que a varivel possui. Label: descritivo da varivel

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


Values: rtulos dos valores das variveis (pe, 1=feminino e 2=masculino). Missing: para indicar a codificao dos valores perdidos, aqueles que no sero considerados para efeito de clculo estatstico. Columns: indica o numero de caracteres que formam a coluna, ou seja, a largura da coluna. Align: alinhamento dos dados. Measure: seleciona a escala de medida da varivel (intervalar/razo, ordinal ou nominal).

Figura 2 - Tela das variveis banco anorectic.sav

Na Figura 3 temos o View (Output), que mostra todas as sadas solicitadas, como grficos, tabelas, e resultados estatsticos. Na Figura 4 temos a tela de sintaxe do comando Frequencies do tpico Descriptive Statistics.

Figura 3 - Tela de sada Output banco anorectic.sav

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Figura 4 - Tela de sintaxe Syntax banco anorectic.sav

4. Os Menus
4.1 Data Editor

File tem as funes de criar, abrir, ler, imprimir, salvar, mostra os arquivos recentemente utilizados, para o processo, sai do programa.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Edit gerencia comandos de edio dos arquivos, modificar, copiar, colar, cortar, apagar, localizar e manipula o formato de sada (default).

View formato das telas: barras de ferramentas, fontes, status e linha de grade e rtulos de variveis.

Data inserir varivel ou dados, define formato dos dados, ordena o arquivo segundo valores de uma varivel, transpe variveis (em um novo arquivo transpose), agrupa arquivos (merge files), cria novo arquivo com valores agregados das variveis originais, divide um arquivo segundo uma varivel qualitativa, seleciona casos em que cumprem uma certa condio, pondera os valores da varivel.

Transform para alterar variavel selecionada, calcular novas variveis a partir das existentes, gera amostra aleatria, cria nova varivel atravs de uma existente, recodifica variveis, transforma varivel qualitativa em categrica, atribui postos aos valores de uma varivel (segundo outra), cria varivel Lag de uma srie temporal, substitui valores perdidos, roda as transformaess pendentes.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Analyze Funes estatsticas como Anlise Descritiva, Tabelas de Freqncias, Anlise de Varincia, Correlao, Regresso, Anlise Fatorial, Anlise de confiabilidade, Anlise de respostas mltiplas, Testes No-paramtricos, Anlise de Sobrevivncia, etc.

Graphs Criar grficos de barras, setorial, Boxplot, linha, histograma, etc.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


Utilities para obteno de informaes acerca das variveis, alterar menus, scripts...

Window comutar entre as vrias janelas do SPSS que esto abertas.

Help Tpicos de ajuda, tutorial, Home page do SPSS.

4.2 Output

A barra de menus do Output similar a da janela Data Editor, acrescido dos itens Insert e Format

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

5. Anlise de Dados
No SPSS podemos criar um banco novo no prprio programa ou importar de um outro software, tais com Excel, Acess, DBase. Aps carregar o banco de dados o SPSS est pronto para ser explorado. Iniciaremos com procedimentos mais simples de estatstica descritiva. Para esta anlise utilizaremos o banco de dados 1991 U.S. General Social Survey.sav

Tabela de Distribuio de Freqncia Para gerar a tabela de freqncia seguimos os seguintes comandos na barra de menu nas janelas Data Editor ou Output: Analyze >> Descriptive Statistics >> Frequecies

Ou, podemos utilizar os comandos diretamente da janela Syntax, como segue: FREQUENCIES VARIABLES=sex /ORDER= ANALYSIS .

Para este exemplo selecionamos a varivel sex (sexo dos respondentes), obtendo a seguinte sada:
Respondent's Sex

Frequency Valid Male Female Total 636 881 1517

Percent 41,9 58,1 100,0

Valid Percent 41,9 58,1 100,0

Cumulative Percent 41,9 100,0

Podemos formatar os dados da tabela, como nmero de casas decimais, incluir %, fonte, etc. Para isto, necessrio, ainda na janela Output, darmos duplo clique com o boto esquerdo do mouse na tabela, para que se abra a ilha de edio, selecionamos os dados que queremos formatar e damos um clique com o boto direito para que se abra a lista de opes do menu. Tambm possvel solicitar a tabela de freqncia de diversas variveis ao mesmo tempo, bastando seleciona-las na janela de dilogo, ou acrescent-las nos comandos do Syntax: FREQUENCIES VARIABLES=sex sibs /ORDER= ANALYSIS .

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Ainda neste item, podemos solicitar, atravs do boto Statistics e Charts algumas estatsticas resumo e grficos para representar as variveis.

Quando necessitamos descrever variveis quantitativas atravs de estatsticas gerais podemos utilizar o comando: Analyze >> Descriptive Statistics >> Descriptives

Ou mesmo os comandos em: Analyze >> Descriptive Statistics >> Explore

Neste item do menu Analyze podemos obter alm de parmetros estatsticos, grficos boxplot e ramo-e-folha e testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilk (em que a hiptese nula, H0, nos diz que a varivel estudada segue distribuio Normal, versus a hiptese alternativa, Ha, a varivel no

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


segue uma distribuio Normal, cuja regra de deciso se p-valor < ento rejeitamos H0) e a analise visual utilizando os grfico QQ e QQ detrended (normalidade quando os pontos esto distribudos de forma aleatria em torno da reta). Para fazermos a analise da varivel X segundo os fatores da varivel Y devemos inserir X em Dependent list e Y em Factor List.

Para analisarmos variveis quantitativas em funo de uma qualitativa, por exemplo, queremos saber se o sexo (sex) pode explicar variaes no tempo de estudo (educ). Podemos fazer esta verificao usando: I. II. III. IV. V. Analyze >> Explore Analyze >> Reports >> Report Summary in Row Analyze >> Compare Means >> Means Analyze >> Compare Means >> Independet Sample T Test Graphs >> Boxplot

Para aplicarmos o test t-Student devemos verificar se a varivel testada atendem aos pressupostos de normalidade e homocedasticidade, este ltimo pode ser verificado pelo teste Levene cuja hiptese nula diz no existir diferena entre as varincias. O teste t-student tem como hiptese nula a no existncia de diferena entre a mdia da varivel por grupo (fator). Para os dois testes temos como regra de deciso se p-valor < ento rejeitamos H0. Cruzamento de Variveis pode ser feito atravs dos comandos: Analyze >> Descriptive Statistics >> Crosstable Ento selecionamos as variveis que iro compor as linhas e as colunas. Podemos acrescentar as percentagens clicando no Cell Display.

Podemos ainda usar um dos comandos do Tables, por exemplo: Analyze >> General Tables >> General Tables

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


Anlise de Correlao pode ser feita para responder como as variveis se relacionam. Podemos obter os coeficientes de Correlao de Pearson e o Coeficiente de Correlao de Spearman (variveis cujas distribuio no seja Normal). Analyze >> Correlate >> Bivariate

Correlations

Number of Children Spearman's rho Number of Children Correlation Coefficient Sig. (2-tailed) N Highest Year of School Completed Correlation Coefficient Sig. (2-tailed) N Highest Year School Completed, Father Correlation Coefficient Sig. (2-tailed) N ** Correlation is significant at the 0.01 level (2-tailed). 1,000 . 1509 -,262(**) ,000 1507 -,297(**) ,000 1064

Highest Year of School Completed -,262(**) ,000 1507 1,000 . 1510 ,450(**) ,000 1065

Highest Year School Completed, Father -,297(**) ,000 1064 ,450(**) ,000 1065 1,000 . 1069

A hiptese nula testada de correlao nula (teste bicaudal).

Anlise de Regresso pode ser feita para modelar uma varivel em funo de outra (s). Analyze >> Regression >> (selecionamos o tipo de modelo)

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


A seguir apresentamos a sada do comando Regresso Linear Em que a varivel dependente educ e as variveis independentes so: sex, paeduc e maeduc.

Variables Entered/Removed(b)

Model 1

Variables Entered

Variables Removed

Method

Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father(a)

. Enter

a All requested variables entered. b Dependent Variable: Highest Year of School Completed

Model Summary(b) R Square Model 1 R ,486(a) ,236 ,234 Adjusted R Square

Std. Error of the Estimate 2,448

Coeficiente de determinao: R2= 23,6%. Este modelo explica 23,6% da variao de educ.

a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father b Dependent Variable: Highest Year of School Completed

ANOVA(b) Model Sum of Squares 1 Regression 1796,560 Residual Total 5806,745 7603,305 3 969 972 598,853 5,993 99,934 df Mean Square F Sig. ,000(a)

Com p-valor= 0,000 rejeitamos H0 e educ pode ser modelado por uma reta com os preditores selecionados.

a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father b Dependent Variable: Highest Year of School Completed

Coefficients(a) Unstandardized Coefficients B 1 (Constant) Respondent's Sex Highest Year School Completed, Father Highest Year School Completed, Mother 9,902 -,380 ,196 ,189 Std. Error ,384 ,160 ,026 ,031 -,067 ,288 ,231 Standardized Coefficients Beta 25,782 -2,381 7,574 6,085 ,000 ,017 ,000 ,000 Sig. t

a Dependent Variable: Highest Year of School Completed

A equao do modelo proposto :

educ = 9,902 0,380sex + 0,196 paeduc + 0,189maeduc


julianabahiense@gmail.com

Todos os preditores so estatisticamente significantes.

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Residuals Statistics(a) Minimum Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value 9,11 Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value ,001 a Dependent Variable: Highest Year of School Completed ,023 ,003 ,003 973 -9,603 -3,923 -3,930 -9,636 -3,959 ,744 ,000 17,20 8,277 3,381 3,399 8,365 3,418 22,354 ,045 13,54 ,000 ,000 ,000 ,000 ,000 2,997 ,001 1,359 2,444 ,998 1,001 2,455 1,002 2,499 ,003 973 973 973 973 973 973 973 973 9,14 -3,239 ,104 Maximum 17,22 2,707 ,379 Mean 13,54 ,000 ,151 Std. Deviation 1,360 1,000 ,041 N 973 973 973

Normal P-P Plot of Regression Standardized Residual

Dependent Variable: Highest Year of School Completed


1,0

0,8

Expected Cum Prob

Anlise visula dos resduos para avaliar a qualidade do ajuste. Indica normalidade dos dados educ.

0,6

0,4

0,2

0,0 0,0 0,2 0,4 0,6 0,8 1,0

Observed Cum Prob

A Anlise Fatorial tem como objetivo principal descrever a variabilidade de um conjunto de variveis em termos de um nmero menor de variveis que esto relacionadas com o grupo original atravs do modelo linear, sem perda de informao. O SPSS usa os comandos a seguir: Analyze >> Data Reduction >> Factor

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Nesta caixa de dilogo, podemos especificar estatsticas descritivas e coeficientes e correlao.

Selecionamos o mtodo de extrao dos fatores.

Initial solution apresenta as comunalidades, os valores prprios e a percentagem de varincia explicada.

Matriz de correlao: variveis em escalas diferentes. Matriz de covarincia: mltiplos grupos, com diferentes varincias para cada varivel.

Testes para validade da aplicao da anlise fatorial. . Interpretao do teste KMO: <0,50 0,50 0,60 0,60 0,70 0,70 0,80 0,80 0,90 0,90 1 iniciais. Na mesma caixa de dilogo podemos definir tambm a Rotao (Rotation), que aplicada para transformar os coeficientes das componentes principais numa estrutura simplificada pelos mtodos: Varimax: alguns pesos significativos e os outros prximos de zero Quartimax: pesos elevados para um nmero reduzido de componentes e prximos a zero para as restantes. Equamax: combinao do Varimax e Quartimax. Direct Oblimin e Promax: mtodos no ortogonais, observa-se o pressuposto de independncia das componentes. Os mtodo de clculo dos escores so definidos em Scores. E em Options podemos escolher como ser tratado o valor missing, por exemplo. Inaceitvel M Razovel Mdia Boa Muito boa

A hiptese nula do teste de Esfericidade de Bartlett afirma no haver correlao entre as variveis

No SPSS temos alguns testes de hipteses, por exemplo, temos com testes paramtricos disponveis o teste t e o ANOVA e como testes no paramtricos, o teste dos sinais, McNemar, Wilcoxon, Mann-whitney, Kruskal-wallis, Aleatoriedade, Binomial e o Qui-quadrado.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


O teste t pode ser feito atravs dos comandos: Analyze >> Compare Means >> Independent Samples T test

Os grupos da varivel definido em Define Groups.

Esses valores correspondem aos cdigos usados na varivel, neste caso, sex, 1=masculino e 2=feminino

A sada apresentada :

Group Statistics Respondent's Sex Male Female N 633 877 Mean 13,23 12,63 Std. Deviation 3,143 2,839 Std. Error Mean ,125 ,096

Highest Year of School Completed

% de possibilidade de observar uma diferena de mdias desse valor, se H0 for verdadeira.


Independent Samples Test Levene's Test for Equality of Variances

t-test for Equality of Means Std. Error Difference ,155 ,157 95% Confidence Interval of the Difference Lower ,298 ,293 Upper ,906 ,911

Highest Year of School Completed

Equal variances assumed Equal variances not assumed

F 11,226

Sig. ,001

t 3,887 3,824

df 1508 1276,454

Sig. (2-tailed) ,000 ,000

Mean Difference ,602 ,602

Teste da igualdade de varincias. H0 varincias iguais.

Mdia de anos para as amostras (mas. e fem.) difere de 0,602 anos.

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense


A ANOVA pode ser feita atravs dos comandos: Analyze >> Compare Means >> One-Way ANOVA

Obter resumo dos dados. Obter testes de comparao mltipla de Bonferroni.

Para os Testes No PAramtricos procedemos da seguinte maneira: Analyze >> Nonparametric Tests

Temos, nesta ordem, os testes Qui-quadrado, Binomial, Aleatoriedade, Kolmogorov-Smirnov, testes para duas amostras independentes, testes para duas amostras relacionadas, Kruskal-Wallis e Mediana (k Independent Samples)

Para fazermos Anlise de Cluster, seguimos os seguintes comandos: Analyze >> Classify >> Hierarchical Cluster

julianabahiense@gmail.com

Apostila: Anlise Estatstica utilizando SPSS Juliana Bahiense

Para colocar as variveis numa mesma escala devemos padroniz-la atravs do mtodo de transformao encontrado na caixa de dilogo . Para dendogramas,

6. Bibliografia Consultada

CAZORLA, Irene M. Curso de Pacotes Estatsticos. UESC. Ilheus. Ago 2003.

FERREIRA, Armando M. SPSS Manual de Utilizao. Escola Superior Agrria de Castelo Branco. 1999.

PEREIRA, Alexandre. Guia Prtico de Utilizao do SPSS. Anlise de dados para Cincias Sociais e Psicologia. 4 ed. Edies Silabo. Lisboa. Mar 2003.

SANTANA, Cora. LISBOA, Graa. Manual Bsico do SPSS para Windows. CPD/ UFBA.

SPSS Inc. Statistical Analysis Using SPSS. Chicago. 2001

Wikipedia. SPSS. Disponvel em: <http://pt.wikipedia.org/wiki/SPSS>.

julianabahiense@gmail.com

Você também pode gostar