Escolar Documentos
Profissional Documentos
Cultura Documentos
julianabahiense@gmail.com
Sumrio
1. Introduo.....................................................................................................................................3 2. Primeiro Passo ............................................................................................................................3 3. As Janelas ....................................................................................................................................4 4. Os Menus ......................................................................................................................................6 4.1 Data Editor..............................................................................................................................6 4.2 Output......................................................................................................................................9 5. Anlise de Dados......................................................................................................................10 6. Bibliografia Consultada ..............................................................................................................19
julianabahiense@gmail.com
1. Introduo
O Statistical Package for Social Science for Windows (SPSS) um software para anlise estatstica de dados, em um ambiente amigvel, utilizando-se de menus e janelas de dilogo, que permite realizar clculos complexos e visualizar seus resultados de forma simples e autoexplicativas. Segundo o site Wikipedia, SPSS um software aplicativo (programa de computador) do tipo cientfico, acrnimo de Statistical Package for the Social Sciences - pacote estatstico para as cincias sociais. Pacote este de apoio a tomada de deciso que inclue: aplicao analtica, Data Mining, Text Mining e estatstica que transformam os dados em informaes importantes que proporcionam reduzir custos e aumentar a lucratividade. Um dos usos importantes deste software para realizar pesquisa de mercado. A primeira verso data de 1968 e, a mais recente a SPSS for Windows 16 (2007). Para exemplificar utilizaremos os bancos de dados 1991 U.S. General Social Survey.sav anorectic.sav que se encontra no diretrio SPSS. e
Para um melhor aproveitamento das rotinas apresentadas nesta apostila faz-se necessrio um prvio conhecimento de tcnicas estatsticas de explorao de dados.
2. Primeiro Passo
Assim que voc inicia o programa aparece a seguinte tela:
Nela voc poder abrir um arquivo j existente (banco de dados ou sintaxe ou output), ir ao tutorial, criar um novo banco de dados.
julianabahiense@gmail.com
3. As Janelas
No SPSS existem 7 tipos de janelas, so elas: SPSS Data Editor: permite a entrada, modificao e visualizao dos dados. Output SPSS Viewer: a janela de resultados, tabelas e grficos. Syntax SPSS Syntax Editor: janela onde guardamos os comandos do SPSS para reutilizarmos em outra ocasio. SPSS Pivot Table Object: permite editar e modificar tabelas. SPSS Chart Object: permite editar e modificar grficos. Script Editor: cria e modifica scripts para automatizar tarefas. Text Output Editor: altera texto no visveis no Pivot Table Editor.
Porm, ele trabalha basicamente com as trs primeiras, que estaro expostas nesta apostila. O aspecto inicial do editor apresentado nas figuras a seguir. Na Figura 1 temos o Data View (Data Editor), em que as colunas so as variveis e as linhas os casos (ou indivduos). As clulas podem conter valores numricos ou alfanumricos, mas no podem conter frmulas.
Na Figura 2 temos o Variable View (Data Editor), local onde definimos as caractersticas das variveis: Name: nome da varivel, mximo de 64 caracteres, letras maisculas e minsculas so iguais. Type: tipo da varivel (numrica, data, monetria, alfanumrica (string)) Width: comprimento da varivel, isto , a quantidade de dgitos que possui. Decimals: nmero de casas decimais que a varivel possui. Label: descritivo da varivel
julianabahiense@gmail.com
Na Figura 3 temos o View (Output), que mostra todas as sadas solicitadas, como grficos, tabelas, e resultados estatsticos. Na Figura 4 temos a tela de sintaxe do comando Frequencies do tpico Descriptive Statistics.
julianabahiense@gmail.com
4. Os Menus
4.1 Data Editor
File tem as funes de criar, abrir, ler, imprimir, salvar, mostra os arquivos recentemente utilizados, para o processo, sai do programa.
julianabahiense@gmail.com
Edit gerencia comandos de edio dos arquivos, modificar, copiar, colar, cortar, apagar, localizar e manipula o formato de sada (default).
View formato das telas: barras de ferramentas, fontes, status e linha de grade e rtulos de variveis.
Data inserir varivel ou dados, define formato dos dados, ordena o arquivo segundo valores de uma varivel, transpe variveis (em um novo arquivo transpose), agrupa arquivos (merge files), cria novo arquivo com valores agregados das variveis originais, divide um arquivo segundo uma varivel qualitativa, seleciona casos em que cumprem uma certa condio, pondera os valores da varivel.
Transform para alterar variavel selecionada, calcular novas variveis a partir das existentes, gera amostra aleatria, cria nova varivel atravs de uma existente, recodifica variveis, transforma varivel qualitativa em categrica, atribui postos aos valores de uma varivel (segundo outra), cria varivel Lag de uma srie temporal, substitui valores perdidos, roda as transformaess pendentes.
julianabahiense@gmail.com
Analyze Funes estatsticas como Anlise Descritiva, Tabelas de Freqncias, Anlise de Varincia, Correlao, Regresso, Anlise Fatorial, Anlise de confiabilidade, Anlise de respostas mltiplas, Testes No-paramtricos, Anlise de Sobrevivncia, etc.
julianabahiense@gmail.com
4.2 Output
A barra de menus do Output similar a da janela Data Editor, acrescido dos itens Insert e Format
julianabahiense@gmail.com
5. Anlise de Dados
No SPSS podemos criar um banco novo no prprio programa ou importar de um outro software, tais com Excel, Acess, DBase. Aps carregar o banco de dados o SPSS est pronto para ser explorado. Iniciaremos com procedimentos mais simples de estatstica descritiva. Para esta anlise utilizaremos o banco de dados 1991 U.S. General Social Survey.sav
Tabela de Distribuio de Freqncia Para gerar a tabela de freqncia seguimos os seguintes comandos na barra de menu nas janelas Data Editor ou Output: Analyze >> Descriptive Statistics >> Frequecies
Ou, podemos utilizar os comandos diretamente da janela Syntax, como segue: FREQUENCIES VARIABLES=sex /ORDER= ANALYSIS .
Para este exemplo selecionamos a varivel sex (sexo dos respondentes), obtendo a seguinte sada:
Respondent's Sex
Podemos formatar os dados da tabela, como nmero de casas decimais, incluir %, fonte, etc. Para isto, necessrio, ainda na janela Output, darmos duplo clique com o boto esquerdo do mouse na tabela, para que se abra a ilha de edio, selecionamos os dados que queremos formatar e damos um clique com o boto direito para que se abra a lista de opes do menu. Tambm possvel solicitar a tabela de freqncia de diversas variveis ao mesmo tempo, bastando seleciona-las na janela de dilogo, ou acrescent-las nos comandos do Syntax: FREQUENCIES VARIABLES=sex sibs /ORDER= ANALYSIS .
julianabahiense@gmail.com
Ainda neste item, podemos solicitar, atravs do boto Statistics e Charts algumas estatsticas resumo e grficos para representar as variveis.
Quando necessitamos descrever variveis quantitativas atravs de estatsticas gerais podemos utilizar o comando: Analyze >> Descriptive Statistics >> Descriptives
Neste item do menu Analyze podemos obter alm de parmetros estatsticos, grficos boxplot e ramo-e-folha e testes de normalidade Kolmogorov-Smirnov e Shapiro-Wilk (em que a hiptese nula, H0, nos diz que a varivel estudada segue distribuio Normal, versus a hiptese alternativa, Ha, a varivel no
julianabahiense@gmail.com
Para analisarmos variveis quantitativas em funo de uma qualitativa, por exemplo, queremos saber se o sexo (sex) pode explicar variaes no tempo de estudo (educ). Podemos fazer esta verificao usando: I. II. III. IV. V. Analyze >> Explore Analyze >> Reports >> Report Summary in Row Analyze >> Compare Means >> Means Analyze >> Compare Means >> Independet Sample T Test Graphs >> Boxplot
Para aplicarmos o test t-Student devemos verificar se a varivel testada atendem aos pressupostos de normalidade e homocedasticidade, este ltimo pode ser verificado pelo teste Levene cuja hiptese nula diz no existir diferena entre as varincias. O teste t-student tem como hiptese nula a no existncia de diferena entre a mdia da varivel por grupo (fator). Para os dois testes temos como regra de deciso se p-valor < ento rejeitamos H0. Cruzamento de Variveis pode ser feito atravs dos comandos: Analyze >> Descriptive Statistics >> Crosstable Ento selecionamos as variveis que iro compor as linhas e as colunas. Podemos acrescentar as percentagens clicando no Cell Display.
Podemos ainda usar um dos comandos do Tables, por exemplo: Analyze >> General Tables >> General Tables
julianabahiense@gmail.com
Correlations
Number of Children Spearman's rho Number of Children Correlation Coefficient Sig. (2-tailed) N Highest Year of School Completed Correlation Coefficient Sig. (2-tailed) N Highest Year School Completed, Father Correlation Coefficient Sig. (2-tailed) N ** Correlation is significant at the 0.01 level (2-tailed). 1,000 . 1509 -,262(**) ,000 1507 -,297(**) ,000 1064
Highest Year of School Completed -,262(**) ,000 1507 1,000 . 1510 ,450(**) ,000 1065
Highest Year School Completed, Father -,297(**) ,000 1064 ,450(**) ,000 1065 1,000 . 1069
Anlise de Regresso pode ser feita para modelar uma varivel em funo de outra (s). Analyze >> Regression >> (selecionamos o tipo de modelo)
julianabahiense@gmail.com
Variables Entered/Removed(b)
Model 1
Variables Entered
Variables Removed
Method
Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father(a)
. Enter
a All requested variables entered. b Dependent Variable: Highest Year of School Completed
Coeficiente de determinao: R2= 23,6%. Este modelo explica 23,6% da variao de educ.
a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father b Dependent Variable: Highest Year of School Completed
ANOVA(b) Model Sum of Squares 1 Regression 1796,560 Residual Total 5806,745 7603,305 3 969 972 598,853 5,993 99,934 df Mean Square F Sig. ,000(a)
Com p-valor= 0,000 rejeitamos H0 e educ pode ser modelado por uma reta com os preditores selecionados.
a Predictors: (Constant), Highest Year School Completed, Mother, Respondent's Sex, Highest Year School Completed, Father b Dependent Variable: Highest Year of School Completed
Coefficients(a) Unstandardized Coefficients B 1 (Constant) Respondent's Sex Highest Year School Completed, Father Highest Year School Completed, Mother 9,902 -,380 ,196 ,189 Std. Error ,384 ,160 ,026 ,031 -,067 ,288 ,231 Standardized Coefficients Beta 25,782 -2,381 7,574 6,085 ,000 ,017 ,000 ,000 Sig. t
Residuals Statistics(a) Minimum Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value 9,11 Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value ,001 a Dependent Variable: Highest Year of School Completed ,023 ,003 ,003 973 -9,603 -3,923 -3,930 -9,636 -3,959 ,744 ,000 17,20 8,277 3,381 3,399 8,365 3,418 22,354 ,045 13,54 ,000 ,000 ,000 ,000 ,000 2,997 ,001 1,359 2,444 ,998 1,001 2,455 1,002 2,499 ,003 973 973 973 973 973 973 973 973 9,14 -3,239 ,104 Maximum 17,22 2,707 ,379 Mean 13,54 ,000 ,151 Std. Deviation 1,360 1,000 ,041 N 973 973 973
0,8
Anlise visula dos resduos para avaliar a qualidade do ajuste. Indica normalidade dos dados educ.
0,6
0,4
0,2
A Anlise Fatorial tem como objetivo principal descrever a variabilidade de um conjunto de variveis em termos de um nmero menor de variveis que esto relacionadas com o grupo original atravs do modelo linear, sem perda de informao. O SPSS usa os comandos a seguir: Analyze >> Data Reduction >> Factor
julianabahiense@gmail.com
Matriz de correlao: variveis em escalas diferentes. Matriz de covarincia: mltiplos grupos, com diferentes varincias para cada varivel.
Testes para validade da aplicao da anlise fatorial. . Interpretao do teste KMO: <0,50 0,50 0,60 0,60 0,70 0,70 0,80 0,80 0,90 0,90 1 iniciais. Na mesma caixa de dilogo podemos definir tambm a Rotao (Rotation), que aplicada para transformar os coeficientes das componentes principais numa estrutura simplificada pelos mtodos: Varimax: alguns pesos significativos e os outros prximos de zero Quartimax: pesos elevados para um nmero reduzido de componentes e prximos a zero para as restantes. Equamax: combinao do Varimax e Quartimax. Direct Oblimin e Promax: mtodos no ortogonais, observa-se o pressuposto de independncia das componentes. Os mtodo de clculo dos escores so definidos em Scores. E em Options podemos escolher como ser tratado o valor missing, por exemplo. Inaceitvel M Razovel Mdia Boa Muito boa
A hiptese nula do teste de Esfericidade de Bartlett afirma no haver correlao entre as variveis
No SPSS temos alguns testes de hipteses, por exemplo, temos com testes paramtricos disponveis o teste t e o ANOVA e como testes no paramtricos, o teste dos sinais, McNemar, Wilcoxon, Mann-whitney, Kruskal-wallis, Aleatoriedade, Binomial e o Qui-quadrado.
julianabahiense@gmail.com
Esses valores correspondem aos cdigos usados na varivel, neste caso, sex, 1=masculino e 2=feminino
A sada apresentada :
Group Statistics Respondent's Sex Male Female N 633 877 Mean 13,23 12,63 Std. Deviation 3,143 2,839 Std. Error Mean ,125 ,096
t-test for Equality of Means Std. Error Difference ,155 ,157 95% Confidence Interval of the Difference Lower ,298 ,293 Upper ,906 ,911
F 11,226
Sig. ,001
t 3,887 3,824
df 1508 1276,454
julianabahiense@gmail.com
Para os Testes No PAramtricos procedemos da seguinte maneira: Analyze >> Nonparametric Tests
Temos, nesta ordem, os testes Qui-quadrado, Binomial, Aleatoriedade, Kolmogorov-Smirnov, testes para duas amostras independentes, testes para duas amostras relacionadas, Kruskal-Wallis e Mediana (k Independent Samples)
Para fazermos Anlise de Cluster, seguimos os seguintes comandos: Analyze >> Classify >> Hierarchical Cluster
julianabahiense@gmail.com
Para colocar as variveis numa mesma escala devemos padroniz-la atravs do mtodo de transformao encontrado na caixa de dilogo . Para dendogramas,
6. Bibliografia Consultada
FERREIRA, Armando M. SPSS Manual de Utilizao. Escola Superior Agrria de Castelo Branco. 1999.
PEREIRA, Alexandre. Guia Prtico de Utilizao do SPSS. Anlise de dados para Cincias Sociais e Psicologia. 4 ed. Edies Silabo. Lisboa. Mar 2003.
SANTANA, Cora. LISBOA, Graa. Manual Bsico do SPSS para Windows. CPD/ UFBA.
julianabahiense@gmail.com