Você está na página 1de 120

spss Mdulo Base Conceitos e Recursos Volume 1 spss Mdulo Base Conceitos e Recursos Volume 1

SPSS Treinamento

pag. 2

1. Introduo___________________________________________________ 3 1. Passos de uma anlise estatstica_________________________________ 3 2. Famlia SPSS for Windows ______________________________________ 4 3. Viso geral do SPSS for Windows ________________________________ 5 II. Sobre o Banco de Dados_______________________________________ 15 1. Como criar seu prprio banco de dados___________________________ 15 2. Criando vrias variveis com as mesmas caractersticas _____________ 21 3. Formas de importao e exportao de dados _____________________ 24 4. Importao de arquivos de dados do tipo Excel ou Lotus______________ 25 5. Exerccios 29 III. Transformao de Dados _____________________________________ 30 1. Recodificao usando o procedimento Recode _____________________ 30 2. Recodificao automtica para criao de faixas ____________________ 33 3. Recodificao automtica de variveis alfanumricas________________ 35 4. Clculo de novas variveis usando o procedimento Compute__________ 36 5. Exerccios __________________________________________________ 39 IV. Tabelas____________________________________________________40 1. Usando os cones de organizao _______________________________ 41 2. Modificando as clulas ________________________________________ 44 V. Um Pouco de Estatstica Descritiva______________________________ 47 1. Nvel de medida das variveis___________________________________ 47 2. Distribuio de frequncias _____________________________________ 48

3. Medidas de posio ___________________________________________49 4. Medidas de variabilidade _______________________________________51 VI. Comandos do SPSS para Anlise Descritiva_______________________ 55 1. OLAP Cubes_________________________________________________55 2. Frequencies _________________________________________________59 3. Descriptives_________________________________________________64 4. Crosstabs ___________________________________________________66 5. Exerccios __________________________________________________ 72 VII. Grficos No-Interativos_______________________________________73 1. Grfico de pizza______________________________________________73 2. Grfico de barras ____________________________________________ 79 3. Diagramas de disperso _______________________________________ 88 4. Ternplates e exportao de grficos_______________________________91 5. Exerccios __________________________________________________ 93 VIII. Manipulao de Dados_______________________________________94 1. Ordenao de casos __________________________________________94 2. Seleo de casos _____________________________________________96 3. Procedimento Split File _______________________________________100 4. Procedimento Aggregate _____________________________________ 102 5. Exerccios__________________________________________________105

SPSS Treinamento 1. Passos de uma anlise estatstica

pag. 3

Em nosso dia a dia, vivemos constantemente rodeados por potenciais fontes de dados, que podem ser funcionrios de uma empresa (se estivermos interessados em avaliar seu desempenho antes e aps um treinamento) pacientes de uma clnica (se quisermos estudar tempo de reao a uma determinada droga) objetos uma linha de produo (se quisermos avaliar quantidades de peas defeituosas produzidas) dos ndices da bolsa de valores (se nosso alvo so as projees econmicas). Por hora, vamos supor que estamos interessados em estimar a altura mdia dos brasileiros do sexo masculino com mais do que 25 anos. Em geral no temos recursos financeiros ou mesmo tempo suficiente para entrevistar cada pessoa e, por isso, preciso selecionar um grupo ou uma amostra de pessoas. Esta etapa chamada de coleta de dados que seguida do devido armazenamento dos mesmos. Uma vez reunidas as informaes, frequentemente esses dados precisam passar por alguma transformao. Se a altura das pessoas tivesse sido tomada em ps e polegadas, seria conveniente transform-la para centmetros. Esta a etapa de transformao de dados, que poderia se estender a clculos bem mais complexos. Finalmente os dados esto prontos para a anlise a qual ser dividida em duas fases. A primeira chamada de descritiva, na qual como o prprio nome diz descreveremos os dados. Alguns procedimentos utilizados nessa etapa so: construo de tabelas e grficos, clculo de medidas como mdia, varincia, etc. No estudo sobre a altura dos brasileiros, por exemplo, poderamos ter como primeiros resultados: a altura mdia na amostra entrevistada de 168 cm com um desvio padro de 12 cm. Mas da a dizer que esta a altura mdia do brasileiro do sexo masculino com mais do que 25 anos um grande passo, que deve ser dado com muito cuidado. ento que entra a segunda parte da anlise, a anlise inferencial. Com a ajuda de testes estatsticos, poderemos mais do que simplesmente dizer qual a altura mdia do brasileiro, mas tambm associar uma certa confiabilidade a tal concluso.

Depois de tanto trabalho hora de relatar as concluses do estudo. Agora toda informao, seja ela numrica ou grfica, bem-vinda para que algum que no participou do processo de anlise possa compreender as concluses sobre o estudo, atravs do relatrio. Mas afinal, porque devemos realizar uma anlise estatstica? Simplesmente porque precisamos da confiabilidade que essa anlise oferece em um momento de tomada de deciso. A Figura 1-1 apresenta um esquema com os passos de uma anlise estatstica. SPSS Treinamento Figura 1-1: Passos de uma anlise estatstica de dados pag. 4

O SPSS tem sido considerado um dos melhores softwares estatsticos do mercado, justamente porque participa de grande parte do processo que engloba uma anlise estatstica. Logo na primeira etapa possvel armazenar dados de forma rpida e prtica no prprio SPSS. Durante o processo de transformao e anlise de dados, o SPSS tem recursos considerados dos

mais poderosos. At mesmo em um dos momentos mais delicados da anlise, a elaborao de relatrios, o SPSS tem recursos excelentes para ajud-lo. Mas, e na hora de tomar decises? Mesmo nesse momento crtico da sua anlise, voc pode contar com os recursos do SPSS, como por exemplo, um tcnico de resultados que lhe ensina como analisar os resultados apresentados em alguma tabela. 2. Famlia SPSS for Windows A famlia SPSS for Windows formada por dez mdulos: Base, Regression Modeis, Tables, Advanced Models, Trends, Exact Tests, Categories, Conjoint, Missing Values e Maps. O mdulo Base o mdulo central, com o qual todos os demais interagem. Ele o responsvel pela importao e exportao de arquivos, toda etapa de manipulao e

SPSS Treinamento

pag. 5

transformao de dados, anlise descritiva, anlise no paramtrica, anlise inferencial bsica, e toda a produo grfica. Ao adicionar outros mdulos ao Base, estaremos apenas acrescentando novos procedimentos estatsticos, ganhando em termos de opes e complexidade; porm o acrscimo d outros mdulos no altera o aspecto geral do SPSS. Dessa forma, os mdulos podem ser adquiridos levando em conta a rea de atuao e o trabalho a ser desenvolvido (obs.: para maiores detalhes, contate a SPSS Brasil). 3. Viso geral do SPSS for Windows Inicialmente, o SPSS abre uma janela para que comeamos a trabalhar com nossos dados: a janela Untitled - SPSS Data Editor (veja Figura 1-2). A medida em que formos trabalhando, outras podem ser abertas. Cada janela aberta um arquivo em potencial, ou seja, pode ser armazenado, impresso, copiado para outras janelas, etc.

O menu File (ver Figura 1-3) permite que voc tenha controle sobre tudo que se refere ao gerenciamento de arquivos, como importao, exportao, impresso e salvamento. O primeiro bloco desse menu destina-se abertura de arquivos, seja ele um banco de dados, uma janela de sadas produzida anteriormente ou uma janela de sintaxe, Os tipos de SPSS Treinamento pag. 6

bancos de dados que podem ser lidos diretamente pelo SPSS so os mais diversos, desde do formato ASCII (texto) at bancos em formato Lotusl23, Excel, dBase, entre outros e, claro, arquivos produzidos pelo prprio SPSS nas suas diferentes verses. A opo New inicializa um novo banco de dados ou outro tipo de janela, a opo Open abre um arquivo diretamente, a opo Open Database... serve para voc ler arquivos de vrios bancos de dados diferentes atravs de ODBC, e a opo Read Text Data abre um wizard para auxili-lo na leitura de um arquivo em formato texto. O segundo bloco do menu File tem por funo salvar qualquer janela do SPSS; assim se estivermos na janela Sadas, podemos salvar os resultados obtidos

em uma anlise estatstica atravs da opo Save, etc. O software permite ainda salvar um banco de dados criado no SPSS em um outro formato, assim como no prprio formato SPSS.

No terceiro bloco de File, voc pode obter informaes sobre o contedo do seu banco de dados usando a opo Display Data Info, aplicar definies de variveis estabelecidas em um outro arquivo do SPSS com Apply Data Dictionary ou forar a criao de um arquivo de dados temporrio em Cache Data. No quarto bloco de File est localizada a opo de impresso (em Print) de qualquer janela que esteja ativa. Finalmente, temos a opo de parar o processador do SPSS (atravs de Stop Processor), conectar-se a um servidor para executar SPSS Treinamento pag. 7

anlises em bancos de dados maiores (desde que voc tenha um mdulo servidor do SPSS), a lista de arquivos recentemente utilizados e a opo Exit para voc fechar o SPSS.

O menu Edit (ver Figura 1-4) traz comandos relacionados edio, que podem ser diferentes de acordo com a janela que estiver ativa. Se estivermos na janela de dados, podemos utilizar os recursos Cut e Paste para cortar e colar, respectivamente, um conjunto de dados de um lugar para outro. No ltimo bloco do menu Edit, temos o comando Options..., onde podemos definir os principais parmetros do SPSS, como o padro para o tipo da varivel (o padro do SPSS Numeric8.2, i.e., varivel numrica com 8 dgitos, sendo que os 2 ltimos so casas decimais), ou ainda o tamanho e fonte dos ttulos na janela de sadas entre muitas outras. Todas as opes do comando Options... sero estudadas detalhadamente mais adiante.

SPSS Treinamento

pag. 8

Pelo menu View (ver Figura 1-5) voc escolhe como sero mostrados os dados na janela Data Editor (usando as opes Fonts..., Grid Lines e Value Labeis). Por esse menu tambm possvel disponibilizar ou no atravs da opo Status Bar, a barra inferior, chamada de barra de status, que contm algumas mensagens importantes sobre o SPSS: e finalmente, atravs da opo

ToolBars... voc pode customizar a(s) barra(s) de ferramentas, podendo inclusive, criar uma barra totalmente nova.

SPSS Treinamento

pag. 9

O menu Data traz funes relacionadas a manipulao dos dados. Comandos como definio de datas, ordenao do banco de dados, juno de arquivos em formato SPSS, seleo de casos do arquivo de dados para trabalho, ponderao de valores, etc., fazem parte das opes desse menu (ver Figura 1-6).

SPSS Treinamento

pag. 10

A etapa de transformao dos dados concentra-se basicamente no menu Transform. Recursos como criao de novas variveis a partir das j existentes, recodificao de valores do banco de dados, e at mesmo interpolao de valores ausentes em urna srie de tempo so algumas das opes desse menu (ver Figura 1-7).

SPSS Treinamento

pag. 11

O menu Analyze (ver Figura 1-8) rene todos os procedimentos estatsticos disponveis no SPSS. Este o principal menu que sofre alteraes com a incluso de outros mdulos. A medida que so includos mdulos opcionais o nmero de opes (linhas) existentes nesse menu vai aumentando, ou seja, a quantidade de recursos estatsticos vai se tornando cada vez maior e o seu SPSS cada vez mais poderoso.

SPSS Treinamento

pag. 12

O menu Graphs contm todos os tipos de grficos que o SPSS oferece. Grficos de sequencia, barras, rea, pizza, boxplot, pareto e cartas de controle so apenas alguns deles (ver Figura 1-9). Nesse menu temos a opo de construir grficos interativos e caso voc tenha o mdulo Maps, possvel a construo de mapas no SPSS.

Utilities (ver Figura 1-10) um menu que oferece recursos que no so imprescindveis, mas certamente quebram alguns galhos. Um exemplo obter um resumo da estrutura do seu banco de dados bastando clicar a opo File Info. A opo Variables abre uma janela com informaes sobre as variveis do seu arquivo; clicando em Menu Editor... voc pode customizar os menus do SPSS, criando at mesmo um menu totalmente novo. A principal opo nesse menu Run Sscript..., onde podemos escolher algum script do SPSS para ser executado (scripts so programas em Visual Basic que veremos adiante). SPSS Treinamento pag. 13

Atravs do menu Window do SPSS (ver Figura 1-11), voc pode navegar pelas janelas criadas pelo SPSS, bastando escolher a janela desejada e clicar em seu nome: ou voc pode minimizar o SPSS com todas as suas janela atravs da opo Minimize Ali Windows.

O ltimo menu que aparece o Help (ver Fiqura 1-12). A ajuda no SPSS um dos pontos fortes do software, j que ela muito mais do que uma cpia do manual. Quando clicamos em Help, a primeira opo Topics lhe d a chance de escolher entre esclarecimentos do significado de algum termo tcnico ou de algum comando e um ndice remissivo. SPSS Treinamento pag. 14

Um tutorial do SPSS est disponvel atravs da opo Tutorial. Com ele voc pode obter detalhadamente informaes bsicas do uso do SPSS. A opo SPSS Home Page abre automaticamente a pgina da SPSS norteamericana na Internet. Na opo Syntax Guide voc ter todos os manuais de sintaxe do SPSS. Finalmente, a opo Statistics Coach funciona como um tcnico estatstico. Ele ir fazer a voc algumas perguntas sobre seus dados e o tipo de anlise que voc gostaria de obter, e ento, baseado nas suas respostas, ele lhe indicar o procedimento do SPSS mais apropriado para o seu caso. SPSS Treinamento II. Sobre o Banco de Dados 1. Como criar seu prprio banco de dados Antes de comear a entrar valores na janela de dados, preciso atentar ao fato de que o SPSS tem por regra geral trabalhar com as variveis (campos) definidas em colunas e casos (registros) em linhas. Digamos que estamos interessados em armazenar informaes de uma pesquisa sobre a programao das emissoras de televiso realizada no Rio de Janeiro e em So Paulo. Vamos criar uma coluna para a cidade do respondente. pag. 15

Para definir uma varivel, dique duas vezes no nome da varivel no topo da coluna ou na parte inferior da janela de dados dique em Variable Vew. Dessa maneira o modo de definio de variveis ser exibido na janela de dados. Nesse modo temos a opo de definir todas as caractersticas que fazem parte de uma varivel: nome, tipo, rtulos, valores ausentes, formato da coluna e o nvel de medida (ver Figura 11-1).

Para dar um nome varivel, basta digitlo no espao designado por Name; o nome pode ter no mximo 8 caracteres, sem que haja caracteres especiais, como +, &, \,-, etc. (porm podemos acentuar); no nosso caso o nome ser cidade (Figura 11-2).

SPSS Treinamento

pag.

16

Para alterarmos o tipo da varivel, basta clicar em Type, onde podemos definir a varivel como numrica (numei-ic), moeda (dollar), data (date), alfanumrica (string), entre outros tipos. Usaremos no nosso caso uma codificao para a varivel cidade, onde o nmero 1 corresponder a cidade de So Paulo e o nmero 2 ao Rio de Janeiro, pois estas foram as duas nicas cidades pesquisadas. Portanto, a varivel cidade ser definida como numrica (Figura 11-3). Ainda nessa janela voc pode especificar quantos caracteres a varivel ocupa (em Width) e o nmero de casas decimais (em Decimais Piaces). Vamos deixar 8 em Width e O em Decimal Places (dado que s usamos os nmeros 1 e 2 no precisamos de casas decimais) e cicar em 0K.

Voc pode estar se perguntando: porque no definir a varivel cidade como alfanumrica (string) e digitar So Paulo e Rio de Janeiro, ao invs dos nmeros 1 e 2? A resposta simples: muitos dos procedimentos estatitiscos no conseguem trabalhar com variveis desse tipo, diminui-se o tempo e a ocorrncia de erros na digitao e tambm porque economizamos espao e consequentemente tempo no processamento dos casos. SPSS Treinamento pag. 17

Um recurso muito til no SPSS a possibilidade de relacionarmos um texto (rtulo) ao nome das variveis (j que o nome s pode ter at 8 letras). Basta selecionar a coluna Label e digitar o texto desejado. Vamos colocar Cidade do entrevistado como rtulo da varivel. Podemos tambm definir rtulos para os valores que uma determinada varivel pode assumir. A coluna Values reservada para esse tipo de definio. Clique no boto que aparece ao selecionarmos essa coluna e no espao Value digitamos o valor que a varivel assume e em Value Label o rtulo (texto) para aquele valor. Feito isso basta clicar Add para armazenar o rtulo do primeiro valor e passar para a segunda definio. No caso da varivel cidade definimos So Paulo como rtulo para o valor 1 e Rio de Janeiro para o valor 2 (ver Figura 11-4). A vantagem de definirmos rtulos para variveis ou para os valores que uma varivel pode assumir que

toda vez que pedimos qualquer estatstica envolvendo essas variveis eles aparecero junto com os resultados na janela de sadas (ver Figura 11-5). Dessa maneira poderemos identificar qual a cidade referente a cada nmero (cdigo).

SPSS Treinamento

pag. 18

Geralmente no temos condies de obter um banco de dados totalmente completo (vamos supor que uma das perguntas da pesquisa a idade do respondente; algumas pessoas no gostam de mencionar a idade). Se nada for informado ao SPSS, como padro a opo No missing values usada. Nesse caso basta deixar em branco o espao reservado informao que falta e o SPSS coloca o separador decimal (. ou ,) no local e interpreta todos os pontos (ou vrgulas) como valores ausentes.

Podemos, porm, querer definir valores especficos como valores ausentes. Nesse caso basta selecionar a coluna Missing, clicar no boto que aparecer e escolher a opo mais conveniente (ver Figura 11-6). Por exemplo, se escolhermos a opo Discrete missing values podemos definir o nmero 999 como valor missing e cada vez que o SPSS encontrai o nmero 999 no meio de uma anlise estatstica que envolve essa varivel ele saber que aquele valor se refere a um valor ausente.

A definio do formato da coluna um aspecto meramente esttico. Atravs da coluna Columns voc poder determinar a largura da coluna e na coluna Align o alinhamento do texto que pode ser: esquerda (Left), direita (Right) ou centralizado (Center). No caso da varivel cidade definiremos a largura da coluna como 12 e o alinhamento . direita (ver Figura II-7).

SPSS Treinamento

pag. 19

E finalmente na coluna Measure, devemos escolher o nvel de medida da varivel. As possveis escolhas so: Escalar (Scale): use essa opo quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). Devem ser numricas. Ordinal quando os dados representam categorias com uma ordem intrnseca (ex: pequeno, mdio, grande; concordo totalmente, concordo, discordo, discordo totalmente). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=pequeno, 2=mdio, 3=grande). Nominal: quando os dados representam categorias sem ordem intrnseca (ex: as categorias de estado civil, ocupao, nacionalidade). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1 =masculino; 2=feminino). No nosso caso escolhemos a opo Nominal (no existe ordem nas categorias de cidade). Pronto! Agora s voltar para o modo de exibio dos dados

(selecione Data View na parte inferior da janela de dados) e digitar os valores coletados, lembrando que cada caso (registro) deve ser digitado em uma linha (ver Figura 11-8). Desse modo o primeiro respondente de So Paulo o segundo do Rio de Janeiro e assim por diante. SPSS Treinamento pag. 20

Note que apenas os nmeros 1 e 2 aparecem na janela de dados e no os rtulos (nome das cidades). Para ativ-los basta clicar no cone 1. A Figura 119 mostra a janela de dados agora com os rtulos ativos. Para desativ-los basta clicar novamente no mesmo cone.

SPSS Treinamento

pag. 21

2. Criando vrias variveis com as mesmas caractersticas Suponha agora que voc tenha que definir as perguntas abaixo no SPSS. Note que elas tm as mesmas opes de resposta: 1) Qual a emissora de televiso a que voc mais assiste? 2) Qual a emissora de televiso que tem a melhor programao? 3) Qual a emissora de televiso que tem os programas mais apelativos? 4) Qual a emissora de televiso que sua famlia prefere? Possveis respostas:

1) Emissora A

4) Outra Emissora

2) Emissora B 5) Nenhuma

3) Emissora C

Usando os conhecimentos adquiridos at agora poderamos definir quatro variveis, uma para cada pergunta. Para cada uma delas poderamos definir tipo, rtulos, valores ausentes, formato da coluna e nvel de medida. Todas as definies seriam exatamente iguais nas quatro variveis. Portanto seria desejvel definir apenas uma vez as caractersticas das SPSS Treinamento pag. 22

quatro perguntas e atravs de algum mecanismo poder relacion-las a todas as colunas de uma s vez. Podemos fazer isso no modo de definio de variveis usando as opes Copy e Paste Variables. Para comear basta definir uma das variveis; por exemplo, perg1. Vamos definir como: numrica de tamanho 8 e sem nenhuma casa decimal, dados ausentes padro, formato da coluna com largura 10, rtulos dos valores da varivel sendo valor 1 - emissora A; valor 2 - emissora B; valor 3 - emissora C; valor 4 - outra emissora e valor 5 - nenhuma e nvel de medida nominal. A Figura TI-lo mostra a janela de dados (modo de definio de variveis) aps a criao da varivel perg1

O prximo passo simples: selecione a varivel perg1 na janela de dados (modo de definio de variveis) clicando no nmero da varivel (2 no nosso caso), selecione Copy no menu Edit, depois marque uma linha vazia (no nosso

caso, selecionamos a linha 3) e selecione a opo Paste Variables do menu Edit. Na janela aberta (ver Figura TI-li) voc escolha quantas variveis so criadas a partir da varivel copiada e o nome delas. Escolha 3 no quadro Number of new variables (pois queremos criar perg2, perg3 e perg4), 2 no segundo quadro direita de New variable names (lembre-se de que j existe uma varivel chamada perg1) e dique em 0K.

SPSS Treinamento

pag. 23

A Figura 11-12 mostra a janela de dados (modo de exibio dos dados Data View) com as variveis criadas e alguns valores j digitados. Para salvar as informaes armazenadas nessa janela no formato SPSS basta clicar o menu File.. Save ou Save As...e digitar o nome que queremos dar ao novo arquivo no quadro File Name. Note que a extenso dos arquivos do tipo SPSS sav.

Uma outra opo muito til para ajud-lo na definio das caractersticas de suas variveis chama Apply Data Dictionary e est presente no menu File. Ao escolher essa opo, ser aberta uma janela para voc escolher um arquivo no formato SPSS, chamado de arquivo modelo. Aps a escolha, o SPSS compara os nomes das variveis do arquivo ativo com as do arquivo modelo e para aquelas variveis que tiverem o mesmo nome, ele copia todas as definies dessas variveis (como tipo, rtulo, valores ausentes, etc.) do arquivo modelo para o arquivo ativo. SPSS Treinamento 3. Formas de importao e exportao de dados Conforme j mencionamos, o SPSS tem capacidade para importar bancos de dados gerados nos mais diversos formatos, entre eles Lotus 123, Excel, dBase e ASCLI. Para ter acesso aos diferentes formatos de banco de dados basta clicar o menu File.. Open.. Data. Aparece ento uma tela (ver Figura 11-13) onde determinamos disco e subdiretrios (Look in), o nome do arquivo (File name), e a forma sob a qual o arquivo foi gerada (opo File Type no canto pag. 24

inferior esquerdo). O padio o formato SPSS (extenso .sav). Discutiremos a seguir como importar arquivos em formato Excel (.xls).

J mencionamos tambm que os dados da janela de dados podem ser armazenados sob diversos formatos, tenha ele sido gerado atravs do SPSS ou de qualquer outro aplicativo; para isso, entramos no menu File e clicamos em Save ou Save as.. Aparecer uma tela (ver Figura 11-14) semelhante quela para abertura de arquivos, onde especificamos novamente disco e subdiretrios, o nome do arquivo, e a forma sob a qual o arquivo deve ser salvo abrindo o menu Save as type (canto inferior esquerdo). O default o formato SPSS (extenso .sav). Outra opo salvar no formato Excel (extenso xis). Para maiores detalhes sobre importao e exportao de bancos de dados com extenso diferente das mencionadas aqui, consulte o manual do mdulo Base do SPSS. SPSS Treinamento pag. 25

4. Importao de arquivos de dados do tipo Excel ou Lotus O exemplo que utilizaremos aqui utiliza uma pesquisa de opinio sobre lazer que iremos analisar durante o treinamento. Ao invs de importar os dados no formato SPSS, vamos import-los do formato Excel. Antes de iniciar a importao precisamos observar como os dados se encontram no arquivo original inicializando o Excel. Atravs do menu File.. Open... (do Excel) abrimos o arquivo lazer.xls. A Figura 11-15 apresenta o contedo desse arquivo. SPSS Treinamento pag. 26

Notamos que o banco de dados contm no apenas nmeros, mas tambm ttulo, linhas em branco e o nome das variveis. Precisamos ento ter um certo cuidado na importao, pois o SPSS s consegue ler o nome das variveis e os valores das mesmas. Ttulos, comentrios, grficos ou frmulas presentes no arquivo no podem ser importados. Uma possvel soluo anotarmos as coordenadas dos cantos superior esquerdo e inferior direito da matriz onde o nome das variveis e dados esto efetivamente situados (no nosso caso A4 e P3 5). Fechamos ento o arquivo no Excel j que se no fecharmos o arquivo dentro de um aplicativo, no conseguimos abri-lo em outro e ento, vamos import-lo no SPSS. Para isso, volte ou abre o SPSS (caso ele j no esteja aberto). Para importar esse arquivo de dados no SPSS, cicamos o menu File.. Open.. Data.. (ver Figura 11-16). Devemos indicar o disco e o subdiretrio, alm claro, do tipo do arquivo, que no nosso caso Excel (*.xls). No quadro File name digitamos o nome do arquivo a ser importado, que no nosso caso lazer.xls.

SPSS Treinamento

pag. 27

Ao clicar em Open (ou Abrir se o seu Windows est em portugus), ser aberta uma janela de nome Opening Excel Data Source (ver Figura 11-17). Nessa janela, em Worksheet, devemos especificar a planilha a ser lida (no nosso caso a primeira; LAZER). Alm disso, como o nosso arquivo original contm o nome das variveis devemos selecionar a opo Read variable names from the first row of data e no quadro Range devemos especificar a faixa de valores que deve ser lida, no nosso caso A4:P35. Agora s clicar ok e pronto!

SPSS Treinamento Observaes:

pag. 28

1 - Caso o arquivo original estivesse limpo, isto , com os dados comeando da clula AI, no seria necessrio entrar com as coordenadas em Range e precisaramos apenas especificar se a primeira linha contm ou no o nome das variveis (em Read variable names from the first row of data) 2- Para leitura no formato Lotus o procedimento exatamente o mesmo com duas excees: no quadro Files of type escolhemos a opo Lotus (*.w*) e no quadro Range ao invs da especificao A4:P35, usaramos A4..P35. Quando o arquivo aparece na tela de dados, observe que seu ttulo continua sendo Untitled (ver Figura 11-18). Somente a partir do momento em que salvamos no formato SPSS que o ttulo da janela de dados passa a ser o nome escolhido para o arquivo.

SPSS Treinamento 5. Exerccios

pag. 29

1 - Defina uma varivel num novo banco de dados chamada ESTCIVIL. As caractersticas dessa varivel dvem ser: - Tipo: Numrica sem casas decimais - Rtulo da varivel: Estado Civil - Rtulos dos valores: 1 - Solteiro 2 - Casado 3 - Separado 4 - Vivo - Nvel de medida: Nominal

SPSS Treinamento III. Transformao de Dados 1. Recodificao usando o procedimento Recode

pag. 30

Utilizaremos aqui um recurso muitas vezes necessrio que antecede a anlise estatstica propriamente dita. A recodificao simples de variveis pode ser usada, entre outras coisas, para criar faixas de valores baseados em variveis j existentes. Um exemplo tpico ter interesse em estudar a faixa etria das pessoas em um estudo onde a informao disponvel originalmente a idade. No nosso exemplo vamos criar essa varivel representando a faixa etria a partir da varivel idade. Nossa idia construir tal varivel de acordo com a seguinte diviso por faixas: Valores atuais (Idade) Valores Futuros (Faixa Etria) <=25anos..................................................................................................1 26 at 35 anos..........................................................................................2 36 at 45 anos..........................................................................................3 >45 anos...................................................................................................4 Para fazer uma recodificao no SPSS entramos no menu Transform e escolhemos a opo Recodi. Temos ainda que escolher entre as opes Into Sarne Variables ou Into Different Variables (ver Figura 111-1). Atravs dessa ltima opo uma nova coluna adicionada ao banco de dados com os valores recodificados. J atravs da opo Into Sarne Variables a informao recodificada armazenada na mesma coluna da varivel Idade, perdendo, dessa maneira, a informao da antiga varivel.

SPSS Treinamento

pag. 31

Escolhendo a opo Into Different Variables uma nova janela aberta (ver Figura 111-2). Devemos informar o nome da varivel a ser recode.ficada (no caso Idade). Para isso basta clicar em Ida de dos Entrevistados (que o rtulo da varivel Idade) dentre todos os rtulos que esto no quadro esquerdo e mov-lo, clicando a seta logo ao lado, para o quadro Numeric Variable> Output Variable. Devemos, tambm, dar um nome para a nova varivel que ser criada atravs do quadro Output Variable no canto superior direito. No espao reservado ao nome da nova varivel (Name) digitamos fai.xaet. Podemos ainda criar um rtulo para a nova varivel Faixaet (por exemplo, Faixa Etria), preenchendo o quadro abaixo de Label. Aps essas definies, basta clicar Change e terminamos a primeira etapa da recodificao.

SPSS Treinamento

pag. 32

Falta agora informar ao SPSS as condies da recodificao. Para isso basta clicar a opo Old and New Values, localizada na parte inferior da janela e aparece uma nova tela (ver Figura 111-3). No quadro Old Value, esquerda, temos que especificar os valores da antiga varivel que vo determinar os valores da nova varivel. Para isso temos disponvel uma srie de opes:
Value - usado quando estamos interessados em transformar um valor

especfico da varivel em questo em um novo valor:


System Missing - usado quando queremos especificar um valor

numrico para os valores ausentes do sistema (pontos ou vrgulas):


System or User Missing - usado quando queremos especificar um valor

numrico para todos os tipos de valores ausentes: os do sistema e os especificados pelo usurio;
Range [J through O - usado para especificar uma faixa de valores que

recebero um novo valor (ex. de 30 at 40);

Range Lowest through O - usado para especificar uma faixa de valores

que se transformaro num novo valor; nesse caso, do menor_valor da varivel em questo at o nmero especificado;
RanTFthroiij:ii highest - usado para especificar uma faixa de valores que

recebero um novo valor; nesse caso do nmero especificado at omaior valor da sua varivel. No quadro New Value, no canto superior direito, existe um pequeno espao (Value), no qual deve ser digitado o valor que a nova varivel deve assumir para cada uma das faixas ou valores definidos esquerda. SPSS Treinamento pag. 33

No nosso caso clicamos em Range Lowest through esquerda e preenchemos com o valor 25, ou seja, estamos falando em valores menores ou iguais a 25, e direita no quadro New Value digitamos o valor 1. Cique em Add para incluir a primeira faixa no quadro OldNew. Podemos definir o segundo grupo de valores: dique em Range O through EJ, digite os valores 26 e 35; no quadro Value direita, entre com o valor 2 e dique Add. Analogamente repita essa operao para a terceira faixa etria (de 36 at 45 anos). Finalmente, defina a ltima categoria clicando em Range: O through highest e entrando com o valor 46; estamos agora falando em valores maiores ou iguais a 46. No quadro Value digite o nmero 4 e dique Add. Dessa maneira a definio da nova varivel Faixaet est encerrada.

Clicando Continue, voltamos tela anterior onde clicamos 0K. A nova varivel passa a existir e aparece na ltima coluna do arquivo. Ela assume os valores 1, 2, 3 e 4 porm os rtulos ainda no esto associados a esses valores. Para associar rtulos aos valores da nova varivel podemos usar a opo do menu View.. Variables e na opo Values acrescentar o rtulos dos valores. 2. Recodificao automtica para criao de faixas Quando usamos o procedimento Recode para a criao da faixa etria, ns especificamos os limites de cada uma das faixas. Porm suponha que voc no tenha idia de como dividir sua varivel em faixas, mas que tenha em mente o nmero de faixas. O SPSS Treinamento pag. 34

procedimento Categorize Variables converte valores contnuos de uma varivel escalar em um nmero discreto de categorias. Esse procedimento cria novas

variveis contendo os dados categorizados baseado nos valores dos percentis1, com cada grupo contendo aproximadamente o mesmo nmero de casos. Por exemplo, uma especificao de quatro grupos iria designar valor 1 para os casos abaixo do 25 percentil 2 para os casos entre o 25 e o 5O percentil 3 para os casos entre o 50 e o 75 percentil e 4 para os casos acima do 75 Vamos criar uma nova varivel contendo a diviso em faixas da varivel idade, porm usando esse procedimento. Na janela aberta aps clicarmos em Categorize Variables no menu Transform (veja a Figura 111-4), basta escolher a varivel Idade dos Entrevistados, movla para o quadro Create Categories for e escolher o nmero de categorias em Number of categories (quatro no nosso caso). Agora basta dicar em 0K e ele criar uma varivel chamada nidade (ou seja n nome da varivel) no nosso banco de dados.

A Figura 111-5 mostra a distribuio de frequncias da varivel criada e logo abaixo os valores dos percentis de nmero 25, 50 e 75 que definem as faixas criadas. Posteriormente veremos como pedir essa tabela de frequncia e os percentis no SPSS.
1 Um determinado percentil o valor de uma varivel escalar que divide os dados ordenados em grupos de maneira que um certo percentual dos valores est abaixo e um outro percentual acima. Por exemplo, se dissermos que o 25 percentil do salrio numa empresa de R2OO,OO, estamos dizendo que 25% dos funcionrios dessa empresa ganham menos de R$200,OO e que os outros 75% ganham mais do que esse valor.

Note na tabela que o nmero de casos em cada faixa bem parecido: 7, 8 ou 9 casos. Olhando na tabela dos percentis temos que a primeira faixa so as pessoas que tm at 21 anos; a segunda faixa representa quem tem entre 21 e 26 anos, a terceira quem tem entre 26 e 36 anos e a ltima faixa representa quem tem mais de 36 anos.

SPSS Treinamento

pag. 35

3. Recodificao automtica de variveis alfanumricas Outro recurso para recodificao presente no SPSS o Automatic Recode. Atravs desse procedimento podemos transformar variveis do tipo alfanumricas (string) ou numricas em variveis numricas consecutivas j codificadas (com rtulos associados). O SPSS ordena em ordem alfabtica (crescente ou decrescente) os valores da varivel selecionada relacionando o nmero 1 ao primeiro valor e assim por diante at o ltimo valor. A nova varivel ser numrica assumindo desde o valor 1 at o nmero de valores (ou cadeia de caracteres) existentes, alm de assumir os antigos valores (alfanumricos ou numricos originais) como rtulos da nova varivel numrica. Por exemplo suponha que queiramos transformar a varivel Cidade (que alfanumrica) do nosso banco de dados lazer.sav numa varivel numrica. Se quisermos fazer determinadas anlises usando a cidade de origem teremos que executar esse procedimento.

Para isso basta usar a opo Automatic Recode presente no menu Transform. Uma janela (ver Figura 111-6) aberta e a primeira coisa a fazer mover a varivel a ser recodificada para o quadro central Variable -> New Name. No nosso caso moveremos a varivel Cidade. Como uma outra coluna ser criada para armazenar a nova varivel preciso dar um nome para SPSS Treinamento pag. 36

essa coluna, digamos Cidade2. Devemos colocar essa informao no retngulo logo abaixo do quadro central e dicar New Name. A ltima deciso a ser tomada quanto ordem da recodificao, que pode ser em ordem alfabtica crescente ou decrescente, usando uma das opes: Recode Starting from: Lowest Value (ordem crescente) ou Highest Value (ordem decrescente). Podemos escolher por exemplo Lowest Value e clicar 0K. Feito isso o resultado da recodificao mostrado na janela de sadas (ver Figura 111-7). Note que antes da recodificao a varivel Cidade assumia os valores So Paulo, Rio de Janeiro e Brasifia. Aps a recodificao a nova varivel criada, Cidade2, assume os valores 1, 2 e 3 j com os rtulos relacionados (lado direito).

4. Clculo de novas variveis usando o procedimento Compute Vamos agora estudar um outro recurso de transformao de dados: a criao de uma nova varivel como funo de variveis j existentes. Vamos utilizar as variveis Trabalho e Lazer. Nosso interesse investigar qual a porcentagem de lazer em relao s horas gastas com trabalho mais lazer. Por exemplo, se a pessoa trabalha 60 horas por semana e gasta 20 horas com lazer, ela gasta 25% do tempo dela de trabalho(+)lazer com lazer. Para chegar a esse SPSS Treinamento pag. 37

nmero a operao que fizemos foi muito simples: soma-se as horas de trabalho e lazer (trabalho+lazer); divide-se o nmero de horas de lazer por essa soma (lazer/(trabalho+lazer)) e ,multiplica-se o resultado por 100. Nosso objetivo agora criar no banco de dados uma nova varivel, com nome p_lazer, que contenha a informao desejada. Para isso basta entrar no menu Transform e clicar opo Compute. Uma janela (ver Figura 111-8) aberta com as seguintes caractersticas: um quadro no canto esquerdo apresenta uma lista com todas as variveis existentes no banco de dados que podem ser usadas para o clculo da nova varivel, para selecion-las basta clicar a seta ao lado;

um quadro no canto superior esquerdo designado por Target Variable, onde digitaremos o nome da varivel a ser criada; um quadro direita na parte superior designado por Numeric Expression, onde devemos escrever a funo (envolvendo as variveis j existentes no arquivo) que permitir o clculo da nova varivel; um quadro central com uma srie de botes que contm desde funes matemticas (+, -, , etc) at funes lgicas (&, etc); e no quadro inferior direito, Functions, h um vasto conjunto de funes, desde soma, multiplicao at arco-tangente, logaritmo neperiano, entre outras, que tambm podem ser usadas na construo da expresso numrica.

No nosso caso, a expresso a ser criada (Lazer/(Trabalho+Lazer))* 100. Selecionamos a varivel Lazer do quadro esquerdo, clicamos o smbolo / presente no quadro central da janela; em seguida clicamos o smbolo ( ), selecionamos a varivel Lazer, o smbolo + e a varivel Trabalho; agora basta clicar o smbolo * e o nmero 100. Poderamos, ainda, ter escrito a expresso digitando diretamente no quadro Numeric Expression. SPSS Treinamento pag. 38

Agora que nossa funo j est pronta, devemos dar um nome a nova varivel. Digitamos p lazer no quadro superior esquerdo Target Variable, e clicamos 0k

(ver Figura 111-9). Urna nova varivel com nome p_lazer ser adicionada janela de dados na primeira coluna vazia.

SPSS Treinamento 5. Exerccios 1 - Abra o banco de dados Banco.sav, que est no formato SPSS.

pag. 39

2 - Utilize o procedimento Recode para, baseado nos valores da vari:el Salrio Atual (salrio) criar uma nova varivel com as caractersticas a seguir:

Aps a criao de Faixa Salarial, entre na sua janela de definio e mude seu nvel de medidas para Ordinal. 3 - Crie uma varivel que representar a porcentagem de aumento que os funcionrios do banco tiveram desde que entraram na empresa. O nome da nova varivel ser PERCENT e seu rtulo ser Porcentagem de Aumento. Dica: essa varivel pode ser criada atravs da construo de uma funo que envolva os valores do Salrio Inicial (salarin) e Atual (salrio) dos funcionrios. Utilize o procedimento Compute. 4 - Salve o arquivo com as modificaes feitas at agora, no formato do SPSS com o nome de Novobanco.sav. SPSS Treinamento IV. Tabelas Nem sempre as tabelas feitas automaticamente pelo SPSS esto prontas para apresentao da maneira que voc gostaria ou por exemplo a visualizao dos resultados no est satisfatria. Porm, o SPSS tem recursos poderosos para deixar sua tabela da maneira que voc quiser e o que melhor, de uma maneira muito fcil e rpida. Nesta seo iremos manipular tabelas, trabalhar com estratos e identificadores e mudar caractersticas como fonte, cor, etc. Comearemos criando uma tabela pelo procedimento Crosstabs (menu Analyze, opo Descriptive Statistics) do SPSS (posteriormente veremos detalhadamente as opes e a funcionalidade dessa janela), com as variveis sexo, filhos e estcivil do arquivo Lazer.sav, como na Figura IV- 1. pag. 40

A Figura IV-2 mostra a tabela criada pelo SPSS. Para edit-la, voc pode clicar duas vezes2 sobre a tabela ou ento clicar apenas uma vez com o boto direito do mouse e SPSS Treinamento pag. 41

selecionar a opo SPSS Pivot Table Object... Open. Escolhendo a segunda maneira, o SPSS abre uma janela prpria para editar a tabela selecionada e melhor que a primeira especialmente quando voc tem uma tabela muito grande.

2 Posteriormente veremos como mudar a ao padro que o SPSS executa quando clicamos duas vezes numa tabela.

Vamos supor que voc queira dividir a tabela primeiro pelo nmero de filhos e depois pelas categorias de sexo, ou ento mostrar apenas um subgrupo das pessoas estudadas (por exemplo s as mulheres), ou ainda passar a informao do nmero de filhos para as colunas e do estado civil para as linhas. Tudo isso pode ser feito usando os cones de organizao (Pivoting Trays) como veremos a seguir. 1. Usando os cones de organizao Para acionar os cones de organizao, caso no estejam ativados, dique no menu Pivot e escolha a opo Pivoting Trays (veja a Figura IV-3). A regio cinza Row representa os elementos que esto nas linhas que nosso caso so as variveis sexo e filhos (coloque o mouse sobre um dos dois cones e ser mostrado o que ele representa), a regio Column representa os elementos das colunas (no nosso caso, um cone representando a varivel est ci vil) e finalmente a regio Layer representa as camadas de tabelas que podemos ter. A tabela pode ser pensada como se estivesse armazenada em camadas (layers), onde apenas a camada de cima est visvel. Por exemplo, se voc colocar a varivel sexo na parte Layer, o SPSS divide a tabela em duas camadas, uma para o sexo masculino e outra para o sexo feminino.

SPSS Treinamento

pag. 42

Note que os cones dessa regio possuem duas setas, que servem para voc mudar a categoria (camada) que apresentada na janela de sadas, sendo que voc pode depois mandar o SPSS imprimir apenas a tabela mostrada na janela ou todas as tabelas. Vamos, por exemplo, dividir a tabela em duas camadas de acordo com o sexo, arrastando seu cone da regio Row para a regio Layer. Dessa maneira, voc pode mudar a disposio da sua tabela vontade (veja na Figura PJ-7 dois exemplos do uso dos cones de organizao, incluindo a diviso da tabela de acordo com sexo). No momento a sua tabela deve estar mostrando apenas os homens (que a primeira categoria de sexo); para mudar para as mulheres voc pode proceder como dissemos anteriormente, clicando nas setas pretas ao lado do icone Sexo at voc achar a categoria desejada ou clicar na seta ao lado da categoria da varivel sexo mostrada na prpria tabela (veja a Figura 1V-4).

SPSS Treinamento

pag. 43

Suponha agora que voc queira guardar urna ou mais configuraes para uma posterior reviso, apresentao ou para marcar importantes descobertas na sua tabela. Para tal tarefa vamos utilizar os identificadores (bookmarks) clicando em Pivot e depois em Bookmarks. Na janela aberta (ver Figura 1V-5) escolhemos um nome para o identificador e depois clicamos em Add. No nosso exemplo, vamos criar um identificador para a nossa configurao atual (s mulheres) e depois vamos selecionar a categoria masculino de sexo e solteiro de estcivil (aps passar o cone estcivi para a dimenso Layer) e criar um identificador para essa nova configurao. Posteriormente para acessar qualquer identificador basta acessar novamente a opo Bookmarks do menu Pivot, escolher o identificador e clicar em Go to, ou ento clicar em View e depois Toolbar (para mostrar a barra de. ferramentas de formatao) e escolher o identificador da lista. A barra de ferramentas de formatao mostrada na Figura IV-6.

Finalmente, no menu Pivot, voc tem a opo de transpor as linhas e colunas da sua tabela escolhendo a opo Transpose Rows and Columns. Isto tem o mesmo efeito de arrastar todos os cones da regio Column para a regio Row e vice-versa. SPSS Treinamento pag. 44

2. Modificando as clulas Quando voc tiver a disposio da sua tabela da maneira ideal, voc pode modificar a formatao das clulas. Para isso, selecione as clulas que voc gostaria de editar e escolha a opo Ceil Properties... do menu Format (veja na Figura 1V-8), onde voc poder modificar o formato dos valores para nmero, data, tempo ou monetrio, e ajustar o nmero de dgitos decimais mostrados clicando em Value. Selecionando Alignment voc ajusta o alinhamento vertical e horizontal e direo do texto para a(s) clula(s). Em Margins voc modifica a distncia dos valores a cada uma das margens, porm no esquea de levar em conta o alinhamento que voc deu clula. Por ltimo em Shading, voc pode mudar a porcentagem de sombreamento baseado nas cores de frente e fundo (Foreground e Background colors). Isto no muda a cor do texto. Para mudar a cor e tipo de fonte do texto voc pode selecionar

SPSS Treinamento

pag. 45

Font... no menu Format (Figura IV9) ou ativar a barra de ferramentas de formatao (Formatting toolbar) escolhendo no menu View a opo Toolbar (veja Figura lV-6).

SPSS Treinamento

pag. 46

Voc pode ainda ajustar o comprimento das clulas movendo o mouse pelos rtulos da categoria at a borda direita da coluna que voc gostaria de mudar. O cursor mudar para uma flecha com duas pontas, depois deixe o boto do mouse apertado at arrastar a borda para sua nova posio. A Figura IV-10 mostra uma tabela editada, posteriormente iremos ver como modificar as bordas e as vrias propriedades de uma tabela em geral e o uso de TableLooks.

SPSS Treinamento V. Um Pouco de Estatstica Descritiva

pag. 47

Nesta seo vamos definir alguns conceitos bsicos que nos ajudaro a entender melhor a linguagem estatstica do SPSS.
Populao - conjunto de todos os elementos sobre os quais temos

interesse em estudar, por exemplo, se estamos interessados em investigar qual ser o prximo presidente do Brasil nossa populao o colgio eleitoral do pas; Na maioria das vezes no temos condies de pesquisar todos os elementos de uma populao, por razes como tempo e dinheiro. Portanto uma alternativa para podermos realizar o estudo pesquisar apenas parte dos elementos da populao, ou seja uma amostra.

Amostra - constituda por qualquer subconjunto de elementos de uma

populao;
Varivel - qualquer caracterstica de interesse dos elementos da

populao; exemplos: inteno de voto para presidente, idade, sexo, altura, entre outras; 1. Nvel de medida das variveis Como vimos anteriormente as variveis podem ser classificadas em trs tipos no SPSS de acordo com o seu nvel de medida. Vamos recordar esses tipos: Escalar (Scale): quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). Ordinal: quando os dados representam categorias com uma ordem intrnseca (ex: pequeno, mdio, grande; concordo totalmente, concordo, discordo, discordo totalmente). Nominal: quando os dados representam categorias sem ordem intrnseca (ex: as categorias de estado civil, ocupao, nacionalidade). A importncia de se conhecer os tipos de variveis existentes est ligada forma que a varivel dever assumir no banco de dados, bem como ao tipo de anlise descritiva e inferencial que a mesma dever ser submetida. No momento de definio de variveis categricas, a maneira mais natural seria defini-las como alfanumricas (tipo string). Entretanto, muitos procedimentos estatsticos no SPSS no

SPSS Treinamento

pag. 48

podem ser realizados com variveis desse tipo. Assim, uma sugesto seria defini-las como numricas e codific-las. Por exemplo: Pas de origem: 1 Alemanha; 2 = Blgica: ... ; 18 = Venezuela. Sexo: 1 = Masculino; 2 = Feminino. 2. Distribuio de frequncias Para entendermos melhor o comportamento de uma varivel categrica uma das medidas resumo que pode ser usada a tabela de frequncia. Atravs dessa tabela podemos descobrir o nmero (ou porcentagem) de ocorrncias de cada uma das categorias da varivel. Tabelas de frequncia tambm podem ser construdas para variveis no categricas que assumam um nmero pequeno de valores. Por exemplo, o nmero de filhos, que geralmente assume os valores O, 1, 2 3 e 4. A tabela abaixo (Figura V-1) apresenta a distribuio de frequncia da varivel estado civil. Notamos que a categoria mais frequente a dos solteiros com 13 pessoas, e representa 41.9% do total de respondentes. A categoria menos frequente a dos vivos com 3 pessoas e representa apenas 9.7% do total de respondentes. As categorias casado e separado/divorciados apresentam cada uma 8 e 7 pessoas, respectivamente.

Devemos ressaltar que para variveis escalares que apresentam muitos valores diferentes a construo de tabelas de frequncia no nos traz nenhuma informao relevante na descrio dos dados. Nesse caso uma alternativa seria criar categorias baseadas nos valores da varivel, ou seja categorizar essa varivel, e contar o nmero de ocorrncias em cada categoria. O procedimento Recode pode ser usado para criar a varivel categrica. SPSS Treinamento pag. 49

Na tabela abaixo (Figura V-2), apresentamos a distribuio de frequncias da varivel idade dividida em 4 faixas etrias. Notamos que as pessoas dessa amostra so muito jovens, pois 48,4% tm menos do que 25 anos (15 pessoas). Sete pessoas tm entre 26 e 35 anos, seis pessoas entre 36 e 45 anos e apenas 3 pessoas tm mais do que 45 anos.

Quando trabalhamos com variveis escalares algumas medidas resumo podem ser usadas para obtermos uma descrio mais apurada dos dados. Essas medidas so divididas basicamente em duas classes, as medidas de posio e as medidas de variabilidade. Faremos a seguir um resumos desses dois grupos e apresentaremos as medidas mais conhecidas e importantes.

3. Medidas de posio

As medidas de posio so muito importantes para a descrio dos dados. Geralmente usadas para variveis escalares (pois muitas vezes no acrescentam nenhuma informao no estudo de variveis categricas) essas medidas nos do uma boa ideia da magnitude dos dados. Suponha por exemplo que voc est interessado em descrever as horas gastas semanalmente com trabalho de um grupo de 31 pessoas. Uma opo seria imprimir uma listagem dos 31 valores ordenados e estud-los um a um. Quanto maior for a amostra mais complicado ser analisar a varivel dessa maneira. Imagine o trabalho que voc teria com uma amostra de 1500 pessoas! Precisamos, portanto, encontrar uma maneira de condensar a informao atravs da construo de ndices ou medidas que facilitem nossa anlise. SPSS Treinamento pag. 50

Podemos apresentar os valores mnimo e mximo que a varivel assume na amostra. Esse par de valores determina o intervalo de variao da varivel em estudo. No caso das horas de trabalho o mnimo O e o mximo 70, ou seja, ningum trabalha menos de O horas ou mais de 70 horas por semana. Vamos pensar novamente na listagem dos valores ordenados do menor paia o maior. J comentamos que essa lista no nos ajuda muito. Mas se, ao invs de olharmos a lista toda, escolhermos alguns valores de maneira conveniente poderemos tirar proveito da informao. Os valores mnimo e mximo so um exemplo. Uma outra medida de interesse o valor que divide os dados ao meio, ou seja o valor que deixa pelo menos 50% das observaes ordenadas esquerda. No caso das horas de trabalho esse valor o nmero 40, portanto 50% das pessoas trabalham at 40 horas por semana. Esse valor denominado de 502 percentil. Um determinado percentil o valor da varivel de estudo que divide os dados ordenados em grupos de modo que um certo percentual est acima desse valor e o restante abaixo. O 25, 502, e o 752 percentis so denominados respectivamente de 1Q., 2 e 32 quartis, pois dividem o conjunto de dados em quatro grupos.

O 102, 202, 3Q2 902 percentis so denominados respectivamente de 1Q, 22, 32, ., 92 decis, pois dividem os dados em 10 grupos Vamos agora estudar um pouco sobre algumas medidas que nos trazem informaes sobre o valor central da distribuio dos nossos dados. A mais famosa dentre todas as medidas de posio certamente a mdia aritmtica. Fcil de ser calculada a mdia aritmtica simplesmente a soma de todas as observaes dividida pelo nmero delas. Para as horas de trabalho a mdia 37.9 horas. Apesar das caractersticas descritas acima a mdia uma medida muito influenciada por valores extremos. Observe o valor da mdia para os dois conjuntos de dados abaixo:

Notamos que nos dois conjuntos os valores so idnticos a no ser pelo ltimo valor que no primeiro 6 e no segundo 30. O valor da mdia passou de 4 para 7.43. Nesse caso, como alternativa podemos calcular uma outra medida que no influenciada por valores extremos. Essa medida conhecida como mediana. A mediana nada mais do que o 22 quartil, que j foi discutido. Relembrando, essa medida o valor que deixa pelo menos 50% das observaes sua esquerda. Para os dois conjuntos de dados apresentados acima:

SPSS Treinamento

pag. 51

Note que, apesar da alterao do ltimo valor no segundo conjunto de dados, a mediana permanece inalterada. Por essa razo, dizemos que a mediana uma medida mais robusta do que a mdia. Uma outra medida de centralidade no muito utilizada a moda. A moda nada mais do que o valor mais frequente do conjunto de dados. Para variveis que apresentam muitos valores diferentes, a moda no traz nenhuma informao relevante. Porm, pala variveis categricas, numricas que assumem um nmero pequeno de valores ou escalares categorizadas a moda nos d a informao da categoria mais frequente. Nos exemplos do estado civil e faixa etria a moda , respectivamente, 1 e 1. Portanto para amostra estudada o estado civil mais frequente o solteiro (estado civil=1) e a faixa etria mais frequente a primeira, com pessoas de at 25 anos (faixa etria=l). 4. Medidas de variabilidade Analisando os dois conjuntos de dados abaixo notamos que apesar das mdias serem iguais, os conjunto tm uma diferena grande com relao a homogeneidade dos valores.

No primeiro conjunto todos os valores so iguais a 2 e portanto iguais a mdia (dados totalmente homogneos). J no segundo conjunto os valores no so todos iguais (dados heterogneos) embora a mdia continue sendo 2.

Seria importante agora, expressar a variabilidade dos dados atravs de alguma medida numrica. Para que essa medida fosse coerente ela deveria assumir o valor zero apenas se todos os dados fossem iguais (ex. conjunto 1). Alm disso, quanto maior fosse a variabilidade do conjunto de dados, maior seria o valor da medida. Uma medida bastante simples e fcil de ser calculada a amplitude. A amplitude nada mais do que o valor mximo menos o valor mnimo de um conjunto de dados. No caso dos conjuntos 1 e 2 a amplitude igual a O e 4, respectivamente. Uma desvantagem dessa SPSS Treinamento pag. 52

medida que ela muito influenciada por valores extremos. Alm disso ela no leva em conta a variabilidade entre todas as observaes do conjunto de dados. Observe no exemplo abaixo que apesar de a amplitude ser a mesma para os dois conjuntos, o primeiro aparenta ser mais homogneo:

A prxima medida que apresentaremos tenta corrigir esse defeito da amplitude. Em primeiro lugar iremos considerar as distncias de todas as observaes a um valor central, a mdia. Aps o clculo de todas as distncias (diferenas), faremos a sua soma. Para refinar um pouco a medida podemos dividir a soma pelo nmero total de observaes. Acompanhe o clculo da medida proposta no exemplo a seguir:

Deixamos para voc verificar que para qualquer conjunto de dados a medida apresentada acima sempre zero. Dessa maneira impossvel trabalhar com essa medida para estudar a variabilidade dos dados. Fazendo, porm, uma pequena mudana na medida acima obteremos a famosa varincia. A varincia nada mais do que a soma das diferenas das observaes em relao mdia elevadas ao quadrado, dividida pelo nmero total de observaes. Dessa maneira a varincia ser sempre positiva e s assumir o valor zero se todas as observaes do conjunto de dados forem iguais. Para o conjunto de dados acima a varincia dada por:

Devemos porm tomar cuidado ao analisar essa medida, pois ao elevarmos as diferenas ao quadrado estamos mudando a unidade de medida dos dados. Por exemplo se os nmeros do conjunto 1 esto expressos em metros a varincia estar expressa em metros quadrados. Para contornar esse problema foi criado o desvio padro, que nada mais do que

SPSS Treinamento

pag. 53

a raiz quadrada da varincia (voltamos portanto unidade de medida original). Para o conjunto de dados acima o desvio padro dado por:

Ainda baseado no desvio padro existe uma medida que tenta expressar a variabilidade da mdia e no a variabilidade dos dados como um todo. Essa

medida chamada de erro padro da mdia, ou simplesmente erro padro, e obtida pela diviso do desvio padro pela raiz quadrada do nmero de observaes. Para o conjunto de dados acima o erro padro :

Conforme j foi mencionado anteriormente, existem vrios tipos de variveis e razovel pensar que cada tipo deva receber um tratamento especfico; afinal, no faz sentido calcular a mdia da varivel Opo (Qual sua primeira opo para as horas de lazer?), nem to pouco fazer uma tabela de dupla entrada para Ida de e Trabalho (Horas de trabalho por semana) com seus valores absolutos. Se estamos trabalhando com variveis categricas nominais, digamos Estcivii (estado civil), no faz sentido calcularmos medidas como mdia ou varincia j que no existe uma ordem natural das possveis respostas. Podemos, por exemplo, pedir uma tabela de frequncias e calcular a moda. Para as variveis ordinais surgem algumas novas opes, j que agora as respostas assumem uma ordem natural; este o caso da varivel Escola (Grau de instruo), onde a ordem natural 12 grau incompleto, lQ. grau completo, 22 grau incompleto, e assim por diante at superior completo. Nesse caso, alm da distribuio de frequncias e da moda, podemos calcular medidas como mediana, mnimo e mximo. As variveis escalares so as que apresentam mais opes para anlise descritiva; o caso da varivel Idade, onde alm de mediana, quartis e percentis, podemos tambm calcular mdia, desvio padro, valores mnimo e mximo, medidas de assimetria e curtose (relacionadas distribuio da varivel) etc. Alm disso, se quisermos uma distribuio de frequncias e moda

podemos faz-lo transformando a Ida de em varivel qualitativa ordinal, digamos FaixaEt

SPSS Treinamento

pag. 54

(exatamente como fizemos anteriormente atravs do comando Recode presente no menu Transform). Como veremos a seguir, o SPSS apresenta procedimentos para o clculo de todas as medidas descritas acima e algumas outras. importante ressaltar que o SPSS no saber decidir qual o tipo de medida adequada para as variveis existentes no seu estudo; cabe a. voc decidir SPSS Treinamento VI. Comandos do SPSS para Anlise Descritiva Os comandos relacionados a anlise descritiva encontram-se nas opes Reports e Descriptive Statistics do menu Analyze. Figura VI-1 apresenta as opes de Descriptives Statistics. Vamos agora estudar as opes mais usadas. pag. 55

1. OLAP Cubes A primeira opo do menu Analize. ..Reports OLAP Cubes. Esse procedimento utilizado para a construo de relatrios e estes podem se tomar bem flexveis graas ao uso dos cones de organizao. A construo dos relatrios simples, basta preencher os quadros da janela mostrada na Figura VI-2 com as variveis desejadas. A seguir detalharemos os quadros. SPSS Treinamento pag. 56

No quadro Summary Variable(s) coloque as variveis para as quais voc deseja que ele calcule medidas descritivas como mdias, somas, percentuais, mnimos, mximos, etc.; geralmente as variveis nesse quadro so quantitativas. Como exemplo, vamos colocar as variveis idade, trabalho e lazer. No quadro abaixo Grouping Variable(s), coloque variveis para as quais voc gostaria que sejam criados subgrupos. No nosso exemplo, colocaremos as variveis sexo, estci vil e escola. Clicando no boto Statistics... voc escolhe quais as estatsticas que sero calculadas. Como padro temos: soma, nmero de casos, mdia, desviopadro, percentual sobre a soma total, percentual sobre o N total; vrias outras estatsticas como mediana, mnimo, mximo e varincia, podem ser escolhidas (veja Figura VI-3). No nosso exemplo removeremos a soma (sum) e o percentual sobre a soma total (percent of total sum). Depois basta clicarmos em Continue. SPSS Treinamento pag. 57

Finalmente ao clicar no boto Titie... (ver Figura VI-4), voc pode escolher um ttulo e uma legenda para a tabela, que podero ser modificados posteriormente. Aps a digitao do ttulo e da legenda dique em Continue. Agora basta clicar no boto 0K e teremos nosso relatrio como na Figura \TJ-5.

SPSS Treinamento

pag. 58

Inicialmente, temos o nmero de casos, a mdia, o desvio-padro e o percentual sobre o nmero de casos para as variveis idade, trabalho e lazer considerando todos os casos, independentemente de sexo, estado civil e grau de instruo. Assim, por exemplo, temos para a idade que: - O nmero de pessoas que responderam a idade 3 - A idade mdia dessas pessoas 28,9 anos e o desvio-padro 11,31 anos; - Elas representam 100% das pessoas que responderam a idade (por enquanto essa coluna intil).

Vamos editar a tabela e mostrar subgrupos baseados em sexo, estado civil e escolaridade; dique com o boto direito do mouse na tabela e escolha a opo SPSS Pivot Table Object - Open. Primeiro vamos selecionar apenas os homens; para isso dique na seta ao lado da palavra Total associada a sexo e selecione masculino da lista que ir aparecer. De maneira similar, vamos selecionar as categorias solteiro e superior incompleto. Agora nossa anlise para a idade ficaria assim (ver Figura VI-6): - O nmero de homens solteiros com superior incompleto que responderam a idade 4; - A idade mdia desses homens 20,75 anos e o desvio-padro 1,26 anos;

- Eles representam 12,9% das pessoas que responderam a idade. SPSS Treinamento pag. 59

Usando os cones de organizao voc poderia mostrar apenas uma estatstica por vez, todos os grupos de uma ou mais variveis na mesma tabela, etc. A Figura VI-7 mostra essa versatilidade e lembre-se que voc tambm pode usar os identificadores (bookmarks) para marcar aquelas configuraes que mais lhe interessa

Usando os cones de organizao voc poderia mostrar apenas uma estatstica por vez, todos os grupos de uma ou mais variveis na mesma tabela, etc. A Figura VI-7 mostra essa versatilidade e lembre-se que voc tambm pode usar os identificadores (bookmarks) para marcar aquelas configuraes que mais lhe interessa

SPSS Treinamento

pag. 60

Na parte inferior temos um quadro chamado Statistics. Esse quadro apresenta vrias opes de medidas estatsticas (ver Figura VI-9). Devemos tomar cuidado pois nem todas as medidas apresentadas trazem informaes relevantes para o estudos das variveis em questo. As medidas esto divididas em 4 grupos:
Percentile Values - no canto superior esquerdo essa opo possibilita o

clculo dos quartis (Quartiles), decis (Cut points for 10 equal groups voc pode mudar o nmero 10 para qualquer diviso que desejar) e quaisquer percentis (Percentile(s)) de interesse;
Central Tendency - no canto superior esquerdo essa opo possibilita o

clculo da mdia (Mean), mediana (Median), moda (Mode) e soma (Sum);


Dispersion - no canto inferior esquerdo essa opo possibilita o clculo

do desvio padro (Std. deviation), varincia (Variance), amplitude (Range), valor mnimo (Minimum), valor mximo (Maximum) e erro padro da mdia (SE. mean);

Distribution - no canto inferior direito essa opo possibilita o clculo de

duas medidas de distribuio: Kurtosis e Skewness. A kurtosis uma medida do achatamento da distribuio e skewness um ndice que reflete a simetria da distribuio em torno de um valor central. Devemos decidir agora dentre todas essas medidas aquelas que so adequadas para as variveis prog-tv e peas. Como ambas so nominais apenas a moda trar alguma informao relevante. SPSS Treinamento pag. 61

Um outro quadro que aparece na parte inferior da janela principal o Charts. Esse quadro apresenta trs grficos como opo: histograma com ou sem uma curva normal (Histograms marcando ou no a opo With normal curve), grfico de barras (Bar charts), e grfico de Pizza (Pies), como mostrado na Figura VI-lO. Note que apesar de apresentar um menu exclusivamente para grficos (menu Graphs) o SPSS tambm possibilita a construo de grficos dentro de procedimentos estatsticos. Discutiremos alguns dos tipos de grficos mais utilizados na seo seguinte. Por hora, vamos escolher a opo Bar charts.

SPSS Treinamento

pag. 62

O ltimo quadro que aparece na parte inferior da janela principal o Format. que inclui opes de ordem esttica (ver Figura VI-li). Atravs do quadro Order by controlamos a ordem em que as categorias da varivel so apresentadas na janela de sadas. As opes disponveis so por ordem crescente (ou decrescente) dos valores que a varivel assume e crescente (ou decrescente) de frequncias. Se voc marcar a opo Suppress tables with more than categories, o SPSS no ir fazer nenhuma tabela que tiver mais do que um certo nmero de categorias, sendo que o padro 10. Finalmente no quadro Multiple Variables, caso voc tenha pedido estatsticas para suas variveis, voc pode escolher que essas estatsticas saiam numa s tabela (Compare variables) ou uma tabela para cada varivel separadamente (Organize output by variables). No nosso exemplo, vamos escolher a opo Ascending counts do quadro Order by.

Escolhidas todas as opes podemos clicar 0K. Feito isso o SPSS ativa a janela de sadas e apresenta o resultado da frequncia (ver Figura VI-12). Voc deve perceber que duas distribuies de frequncias so apresentadas. Uma para a varivel progtv e outra para peas. A distribuio de frequncias apresenta os rtulos dos valores, o nmero de observaes em cada categoria (Frequency); a porcentagem que a frequncia representa no total de observaes levando-se em conta valores ausentes (Percent); a percentagem que a frequncia representa no total de observaes desconsiderando os valores ausentes (Valid Percent) e o percentual vlido acumulado (Cum Percent). Acima da distribuio de frequncias, a moda tambm apresentada no quadro Statistics (lembre-se que escolhemos a opo mode no quadro Statistics).

SPSS Treinamento

pag. 63

Temos ainda os grficos de barras localizados na janela de sadas. Olhando o grfico apresentado referente varivel progtv, por exemplo, notamos com facilidade que o tipo de programa preferido filme (barra maior) e que o menos preferido programa humorstico (menor barra) como mostra a Figura VI-13. fcil perceber que a informao contida em um grfico muito mais simples de ser interpretada do que a informao numrica. por esse motivo que os grficos so to importantes na etapa de anlise exploratria de dados.

SPSS Treinamento

pag. 64

3. Descriptives A segunda opo de Descriptive Statistics o procedimento Descriptives. De maneira similar ao procedimento Frequencies temos a opo de incluir as variveis que julgarmos necessrias (vamos colocar Trabalho e Lazer) ao quadro central Variable(s) (ver Figura VI-14). Essa opo geralmente usada quando temos interesse em estudar variveis escalares de maneira rpida.

SPSS Treinamento

pag. 65

O quadro inferior direito Options apresenta medidas estatsticas que podem ser usadas para descrio dos dados (ver Figura VI-15). Existem dois grupos de medidas idnticos aos j discutidos anteriormente na opo Statistics do procedimento Frequencies, so eles Dispersion e Distribution. Alm dessas medidas podemos pedir para o SPSS apresentar a mdia (Mean) e a soma (Sum) das variveis em estudo, O ltimo quadro, Display Order, nos permite escolher a ordem com que os resultados sero apresentados na janela de sadas: crescente ou decrescente de mdias, alfabtica ou a ordem em que as variveis aparecem na lista. Este quadro til quando estamos estudando mais do que uma varivel. No nosso caso podemos escolher, por exemplo, as medidas mnimo, mximo, mdia, desvio padro e erro padro, em ordem decrescente de mdias. Agora basta cicar 0K na janela principal e analisar os resultados que so apresentados na janela de sadas (ver Figura VI-16).

SPSS Treinamento

pag. 66

Notamos que em mdia as pessoas entrevistadas nesse estudo trabalham 37.9 horas por semana e tm 16.85 horas de lazer. Alm disso o mximo de horas trabalhadas foi 70 e o mnimo 0, enquanto que o mximo de horas de lazer foi 40 e o mnimo 2. 4. Crosstabs A quarta opo de Descriptive Statistics o procedimento Crosstabs que usado para construo de tabelas simples (geralmente de dupla entrada). Imagine que temos duas variveis qualitativas e estamos interessados em observar a distribuio de frequncias de ambas em conjunto. Para isso, construmos uma tabela onde uma varivel entra com suas categorias em linhas e a outra em colunas. Podemos ento fazer um estudo descritivo sobre o comportamento conjunto das variveis. Porm, muitas vezes queremos mais do que

SPSS Treinamento

pag. 67

simplesmente observar. Queremos, tambm, verificar se existe efetivamente assoc:ao entre tais variveis. Ento precisamos utilizar testes estatsticos (anlise inferencial). Vrios testes estatsticos esto disponveis no procedimento Crosstabs. A Figura VI-17 mostra as opes do procedimento Crosstabs. No canto esquerdo esto disponveis todas as variveis do banco de dados. Para construo da tabela basta movermos a varivel cujas categorias desejamos dispostas nas linhas para o quadro Row(s) localizado no centro da janela e a varivel cujas categorias desejamos dispostas nas colunas para o quadro Column(s). Note que podemos colocar mais do que uma varivel nos quadros Column(s) e Row(s). Entretanto, atravs do comando Crosstabs sero construdas vrias tabelas de dupla entrada a partir de combinao das variveis duas a duas. Se voc deseja construir uma tabela com mais de duas entradas (envolvendo 3 variveis ou mais) voc pode usar o quadro Layer, porm voc ter opes ilimitadas de estatsticas e customizao; neste caso, o mdulo Tables indicado, j que ele possui recursos avanados para a customizao e criao de tabelas. Suponha que estamos interessados em verificar se existe alguma associao entre a preferncia religiosa e a regio do pas nos E.U.A., abrindo, para isso, o arquivo GSS93Treinamento.sav. Moveremos ento a varivel Regio (regio4) para o quadro Column(s) e Preferncia religiosa (religio) para o quadro Row(s). Se voc marcar a opo Display clustered bar charts sero feitos grficos de barras com as variveis pedidas e a opo Suppress tables faz com que nenhuma tabela seja feita; apenas as estatsticas, testes e grficos pedidos sero mostrados na janela de sadas.

SPSS Treinamento

pag. 68

Aparece ainda na janela quatro pequenos botes (ou trs, caso voc no tenha o mdulo SPSS Exact Tests instalado) na parte inferior:
Exact - como dito acima, essa opo s estar disponvel se o mdulo

Exact Tests for instalado; indicado para estudos onde as suposies dos testes assintticos no esto satisfeitas (por exemplo, uma amostra pequena); apresenta dois procedimentos para clculo do nvel descritivo: mtodo Monte Cano (baseado em sirnulaes) e o mtodo Exato (ver Figura VI-18);
Statistics - deve ser usado para selecionar os testes estatsticos que

sero realizados; note que so apresentados nesse quadro catorze testes estatsticos diferentes; cada um deles apropriado para verificarmos suposies diferentes sobre as variveis em questo (ver Figura VI-19); vamos selecionar a estatstica Chi-square que usada para testar a hiptese de que as variveis que definem as linhas e colunas so independentes;

Celis - essa opo usada para escolha das medidas que sero

apresentadas em cada uma das clulas da tabela (ver Figura VI-20); as possveis medidas apresentadas so: frequncias ou valores observados (Counts.. Observed); valores esperados, isto , frequncias calculadas assumindo que as variveis so independentes (Counts.. Expected); porcentagens por linha, coluna e total (Percentages.. Row, Column e

SPSS Treinamento

pag. 69

Total) e vrios tipos de resduos, que so a diferena entre o valor observado e esperado (quadro Residuais); pediremos, para nosso exemplo, os valores observados e as porcentagens por coluna; 1 Format - usada apenas para escolher a ordem em que as categorias (valores) da varivel apresentada nas linhas da tabela sero apresentadas (Row Order), que pode ser crescente ou decrescente (Ascending ou Descending);

SPSS Treinamento

pag. 70

O passo mais importante agora saber interpretar todos os resultados presentes na janela de sadas, seno todo o trabalho que tivemos at agora foi apenas perda de tempo A Figura 11-21 apresenta o resultado da tabela de dupla entrada feita atravs do procedimento Crosstabs Note que dentro de cada clula so apresentados os dois valores pedidos: Count que representa a frequncia e % within Region representando a porcentagem sobre a coluna (a varivel Regio). Essa disposio pode ser facilmente modificada usando os cones de organizao como j visto; note na Figura 11-21 a diferena com a tabela que voc tem na tela do seu computador.

SPSS Treinamento

pag. 71

Alm da tabela tambm apresentada na janela de sadas a estatstica de quiquadrado. Atravs dos valores apresentados saberemos se existe alguma evidncia para concluir que as variveis que representam a regio dos E.U.A. e religio so estatisticamente relacionadas (dependentes). Valores das estatsticas de qui-quadrado de Pearson e da razo de verossimilhana so apresentados; a mais usada e conhecida a de Pearson, que no nosso caso tem valor 109.104. Como o nvel de significncia, Asymp. Sig. (ver Figura VI22), associado a essa estatstica muito baixo (menor que 0.0965) temos evidncia suficiente para afirmar que as variveis so relacionadas. A terceira linha da tabela nos mostra uma estatstica (Lineai-by-Linear Association) que mede a associao linear entre as variveis da linha e da coluna. Esta estatstica no deve ser usada para variveis nominais (nosso caso, por exemplo) e tambm chamada de teste de qui-quadrado de MantelHaenszel.

Voc deve ter percebido que as opes disponveis em Reports e Descriptive Statistics para anlise descritiva so usadas para obter diferentes informaes sobre os dados. importante lembrar que, embora o SPSS seja um software muito fcil de operar, o bom senso do usurio fundamental; em outras palavras, a cada passo que pretendemos dar, preciso pensar antes se a anlise faz sentido ou no, pois se pedirmos ao SPSS que calcule a mdia para a varivel estcivil do nosso arquivo Lazer.sav, ele o far, mas a resposta obtida certamente no far sentido algum. SPSS Treinamento 5. Exerccios 1 Abra o arquivo Novobanco.sav. Construa uma tabela usando o procedimento OLAP Cubes para mostrar o nmero de casos, mdia, desvio padro e percentual sobre o nmero total de casos das variveis Anos de Estudo (estudo), Salrio Atual (salrio) e Experincia Prvia (exp ant). Para visualizar subgrupos, use as variveis Sexo, Pertence a alguma minoria tnica? (minoria) e Categoria de Emprego (catemp). 2- Utilize o procedimento Frequencies presente no menu Analyze.. Descriptive Statistics para estudar o comportamento das variveis Sexo e Categoria de Emprego (catemp). Pea ainda atravs desse procedimento um grfico de pag. 72

barras para cada uma das variveis e faa uma anlise dos mesmos posteriormente. 3 - Analise o comportamento das variveis Salrio Inicial (salarin), Salrio Atual (salrio) e Porcentagem de Aumento (percent) atravs do clculo das seguintes estatsticas: mdia, mnimo, mld.mo e desvio-padro. Utilize o procedimento Descriptives. 4 - Construa tabelas de dupla entrada atravs do procedimento Crosstabs para as variveis Faixa Salarial (faixasal) e Sexp.. Apresente em cada clula o valor observado e a porcentagem pela coluna. Pea tambm o clculo da estatstica de qui-quadrado. Baseado nos resultados, que concluses voc pode tirar a respeito da relao entre as variveis? 5 - Construa um cruzamento entre as variveis Faixa Salarial (faixasal) nas colunas e pertence a alguma minoria tnica? (minoria) nas linhas, dividindo por Sexo. Utilize o procedimento Crosstabs e faa uso do quadro Layer para fazer a diviso por sexo. 6 - Edite a tabela feita no exerccio anterior, mostrando apenas as mulheres, mudando a varivel Faixa Salarial (faixasal) para as linhas e Pertence a alguma minoria tnica? (minoria) para as colunas. Selecione algumas clulas e modifique a cor, coloque em negrito e centralize seu contedo.

SPSS Treinamento VII. Grficos No interativos

pag. 73

Abordaremos nesse captulo aspectos elementares para produo de grficos nointerativos3 no SPSS. A maneira com que a informao apresentada nos grficos permite uma interpretao mais fcil e intuitiva dos dados. Isso faz
3 A partir da verso 8.0 do SPSS existem dois tipos de grficos: interativos e nointerativos. As principais diferenas do grfico interativo para o no-interativo que voc tm muitas outras opes para edio, pode arrastar e largar variveis e atualizar o grfico, dividi-lo em painis mltiplos para comparao lado a lado e col-lo em outras aplicaes como objetos Active-X. Posteriormente estudaremos essa opo.

com que eles sejam uma ferramenta muito importante para anlise exploratria dos dados. Como j foi mencionado, no menu Graphs que encontramos todos os tipos de grficos gerados pelo SPSS. Esse menu apresenta mais de 10 tipos de grficos diferentes. A deciso sobre qual dos tipos mais adequado vai depender do tipo de varivel(eis) que voc possui e da informao que voc quer obter sobre elas. Precisamos ter alguns cuidados para no produzir grficos que no trazem informao relevante ao nosso estudo, como por exemplo um grfico de barras (Bar) para uma varivel que contenha o valor da altura das pessoas. Vamos discutir a construo e aplicabilidade dos grficos do tipo pizza, barras e diagrama de disperso. 1. Grfico de pizza Para estudar o gnero de peas de teatro preferido das pessoas vamos construir um grfico de pizza. Selecionamos a opo Pie do menu Graphs. Devemos decidir entre as trs opes que so apresentadas na Figura VII- 1.

SPSS Treinamento

pag. 74

Cada uma das opes apresentadas adequada para uma situao diferente:

Depois de escolhida a opo a ser usada, no nosso caso a primeira, basta clicar Define e uma janela para definio do grfico aberta (ver Figura Vll-2). Devemos mover para o quadro Define Slices by a varivel cujas categorias definiro os pedaos da pizza, no nosso caso Qual seu estilo preferido de peas (peas). A largura de cada pedao determinada pela funo escolhida no quadro Slices Represent. As seguintes opes esto disponveis:

Alm das opes descritas acima, ainda podemos dar um ttulo ao grfico atravs do boto Tities, no canto inferior direito; escolher opes referentes ao tratamento dado a valores ausentes atravs do boto Options ou fazer uso da opo Template, que ser comentada adiante. SPSS Treinamento pag. 75

Para o tipo de pea preferido podemos usar, por exemplo,o nmero de casos (N o! cases) para determinar a largura dos pedaos da pizza. Vamos acrescentar um ttulo e uma legenda ao nosso grfico, bastando para isso, clicar em Titles, escolher um ttulo, subttulo e/ou legenda e clicar em Continue.

Agora basta clicar 0K. O SPSS desenha o grfico e o apresenta na janela de sadas (ver Figura VII-4). SPSS Treinamento pag. 76

Notamos que o gnero de pea preferido das pessoas a comdia. A mesma porcentagem de pessoas prefere os gneros tragdia e musical. Alm disso urna porcentagem razoavelmente grande de pessoas no opinou sobre o gnero teatral preferido. possvel que essas pessoas no frequentam teatros. O grfico apresentado pelo SPSS pode no estar exatamente no formato que voc deseja. Porm com algumas edies voc pode modificar muito a apresentao do seu grfico. Essas modificaes so feitas atravs de uma janela prpria para a edio de grficos no interativos gerados pelo SPSS. Para transferir um grfico da janela de sadas para sua prpria janela de edio basta clicar duas vezes sobre ele.

Isso feito o grfico de pizza aparece agora em uma outra janela de nome Chart 1 - SPSS Chart Editor. Note que nessa janela uma nova barra de ferramentas apresentada, alm de um novo grupo de menus. E atravs dessas ferramentas que faremos as modificaes desejadas. SPSS Treinamento a) Omitindo pedaos da pizza Voc pode decidir quais dos pedaos da pizza omitir sem ter que redefinir todo o grfico. O menu Series permite que voc especifique quais pedaos que voc deseja omitir (alm d outras modificaes diferentes para outros tipos de grfico). Podemos, por exemplo, omitir o pedao que contm os valores ausentes. Para isso basta clicar o menu Series.. Displayed (ver Figura VII-5). Abre-se uma janela que possui um quadro chamado Slices na parte inferior. Todas as categorias presentes no lado direito, Display, sero mostradas no grfico. Para omiti.r alguma dessas categorias basta mov-las para o quadro no canto esquerdo, Omit. Dessa maneira moveremos a categoria Missing para o quadro Omit e clicamos 0K. A Figura Vll-6 apresenta o grfico j sem os valores ausentes. pag. 77

SPSS Treinamento

pag. 78

Para destacar um ou mais pedaos do seu grfico, voc pode explodi-lo. Para isso, basta selecionar o pedao desejado (clicando em tal pedao) e clicar no cone ou clicar no menu Format.. Explode Slice. Por exemplo, podemos explodir a categoria musical, destacando-a das demais (veja Figura VII-7)

SPSS Treinamento

pag. 79

Para a construo do novo grfico voc tem a opo de substituir o grfico de pizza clicando em Replace. Isso significa que o SPSS desenha o grfico de barras na mesma janela em que est o grfico de pizza e voc perde a customizao j feita para o mesmo. A Figura VII-9 apresenta o novo grfico.

Algumas mudanas tambm podem ser feitas nesse grfico. Podemos sombrear, mudar a cor e o padro das barras, etc... SPSS Treinamento a) Grficos de barras envolvendo mais de uma varivel O grfico de barras da Figura VlI-9 apresenta a distribuio do tipo de pea favorita de todas os respondentes. Voc pode criar, no SPSS um grfico de barras do tipo agrupado. Nesse caso uma outra varivel categrica pode ser usada alm do tipo de pea favorita, por exemplo, sexo. A informao obtida no grfico (se as barras representarem o nmero de casos) equivalente obtida a partir de uma tabela de dupla entrada, ou seja, o grfico apresentar o gnero de pea favorito dos homens e mulheres. Para definir tal grfico temos que selecionar no menu Graphs.. Bar, a opo Clustered. Uma janela aberta na qual faremos a opo pelo tipo Clustered (ver Figura VII-10). pag. 81

O quadro Data in Chart Are apresenta as mesmas opes do grfico do tipo Pie, que j foram discutidas anteriormente na pgina 73. No nosso caso escolheremos a opo Summaries for groups of cases. Para especificar as variveis que definiro o grfico devemos clicar o quadro Define no canto superior direito. A janela de definio aberta (ver Figura Villi). O quadro Bars Represent apresenta as mesmas opes do quadro Slices Represent presentes no grfico do tipo Pie, que j foram discutidas na pgina 75. Escolheremos a opo Nof cases, para que as barras representem o nmero de casos. Opes como insero de ttulo (Tities) utilizao de Template e o quadro Options (para tratamento dos valores ausentes) tambm esto presentes nessa janela. SPSS Treinamento pag. 82

Ainda falta informar ao SPSS quais variveis iro compor o grfico. Para isso dois quadros foram reservados: 1 Category Axis - a varivel escolhida para ocupar esse quadro definir as categorias presentes no eixo horizontal do grfico; f Define Clusters by - as categoria da varivel escolhida para ocupar esse quadro determinaro o nmero de barras que sero apresentados para cada categoria da varivel usada como Category Axis; cada uma das barras definidas pelas categorias dessa varivel receber uma cor diferente; No nosso caso usaremos o Sexo como Category Axis e Qual seu estilo preferido de peas (peas) como varivel de definio de Cluster.

Aps todas as definies basta clicar 0K e o SPSS desenha o grfico na janela de sadas. A Figura VII-12 apresenta o grfico resultante. Faremos agora algumas modificaes no grfico para melhorar seu aspecto, movendo-o para a janela de edio como descrito anteriormente.

SPSS Treinamento

pag. 83

Dois cones presentes na barra de ferramentas so responsveis pela mudana de padro e cor dos objetos selecionados (por exemplo, barras, rtulos, ttulos, molduras etc.). Estes cones so: e respectivamente. Mudaremos em primeiro lugar o padro das barras. Precisamos escolher a(s) barra(s) para as quais desejamos efetuar a mudana, fazendo isso com um dique do mouse dentro da barra. Vamos selecionar por exemplo a(s) barra(s) referente(s) ao gnero comdia. Agora basta um dique no cone e uma janela com oito tipos de padres diferentes aberta (ver Figura VII-13). Escolhemos aquele que mais nos agrada com um dique. Para validar a mudana basta clicar Apply no canto superior direito. Para fechar essa janela basta clicar Close.

SPSS Treinamento

pag. 84

Abriremos agora a janela para mudana de cor. Precisamos escolher a(s) barra(s) para as quais desejamos efetuar a mudana com um dique de mouse dentro da(s) barra(s). Vamos selecionar por exemplo a barra referente ao gnero tragdia. Agora basta um dique de mouse no cone e uma janela para mudana de cor aberta (ver Figura VII-14).

Escolhemos a cor desejada com um dique em uma das 16 opes apresentadas ou podemos criar a cor desejada atravs do quadro Edit no canto

inferior direito. Para validar a mudana basta clicar Apply no canto superior direito. Para fechar essa janela basta cicar Close. c) Mudando o estilo dos rtulos e barras O estilo das barras tambm pode ser mudado no SPSS. Trs estilos diferentes para grficos no interativos esto disponveis. Com um dique no cone abrimos a janela para SPSS Treinamento pag. 85

mudana de estilo (ver Figura VII-15). Os trs estilos disponveis so: simples (Normal), sombreado (Drop shadow) e tridimensional (3-D effect).

Escolhendo estilo sombreado ou tridimensional, ainda podemos optar pela profundidade do efeito, atravs da opo Depth presente no canto inferior esquerdo. Como padro, o valor presente nesse quadro 20. Vamos optar pelo efeito tridimensional. Para validar a mudana basta dicar Apply Ali. Para fechar essa janela basta clicar Close. Podemos inserir rtulos com valores que representam o nmero de casos em cada barra. Os rtulos sero apresentados dentro das barras e podem ser customizados. Com um dique no cone abrimos a janela que nos permite inserilos (ver Figura VII-16). Trs opes esto disponveis: sem rtulos (None),

insero dos nmeros (Standard), insero dos nmeros dentro de uma moldura (Framed).

Escolheremos a opo Framed. Para validar a opo, clicamos o quadro Apply Ali. Para fechar essa janela basta clicar Close. SPSS Treinamento d) Mudando as opes das fontes grficas das selees Podemos mudar o tipo e tamanho da fonte de qualquer seleo do grfico, como ttulos, legendas, anotaes etc.; para isso, basta selecionarmos o objeto pag. 86

que gostaramos de modificar e clicar no cone

, que far com que uma

janela seja aberta (ver Figura I-17), a qual poderemos fazer as mudanas desejadas. Aps escolher a fonte e o tamanho, dique em Apply.

A orientao das barras tambm pode ser mudada de vertical para horizontal e

vice- versa. Para isso basta clicar o cone e) O menu Chart

Vrias outras mudanas importantes, como insero de ttulo, rtulos dos eixos, linhas de referncia, anotaes, incluso ou excluso de moldura interna ou externa, etc., podem ser efetuadas atravs do menu Chart. Tomaremos como exemplo a criao de uma anotao no grfico; para isso, escolha a opo Annotation do menu Chart e uma janela ser aberta (ver Figura Vll-18). Nessa janela voc pode escolher o texto, a justificao, a incluso de uma moldura em torno texto e a posio no eixo das categorias e eixo Y. Feita a definio da sua anotao, no esquea de clicar em Add. SPSS Treinamento pag. 87

O grfico resultante aps todas as mudanas apresentado na Figura VII-19.

SPSS Treinamento 3. Diagramas de disperso

pag. 88

Os grficos de barras e pizza vistos anteriormente so indicados para variveis categricas (nominais ou ordinais). Estudaremos agora um outro tipo de grfico que indicado para variveis escalares. Na pesquisa sobre lazer realizada foram coletadas as seguintes variveis: horas de trabalho por semana (trabalho) e horas gastas com lazer por semana (lazer). razovel imaginar que quanto mais a pessoa trabalha menos tempo ela tem para gastar com lazer. O diagrama de disperso um grfico que vai nos ajudar a investigar se essa relao entre as horas de trabalho e lazer plausvel. Um diagrama de disperso um grfico que apresenta em cada um dos eixos (dois eixos no nosso caso) os valores das variveis em questo. Pala nosso exemplo, os valores das horas de trabalho podem ser apresentados no eixo X (horizontal) e os valores das horas de lazer no eixo Y (vertical). Para cada respondente um ponto ser plotado. Uma vez na janela de dados ou na janela de sadas, basta clicar a opo Scatter no menu Graphs e uma janela aberta (ver Figura /11-20). atravs dessa janela que escolheremos o tipo de diagrama de disperso adequado ao nosso estudo.

Simple - nesse tipo de grfico para cada caso um ponto plotado; cada

ponto representa os valores de duas variveis;


Overlay - esse tipo de grfico permite a sobreposio de vrios grficos

do tipo Simple;
Matrix - essa opo permite a construo de uma matriz quadrada de

diagramas de disperso do tipo Si.mple; so construdos dois diagramas para cada combinao das variveis especificadas, sempre duas a duas;
3-D - nesse tipo de grfico para cada caso da janela de dados um ponto

plotado; cada ponto representa os valores de trs varivei.s; os pontos so plotados em um sistema de coordenadas tridimensional que pode ser rotacionado posteriormente; SPSS Treinamento pag. 89

Como temos interesse na relao entre duas variveis apenas, o tipo indicado para nosso caso o Simple. A janela para definio do grfico acessada atravs do boto Define no canto superior direito. A Figura VII-21 apresenta essa janela.

Podemos mover variveis para quatro quadros presentes na parte central da janela de definio:
Y Axis - a varivel escolhida para esse quadro vai determinar a posio

vertical de cada ponto no grfico;


X Axis - a varivel escolhida para esse quadro vai determinar a posio

horizontal de cada ponto no grfico;


Set Markers by - os pontos referentes a cada uma das categorias dessa

varivel sero apresentados em cores ou marcadores diferentes no grfico;


Label Cases by - voc pode ver os valores da varivel escolhida para

esse quadro plotados em cima de determinados pontos do diagrama de disperso, usando posteriormente o cone na janela de edio. Se

rtulos foram definidos para essa varivel,eles sero plotados ao invs dos valores;

SPSS Treinamento

pag. 90

Escolheremos a varivel horas gastas com lazer por semana (lazer) para o quadro Y Axis, horas de trabalho por semana (trabalho) para X Axis, sexo para Set Marker by e estado civil (estcivil) para Label Cases by. Opes como insero de ttulo (Tities), utilizao de Template e o quadro Options tambm esto presentes nessa janela. Depois de feitas todas as definies basta clicar 0K e o SPSS apresenta o grfico resultante na janela de sadas. Clicando duas vezes no grfico, voc entrar na janela de edio, onde poder, por exemplo, mudar o tamanho e o

estilo dos marcadores do grfico clicando no cone

(ver Figura VII-22)

ou mudar o tipo de interpolao de linha clicando em disperso.

. Note que no faz

sentido mudar a interpolao de linha no nosso exemplo de grfico de

Nosso grfico de disperso, com estilo e tamanho dos marcadores modificados, est na Figura /11-23.

SPSS Treinamento

pag. 91

Por causa do nmero pequeno de pontos, fica difcil dizer algo sobre a possvel relao entre as duas variveis; talvez fosse necessrio realizar uma nova pesquisa com um nmero maior de casos. Alm disso, lembre-se que sempre que voc estiver falando de um grfico seus resultados no sero conclusivos. O grfico serve para nos dar indicaes sobre as hipteses que levantamos e no concluses. Os dados apresentados no grfico so baseados apenas nas pessoas que responderam o questionrio (amostra) e no na populao toda. Para podermos concluir, com um certo grau de confiabilidade, se existe relao entre as horas de trabalho e as horas de lazer precisamos fazer um teste estatstico (anlise inferencial). Lembrando, claro, que para toda anlise inferencial existe um erro associado. 4. Templates e exportao de grficos Como vimos anteriormente a produo de grficos no SPSS feita de maneira muito simples atravs do menu Graphs. Escolhemos, dentre as muitas opes, o tipo de grfico adequado e especificamos a(s) varivel(eis) juntamente com o tipo de resumo desejado. Alm disso podemos especificar ttulo, subttulo e nota de rodap. Uma vez pronto, o grfico colocado na janela de sadas e pode ainda ser modificado atravs de sua prpria janela de edio. SPSS Treinamento pag. 92

Vamos supor que desejamos produzir uma srie de grficos similares. Algumas caractersticas como ttulo, subttulo, tipo de letra, cor e padro podem ser aplicados a vrios grficos ao mesmo tempo, sem a necessidade de especificlas novamente para cada um dos grficos separadamente. Isso pode ser feito, no SPSS, atravs da criao de Templates Grficos. Para construir um template grfico, hasta editar um grfico e salv-lo como template grfico, escolhendo a opo Save Chart Template do menu File da janela de edio de grficos. Note que o arquivo salvo ter a terminao .sct (de SPSS Chart Template). Quando voc for utilizar um template, voc ter duas opes para aplic-lo no seu grfico:

1. Na janela de criao do grfico, marcar a opo Use chart specifications from, dicar em File e escolher algum arquivo de template grfico; 2. Na janela de edio do grfico, escolher a opo Apply Chart Template do menu Format, escolher algum arquivo de template grfico e dicar em Open Ainda na janela de edio de grficos, voc pode exportar o seu grfico escolhendo um dos formatos disponveis no SPSS: JPEG (padro), CGM, PNG, Macintosh PICT, PostScript, TIF, Windows Bitmap (BMP) e Windows Metafile (WMF). Para export-lo, selecione a opo Export Chart do menu File, escolha o formato em Save as Type, um nome para o arquivo a ser criado e dique em Save. A Figura VIl-24 mostra a janela de exportao de grficos com suas opes de formatos.

SPSS Treinamento VIII. Manipulao de Dados 1. Ordenao de casos

pag. 94

Antes de realizarmos qualquer anlise comum termos que preparar os dados para que possamos obter a informao desejada. Uma das necessidades na hora da manipulao dos dados em nosso dia a dia a ordenao dos casos segundo uma ou mais variveis. Para fazer isso no SPSS voc pode usar o procedimento Sort Cases presente no menu Data. Aps clicar o menu Data, opo Sort Cases, uma janela aberta (ver Figura VIll-1). Movemos para o quadro Sort by a varivel segundo a qual o arquivo deve ser ordenado. Podemos mover para esse quadro mais do que uma varivel. Nesse caso o arquivo ordenado, em primeiro lugar, pelos valores da primeira varivel presente no quadro e em segundo lugar pela segunda varivel presente no quadro; a segunda ordenao feita para os valores comuns da primeira varivel e assim por diante.

Podemos escolher tambm entre ordem crescente ou decrescente de ordenao para cada uma das variveis. Isso feito atravs do quadro Sort Order, opes Descending (decrescente) ou Ascending (crescente). Vamos fazer uma ordenao segundo sexo (ordem crescente) e idade (ordem decrescente). Para isso movemos a varivel sexo para o quadro Sort by e escolhemos a opo Ascending no quadro Sort Order. Movemos em seguida a varivel ida de para o quadro Sort by e escolhemos a opo Descending no quadro Sort Order. Agora basta clicar 0K para validar a ordenao.

SPSS Treinamento

pag. 95

Voc pode notar na Figura \TIII1 que aparece a letra A (ou a palavra Ascending) na frente da varivel sexo e a letra D (ou a palavra Descending) na frente da varivel idade. Isso indica a ordem pela qual ser feita o ordenao para cada uma das variveis. A Figura \TIII-2 mostra a janela de dados aps a ordenao. Note que as 19 primeiras linhas contm informaes referente a pessoas do sexo masculino (sexo=1); alm disso a primeira linha do arquivo contm as informaes do homem mais velho e a linha 19 do mais jovem. As demais linhas contm as informaes das mulheres (sexo=2) tambm ordenadas pela idade.

Dica sobre ordenao: Voc pode ordenar os dados direto da janela de dados sem usar a opo Sort Cases do menu Data. Para isso, basta selecionar as variveis que definem a ordenao (voc pode usar as teclas Ctrl ou Shift para selecionar vrias variveis), cicar com o boto direito do mouse no nome de qualquer uma das variveis selecionadas e escolher Sort Ascending ou Sort Descending. SPSS Treinamento 2. Seleo de casos Outra grande necessidade a seleo (temporria ou permanente) de parte do arquivo de dados. Digamos que estamos interessados em estudar um segmento especfico da amostra O SPSS possui vrias formas de seleo de dados. Falaremos nessa seo de todas elas, mas discutiremos detalhadamente a mais usada de todas. Para maiores detalhes sobre as demais formas de seleo recomenda-se que o leitor use o manual do SPSS for Windows. Para fazer qualquer tipo de seleo devemos clicar o menu Data opo Select Cases ou clicar no cone . A janela aberta apresentada na Figura Vffl-3. pag. 96

No quadro central Select esto presentes cinco opes diferentes para seleo. Faremos a seguir uma breve descrio de cada uma delas.
Ali cases - opo usada como padro; utiliza todas as observaes do

banco de dados;
If condition is satisfied - atravs dessa opo podemos definir

expresses condicionais para seleo de casos; estudaremos essa opo detalhadamente mais adiante;
Random sample of cases - podemos selecionar uma porcentagem

aproximada ou um nmero exato de casos dos n primeiros casos; a seleo feita aleatoriamente; SPSS Treinamento pag. 97

Based on time or case range - usamos essa opo quando estamos

interessados em selecionar uma faixa especfica de valores, por exemplo os casos de nmero 100 at 200; tambm utilizada para fazer

selees baseadas em datas (por exemplo, selecionando todos os dados do ms de fevereiro at outubro);
User filter variable - escolhemos uma varivel no banco de dados e

usamos corno filtro; todos os casos para os quais a varivel filtro assume o valor O ou ausente no sero selecionados. Voc tem duas opes para o tratamento dos casos que no sero selecionados. atravs do quadro Unselected Cases Are que podemos fazer a escolha:
Filtered - os casos (linhas) que no so selecionados no so mcludos

nas anlises posteriores, porm permanecem na janela de dados; caso voc mude de idia e queira usar os casos no selecionados na mesma sesso do SPSS basta desligar o filtro (usando a opo Ali Cases no quadro Select);
Deleted - os casos (linhas) no selecionados so apagados da janela de

dados; caso voc mude de idia e queira usar os casos no selecionados voc dever ler novamente o arquivo de dados original. Suponha que estamos interessados em selecionar as pessoas que tra.balham pelo menos 40 horas por semana e que tm at 20 horas de lazer. A funo condicional para seleo nesse caso dada por: trabalho >= 40 AND lazer < 20 Portanto o tipo de seleo de dados que faremos deve possibilitar a criao de sentenas matemticas lgicas para seleo dos casos. Para isso, clicamos em If condition is satisfied, e entramos na caixa de dilogo If.... Atravs da janela que aberta (ver Figura VlII-4) usamos o quadro superior para escrever uma funo lgica na qual a seleo vai ser baseada. Para a construo da funo podemos usar todas as variveis que esto no quadro esquerda e as funes disponveis no quadro inferior direito.

Uma vez escrita a funo que determina a regra de seleo dos casos, dique Continue, e voc voltar janela anterior. No quadro inferior (Unselect cases are), vamos optar pelo modo Filtered (ou seja, os casos no selecionados permanecem na tela de dados, porm no sero utilizados em anlises futuras) e clicar 0K. Voc pode perceber que depois de feita a seleo, a janela de dados sofre algumas alteraes (ver Figura VII1-5). As linhas (casos) que no foram selecionadas apresentam uma listra no canto esquerdo da janela de dados. A barra de status ,localizada na parte inferior da janela, apresenta a mensagem Filter On. Alm disso uma varivel de nome filter_$ adicionada janela de dados. Essa nova varivel apresenta valor O para as linhas que no foram selecionadas e valor 1 para as linhas que foram selecionadas. Apesar de voc conseguir ver os casos que no foram selecionados qualquer anlise efetuada da pra frente no levar em conta esses casos. A Figura VIII-6 apresenta o resultado de uma anlise descritiva feita atravs do menu Analyze.. Descriptive Statistics.. Descriptives para a varivel trabalho.

Note que o nmero mdio de horas trabalhadas 43.06, o valor mnimo 40 horas e apenas 16 observaes foram usadas para esses clculos. Isso parece bvio, j que usamos trabalho >=40 como parte do critrio de seleo. SPSS Treinamento pag. 99

Podemos mudar de ideia e querer usar todas as observaes para o clculo das estatsticas. Temos duas maneiras de cancelar a seleo de casos, se a opo Fiitered foi usada para efetuar a seleo. A primeira delas ativar a opo Ali Cases da janela de seleo de casos (opo Select Cases do menu Data) e clicar 0K. A segunda maneira apagar a varivel filter $ do banco de dados. Usando agora a mesma opo do menu Analyze.. Descriptive Statistics para a varivel trabalho o resultado apresentado na Figura VlII-7 bem diferente do apresentado anteriormente, quando a seleo de casos estava ativa.

SPSS Treinamento

pag. 100

Note que o nmero de casos usados nos clculos passou de 16 para 30, a mdia de horas trabalhadas abaixou para 37,90 e agora o mnimo de horas trabalhadas 0 horas. 3. Procedimento Split File Vamos supor agora que aps uma srie de anlises chegamos concluso de que o comportamento dos homens e das mulheres so completamente diferentes com relao as preferncias para horas de lazer. No faz sentido, portanto, apresentar a anlise do questionrio de opinio sobre lazer com os homens e mulheres juntos. No fundo o que pretendemos fazer, daqui pra frente, so duas anlises idnticas, uma para cada sexo. Para esse tipo de situao podemos utilizar o procedimento Split File, presente no menu Data ou acessado atravs do cone (ver Figura VllI-8). Como padro sempre analisamos todos os casos juntos, sem separao por grupos. Por esse motivo a opo selecionada na janela Analyse ali cases. Podemos separar a anlise de acordo com as categorias da varivel escolhida (ou combinao das categorias de vrias variveis, se for o caso) escolhendo Compare groups ou Organize output by groups. A opo Compare groups faz com que os grupos sejam apresentados juntos para comparao e a opo

Organize output by groups mostra os resultados de cada procedimento do SPSS organizados separadamente para cada grupo 4. Escolhida uma das duas ultimas opes, podemos mover para o quadro Groups based on a varivel (ou variveis) que definiro os grupos para os quais a anlise deve ser repetida. Se mais do que uma varivel for selecionada, os grupos sero definidos pela combinao das categorias de todas as variveis. Podemos ainda escolher se o banco de dados deve ser ordenado pela varivel que definir os grupos (Sort the file by group variables) ou se nenhuma ordenao deve ser feita ( File is aiready sorted). Tenha em mente que, se o arquivo no estiver ordenado por essas variveis, o procedimento Split File no funcionar corretamente. SPSS Treinamento pag. 101

No nosso caso selecionamos Organize output by groups, escolhemos a varivel sexo e movemos para o quadro Groups Based on e cicamos 0k. A
4 Esta diferena s vale para as tabelas (pivot tables). Para os outros tipos de sada essas duas opes so idnticas.

nica mudana que acontece na janela de dados a mensagem Split File On na barra de status. Porm qualquer anlise ou grfico feitos de agora em diante vo gerar dois resultados, um para os homens e outro para as mulheres. A Figura \TIll-9 apresenta o resultado de uma anlise descritiva feita atravs do menu Analyze..Descriptive Statistics.. Descriptives para a varivel trabalho usando a opo Organize output by groups. Note que os resultados so apresentados separadamente para cada categoria da varivel sexo. SPSS Treinamento pag. 102

Podemos mudar de ideia e querer usar todas as observaes para o clculo das estatsticas. Para cancelar o procedimento Split File basta ativar a opo Anaiyse ali cases presente na janela de definio da opo Split File no menu Data. 4. Procedimento Aggregate

O procedimento Aggregate combina grupos de casos em um nico caso e cria um novo banco de dados agregados. Os casos so agregados baseados fios valores de uma ou mais variveis. O novo arquivo conter um caso para cada grupo. Por exemplo, suponha que voc tenha um banco de dados onde cada caso representa um municpio do Brasil; voc poderia agregar esses dados criando um novo arquivo com uma linha para cada estado. Como exemplo, usaremos o arquivo Rede de FastFood.sav, que contm dados sobre itens de vrias redes de fast food norte americanas. Nosso objetivo criar um arquivo que SPSS Treinamento pag. 103

contenha uma linha para cada rede, tendo como variveis o preo mdio dos itens, a quantidade mdia de gordura, de calorias, etc. Para isso devemos ento selecionar a opo Aggregate... do menu Data. Na janela aberta (ver Figura Viu-lO) temos que escolher uma ou mais variveis que definiro os grupos (Break Varjables); no nosso caso escolheremos rede, que a varivel que contm a rede qo qual o riem pertence. No quadro Aggregate Variable(s) colocamos as variveis que queremos no novo arquivo; note que a funo padro usada para agregar os dados para as variveis a mdia, mas podemos mudar essa funo para qualquer varivel, clicando em Function. Alm disso, voc pode colocar a mesma varivel vrias vezes no quadro Aggregate Variable(s), o que significa que voc pode ter no novo arquivo,vrias colunas representado funes diferentes dessa varivel.

Voc pode ainda, criar uma varivel no novo arquivo que contenha o nmero de casos que foram agregados por grupo. No nosso caso, chamaremos essa varivel de N_itens, representando o nmero de itens que esto sendo estudados por cada cadeia de fastfood. Finalmente, deve ser escolhido se o SPSS salva o resultado num novo arquivo de dados (opo default - Create new file) ou se ele fecha o arquivo atual e mostra o resultado do procedimento aggregate na janela de dados (opo Replace working data file), sendo que voc deve salvar esse arquivo posteriormente. O arquivo criado usando a opo Create new file ser gravado no diretrio corrente com o nome de aggr.sav, mas voc pode mud-lo clicando em File.... SPSS Treinamento pag. 104

O resultado do procedimento pode ser visualizado na Figura Viu-li.

SPSS Treinamento 5. Exerccios

pag. 105

1- Ordene o arquivo Mundo95.sav usando a opo Sort Cases segundo as variveis Regio ou grupo econmico (regio) em ordem crescente e Populao em milhares (populami) em ordem decrescente. 2 - Pea tabelas de frequncia para as variveis Regio ou grupo econmico (regio) e Clima predominante (clima). Aps a aniise de sua sada, faa uma seleo dos pases que tenham Expectativa mdia de vida feminina (expvidaf) menor do que 75 anos e ndice de alfabetismo (aifabet) menor do que 80%. Pea novamente as tabelas e grficos anteriores e compare os resultados. 3 - Certifique-se que todos os casos do banco de dados esto selecionados e construa tabelas de frequncia e grficos de pizza (usando Frequencies) para as variveis Religio predominante (religio) e Clima predominante (clima) para cada categoria da varivel Regio ou grupo econmico (regio). Utilize o procedimento Split File para pedir a quebra por regio. 4 - Um hospital tem um banco de dados sobre seus pacientes contendo uma varivel chamada paciente (representando o cdigo do paciente) e uma outra

varivel chamada data_.int (data da internao do paciente). O hospital gostaria que voc criasse um arquivo com apenas uma linha para cada paciente com uma varivel contendo o nmero de internaes e outra contendo a ltima internao do paciente. Utilize o procedimento Aggregate substituindo o arquivo atual ao invs de gravar um novo arquivo. Os dados para esse exerccio esto no arquivo hospital.sav.

Você também pode gostar