Você está na página 1de 125

SPSS 11.

0
MODULO BASE CONCEITOS E RECURSOS

TREINAMENTO DE SPSS

ndice I. Introduo 1. SPSS....................................................................................................................................4 2. Famlia SPSS for Windows...................................................................................................4 3. Viso geral do SPSS for Windows........................................................................................5 II. Sobre o Banco de Dados 1. Como criar seu prprio banco de dados .............................................................................13 2. Formas de importao e exportao de dados...................................................................17 3. Importao de arquivos de dados do tipo ASCII .................................................................17 III. Transformao de Dados 1. Recodificao usando o procedimento Recode..................................................................26 2. Recodificao automtica de variveis alfanumricas........................................................30 3. Clculo de novas varives usando o procedimento Compute............................................31 IV. Tabelas 1. Usando os cones de organizao......................................................................................34 2. Modificando as clulas .......................................................................................................35 V. Um Pouco de Estatstica Descritiva 1. Nvel de medida das variveis ............................................................................................37 2. Distribuio de freqncias ................................................................................................38 3. Medidas de posio............................................................................................................39 4. Medidas de variabilidade ....................................................................................................41 VI. Comandos do SPSS para Anlise Descritiva 1. OLAP Cubes ......................................................................................................................44 2. Frequencies........................................................................................................................46 3. Descriptives........................................................................................................................50 4. Crosstabs ...........................................................................................................................51 VII. Manipulao de Dados 1. Ordenao de casos ..........................................................................................................55 2. Seleo de casos ...............................................................................................................56 3. Procedimento Split File.......................................................................................................59 4. Procedimento Aggregate ....................................................................................................60 VIII. Arquivos e Janelas Produzidas em uma Sesso SPSS 1. A janela de dados...............................................................................................................62 1. A janela de sintaxe .............................................................................................................67 2. A janela de sadas ..............................................................................................................63 3. Copiando o contedo da janela de sadas ..........................................................................64 4. Formas de exportao........................................................................................................66 6. Customizao das barras de ferramentas ..........................................................................70 IX. Unio de Dois Bancos de Dados 1. Adicionando casos .............................................................................................................73 2. Adicionando variveis.........................................................................................................75

X. Lendo Bancos de_Dados_Usando ODBC .........................................................................78 XI.Grficos Interativos 1. Criando um grfico interativo ..............................................................................................84 2. Editando o grfico...............................................................................................................89 3. Grficos interativos, interativos desvinculados e estticos..................................................93 4. Alterando as variveis que compem o grfico ..................................................................94 5. Chart properties e chartlooks..............................................................................................95 XII. Propriedades e Formatos de uma Tabela 1. Propriedades da tabela.......................................................................................................97 2. Table Looks......................................................................................................................101 3. Criando um grfico a partir de uma tabela ........................................................................102 XIII. Controlando o Ambiente 1. Quadro General................................................................................................................103 10. Quadro Scripts................................................................................................................114 2. Quadro Viewer .................................................................................................................106 3. Quadro Draft Viewer ........................................................................................................107 4. Quadro Output Labels ......................................................................................................107 5. Quadro Charts..................................................................................................................108 6. Quadro Interactive ............................................................................................................109 7. Quadro Pivot Tables.........................................................................................................111 8. Quadro Data.....................................................................................................................112 9. Quadro Currency ..............................................................................................................113 XIV. Apndice 1: Resumo das Opes Estatsticas Presentes no Menu Analyze ..........115 XV. Apndice 2: Alguns Tipos de Arquivos Importantes....................................................125

I. Introduo 1. SPSS O SPSS (Statistical Package for Social Sciences) uma aplicao que proporciona um poderoso tratamento estatstico de dados, combinando pontecialidade grficas com uma gesto de dados. O SPSS apresenta-se como uma aplicao de fcil manuseamento visto que a sua apresentao e o modo como funciona semelhante a qualquer aplicao desenvolvida para Windows, baseada em janelas e menus caractersticos do referido ambiente. Existem outros softwares similares, tais como o SAS, o Minitab, e o Statistica, a maioria deles em ingls. Todos esses softwares so bastante amigveis e tem uma estrutura similar, logo aprender um deles d base para migrar para qualquer outro software. A planilha EXCEL tambm pode ser usada para analisar dados estatsticos, porm para tcnicas mais avanadas tem que se desenvolver rotinas especficas, o que demanda de um bom conhecimento do EXCEL. O SPSS l bancos de dados criados pelo EXCEL, por qualquer banco de dados que crie arquivos com extenso DBF, tais como FOXPRO, ACCESS, dBase, e de dados em ASCII, alm dos dados gerados pelo ORACLE e SQL.

2. Famlia SPSS for Windows A famlia SPSS for Windows formada por dez mdulos: Base, Regression Models, Tables, Advanced Models, Trends, Exact Tests, Categories, Conjoint, Missing Values e Maps. O mdulo Base o mdulo central, com o qual todos os demais interagem. Ele o responsvel pela importao e exportao de arquivos, toda etapa de manipulao e transformao de dados, anlise descritiva, anlise no-paramtrica, anlise inferencial bsica, e toda a produo grfica. Ao adicionar outros mdulos ao Base, estaremos apenas acrescentando novos procedimentos estatsticos, ganhando em termos de opes e complexidade; porm o

acrscimo de outros mdulos no altera o aspecto geral do SPSS. Dessa forma, os mdulos podem ser adquiridos levando em conta a rea de atuao e o trabalho a ser desenvolvido.

3. Viso geral do SPSS for Windows Inicialmente, o SPSS abre uma janela para que comeamos a trabalhar com nossos dados: a janela Untitled - SPSS Data Editor (veja Figura I.1). Na medida em que formos trabalhando, outras podem ser abertas. Cada janela aberta um arquivo em potencial, ou seja, pode ser armazenado, impresso, copiado para outras janelas, etc.

Barra de Menus Barra de Ferramentas

Visualizao e edio de dados Definir variveis

Barra de Status
Figura1-1: janela Untitled SPSS Data Editor

O menu File (ver Figura I.2) permite que voc tenha controle sobre tudo que se refere ao gerenciamento de arquivos, como importao, exportao, impresso e salvamento.

O primeiro bloco desse menu destina-se abertura de arquivos, seja ele um banco de dados, uma janela de sadas produzida anteriormente ou uma janela de sintaxe. Os tipos de bancos de dados que podem ser lidos diretamente pelo SPSS so os mais diversos, desde do formato ASCII (texto) at bancos em formato Lotus123, Excel, dBase, entre outros e, so claro, arquivos produzidos pelo prprio SPSS nas suas diferentes verses. A opo New inicializa um novo banco de dados ou outro tipo de janela, a opo Open abre um arquivo diretamente, a opo Open Database... serve para voc ler arquivos de vrios bancos de dados diferentes atravs de ODBC, e a opo Read Text Data abre um wizard para auxili-lo na leitura de um arquivo em formato texto. O segundo bloco do menu File tem por funo salvar qualquer janela do SPSS; assim se estivermos na janela Sadas, podemos salvar os resultados obtidos em uma anlise estatstica atravs da opo Save, etc. O software permite ainda salvar um banco de dados criado no SPSS em um outro formato, assim como no prprio formato SPSS.

Figura I-2: Menu File

No terceiro bloco de File, voc pode obter informaes sobre o contedo do seu banco de dados usando a opo Display Data Info, aplicar definies de variveis estabelecidas em um outro arquivo do SPSS com Apply Data Dictionary ou forar a criao de um arquivo de dados temporrio em Cache Data. No quarto bloco de File est localizada a opo de impresso (em Print) de qualquer janela que esteja ativa. Finalmente, temos a opo de parar o processador do SPSS (atravs de Stop Processor), conectar-se a um servidor para executar anlises em bancos de dados maiores (desde que voc tenha um mdulo servidor do SPSS), a lista de arquivos recentemente utilizados e a opo Exit para voc fechar o SPSS. O menu Edit (ver Figura I.3) traz comandos relacionados edio, que podem ser diferentes de acordo com a janela que estiver ativa. Se estivermos na janela de dados, podemos utilizar os recursos Cut e Paste para cortar e colar, respectivamente, um conjunto de dados de um lugar para outro. No ltimo bloco do menu Edit, temos o comando Options..., onde podemos definir os principais parmetros do SPSS, como o padro para o tipo da varivel (o padro do SPSS Numeric8.2, i.e., varivel numrica com 8 dgitos, sendo que os 2 ltimos so casas decimais), ou ainda o tamanho e fonte dos ttulos na janela de sadas entre muitas outras. Todas as opes do comando Options... sero estudadas detalhadamente mais adiante.

Figura I.3: Menu Edit

Pelo menu View (ver Figura I.4) voc escolhe como sero mostrados os dados na janela Data Editor (usando as opes Fonts..., Grid Lines e Value Labels). Por esse menu tambm possvel disponibilizar ou no atravs da opo Status Bar, a barra inferior,

chamada de barra de status, que contm algumas mensagens importantes sobre o SPSS; e finalmente, atravs da opo ToolBars... voc pode customizar a(s) barra(s) de ferramentas, podendo inclusive, criar uma barra totalmente nova.

Figura I.4: Menu View

O menu Data traz funes relacionadas a manipulao dos dados . Comandos como definio de datas, ordenao do banco de dados, juno de arquivos em formato SPSS, seleo de casos do arquivo de dados para trabalho, ponderao de valores, etc, fazem parte das opes desse menu (ver Figura I.5).

Figura I.5: Menu Data

A etapa de transformao dos dados concentra-se basicamente no menu Transform. Recursos como criao de novas variveis a partir das j existentes, recodificao de valores do banco de dados, e at mesmo interpolao de valores ausentes em uma srie de tempo so algumas das opes desse menu (ver Figura I.6).

Figura I.6: Menu Transform

O menu Analyze (ver Figura I-7) rene todos os procedimentos estatsticos disponveis no SPSS. Este o principal menu que sofre alteraes com a incluso de outros mdulos. A medida que includos mdulos opcionais o nmero de opes (linhas) existentes nesse menu vai aumentando, ou seja, a quantidade de recursos estatsticos vai se tornando cada vez maior e o seu SPSS cada vez mais poderoso.

Figura I.7: Menu Analyze

O menu Graphs contm todos os tipos de grficos que o SPSS oferece. Grficos de seqncia, barras, rea, pizza, boxplot, pareto e cartas de controle so apenas alguns deles (ver Figura I.8). Nesse menu temos a opo de construir grficos interativos e caso voc tenha o mdulo Maps, possvel a construo de mapas no SPSS.

Figura I.8: Menu Graphs

Utilities (ver Figura I-9) um menu que oferece recursos que no so imprescindveis, mas certamente "quebram alguns galhos". Um exemplo obter um resumo da estrutura do seu banco de dados bastando clicar a opo File Info. A opo Variables abre uma janela com informaes sobre as variveis do seu arquivo; clicando em Menu Editor... voc pode customizar os menus do SPSS, criando at mesmo um menu totalmente novo. A principal opo nesse menu Run Script..., onde podemos escolher algum script do SPSS para ser executado (scripts so programas em Visual Basic).

10

Figura I-9: O menu Utilities

Atravs do menu Window do SPSS (ver Figura I-10), voc pode navegar pelas janelas criadas pelo SPSS, bastando escolher a janela desejada e clicar em seu nome; ou voc pode minimizar o SPSS com todas as suas janelas atravs da opo Minimize All Windows.

Figura I-10: O menu Window

O ltimo menu que aparece o Help (ver Figura I-11). A ajuda no SPSS um dos pontos fortes do software, j que ela muito mais do que uma cpia do manual. Quando clicamos em Help, a primeira opo Topics lhe d a chance de escolher entre esclarecimentos do significado de algum termo tcnico ou de algum comando e um ndice remissivo.

11

Figura I-11: O menu Help

Um tutorial do SPSS est disponvel atravs da opo Tutorial. Com ele voc pode obter detalhadamente informaes bsicas do uso do SPSS. A opo SPSS Home Page abre automaticamente a pgina da SPSS norte-americana na Internet. Na opo Syntax Guide voc ter todos os manuais de sintaxe do SPSS. Finalmente, a opo Statistics Coach funciona como um tcnico estatstico. Ele ir fazer a voc algumas perguntas sobre seus dados e o tipo de anlise que voc gostaria de obter, e ento, baseado nas suas respostas, ele lhe indicar o procedimento do SPSS mais apropriado para o seu caso.

12

II. Sobre o Banco de Dados

1. Como criar seu prprio banco de dados Antes de comear a entrar valores na janela de dados, preciso atentar ao fato de que o SPSS tem por regra geral trabalhar com as variveis (campos) definidas em colunas e casos (registros) em linhas. Para definir uma varivel, clique duas vezes no nome da varivel no topo da coluna ou na parte inferior da janela de dados clique em Variable View. Dessa maneira o modo de definio de variveis ser exibido na janela de dados. Nesse modo temos a opo de definir todas as caractersticas que fazem parte de uma varivel: nome, tipo, rtulos, valores ausentes,formato da coluna e o nvel de medida (ver Figura II-1). Para dar um nome varivel, basta digit-lo no espao designado por Name; o nome pode ter no mximo 8 caracteres, sem que haja caracteres especiais, como +, &, \,-, etc. (porm podemos acentuar);

Figura II-1: Modo Definio de variveis

Para alterarmos o tipo da varivel, basta clicar em Type, onde podemos definir a varivel como numrica (numeric), moeda (dollar), data (date), alfanumrica (string), entre outros tipos. Ainda nessa janela voc pode especificar quantos caracteres a varivel ocupa (em Width) e o nmero de casas decimais (em Decimals Places). Vamos deixar 8 em Width e 0 em Decimal Places e clicar em OK.

13

Figura II-2: Definio Variveis: Tipo, Tamanho e Casas Decimais

Um recurso muito til no SPSS a possibilidade de relacionarmos um texto (rtulo) ao nome das variveis (j que o nome s pode ter at 8 letras). Basta selecionar a coluna Label e digitar o texto desejado. Podemos tambm definir rtulos para os valores que uma determinada varivel pode assumir. A coluna Values reservada para esse tipo de definio. Clique no boto que aparece ao selecionarmos essa coluna e no espao Value digitamos o valor que a varivel assume e em Value Label o rtulo (texto) para aquele valor. Feito isso basta clicar Add para armazenar o rtulo do primeiro valor e passar para a segunda definio. A vantagem de definirmos rtulos para variveis ou para os valores que uma varivel pode assumir que toda vez que pedimos qualquer estatstica envolvendo essas variveis eles aparecero junto com os resultados na janela de sadas.

Figura II-3: Rtulos para os valores

14

Geralmente no temos condies de obter um banco de dados totalmente completo (vamos supor que uma das perguntas da pesquisa a idade do respondente; algumas pessoas no gostam de mencionar a idade). Se nada for informado ao SPSS, como padro a opo No missing values usada. Nesse caso basta deixar em branco o espao reservado informao que falta e o SPSS coloca o separador decimal (. ou ,) no local e interpreta todos os pontos (ou vrgulas) como valores ausentes. Podemos, porm, querer definir valores especficos como valores ausentes. Nesse caso basta selecionar a coluna Missing, clicar no boto que aparecer e escolher a opo mais conveniente (ver Figura II-4). Por exemplo, se escolhermos a opo Discrete missing values podemos definir o nmero 999 como valor missing e cada vez que o SPSS encontrar o nmero 999 no meio de uma anlise estatstica que envolve essa varivel ele saber que aquele valor se refere a um valor ausente.

Figura II-4: Definio de Variveis: Missing Values

A definio do formato da coluna um aspecto meramente esttico. Atravs da coluna Columns voc poder determinar a largura da coluna e na coluna Align o alinhamento do texto que pode ser: esquerda (Left), direita (Right) ou centralizado (Center).(ver Figura II-5).

15

Figura II-5: Definio de variveis: Formato da Coluna

E finalmente na coluna Measure, devemos escolher o nvel de medida da varivel. As possveis escolhas so: Escalar (Scale): use essa opo quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). Devem ser numricas. Ordinal: quando os dados representam categorias com uma ordem intrnsica (ex: pequeno, mdio, grande; concordo totalmente, concordo, discordo, discordo totalmente). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=pequeno, 2=mdio, 3=grande). Nominal: quando os dados representam categorias sem ordem intrnsica (ex: as categorias de estado civil, ocupao, nacionalidade). Podem ser variveis alfanumricas (string) ou numricas com valores representando as categorias distintas (ex: 1=masculino; 2=feminino).

Figura II-6: Definio de variveis: Measure.

16

Agora s voltar para o modo de exibio dos dados (selecione Data View na parte inferior da janela de dados) e digitar os valores coletados, lembrando que cada caso (registro) deve ser digitado em uma linha. Para salvar as informaes armazenadas no formato SPSS basta clicar o menu File.. Save ou Save As...e digitar o nome que queremos dar ao novo arquivo no quadro File Name. Note que a extenso dos arquivos do tipo SPSS sav. Abrindo o menu Save as type (canto inferior esquerdo aparecer outras opes como salvar no formato Excel (extenso ".xls").

2. Formas de importao e exportao de dados O SPSS tem capacidade para importar bancos de dados gerados nos mais diversos formatos, entre eles Lotus 123, Excel, dBase e ASCII. Para ter acesso aos diferentes formatos de banco de dados basta clicar o menu File.. Open.. Data. Aparece ento uma tela (ver Figura II-8) onde determinamos disco e subdiretrios (Look in), o nome do arquivo (File name), e a forma sob a qual o arquivo foi gerada (opo File Type no canto inferior esquerdo). O padro o formato SPSS (extenso ".sav"). Discutiremos a seguir como importar arquivos em formato ASCII.

3. Importao de arquivos de dados do tipo ASCII O exemplo que utilizaremos aqui utiliza os dados do Censo Demogrfico 2000 que iremos analisar durante o treinamento. Ao invs de importar os dados no formato SPSS, vamos import-los do formato texto. Para importar esse arquivo de dados no SPSS, clicamos o menu File.. Read Text Data.. (ver Figura II-8). Devemos indicar o disco e o subdiretrio, alm claro, do tipo do arquivo, que no nosso caso texto (.txt). No quadro File name digitamos o nome do arquivo a ser importado, que no nosso caso dom14.txt .. (ver Figura II-9).

17

Figura II-8: Read Text Data menu File

Figura II-9: Open File

Ao clicar em Open (ou Abrir se o seu Windows est em portugus), ser aberto o assistente de importao de dados tipo texto, que ajudar em todo o processo de importao. No total so seis passos que mostraremos a seguir.

18

Se voc tiver um arquivo com o formato j predefinido, basta clicar no Browse e escolher o arquivo.

Figura II- 10: Primeiro Passo para importao arquivo texto

19

Figura II- 11: Segundo Passo para importao arquivo texto

Nesta opo devemos escolher como o arquivo est delimitado: vrgula, espao ou se vamos definir manualmente. E Finalmente, se o arquivo contm ou no o nome das variveis. No caso do Censo Demogrfico o arquivo no contm o nome das variveis.

20

Figura II- 12: Terceiro Passo para importao arquivo texto

No terceiro passo, temos que definir onde comeam os registros, quantas linhas representam cada registro e se queremos todos os dados ou no.

21

Figura II- 13: Quarto Passo para importao arquivo texto

No quarto passo dividiremos os campos. No caso do Censo Demogrfico, a documentao dir qual o tamanho de cada campo. Basta clicar entre os dados que aparecer o divisor de campos.

22

Figura II- 14: Quinto Passo para importao arquivo texto

No prximo passo vamos nomear a varivel e definir o seu formato, tipo da varivel. Se a varivel numeric, string, date/time,etc.

23

Figura II- 15: ltimo Passo para importao arquivo texto

No ltimo passo, podemos escolher se usaremos este formato para outras importaes de arquivos, como no Censo. Agora, basta clicar no boto Concluir e a importao estar concluda. Uma outra opo muito til para ajud-lo na definio das caractersticas de suas variveis chama Apply Data Dictionary (verso SPSS 11.0) e est presente no menu File. Para verso do SPSS 11.5 devemos selecionar Copy Data Properties(ver Figura II.16) que est presente no menu Data. Ao escolher essa opo, ser aberta uma janela para voc escolher um arquivo no formato SPSS, chamado de arquivo modelo. Aps a escolha, o SPSS compara os nomes das variveis do arquivo ativo com as do arquivo modelo e para aquelas variveis que tiverem o mesmo nome, ele copia todas as definies dessas variveis (como tipo, rtulo, valores ausentes, etc) do arquivo modelo para o arquivo ativo. Nas figuras II.16 e II.17 veremos os campos que devero ser preenchidos para copiar as definies das variveis. Depois clique em Concluir, para finalizar a copia das definies das variveis.

24

Escolha o arquivo modelo, no formato SPSS.

Figura II-16: Copy Data Properties.

Figura II-17: Copy Data Properties Segundo passo.

25

III: Transformao de Dados 1. Recodificao usando o procedimento Recode Utilizaremos aqui um recurso muitas vezes necessrio que antecede a anlise estatstica propriamente dita. A recodificao simples de variveis pode ser usada, entre outras coisas, para criar faixas de valores baseados em variveis j existentes. Um exemplo tpico ter interesse em estudar a faixa etria das pessoas em um estudo onde a informao disponvel originalmente a idade. No nosso exemplo vamos criar essa varivel representando a faixa etria a partir da varivel idade. Nossa idia construir tal varivel de acordo com a seguinte diviso por faixas: Valores atuais (Idade) Valores Futuros (Faixa Etria)

< 25 anos......................................................................................1 25 a 35 anos ................................................................................2 36 a 45 anos .............................................................................. 3 >45 anos......................................................................................4

Para fazer uma recodificao no SPSS entramos no menu Transform e escolhemos a opo Recode. Temos ainda que escolher entre as opes Into Same Variables ou Into Different Variables (ver Figura III-1). Atravs dessa ltima opo uma nova coluna adicionada ao banco de dados com os valores recodificados. J atravs da opo Into Same Variables a informao recodificada armazenada na mesma coluna da varivel Idade, perdendo, dessa maneira, a informao da antiga varivel.

26

Figura III-1: Transformao de dados - Recodificao

Escolhendo a opo Into Different Variables uma nova janela aberta (ver Figura III-2). Devemos informar o nome da varivel a ser recodificada (no caso Idade). Para isso basta clicar em Idade dentre todos os rtulos que esto no quadro esquerdo e mov-lo, clicando a seta logo ao lado, para o quadro Numeric Variable > Output Variable. Devemos, tambm, dar um nome para a nova varivel que ser criada atravs do quadro Output Variable no canto superior direito. No espao reservado ao nome da nova varivel (Name) digitamos faixaet. Podemos ainda criar um rtulo para a nova varivel Faixaet (por exemplo, "Faixa Etria"), preenchendo o quadro abaixo de Label. Aps essas definies, basta clicar Change e terminamos a primeira etapa da recodificao.

27

Figura III-2: Recodificao da varivel Idade

Falta agora informar ao SPSS as condies da recodificao. Para isso basta clicar a opo Old and New Values, localizada na parte inferior da janela e aparece uma nova tela (ver Figura III-3). No quadro Old Value, esquerda, temos que especificar os valores da antiga varivel que vo determinar os valores da nova varivel. Para isso temos disponvel uma srie de opes:

Value - usado quando estamos interessados em transformar um valor especfico da varivel em questo em um novo valor; System Missing - usado quando queremos especificar um valor numrico para os valores ausentes do sistema (pontos ou vrgulas); System or User Missing - usado quando queremos especificar um valor numrico para todos os tipos de valores ausentes: os do sistema e os especificados pelo usurio; Range through - usado para especificar uma faixa de valores que recebero um novo valor (ex. de 30 at 40); Range Lowest through - usado para especificar uma faixa de valores que se transformaro num novo valor; nesse caso, do menor valor da varivel em questo at o nmero especificado; Range through highest - usado para especificar uma faixa de valores que recebero um novo valor; nesse caso do nmero especificado at o maior valor da sua varivel.

28

No quadro New Value, no canto superior direito, existe um pequeno espao (Value), no qual deve ser digitado o valor que a nova varivel deve assumir para cada uma das faixas ou valores definidos esquerda. No nosso caso clicamos em Range Lowest through esquerda e preenchemos com o valor 25, ou seja, estamos falando em valores menores ou iguais a 25, e direita no quadro New Value digitamos o valor 1. Clique em Add para incluir a primeira faixa no quadro Old New. Podemos definir o segundo grupo de valores: clique em Range through, digite os valores 26 e 35; no quadro Value direita, entre com o valor 2 e clique Add. Analogamente repita essa operao para a terceira faixa etria (de 36 at 45 anos). Finalmente, defina a ltima categoria clicando em Range: through highest e entrando com o valor 46; estamos agora falando em valores maiores ou iguais a 46. No quadro Value digite o nmero 4 e clique Add. Dessa maneira a definio da nova varivel Faixaet est encerrada.

Figura III-3: Recodificao da varivel Idade

Clicando Continue, voltamos tela anterior onde clicamos OK. A nova varivel passa a existir e aparece na ltima coluna do arquivo. Ela assume os valores 1, 2, 3 e 4 porm os rtulos ainda no esto associados a esses valores. Para associar rtulos aos valores da nova varivel podemos usar a opo do menu View.. Variables e na opo Values acrescentar os rtulos dos valores.

29

2. Recodificao automtica de variveis alfanumricas

Outro recurso para recodificao presente no SPSS o Automatic Recode. Atravs desse procedimento podemos transformar variveis do tipo alfanumricas (string) ou numricas em variveis numricas consecutivas j codificadas (com rtulos associados). O SPSS ordena em ordem alfabtica (crescente ou decrescente) os valores da varivel selecionada relacionando o nmero 1 ao primeiro valor e assim por diante at o ltimo valor. A nova varivel ser numrica assumindo desde o valor 1 at o nmero de valores (ou cadeia de caracteres) existentes, alm de assumir os antigos valores (alfanumricos ou numricos originais) como rtulos da nova varivel numrica. Por exemplo, suponha que queiramos transformar uma varivel alfanumrica numa varivel numrica. Se quisermos fazer determinadas anlises usando a cidade de origem teremos que executar esse procedimento. Para isso basta usar a opo Automatic Recode presente no menu Transform. Uma janela aberta e a primeira coisa a fazer mover a varivel a ser recodificada para o quadro central Variable New Name. No nosso caso moveremos a varivel cidade. Como uma outra coluna ser criada para armazenar a nova varivel preciso dar um nome para essa coluna, digamos Cidade2. Devemos colocar essa informao no retngulo logo abaixo do quadro central e clicar New Name.

Figura III-4: Recodificao Automtica

30

A ltima deciso a ser tomada quanto ordem da recodificao, que pode ser em ordem alfabtica crescente ou decrescente, usando uma das opes: Recode Starting from: Lowest Value (ordem crescente) ou Highest Value (ordem decrescente). Podemos escolher por exemplo Lowest Value e clicar OK. Feito isso o resultado da recodificao mostrado na janela de sadas.

3. Clculo de novas variveis usando o procedimento Compute Vamos agora estudar um outro recurso de transformao de dados: a criao de uma nova varivel como funo de variveis j existentes. Nosso objetivo agora criar no banco de dados uma nova varivel, que contenha a informao desejada. Para isso basta entrar no menu Transform e clicar a opo Compute. Uma janela (ver Figura III-5) aberta com as seguintes caractersticas: um quadro no canto esquerdo apresenta uma lista com todas as variveis existentes no banco de dados que podem ser usadas para o clculo da nova varivel, para selecion-las basta clicar a seta ao lado; um quadro no canto superior esquerdo designado por Target Variable, onde digitaremos o nome da varivel a ser criada; um quadro direita na parte superior designado por Numeric Expression, onde devemos escrever a funo (envolvendo as variveis j existentes no arquivo) que permitir o clculo da nova varivel; um quadro central com uma srie de botes que contm desde funes matemticas (+,-, *, etc) at funes lgicas (&, ~, etc.); e no quadro inferior direito, Functions, h um vasto conjunto de funes, desde soma, multiplicao at arco-tangente, logaritmo neperiano, entre outras, que tambm podem ser usadas na construo da expresso numrica.

31

Figura III-5: Menu Transform..Compute

Selecionamos a varivel do quadro esquerdo, clicamos o smbolo > presente no quadro central da janela. Podemos escrever a expresso digitando diretamente no quadro Numeric Expression, ou clicando nos campos correspondentes. Finalmente, devemos dar um nome nova varivel. Digitamos o nome no quadro superior esquerdo Target Variable, e clicamos Ok. Uma nova varivel ser adicionada na ltima coluna dos dados.

32

IV. Tabelas Nem sempre as tabelas feitas automaticamente pelo SPSS esto prontas para apresentao da maneira que voc gostaria ou, por exemplo, a visualizao dos resultados no est satisfatria. Porm, o SPSS tem recursos poderosos para deixar sua tabela da maneira que voc quiser e o que melhor, de uma maneira muito fcil e rpida. Nesta seo iremos manipular tabelas, trabalhar com estratos e identificadores e mudar caractersticas como fonte, cor, etc. Comearemos criando uma tabela pelo procedimento Crosstabs (menu Analyze, opo Descriptive Statistics) do SPSS (posteriormente veremos detalhadamente as opes e a funcionalidade dessa janela).

Figura IV-1: Criando uma tabela no SPSS

33

Para editar a tabela criada, voc pode clicar duas vezes sobre a tabela ou ento clicar apenas uma vez com o boto direito do mouse e selecionar a opo SPSS Pivot Table Object... Open.

1. Usando os cones de organizao Para acionar os cones de organizao, caso no estejam ativados, clique no menu Pivot e escolha a opo Pivoting Trays (veja a Figura IV-3). A regio cinza ROW representa os elementos que esto nas linhas, a regio Column representa os elementos das colunas e finalmente a regio Layer representa as camadas de tabelas que podemos ter. A tabela pode ser pensada como se estivesse armazenada em camadas (layers), onde apenas a camada de cima est visvel. Por exemplo, se voc colocar a varivel sexo na parte Layer, o SPSS divide a tabela em duas camadas, uma para o sexo masculino e outra para o sexo feminino.

Figura IV-3: Usando os cones de organizao

Note que os cones dessa regio possuem duas setas, que servem para voc mudar a categoria (camada) que apresentada na janela de sadas, sendo que voc pode depois mandar o SPSS imprimir apenas a tabela mostrada na janela ou todas as tabelas. Suponha agora que voc queira guardar uma ou mais configuraes para uma posterior reviso, apresentao ou para marcar importantes descobertas na sua tabela. Para tal tarefa vamos utilizar os identificadores (bookmarks) clicando em Pivot e depois em Bookmarks. Na janela aberta escolhemos um nome para o identificador e depois clicamos em Add. Posteriormente para acessar qualquer identificador basta acessar novamente a opo Bookmarks do menu Pivot, escolher o identificador e clicar em Go to, ou ento clicar em View e depois Toolbar (para mostrar a barra de ferramentas de formatao) e escolher o identificador da lista.
34

Figura IV-4: Menu Pivot

Finalmente, no menu Pivot, voc tem a opo de transpor as linhas e colunas da sua tabela escolhendo a opo Transpose Rows and Columns. Isto tem o mesmo efeito de arrastar todos os cones da regio Column para a regio Row e vice-versa.

2. Modificando as clulas Quando voc tiver a disposio da sua tabela da maneira ideal, voc pode modificar a formatao das clulas. Para isso, selecione as clulas que voc gostaria de editar e escolha a opo Cell Properties... do menu Format (veja na Figura IV-5), onde voc poder modificar o formato dos valores para nmero, data, tempo ou monetrio, e ajustar o nmero de dgitos decimais mostrados clicando em Value. Selecionando Alignment voc ajusta o alinhamento vertical e horizontal e direo do texto para a(s) clula(s). Em Margins voc modifica a distncia dos valores a cada uma das margens, porm no esquea de levar em conta o alinhamento que voc deu clula. Por ltimo em Shading, voc pode mudar a porcntagem de sombreamento baseado nas cores de frente e fundo (Foreground e Background colors). Isto no muda a cor do texto. Para mudar a cor e tipo de fonte do texto voc pode selecionar Font... no menu Format ou ativar a barra de ferramentas de formatao (Formatting toolbar) escolhendo no menu View a opo Toolbar.

35

Figura IV-5: Janela para a mudana das propriedades das clulas

Voc pode ainda ajustar o comprimento das clulas movendo o mouse pelos rtulos da categoria at a borda direita da coluna que voc gostaria de mudar. O cursor mudar para uma flecha com duas pontas, depois deixe o boto do mouse apertado at arrastar a borda para sua nova posio. Posteriormente iremos ver como modificar as bordas e as vrias propriedades de uma tabela em geral e o uso de TableLooks.

36

V. Um Pouco de Estatstica Descritiva Nesta seo vamos definir alguns conceitos bsicos que nos ajudaro a entender melhor a linguagem estatstica do SPSS. Populao - conjunto de todos os elementos sobre os quais temos interesse em estudar, por exemplo, se estamos interessados em investigar qual ser o prximo presidente do Brasil nossa populao o colgio eleitoral do pas; Na maioria das vezes no temos condies de pesquisar todos os elementos de uma populao, por razes como tempo e dinheiro. Portanto uma alternativa para podermos realizar o estudo pesquisar apenas parte dos elementos da populao, ou seja uma amostra. Amostra - constituda por qualquer subconjunto de elementos de uma populao; Varivel - qualquer caracterstica de interesse dos elementos da populao; exemplos: inteno de voto para presidente, idade, sexo, altura, entre outras; 1. Nvel de medida das variveis Como vimos anteriormente as variveis podem ser classificadas em trs tipos no SPSS de acordo com o seu nvel de medida. Vamos recordar esses tipos: Escalar (Scale): quando os dados so valores numricos numa escala intervalar ou de razo (ex: idade, renda, peso, altura). Ordinal: quando os dados representam categorias com uma ordem intrnsica (ex: pequeno, mdio, grande; concordo totalmente, concordo, discordo, discordo totalmente). Nominal: quando os dados representam categorias sem ordem intrnsica (ex: as categorias de estado civil, ocupao, nacionalidade).

37

A importncia de se conhecer os tipos de variveis existentes est ligada forma que a varivel dever assumir no banco de dados, bem como ao tipo de anlise descritiva e inferencial que a mesma dever ser submetida. No momento de definio de variveis categricas, a maneira mais natural seria defin-las como alfanumricas (tipo string). Entretanto, muitos procedimentos estatsticos no SPSS no podem ser realizados com variveis desse tipo. Assim, uma sugesto seria defini-las como numricas e codific-las. Por exemplo:

Pas de origem: 1 = Alemanha; 2 = Blgica; ... ; 18 = Venezuela. Sexo: 1 = Masculino; 2 = Feminino. 2. Distribuio de freqncias Para entendermos melhor o comportamento de uma varivel categrica uma das medidas resumo que pode ser usada a tabela de freqncia. Atravs dessa tabela podemos descobrir o nmero (ou porcentagem) de ocorrncias de cada uma das categorias da varivel. Tabelas de freqncia tambm podem ser construdas para variveis no categricas que assumam um nmero pequeno de valores. Por exemplo, o nmero de filhos, que geralmente assume os valores 0, 1, 2 , 3 e 4. Devemos ressaltar que para variveis escalares que apresentam muitos valores diferentes a construo de tabelas de freqncia no nos traz nenhuma informao relevante na descrio dos dados. Nesse caso uma alternativa seria criar categorias baseadas nos valores da varivel, ou seja categorizar essa varivel, e contar o nmero de ocorrncias em cada categoria. O procedimento Recode pode ser usado para criar a varivel categrica. Quando trabalhamos com variveis escalares algumas medidas "resumo" podem ser usadas para obtermos uma descrio mais apurada dos dados. Essas medidas so divididas basicamente em duas classes, as medidas de posio e as medidas de variabilidade. Faremos a seguir um resumos desses dois grupos e apresentaremos as medidas mais conhecidas e importantes.

38

3. Medidas de posio

As medidas de posio so muito importantes para a descrio dos dados. Geralmente usadas para variveis escalares (pois muitas vezes no acrescentam nenhuma informao no estudo de variveis categricas) essas medidas nos do uma boa idia da magnitude dos dados. Suponha por exemplo que voc est interessado em descrever as horas gastas semanalmente com trabalho de um grupo de 31 pessoas. Uma opo seria imprimir uma listagem dos 31 valores ordenados e estud-los um a um. Quanto maior for a amostra mais complicado ser analisar a varivel dessa maneira. Imagine o trabalho que voc teria com uma amostra de 1500 pessoas! Precisamos, portanto, encontrar uma maneira de condensar a informao atravs da construo de ndices ou medidas que facilitem nossa anlise. Podemos apresentar os valores mnimo e mximo que a varivel assume na amostra. Esse par de valores determina o intervalo de variao da varivel em estudo. No caso das horas de trabalho o mnimo 0 e o mximo 70, ou seja, ningum trabalha menos de 0 horas ou mais de 70 horas por semana. Vamos pensar novamente na listagem dos valores ordenados do menor para o maior. J comentamos que essa lista no nos ajuda muito. Mas se, ao invs de olharmos a lista toda, escolhermos alguns valores de maneira conveniente poderemos tirar proveito da informao. Os valores mnimo e mximo so um exemplo. Uma outra medida de interesse o valor que divide os dados ao meio, ou seja o valor que deixa pelo menos 50% das observaes ordenadas esquerda. No caso das horas de trabalho esse valor o nmero 40, portanto 50% das pessoas trabalham at 40 horas por semana. Esse valor denominado de 50- percentil. Um determinado percentil o valor da varivel de estudo que divide os dados ordenados em grupos de modo que um certo percentual est acima desse valor e o restante abaixo. O 25o, 50o, e o 75o percentis so denominados respectivamente de 1o, 2o e 3o quartis, pois dividem o conjunto de dados em quatro grupos.

39

O 10o, 20o, 30o, ..., 90o percentis so denominados respectivamente de 1o, 2o, 3o, .., 9o decis, pois dividem os dados em 10 grupos Vamos agora estudar um pouco sobre algumas medidas que nos trazem informaes sobre o valor central da distribuio dos nossos dados. A mais famosa dentre todas as medidas de posio certamente a mdia aritmtica. Fcil de ser calculada a mdia aritmtica simplesmente a soma de todas as observaes dividida pelo nmero delas. Para as horas de trabalho a mdia 37.9 horas. Apesar das caractersticas descritas acima a mdia uma medida muito influenciada por valores extremos. Observe o valor da mdia para os dois conjuntos de dados abaixo: Conjunto 1: Conjunto 2: 2 2 3 3 3 3 4 4 4 4 6 6 6 30 Mdia = 4.00 Mdia = 7.43

Notamos que nos dois conjuntos os valores so idnticos a no ser pelo ltimo valor que no primeiro 6 e no segundo 30. O valor da mdia passou de 4 para 7.43. Nesse caso, como alternativa podemos calcular uma outra medida que no influenciada por valores extremos. Essa medida conhecida como mediana. A mediana nada mais do que o 2o quartil, que j foi discutido. Relembrando, essa medida o valor que deixa pelo menos 50% das observaes sua esquerda. Para os dois conjuntos de dados apresentados acima: Conjunto 1: Conjunto 2: 2 2 3 3 3 3 4 4 4 4 6 6 6 30 Mediana = 4.00 Mediana = 4.00

Note que, apesar da alterao do ltimo valor no segundo conjunto de dados, a mediana permanece inalterada. Por essa razo, dizemos que a mediana uma medida mais robusta do que a mdia. Uma outra medida de centralidade no muito utilizada a moda. A moda nada mais do que o valor mais freqente do conjunto de dados. Para variveis que apresentam muitos valores diferentes, a moda no traz nenhuma informao relevante. Porm, para variveis categricas, numricas que assumem um nmero pequeno de valores ou escalares categorizadas a moda nos d a informao da categoria mais freqente.
40

Nos exemplos do estado civil e faixa etria a moda , respectivamente, 1 e 1. Portanto para amostra estudada o estado civil mais freqente o solteiro (estado civil=1) e a faixa etria mais freqente a primeira, com pessoas de at 25 anos (faixa etria=1).

4. Medidas de variabilidade Analisando os dois conjuntos de dados abaixo notamos que apesar das mdias serem iguais, os conjunto tm uma diferena grande com relao a homogeneidade dos valores. Conjunto 1: Conjunto 2: 2 0 2 1 2 1 2 2 2 3 2 3 2 4 Mdia = 2 Mdia = 2

No primeiro conjunto todos os valores so iguais a 2 e portanto iguais a mdia (dados totalmente homogneos). J no segundo conjunto os valores no so todos iguais (dados heterogneos) embora a mdia continue sendo 2. Seria importante agora, expressar a variabilidade dos dados atravs de alguma medida numrica. Para que essa medida fosse coerente ela deveria assumir o valor zero apenas se todos os dados fossem iguais (ex. conjunto 1). Alm disso, quanto maior fosse a variabilidade do conjunto de dados, maior seria o valor da medida.

Uma medida bastante simples e fcil de ser calculada a amplitude. A amplitude nada mais do que o valor mximo menos o valor mnimo de um conjunto de dados. No caso dos conjuntos 1 e 2 a amplitude igual a 0 e 4, respectivamente. Uma desvantagem dessa medida que ela muito influenciada por valores extremos. Alm disso ela no leva em conta a variabilidade entre todas as observaes do conjunto de dados. Observe no exemplo abaixo que apesar de a amplitude ser a mesma para os dois conjuntos, o primeiro aparenta ser mais homogneo: Conjunto 1: Conjunto 2: 0 0 2 1 2 8 2 12 3 15 3 19 20 20 Amplitude = 20 Amplitude = 20

A prxima medida que apresentaremos tenta corrigir esse "defeito" da amplitude. Em primeiro lugar iremos considerar as distncias de todas as observaes a um valor central, a mdia.

41

Aps o clculo de todas as distncias (diferenas), faremos a sua soma. Para refinar um pouco a medida podemos dividir a soma pelo nmero total de observaes. Acompanhe o clculo da medida proposta no exemplo a seguir: Conjunto 1: 0 5 Deixamos para voc verificar que para qualquer conjunto de dados a medida apresentada acima sempre zero. Dessa maneira impossvel trabalhar com essa medida para estudar a variabilidade dos dados. Fazendo, porm, uma pequena mudana na medida acima obteremos a famosa varincia. A varincia nada mais do que a soma das diferenas das observaes em relao mdia elevadas ao quadrado, dividida pelo nmero total de observaes. Dessa maneira a varincia ser sempre positiva e s assumir o valor zero se todas as observaes do conjunto de dados forem iguais. Para o conjunto de dados acima a varincia dada por: (0-2)2+(1-2) 2+(2-2) 2+(3-2) 2+(4-2) 2 5 1 2 3 4 Mdia = 2

Medida = (0-2)+(1-2)+(2-2)+(3-2)+(4-2) = 0

varincia=

=2

Devemos porm tomar cuidado ao analisar essa medida, pois ao elevarmos as diferenas ao quadrado estamos mudando a unidade de medida dos dados. Por exemplo se os nmeros do conjunto 1 esto expressos em metros a varincia estar expressa em metros quadrados. Para contornar esse problema foi criado o desvio padro, que nada mais do que a raiz quadrada da varincia (voltamos portanto unidade de medida original). Para o conjunto de dados acima o desvio padro dado por:

desvio padro=

(0 - 2) 2 + (1 - 2) 2 + (2 - 2) 2 + (3 - 2) 2 + (4 - 2) 5

=1,414

Ainda baseado no desvio padro existe uma medida que tenta expressar a variabilidade da mdia e no a variabilidade dos dados como um todo. Essa medida chamada de erro padro

42

da mdia, ou simplesmente erro padro, e obtida pela diviso do desvio padro pela raiz quadrada do nmero de observaes. Para o conjunto de dados acima o erro padro :

erro padro=

desvio ! padro no. ! observaes

=0,632

Conforme j foi mencionado anteriormente, existem vrios tipos de variveis e razovel pensar que cada tipo deva receber um tratamento. Se estamos trabalhando com variveis categricas nominais, digamos Estcivil (estado civil), no faz sentido calcularmos medidas como mdia ou varincia j que no existe uma ordem natural das possveis respostas. Podemos, por exemplo, pedir uma tabela de freqncias e calcular a moda. Para as variveis ordinais surgem algumas novas opes, j que agora as respostas assumem uma ordem natural; este o caso da varivel Escola (Grau de instruo), onde a ordem natural 1o grau incompleto, 1o grau completo, 2o grau incompleto, e assim por diante at superior completo. Nesse caso, alm da distribuio de freqncias e da moda, podemos calcular medidas como mediana, mnimo e mximo. As variveis escalares so as que apresentam mais opes para anlise descritiva; o caso da varivel Idade, onde alm de mediana, quartis e percentis, podemos tambm calcular mdia, desvio padro, valores mnimo e mximo, medidas de assimetria e curtose (relacionadas distribuio da varivel) etc. Alm disso, se quisermos uma distribuio de freqncias e moda podemos faz-lo transformando a Idade em varivel qualitativa ordinal, digamos FaixaEt (exatamente como fizemos anteriormente atravs do comando Recode presente no menu Transform). Como veremos a seguir, o SPSS apresenta procedimentos para o clculo de todas as medidas descritas acima e algumas outras. importante ressaltar que o SPSS no saber decidir qual o tipo de medida adequada para as variveis existentes no seu estudo; cabe a voc decidir!

43

VI: Comandos do SPSS para Anlise Descritiva Os comandos relacionados a anlise descritiva encontram-se nas opes Reports e Descriptive Statistics do menu Analyze. A Figura VI-1 apresenta as opes de Descriptives Statistics. Vamos agora estudar as opes mais usadas.

Figura VI-1: Opes do menu Analyze..Descriptive Statistics

1.OLAP Cubes A primeira opo do menu Analize...Reports OLAP Cubes. Esse procedimento utilizado para a construo de relatrios e estes podem se tornar bem flexveis graas ao uso dos cones de organizao. A construo dos relatrios simples, basta preencher os quadros da janela mostrada na Figura VI-2 com as variveis desejadas. A seguir detalharemos os quadros.

44

Figura VI-2: Procedimento OLAP Cubes

No quadro Summary Variable(s) coloque as variveis para as quais voc deseja que ele calcule medidas descritivas como mdias, somas, percentuais, mnimos, mximos, etc; geralmente as variveis nesse quadro so quantitativas. No quadro abaixo Grouping Variable(s), coloque variveis para as quais voc gostaria que sejam criados subgrupos. Clicando no boto Statistics... voc escolhe quais as estatsticas que sero calculadas. Como padro temos: soma, nmero de casos, mdia, desvio-padro, percentual sobre a soma total, percentual sobre o N total; vrias outras estatsticas como mediana, mnimo, mximo e varincia, podem ser escolhidas. No nosso exemplo removeremos a soma (sum) e o percentual sobre a soma total (percent of total sum). Depois basta clicarmos em Continue. Finalmente ao clicar no boto Title..., voc pode escolher um ttulo e uma legenda para a tabela, que podero ser modificados posteriormente. Aps a digitao do ttulo e da legenda clique em Continue. Agora basta clicar no boto OK e teremos nosso relatrio.

45

2. Frequencies Para utilizar a primeira opo de Descriptive Statistics, clique em Frequencies..., e aparece uma janela onde voc pode incluir as variveis para as quais deseja ter a distribuio de freqncias, como na figura VI-3.

Figura VI-3: Procedimento Frequencies

Na parte inferior temos um quadro chamado Statistics. Esse quadro apresenta vrias opes de medidas estatsticas (ver Figura VI-4). Devemos tomar cuidado pois nem todas as medidas apresentadas trazem informaes relevantes para o estudos das variveis em questo. As medidas esto divididas em 4 grupos: Percentile Values - no canto superior esquerdo essa opo possibilita o clculo dos quartis (Quartiles), decis (Cut points for 10 equal groups - voc pode mudar o nmero 1O para qualquer diviso que desejar) e quaisquer percentis (Percentile(s)) de interesse; Central Tendency - no canto superior esquerdo essa opo possibilita o clculo da mdia (Mean), mediana (Median), moda (Mode) e soma (Sum); Dispersion - no canto inferior esquerdo essa opo possibilita o clculo do desvio padro (Std. deviation), varincia (Variance), amplitude (Range), valor mnimo (Minimum), valor mximo (Maximum) e erro padro da mdia (S.E. mean);

46

Distribution - no canto inferior direito essa opo possibilita o clculo de duas medidas de distribuio: Kurtosis e Skewness. A kurtosis uma medida do achatamento da distribuio e skewness um ndice que reflete a simetria da distribuio em torno de um valor central.

Figura VI-4: Opes de medidas estatsticas no procedimento Frequencies

Um outro quadro que aparece na parte inferior da janela principal o Charts. Esse quadro apresenta trs grficos como opo: histograma com ou sem uma curva normal (Histograms marcando ou no a opo With normal curve), grfico de barras (Bar charts), e grfico de Pizza (Pies), como mostrado na Figura VI-5. Note que apesar de apresentar um menu exclusivamente para grficos (menu Graphs) o SPSS tambm possibilita a construo de grficos dentro de procedimentos estatsticos. Discutiremos alguns dos tipos de grficos mais utilizados na seo seguinte.

47

Figura VI-5: Opes de grficos para o procedimento Frequencies

O ltimo quadro que aparece na parte inferior da janela principal o Format, que inclui opes de ordem esttica (ver Figura VI-6). Atravs do quadro Order by controlamos a ordem em que as categorias da varivel so apresentadas na janela de sadas. As opes disponveis so por ordem crescente (ou decrescente) dos valores que a varivel assume e crescente (ou decrescente) de freqncias. Se voc marcar a opo Suppress tables with more then caategories, o SPSS no ir fazer nenhuma tabela que tiver mais do que um certo nmero de categorias, sendo que o padro 10. Finalmente no quadro Multiple Variables, caso voc tenha pedido estatsticas para suas variveis, voc pode escolher que essas estatsticas saiam numa s tabela (Compare variables) ou uma tabela para cada varivel separadamente (Organize output by variables). No nosso exemplo, vamos escolher a opo Ascending counts do quadro Order by.

Figura VI-6: Opo Format para o procedimento Frequencies

Escolhidas todas as opes podemos clicar OK. Feito isso o SPSS ativa a janela de sadas e apresenta o resultado da freqncia (ver Figura VI-7).

48

Voc deve perceber que duas distribuies de freqncias so apresentadas. A distribuio de freqncias apresenta os rtulos dos valores, o nmero de observaes em cada categoria (Frequency); a porcentagem que a freqncia representa no total de observaes levando-se em conta valores ausentes (Percent); a percentagem que a freqncia representa no total de observaes desconsiderando os valores ausentes (Valid Percent) e o percentual vlido acumulado (Cum Percent).

Figura VI-7: Resultado obtido a partir do procedimento Frequencies

49

3. Decriptives A segunda opo de Descriptive Statistics o procedimento Descriptives. De maneira similar ao procedimento Frequencies temos a opo de incluir as variveis que julgarmos necessrias (vamos colocar Trabalho e Lazer) ao quadro central Variable(s) (ver Figura VI-8). Essa opo geralmente usada quando temos interesse em estudar variveis escalares de maneira rpida.

Figura VI-8: Procedimento Descriptives

O quadro inferior direito Options apresenta medidas estatsticas que podem ser usadas para descrio dos dados (ver Figura VI-8). Existem dois grupos de medidas idnticos aos j discutidos anteriormente na opo Statistics do procedimento Frequencies, so eles Dispersion e Distribution. Alm dessas medidas podemos pedir para o SPSS apresentar a mdia (Mean) e a soma (Sum) das variveis em estudo. O ltimo quadro, Display Order, nos permite escolher a ordem com que os resultados sero apresentados na janela de sadas: crescente ou decrescente de mdias, alfabtica ou a ordem em que as variveis aparecem na lista. Este quadro til quando estamos estudando mais do que uma varivel. Agora basta clicar OK na janela principal e analisar os resultados que so apresentados na janela de sadas.

50

4. Crosstabs A quarta opo de Descriptive Statistics o procedimento Crosstabs que usado para construo de tabelas simples (geralmente de dupla entrada). Imagine que temos duas variveis qualitativas e estamos interessados em observar a distribuio de freqncias de ambas em conjunto. Para isso, construmos uma tabela onde uma varivel entra com suas categorias em linhas e a outra em colunas. Podemos ento fazer um estudo descritivo sobre o comportamento conjunto das variveis. Porm, muitas vezes queremos mais do que simplesmente observar. Queremos, tambm, verificar se existe efetivamente associao entre tais variveis. Ento precisamos utilizar testes estatsticos (anlise inferencial). Vrios testes estatsticos esto disponveis no procedimento Crosstabs. A Figura VI-9 mostra as opes do procedimento Crosstabs. No canto esquerdo esto disponveis todas as variveis do banco de dados. Para construo da tabela basta movermos a varivel cujas categorias desejamos dispostas nas linhas para o quadro Row(s) localizado no centro da janela e a varivel cujas categorias desejamos dispostas nas colunas para o quadro Column(s). Note que podemos colocar mais do que uma varivel nos quadros Column(s) e Row(s). Entretanto, atravs do comando Crosstabs sero construdas vrias tabelas de dupla entrada a partir de combinao das variveis duas a duas. Se voc deseja construir uma tabela com mais de duas entradas (envolvendo 3 variveis ou mais) voc pode usar o quadro Layer, porm voc ter opes limitadas de estatsticas e customizao; neste caso, o mdulo Tables indicado, j que ele possui recursos avanados para a customizao e criao de tabelas. Se voc marcar a opo Display clustered bar charts sero feitos grficos de barras com as variveis pedidas e a opo Suppress tables faz com que nenhuma tabela seja feita; apenas as estatsticas, testes e grficos pedidos sero mostrados na janela de sadas.

51

Figura VI-9: Procedimento Crosstabs e Opo Statistics do Procedimento Crosstabs

Aparece ainda na janela quatro pequenos botes (ou trs, caso voc no tenha o mdulo SPSS Exact Tests instalado) na parte inferior: Exact - como dito acima, essa opo s estar disponvel se o mdulo Exact Tests for instalado; indicado para estudos onde as suposies dos testes assintticos no esto satisfeitas (por exemplo, uma amostra pequena); apresenta dois procedimentos para clculo do nvel descritivo: mtodo Monte Carlo (baseado em simulaes) e o mtodo Exato; Statistics - deve ser usado para selecionar os testes estatsticos que sero realizados; note que so apresentados nesse quadro catorze testes estatsticos diferentes; cada um deles apropriado para verificarmos suposies diferentes sobre as variveis em questo (ver Figura VI-14); Cells - essa opo usada para escolha das medidas que sero apresentadas em cada uma das clulas da tabela (ver Figura VI-15); as possveis medidas apresentadas so: freqncias ou valores observados (Counts.. Observed); valores esperados, isto , frequncias calculadas assumindo que as variveis so independentes (Counts.. Expected); porcentagens por linha, coluna e total (Percentages.. Row, Column e Total) e vrios tipos de resduos, que so a diferena entre o valor observado e esperado (quadro Residuals); pediremos, para nosso exemplo, os valores observados e as porcentagens por coluna;

52

Format - usada apenas para escolher a ordem em que as categorias (valores) da varivel apresentada nas linhas da tabela sero apresentadas (Row Order), que pode ser crescente ou decrescente (Ascending ou Descending);

Figura VI-10: Opo Cells e Format do procedimento Crosstabs

O passo mais importante agora saber interpretar todos os resultados presentes na janela de sadas, seno todo o trabalho que tivemos at agora foi apenas perda de tempo! A Figura VI-11 apresenta o resultado da tabela de dupla entrada feita atravs do procedimento Crosstabs.

Figura VI-11: Sada gerada pelo procedimento Crosstabs.

53

Voc deve ter percebido que as opes disponveis em Reports e Descriptive Statistics para anlise descritiva so usadas para obter diferentes informaes sobre os dados. importante lembrar que, embora o SPSS seja um software muito fcil de operar, o bom senso do usurio fundamental; em outras palavras, a cada passo que pretendemos dar, preciso pensar antes se a anlise faz sentido ou no.

54

VII. Manipulao de Dados 1. Ordenao de casos Antes de realizarmos qualquer anlise, temos que "preparar" os dados para que possamos obter a informao desejada. Uma das necessidades na hora da manipulao dos dados em nosso dia a dia a ordenao dos casos segundo uma ou mais variveis. Para fazer isso no SPSS voc pode usar o procedimento Sort Cases presente no menu Data. Aps clicar o menu Data, opo Sort Cases, uma janela aberta (ver Figura VII-1). Movemos para o quadro Sort by a varivel segundo a qual o arquivo deve ser ordenado. Podemos mover para esse quadro mais do que uma varivel. Nesse caso o arquivo ordenado, em primeiro lugar, pelos valores da primeira varivel presente no quadro e em segundo lugar pela segunda varivel presente no quadro; a segunda ordenao feita para os valores comuns da primeira varivel e assim por diante. Podemos escolher tambm entre ordem crescente ou decrescente de ordenao para cada uma das variveis. Isso feito atravs do quadro Sort Order, opes Descending (decrescente) ou Ascending (crescente).

Figura VII-1: Opo Sort Cases do menu Data

55

Dica sobre ordenao: Voc pode ordenar os dados direto da janela de dados sem usar a opo Sort Cases do menu Data. Para isso, basta selecionar as variveis que definem a ordenao (voc pode usar as teclas Ctrl ou Shift para selecionar vrias variveis), clicar com o boto direito do mouse no nome de qualquer uma das variveis selecionadas e escolher Sort Ascending ou Sort Descending.

2. Seleo de casos Outra grande necessidade a seleo (temporria ou permanente) de parte do arquivo de dados. Digamos que estamos interessados em estudar um segmento especfico da amostra. O SPSS possui vrias formas de seleo de dados. Falaremos nessa seo de todas elas, mas discutiremos detalhadamente a mais usada de todas. Para fazer qualquer tipo de seleo devemos clicar o menu Data opo Select Cases ou clicar no cone . A janela aberta apresentada na Figura VII-2.

Figura VII-2: Opo Select Cases do menu Data

56

No quadro central Select esto presentes cinco opes diferentes para seleo. Faremos a seguir uma breve descrio de cada uma delas. All cases - opo usada como padro; utiliza todas as observaes do banco de dados; If condition is satisfied - atravs dessa opo podemos definir expresses condicionais para seleo de casos; estudaremos essa opo detalhadamente mais adiante; Random sample of cases - podemos selecionar uma porcentagem aproximada ou um nmero exato de casos dos n primeiros casos; a seleo feita aleatoriamente; Based on time or case range - usamos essa opo quando estamos interessados em selecionar uma faixa especfica de valores, por exemplo os casos de nmero 100 at 200; tambm utilizada para fazer selees baseadas em datas (por exemplo, selecionando todos os dados do ms de fevereiro at outubro); User filter variable - escolhemos uma varivel no banco de dados e usamos como filtro; todos os casos para os quais a varivel filtro assume o valor 0 ou ausente no sero selecionados. Voc tem duas opes para o tratamento dos casos que no sero selecionados. atravs do quadro Unselected Cases Are que podemos fazer a escolha: Filtered - os casos (linhas) que no so selecionados no so includos nas anlises posteriores, porm permanecem na janela de dados; caso voc mude de idia e queira usar os casos no selecionados na mesma sesso do SPSS basta "desligar" o filtro (usando a opo All Cases no quadro Select); Deleted - os casos (linhas) no selecionados so apagados da janela de dados; caso voc mude de idia e queira usar os casos no selecionados voc dever ler novamente o arquivo de dados original.

57

Portanto o tipo de seleo de dados que faremos deve possibilitar a criao de sentenas matemticas lgicas para seleo dos casos. Para isso, clicamos em If condition is satisfied, e entramos na caixa de dilogo If.... Atravs da janela que aberta (ver Figura VII-3) usamos o quadro superior para escrever uma funo lgica na qual a seleo vai ser baseada. Para a construo da funo podemos usar todas as variveis que esto no quadro esquerda e as funes disponveis no quadro inferior direito.

Figura VII-3: Opo Select Cases.. If condition is satisfied do menu data

Uma vez escrita a funo que determina a regra de seleo dos casos, clique Continue, e voc voltar janela anterior. No quadro inferior (Unselect cases are), vamos optar pelo modo Filtered (ou seja, os casos no selecionados permanecem na tela de dados, porm no sero utilizados em anlises futuras) e clicar OK. Depois de feita a seleo, a janela de dados sofre algumas alteraes, as linhas (casos) que no foram selecionadas apresentam uma listra no canto esquerdo da janela de dados. A barra de status, localizada na parte inferior da janela, apresenta a mensagem Filter On. Alm disso, uma varivel de nome filter_$ adicionada janela de dados. Essa nova varivel apresenta valor 0 para as linhas que no foram selecionadas e valor 1 para as linhas que foram selecionadas. Apesar de voc conseguir ver os casos que no foram selecionados qualquer anlise: efetuada da pra frente no levar em conta esses casos. Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Temos duas maneiras de cancelar a seleo de casos, se a opo Filtered foi usada para

58

efetuar a seleo. A primeira delas ativar a opo All Cases da janela de seleo de casos (opo Select Cases do menu Data) e clicar OK. A segunda maneira apagar a varivel filter_$ do banco de dados.

3. Procedmento Split File Como padro sempre analisamos todos os casos juntos, sem separao por grupos. Quando queremos separar os grupos como, por exemplo, sexo podemos utilizar o procedimento Split File, presente no menu Data ou acessado atravs do cone. Por esse motivo a opo selecionada na janela Analyse all cases. Podemos separar a anlise de acordo com as categorias da varivel escolhida (ou combinao das categorias de vrias variveis, se for o caso) escolhendo Compare groups ou Organize output by groups. A opo Compare groups faz com que grupos sejam apresentados juntos para comparao e a opo Organize output by groups mostra os resultados de cada procedimento do SPSS organizados separadamente para cada grupo1. Escolhida uma das duas ltimas opes, podemos mover para o quadro Groups based on a varivel (ou variveis) que definiro os grupos para os quais a anlise deve ser repetida. Se mais do que uma varivel for selecionada, os grupos sero definidos pela combinao das categorias de todas as variveis. Podemos ainda escolher se o banco de dados deve ser ordenado pela varivel que definir os grupos (Sort the file by group variables) ou se nenhuma ordenao deve ser feita (File is already sorted). Tenha em mente que, se o arquivo no estiver ordenado por essas variveis, o procedimento Split File no funcionar corretamente.

Esta diferena s vale para as tabelas (pivot tables). Para os outros tipos de sada essas duas opes so idnticas.

59

Figura VII-4: Opo Split File do menu Data

Se p.ex selecionamos Organize output by groups, escolhemos a varivel sexo e movemos para o quadro Groups Based on e clicamos Ok. A nica mudana que acontece na janela de dados a mensagem Split File On na barra de status. Porm qualquer anlise ou grfico feitos de agora em diante vo gerar dois resultados, um para os homens e outro para as mulheres. Se fizermos uma anlise descritiva feita atravs do menu Analyze..Descriptive Statistics.. Descriptives para uma varivel qualquer usando a opo Organize output by groups, os resultados sero apresentados separadamente para cada categoria da varivel sexo. Podemos mudar de idia e querer usar todas as observaes para o clculo das estatsticas. Para cancelar o procedimento Split File basta ativar a opo Analyse all cases presente na janela de definio da opo Split File no menu Data.

4. Procedmento Aggregate O procedimento Aggregate combina grupos de casos em um nico caso e cria um novo banco de dados agregados. Os casos so agregados baseados nos valores de uma ou mais variveis. O novo arquivo conter um caso para cada grupo. Por exemplo, suponha que voc tenha um banco de dados onde cada caso representa um municpio do Brasil; voc poderia agregar esses dados criando um novo arquivo com uma linha para cada estado. Para isso devemos ento selecionar a opo Aggregate... do menu Data. Na janela aberta (ver Figura VII-5) temos que escolher uma ou mais variveis que definiro os grupos (Break

60

Variables). No quadro Aggregate Variable(s) colocamos as variveis que queremos no novo arquivo; note que a funo padro usada para agregar os dados para as variveis a mdia, mas podemos mudar essa funo para qualquer varivel, clicando em Function. Alm disso, voc pode colocar a mesma varivel vrias vezes no quadro Aggregate Variable(s), o que significa que voc pode ter no novo arquivo, vrias colunas representado funes diferentes dessa varivel.

Figura VII-5:Janela para definio do procedimento Aggregate

Voc pode ainda criar uma varivel no novo arquivo que contenha o nmero de casos que foram agregados por grupo. Finalmente, deve ser escolhido se o SPSS salva o resultado num novo arquivo de dados (opo default - Create new file) ou se ele fecha o arquivo atual e mostra o resultado do procedimento aggregate na janela de dados (opo Replace working data file), sendo que voc deve salvar esse arquivo posteriormente. O arquivo criado usando a opo Create new file ser gravado no diretrio corrente com o nome de aggr.sav, mas voc pode mud-lo clicando em File....

61

VIII. Arquivos e Janelas Produzidas_em uma Sesso SPSS Sempre que inicializamos o SPSS, uma janela para entrada, digitao ou edio de dados aberta (ver Figura VIII-1). Essa janela, chamada Data Editor no pode ser fechada, a no ser que outra do mesmo tipo seja aberta em seu lugar. Note que se a janela de dados estiver ativa, a opo Close do menu File no estar disponvel. Voc perceber que alm desse tipo de janela, vrias outras podem ser abertas. As caractersticas de cada uma dessas janelas sero analisadas nesse captulo.

Figura VIII-1: Aspecto inicial do SPSS

1. A janela de dados A janela Data Editor (ou simplesmente janela de dados) destinada a armazenar os dados que sero usados para efetuar as anlises. Uma caracterstica dessa janela que apenas uma pode ser aberta em cada sesso do SPSS e apesar de ser possvel abrir mais de uma sesso, isso no significa que se voc quiser analisar dados de dois arquivos diferentes basta abrir uma janela de dados para cada arquivo e pronto. Para isso ser possvel, os arquivos precisam estar

62

presentes na mesma sesso e por isso, o SPSS apresenta a opo Merge File no menu Data. Essa opo ser estudada em detalhes posteriormente. Como j mencionado anteriormente, o SPSS faz importao de arquivos de dados no formato Excel, Lotus, Dbase, Sylk e ASCII, alm claro do prprio formato SPSS (verses DOS, Windows e portable) e atravs de ODBC. Para abrir um arquivo, basta clicar o menu File.. Open.. Data, escolher o formato em que o arquivo foi gerado (quadro File of type ,opo SPSS(*.sav) ) e selecionar o arquivo. Atravs da digitao dos resultados de seus estudos na janela de dados, voc pode criar seu banco de dados dentro do prprio SPSS. O arquivo criado pode ser exportado em todos os formatos nos quais pode ser importado diretamente (sem uso de ODBC). O formato de exportao padro o prprio formato SPSS for Windows (extenso .sav). Para salvar a janela de dados basta clicar o menu File, opo Save . No canto inferior esquerdo, Save as type, o SPSS apresenta uma lista com todos os formatos de exportao disponveis. Basta escolher o de sua preferncia (o padro o formato SPSS), dar um nome ao arquivo no quadro File name, e clicar OK.

2. Janela de sadas Quando voc pedir uma anlise estatstica, um grfico, etc. o SPSS automaticamente abre uma janela de sadas chamada Output 1 - SPSSViewer. Os resultados so armazenados de maneira seqencial na ordem em que os mesmos so gerados, porm voc pode usar as facilidades da janela de sadas para: procurar sadas, mostrar ou esconder tabelas ou grficos, mudar a ordem de visualizao das sadas movendo itens e mover itens entre o SPSS e outros programas. A sua janela de sadas est dividida em dois painis (veja a Figura VIII-2):

63

Painel Geral

Painel dos Contedos

Figura VIII-2: A janela de sadas e seus painis

O painel da esquerda contm uma viso geral do contedo das sadas e chamado de painel geral. O painel da direita contm as tabelas, grficos e sadas de texto e chamado painel dos contedos. Voc pode usar as barras de movimentao (scrool bars) para procurar as sadas ou pode clicar no item correspondente no painel geral para ir diretamente para o item procurado. Voc pode clicar e arrastar a borda direita do painel geral para mudar a largura desse painel (voc pode at mesmo arrastar a borda totalmente para a esquerda, deixando-o no visvel). Clique num cone em formato de livro para mostrar ou esconder um item.

3. Copiando o contedo da janela de sadas Com freqncia ser necessrio copiar os resultados de alguma anlise feita no SPSS em algum outro aplicativo, especialmente editores de texto e planilhas eletrnicas. Vamos mostrar alguns exemplos utilizando os softwares dessas categorias mais utilizados: o editor de textos Word for Windows e a planilha de dados Excel. Vamos comear pelo grfico; para copi-lo para a rea de transferncia voc pode clicar nele com o boto direito do mouse e ento selecionar a opo Copy ou ento selecion-lo com um

64

clique do mouse no painel geral ou dos contedos e selecionar a opo Copy do menu Edit. Agora s abrir o Word e selecionar a opo Paste ou Colar, dependendo do idioma do seu software. Note que para grficos no-interativos voc s tem duas opes para col-lo no Word (acessadas caso voc escolha Paste Special ou Colar Especial no menu Edit/Editar): figura (picture) e bitmap. Em nenhum dos casos voc poder editar o grfico como se estivesse no SPSS, porm a opo figura permite que voc tenha opes simples do Word para edio. Para copiar a tabela para a rea de transferncia faa da mesma maneira que voc fez com o grfico. Retornando ao Word, vamos acessar agora a opo Paste Special ou Colar Especial do menu Edit/Editar. A primeira opo (SPSS Pivot Table Control) faz com que as tabelas sejam coladas no Word como objetos do tipo Active-X (tambm chamado de OLE2) de modo que elas podem ser editadas de dentro do Word como se voc estivesse no SPSS (ou seja, usando os cones de organizao, os identificadores, os formatos de tabela) mas sem abri-lo! Porm, como essa tecnologia relativamente nova, muitos softwares ainda no a suportam ( o caso, por exemplo, das verses do Office anteriores verso 97), por isso a primeira opo para colarmos a tabela no estar disponvel a no ser que voc execute o programa chamado OBJS-ON.BAT que est localizado no diretrio do SPSS. A segunda opo (Formatted Text - RTF) copia a tabela como texto j formatado, o que resultar como uma tabela do Word. A terceira opo (Unformatted Text) colar a tabela como txto no formatado, mas usando a opo do Word de transformar texto em tabela, podemos facilmente edit-la. A ltima opo (Picture) cola a tabela como uma figura, semelhante maneira que voc colou anteriormente os grficos no-interativos do SPSS. No Excel, faa os mesmos procedimentos que no Word , nica diferena a opo Text cola o contedo da tabela nas clulas da planilha, porm a preciso do nmero copiado para o Excel a mesma preciso exibida no SPSS. Usando a opo Biff, os nmeros tero toda a preciso numrica que poderamos mostrar na tabela no SPSS (o que pode ser muito importante para futuros clculos feitos na planilha), por isso, essa opo melhor do que a opo Text.

65

4. Formas de exportao importante lembrar que o SPSS permite que voc abra quantas janelas de sadas quiser. Cada janela de sadas aberta um arquivo em potencial que pode ser salvo no formato Viewer files, que o formato prprio do SPSS para suas janelas de sadas (terminao .spo). Para salvar uma janela de sadas basta clicar o menu File estando na janela que voc quer gravar e selecionar a opo Save (ver Figura VIII-3). Temos que escolher o driver e diretrio no qual queremos armazenar o arquivo e digitamos o nome com o qual o arquivo ser armazenado.

Figura VIII-3 - Salvando uma janela de sadas

Alm de abrir esse arquivo no SPSS, voc tambm poder abri-lo em outros trs softwares da SPSS: Viewer: uma espcie de janela de sadas do SPSS sem o mesmo; permite que voc veja as sadas mas no permite a edio ou cpia das mesmas. gratuito e j vem no CD do SPSS; SmartViewer: semelhante ao Viewer, porm permite que as sadas sejam editadas (usando cones de organizao, etc) e copiadas. J vem com o SPSS, mas no gratuito, voc precisa de uma licena para poder acess-lo; SmartViewer Web Server: uma espcie de verso para a Internet do SmartViewer; permite que os arquivos em formato de sada do SPSS sejam acessados atravs dos browsers mais utilizados (Internet Explorer e Netscape Navigator) sendo que quem estiver acessando a pgina que contenha as sadas deve ter instalado apenas um plug in Java.

66

E finalmente, voc pode exportar as sadas como formato HTML, XML ou texto usando a opo Export... do menu File (ver Figura VIII-4).

Figura VIII-4: Exportando uma janela de sadas

Se voc escolher exportar as sadas do SPSS, voc tem na lista Export as opes de exportar qualquer combinao de tabelas, grficos e textos (Output Document), qualquer combinao de tabelas e textos (Output Document (No Charts)) ou apenas uma seleo dos grficos da sua sada (Charts Only). Em Export What voc escolhe exportar todos os objetos possveis (All Objects) ou apenas os visveis (aqueles cujo cone no painel geral um livro aberto) em All Visible Objects ou apenas objetos que voc selecionou (Selected Objects).

5. Janela de sintaxe As escolhas feitas dentro dos menus do SPSS podem ser salvas na forma de comandos dentro de uma janela de programao. A vantagem de procedermos dessa maneira que os procedimentos armazenados nessa janela podem ser rodados novamente sem que precisamos entrar nos menus. Por exemplo, se voc precisa rodar uma mesma anlise todo ms com um arquivo atualizado voc pode tirar proveito dessa facilidade. bom lembrar que o SPSS possui uma linguagem de programao prpria e aqueles que a conhecem podem escrever os comandos sem a necessidade de usar o recurso Paste. Atravs

67

desse recurso voc no precisa digitar o cdigo referente ao procedimento desejado. O prprio SPSS escreve o cdigo para voc. Vamos comear com um exemplo simples: a criao de uma janela de programao com a sintaxe referente criao de uma tabela de freqncia. Devemos clicar o menu Analyze, escolher Descriptive Statistics e depois, Frequencies, porm, agora, ao invs de clicar OK, clique em Paste (pea tambm um grfico de barras para cada varivel atravs do boto Charts...). O resultado desse procedimento a criao de uma janela chamada Syntaxl - SPSS for Windows Syntax Editor, j com o cdigo referente criao de tabelas de freqncia (ver Figura VIII-5).

Figura VIII-5: Janela de definio de uma tabela de freqncias

Para saber quais so as demais especificaes disponveis para o comando FREQUENCIES, marcamos qualquer parte do comando FREQUENCIES e com um click no cone Help) obtemos a informao desejada (ver Figura VIII-6). - (Syntax

68

Figura VIII-6: Ajuda para definio de comandos na janela de sintaxe

Para um procedimento simples como o FREQUENCIES, o SPSS at que apresenta um nmero grande de opes. A maioria delas pode ser acessada atravs do menu, por exemplo os subcomandos /STATISTICS e /HISTOGRAM. Todos os cdigos entre colchetes so opcionais, e os entre chaves indicam opes que podem ser escolhidas. Ressaltamos que essa janela parte do sistema de ajuda do SPSS e embora mostre todas as opes existentes para cada comando, no apresenta nenhuma explicao sobre o que cada uma faz. Para informaes mais detalhadas sobre os comandos do SPSS o leitor pode consultar o manual SPSS Base Syntax Reference Guide (disponvel no menu Help.. Syntax Guide). O comando FREQUENCIES presente na janela de sintaxe vai produzir exatamente a mesma tabela de freqncia feita atravs do menu Frequencies clicando OK. At agora apenas o cdigo foi gerado, para rodar o procedimento basta selecionar o comando desejado com o

69

mouse e clicar no cone (Run Current). Note que no menu Run voc tem mais opes para rodar seu programa como, por exemplo, All que roda todos os comandos sem que voc precise selecionar nenhum anteriormente. Podemos continuar nosso programa selecionando outros procedimentos dos menus do SPSS e depois clicando em Paste. Cada janela de sintaxe aberta um arquivo em potencial que pode ser salvo em formato texto. Para salvar uma janela de sintaxe basta clicar o menu File opo Save. Escolhemos o disco e diretrio no qual queremos armazenar o arquivo e digitamos o nome com o qual ele ser armazenado (quadro File name). Note que a extenso usada para as janelas de sintaxe .sps. Como esses arquivos so gerados como formato texto, podemos edit-los em qualquer editor de textos. Um arquivo salvo anteriormente com comandos pode ser aberto dentro de qualquer sesso do SPSS, modificado se necessrio e executado. Para abrir um arquivo desse tipo basta clicar o menu File Open... e escolher o tipo Syntax(*. sps) no menu Files of type (ver Figura VIII-2O). Aps escolher o arquivo e clicar OK uma janela de sintaxe aberta e voc poder executar ou modificar esse arquivo. Existe uma maneira mais fcil e rpida de executar arquivos de sintaxe e scripts no SPSS; basta coloc-los como botes nas barras de ferramentas como veremos a seguir.

6. Customizao das barras de ferramentas Cada janela do SPSS tem sua prpria barra de ferramentas que lhe d um acesso fcil e rpido a tarefas comuns. Algumas janelas tm mais de uma barra de ferramentas e voc pode control-las de vrias maneiras : Mostrar ou esconder barras; Mostrar as barras vertical ou horizontalmente, fixadas esquerda, direita, em cima ou em baixo da janela;

70

Mostrar as barras como palhetas flutuantes em qualquer lugar dentro ou fora da janela; Customizar as barras de modo que contenham as ferramentas que voc mais usa, incluindo programas em sintaxe ou script. Para mostrar ou esconder uma barra de ferramentas escolha a opo Toolbars... do menu View e na caixa de dilogo Show Toolbar (ver Figura VIII-7), escolha as barras que voc deseja mostrar ou esconder. J para mover uma barra de ferramentas, basta clicar em qualquer lugar da barra, mas fora de qualquer cone e arrastar a barra para a localizao desejada. Para customizar barras de ferramentas escolha a opo Toolbars... do menu View, selecione a barra que voc quer customizar e clique em Customize, ou clique em New Toolbar para criar uma nova barra de ferramentas. Para novas barras, entre um nome, selecione as janelas nas quais voc quer que a barra aparea, e clique em Customize. Na caixa de dilogo Customize Toolbar (ver Figura VIII-7), selecione um item na lista de categorias (Categories) para mostrar as ferramentas disponveis naquela categoria e arraste as ferramentas que voc quer para a barra que aparece na parte de baixo da caixa de dilogo (para remover um item, simplesmente arraste-o para fora desta barra).

Figura VIII-7: Caixa de dilogo Show Toolbars e Customize Toolbar

Voc pode tambm criar uma ferramenta customizada capaz de executar as seguintes aes: lanar uma aplicao mandando (ou no) os dados do SPSS, rodar um script ou um programa

71

de sintaxe. Para isso, clique em New Tool e na janela aberta entre um rtulo descritivo em Label, selecione a ao que voc quer para a ferramenta em Action e clique em Browse para selecionar o arquivo que vai ser associado ferramenta a qual ser mostrada posteriormente na categoria User-Defined. Voc pode ainda atravs da caixa de dilogos Toolbar Properties (clicando em Properties) selecionar em quais tipos de janela do SPSS voc quer cada barra aparea. Essa caixa tambm usada para criar nomes para novas barras e mostrada na Figura VIII-8.

Figura VIII-8: Propriedades da barra de ferramentas

72

IX. Unio de Dois Bancos de Dados Muitas vezes queremos usar informaes, para a realizao de uma anlise, que esto armazenadas em arquivos diferentes. Como j mencionado anteriormente, o SPSS no consegue trabalhar com mais do que uma janela de dados aberta ao mesmo tempo. A alternativa usada pelo SPSS quando queremos trabalhar com mais de um arquivo de dados unir os arquivos. A condio essencial para que a unio possa ser efetuada que todos os arquivos estejam no formato do SPSS (.sav). Dessa maneira o arquivo resultante da unio conter toda a informao dos vrios arquivos. Vamos supor num primeiro momento que desejamos unir dois arquivos. O procedimento Merge Files, presente no menu Data, apresenta duas opes para unio (ver Figura IX-1): unio de linhas/casos (Add Cases) ou unio de colunas/variveis (Add Variables). Faremos a seguir uma descrio detalhada de cada um deles.

Figura IX-1: Procedimento Merge Files presente no menu Data

1. Adicionando casos(registros) Essa opo adequada quando os dois arquivos que desejamos unir contm as mesmas variveis (ou pelo menos um grupo de variveis em comum) e diferentes casos.

73

Como no podemos abrir os dois arquivos ao mesmo tempo no SPSS vamos ter que unir os dois arquivos. Em primeiro lugar devemos abrir um dos arquivos. Em seguida devemos clicar o menu Data.. Merge Files.. Add Cases. Uma janela aberta e nessa janela devemos indicar o nome do arquivo a ser unido ao arquivo aberto, e clicar Open. A nova janela apresentada contm uma srie de informaes sobre as variveis presentes nos arquivos. O quadro no lado direito de nome Variables in New Working Data File lista as variveis que so comuns aos dois: arquivos (variveis pareadas). Como padro todas elas sero includas no "novo" arquivo que ser criado aps a unio. O quadro no lado esquerdo de nome Unpaired Variables contm todas as variveis que no so comuns aos dois arquivos (variveis no-pareadas). O sinal * na frente da varivel indica que ela est presente no arquivo ativo, basta observar a legenda no canto inferior esquerdo: (*)=Working Data File(arquivo ativo,,j aberto). O sinal + na frente de outra varivel indica que essa varivel est presente no outro arquivo. A princpio, todas as variveis listadas nesse quadro no sero includas no novo arquivo. Voc tem a opo de incluir ou excluir quaisquer variveis do novo arquivo. Para excluir variveis comuns aos dois arquivos basta mov-las para o quadro Unpaired Variables. Para incluir uma varivel no-pareada basta mov-la para o quadro Variables in New Working Data File usando o boto em formato de flecha. Se voc quiser incluir uma varivel que tenha nomes diferentes nos dois arquivos (por exemplo: es civil e estcivil), selecione as duas e use o boto Pair, assim, essas duas variveis iro passar para o quadro Variables in New Working Data File como uma s. No canto inferior direito, podemos marcar o quadro Indicate case source as variable quando quisermos incluir uma varivel que receber valores "0" quando o caso pertence ao arquivo ativo e "1" quando o caso pertence ao arquivo que est sendo unido. Como padro o nome dessa nova varivel source0l; para mud-lo basta clicar com o cursor no quadro que contm o nome e digitar o novo nome.

74

Figura IX-2: Janela de definio para unio de casos

importante ressaltar que quando queremos unir mais do que dois arquivos o procedimento idntico ao j descrito aqui. Unimos os dois primeiros arquivos, e depois, ao arquivo resultante unimos o terceiro e assim por diante. Casos de mais de dois arquivos tambm podem ser unidos atravs da janela de sintaxe com o comando ADD FILES.

2. Adicionando variveis Essa opo adequada quando os dois arquivo contm os mesmos casos (ou pelo menos parte deles em comum) mas no as mesmas variveis. O arquivo resultante ter as variveis provenientes dos dois arquivos. Nesse tipo de unio necessrio que os arquivos a serem unidos estejam no formato SPSS e aconselhvel que contenham uma varivel chave. A varivel chave (key variable) aquela que identifica a correspondncia dos casos nos dois arquivos. Essa varivel deve ter o mesmo valor nos dois arquivos para casos equivalentes e o arquivo deve estar ordenado por essa varivel antes que a unio seja efetuada. Voc pode adicionar variveis sem usar uma varivel chave, porm para que o resultado da unio seja correto, os dois arquivos tero que conter os mesmos casos e exatamente na mesma ordem. Da mesma forma que na unio de casos devemos abrir um dos dois arquivos. Em seguida devemos clicar o menu Data.. Merge Files.. Add Variables. Uma janela aberta, e nela devemos indicar o nome do arquivo a ser unido e clicar Open.

75

A prxima janela aberta (ver Figura IX-3) mostra um quadro direita, de nome New Working Data File, contendo a lista de todas as variveis que faro parte do novo arquivo. Voc pode notar que ao lado de cada varivel existe um smbolo, esse smbolo usado para indicar a procedncia de cada uma das variveis ((*) para o arquivo ativo e (+) para o arquivo que est sendo unido) como descrito na legenda da parte inferior dessa janela. Podemos excluir qualquer varivel do arquivo final. Para isso basta mov-las para o quadro no canto esquerdo de nome Excluded Variables. Inicialmente, so colocadas nesse quadro todas as variveis comuns aos dois arquivos, no nosso caso id, mas essa justamente a varivel que deve ser usada como varivel chave da unio. No caso de unir os bancos de domiclios e pessoas de para o Censo 2000 abrir

deveremos

primeiro o arquivo de domiclios e escolher as seguintes variveis chaves: municpio, distrito, subdistrito e controle, e selecionar a
Figura IX-3: Janela de definio para unio de variveis

opo

Working

Data File is keyed table, como na figura ao lado. Caso tenhamos uma ou mais variveis chaves para a unio devemos selecionar a opo Match cases on key variables in sorted files e especific-las (no nosso caso apenas id), movendoas para o quadro de nome Key Variables. Quando usamos uma varivel chave, temos trs opes para a seleo dos casos que faro parte do arquivo resultante da unio:

76

Both files provide cases: use essa opo se voc deseja que os casos que no aparecem

no primeiro ou no segundo arquivo sejam includos na unio; External file is keyed table*: se voc deseja que s os casos que apaream no outro

arquivo faam parte da unio; Working Data file is keyed table*: se voc deseja que s os casos que apaream no

arquivo aberto faam parte da unio.


*Keyed Table => Contribui apenas com as variveis para o novo arquivo, os casos da Keyed Table so ignorados.

Caso voc escolha Both files provide cases, voc pode marcar a opo Indicate case source as variable, que faz com que seja criada uma varivel no arquivo resultante contendo valor "0" para casos que s aparecem no primeiro arquivo e "1" para os demais (inclusive para os que apaream s no segundo arquivo). Vamos escolher Both files provide cases, clicar em OK e o arquivo resultante da unio colocado na janela de dados. Voc vai notar que uma mensagem apresentada antes que a unio seja efetuada. Essa mensagem apenas alerta voc ao fato de que a unio vai falhar se os arquivos no estiverem ordenados pela varivel chave (no nosso caso id).

77

X. Lendo Bancos de_Dados_Usando ODBC J vimos anteriormente como ler arquivos textos e usamos vrios arquivos no formato do SPSS (terminao .sav). Porm, muitas vezes nossos dados esto localizados em bases com as quais o SPSS no consegue se comunicar diretamente; assim, para que possamos trabalhar com esses dados, o SPSS usa ODBC. Vamos capturar os dados de um banco do Access para exemplificar o uso de ODEC no SPSS. Para iniciar, voc deve escolher a opo Open Database..New Query do menu File. A Figura X-1 mostra a janela aberta.

Figura X-1: Janela aberta para escolher o tipo de banco de dados a ser aberto

Nessa janela ele mostrar todos os bancos de dados configurados no seu computador (dica: voc pode configurar um novo banco de dados clicando no boto Add Data Source).

78

O prximo passo selecionar a(s) tabela(s) a ser(em) lidas (ver Figura X-2), e arrast-la(s) para o quadro Retrieve Fields in This Order. Se voc clicar no + do lado do nome da tabela, voc poder selecionar apenas um conjunto das variveis (campos) originais da(s) sua(s) tabela(s).

Figura X-2: Selecionando as tabelas a serem lidas

Caso voc escolha mais de uma tabela, o prximo passo selecionar a relao entre essas tabelas. A Figura X-3 mostra um exemplo onde estaramos especificando a varivel chave (ou seja, aquela que identificaria os casos para que eles possam ser corretamente unidos). Para especificar uma relao entre as tabelas, basta arrastar com o mouse uma varivel de uma tabela at a varivel correspondente (que no precisa necessariamente ter o mesmo nome) na outra tabela. Voc pode ter mais de uma relao entre as tabelas.

79

Figura X-3: Especificando relaes entre as tabelas

Clicando em Next > voc chega no quadro onde podemos limitar os casos a serem lidos(ver Figura X-4). A limitao geralmente consiste em preencher o quadro Criteria com dois ou mais critrios. Um critrio consiste de duas expresses e uma relao entre elas. As limitaes podem retornar um dos valores: verdadeiro, falso ou ausente para cada caso. Se o resultado for verdadeiro, o caso selecionado. Se for falso ou ausente, o caso no selecionado. A maioria dos critrios usa um ou mais dos seis operadores relacionais (<,>,<=,>=,=, e <>). As expresses podem incluir nomes de campos, constantes, operadores aritmticos, funes e variveis lgicas. Nessas expresses, voc pode usar campos que no pretende importar como varivel.

80

Figura X-4: Selecionando casos a serem importados

Use o boto Prompt For Value.., para criar uma caixa de dilogo que solicite informaes ao usurio cada vez que voc rodar sua consulta. Ele til quando quiser usar a mesma fonte de dados usando diferentes critrios. A figura logo abaixo mostra como voc preencheria o quadro Prompt for Value para que aparecesse a sua pergunta e para limitar as possveis respostas a '1', '2', '3' e '4' (que so os cdigos vlidos das categorias da varivel do banco de dados). Na opo Use Random Sampling podemos selecionar uma amostra baseada no percentual aproximado ou no nmero exato de casos.

81

Figura X-5: Usando o boto Prompt For Value

Aps clicar em Next > voc entrar na janela de definies de nomes. O nome completo do campo ser usado como rtulo da varivel e do lado direito voc pode especificar o nome da varivel no SPSS. Na coluna Value Labels, voc pode optar por transformar automaticamente uma varivel string em varivel numrica.

Figura X-6: Definindo os nomes da variveis

82

O ltimo passo aps clicar em Next > escolher se o SPSS deve ler os dados selecionados ou copiar a sintaxe criada para uma janela de programao. Note que nessa janela (ver Figura X7) voc pode escolher salvar essa consulta para uso futuro, preenchendo.o quadro Save query to file (use o boto Browse para escolher um diretrio). Vamos escolher a opo de ler os dados selecionados e escolher um arquivo para salvar a consulta e clicar em Finish.

Figura X-7: Gravando a consulta para uso futuro

Finalmente, o resultado da leitura dos dados colocado na janela de dados. Note que poderamos ter clicado em Finish na janela da Figura X-II caso no houvesse a necessidade de modificar nenhuma das janelas seguintes. No menu File... Open Database voc tem mais duas opes: Edit Query permite que voc edite uma consulta j salva anteriormente e execute-a ou Run Query permite que voc execute uma consulta j salva (muito til em conjunto com a

salve-a com as modificaes. opo de solicitar um valor para o usurio preencher).

83

XI. Grficos Interativos 1. Criando um grfico interativo Um grfico interativo dinmico. No s sua aparncia que pode ser mudada, voc pode mudar a designao das variveis que esto sendo utilizadas no grfico. Elas podem ser movidas entre eixos, legendas, e painis. As mudanas so evidentes na janela de sadas to logo as novas designaes so feitas. Os grficos interativos podem mudar de 2D para 3D ou vice-versa com alguns cliques do mouse, arrastar objetos e clicar com o boto direito do mouse so tarefas-chave para a fcil manipulao dos grficos. Neste captulo vamos ver como criar um grfico de barras interativo e logo a seguir vamos edit-lo. Para criar um grfico interativo, vamos clicar no menu Graphs, escolher a opo Interactive e depois Bar.... Na janela aberta (ver Figura XI-1) vamos modificar as opes iniciais.

Figura XI-1: Criando um grfico de barras interativo

84

Primeiro vamos entender os smbolos que representam as variveis na lista que aparece na parte esquerda da janela. Tipo Escalar Categrica Especial do SPSS Especial criada pelo usurio cone Descrio Representa as variveis descritas como escalares no banco de dados. Representa as variveis descritas como nominais ou ordinais(categricas) no banco de dados. Representam designaes especiais como freqncias, percentuais e casos. Representam combinaes de variveis criadas pelo usurio. Apenas variveis do mesmo tipo podem ser combinadas entre si.

Voc pode mudar a maneira como uma varivel tratada no grfico, ou seja passar de categrica para escalar ou vice-versa, clicando com o boto direito do mouse na lista de variveis e escolher Scale ou Categorical. Essa mudana vale apenas para o grfico e no ser refletida no banco de dados. Agora, vamos estudar as opes que temos na janela de definio de um grfico de barras interativo na ficha de nome Assign Variables: Nmero de dimenses: no canto superior direito voc tem trs opes; 2-D Coordinate, que especifica que nosso grfico ter duas dimenses; 3-D Coordinate, para trs dimenses e 3-D Effect para a criao de um grfico com duas dimenses mas com um efeito 3-D. Vamos escolher 3-D Effect para nosso grfico. Orientao: caso o nmero de dimenses seja dois (e sem efeito 3-D), nosso grfico pode ter uma orientao vertical ou uma orientao horizontal veja figura abaixo.

Eixo Y: para preencher o espao do eixo Y voc deve arrastar com o mouse uma varivel da lista esquerda (diferentemente da maioria dos outros procedimentos do SPSS onde no h possibilidade de arrast-las). No caso do grfico de barras, ele preenche automaticamente esse espao com a varivel especial Count, ou seja, as barras representaro as frequncias das variveis especificadas. Vamos deixar essa opo embora voc poderia especificar uma

85

varivel escalar (e nesse caso a barra representaria uma funo dessa varivel como mdia, mediana, desvio-padro, etc), uma categrica (mas a nica funo disponvel seria a moda) ou a varivel especial Percent. Eixo X: aqui voc pode arrastar qualquer varivel escalar, categrica ou a varivel especial Case (cada barra representaria um caso). Legend Variables - Color e Style: se aqui voc especificar uma varivel categrica, o grfico ser dividido pelas categorias dessa varivel. As cores ou estilos sero designados de acordo com as categorias. Por exemplo, se Sexo for designado como Legend Variable - Color, ento as barras para masculino e feminino sero de cores diferentes (Style far com que os estilos sejam diferentes). Caso voc coloque uma varivel escalar (vlido apenas para Color), voc ter no seu grfico cores aplicadas s barras de acordo com algum valor resumo (como por exemplo, a mdia) dessa varivel. Ao lado das especificaes das variveis, voc escolhe_como ficaro as barras: lado a lado (opo Clustered) ou empilhadas (opo Stack). Panel Variables - dividem o grfico em pequenos painis, cada um representando um diferente grupo de casos. Apenas variveis categricas podem ser escolhidas aqui. Agora, vamos ver na ficha Bars Chart Option para estudarmos suas opes (veja a Figura XI2): Bar Shape: exibe as barras como retngulos, pirmides ou monumentos. Para barras 3-D ou efeito 3-D, a forma da base pode ser circular (opo Circular base) ou quadrada (opo Square base). Bar Labels: exibe rtulos nas barras mostrando as frequncias (opo Count - nmero de casos em cada barra) ou o valor representado pelo comprimento da barra (opo Value). Vamos escolher a opo Value. Bar Baseline: ajusta a localizao da linha base de onde as barras iro comear.

86

Figura XI-2: Ficha Bars Chart Options

Na Ficha Error Bars porque voc pode incluir o intervalo de confiana para a mdia ou um intervalo baseado num nmero de desvios-padro quando a varivel do eixo Y escalar e as barras (ou linhas caso o grfico fosse de linhas) representam a mdia dessa varivel. Nessa ficha voc poderia modificar o nvel do intervalo de confiana/nmero de desvios-padro, a direo e a forma, assim como a aparncia das barras de erros. Se voc clicar na ficha Titles (veja a Figura XI-3), voc poder escolher um ttulo, um subttulo e uma legenda para o seu grfico. Mais adiante, editando o grfico, voc poder mudar as fontes, posies, estilos, etc desses elementos.

87

Figura XI-3: Ficha Titles

Por ltimo vamos analisar as opes da ficha Options (ver Figura XI-4)

Figura XI-4: Ficha Options

88

Em Categorical Order voc pode especificar a ordem das barras no seu grfico de acordo com o critrio desejado. Em Sort, voc escolhe como ser a ordenao (crescente ou decrescente) e se categorias vazias da varivel sero exibidas ou no (em Exclude empty categories). Vamos escolher descendente. Logo abaixo, em Scale Range, voc pode definir para cada varivel qual o valor mximo e mnimo da escala ou deixar o SPSS calcul-los para voc (opo Auto). Em ChartLook voc escolhe um chartlook a ser aplicado ao seu grfico. Um chartlook controla as propriedades visuais iniciais do grfico, como cores, smbolos e texturas (semelhante ao que um tablelook faz com uma tabela). E por ltimo em Size, determinamos o tamanho do grfico ajustando cada eixo (poderemos modificar esse tamanho depois, editando o grfico). Agora, basta clicar em OK para ele produzir nosso grfico e exibi-lo na janela de sadas. Depois do grfico pronto, vamos passar a edit-lo, modificando inclusive as variveis e estatsticas apresentadas (afinal, por isso que ele interativo!).

2. Editando o grfico

Para editar um grfico interativo basta clicar duas vezes sobre o grfico. Aparecero acima e ao lado do grfico, duas barras de ferramentas que permitiro essa edio. Vamos comear com o Chart Manager ou gerenciador do grfico, que uma das ferramentas mais importantes, clicando no (veja na Figura XI-6). Nesse gerenciador voc tem todos os componentes do

grfico numa lista onde podemos selecionar, esconder, mostrar, editar ou apag-los.

89

Figura XI-6: O gerenciador do grfico

No nosso caso temos os seguintes componentes: Plot Area: contm a regio do grfico em geral, os eixos da varivel categrica e da varivel escalar. Text: todos os textos adicionais; no nosso caso, o ttulo. Legend: aqui controlamos as variveis que definem a legenda (no nosso caso, sexo). Elements: controlamos os elementos do grfico. No nosso caso, temos as barras. Note que aqui,controlamos os componentos do grfico em geral. Por exemplo, se voc quiser mudar a textura ou a cor de uma barra em particular (e no de todas as barras) voc deve clicar com o boto direito do mouse na respectiva barra. Vamos realizar algumas edies no nosso grfico usando o gerenciador. Primeiro, vamos mudar o fundo do grfico clicando em Chart e depois Edit. A Figura XI-7 mostra a janela aberta.

90

Figura XI-7: Opo Data Region

Em Size voc pode modificar o tamanho do grfico. Essa rea (grficos em 2D) ou volume (grficos em 3D) no inclui rtulos de eixos ou ttulos (ou seja, o tamanho desses textos no ser modificado). Se Maintain Aspect Ratio for selecionado, a modificao da altura, largura ou comprimento automaticamente far com que os outros dois sejam modificados para que a razo seja mantida. Em Axis Labels e ,Axis Titles (opo disponvel apenas em grficos 3D) voc escolhe a posio dos rtulos e ttulos dos eixos: na frente do grfico ou no mesmo plano dos eixos. Em Data Region Fill podemos escolher um novo estilo e/ou uma nova cor para o fundo da regio dos dados. Vamos clicar no boto ao lado de Style e vamos escolher alguma das opes oferecidas. Note que podemos escolher entre hachurados, gradientes de duas cores ou texturas e alm disso, ao clicar em More Styles, voc tem mais opes para esses trs tipos (podendo inclusive selecionar qualquer arquivo .bmp como textura).Essas opes esto disponveis para qualquer objeto no grfico que possa ter preenchimento, como barras, pedaos de pizza, legendas, reas, etc. Aps escolher suas edies clique em OK. O prximo componente do gerenciador do grfico, Categorical Axis. Nesse quadro voc encontra opes para modificar quais as categorias

91

exibidas e sua ordenao (ficha Categories), a aparncia do eixo (ficha Appearance), orientao e freqncia dos rtulos (ficha Labels), mostrar ou no o ttulo do eixo e sua orientao (ficha Title), escolher entre mostrar ou no e modificar as configuraes das linhas de grade (ficha Grid Lines) e opes para incluso e edio de linhas de referncia (ficha Reference Lines). Aps as modificaes, vamos clicar em OK e estudar mais um item do gerenciador do grfico, Bar (ver Figura XI-8).

Figura XI-8: Opo Bars

Aqui voc modifica aspectos das barras (de todas!) como a forma e a base (em Bar Shape), rtulos (opo Bar Labels), bordas (em Bar Border) e cores e estilos do preenchimento (opo Bar Fill). No possvel, no nosso caso, modificar a cor das barras nessa janela, pelo mesmo motivo pelo qual voc no pode modificar a cor de uma barra em particular; h uma varivel legenda definindo essas cores. Porm, podemos modificar o estilo de preenchimento como fizemos com o fundo do grfico.

92

Finalmente, no quadro Bars, voc pode mudar a funo representada pelas barras (caso voc tenha alguma varivel escalar no eixo Y, o que no nosso caso) acessando a ficha Summary Function e escolher a largura (e profundidade caso o grfico seja em 3-D) das barras na ficha Bar Width. Como nosso grfico interativo, podemos mudar as variveis que definem nosso grfico, porm, nem sempre isso possvel. A seguir veremos os diferentes estados que um grfico interativo pode ter em relao a mudana de variveis. 3. Grficos interativos, interativos desvinculados e estticos Um grfico interativo tem acesso s variveis usadas para cri-lo. Usando a caixa de dilogo Assign Graph Variables (que veremos a seguir), voc pode modificar as variveis designadas sempre que o grfico ativado. Porm: Se o arquivo usado para criar o grfico ainda est aberto e nada foi modificado na janela de dados desde que o grfico foi criado, ele rotulado como Interactive (interativo) na barra de status da janela de sadas, e voc pode mudar qualquer elemento do grfico, usando todas as variveis disponveis no banco de dados ativo. Estes grficos usam o editor de grficos interativo (que vimos at agora). Se a opo Save data with the chart foi selecionada na ficha Interactive em Edit...Options e se o arquivo foi modificado ou um novo arquivo de dados foi aberto, o grfico desvinculado do arquivo e rotulado como Interactive (detached), ou seja interativo desvinculado, na barra de status da janela de sadas. Para um grfico desvinculado, voc ainda pode mudar as variveis; entretanto, apenas variveis usadas enquanto o grfico estava ativamente conectado ao arquivo de dados estaro disponveis agora. A caixa de dilogo Assign Graph Variables ir conter uma mensagem sobre as variveis disponveis. Um grfico interativo se torna esttico se a opo Save only summarized data selecionada na ficha Interactive em Edit...Options. Num grfico esttico (rotulado como Static na barra de status), apenas os dados resumidos so salvos, e voc no pode mudar variveis, embora voc possa mudar atributos como cor, preenchimento, tamanho dos smbolos, etc. Voc pode tornar

93

um grfico interativo em esttico clicando com o boto direito do mouse e selecionando Save only summarized data do menu que ir aparecer. Um grfico esttico no pode ser transformado em interativo.

4. Alterando as variveis que compem o grfico Se nosso grfico for interativo ou interativo desvinculado, poderemos modificar as variveis e funes que o compem utilizando a caixa de dilogo de controle de variveis do grfico (Assign Graph Variables). Para acessar essa caixa de dilogo basta clicar no cone ento ser aberta uma janela como mostrado na Figura XI-9. e

Figura XI-9: Janela de controle das variveis

Note que essa janela praticamente idntica quela que voc usou para construir o grfico original, ou seja, voc j sabe como preench-la. Abaixo na figura XI-10 temos outras opes de elementos que podemos inserir no grfico.

94

O procedimento de clicar com o boto direito do mouse muito importante para a edio de um grfico interativo, especialmente quando o grfico tem muitos elementos e/ou voc deseja editar um ou mais itens especficos e no todos de uma vez. Alm disso, para realizar edies em objetos especficos do seu grfico, voc pode simplesmente selecion-los e usar os cones em torno do grfico.

Figura XI-10: Opes de elementos que podemos inserir no grfico

5. Chart properties e chartlooks J vimos anteriormente a utilizao de templates grficos para facilitar a edio dos grficos no-interativos. De maneira semelhante, os grficos interativos usam duas ferramentas poderosas para a automatizao da edio de suas caractersticas: Chart Properties e ChartLooks. Voc pode escolher as propriedades dos grficos interativos na opo Chart Properties e salvar suas escolhas num ChartLook. Usando as opes dessa caixa de dilogo , voc pode ajustar: A seqncia de cores para uma legenda categrica ou faixa de cores para uma legenda escalar (ficha Colors). A sequncia de preenchimentos, smbolos e linhas para legendas categricas (ficha Styles). Tamanhos de smbolos e linhas para legendas categricas e escalares (ficha Sizes). Propriedades de texto para objetos como ttulos e rtulos (ficha Text). Preenchimento e bordas para objetos grficos como barras e pedaos de pizza (ficha Filled Objects).
95

A aparncia dos eixos e marcadores ao longo dos eixos (ficha Axes). Propriedades de linhas, smbolos e conectores (ficha Lines & Symbols). Para salvar ou aplicar seu formato (ou algum j pronto) clique na opo ChartLooks.. do menu Format. Na janela aberta, voc pode: Salvar seu formato clicando em Save As... Editar qualquer formato existente clicando em Edit Look... Aplicar algum formato existente escolhendo da lista de chartlooks do lado esquerdo (que mostra os formatos do diretrio padro de chartlooks) ou clicando em Browse para procurar em outro diretrio e depois clicar em Apply.

96

XII: Propriedades e Formatos de uma Tabela 1. Propriedades da tabela Vimos anteriormente como fazer alguns tipos de edio em tabelas do SPSS. Agora vamos estudar um pouco sobre as propriedades da tabela, o que torna a edio de tabelas uma ferramenta mais poderosa ainda. Para isso, vamos criar uma tabela, por exemplo, usando o procedimento Crosstabs. Depois que a tabela foi criada na janela de sadas, vamos edit-la clicando nela com o boto direito do mouse e selecionando SPSS Pivot Table Object 8 Open do menu que ir aparecer. Para abrir a janela de propriedades da tabela clique em Format e depois selecione Table Properties....Uma janela aberta (ver Figura XII-1) onde podemos escolher cinco caractersticas da tabela para modificar bastando clicar no respectivo nome: General, Footnotes, Cell Formats, Borders e Printing.

Figura XII-1: Janela para mudana das propriedades da tabela - Quadro General

97

- Quadro General (ver Figura XII-1): Vrias propriedades se aplicam tabela como um todo. Voc pode: Mostrar ou no linhas ou colunas vazias em Hide empty rows and columns (que no tem nada nas clulas de dados). Controlar a localizao dos rtulos das linhas em Row Dimension Label: In Corner posicionar tais rtulos no canto superior esquerdo da tabela, enquanto que a opo Nested far com que os rtulos fiquem no canto esquerdo da tabela. Controlar a largura mnima e mxima dos rtulos das colunas e das linhas em Minimum/Maximum width for column/row labels. - Quadro Footnotes: Aqui voc controla as propriedades dos marcadores de nota de rodap incluindo estilo e posio em relao ao texto: No estilo podem ser usados nmeros (Numeric: 1,2,3,...) ou letras (Alphabetic: a,b, c, ...). Os marcadores podem ser anexados ao texto como sobrescrito (Superscript) ou subscrito (Subscript).

- Quadro Cell Formats (ver Figura XII-2): Para formatao, uma tabela dividida em oito reas: ttulo (Title), camadas (Layers), rtulos do canto superior esquerdo, das linhas e das colunas (Corner Labels, Row Labels e Column Labels respectivamente), dados (Data), legendas (Caption) e notas de rodap (Footnotes). Voc ento escolhe alguma rea (e no um grupo de clulas) atravs do menu Area ou clicando com o mouse na rea desejada na pequena tabela mostrada no quadro Sample e modifica o formato.

98

Figura XII-2: Quadro Cell Formats

- Quadro Borders (ver Figura XII-3): Para cada lugar da borda numa tabela, voc pode selecionar um estilo e cor para a linha. Se voc selecionar None como estilo, no haver linha no lugar selecionado. Para selecionar uma borda, clique no nome da borda na lista Border ou clique na linha na pequena tabela que aparece no quadro Borders de amostra mostrada ao lado da lista, da basta apenas selecionar um estilo e uma cor localizados no canto inferior esquerdo.

99

Figura XII-3: Quadro Borders

- Quadro Printing (ver Figura XII-4): Aqui voc controla as propriedades da tabela em relao a impresso. Voc pode: Imprimir todas as camadas (layers) ou apenas a camada que est sendo mostrada em Print all layers, e imprimir cada camada numa pgina separada em Print each layer on separate page (Isto afeta apenas a impresso, e no a visualizao na janela de sadas). Reduzir uma tabela horizontal ou verticalmente para caber numa nica pgina em Rescale wide table to fit page e Rescale long table to fit page. Caso voc deixe a tabela ser quebrada, voc pode controlar o nmero de linhas rfs/vivas em Widow/Orphan lines. Escolher o texto que indica que a tabela foi quebrada (o padro "cont. ") em Continuation text. Caso voc queira que o texto aparea voc deve marcar uma das duas opes em Position of Continuation Text: no fim (opo At bottom of table) ou no comeo da tabela (opo At top of table).
100

Figura XII-4: Quadro Printing

2.Table Looks Um tablelook um conjunto de propriedades que definem a aparncia de uma tabela. Voc pode selecionar um tablelook previamente definido ou criar o seu prprio. Antes ou depois que um tablelook aplicado, voc pode mudar o formato de clulas para clulas individuais ou um grupo usando Cell Properties. Os formatos permanecero, mesmo quando voc aplicar um novo tablelook. Por exemplo, voc pode comear aplicando o tablelook chamado HotDog e depois selecionar uma coluna e mudar algumas caractersticas do contedo dessa coluna. Mais tarde, voc pode aplicar o tablelook chamado Avant-Garde. A coluna previamente selecionada mantm a cor que voc colocou anteriormente enquanto o resto das caractersticas so aplicadas do tablelook Avant-Garde.

101

Para aplicar um tablelook voc deve clicar no menu Format e escolher a opo TableLooks.... A Figura XII-5 mostra a janela aberta onde voc pode escolher na lista TableLook Files aquele formato que mais lhe agrada. A lista que aparece nessa janela corresponde aos formatos salvos no diretrio do SPSS, que o diretrio padro para se armazenar os tablelooks. Caso seu padro esteja em outro diretrio, basta clicar em Browse... para selecion-lo.

Figura XII-5: Escolhendo o tablelook a ser aplicado tabela

Mas voc deve estar se perguntando como criar um padro! simples; quando definimos tablelook no comeo desse tpico, voc viu que ele um conjunto de propriedades de uma tabela. Pois ento, basta voc definir as propriedades da tabela que voc gostaria que se tornasse um padro em Table Properties, entrar na opo TableLooks... e clicar em Save Look. Lembre-se, porm que na lista TableLook Files s vo aparecer os formatos salvos no diretrio padro de tablelooks o qual, caso voc no mude, o diretrio chamado Looks localizado dentro do diretrio do seu SPSS. 3. Criando um grfico a partir de uma tabela Podemos criar automaticamente um grfico interativo a partir de uma tabela no SPSS. Para isso, basta selecionar as clulas dos dados que iro compor o grfico (no necessrio selecionar os ttulos das linhas ou colunas), escolher a opo Create Graph do menu Edit (ou no menu aberto ao clicar com o boto direito do mouse sobre a rea selecionada) e finalmente escolher o tipo de grfico que voc deseja construir.
102

XIII. Controlando o Ambiente O SPSS foi desenvolvido com alguns aspectos gerais predeterminados. Voc deve ter percebido, por exemplo, que toda nova varivel criada tem o formato inicial numrico de tamanho 8 e 2 casas decimais, embora isso possa ser mudado. Assim como a caracterstica descrita acima, muitas outras tambm fazem parte da definio inicial do SPSS. Como difcil agradar a todos os usurios com os mesmos padres o SPSS permite que voc os modifique atravs do menu Edit..Options. 1. Quadro General Quando entramos em Options..., uma janela aberta (ver Figura XIII-1) e atravs dela que faremos as modificaes desejadas.

Figura XIII-1: Janela de definio menu Edit.. Options.. General

103

Primeiramente notamos nesse quadro no canto superior esquerdo uma parte chamada Session Journal. Quando a opo Record syntax in journal estiver selecionada, todos os comandos executados estaro sendo enviados a um arquivo, cujo nome padro spss.jnl, localizado no diretrio C:\WINDOWS\TEMP. O nome do arquivo destino, bem como sua localizao, podem ser alterados simplesmente clicando Browse.... Alm disso, nesse mesmo quadro devemos optar entre Append ou Overwrite. Se selecionarmos Append, os comandos executados em uma sesso sero acumulados aos executados nas sesses anteriores; a desvantagem que esse arquivo torna-se cada vez mais extenso, ocupando cada vez mais espao em seu disco. Se selecionarmos Overwrite os comandos executados nessa sesso sero sobrepostos aos executados na sesso anterior e assim por diante; a desvantagem que o comando que gostaramos de relembrar quase nunca o executado na ltima seo! Em Display of Small Numbers voc escolhe se quer omitir, na tabelas (output), a notao cientfica para os valores decimais muito pequenos. Esses nmeros sero mostrados no output com 0 ou .000. Caso seja do seu interesse trabalhar com uma janela de programao em todas as sesses do SPSS, ativando a opo Open Syntax window at Startup uma janela de sintaxe aberta toda vez que uma sesso inicializada, alm da janela de dados. Temos tambm como alterar a ordem com que as variveis so apresentas nas janelas de definio de todos os procedimentos, atravs do quadro Variable Lists. A ordem pode ser alfabtica (Alphabetical) ou pela ordem em que as variveis so apresentadas na janela de dados (File). Tambm est nesse quadro o local onde voc controla como as variveis aparecem nas listas; voc pode escolher que sejam mostrados os rtulos (Display labels) ou apenas os nomes das variveis (Display names). Logo abaixo, voc tem a opo de modificar quantos arquivos aparecero na lista de arquivos recentemente usados (Recently Used Files List). Esta lista aparece no menu File e serve para voc abrir rapidamente qualquer um desses arquivos sem precisar especificar discos, diretrios, etc. O nmero de arquivos que a lista pode ter varia entre 0 e 9. Em Temporary Directory voc controla a localizao dos arquivos temporrios criados durante uma sesso. Dependendo do modo como voc trabalha com os arquivos (ou seja, criando

104

cpias ou no), do tamanho desses arquivos e operaes realizadas, o espao para arquivos temporrios pode se tornar muito grande. Por exemplo, um arquivo de 200MB. pode precisar de mais de 400MB para arquivos temporrios. Nesse caso, pode ser necessrio mudar a localizao desses arquivos para alguma pasta ou disco que contenha mais espao livre disponvel. No quadro Output Type at Start-up voc escolhe o tipo de janela de sadas. Durante todo o treinamento, vimos o tipo padro que o Viewer, porm voc pode escolher a opo Draft Viewer; nesse modo todas as tabelas do SPSS sairo em formato texto (muito parecido com as verses antigas do SPSS) e os grficos no podem ser editados. No quadro Output Notification voc controla a maneira como o SPSS o notifica que ele terminou de rodar um procedimento e que os resultados esto disponveis na janela de sadas e finalmente em Measurement System voc escolhe o sistema de medidas usado (pontos, polegadas ou centmetros) para especificar atributos como margens de tabelas, largura de clulas, espao entre tabelas para impresso, etc.

105

2. Quadro Viewer Clicando em Viewer na parte superior da janela Options, voc controla caractersticas da janela de sadas.(Figura XIII-2). Em Initial Output State, voc controla quais itens so automaticamente mostrados ou no cada vez que voc executa um procedimento e como os itens so alinhados (para impresso apenas). Em Title Font (ou Page Title Font, voc tem duas opes) voc controla o estilo, tamanho e cor da fonte para novos ttulos de procedimentos e pginas da janela de sadas. Para sadas em formato texto, Text Output Page Size controla a largura e comprimento da pgina e em Text Output Font voc seleciona as caractersticas da fonte usada nessas sadas (evite usar fontes que no sejam mono-espaadas).

Figura XIII-2: Opo Viewer do menu Edit.. Options

106

3. Quadro Draft Viewer Nesse quadro voc controla a formatao das sadas no modo Draft Viewer. Aqui voc tem opes de escolher quais sadas sero produzidas, o separador de colunas, a largura das colunas, o separador de clulas, qual a fonte e o seu tamanho, etc. 4. Quadro Output Labels Clicando em Output Labels na janela Options (ver Figura XIII-3), voc controla como o SPSS mostra as informaes das variveis e valores no painel geral da janela de sadas e nas tabelas. Voc pode mostrar o nome da varivel e/ou seu rtulo, e os valores reais dos dados e/ou seus rtulos.

Figura XIII-3: Opo Output Labels do menu Edit.. Options

107

5. Quadro Charts Se clicarmos em Chart (ver Figura XIII-4) na parte superior da janela Options poderemos alterar os padres da produo de grficos no-interativos, como o tipo de fonte em Font (todas as fontes que estiverem disponveis no Windows podem ser utilizadas nos seus grficos), se os grficos devem vir ou no com borda externa/interna (em Frame Outer/Inner), etc. No quadro Chart Template voc pode especificar um template grfico que ser aplicado a todos os grficos feitos posteriormente e em Chart Aspect Ratio voc especifica a razo largura/altura da moldura externa de novos grficos (especificando um valor entre 0,1 e 10). Por exemplo, o valor 1 produziria um grfico quadrado.

Figura XIII-4: Opo Charts do menu Edit.. Options

108

6. Quadro Interactive As opes desse quadro lidam com os grficos interativos. Em ChartLook voc escolhe o chartlook padro dos seus novos grficos interativos. No quadro Data Saved with Chart voc escolhe se os dados so salvos junto com o grfico (primeira opo) ou no (segunda opo). Ao escolher uma das duas opes voc sempre deve levar em contar os recurso de memria e processamento do seu computador. Tambm podemos escolher a resoluo da impresso em Print Resolution; na maioria dos casos, a opo Vector Metafile ir imprimir mais rpido e com melhores resultados. Com relao s opes de bitmaps temos que grficos em resoluo mais baixa imprimem mais rpido mas em resoluo mais alta imprimem melhor. Em Measurement Units voc escolhe o sistema de medidas (pontos, polegadas ou centmetros) usado para especificar o tamanho de atributos como o tamanho da regio dos dados num grfico. Em Reading Pre-8.0 Data Files voc especifica o nmero mnimo de valores numa varivel numrica usado para classific-la como escalar ou categrica. Variveis com menos valores que o nmero especificado so classificadas como categricas e o restante como escalar. Porm, qualquer varivel com rtulos definidos para valores classificada como categrica, independente do nmero de valores que ela assume.

109

Figura XIII-5: Opo Interactive do menu Edit.. Options

110

7. Quadro Pivot Tables As opes desse quadro (ver Figura XIII-6) controlam o formato de tabelas usado para as novas tabelas. Voc pode usar um dos tablelooks que vm junto o SPSS ou pode criar o seu prprio na janela de edio de tabelas. O quadro Adjust Column Widths for controla o ajuste automtico das larguras das colunas em tabelas: Labels only ajusta a largura da coluna de acordo com o rtulo da coluna e Labels and Data ajusta de acordo com o o que for maior, o rtulo da coluna ou o maior valor da coluna de dados. Em Default Editing Mode voc especifica onde uma tabela vai ser editada quando voc clicar duas vezes nela. Por exemplo, voc pode escolher que quando voc clicar duas vezes numa tabela, apenas as pequenas sero editadas dentro da janela de sadas; todas as outras sero editadas numa janela prpria.

Figura XIII-6: Opo Pivot Tables do menu Edit.. Options

111

8. Quadro Data Em Display Format for New Numeric Variables (ver Figura XIII-7) voc muda o padro da largura e nmero de casas decimais para novas variveis numricas. At agora, voc j deve ter notdo que sempre que criamos uma varivel nova ela do tipo numrica com 8 dgitos, tendo 2 casas decimais. Esse padro pode ser alterado nesse quadro. Em Transformation & Merge Options, voc determina se algumas transformaes de dados (como usando Compute ou Recode) ou arquivos (como adicionar variveis ou casos) sero calculadas imediatamente ou apenas antes de serem usadas. A opo Calculate values before used usada geralmente quando se est trabalhando com arquivos muito grandes. Em Set Century Range for 2-Digit Years voc escolhe como o SPSS ir interpretar um ano que for digitado com apenas dois algarismos

Figura XIII-7: Opo Data do menu Edit.. Options

112

9. Quadro Currency Voc pode criar at cinco tipos de formatos especiais de variveis que incluem caracteres de prefixo e/ou sufixo especiais e tratamento especial para valores negativos (ver Figura XIII-8). Os cinco nomes de formatos especiais so CCA, CCB, CCC, CCD, e CCE. Voc no pode mudar os nomes ou adicionar novos. Para modificar um formato especial, selecione o nome da lista e faa as mudanas desejadas.

Figura XIII-8: Opo Currency do menu Edit.. Options

113

10. Quadro Scripts Use esse quadro (ver FiguraXIII-9) para especificar o arquivo de procedimento global e o arquivo de autoscript e selecionar as sub-rotinas de autoscript que voc quiser usar. Global Procedures: Um arquivo de procedimentos global uma biblioteca de sub-rotinas e funes que podem ser chamadas por scripts, incluindo autoscripts. No aconselhvel mudar esse arquivo (global.sbs), j que vrios scripts que vm com o SPSS usam funes e subrotinas desse arquivo e no iro funcionar se voc especificar outro arquivo de procedimento global. Autoscripts: Um arquivo de auatoscript uma coleo de sub-rotinas que rodam automaticamente toda vez que vc executar procedimentos que criem certos tipos de objetos na janela de sadas (por exemplo: grficos, tabelas cruzadas, etc.).

Figura XIII-9: Opo Script do menu Edit.. Options

114

XIV. Apndice 1: Resumo das Opes Estatsticas Presentes no Menu Analyze

Relatrios OLAP Reports...OLAP Cubes Esse procedimento calcula totais, mdias, e outras estatsticas univariadas para wariveis escalares dentro das categorias de uma ou mais variveis categricas (de agrupamento). Uma camada criada na tabela para cada categoria de cada varivel de agrupamento. Listagem dos Casos Reports...Case Summaries Calcula estatsticas de subgrupos para variveis de acordo com as categorias de uma ou mais variveis de agrupamento. Todos os nveis das variveis de agrupamento so cruzados voc pode escolher a ordem na qual as estatsticas so exibidas. Os dados para cada caso podem ser listados ou no e para arquivos muito grandes, voc pode escolher listar apenas os n primeiros casos. Reltrios Simples Reports...Report Summaries in Rows ou Columns Listagem de casos e clculo de medidas descritivas so ferramentas bsicas para estudar e apresentar seus dados. Voc pode obter listagem dos casos na janela de dados ou com o procedimento Case Summaries, tabelas de frequncias e estatsticas descritivas com o procedimento Frequencies, e estatsticas para subpopulaes com o procedimento Means. Cada um deles usa um formato destinado a exibir as informaes de maneira limpa. Se voc deseja exibir as informaes num formato diferente e mais simples, Report Summaries ir Rows ou Columns lhe oferecem o controle necessrio sobre a apresentao dos dados. Report Summaries in Rows produz relatrios nos quais diferentes estatsticas so organizadas em linhas. Listagem dos casos tambm est disponvel, com ou sem estatsticas. J Report Summaries in Columns produz relatrios nos quais diferentes estatsticas aparecem em colunas separadas.

115

Tabelas de Frequncias Descriptive Statistics...Frequencies O procedimento Frequencies oferece exibies estatsticas e grficas que so teis para descrever muitos tipos de variveis. Para uma primeira anlise dos seus dados, esse procedimento um bom lugar para comear. Para a tabela de frequncias e grfico de barras, voc pode arranjar os valores distintos em ordem crescente ou decrescente ou orden-los de acordo com suas frequncias. As frequncias podem ser omitidas quando uma varivel tem muitos valores distintos e voc pode rotular os grficos de barras usando as frequncias (padro) ou os percentuais. Estatsticas Descritivas Descriptive Statistics...Descriptives O procedimento Descriptives exibe estatsticas univariadas para vrias variveis numa nica tabela e calcula valores padronizados (z escores). As variveis podem ser ordenadas pela mdia (ordem r,rescente ou decrescente), alfabeticamente ou pela ordem em que voc as selecionou. Quando z escores so armazenados, eles so acrescentados aos seus dados na janela de dados e esto disponveis para grficos, listagens e anlises. Quando as variveis esto armazenadas em diferentes unidades (por exemplo, salrio e idade), o clculo dos z escores coloca-as numa escala comum para uma comparao visual mais fcil. Anlse Exploratria Descriptive Statistics...Explore O procedimento Explore produz exibies estatsticas e grficas, para todos os seus casos ou separadamente para grupos de casos. H vrias razes para usar esse procedimento limpeza dos dados, identificao de casos extremos, descrio, checagem de suposies, e caracterizao de diferenas entre subpopulaes (grupos de casos). A limpeza dos dados pode mostrar que voc tem valores incomuns, extremos, discontinuidade nos dados, ou outras peculiaridades. A explorao dos dados pode ajud-lo a determinar se a tcnica estatstica considerada para a anlise apropriada. A explorao pode indicar que voc precisa

116

transformar os dados se a tcnica requer distribuio normal ou voc pode decidir que necessita de testes no-paramtricos.

Cruzamento de Variveis Descriptive Statistics...Crosstabs Esse procedimento produz tabelas de dupla ou mltipla entrada e oferece 22 testes e medidas de associao para tabelas de dupla entrada. A estrutura da tabela e se as categorias esto ordenadas determina qual teste ou medida a ser usada. As estatsticas e medidas de associao do Crosstabs so calculadas apenas para tabelas de dupla entrada. Se voc especificar uma linha, coluna e uma varivel controle (nas camadas), o procedimento forma um painel de estatsticas e medidas associadas para cada valor da varivel controle (ou combinao de valores para duas ou mais variveis controle). Por exemplo, se Sexo uma varivel controle, os resultados das mulheres so calculados separadamente dos dos homens. Clculo de Mdias Compare Means...Means O procedimento Means calcula mdias por subgrupos e estatsticas univariadas relacionadas para variveis dependentes dentro das categorias de uma ou mais variveis independentes. Opcionalmente, voc pode obter uma anlise de varincia , eta, e teste de linearidade. Testes t Compare Means...One-Sample, Independent-Samples ou Paired-Samples T Test O submenu Compare Means do menu Analyze lhe oferece trs tipos de testes t: One-Sample T Test: compara a mdia de uma varivel com um valor hipottico ou conhecido. Estatsticas descritivas para as variveis de teste so exibidos assim como o teste t.

117

Um intervalo de confiana de 95% para a diferena entre a mdia da varivel de teste e o valor hipottico faz parte da sada padro; Independent-Samples T Test: compara as mdias de uma varivel para dois grupos de casos. Estatsticas descritivas para cada grupo e teste de Levene para igualdade de varincia so apresentados, assim como estatsticas t para varincias iguais e diferentes e um intervalo de 95% de confiana para a diferena das mdias; Paired-Samples T Test: compara as mdias de duas variveis para um nico grupo. Este teste usado tambm para valores pareados e estudos caso-controle. A sada inclui estatsticas descritivas para as variveis de teste, a correlao entre elas, estatsticas descritivas para as diferenas pareadas, o teste t, e um intervalo de confiana de 95%. Anlise de Varincia Simules Compare Means...One-Way ANOVA O procedimento One-Way ANOVA produz uma anlise de varincia simples para uma varivel escalar dependente por uma nica varivel fator (independente). A anlise de varincia usada para testar a hiptese de que vrias mdias so iguais. Esta tcnica uma extenso do teste t para duas amostras. Alm de determinar se existe diferena entre as mdias, voc pode querer saber quais mdias diferem. H dois tipos de testes para comparao de mdias: contrastes a priori e testes post hoc. Contrastes so testes definidos antes de realizar o experimento, e testes post hoc so executados depois que o experimento foi conduzido. Voc tambm pode testar tendncias entre as categorias. GLM - Modelo Univariado General Linear Model...Univariate Esse procedimento oferece anlise de regresso e anlise de varincia para uma varivel dependente por uma ou mais variveis fatores que dividem a populao em grupos. Usando esse procedimento, voc pode testar a hiptese nula sobre o efeito de outras variveis nas mdias de vrios grupos da varivel dependente. Voc pode investigar interaes entre fatores

118

assim como os efeitos de fatores individuais, alguns dos quais podem ser aleatrios. Alm disso, os efeitos de covariveis e suas interaes com os fatores podem ser includos. Para anlise de regresso, os preditores (variveis independentes) so especificados como covariveis. Podem ser testados modelos balanceados e no-balanceados (um desenho de experimento balanceado se cada clula no modelo contm o mesmo nmero de casos). Alm de testar hipteses, o procedimento fornece estimativas dos parmetros. Contrastes a priori comumente utilizados esto disponveis para serem testados. Adicionalmente, depois que um teste F tenha mostrado significncia, voc pode usar testes ad hoc para avaliar diferenas entre mdias especficas. Mdias marginais estimadas lhe do estimativas das mdias previstas para as clulas no modelo, e grficos de perfis (grficos de interao) dessas mdias permitem visualizar facilmente algumas dessas relaes. Resduos, valores previstos, distncias de Cook e valores de influncia podem ser salvos como novas variveis no seu banco de dados para checagem das suposies. WLS Weight permite especificar uma varivel usada para dar diferentes pesos para as observaes usando anlise de mnimos quadrados ponderados (til quando, por exemplo, voc deseja cornpensar precises diferentes nas medies das variveis). Correlaes Correlate...Bivariate O procedimento Bivariate calcula o coeficiente de correlao de Pearson, Spearman's rho e Kendall's tau b com seus nveis de significncia. As correlaes medem como as variveis ou valores ordenados esto relacionados. Antes de calcul-los, verifique em seus dados a presena de valores extremos (que podem levar a concluses errneas) e evidncias de relao linear, j que o coeficiente de correlao de Pearson uma medida de associao linear. Duas variveis podem ser perfeitamente relacionadas, mas se a relao no linear, o coeficiente de correlao de Pearson no uma estatstica apropriada para medir sua associao.

119

Correlaes Parciais Correlate...Partial Esse procedimento calcula coeficientes de correlao parciais que descrevem a relao linear entre duas variveis controlando os efeitos de uma ou mais variveis adicionais. Lembrese que a correlao uma medida de associao linear. Duas variveis podem ser perfeitamente relacionadas, mas se a relao no linear, o coeficiente de correlao no uma estatstica apropriada para medir sua associao. Medidas de Similaridade e Dissimilaridade Correlate...Distances Este procedimento pode lhe fornecer uma srie de estatsticas que medem ou similaridades ou dissimilaridades (distncias), entre pares de variveis ou de casos. Essas medidas podem ser usadas, ento, com outros procedimentos como anlise fatorial, anlise de cluster, escalonamento multidimensional, para ajudar na anlise de conjuntos de dados complexos, etc. Regresso Linear Regression...Linear A regresso linear estima os coeficientes da equao linear, envolvendo uma ou mais variveis independentes, que melhor prevejam os valores de uma varivel dependente. Por exemplo, voc pode tentar prever o peso de uma pessoa (varivel dependente) baseado nos valores da altura e medidas de sedentarismo. Estimao de Curva Regression...Curve Estimation O procedimento Curve Estimation produz estatsticas de estimao de curva de regresso e grficos relacionados para onze diferentes modelos: linear, logartmico, inverso, quadrtico, cbico, potencial, composto, curva S, logstico, crescimento e exponencial. Um modelo separado produzido para cada varivel dependente. Voc pode, tambm, salvar os valores previstos, resduos, e intervalos de predio como novas variveis.

120

Anlise de Cluster - K mdias Classify...K-Means Cluster Esse procedimento tenta identificar grupos de casos relativamente homogneos baseado em caractersticas selecionadas, usando um algoritmo que pode manipular um grande nmero de casos. Entretanto, o algoritmo necessita que voc especifique um nmero de clusters. Voc pode armazenar a pertinncia a um cluster, informaes da distncia, e centros dos clusters finais. Opcionalmente, voc pode especificar uma varivel cujos valores so'usados para rotular casos em algumas sadas. Voc pode tambm requisitar estatsticas F de uma anlise de varincia que embora sejam estatsticas oportunistas (afinal, o procedimento tenta formar grupos que realmente diferem), o tamanho relativo das estatsticas fornecem informaes sobre a contribuio de cada varivel na separao dos grupos. Anlise de Cluster Hierrauica Classify...Hierarchical Cluster Esse procedimento tenta identificar grupos de casos (ou variveis) relativamente homogneos baseado em caractersticas selecionadas, usando um algoritmo que comea com cada caso (ou varivel) num cluster separado e combina clusters at que sobre apenas um. Voc pode analisar as variveis originais ou escolher entre uma variedade de transformaes de padronizao. Medidas de similaridade ou dissimilaridade so geradas pelo comando de sintaxe Proxilnities e estatsticas so exibidas a cada estgio para ajud-lo a selecionar a melhor soluo. Anlise Discriminante Classify...Discriminant A anlise discriminante til em situaes onde voc queira construir um modelo preditivo para classificao em grupos baseado em caractersticas observadas em cada caso. O procedimento gera uma funo discriminante (ou, para mais de dois grupos, um conjunto de funes discriminantes) baseada nas combinaes lineares das variveis preditoras que oferecem a melhor discriminao entre grupos. As funes so geradas a partir de uma amostra de casos para os quais j conhecemos em qual grupo eles esto classificados; as

121

funes podem ser, ento, aplicadas a novos casos, para os quais temos as variveis preditoras mas no sabemos a qual grupo eles pertencem. Anlise Fatorial Data Reduction...Factor A anlise fatorial tenta identificar variveis elementares, ou fatores, que expliquem o padro de correlaes dentro de um conjunto de variveis observadas. Ela frequentemente utilizada em reduo dos dados, atravs da identificao de um pequeno nmero de fatores que expliquem a maior parte da varincia observada num nmero muito maior de variveis. Pode ser usada tambm para gerar hipteses sobre mecanismos causais ou para estudar variveis a serem usadas em anlises subsequentes (por exemplo, identificar colinearidade antes de executar uma anlise de regresso). O procedimento de anlise fatorial oferece uma alto grau de flexibilidade: Sete mtodos de extrao esto disponveis; Cinco mtodos de rotao, incluindo direct oblimin e promax para rotaes noortogonais. Trs mtodos de calcular escores fatoriais, que podem ser salvos como variveis para anlises posteriores. Anlise de Confiabilidade Scale...Reliability Analysis A anlise de confiabilidade lhe permite estudar as propriedades de escalas de medidas e itens que a compem. Esse procedimento calcula vrias medidas comumente usadas de confiabilidade de uma escala, fornece coeficentes de correlao intraclasses e informaes sobre a relao entre itens individuais na escala. Com esse procedimento voc pode responder perguntas como 'Meu questionrio mede satisfao dos clientes de uma maneira til?', pode determinar como os itens esto correlacionados uns com os outros, pode obter um ndice geral de repetibilidade ou consistncia interna da escala como um todo, e identificar itens problemticos que deveriam ser excludos da escala.

122

Escalonamento Multidimensional Scale...Multidimensional Scaling Escalonamento multidimensional uma tcnica que tenta achar uma estrutura num conjunto de medidas de distncias entre objetos ou casos. Isto alcanado atravs da designao das observaes em locaes especficas num espao conceitual (geralmente duas ou trs dimenses). Em muitos casos, as dimenses desse espao conceitual podem ser interpretadas e usadas para entender seus dados. Voc pode usar escalonamento multidimensional como uma tcnica de reduo de dados. Testes No-Paramtricos Nonparametric Tests O menu de testes no-paramtricos lhe oferece testes que no necessitam de suposies sobre a forma da distribuio da varivel a ser testada: Chi-Square: tabula uma varivel em categorias e calcula uma estatstica de quiquadrado baseada nas diferenas entre frequncias esperadas e observadas; Binomial: compara a frequncia observada em cada categoria de uma varivel dicotmica com as frequncias esperadas a partir de uma distribuio binomial; Runs: testa se a ordem de ocorrncia de dois valores de uma varivel aleatria; One-Sample Kolmogorov-Smirnov: compara a funo de distribuio acumulada observada para uma varivel com uma distribuio terica especificada, que pode ser normal, uniforme ou Poisson; Two Independent-Samples: compara dois grupos de casos em uma varivel. Esto disponveis os testes de Mann-Whitney U, duas amostras de KolmogorovSmirnov, Moses de reaes extremas e runs de Wald-Wolfowitz; K Independent Samples: compara dois ou mais grupos de casos em uma varivel. Os testes disponveis so o de Kruskal-Wallis, da mediana e de Jonckheere-Terpstra;

123

Two Related Samples: compara a distribuio de duas variveis. Esto disponveis os testes do sinal, de McNemar e Wilcoxon signed-rank; K Related Samples: compara a distribuio de duas ou mais variveis. Os testes disponveis so o de Friedman, W de Kendall e Q de Cochran. Para todos os testes acima esto disponveis os quartis, mdia, desvio-padro, mnimo, mximo e nmero de casos vlidos. Anlise de Varives de Resposta Mltipla Multiple Response Dois procedimentos esto disponveis para analisar conjuntos de resposta mltipla usando codificao dicotmica ou categrica. O procedimento Multiple Response...Frequencies exibe tabelas de frequncias e Multiple Response...Crosstabs exibe tabulaes duplas ou triplas. Antes de usar esses procedimentos, voc deve definir pelo menos um conjunto de resposta mltipla em Multiple Response...Define Sets.

124

XV. Apndice 2: Alguns Tipos de Arquivos Importantes Tipos de arquivos (indicados por suas extenses): .clo .html .jpg .mdb .sav .sbs .sct .spo .spq .sps .tlo .tpf .txt .xl* - Arquivo de ChartLook do SPSS - Do ingls "hypertext markup language", linguagem usada na Internet - Tipo de arquivo grfico - Banco de dados do Access - Arquivo de dados do SPSS for Windows - Arquivo de script em SaxBasic do SPSS - Template grfico do SPSS - Arquivo de sadas do SPSS - Consulta a banco de dados criada no SPSS - Arquivo de sintaxe do SPSS - Arquivo de TableLook do SPSS - Formato pr-definido para leitura de arquivos texto usado pelo Wizard do SPSS - Arquivo texto padro - Arquivos do Excel

125