Você está na página 1de 53

Curso Básico

de

SPSS 7.5
Juliana Mambrini
Kleber Adriano Pansanato
Natália Guimarães Duarte Sátyro

PROAV-UFMG
Coordenador Geral – José Francisco Soares

Belo Horizonte – MG
abril 1999

1
Curso SPSS 7.5 PROAV-UFMG
2
Curso SPSS 7.5 PROAV-UFMG
Índice

I INFORMAÇÕES BÁSICAS 5

I.I. INTRODUÇÃO 5
I.II. DESCRIÇÃO GERAL 5
I.III. INICIANDO E TERMINANDO UMA SESSÃO NO SPSS 7
I.IV. APRESENTANDO AS JANELAS DO SPSS 8
I.V. ARQUIVOS DE DADOS 8
I.VI. OBTENDO AJUDA 9

II ENTRADA E SAÍDA DE DADOS 10

II.I. INTRODUÇÃO 10
II.II. ENTRADA DE DADOS 10
II.II.I. LEITURA DE UM ARQUIVO DE DADOS 10
II.II.II. ENTRADA DE DADOS VIA DIGITAÇÃO 11
II.II.III. DEFININDO VARIÁVEIS 12
II.III. ARMAZENAMENTO DE DADOS 15
II.IV. ARMAZENAMENTO DE RESULTADOS 16
II.V. ARMAZENAMENTO DE GRÁFICOS 17
II.VI. EXERCÍCIO DE FIXAÇÃO 17

III TRANSFORMAÇÃO DE DADOS 19

III.I. INTRODUÇÃO 19
III.II. ATRIBUINDO POSTOS ÀS VARIÁVEIS 19
III.III. RECODIFICAÇÃO DE VARIÁVEIS 20
III.IV. O COMPUTE 23
III.IV.I. PARA UTILIZAR O COMPUTE VARIABLES 23
III.IV.II. COMPUTE VARIABLE: IF CASES 24

IV TRANSFORMAÇÕES NO ARQUIVO DE DADOS 25

IV.I. INTRODUÇÃO 25
IV.II. ORDENANDO CASOS 26
IV.III. CRIANDO UM SUBCONJUNTO DE DADOS 26
IV.IV. COMANDO SPLIT FILE 28
IV.V. JUNTANDO ARQUIVOS DE DADOS 29
IV.V.I. JUNTANDO CASOS 29
IV.V.II. JUNTANDO VARIÁVEIS 30
IV.VI. AGREGANDO VARIÁVEIS 31

3
Curso SPSS 7.5 PROAV-UFMG
V TÉCNICAS ESTATÍSTICAS 33

V.I. INTRODUÇÃO 33
V.II. FREQÜÊNCIA 34
V.II.I. INTERPRETANDO UMA TABELA DE FREQÜÊNCIA SIMPLES 36
V.III. ESTATÍSTICAS DESCRITIVAS 36
V.IV. ANÁLISE EXPLORATÓRIA DOS DADOS 38
V.V. TABELAS CRUZADAS - CROSSTABS 39
V.VI. TABELAS GENERALIZADAS 40

VI CONSTRUÇÃO DE GRÁFICOS 43

VI.I. INTRODUÇÃO 43
VI.II. HISTOGRAMA 44
VI.III. O GRÁFICO DE DISPERSÃO 46
VI.IV. O GRÁFICO PARA SÉRIES TEMPORAIS 47
VI.V. O GRÁFICO DE PROBABILIDADE NORMAL 49

VII CONSTRUÇÃO DE SINTAXES 51

VII.I. INTRODUÇÃO 51
VII.II. ABRINDO UM ARQUIVO DE SINTAXE 51
VII.III. CRIANDO UMA SINTAXE 53

4
Curso SPSS 7.5 PROAV-UFMG
Informações Básicas

I.I. Introdução

O Statistical Package for Social Science - SPSS é um sistema computacional para


preparação e análise de dados desenvolvido com o objetivo de assistir às
necessidades técnicas e metodológicas de profissionais das ciências sociais que
utilizam métodos quantitativos como instrumentos de trabalho. Desta forma, foram
colocadas à disposição as técnicas estatísticas mais usadas por sociólogos,
educadores, cientistas políticos, profissionais de marketing, entre outros,
incorporando características que facilitam o uso das mesmas e tornando o SPSS o
software padrão dentro dessas áreas.

I.II. Descrição Geral

A utilização do SPSS exige o armazenamento prévio, em uma planilha, dos


dados que devem ter sido coletados através de um instrumento metodológico
apropriado.

As dimensões da planilha, que constituirão o banco de dados com o qual o


pesquisador trabalhará, serão determinadas pelo número de casos e variáveis. Cada
5
Curso SPSS 7.5 PROAV-UFMG
caso corresponde a uma unidade básica de análise que pode ser aluno, escola,
cidade, eleitor, etc., que será alocado, por linha, dentro do banco de dados. Já a
variável é uma característica da unidade de análise que se deseja medir e analisar,
estando localizada em colunas do banco, como pode ser visualizado na Figura I.I.

É importante ressaltar que, para o software, tudo o que constar entre a última
variável e o último caso é um dado, assim, as células em branco estarão sendo
consideradas e serão chamadas pelo programa de missing values.

As técnicas estatísticas estão organizadas no SPSS em forma de comandos


identificados por palavras da língua inglesa (ex. File, Transform, etc). Existem duas
formas de se submeter um comando. A mais simples é utilizar o mouse e “clicar”,
na barra de menu, o botão associado no comando desejado. A outra maneira, um
pouco mais complexa, é o uso da sintaxe dos comandos para opções distintas das
padronizadas.

Esta é uma janela do SPSS voltada para a programação e sua utilização se


dará quando houver necessidade de gravar certa seqüência de comandos para uso
futuro ou quando se precisar utilizar a mesma seqüência várias vezes.

Figura I.I

Localização dos casos e das variáveis em um banco de dados

Cada coluna é
uma variável

Cada linha
é um caso

6
Curso SPSS 7.5 PROAV-UFMG
I.III. Iniciando e Terminando uma Sessão no SPSS
O SPSS é acessado através do WINDOWS clicando no ícone
correspondente

Seguindo este procedimento, o SPSS apresentará a janela abaixo:

Figura I.II

Janela de abertura do SPSS

Para sair do SPSS selecione a opção File na barra de menu e escolha Exit
SPSS.

7
Curso SPSS 7.5 PROAV-UFMG
I.IV. Apresentando as Janelas do SPSS

O SPSS contém quatro janelas básicas. Cada uma tem sua função específica e
juntas compõem um rico instrumental metodológico facilitador do trabalho de
pesquisadores.

SPSS Data Editor : esta janela mostra o conteúdo do banco de dados. Ela permite
criar novos arquivos ou modificar arquivos de dados já existentes. A Data Editor
contém a barra de menu através da qual pode-se abrir arquivos, escolher
procedimentos estatísticos e selecionar outras características do sistema. É a janela a
partir de onde o pesquisador desenvolverá o seu trabalho.

SPSS Output Navigator : esta janela é aberta automaticamente para mostrar os


resultados dos procedimentos executados através da Data Editor. Ela permite a
editoração de tabelas.

SPSS Chart Editor : todos os gráficos e figuras gráficas produzidos na sessão no


SPSS são acessados através desta janela aberta, automaticamente, a primeira vez que
um gráfico for gerado. Esta janela permite que se modifique e salve figuras gráficas e
plots com alta resolução.

SPSS Syntax Editor : permite a edição de arquivos de conjunto de comandos do


SPSS. É uma linguagem de programação de muita importância para o trabalho do
pesquisador.

I.V. Arquivos de Dados

Em adição aos arquivos de dados gravados em formato SPSS, é permitido


importar ou exportar dados de planilhas do Excel (versão 4 ou inferior), Lotus 1-2-
3, Dbase e arquivos texto em formato fixo ou livre.

8
Curso SPSS 7.5 PROAV-UFMG
I.VI. Obtendo Ajuda

O SPSS utiliza o sistema padrão de ajuda do Windows para fornecer as


informações sobre seu funcionamento. Para buscar ajuda, selecione na barra de menu
principal o comando Help. Escolha a opção Topics ou Tutorial. Através dessas
duas opções se terá acesso à uma caixa de Tópicos de Ajuda com três opções de
pesquisa: Conteúdo, Indice e Localizar. As duas primeiras são opções de ajuda
previamente categorizadas onde o pesquisador terá de procurar ajuda tendo como
base as categorias apresentadas pelo programa. A terceira opção é um assistente que
permitirá uma pesquisa através de termos ou frases livres.

9
Curso SPSS 7.5 PROAV-UFMG
Entrada e Saída de Dados

II.I. Introdução

Neste capítulo serão mostrados os procedimentos para exportação de dados


de outros programas através do SPSS, entrada de dados via digitação, definição das
características das variáveis e as formas de armazenamento dos dados com a
gravação da planilha para uso posterior.

II.II. Entrada de Dados

A criação do arquivo de dados a ser analisado pode ser feita de duas maneiras
básicas, através da leitura de um arquivo de dados, que pode ter formatos diferentes
ou pela entrada de dados via teclado.

II.II.I. Leitura de um Arquivo de Dados

Muitas vezes os dados a serem analisados estão em um arquivo de dados


com o formato específico do software usado na digitação, que pode não ser
necessariamente o SPSS como vimos na seção I.V. Pode-se utilizar esse arquivo para
criar um arquivo de dados do SPSS.
10
Curso SPSS 7.5 PROAV-UFMG
O SPSS lê, automaticamente, arquivos com formato de planilhas de dados
criadas com Lotus 1-2-3 e Excel; banco de dados criados com dBASE e vários
formatos SQL; arquivos texto ASCII, tabulados e em formato livre e, obviamente,
arquivos de dados SPSS criados na operação do próprio sistema.

Para ler um arquivo de dados existente é preciso ir à barra de menu, selecionar File,
escolher Open e depois Data...O SPSS apresentará a tela da Figura II.I. Assim,
basta escolher o arquivo com o qual se trabalhará e clicar OK.

Figura II.I

Janela para abertura de arquivos

II.II.II. Entrada de dados via digitação

O procedimento a ser utilizado para criar um banco de dados no SPSS é o


seguinte: selecione a opção File na barra de menu, escolha New e a seguir selecione
Data. A janela aberta será a seguinte:

11
Curso SPSS 7.5 PROAV-UFMG
Figura II.II

Janela para entrada de dados

Basta posicionar o cursor na linha 1 da 1ª coluna e digitar os dados desejados.


Para sua segurança, acostume-se a salvar os dados em um arquivo logo após o
término da digitação como exposto na seção II.III.

II.II.III. Definindo Variáveis

Devemos sempre atribuir nomes descritivos às variáveis da planilha. O nome


padrão para variáveis é dado pelo prefixo var e uma seqüência de cinco números
(var00001, var00002, etc.). Para personalizar o nome, o formato e outros atributos
da variável deve-se dar um clique duplo sobre o nome corrente da variável no alto
da coluna, ou selecionar qualquer célula na coluna da variável e escolher no menu a
opção Data, depois Define Variable...Isto abrirá a caixa de diálogo mostrada a
seguir.

12
Curso SPSS 7.5 PROAV-UFMG
Figura II.III

Definindo variáveis

O programa apresenta como default o nome da variável, o seu tipo


(numérica, string, datas, entre outros), label (espécie de legenda descrevendo a
variável), valores omissos (se houver) e o seu alinhamento. Para alterá-los selecione
uma das caixas contidas em Change Settings.

Figura II.IV

Caixa Type: Definição do tipo da variável

13
Curso SPSS 7.5 PROAV-UFMG
Figura II.V

Caixa Labels: Nome e ‘legenda’ da variável

Figura II.VI

Caixa Column Format: Formatação da coluna de dados

O missing value é qualquer espaço em branco nas células, da matriz


retangular de dados. É considerado valor perdido, indicado por (.). É possível
atribuir valores que identifiquem a informação perdida para razões específicas e
determinar ao SPSS que diferencie estes valores dos outros na hora da análise. Esta
maneira é útil para distinguir a informação ausente, vide Figura II.VII.

14
Curso SPSS 7.5 PROAV-UFMG
Figura II.VII

Caixa Missing Values: Definição dos dados omissos

II.III. Armazenamento de Dados

Os dados digitados podem ser armazenados no SPSS num arquivo com


extensão SAV, o formato padrão do software. Para isto, durante e depois do término
da digitação, siga os seguintes passos: posicione o cursor no menu File e escolha a
opção Save As... . Aparecerá a janela mostrada na Figura II.VIII. Deve-se
determinar o nome, o diretório e o tipo do arquivo a ser salvo e clicar OK.

Figura II.VIII

Janela para salvar arquivos

15
Curso SPSS 7.5 PROAV-UFMG
Arquivo de dados no formato ASCII

O formato ASCII, iniciais de Americam Standart Code for Interchange of


Information, é padrão de comunicação entre diferentes softwares e permite representar
todos os caracteres (alfabéticos, numéricos e símbolos) utilizados na escrita. Todos
os softwares de estatística lêem arquivos neste formato, daí a sua importância. Para
salvar o seu arquivo em formato ASCII deve-se seguir os passos mostrados acima.
Porém na caixa Salvar arquivo como tipo deve-se selecionar o formato ASCII.

Arquivo de dados em outros formatos

Pode-se utilizar o procedimento anterior para gravar o seu arquivo em outros


formatos. Basta mudar o tipo do arquivo a ser salvo na caixa Salvar arquivo como
tipo.

II.IV. Armazenamento de Resultados

Ao executar comandos na janela Data Editor o SPSS abre automaticamente


a janela chamada Output Editor, onde todos os resultados das análises são
armazenados. Estes resultados serão utilizados na análise e na construção do
relatório . Antes de terminar a sessão de trabalho é necessário gravar a saída em um
arquivo apropriado. Para isto, posicione o cursor na barra de menu sobre a opção
File e escolha Save As... Aparecerá uma janela para salvar os resultados das análises
onde o pesquisador poderá dar nome e escolher o diretório em que guardará o
arquivo.

16
Curso SPSS 7.5 PROAV-UFMG
Figura II.IX

Janela para salvar resultados das análises

II.V. Armazenamento de Gráficos

Depois de feito um gráfico o pesquisador deve sempre salvá-lo. Para isto,


basta permanecer na janela Chart que será criada quando o gráfico for feito e
realizar os mesmos procedimentos dos itens imediatamente anteriores a este. Na
seção VI explicaremos os passos para a construção de gráficos.

II.VI. Exercício de fixação

Monte um banco de dados a partir do questionário modelo apresentado


abaixo, defina as variáveis e entre com os dados.

17
Curso SPSS 7.5 PROAV-UFMG
NÚMERO DO QUESTIONÁRIO :

1. Nome do Aluno

2. Sexo

Masculino - M
Feminino - F

3. Idade: anos

4. Cite o nome da cidade onde você nasceu.

5. Qual o tipo de escola que você estuda?

Escola Pública Federal


Escola Pública Estadual
Escola Pública Municipal
Escola Particular
Curso Livre

6. Cite duas atividades que você pratica em suas horas de folga.

1.___________________________________________________________

2.___________________________________________________________

18
Curso SPSS 7.5 PROAV-UFMG
Transformação de dados

III.I. Introdução

Neste capítulo vamos aprender alguns comandos especializados na


transformação de dados. Veremos como alterar os valores de uma variável fazendo
uma transformação ou uma recodificação, como classificar um conjunto de dados,
como trabalhar apenas com um subconjunto de dados dentro do banco e outras
manipulações de uso específico que são possíveis através do SPSS.

III.II. Atribuindo postos às variáveis

Nesta seção mostraremos como atribuir postos às variáveis, isto é, definir a


posição relativa de uma observação no conjunto de dados. Este comando lhe
permitirá algo mais que uma ordenação. Ele classificará os casos, a partir de uma
ordem, crescente ou decrescente, escolhida pelo pesquisador, atribuindo o que
chamamos postos (primeiro lugar, segundo lugar, etc.).

Selecione na barra de menu a opção Transform, escolha Rank Cases... A


janela aberta será semelhante à Figura III.I.

19
Curso SPSS 7.5 PROAV-UFMG
Figura III.I

Atribuição de postos às variáveis

É necessário fazer a seleção de uma (ou mais variáveis) que seja interessante
e clicar OK. O SPSS criará uma variável com os valores dos postos das observações
para cada uma das variáveis selecionadas. Para escolher outros tipos de postos clique
sobre Rank Types... .

III.III. Recodificação de Variáveis

O SPSS permite modificar os valores assumidos pelas variáveis. Isto é


particularmente útil para combinar duas ou mais categorias. Pode-se fazer esta
operação mantendo as mesmas variáveis ou criando novas. Por exemplo, para
recodificar a variável SEXO – Masculino e Feminino - em duas categorias (1 e 2),
deve-se proceder da seguinte maneira:

Selecione a opção Transform na barra de menu principal. Escolha Recode e


selecione Into Same Variables ou Into Difference Variables caso se queira fazer
a transformação na própria variável ou criando uma outra variável e preservando a
primeira. Se se fizer a opção pela primeira alternativa a seguinte janela será aberta.

20
Curso SPSS 7.5 PROAV-UFMG
Figura III.II

Recodificação de variáveis

Selecione a variável a ser recodificada, no nosso caso SEXO. Clique sobre a


caixa Old and New Values... A caixa de diálogo aberta será como a seguinte:

Figura III.III

Recodificação: Antigos e Novos Valores

Digite na caixa Old Value o valor atual da variável e na caixa New Value o
valor que ela assumirá. Clique Add ao definir cada valor e depois de definidos todos
os valores desejados e clique sobre a caixa Continue para retornar à janela anterior.
Clique OK.

21
Curso SPSS 7.5 PROAV-UFMG
Algumas vezes a recodificação necessária consiste apenas na mudança dos
códigos existentes para outros ordenados dentro de inteiros consecutivos. Isto pode
ser feito utilizando o menu Automatic Recode. Para isto, na barra de menu principal
selecione Transform . Escolha Automatic Recode... Será mostrada uma caixa de
diálogo como a seguinte:

Figura III.IV
Janela de recodificação automática

Selecione uma ou mais variáveis para serem recodificadas. Na caixa ao lado


de New Name especifique o nome para a nova variável que receberá os valores
recodificados e dê um clique sobre ela. O nome escolhido aparecerá na caixa
Variable→New Name na frente do nome da variável original. Na caixa Recode
Starting from selecione a ordem com que os valores serão recodificados.

22
Curso SPSS 7.5 PROAV-UFMG
III.IV. O Compute

O comando Compute Variable permite alterar valores de uma variável com


base em informações de outras variáveis. O pesquisador pode alterar valores de
variáveis numéricas ou texto; pode criar novas variáveis ou alterar valores de
variáveis existentes; para novas variáveis, ele pode também especificar o tipo da
variável e o seu label; pode alterar valores seletivamente, de grupos dos dados,
baseados em condições lógicas; enfim, pode utilizar mais de 70 funções, incluindo
funções aritméticas, estatísticas, de distribuição e funções para variáveis texto.

III.IV.I. Para utilizar o Compute Variables

No menu, dentro da opção Transform há o comando Compute Variables.


Clicando nele se abrirá a janela da Figura III.V onde deverá ser digitado o nome da
variável a ser modificada em Target Variable e no espaço denominado Numeric
Expressions, deverá ser digitado as transformações desejadas.

Figura III.V
Caixa Compute Variables

23
Curso SPSS 7.5 PROAV-UFMG
III.IV.II. Compute Variable: If Cases

Esta caixa de diálogo é utilizada quando se deseja transformar dados


específicos de um determinado grupo, condicionando o campo de ação do
programa. Essa expressão condicional retorna um valor que pode ser verdadeiro,
falso ou missing para cada caso. Se o resultado da expressão condicional for
verdadeira, a transformação é aplicada ao caso, mas, caso seja falsa ou missing a
transformação não é aplicada ao caso.

É importante ressaltar que expressões devem utilizar nomes de variáveis,


constantes, operadores aritméticos, numéricos ou outras funções, variáveis lógicas e
operadores relacionais. Quando uma nova variável é criada através do comando
Compute é necessário fazer a sua definição através do comando Define Variable já
vistos nesse manual.

Figura III.V
Caixa Compute Variables

24
Curso SPSS 7.5 PROAV-UFMG
Transformações no Arquivo de
Dados

IV.I. Introdução

De modo geral, os arquivos de dados não estão organizados no formato


necessário para uma utilização específica. Antes da análise, é necessário combinar
arquivos de dados, ordenar dados segundo diferentes variáveis, selecionar um
subgrupo dos dados ou alterar a unidade de análise para grupos de casos entre
outras necessidades que surgem na hora da preparação dos dados. Para isso, existe
uma série de comandos que agilizam o trabalho do pesquisador. Eles possibilitam a
ordenação de casos baseados nos valores de uma ou mais variáveis. O agrupamento
de dois ou mais arquivos de dados, combinando arquivos com as mesmas variáveis,
mas com casos diferentes ou os mesmos casos mas com variáveis diferentes. A
seleção de um grupo de casos para análise. A alteração da unidade de análise a partir
da agregação de casos baseados em um ou mais valores de uma variável. Ou a
ponderação dos dados pelos valores da variável de peso entre outras possibilidades.

25
Curso SPSS 7.5 PROAV-UFMG
IV.II. Ordenando Casos

A classificação dos casos pode ser feita em ordem crescente ou decrescente.


Esta caixa de diálogo ordena os casos do banco de dados baseados nos valores de
uma ou mais variáveis em Sort by.

Para reordenar os casos em um arquivo de dados, baseado no valor de uma


ou mais variáveis classificadas, deve-se selecionar a Data na barra de menu e escolher
Sort Cases... Será aberta uma caixa de diálogo como a seguinte:
Figura IV.I
Ordenação dos casos

O pesquisador deve selecionar uma ou mais variáveis. Se selecionar múltiplas


variáveis para serem classificadas, a ordem na qual elas aparecerem na lista da caixa
Sort by determinará a ordem com que os casos serão classificados.

Caso queira guardar os dados na forma ordenada para uso posterior é preciso
gravar o arquivo, pois apenas a versão do arquivo, em uso nesta sessão de trabalho,
está ordenado.

IV.III. Criando um Subconjunto de Dados

O SPSS permite que se restrinja a análise dos dados de um subgrupo


específico, baseado em um critério que inclui variáveis relacionadas através de
expressões lógicas, ou ainda, permite selecionar uma amostra aleatória dos casos. O
26
Curso SPSS 7.5 PROAV-UFMG
critério usado para definir um subgrupo pode incluir valores e amplitudes das
variáveis, amplitudes de tempo e data, número de casos, expressões aritméticas ou
lógicas e funções.

Para selecionar um subconjunto de casos para análise selecione a barra de


menu principal a opção Data, depois escolha a opção Select Cases... Isto abrirá
uma caixa de diálogo como a mostrada na Figura IV.II.

Figura IV.II
Seleção de um subconjunto dos casos

Dentro da caixa Select escolha uma das possíveis opções:

All cases: usa todos os casos no arquivo de dados. Esta é a escolha padrão.

If condition is satisfied: utiliza uma expressão condicional, onde o caso é


selecionado se satisfizer uma determinada condição.

Random sample of cases: seleciona uma porcentagem ou um número exato de


casos através de uma amostragem aleatória dos casos.

27
Curso SPSS 7.5 PROAV-UFMG
Based on time or case range: faz a seleção utilizando tempo ou um intervalo de
casos.

Use filter variable: permite a seleção de uma variável numérica do arquivo de


dados para “filtrar” ou apagar os casos. Este é um recurso poderoso.

Os casos não selecionados podem ser apagados do banco de dados ou


permanecer nele, mas nesse caso serão invisíveis às análises posteriores até que o
filtro seja desligado.

IV.IV. Comando Split File

Para separar seu arquivo de dados dentro de grupos para análise selecione
Data na barra de menu principal, escolha a opção Split File... A caixa de diálogo
aberta será como a seguinte:

Figura IV.III
Seleção de um subconjunto dos casos

Clique em Organize output by groups e selecione uma ou mais variáveis


para serem utilizadas na separação dos grupos. Pode-se utilizar variáveis numéricas e

28
Curso SPSS 7.5 PROAV-UFMG
string, sendo o número máximo de grupos igual a 8. Se forem selecionadas mais de
uma variável, a ordem com que elas aparecem na lista determinará a maneira como
os grupos serão separados. Clique OK.

Terminada a análise, se não se desejar o uso dos dados agrupados, deve-se


selecionar a opção Analyse all cases, do not create groups.

IV.V. Juntando Arquivos de Dados

Com o SPSS, é possível juntar dados de dois arquivos de duas diferentes


formas. A primeira é juntar arquivos contendo as mesmas variáveis, mas casos
diferentes ou juntar arquivos contendo os mesmos casos, mas variáveis diferentes.

IV.V.I. Juntando Casos

Este comando junta o arquivo no qual se está trabalhando com um segundo


arquivo de dados (que deve estar necessariamente em formato SPSS), contendo as
mesmas variáveis, porém, com casos diferentes. Os novos casos serão anexados
abaixo do último caso existente no arquivo onde se está trabalhando.

Para juntar um novo arquivo com diferentes casos selecione na barra de menu
Data depois escolha a opção Merge Files e clique em Add Cases... Isto abrirá
uma caixa de diálogo como a mostrada a seguir.

29
Curso SPSS 7.5 PROAV-UFMG
Figura IV.IV
Juntando casos

IV.V.II. Juntando Variáveis

Este comando junta o arquivo no qual se está trabalhando com um segundo


arquivo de dados (que deve estar necessariamente em formato SPSS), contendo
variáveis distintas. Para isso, existe a necessidade de se atender dois requisitos
básicos: primeiro, é necessário possuir uma variável chave, ou seja, uma variável
comum aos dois bancos de dados, que servirá de referência para a junção dos
arquivos. Em segundo, a variável chave deve estar numa mesma ordem nos dois
arquivos, pois as variáveis serão anexadas com base na variável comum.

Para juntar um novo arquivo com diferentes variáveis selecione na barra de


menu principal a opção Data depois escolha a opção Merge Files, clique em Add
Variables... Isto abrirá uma caixa de diálogo como a mostrada a seguir. Primeiro,
será aberta uma janela para escolher o arquivo que será anexado e depois a janela da
Figura IV.V através da qual será efetuada a união dos arquivos.

30
Curso SPSS 7.5 PROAV-UFMG
Figura IV.V
Juntando variáveis

IV.VI. Agregando Variáveis

No menu Data, o comando Aggregate Data combina grupos de casos em


uma medida agregativa e cria uma nova variável. Os casos são agregados baseados
no valor de uma ou mais variáveis. O novo banco conterá um caso para cada grupo
de dados.

Break Variables. Os casos são agrupados nos subgrupos definidos pelos valores
existentes nesta variável. Seu uso é opcional.

Function. Apresenta uma caixa de diálogo que especifica a função utilizada para
calcular os valores agregados. Como pode ser visto na figura adiante, existem várias
medidas que podem ser utilizados (média, desvio padrão, etc).

31
Curso SPSS 7.5 PROAV-UFMG
Figura IV.VI
Agregando variáveis

32
Curso SPSS 7.5 PROAV-UFMG
Técnicas Estatísticas

V.I. Introdução

O SPSS reúne sob o menu Statistics, comandos que executam as principais


técnicas estatísticas. Este menu com os procedimentos estatísticos está reproduzido
abaixo. Cada um é seguido por uma seta ( ) indicando que existe um outro nível
onde os procedimentos estatísticos ficam mais especificamente identificados.

Figura V.I
Técnicas estatísticas implementadas no SPSS7.5

33
Curso SPSS 7.5 PROAV-UFMG
Como se vê o número de técnicas estatísticas disponíveis no SPSS é muito
grande. Para entender cada uma é preciso estudá-las em curso a elas dedicado. Neste
capítulo vamos nos ater apenas às técnicas de análise estatística elementares.
Esperamos com isto ilustrar as potencialidades analíticas do sistema.

V.II. Freqüência

O procedimento de freqüência é um ponto de partida para a análise de


dados, é quando o pesquisador vai conhecer minimamente os seus dados.
Freqüentemente os dados a serem analisados têm várias variáveis categóricas ou
quantitativas, por isso a construção de tabelas de freqüência é uma boa opção.

No menu Statistics o pesquisador selecionará a opção Summarize e depois


Frequencies... Depois irá escolher as variáveis discretas para as quais se deseja
construir tabelas de freqüência, por exemplo SEXO e IDADE. A informação pode
ser obtida através de uma contagem simples (Count) ou percentual (Percents),
bastando para isto escolher a opção adequada através do submenu Statistics....

Figura V.II
Tabela de frequência

34
Curso SPSS 7.5 PROAV-UFMG
De forma opcional, o pesquisador pode clicar em Statistics... para
estatísticas descritivas de variáveis quantitativas, clicar Charts... para gráficos de
barras, torta, histogramas e clicar Format... para a ordem em que as freqüências
serão apresentadas. Clicando no comando Statistics... ter-se-á o seguinte quadro:

Figura V.III
Tabela de frequência: Statistics

Percentile Values: Valor de uma variável quantitativa que divide os dados


ordenados em grupos que possuem um certo percentual acima ou abaixo dele.
Normalmente trabalha-se com os quartiles (quartis, que dividem os dados ordenados
em grupos de 25%, 50%, 75%).

Dispersion: Fornece estatísticas que apresentam a dispersão dos dados.

Central Tendency: Fornece estatísticas que apresentam a medida de tendência


central dos dados.

35
Curso SPSS 7.5 PROAV-UFMG
V.II.I. Interpretando uma Tabela de Freqüência Simples

Seguindo o procedimento acima será gerada uma tabela de freqüências. Na


Tabela V.I apresentamos um exemplo dessa tabela.

Tabela V.I
Exemplo de uma tabela de frequência

Sexo do Aluno

Valid Cumulative
Frequency Percent Percent Percent
Valid Masculino 22 44,0 44,0 44,0
Feminino 28 56,0 56,0 100,0
Total 50 100,0 100,0
Total 50 100,0

O título da tabela apresenta a variable label, ou seja, o significado da


variável em estudo, no exemplo acima Sexo do Aluno. A 1ª coluna apresenta os
níveis da variável em estudo. Cada linha da tabela descreve um nível da variável. A
2ª coluna apresenta a freqüência absoluta de cada nível. A 3ª coluna apresenta o
percentual relativo de cada nível (percent). A 4ª coluna apresenta o percentual válido,
ou seja, a freqüência relativa eliminando-se os casos omissos (missing values) quando
estes estiverem presentes. E a última coluna apresenta o percentual acumulado dos
níveis das variáveis. A penúltima linha da tabela apresenta o número de casos
válidos, e a última o número total de casos.

V.III. Estatísticas Descritivas

Outra forma de se conhecer os dados é obter o valor de estatísticas


descritivas destes dados. Se a variável é quantitativa, o comando Summarize calcula
o valor destas estatísticas. Em particular, produz a média, o desvio-padrão, mínimo
e máximo de valores.
36
Curso SPSS 7.5 PROAV-UFMG
Para ilustrar o cálculo de estatísticas descritivas vamos utilizar a variável
IDADE. Temos interesse em obter informações sobre a idade em cada um dos
sexos separadamente. Por isso, antes de se iniciar deve-se utilizar o comando Split
File como descrito na seção IV.III. Depois selecione a opção Statistics na barra do
menu principal, escolha a opção Summarize, logo após, escolha Descriptives... A
seguinte janela será mostrada:

Figura V.IV
Estatística descritiva

Selecione as variáveis para as quais deseja informações descritivas. Clique


sobre a seta e elas aparecerão na caixa Variable(s). Clique OK. (Se desejar outras
medidas descritivas pode selecioná-las através da janela Options...)

O resultado obtido é o seguinte:

37
Curso SPSS 7.5 PROAV-UFMG
Tabela V.II

Estatística descritiva da variável IDADE por SEXO

Descriptive Statistics

Sexo do Std.
Aluno N Minimum Maximum Mean Deviation
Masculino IDADE 22 14 18 15,18 ,85
Valid N
22
(listwise)
Feminino IDADE 28 15 18 15,29 ,71
Valid N
28
(listwise)

V.IV. Análise Exploratória dos Dados

Os métodos de análise exploratória de dados são utilizados nos estágios


iniciais da análise de dados, principalmente para identificar observações discrepantes
e evidenciar possíveis violações nas suposições usuais para as técnicas estatísticas.

No SPSS estes procedimentos estão reunidos no submenu Explore... sob o


menu Statistics. O comando Explore é utilizado para produzir um resumo
descritivo para todos os casos ou para grupos de casos separadamente.
Opcionalmente, pode-se selecionar uma ou mais variáveis de fatores que irão definir
os grupos de casos, selecionar uma variável identificadora para rotular os casos,
clicar Statistics para outliers, percentis e tabelas de freqüência, clicar Plots para
histogramas, testes de normalidade, além de outros gráficos e medidas descritivas.
Na caixa Dependent List selecione uma ou mais variáveis numéricas dependentes.
O procedimento padrão inclui estatísticas descritivas, boxplots e ramo-e-folhas para
cada variável selecionada.

38
Curso SPSS 7.5 PROAV-UFMG
Figura V.V

Análise exploratória de dados

V.V. Tabelas Cruzadas - Crosstabs

O comando Crosstabs permite a construção de tabelas de dupla-entrada


úteis na verificação de associação entre as variáveis. Ou seja, este procedimento
permite criar tabelas cruzadas e medir a associação entre duas ou mais variáveis. Se
forem definidas variáveis para a linha (Row), para a coluna (Column) e para a
variável de grupo (Layer), serão produzidas tabelas cruzadas para as variáveis
definidas na linha e coluna, dentro de cada nível da variável de grupo (Layer).

Para se construir uma tabela cruzada selecione na barra de menu, Statistics, depois
escolha a opção Summarize, clique em Crosstabs... Isto abrirá uma caixa de
diálogo como a mostrada a seguir. Selecione uma ou mais variáveis para a linha e
uma ou mais variáveis para a coluna.

39
Curso SPSS 7.5 PROAV-UFMG
Figura V.VI

Tabelas cruzadas

De forma opcional, é possível selecionar uma ou mais variáveis de controle,


clicar em Statistics... para se obter as medidas de associação entre as variáveis,
clicar em Cells... para se obter os valores esperados e os valores observados,
percentuais relativos à coluna, à linha e ao total, e clicar em Format... para controlar
a ordem das categorias.

V.VI. Tabelas Generalizadas

Tabelas de freqüência simples podem possuir uma, duas ou três dimensões.


Cada dimensão é definida por uma variável simples ou pela combinação de
variáveis. As variáveis que aparecem do lado esquerdo da tabela são chamadas row
variables. Elas definem as linhas em uma tabela. Variáveis que aparecem lado a lado
40
Curso SPSS 7.5 PROAV-UFMG
no topo da tabela são chamadas column variables. Elas definem as colunas em
uma tabela. Variáveis que definem grupos de tabelas são chamadas layer variables.
Elas definem a terceira dimensão de uma tabela.

No exemplo a seguir, a variável SEXO é a column variable, a variável


IDADE é a row variable e a REGIAO é a layer variable.

Figura V.VII

Tabelas generalizadas

O corpo de uma tabela é feito de células (cells), que contém os dados


desejados: counts (valores absolutos), sums (somas), means (médias),
percentages (percentuais) e outras medidas. Uma célula é formada pela interseção
de uma coluna com uma linha da tabela.

Quando múltiplas variáveis são colocadas na mesma "dimensão", a


visualização pode ser organizada de duas diferentes formas. As variáveis podem
estar stacked (ou unnested) ou nested. Quando as variáveis estão stacked , as

41
Curso SPSS 7.5 PROAV-UFMG
categorias são apresentadas separadamente para cada variável, que também são
apresentadas em separado na mesma tabela. O exemplo abaixo ilustra esta situação.

Tabela V.III

Exemplo de tabela generalizada stacked

Sexo do Aluno TIP_ESC


Masculino Feminino 1 2 3 4 5
IDADE 14 2 1 1
15 17 23 9 13 8 7 3
16 1 3 1 1 2
17 1 1 1 1
18 1 1 1 1

Por outro lado, se a variável estiver aninhada (nested), ela será sumarizada
dentro de cada categoria da variável anterior, conforme tabela abaixo.

Tabela V.IV

Exemplo de tabela generalizada nested

Sexo do Aluno
Masculino Feminino
TIP_ESC TIP_ESC
1 2 3 4 5 1 2 3 4 5
IDADE 14 1 1
15 6 5 4 1 1 3 8 4 6 2
16 1 1 2
17 1 1
18 1 1

42
Curso SPSS 7.5 PROAV-UFMG
Construção de Gráficos

VI.I. Introdução

Uma boa análise estatística quase sempre inclui a produção de gráficos. O


SPSS cria gráficos de alta resolução através dos procedimentos no menu Graphs e
em vários procedimentos no menu Statistics. O objetivo deste capítulo é apresentar
os passos para a construção de gráficos, além de noções básicas para editorá-los.

Ao se selecionar a opção Graphs na barra de menu principal será mostrada


uma janela igual à da Figura VI.I.

43
Curso SPSS 7.5 PROAV-UFMG
Figura VI.I

Opções gráficas do SPSS 7.5

VI.II. Histograma

O histograma separa os dados dentro de intervalos apropriados, distribuídos


ao longo do eixo x. Para cada intervalo é desenhada uma barra cuja altura é
proporcional ao número de observações (ou freqüências) em cada intervalo.
Veremos como construir um histograma no SPSS. Selecione a opção Graphs na
barra de menu principal. Escolha Histogram... A janela aberta será como a da
Figura VI.II. O próximo passo será a escolha da variável com a qual se trabalhará.
Clique OK e o histograma será produzido pelo software.

44
Curso SPSS 7.5 PROAV-UFMG
Figura VI.II

Como fazer um histograma

O histograma da variável IDADE pode ser visto no Gráfico VI.I.

Gráfico VI.I

Histograma da variável Idade

50

40

30

20

10
Std. Dev = ,77
Mean = 15,2

0 N = 50,00
14,0 15,0 16,0 17,0 18,0

IDADE

45
Curso SPSS 7.5 PROAV-UFMG
VI.III. O Gráfico de Dispersão

Muitas vezes é necessário estudar a relação entre duas variáveis quantitativas.


Uma das ferramentas utilizadas para se verificar as relações, entre duas variáveis, é o
diagrama de dispersão. No SPSS, o diagrama é construído utilizando o comando
Scatter . Selecione a opção Graphs no menu, depois escolha Scatter...O SPSS
mostrará a janela abaixo.

Figura VI.III

Como fazer um gráfico de dispersão

Clique sobre o ícone Simple e depois sobre a caixa Define:

Figura VI.IV

Gráfico de dispersão... Continuação

46
Curso SPSS 7.5 PROAV-UFMG
Escolha a variável para o eixo y e clique sobre a seta ao lado da caixa Y Axis.
Escolha a variável para o eixo x e clique sobre a seta ao lado da caixa X Axis. Clique
OK. O gráfico construído será como o mostrado abaixo.

Gráfico VI.II

Gráfico de dispersão: Nota de matemátics vs Nota de português

18

16
Nota do aluno na prova de português

14

12

10

2
2 4 6 8 10 12

Nota do aluno na prova de matemática

VI.IV. O Gráfico para séries temporais

Este comando permite a construção de gráficos de séries temporais, isto é,


um conjunto de dados ordenado no tempo. Selecione Graphs na barra de menu
principal. Escolha a opção Sequence... A janela aberta será a seguinte:

47
Curso SPSS 7.5 PROAV-UFMG
Figura VI.V

Gráfico para séries temporais

Selecione uma variável na caixa Variables e outra na caixa Time Axis


Labels. Clique OK. O gráfico construído será semelhante ao mostrado abaixo:
Gráfico VI.II

Série temporal das notas de matemática

12

10

4
NOTA_MAT

0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

TEMPO

48
Curso SPSS 7.5 PROAV-UFMG
VI.V. O Gráfico de Probabilidade Normal

A distribuição Normal é uma importante suposição em muitas análises


estatísticas. A melhor maneira de verificar se um subconjunto de dados segue a
distribuição normal é a construção do gráfico de probabilidade normal. Se os dados
seguem de fato a distribuição normal, uma reta seria observada. Para sua construção
siga os seguintes passos: selecione a opção Graphs , escolha Normal P-P, selecione
uma ou mais variáveis e clique OK. A caixa de diálogo aberta é semelhante a que
está sendo mostrada logo abaixo:

Figura VI.VI

Gráfico para testar a normalidade dos dados

Um exemplo do gráfico de probabilidade normal pode ser visto no Gráfico


VI.III.

49
Curso SPSS 7.5 PROAV-UFMG
Gráfico VI.III

Gráfico de probabilidade normal das notas de português

1,00

,75

,50
Expected Cum Prob

,25

0,00
0,00 ,25 ,50 ,75 1,00

Observed Cum Prob

O SPSS tem também um segundo tipo de gráfico normal. O gráfico Normal


Q-Q. São formas diferentes de verificar o mesmo fato.

50
Curso SPSS 7.5 PROAV-UFMG
Construção de sintaxes

VII.I. Introdução

Como foi citado no primeiro capítulo, o SPSS permite ao usuário executar


um conjunto de comandos armazenados em arquivo. Esta característica é utilizada
em situações especiais, ou quando se deseja adicionar opções pouco comuns, ou
ainda para personalizar a análise. O objetivo deste capítulo é mostrar os elementos
básicos para a criação destes arquivos de comandos que serão chamados
genericamente de sintaxe. Com esta flexibilidade o SPSS transforma-se em uma
verdadeira linguagem de programação.

VII.II. Abrindo um Arquivo de Sintaxe

Para mostrar como usar uma sintaxe, vamos usar o exemplo apresentado
durante o texto. Para abrir um arquivo de sintaxe, o procedimento é o mesmo
utilizado para se abrir o banco de dados. A janela aberta será como mostrado na
Figura II.I. A única diferença é que na caixa Arquivos do tipo ter-se-á que
selecionar a opção de syntax. A figura abaixo ilustra a janela aberta.

51
Curso SPSS 7.5 PROAV-UFMG
Figura VII.I

Janela de abertura de arquivos de sintaxe

Selecione o arquivo que se quer abrir e clique OK. Isto abrirá uma nova
janela, contendo um arquivo texto da sintaxe, semelhante à que se segue. Nesta
janela executa-se os comandos clicando sobre o menu Run ou sobre o ícone
indicado na Figura VII.II.

Figura VII.II

Exemplo de uma sintaxe

52
Curso SPSS 7.5 PROAV-UFMG
VII.III. Criando uma Sintaxe

Um arquivo de sintaxe de comandos do SPSS, pode ser criado utilizando


qualquer editor de textos, que grave arquivos em formato texto. Para isto,
entretanto, é preciso conhecer a forma de funcionamento de cada comando. Para
contornar este problema o SPSS permite que sejam armazenados na forma de
sintaxe os comandos submetidos via Windows, clicando o botão Paste na caixa de
menu que contém o procedimento desejado. Ao se verificar na janela de sintaxe o
comando submetido, aprende-se também a modificá-lo.

53
Curso SPSS 7.5 PROAV-UFMG

Você também pode gostar