Você está na página 1de 58
SPSS PROAV-UFMG Coordenador Geral – José Francisco Soares Belo Horizonte – MG abril 1999 1
SPSS PROAV-UFMG Coordenador Geral – José Francisco Soares Belo Horizonte – MG abril 1999 1

SPSS

PROAV-UFMG

Coordenador Geral – José Francisco Soares

Belo Horizonte – MG abril 1999

SPSS PROAV-UFMG Coordenador Geral – José Francisco Soares Belo Horizonte – MG abril 1999 1 Curso

1

SPSS PROAV-UFMG Coordenador Geral – José Francisco Soares Belo Horizonte – MG abril 1999 1 Curso

Curso SPSS 7.5 PROAV-UFMG

2

2 Curso SPSS 7.5 PROAV-UFMG

Curso SPSS 7.5 PROAV-UFMG

Básicas
Básicas

Informações

1.1 - Introdução

para análise de dados. Como o

próprio nome indica: Statistical Package for Social Science foi desenvolvido com o cientista social em mente. Assim sendo, colocou à disposição as técnicas mais usadas por sociólogos, cientistas políticos, profissionais de marketing, etc. e incorporou características que facilitam o seu uso. Por isto tornou-se o software padrão, nestas áreas, razão da nossa escolha como software básico deste curso.

O SPSS é um sistema computacional

1

1.2 - Descrição Geral

A utilização do SPSS exige o armazenamento prévio dos dados, em uma

planilha. Feito isto pode-se aplicar a técnica estatística desejada aos dados.

Os dados devem ser organizados em linhas e colunas. As linhas são chamadas de casos e as colunas de variáveis. Cada caso representa a unidade básica de análise (cliente, eleitor, agência, etc.) e cada coluna representa uma variável ou característica a ser medida. Por exemplo, para um questionário cada respondente individual é um caso e cada item é uma variável.

As técnicas estatísticas estão organizadas no SPSS em comandos, a maioria dos quais é identificada por palavras simples da língua inglesa:

STATISTICS, GRAPHS, TABLES, PLOT. Há basicamente duas formas de se submeter um comando. A maneira mais simples na versão para Windows do SPSS é utilizar o mouse e “clicar”, na barra de menu, o botão associado ao comando desejado. Porém você pode utilizar a sintaxe dos comandos se desejar utilizar opções diferentes das escolhidas, ou se precisa de técnicas cujo uso ainda não foi incluido mos menus.

Exemplo 1.1 :

O arquivo CANETA.SAV contém dados obtidos em uma pesquisa cujo

objetivo era avaliar a eficácia dos esforços do departamento de marketing de uma indústria de canetas. As variáveis de interesse são as seguintes: território,

total de vendas, publicidade, número de vendas representativas e o índice de eficiência do atacadista. Observe a saída de alguns comandos simples.

DESCRIPTIVES

Number of valid observations (listwise) =

40.00

 

Valid

Variable

Mean

Std Dev

Minimum

Maximum

N

Label

EFICIENC

2.83

.98

1.00

4.00

40

VEND_REP

5.00

1.65

3.00

8.00

40

PUBLICID

10.90

4.31

4.00

19.00

40

TERRITOR

241.75

139.47

5.00

488.00

40

VENDAS

411.29

123.85

220.50

667.00

40

2

CORRELATIONS

 

- - Correlation Coefficients - -

 

VENDAS

PUBLICID

VEND_REP

EFICIENC

VENDAS

1.0000

.8802

.8818

.0019

(

40)

(

40)

(

40)

(

40)

P= .

P= .000

P= .000

P= .991

PUBLICID

.8802

1.0000

.7763

.0321

(

40)

(

40)

(

40)

(

40)

P= .000

P= .

P= .000

P= .844

VEND_REP

.8818

.7763

1.0000

-.1896

(

40)

(

40)

(

40)

(

40)

P= .000

P= .000

P= .

P= .241

EFICIENC

.0019

.0321

-.1896

1.0000

(

40)

(

40)

(

40)

(

40)

P= .991

P= .844

P= .241

P= .

(Coefficient / (Cases) / 2-tailed Significance)

" . " is printed if a coefficient cannot be computed

GRAPH

Hi-Res Chart # 1:Histogram of vendas

HISTOGRAMA PARA AS VENDAS (EM $1000)

7 6 5 4 3 2 1 0 200.0 250.0 300.0 350.0 400.0 450.0 500.0
7
6
5
4
3
2
1
0
200.0
250.0
300.0
350.0
400.0
450.0
500.0
550.0
600.0
650.0

VENDAS

Std. Dev = 123.85 Mean = 411.3 N = 40.00

3

1.3 - Iniciando e Terminando uma sessão no SPSS

O

SPSS,

na

WINDOWS.

Para iniciar:

maioria

das

situações,

deve

1. Abra o grupo de programas SPSS

2. Selecione com um duplo clique o ícone:

de programas SPSS 2. Selecione com um duplo clique o ícone: O SPSS apresentará a seguinte

O SPSS apresentará a seguinte janela:

ser

utilizado

através

do

apresentará a seguinte janela: ser utilizado através do Para sair do SPSS: 1. Selecione a opção

Para sair do SPSS:

1. Selecione a opção File na barra de menu

2. Escolha Exit

4

O SPSS contém seis janelas:

SPSS application window : esta janela contém a barra de menu, que você uiliza para abrir arquivos, escolher procedimenos estatísicos e selecionar ouras características do sistema. Ouput window : mostra os resultados dos procedimentos executados em sua sessão no SPSS. Você pode editar e salvar sua saída para utilizar amis tarde. Esta janela é aberta automaticamente no início de cada sessão de trabalho. Data Editor window : esta janela mostra o conteúdo do arquivo de dados. Você pode criar novos arquivos ou modificar arquivos de dados já exixtentes utilizando esta janela. Chart Carousel window : todps os gráficos e figuras gráficas produzidos em sua sessão no SPSS são acessdos através desta janela aberta, automaticamente, a primeira vez que você gerar um gráfico. Chart window : esta janela permite que você, modifique e salve, figuras gráficas e plots com alta resolução. Syntax window : permite que você edite arquivos de conjunto de comandos do SPSS. Esta forma de utilização é essencial em situações especiais.

1.4 - Utilizando o SPSS via Windows

Nesta seção mostraremos com detalhes como executar alguns procedimentos básicos. Vejamos como os resultados do Exemplo 1 foram obtidos.

1.4.1 - Análise Descritiva

A análise descritiva dos dados é obtida da seguinte maneira:

1. Selecione na barra de menu a opção Statistics

2. Escolha Summarize e então selecione Descripives

A seguinte janela surgirá

5

3. Selecione as variáveis e clique sobre a seta 4. Clique OK Para obter estatísticas

3. Selecione as variáveis e clique sobre a seta

4. Clique OK

Para obter estatísticas descritivas adicionais ou controlar a ordem na qual as variáveis aparecerão na listagem escolha Options

1.4.2 - Correlação

1. Selecione na barra de menu a opção Statistics

2. Escolha Correlate

e selecione o submenu Bivariate

a mostrada na figura abaixo:

Será

aberta

caixa

de

diálogo

Bivariate

Correlations,

como

 

6

3. As variáveis numéricas, presentes em seu arquivo, serão mostradas na lista. Selecione duas ou

3. As variáveis numéricas, presentes em seu arquivo, serão mostradas na lista. Selecione duas ou mais variáveis para análise

4. Clique OK

1.4.3 - Histograma

1. Selecione a opção Graphs na barra de menu

2. Escolha Histogram

Será aberta uma caixa de diálogo como a mostrada abaixo.

7

3. Selecione a variável para qual se quer o histograma 4. Clique OK 1.4.4 -

3. Selecione a variável para qual se quer o histograma

4. Clique OK

1.4.4 - Transformações dos Dados

1. Selecione a opção Transform na barra de menu

2. Escolha Compute Surgirá a seguinte caixa de diálogo:

Dados 1. Selecione a opção T ransform na barra de menu 2. Escolha C ompute Surgirá

8

3.

Na caixa Target Variable escreva o nome da variável que receberá o valor calculado. O nome desta variável pode ser o mesmo ou outro qualquer.

4. Na caixa Numeric Expression escreva a expressão usada para o cálculo da nova variável. A expressão pode utilizar nomes de variáveis, constantes, operadores aritméticos e funções.

5. Clique OK

e escreva as expressões

Para expressões condicionais clique sobre If desejadas.

Como se vê, para operações rotineiras, a entrada de comandos através das facilidades do WINDOWS é muito simples.

1.5 - O Comando HELP

O SPSS utiliza o sistema padrão de ajuda do Windows para fornecer as

informações sobre seu funcionamento.

Você pode utilizar o Help em uma destas maneiras:

Clicando sobre o botão Help na caixa de diálogo do SPSS

Selecionando um tópico do menu Help em uma janela do SPSS

Pressionando F1 a qualquer momento no SPSS

Clicando sobre o botão Glossary, para uma ajuda específica, nas janelas de saída ou sintaxe do SPSS.

Se

você clicar sobre o botão Help e escolher a caixa Contents obterá:

9

O SPSS é um software muito abrangente. Todas as técnicas existentes para análises de dados

O SPSS é um software muito abrangente. Todas as técnicas existentes para análises de dados estatísticos estão disponíveis. Para se conhecer, integralmente, suas potencialidades é preciso muito tempo de exposição ao programa. Este texto pretende ser apenas uma introdução.O leitor interessado deverá procurar os manuais apropriados.

10

Dados
Dados

Entrada e Saída de

2.1 - Introdução

O primeiro passo para a análise estatística de um problema é a criação de um arquivo de dados contendo as variáveis de interesse. O objetivo principal deste capítulo é mostrar como o SPSS lê um arquivo de dados. Além disto veremos como gravar a planilha para uso posterior e as saídas com análises estatísticas.

11

2.2 - Entrada de dados

A criação do arquivo de dados a ser analisado pode ser feita de duas

maneiras básicas: leitura de um arquivo de dados, que pode ter formatos diferentes e entrada via teclado.

2.2.1 - Leitura de um arquivo de dados

Muitas vezes os dados a serem analisados já estão em um arquivo de dados com o formato específico do software usado na digitação. Você pode utilizar esse arquivo para criar um arquivo de dados do SPSS.

O

SPSS lê, automaticamente, arquivos dos seguintes tipos:

Arquivos com formato de planilhas de dados criadas com Lotus 1-2-3, Excel e Multiplan.

Banco de dados criados com dBASE e vários formatos SQL.

Arquivos texto ASCII, tabulados e em formato livre.

Arquivos de dados SPSS criados na operação do próprio sistema.

Para ler um arquivo de dados siga os seguintes passos:

1. Na barra de menu selecione File

2. Escolha Open e depois Data

O SPSS apresentará a seguinte tela.

12

3. Escolha o arquivo com que vai trabalhar 4. Clique OK Exemplo 2.1: Arquivo de

3. Escolha o arquivo com que vai trabalhar

4. Clique OK

Exemplo 2.1: Arquivo de dados para o Exemplo 1.1

3. Escolha o arquivo com que vai trabalhar 4. Clique OK Exemplo 2.1: Arquivo de dados

13

2.2.2- Entrada de dados via digitação

O procedimento a ser utilizado para criar um banco de dados no SPSS é o seguinte:

1. Selecione a opção File na barra de menu

2. Escolha New e a seguir selecione Data

A janela aberta será a seguinte:

a seguir selecione D ata A janela aberta será a seguinte: 3. Maximize a janela Newdata

3. Maximize a janela Newdata

4. Posicione o cursor na linha 1 da 1ª coluna

5. Digite os dados desejados.

2.2.3- Definindo Variáveis

Podemos sempre atribuir nomes descritivos às variáveis da planilha. O nome padrão para variáveis é dado pelo prefixo var e uma seqüência de cinco números (var00001, var00002, etc.). Para mudar o nome, o formato e outros atributos da variável você pode:

Dar um clique duplo sobre o nome corrente da variável no alto da coluna, ou;

Selecionar qualquer célula na coluna da variável, e no menu escolher:

14

Data

Define Variable

Isto abrirá a caixa de diálogo Define Variable, mostrada a seguir.

a caixa de diálogo Define Variable, mostrada a seguir. O nome, o tipo, label , valores

O nome, o tipo, label, valores perdidos (se houver) e o alinhamento para

a variável selecionada são mostrados. Para alterá-los selecione uma das caixas

contidas em Change Settings.

É importante acrescentar que o SPSS tem dois tipos de identificação para

os dados ausentes (valores perdidos):

qualquer espaço em branco nas células, da matriz retangular de dados, é considerado como valor perdido sendo indicado por (.)

você pode atribuir valores que identifiquem a informação perdida para razões específicas e determinar ao SPSS que marque estes valores como perdidos. Esta maneira é útil para distinguir a informação ausente.

Para especificar como deverão ser mostrados os valores perdidos você

na caixa de diálogo Define

deve clicar sobre a caixa Missing Values Variables. Será aberta a seguinte janela:

15

Determine as opções desejadas e depois clique Continue. Você retornará a caixa de diálogo principal

Determine as opções desejadas e depois clique Continue. Você retornará a caixa de diálogo principal permitindo que você faça outras modificações se desejar.

Acostume-se a salvar seus dados, em um arquivo, logo após o término da digitação. O procedimento para gravação será mostrado na próxima seção.

2.3 - Armazenamento de Dados

Os

maneira:

dados

digitados

podem ser

armazenados

Arquivo de dado no formato SAV

no

SPSS

da

seguinte

Trata-se do formato padrão do SPSS e é a melhor maneira de se armazenar os dados. Para isto basta seguir os seguintes passos:

1. Depois de terminar a digitação, com o cursor posicionado na janela Newdata escolha a opção Save As

16

2. Determine o nome, o diretório e o tipo do arquivo a ser salvo. 3.

2. Determine o nome, o diretório e o tipo do arquivo a ser salvo.

3. Clique OK

É importante acrescentar que o SPSS sempre cria um arquivo de dados

retangular, isto é, as dimensões do arquivo são definidas pelo número de casos e variáveis.

Arquivo de dados no formato ASCII

Este é o formato padrão de comunicação entre diferentes softwares. Para salvar o seu arquivo em formato ASCII você deve seguir os passos anteriores. Porém na caixa Salvar arquivo como tipo: você deve selecionar o formato ASCII.

O formato ASCII, iniciais de Americam Standart Code for Interchange

of Information, permite representar todos os caracteres (alfabéticos, numéricos e símbolos) utilizados na escrita. Todos os softwares de estatística, ou não, lêem arquivos neste formato. Daí a sua importância.

Arquivo de dados em outros formatos

Você pode utilizar o procedimento anterior para gravar o seu arquivo em outros formatos. Basta mudar o tipo do arquivo a ser salvo.

17

2.4

- Armazenamento de Resultados

O SPSS abre automaticamente uma janela, onde todos os resultados das análises são armazenados. Como estes resultados serão utilizados mais tarde na produção do relatório final para a análise é usual, antes de terminar a sessão de trabalho, gravar a saída em um arquivo apropriado. Para isto proceda da seguinte maneira:

1. Com o cursor posicionado na janela Output, selecione na barra de menu a opção File

2. Escolha Save As

na barra de menu a opção File 2. Escolha Save A s 3. Escolha o nome

3. Escolha o nome e o diretório do arquivo.

4. Clique OK

2.5 - Armazenamento de Gráficos

Depois de feito um gráfico você pode salvá-lo para utilizar mais tarde. Para isto, basta permanecer na janela Chart e proceder como descrito anteriormente.

18

2.6 - Exercício

Este exercício utiliza os dados do livro: Métodos Estatísticos para Melhoria da Qualidade - Hitoshi Kume - Editora Gente, página 69.

1. Numa padaria, dois padeiros, A e B, assam pão usando duas máquinas (máquina 1 e máquina 2). Os pesos dos pães franceses produzidos foram registrados durante 20 dias, como mostra a tabela 1. Cada dia, quatro pães foram retirados ao acaso de cada máquina e pesados. O peso especificado é de 200 a 225 gramas. Com relação aos dados da tabela 1 execute as seguintes tarefas:

a)

Monte

o

arquivo

de

dados,

definindo

as

variáveis

necessárias

e

escolhendo nomes descritivos.

 

b)

Entre com pelo menos 5 linhas de dados.

 

c)

Grave os dados no formato dBASE (.DBF)

 

Dia

Padeiro

 

Máquina 1

     

Máquina 2

 

1

A

209,2

209,5

210,2

212,0

 

214,3

221,8

214,6

214,4

2

A

208,5

208,7

206,2

207,8

215,3

216,7

212,3

212,0

3

A

204,2

210,2

210,5

205,9

215,7

213,3

215,2

202,7

4

B

204,0

203,3

198,2

199,9

212,5

210,2

211,3

210,4

5

B

209,6

203,7

213,2

209,6

208,4

241,9

212,8

214,8

6

A

208,1

207,9

211,0

206,2

 

212,3

216,2

208,4

210,8

7

A

205,2

204,8

198,7

205,8

208,1

211,9

212,9

209,0

8

B

199,0

197,7

202,0

213,1

207,5

209,9

210,6

212,3

9

B

197,2

210,6

199,5

215,3

206,9

207,1

213,6

212,2

10

B

199,1

207,2

200,8

201,2

209,6

209,5

206,8

214,2

19

Manipulação de Dados 3.1- Introdução Vamos aprender neste capítulo alguns comandos especializados na manipulação

Manipulação de Dados

3.1- Introdução

Vamos aprender neste capítulo alguns comandos especializados na manipulação de dados. Veremos como recodificar uma variável, classificar o conjunto de dados, trabalhar apenas com um subconjunto destes dados e outras manipulações de utilidade mais específicas.

Para demonstrar estes procedimentos utilizaremos os dados do arquivo VESTIB94.SAV que contém, para 824 candidatos ao vestibular da UFMG de 1994, algumas de suas características sócio-econômicas-culturais e o seu resultado. Especificamente VESTIB94.SAV contém uma amostra aleatória de 2% dos candidatos do ano de 1994 para os quais as seguintes informações foram coletadas:

20

Variável

Descrição e Código da Variável

RESULT

Situação final do candidato: 1=Não classificado na 1ª etapa, 2=Classificado na 1ª etapa, 3=Aprovado no Vestibular

PRIMEIRA

Nota total na primeira etapa

TOTAL

Nota total no Vestibular; 0, se o aluno não passou à 2ª etapa

ESTCIVIL

1=Solteiro, 2=Casado, 3=Viúvo, 4=Separado, 5=Outro

IDADE

Idade do candidato: 1=Até 17 anos, 2=18 anos, 3=19 anos, 4=20 a 24 anos, 5=25 a 29 anos, 6=30 anos ou mais

NASCIMEN

Lugar de Nascimento: 1=B.H., 2=Grande B.H., 3=Interior de M.G., 4=Outro Estado, 5=Outro País

RESIDEN

Lugar de residência: 1=B.H., 2=Grande B.H., 3=Interior de M.G., 4=Outro Estado, 5=Outro País

ANO2G

Ano de conclusão do 2º grau: 1=Antes de 1980, 2=Entre 1980 e 1990, 3=1991, 4=1992, 5=1993, 6=1994, 7=Depois de 1994

TIPO2G

Tipo do curso de conclusão de 2º grau: 1=2º grau não profissionalizante, 2=2º grau profissionalizante, 3=Supletivo (antigo Madureza), 4=Outro equivalente, 5=Concluirei a partir de 1994

LUGAR2G

Lugar de conclusão do 2º grau: 1=B.H., 2=Grande B.H., 3=Interior de M.G., 4=Outro Estado,5=Outro País

ESCOLA2G

Escola onde fez maior parte do 2º grau: 1=Pública Federal, 2=Pública Estadual, 3=Pública Municipal, 4=Particular

TURNO2G

Turno onde fez a maior parte do 2º grau: 1=Diurno, 2=Noturno

LINGEST

Domínio da língua estrangeira: 1=Não domina a língua estrangeira, 2=Inglês, 3=Francês, 4=Outra, 5=Domina duas línguas estrangeiras, 6=Domina três línguas estrangeiras

PREVEST

Freqüência em cursinho pré-vestibular: 1=Não, 2=Menos de 1 semestre, 3=1 semestre, 4=1 ano, 5=Mais de 1 ano

PVEST

Já prestou vestibular: 1=Não, 2=Sem concluir o 2º grau, 3=Não foi aprovado, 4=Não matriculou, 5=Mudar de curso, 6=Formado, outra graduação, 7=Outra situação

QUANTV

Quantos vestibulares na UFMG: 1=Nenhum, 2=Um, 3=Dois, 4=Três, 5=Quatro ou mais

LEITURA

Leitura de jornais e revistas: 1=Diariamente, 2=Semanalmente, 3=Ocasionalmente, 4=Não lê

INFORMA

Principal fonte de informação: =Jornal escrito, 2=Telejornal, 3=Jornal falado (rádio), 4=Revistas, 5=Outras fontes, 6=Não se mantém informado

21

TRABREM

Trabalho remunerado: 1=Até 20 horas semanais, 2=De 20 a 30 horas semanais, 3=De 30 a 40 horas semanais, 4=Mais de 40 horas semanais, 5=Não trabalha

RENDA

Renda mensal da família: 1=Até 2 salários mínimos, 2=De 3 a 5 salários mínimos, 3=De 6 a 10 salários mínimos, 4=De 11 a 15 salários mínimos, 5=De 16 a 20 salários mínimos, 6=De 21 a 40 salários mínimos, 7=De 41 a 60 salários mínimos, 8=Acima de 60 salários mínimos

PARTREN

Participação na renda: 1=Responsável pela família, 2=Sustenta e contribui parcialmente, 3=Responsável pelo próprio sustento, 4=Sustentado pela família, 5=Não trabalha, 6=Outra situação

ESCPAI

Nível de escolaridade do Pai: 1=Nenhum, 2=1º grau incompleto, 3=1º grau completo, 4=2º grau incompleto, 5=2º grau completo, 6=Superior incompleto, 7=Superior completo

ESCMAE

Nível de escolaridade da Mãe: Mesma codificação utilizada para o nível de escolaridade do Pai

OCUPPAI

 

OCUPMAE

 

3.2- Classificando o Conjunto de Dados

Nesta seção mostraremos duas operações básicas. A primeira consiste em obter o posto de cada observação, isto é a posição relativa de uma observação no conjunto de dados. A segunda é a ordenação do arquivo de dados segundo uma ou mais variáveis selecionadas.

3.2.1 - Atribuindo postos às variáveis

Para obter os postos das observações, é preciso:

1. Selecionar na barra de menu Transform

2. Escolha Rank Cases

A janela aberta será semelhante à mostrada abaixo.

22

3. Selecione uma ou mais variáveis. 4. Clique OK O SPSS criará uma variável com

3.

Selecione uma ou mais variáveis.

4.

Clique OK

O

SPSS criará uma variável com os valores dos postos das observações

para cada uma das variáveis selecionadas. Para escolher outros tipos de postos

clique sobre Rank Types

A figura abaixo mostra os postos obtidos pela variável PRIMEIRA para

os 10 primeiros alunos.

.

sobre Rank Types A figura abaixo mostra os postos obtidos pela variável PRIMEIRA para os 10

23

3.2.2 - Ordenando as variáveis

Para reordenar os casos em um arquivo de dados, baseado no valor de uma ou mais variáveis classificadas, você deve:

1. Selecionar a Data na barra de menu

2. Escolher Sort Cases

Será aberta uma caixa de diálogo como a seguinte:

Cases Será aberta uma caixa de diálogo como a seguinte: 3. Selecione uma ou mais variáveis.

3. Selecione uma ou mais variáveis. Se você selecionar múltiplas variáveis para serem classificadas, a ordem na qual elas aparecerem na lista da caixa Sort by determinará a ordem com que os casos serão classificados.

4. Clique OK.

mostra a ordenação obtida com variável PRIMEIRA

A figura abaixo

para os 10 primeiros alunos.

24

ou decrescente. Caso queira guardar os dados na forma ordenada para uso posterior é preciso

ou

decrescente.

Caso queira guardar os dados na forma ordenada para uso posterior é preciso gravar o arquivo, pois apenas a versão do arquivo, em uso nesta sessão de trabalho, está ordenado.

A

classificação

das

variáveis

pode

ser

feita

em

ordem

crescente

3.3- Criando um Subconjunto de Dados

O SPSS permite que você restrinja a análise dos dados de um subgrupo específico, baseado em um critério que inclui variáveis relacionadas através de expressões lógicas, ou ainda selecionar uma amostra aleatória dos casos. O critério usado para definir um subgrupo pode incluir:

Valores e amplitudes das variáveis

Amplitudes de tempo e data

Número de casos

Expressões aritméticas ou lógicas

25

Funções

Para selecionar um subconjunto de casos para análise:

1. Selecione na barra de menu Data

2. Escolha a opção Select Cases

Isto abrirá uma caixa de diálogo como a mostrada a seguir.

Isto abrirá uma caixa de diálogo como a mostrada a seguir. 3. Dentro da caixa Select

3.

Dentro da caixa Select escolha uma das possíveis opções:

All cases: usa todos os casos no arquivo de dados. Esta é a escolha padrão.

If condition is satisfied: utiliza uma expressão condicional, onde o caso é selecionado se o resultado é verdadeiro.

Random sample of cases: seleciona uma porcentagem ou um número exato de casos para criar uma amostra aleatória dos casos.

Based on time or case range: faz a seleção utilizando tempo ou um intervalo de casos

26

Use filter variable: permite a seleção de uma variável numérica do arquivo de dados para “filtrar” ou apagar os casos. Este é um recurso poderoso.

4. Clique OK

Os casos não selecionados podem ser filtrados, isto é, as variáveis permanecem no arquivo mas não são incluídas na análise; ou apagados.

3.4- Recodificação de Variáveis

O SPSS permite modificar os valores assumidos pelas variáveis. Isto é

particularmente útil para combinar duas ou mais categorias. Pode-se fazer esta operação mantendo as mesmas variáveis ou criando novas.

Por exemplo para recodificar a variável LINGEST - domínio da língua estrangeira - em apenas duas categorias: 0, não domina a língua estrangeira e 1, domina alguma língua estrangeira, deve-se proceder da seguinte maneira:

1. Selecione a opção Transform na barra de menu principal

2. Escolha Recode e selecione Into Same Variables

A seguinte janela será aberta.

Into S ame Variables A seguinte janela será aberta. 3. Selecione a variável a ser recodificada,

3. Selecione a variável a ser recodificada, no nosso caso LINGEST

4. Clique sobre a caixa Old and New Values

27

A caixa de diálogo aberta será como a seguinte:

A caixa de diálogo aberta será como a seguinte: 5. Digite na caixa Old Value o

5. Digite na caixa Old Value o valor atual da variável e na caixa New Value o valor que ela assumirá. Clique Add ao definir cada valor e depois de definidos todos os valores clique sobre a caixa Continue para retornar a janela anterior.

6. Clique OK

Os novos valores da variável LINGEST são mostrados na figura abaixo:

para retornar a janela anterior. 6. Clique OK Os novos valores da variável LINGEST são mostrados

28

Algumas vezes a recodificação necessária consiste apenas na mudança dos códigos existentes para outros ordenados dentro de inteiros consecutivos. Isto pode ser feito utilizando o menu Automatic Recode. Para isto:

1. Na barra de menu principal selecione Transform

2. Escolha Automatic Recode

Será mostrada uma caixa de diálogo como a seguinte:

Recode Será mostrada uma caixa de diálogo como a seguinte: 3. Selecione uma ou mais variáveis

3. Selecione uma ou mais variáveis para serem recodificadas

4. Na caixa ao lado de New Name especifique o nome para a variável que receberá os valores recodificados e dê um clique sobre ela. O nome escolhido aparecerá na caixa Variable New Name

5. Selecione a ordem com que os valores serão recodificados na caixa Recode Starting from.

6. Clique OK

3.5- Comando Split File

Para separar seu arquivo de dados dentro de grupos para análise:

1. Selecione Data na barra de menu principal

2. Escolha a opção Split File

29

A caixa de diálogo aberta será como a seguinte:

A caixa de diálogo aberta será como a seguinte: 3. Selecione Re peat Analysis for each

3. Selecione Repeat Analysis for each group

4. Selecione uma ou mais variáveis para serem utilizadas na separação dos grupos. Você pode utilizar variáveis númericas e string, sendo o número máximo de grupos igual a 8. Se você selecionar mais de uma variável, a ordem com que elas aparecem na lista determinará a maneira como os grupos serão separados.

5. Clique OK

Terminada a análise, se você não desejar utilizar os dados agrupados, você seguir os passo 1 e 2 e modificar para Analyse all cases.

30

Técnicas Estatísticas 4.1- Introdução as principais técnicas estatísticas. O menu com os procedimentos estatísticos

Técnicas Estatísticas

4.1- Introdução

as

principais técnicas estatísticas. O menu com os procedimentos estatísticos está

reproduzido abaixo. Cada um é seguido por uma seta (

um outro nível onde os procedimentos estatísticos ficam completamente identificados.

) indicando que existe

O SPSS reúne sob o menu Statistics, comandos, que executam

completamente identificados. ) indicando que existe O SPSS reúne sob o menu S tatistics , comandos,

31

Como se vê o número de técnicas estatísticas disponíveis no SPSS é muito grande. Para

Como se vê o número de técnicas estatísticas disponíveis no SPSS é muito grande. Para entender cada uma é preciso estudá-las em curso a elas dedicado. Neste capítulo vamos nos ater apenas a técnicas de análise estatística elementares. Esperamos com isto ilustrar as potencialidades analíticas do sistema.

Para ilustrarmos os procedimentos escolhidos utilizaremos os dados para o Vestibular 94 da UFMG mostrados no Exemplo 3.1.

4.2- Estatísticas Descritivas

Para se conhecer um conjunto de dados, é necessário obter o valor das estatísticas descritivas destes dados. Se a variável é quantitativa, o comando Summarize calcula o valor destas estatísticas. Em particular produz a média, o desvio-padrão, mínimo e máximo dos valores.

Para obter as estatísticas descritivas vamos utilizar a variável PRIMEIRA. Porém antes de iniciar você deve utilizar o comando Split File como descrito na seção 3.5.

1. Selecione a opção Statistics na barra de menu principal

2. Escolha a opção Summarize

3. Escolha Descriptives

A seguinte janela será mostrada:

32

4. Selecione as variáveis para as quais você deseja informações descritivas. Clique sobre a seta

4. Selecione

as

variáveis

para

as

quais

você

deseja

informações

descritivas. Clique sobre a seta e elas aparecerão na caixa Variable(s)

5. Clique OK

O resultado obtido para os quatro primeiros cursos é o seguinte:

CURSO:

Number of valid observations (listwise) =

1

20.00

 

Valid

Variable

Mean

Std Dev

Minimum

Maximum

N

Label

PRIMEIRA

68.70

23.17

0

110

20

CURSO:

2

Number of valid observations (listwise) =

17.00

Valid

Variable

Mean

Std Dev

Minimum

Maximum

N

Label

PRIMEIRA

60.56

32.55

0

104

17

33

CURSO:

Number of valid observations (listwise) =

3

23.00

 

Valid

Variable

Mean

Std Dev

Minimum

Maximum

N

Label

PRIMEIRA

73.37

34.69

0

133

23

CURSO:

5

Number of valid observations (listwise) =

9.00

Valid

Variable

Mean

Std Dev

Minimum

Maximum

N

Label

PRIMEIRA

55.50

32.41

0

113

9

Se você desejar outras medidas descritivas você pode selecioná-las através da janela Options

4.3- Tabelas

Freqüentemente os dados a serem analisados têm várias variáveis qualitativas. Assim uma boa opção de análise é a construção de tabelas de freqüência, que pode ser feita da seguinte maneira:

1. No menu Statistics selecione a opção Custom Tables

2. Escolha Tables of Frequencies

A seguinte janela será aberta:

34

Agora escolhe-se as variáveis discretas para as quais se deseja construir tabelas de freqüência, por

Agora escolhe-se as variáveis discretas para as quais se deseja construir tabelas de freqüência, por exemplo RESULT e IDADE. A informação pode ser obtida através de uma contagem simples (Count) ou percentual (Percents), bastando para isto escolher a opção adequada através do submenu Statistics

3. Selecione as variáveis RESULT e IDADE e clique sobre a seta.

4. Abra a janela Statistics

5. Clique OK

A tabela obtida será semelhante a mostrada abaixo.

e marque as opções Count, Percents e Total

5. Clique OK A tabela obtida será semelhante a mostrada abaixo. e marque as opções Count,

35

O comando Crosstabs permite a construção de tabelas de dupla-entrada úteis na verificação de associação entre as variáveis. Para utilizá-lo:

1. Selecione o menu Statistics

2. Escolha a opção Summarize e logo após escolha Crosstabs

a opção Summarize e logo após escolha C rosstabs Suponhamos que se deseja saber se o

Suponhamos que se deseja saber se o fato do candidato dominar alguma língua estrangeira influencia o seu resultado no vestibular. Proceda da seguinte forma:

3. Coloque a variável RESULT na caixa Row(s) e LINGEST na caixa Column(s).

4. Clique OK

Você obterá uma tabela semelhante a mostrada abaixo:

36

4.4- Análise Exploratória dos Dados Os métodos de análise exploratória de dados são utilizados nos

4.4- Análise Exploratória dos Dados

Os métodos de análise exploratória de dados são utilizados nos estágios iniciais da análise de dados, principalmente para identificar observações discrepantes e evidenciar possíveis violações nas suposições usuais para as técnicas estatísticas.

No SPSS estes procedimentos estão reunidos no submenu Explore sob o menu Statistics. O comando Explore é utilizado para produzir um resumo descritivo para todos os casos ou para grupos de casos separadamente. Você pode obter boxplots, ramo-e-folhas, histogramas, testes de normalidade, tabelas de freqüência além de outros gráficos e medidas descritivas. Para isto:

1. Selecione Statistics

2. Escolha Summarize e logo após Explore

37

3. Na caixa D ependent List selecione uma ou mais variáveis numéricas dependentes 4. Clique

3. Na caixa Dependent List selecione uma ou mais variáveis numéricas dependentes

4. Clique OK

O procedimento padrão inclui estatísticas descritivas, boxplots e ramo-e- folhas para cada variável selecionada. Experimente!

38

Construção de Gráficos 5.1 - Introdução Uma boa análise estatística quase sempre inclui a produção

Construção de Gráficos

5.1 - Introdução

Uma boa análise estatística quase sempre inclui a produção de gráficos. O SPSS cria gráficos de alta resolução através dos procedimentos no menu Graphs e em vários procedimentos no menu Statistics. O objetivo deste capítulo é apresentar os passos para a construção de gráficos, além de noções básicas para editorá-los.

Ao selecionar a opção Graphs na barra de menu principal você verá uma janela semelhante a mostrada a seguir.

39

5.2 - Histograma

5.2 - Histograma O histograma separa os dados dentro de intervalos apropriados, distribuídos ao longo do

O histograma separa os dados dentro de intervalos apropriados, distribuídos ao longo do eixo x. Para cada intervalo é desenhada uma barra cuja altura é proporcional ao número de observações (ou freqüências) em cada intervalo. Veremos como construir um histograma no SPSS.

1. Selecione a opção Graphs na barra de menu principal

2. Escolha Histogram

A janela aberta será como a seguinte:

40

3. Escolha a variável VENDAS 4. Clique OK O histograma construído será semelhante ao mostrado

3. Escolha a variável VENDAS

4. Clique OK

O histograma construído será semelhante ao mostrado abaixo:

HISTOGRAMA PARA AS VENDAS (EM $1000)

7 6 5 4 3 2 1 0 200.0 300.0 400.0 500.0 600.0 250.0 350.0
7
6
5
4
3
2
1
0
200.0 300.0
400.0
500.0 600.0
250.0 350.0
450.0
550.0 650.0

VENDAS

Std. Dev = 123.85 Mean = 411.3 N = 40.00

5.3 - O Comando Scatter

Muitas vezes é necessário estudar a relação entre duas variáveis quantitativas, por exemplo o número de canetas vendidas e o número de comerciais. Uma das ferramentas utilizadas para se verificar as relações, entre

41

duas variáveis, é o diagrama de dispersão. No SPSS, o diagrama é construído utilizando o comando Scatter da seguinte maneira:

1. Selecione a opção Graphs

2. Escolha Scatter

O SPSS mostrará a seguinte janela:

2. Escolha Scatter O SPSS mostrará a seguinte janela: 3. Clique sobre o ícone que Simple

3. Clique sobre o ícone que Simple

4. Clique sobre a caixa Define

A janela aberta será semelhante a esta:

janela: 3. Clique sobre o ícone que Simple 4. Clique sobre a caixa Define A janela

42

5.

Escolha a variável para o eixo y e clique sobre a seta ao lado da caixa Y Axis. Para o nosso exemplo VENDAS.

6. Escolha a variável para o eixo x e clique sobre a seta ao lado da caixa X Axis. Para o nosso exemplo PUBLICID.

7. Clique OK

O gráfico construído será como o mostrado abaixo.

700 600 500 400 300 200 2 4 6 8 10 12 14 16 18
700
600
500
400
300
200
2
4
6
8
10
12
14
16
18
20
VENDAS

PUBLICID

5.4 - O Comando Sequence

Este comando permite a construção de gráficos de séries temporais, isto é, um conjunto de dados ordenado no tempo. Vamos utilizar o arquivo INFLACAO.SAV que fornece o índice IGP-DI de janeiro de 1981 a abril de

1994.

1. Selecione Graphs na barra de menu principal

2. Escolha a opção Sequence

A janela aberta será a seguinte:

43

3. Selecione uma ou mais variáveis para a caixa Variables, para o nosso caso escolhemos

3. Selecione uma ou mais variáveis para a caixa Variables, para o nosso caso escolhemos a variável INDICE.

4. Escolha

agora

uma

variável

para

caixa

Time

Axis

Labels,

utilizaremos a variável PERIODO.

 

5. Clique OK

O gráfico construído será semelhante ao mostrado abaixo:

 
 

44

INDICE

153,00 145,00 1,0 0 1 37,0 ,9 129,00 ,8 121,00 113,00 ,7 105,00 ,6 97,00
153,00
145,00
1,0
0
1 37,0
,9
129,00
,8
121,00
113,00
,7
105,00
,6
97,00
,5
,4
00 89,00
73, 81,00
,3
65,00
,2
57,00
49,00
,1
41,00
0,0
-,1
00 33,00
-,2
17, 25,00
9,00
1,00

PERIODO

5.5 - O Comando Normal

A distribuição Normal é uma importante suposição em muitas análises estatísticas. A melhor maneira de verificar se um subconjunto de dados segue a distribuição normal é a construção do gráfico de probabilidade normal. Se os dados seguem, de fato, a distribuição normal uma reta seria observada. Para sua construção siga os seguintes passos:

1. Selecione a opção Graphs

2. Escolha Normal P-P

As caixas de diálogo aberta é mostrada abaixo:

45

3. Selecione uma ou mais variáveis 4. Clique OK Para a variável VENDAS temos: Normal

3. Selecione uma ou mais variáveis

4. Clique OK

Para a variável VENDAS temos:

Normal P-P Plot of VENDAS

1.00 .75 .50 .25 0.00 0.00 .25 .50 .75 1.00 Expected Cum Prob
1.00
.75
.50
.25
0.00
0.00
.25
.50
.75
1.00
Expected Cum Prob

Observed Cum Prob

O SPSS tem também um segundo tipo de gráfico normal. O gráfico Normal Q-Q. São formas diferentes de verificar o mesmo fato.

46

5.6- Exercício

1. Uma peça de um certo equipamento é fornecida, sob encomenda, por duas empresas externas (1 e 2). A dimensão desta peça é uma característica de qualidade importante no momento da montagem do produto. Para examinar se há diferença nas dimensões das peças da Empresa 1 e Empresa 2, foram extraídas amostras aleatórias das respectivas fábricas, obtendo-se os dados baixo (em mm):

Empresa 1

12,5

12,5

12,4

12,8

12,8

12,6

12,6

12,5

12,6

12,4

12,3

12,6

Empresa 2

13,0

13,1

13,0

13,2

13,1

12,7

13,0

12,1

12,9

12,9

Como, graficamente, você responderia esta pergunta?

47

Criação de Sintaxes 6.1 - Introdução Como foi visto, no Capítulo 1, o SPSS permite

Criação de Sintaxes

6.1 - Introdução

Como foi visto, no Capítulo 1, o SPSS permite ao usuário executar um conjunto de comandos armazenados em arquivo. Esta característica é utilizada em situações especiais, ou quando se deseja adicionar opções pouco comuns ou ainda para personalizar a análise. O objetivo deste capítulo é mostrar os elementos básicos para a criação destes arquivos de comandos que serão chamados genericamente de sintaxe. Com esta flexibilidade o SPSS transforma-se em verdadeira linguagem de programação.

47

6.2 - Abrindo um Arquivo de Sintaxe

Para

mostrar

como

usar

uma

sintaxe,

vamos

usar

o

exemplo

apresentado no Capítulo 1. Siga os passos seguintes:

1. Selecione a opção File

2. Escolha Open

3. Selecione a opção SPSS Syntax

A janela aberta será como a seguinte:

opção SPSS Syntax A janela aberta será como a seguinte: 4. Selecione o arquivo que você

4. Selecione o arquivo que você quer abrir, para o nosso exemplo DESCRIT.SPS

5. Clique OK

Isto abrirá uma nova janela, contendo um arquivo texto da sintaxe, semelhante ao seguinte:

48

Execute os resultados. comandos clicando 6.3 - Criando uma Sintaxe sobre a caixa Run e

Execute

os

resultados.

comandos

clicando

6.3 - Criando uma Sintaxe

sobre

a

caixa

Run

e

observe

os

Um arquivo de sintaxe de comandos do SPSS, pode ser criado utilizando qualquer editor de textos, que grave arquivos em formato texto. Para isto, entretanto, é preciso conhecer a forma de funcionamento de cada comando. Isto nem sempre é fácil! Para contornar este problema o SPSS permite que sejam armazenados na forma de sintaxe os comandos submetidos via Windows, clicando o botão Paste na caixa de menu que contém o procedimento desejado. Ao se verificar na janela de sintaxe o comando submetido, aprende-se também a modificá-lo. Um exemplo ilustra melhor a situação.

49

6.4 - Procedimentos Não Disponíveis na Versão Windows O SPSS disponibiliza um grande número de

6.4 - Procedimentos Não Disponíveis na Versão Windows

O SPSS disponibiliza um grande número de técnicas estatísticas. Algumas delas não estão disponíveis no menu da versão Windows. Isto ocorre seja porque não é viável usar a técnica através de menu ou, porque a versão Windows da técnica ainda não foi desenvolvida. Nestas circunstâncias é preciso criar uma sintaxe. Isto pode ser feito colando os comandos disponíveis das sintaxes da seguinte forma:

Se você não tem uma janela de sintaxe aberta você deve:

1. Selecionar a opção File na barra de menu principal

2. Escolha New

3. Selecione SPSS Syntax

4. Clique sobre a caixa Syntax. Será aberta uma janela, como a mostrada abaixo, contendo o índice das sintaxes existentes no SPSS.

50

5. Selecione a sintaxe que você deseja clicando sobre a palavra do procedimento escolhido. Por

5. Selecione a sintaxe que você deseja clicando sobre a palavra do procedimento escolhido. Por exemplo, para o procedimento Descriptives teremos:

51

Com esta janela aberta você pode copiar este conjunto de instruções uma janela de sintaxe

Com esta janela aberta você pode copiar este conjunto de instruções uma janela de sintaxe criada por você ou fazer modificações. Para isto você deve:

1. Com a janela do procedimento escolhido aberta, clique sobre a caixa Edit. Serão mostradas duas opções: Copy e Annotate

, pois ela permitirá que você copie parte ou

2. Selecione a opção Copy

toda sintaxe para utilizar na janela de sintaxe.

A janela aberta será semelhante a mostrada abaixo:

52

3. Marque, com a ajuda do mouse, a parte que será copiada 4. Clique sobre

3. Marque, com a ajuda do mouse, a parte que será copiada

4. Clique sobre a caixa Copy

5. Retorne a janela de sintaxe

6. Na barra de menu principal selecione Edit e depois Paste para colar os comandos selecionados. Você também pode utilizar Crtl-V para fazer a colagem. Experimente!

7. Depois de colados os comandos você pode fazer as modificações desejadas

8. Grave sua sintaxe para utilizá-la outras vezes.

53

Exercícios

Características Gerais

1.

Qual a característica da configuração do seu PC mais afeta a performance do SPSS?

Armazenamento de Dados e Resultados

2.

Em qual formato você gravaria o arquivo INFLACAO para análises posteriores no SPSS? E para armazenamento para uso futuro?

3.

Grave o arquivo VESTIB94 no formato WK1.

4.

Acesse os dados sócio-econômicos-culturais do vestibular e faça uma distribuição de freqüência para as seguintes variáveis: CURSO e ESTADO CIVIL. Como você passaria estas distribuições de freqüência para o seu editor de textos.

Manipulação de Dados

5.

No arquivo de dados do vestibular selecione e guarde em arquivos separados as respostas dos candidatos aos cursos de Medicina(Curso 32) e Engenharia (Cursos 16,17,18,19 e 20).

6.

Quantos são os candidatos para os quais não se tem a nota na primeira etapa.

7.

Se você recebe os dois arquivos referentes aos alunos candidatos aos cursos de Medicina e Engenharia separados, como você faria para produzir análises, comparando os dois cursos.

8.

Obtenha uma amostra de 300 candidatos. Compare as notas desta amostra com as notas de todos os candidatos do arquivo.

9.

Ordene os candidatos ao curso de Engenharia pela nota da primeira etapa.

Construção de Tabelas

10.Como você verificaria se o Estado Civil e o Grau de Escolaridade do Pai têm influência na aprovação do candidato.

54

Gráficos

11.Leia o arquivo CITIES.DBF que fornece temperaturas em 5 cidades americanas e faça um gráfico com as cinco curvas.

Aritmética

12.Verifique usando o comando NORMAL P-P se as notas na primeira etapa têm distribuição Normal.

55