Você está na página 1de 103

FORMAÇÃO

Introdução ao IBM SPSS Statistics

Sara Vieira
VF: Fevereiro de 2020
ÍNDICE

INTRODUÇÃO À FORMAÇÃO.......................................................................................................................... 5

CAPÍTULO 1 – INTRODUÇÃO AO IBM SPSS STATISTICS .............................................................................. 5

1. Apresentação do IBM SPSS Statistics .................................................................................................... 5

2. Iniciar o IBM SPSS Statistics .................................................................................................................... 6

3. Separadores do Editor de Dados........................................................................................................... 8

3.1. O Separador Data View...................................................................................................................... 8

3.2. O Separador Variable View ............................................................................................................... 9

4. Barra de Ferramentas e Barra de Menus ...........................................................................................13

5. Janela de Resultados – Output Viewer ..................................................................................................15

6. Tipos de Ficheiros ..................................................................................................................................16

CAPÍTULO 2 – CONSTRUÇÃO DE UM FICHEIRO DE DADOS .....................................................................16

1. Exemplo do Questionário de um Inquérito .......................................................................................16

2. Introdução de Variáveis ........................................................................................................................19

2.1. Introdução de Variáveis Numéricas................................................................................................. 19

2.2. Introdução de Variáveis Alfanuméricas .......................................................................................... 21

3. Definição das Propriedades das Variáveis .........................................................................................22

3.1. Adição de Descritivos para Variáveis (variable Labels).................................................................. 22

3.2. Adição de Rótulos para Valores Numéricos (Values labels).......................................................... 24

3.3. Adição de Rótulos para Valores Alfanuméricos (Values labels) ................................................... 26

3.4. Utilização dos Rótulos de Valores (numéricos ou alfanuméricos) para Introdução de Dados26

4. Tratamento da Não Resposta (Missing Values) ...................................................................................27

4.1. Definição de Não Resposta (Missing) para uma Variável Numérica ............................................ 28

4.2. Definição de Não Resposta (Missing) para uma Variável Alfanumérica ...................................... 30

5. Copiar e Colar Atributos de Variáveis .................................................................................................31

6. Guardar os Dados..................................................................................................................................34

7. Sair do SPSS ............................................................................................................................................35

CAPÍTULO 3 – IMPORTAÇÃO DE FICHEIROS DE DADOS ...........................................................................36

1. Importação de um Ficheiro de Dados.................................................................................................36

2. Importação de Folhas de Cálculo (Excel) ............................................................................................36

3. Exportação de um Ficheiro para o Formato de Folha de Cálculo (Excel) .......................................38


CAPÍTULO 4 – OPERAÇÕES DE TRANSFORMAÇÃO DE DADOS ............................................................... 42

1. Definir Grupos a Partir de uma Variável Quantitativa ..................................................................... 42

2. Cálculo de Novas Variáveis .................................................................................................................. 46

3. Recodificar Valores numa Nova Variável ........................................................................................... 48

4. Recodificar Valores na Própria Variável ............................................................................................. 50

5. Automatic Recode ................................................................................................................................. 52

6. Contabilizar Atributos num Conjunto de Variáveis .......................................................................... 54

7. Cálculo de uma Nova Variável a partir de Outra de Formato de Data .......................................... 56

CAPÍTULO 5 – MODIFICAÇÕES SOBRE FICHEIROS DE DADOS ................................................................ 57

1. Ordenação de Dados ............................................................................................................................ 57

2. Identificar Casos Duplicados ............................................................................................................... 59

3. Juntar Observações de Dois Ficheiros (Casos) .................................................................................. 61

4. Juntar Variáveis de Dois Ficheiros ....................................................................................................... 66

5. Selecção de Dados ................................................................................................................................ 72

6. Agregar Informação .............................................................................................................................. 75

CAPÍTULO 6 – ANÁLISE DESCRITIVA DE DADOS ........................................................................................ 83

1. Escalas de Medida ................................................................................................................................. 83

2. Tabelas de Frequências ........................................................................................................................ 84

3. Procedimento Descriptives .................................................................................................................. 90

4. Case Summaries .................................................................................................................................... 92

5. Procedimento Explore .......................................................................................................................... 93

6. Crosstabs ................................................................................................................................................ 99

7. Means ................................................................................................................................................... 102


INTRODUÇÃO À FORMAÇÃO

Esta formação tem como principais objectivos a contextualização da utilização geral do IBM
SPSS Statistics, permitir aos formandos familiarizarem-se com o ambiente de trabalho do SPSS
através do contacto com uma primeira sessão do programa, e dotá-los de conhecimentos que
possibilitem a obtenção de análises estatísticas relevantes a partir desta ferramenta.

Assim, depois da formação os formandos vão estar aptos a:

▪ Entender a estrutura geral do SPSS


▪ Perceber a apresentação dos dados no SPSS (Data View)
▪ Compreender a apresentação das variáveis no SPSS (Variable View)
▪ Criar/importar ficheiros de dados
▪ Definir propriedades de variáveis
▪ Manipular conjuntos de dados no SPSS
▪ Executar análises estatísticas simples
▪ Perceber a apresentação da janela de resultados (Output Viewer do SPSS)
▪ Construir gráficos no SPSS através de menus

CAPÍTULO 1 – INTRODUÇÃO AO IBM SPSS STATISTICS

1. APRESENTAÇÃO DO IBM SPSS STATISTICS

O SPSS (Statistical Package for Social Science) é uma ferramenta para análise de dados utilizando
técnicas estatísticas básicas e avançadas. É um software estatístico da IBM, de fácil
manuseamento, e que permite a utilização de dados em diversos formatos para gerar
relatórios, calcular estatísticas descritivas, conduzir analises estatísticas complexas e elaborar
gráficos.

A primeira versão data de 1968 e, a mais recente é a SPSS for Windows 26 (2019).

A utilização do SPSS apresenta diversas vantagens, como sejam, a sua flexibilidade para
diferentes naturezas de variáveis; a facilidade de utilização, sendo um programa muito
amigável (baseado no ambiente Windows), com diversos níveis de complexidade, de acordo
com as necessidades dos seus utilizadores, possibilitando a elaboração de relatórios, quer
pelo próprio programa, quer por uma articulação com um processador de texto.

Para a análise estatística dos dados o SPSS Statistics engloba várias funcionalidades, como
sejam:

• Acesso e gestão de elevada quantidade de dados – possibilita uma ligação simples com
diverso software para importação de dados, nomeadamente Excel, SAS, Stata,..

• Preparação dos dados para análise – baseado nas possibilidades de codificação e


recodificação, propriedades das variáveis, validação, contagens, partição ou selecção de
dados, entre outras funções;

INTRODUÇÃO AO IBM SPSS STATISTICS 5


• Análise estatística de dados – com recurso a diversas técnicas, a construção de tabelas
com os apuramentos mais simples da informação, como sejam as análises descritivas,
até à utilização de técnicas de análise mais sofisticadas, como análise fatorial, modelos
de classificação, modelos de regressão, séries temporais, forecasting, análise de
sobrevivência, redes neuronais, data mining, entre muitos outros;

• Construção de gráficos – elevada diversidade de gráficos, obtidos através de menus


intuitivos de construção e manuseamento, com a possibilidade de personalização de
modelos de gráficos para repetida utilização.

Em suma, o IBM SPSS Statistics apresenta-se como um produto abrangente, completo,


facilitador da análise de dados e que, pelas suas características de excelência, tem
conquistado um lugar de destaque em diferentes áreas como as ciências sociais, humanas,
biológicas e empresariais, quer na vertente de utilização quer na de investigação.

2. INICIAR O IBM SPSS STATISTICS

Uma vez no ambiente de trabalho do Windows, inicie o IBM SPSS


Statistics clicando directamente no atalho do programa (Figura 1) para
o caso dele estar disponível no ambiente de trabalho ou na barra de
tarefas.
Figura 1 – Ícone de
Ou clicando no botão Iniciar do Windows e proceder à sequência de: atalho do SPSS

Start » Programs » IBM SPSS Statistics

Assim, aparecerá o ecrã de abertura do SPSS, com uma caixa de diálogo inicial que permite
iniciar uma nova sessão no SPSS ou aceder à importação de uma base de dados.

Figura 2 – Ecrã de abertura do SPSS com caixa de diálogo inicial

6 INTRODUÇÃO AO IBM SPSS STATISTICS


Clicar em Type in data da caixa de diálogo para proceder à abertura de uma nova janela (nova
sessão), ou no caso de se pretender abrir um ficheiro já existente (base de dados), deve clicar-
se em Open an existing data source e seleccionar o ficheiro pretendido.

Type in data – para


abrir nova janela

Open an
existing
data source
- para abrir
um ficheiro
existente

Figura 3 – Caixa de diálogo inicial para abertura de nova janela ou de ficheiro existente

Desta forma, abre-se de imediato a janela do Editor de Dados, que funciona de forma
semelhante a uma folha de cálculo.

Figura 4 – Janela do Editor de Dados (Data Editor) - neste caso após clicar em Type in data, por isso aparece
vazio

O Editor de Dados apresenta uma Barra de Menus, uma Barra de Ferramentas e dois Separadores.

INTRODUÇÃO AO IBM SPSS STATISTICS 7


Barra de Menus Barra de Ferramentas

Dois Separadores

Figura 5 – Localização dos componentes do Editor de Dados

3. SEPARADORES DO EDITOR DE DADOS

No IBM SPSS Statistiscs existem, quando se acede a dados ou se cria um ficheiro de dados,
dois separadores: Data View (que permite a visualização e introdução ou edição dos dados)
e Variable View (que permite a visualização e a definição ou alteração das características das
variáveis).

3.1. O SEPARADOR DATA VIEW

No SPSS os dados são colocados no separador Data View do Editor de Dados visível na Figura
6.
Barra de Menus Barra de Ferramentas

Variáveis

Casos

Editor de Dados Editor de Variáveis


[permite visualizar e editar os dados]
Figura 6 – O Separador Data View (Editor de Dados)

8 INTRODUÇÃO AO IBM SPSS STATISTICS


O Separador Data View é, em português designado por Editor de Dados (tal como a janela
inicial que abrange os dois separadores).
Neste separador podem ser efectuadas alterações nos dados do ficheiro (colocando-se numa
célula e escrevendo o novo valor), tal como adicionar novos casos. Tanto o rato como o teclado
podem ser usados para se movimentar dentro do Editor de Dados, à semelhança de outras
aplicações para o Windows.
Os ficheiros de dados (DataSet) estão organizados segundo uma matriz de casos (linhas) e
variáveis (colunas). Assim, cada caso representa a resposta individual a um questionário (ou
um inquirido) e cada variável uma questão do questionário.

Notas do separador Data View:

▪ Operações de cálculo entre casos (linhas) não são possíveis de efectuar;


▪ Operações de cálculo nas colunas (variáveis) afectam todas as linhas;
▪ Alterações aplicadas em casos (linhas) não serão reflectidas em tabelas/gráficos produzidos
anteriormente.

3.2. O SEPARADOR VARIABLE VIEW

O Separador Variable View é, em Português, denominado por Editor de Variáveis e permite


definir as diversas propriedades das variáveis. Onde cada linha corresponde a uma variável e
cada coluna corresponde um atributo associado à variável.

Barra de Menus Barra


Barra dede Ferramentas
Ferramentas

Características
das Variáveis

Variáveis

Editor de Dados Editor de Variáveis


[permite definir ou alterar as características das variáveis]
Figura 7 – O Separador Variable View (Editor de Variáveis)

Na Figura 8 podem-se ver os vários atributos que se podem associar a uma variável.

INTRODUÇÃO AO IBM SPSS STATISTICS 9


Tipo da Rótulos dos valores
Variável da Variável

Etiqueta da Valores Escala de


Nome da
Variável Omissos Medida
Variável

Figura 8 – Atributos das Variáveis

Como atributos das variáveis o SPSS permite ao utilizador definir:


1. Name ou Nome da variável – Especificação da designação da variável.
Regras para definição:
a) Devem iniciar-se com uma letra;
b) Os restantes caracteres podem ser algarismos ou símbolos (@, #,_,$);
c) Não podem terminar com um ponto final, nem podem conter espaços em branco (em
alternativa usar underscore);
d) Não permite utilizar os caracteres de pontuação ou de cálculo (!, ?, +, - %, etc.);
e) Existem palavras reservadas que não devem ser usadas como nome: ALL, AND, BY, EQ, GE,
GT, LE, LT, NE, NOT, OR, TO e WITH;
f) Não são permitidas duplicações de designações de variáveis;
g) A designação não pode ter mais de 64 caracteres.

2. Type ou Tipo da variável - Especificação do tipo de cada variável. Por defeito assume-
se que as variáveis são numéricas.

Figura 9 – Caixa de diálogo do Tipo de variável

10 INTRODUÇÃO AO IBM SPSS STATISTICS


Na caixa de diálogo do Tipo da Variável estão disponíveis os seguintes tipos de dados:

▪ Numéric – Variável com atributos numéricos;


▪ Comma – Valores numéricos separados por vírgula a cada 3 casas e com
espaço como delimitador decimal;
▪ Dot – Valores numéricos, separados por ponto a cada 3 casas e com vírgula
como delimitador decimal;
▪ Scientific notation – Valores numéricos especificados conforme notação
científica, ou seja, com o símbolo E e um exponente potência de 10 (com sinal).
Exemplo – 123, 1.23E2, 1.23E+2;
▪ Date – Definição de formatos para datas (dia, mês, ano);
▪ Dollar – Definição de valores em unidades monetárias ($);
▪ Custom currecy – Opção que serve para customização de formatos de
apresentação de valores numéricos (como por exemplo o símbolo “€”), desde
que definidos em Options (menu Edit);
▪ String – Especificação para variáveis de texto/ alfanuméricas;
▪ Reestricted Numeric (integer with leading zeros) – Definição para valores
maiores que zero.

Contudo, em cada variável só é possível especificar uma destas opções.

3. Width – Especificação do número de caracteres assumidos pela variável.


4. Decimals – Identificação do número de casas decimais.
5. Label ou Etiqueta da variável – Texto descritivo da variável. Pode conter espaços e a
especificação de caracteres reservados, face ao identificado na designação das
variáveis. Poderá ser especificado um descritivo até 256 caracteres e por defeito, se
definidos, será o descritivo que será apresentado aquando a criação de tabelas e
gráficos.
6. Values ou Rótulos dos valores dos dados – Texto descritivo dos atributos assumidos
ela variável. (Exemplo: 1 – Masculino, 2 – Feminino). Opção muito útil para o
tratamento de variáveis categóricas. É possível a especificação de 128 caracteres.

Figura 10 – Caixa de diálogo de Rótulos dos valores dos dados

INTRODUÇÃO AO IBM SPSS STATISTICS 11


7. Missing ou Valores Omissos – Podem-se definir códigos numéricos ou alfanuméricos
que correspondam a não respostas. Quando não são definidos missing values, as não
respostas assumem-se como sendo “System missing” (com pontos “.” para variáveis
numéricas e a branco para variáveis alfanuméricas) e após a sua definição passam a
ser tratados como “User missing”. Também poderá associar códigos às respostas não
válidas (não sabe, não responde, não aplicável) que são excluídas da análise.
8. Columns - Opção que tem repercussão no separador Data View, contendo alterações
do dimensionamento da coluna. Esta operação também pode ser executada no
separador Data View.
Nota: Os valores atribuídos à largura da coluna não afectam a forma como o número (ou texto)
é guardado, apenas como é apresentado no Data View.

9. Align – Propriedade que permite controlar a forma como os valores são apresentados
no separador Data View.

Figura 11 – Opções de alinhamento

10. Measure – Define a escala de medida das variáveis.

Figura 12 – Opções de escalas de medida

▪ Scale: para atributos numéricos em escala de rácios ou de intervalos (exemplo


- idade, rendimento);
▪ Ordinal: informação qualitativa para a qual os respectivos valores assumem
uma determinada ordem, com uma diferença desconhecida entre valores
adjacentes (exemplo – escalas de satisfação, escalões etários);
▪ Nominal: informação qualitativa em que as respectivas categorias não
possuem nenhuma ordem inerente às mesmas (exemplo – género, meio de
transporte utilizado, países…). Estas variáveis podem ser numéricas ou
alfanuméricas.

11. Role – Opção que permite determinar o tratamento da variável em procedimentos de


modelização de dados.

12 INTRODUÇÃO AO IBM SPSS STATISTICS


4. BARRA DE FERRAMENTAS E BARRA DE MENUS

Os procedimentos utilizados no SPSS são acessíveis a partir dos menus disponíveis e/ou da
barra de ferramentas.

Figura 13 – Barra de Ferramentas

A Barra de Ferramentas consiste num conjunto de atalhos de acesso rápido a


procedimentos (importar ficheiros de dados, guardar o ficheiro de dados, listar últimos
procedimentos utilizados, aceder a filtros, ponderações, listar os descritivos dos atributos das
variáveis, etc…) podendo ser customizada. Se posicionarmos o rato em cima de um botão (sem
clicar) obtém-se a informação resumida sobre esse mesmo botão.

A Barra de Menus é uma área do software SPSS, onde são apresentados os menus que
contêm as funcionalidades do programa. Os menus são, geralmente, presentes em interfaces
gráficas que possuem janelas e estas vários comandos.

Figura 14 – Barra de Menus

Na Barra de Menus do SPSS encontram-se os seguintes Menus:

1. File: Acede-se a este menu quando se pretende, entre outras funções, importar
ficheiros de dados, no formato IBM SPSS Statistics ou a partir de outra fonte (Microsoft
Office Excel, bases de dados, texto), ou construir um novo ficheiro. Também se pode
abrir/criar novas janelas de programação (Sintaxe) ou de resultados (Outputs) ou de
Scripts. Adicionalmente poderá obter informação do ficheiro (Display Data File
Information), guardar o ficheiro (Save), listar os últimos ficheiros de dados utilizados
(Recently Data Files) e sair da aplicação (Exit).

2. Edit: Permite efectuar operações de edição sobre ficheiros de dados, bem como
modificar, copiar, seleccionar e procurar texto ou dados.

3. View: Permite alterar o formato de visualização de propriedades (Fontes, Grid Lines,


Criação de menus, customização da barra de ferramentas, passagem para o separador
Variable View, etc…).

4. Data: É composto por um conjunto de procedimentos destinados à fase de


preparação de dados. É aqui que se desenvolvem alterações subjacentes a uma
estrutura de dados. Entre outras opções, é possível aceder a procedimentos para
ordenação de casos ou de variáveis (Sort Cases/ Variables), de agregação (Aggregate),
e de junção de casos ou de variáveis entre ficheiros de dados (Merge Files).

INTRODUÇÃO AO IBM SPSS STATISTICS 13


5. Transform: Destinado à criação (ou recodificação) de (novas) variáveis. Entre outras
funções, utiliza-se este menu para efectuar operações sobre valores de variáveis
(Compute Variable), atribuir nova classificação (Recode into Sme Variables ou Recoude
into Different Variables) e criar variáveis numéricas a partir de variáveis alfanuméricas
(Automatic Recode)

6. Analyse: Neste menu podem ser seleccionados procedimentos estatísticos a utilizar


na fase de análise de dados. São diversas as técnicas estatísticas disponíveis: obtenção
de frequências e medidas descritivas (Descriptive Statistics), de tabelas de
contingência (Custom Tables), de testes estatísticos paramétricos (Compare Means),
de testes não paramétricos (Nonparametric Tests), etc…

7. Graphs: Serve para a criação de gráficos (barras, histogramas, circulares, dispersão,


linhas, etc…).

8. Utilities: Entre outras opções, permite o acesso de informação das variáveis


existentes no ficheiro de dados (Variables), a definição de conjuntos de variáveis
(Define Variable Sets) e a execução de scripts (Run Scripts).

9. Extensions ou Add-ons (dependendo das versões): Permite desenvolver e gerir


extenções do IBM SPSS Statistics. As extensões são componentes customizados que
entendem as capacidades do SPSS e podem ser criadas por utilizadores mais
experientes e partilhadas com outros.

10. Window: Serve, sobretudo, para mudar de janela de trabalho;

11. Help: Permite o acesso aos diversos tópicos de ajuda disponíveis no IBM SPSS
Statistics.

Configurar / Operações sobre dados:


parametrizar o Ordenar casos; juntar ficheiros (Merge Files);
SPSS (Options), partir a análise por grupos (Split File); filtrar
inserir novas casos (Select Cases); activar ponderadores
variáveis e casos (Weight Cases)

Criar, abrir, Activar barras de


exportar, ferramentas, fontes,
guardar e barra de status e
imprimir mostrar etiquetas
ficheiros (Value Labels)

Figura 15 – Localização dos menus File, Edit, View e Data da Barra de Menus

14 INTRODUÇÃO AO IBM SPSS STATISTICS


Criar novas variáveis Criar Add-ons do Ajuda on-line;
com base nas variáveis gráficos Statistics; tutoriais
originais; recodificar Extensões
variáveis

Comutar
Procedimentos Informação entre janelas;
de análise sobre as minimizar
estatística variáveis janelas

Figura 16 – Localização dos menus Transform, Analyse, Graphs, Utilities, Add-ons, Window e Help da
Barra de Menus

5. JANELA DE RESULTADOS – OUTPUT VIEWER

Anteriormente, foram apresentadas informações sobre a janela de dados (Editor de Dados)


com indicação dos separadores Data View e Variable View. Agora apresenta-se a Janela de
Resultados (o Output do IBM SPSS Statistics).

Figura 17 – Janela de Resultados

INTRODUÇÃO AO IBM SPSS STATISTICS 15


Na Janela de Resultados ou Output Viewer, são apresentados todos os resultados estatísticos,
tabelas e gráficos.
No painel do lado esquerdo apresenta-se a organização do conteúdo da Janela de Resultados,
e o painel direito (ou de conteúdos) contém os resultados propriamente ditos, como as tabelas
estatísticas, os gráficos e outra qualquer informação criada na análise. Note-se que no painel
de conteúdos, antes de serem apresentados os resultados estatísticos, é mostrado um
caminho com informação do sistema sobre a análise efectuada (programação do software).

O painel de conteúdos (lado direito) revela os detalhes do item seleccionado no painel


esquerdo, e pode-se facilmente navegar através das barras de scroll no painel de conteúdos
(ou clicando no item do painel esquerdo para ir directamente para a tabela, gráfico ou
informação correspondente). Na Figura 17 pode observar-se uma tabela de frequências e
percentagens para a variável “Sexo”, assim como um gráfico circular sobre a mesma variável.

6. TIPOS DE FICHEIROS

Para cada uma das janelas referidas (dados e resultados) são gerados ficheiros específicos
que são identificados com extensões e ícones diferentes:
▪ Ficheiro de dados: extensão - .sav;
▪ Ficheiros de resultados: extensão - .spv

Nota: Existem ainda outras janelas, nomeadamente a Syntax (para programação, e que não é abordada
neste manual/formação) e que tem uma extensão - .sps.

Ainda a este respeito, indica-se que é possível ter múltiplos ficheiros de dados (e de resultados)
abertos na mesma sessão de trabalho, no entanto apenas um será o ficheiro de dados activo.

A cruz que se apresenta na respectiva janela (de dados ou de resultados) indica qual o
ficheiro activo. Tal significa que todas as análises (tabelas / gráficos ou comandos de
programação) serão realizadas sobre esse ficheiro. O utilizador pode alterar o ficheiro activo,
clicando no ficheiro de seu interesse a partir do menu Window.

CAPÍTULO 2 – CONSTRUÇÃO DE UM FICHEIRO DE DADOS

1. EXEMPLO DO QUESTIONÁRIO DE UM INQUÉRITO

Além da importação de dados desde fontes distintas, assunto a ser abordado posteriormente,
o utilizador poderá optar por introduzir directamente a informação no SPSS. Esta opção é
muito útil para ficheiros de pequena dimensão.

Neste exemplo detalha-se a construção de um ficheiro de dados contendo a introdução de


variáveis numéricas / alfanuméricas, bem como a definição das suas propriedades.

O questionário do inquérito em causa contém um conjunto de questões relacionadas com os


elementos de caracterização do inquirido e outro com a utilização de software.

16 INTRODUÇÃO AO IBM SPSS STATISTICS


ID

Caracterização dos Inquiridos

S1 Género

 1.1 Feminino
 1.2 Masculino

S2 Habilitações Académicas

 2.1 Ensino Básico


 2.2 Ensino Secundário
 2.3 Licenciatura
 2.4 Mestrado
 2.5 Doutorado

S3 Idade

S4 Localidade

Utilização de Sotware

P1 Identifique, da seguinte lista, os programas que utiliza

 1.1 SPSS
 1.2 Excel
 1.3 PowerPoint
 1.4 Word

P2 Identifique como avalia os seus conhecimentos dos programas referidos

1 = Muito Insuficientes, 2 = Insuficientes, 3 = Razoáveis, 4 = Bons, 5 = Muito Bons e 98 = Não Sabe


Grau de conhecimento do software
1 2 3 4 5 98
2.1 SPSS
Pogramas

2.2 Excel
2.3 PowerPoint
2.4 Word

Figura 18 – Exemplo de questões usadas num inquérito

Para as questões representadas na Figura 18 apresenta-se uma tabela com o esquema de


codificações a ser especificado no SPSS. Apresentam-se as designações das variáveis
(iniciando-se por “S” todas as variáveis de caracterização dos inquiridos e por “P” as questões
de utilização dos softwares), os seus descritivos (Labels), os seus atributos (Value Labels), os
missing values a si associados e as escalas de medida apropriadas.

INTRODUÇÃO AO IBM SPSS STATISTICS 17


Variável Descritivo da variável Descritivos dos atributos Missing Escala de
Value Medida
ID Código do Inquirido - - Nominal
S1 Género do Inquirido 1 – Feminino 99 Nominal
2 – Masculino
99 – Não Responde
S2 Habilitações 1 – Ensino Básico 99 Ordinal
Académicas do 2 – Ensino Secundário
Inquirido 3 – Licenciatura
4 – Mestrado
5 – Doutoramento
99 – Não Responde
S3 Idade do Inquirido 999 – Não Responde 999 Scale
S4 Localidade do Inquirido NR – Não Responde NR Nominal
P1_1 Utilização do SPSS 0 – Não 99 Nominal
1 – Sim
99 – Não Responde
P1_2 Utilização do Excel 0 – Não 99 Nominal
1 – Sim
99 – Não Responde
P1_3 Utilização do 0 – Não 99 Nominal
PowerPoint 1 – Sim
99 – Não Responde
P1_4 Utilização do Word 0 – Não 99 Nominal
1 – Sim
99 – Não Responde
P2_1 Conhecimentos do 1 – Muito Insuficientes 98, 99 Ordinal
SPSS 2 – Insuficientes
3 – Razoáveis
4 – Bons
5 – Muito Bons
98 – Não Sabe
99 – Não Responde
P2_2 Conhecimentos do 1 – Muito Insuficientes 98, 99 Ordinal
Excel 2 – Insuficientes
3 – Razoáveis
4 – Bons
5 – Muito Bons
98 – Não Sabe
99 – Não Responde
P2_3 Conhecimentos do 1 – Muito Insuficientes 98, 99 Ordinal
PowerPoint 2 – Insuficientes
3 – Razoáveis
4 – Bons
5 – Muito Bons
98 – Não Sabe
99 – Não Responde
P2_4 Conhecimentos do 1 – Muito Insuficientes 98, 99 Ordinal
Word 2 – Insuficientes
3 – Razoáveis
4 – Bons
5 – Muito Bons
98 – Não Sabe
99 – Não Responde

Figura 19 – Esquema de codificação das variáveis

18 INTRODUÇÃO AO IBM SPSS STATISTICS


2. INTRODUÇÃO DE VARIÁVEIS

As variáveis, e as características de cada uma, deverão ser especificadas no separador Variable


View.

Clique no separador Variable View

De seguida, o utilizador deve definiras variáveis a introduzir.

2.1. INTRODUÇÃO DE VARIÁVEIS NUMÉRICAS

Especificar as quatro primeiras variáveis que, de acordo com o esquema de codificação,


devem ser do tipo numérico.

Escreva ID na primeira linha da primeira coluna


Escreva S1 na segunda linha da mesma coluna
Escreva S2 na terceira linha da mesma coluna
Escreva S3 na quarta linha da mesma coluna

Figura 20 – Designação das variáveis definidas no Variable View

Após a introdução dos nomes das variáveis, estas são automaticamente formatadas como
sendo numéricas. Mesmo que o utilizador não introduza os nomes, o SPSS define-os
automaticamente. O utilizador deve, no entanto, ter em conta que estes nomes não espelham
o conteúdo da informação, nem são aconselháveis para ficheiros de maior dimensão.

Clique no separador Data View para introduzir a restante informação

Os nomes definidos no Variable View aparecem agora no topo das primeiras quatro colunas
do Data View. A introdução dos dados deverá iniciar-se na primeira linha, a partir da primeira
coluna.

Na coluna ID digite 1
Na coluna S1 digite 1
Na coluna S2 digite 1

INTRODUÇÃO AO IBM SPSS STATISTICS 19


Na coluna S3 digite 15
Coloque o cursor na primeira coluna da segunda linha para adicionar uma nova linha
de dados.
Na coluna ID digite 2
Na coluna S1 digite 2
Na coluna S2 digite 2
Na coluna S3 digite 35
Repita estes passos para os restantes casos.

Figura 21 – Valores introduzidos no Data View

Neste momento todas as variáveis possuem duas casas decimais, ainda que estas apenas
assumam valores inteiros.

Para retirar as casas decimais destas variáveis:


Clique no separador Variable View

Seleccione a coluna Decimals relativa à linha ID e digite 0


Seleccione a coluna Decimals relativa à linha S1 e digite 0
Repita estes passos para as restantes variáveis.

Figura 22 – Correcção das casas decimais

20 INTRODUÇÃO AO IBM SPSS STATISTICS


2.2. INTRODUÇÃO DE VARIÁVEIS ALFANUMÉRICAS

De acordo com o plano de codificação a variável S4 está associada à localidade de residência


do inquirido, pelo que esta variável deve assumir a tipologia alfanumérica. Ou seja, é
expectável que os dados recolhidos para esta variável sejam do tipo texto.

Clique no separador Variable View

Digite S4 na linha em branco a seguir a S3


Clique na área Type
Clique no botão existente na área Type para aceder à caixa de diálogo Variable Type

Figura 23 – Botão relativo à área Type

A coluna Tye regista o formato da variável (numérica, alfanumérica, data, etc…). Os formatos
Numeric (numérico) e String (alfanumérico) são os mais comuns e coexistem com uma
apreciável variedade de formatos.

Seleccione String para especificar o tipo de variável


Altere o número de caracteres (Characters) para 100
Clique em OK para guardar as alterações e voltar ao Editor de Dados

Figura 24 – Caixa de diálogo Variable Type

INTRODUÇÃO AO IBM SPSS STATISTICS 21


Repita os passos anteriores e necessários para a criação e definição das variáveis
relativas à utilização do software.

Figura 25 – Criação das restantes variáveis

3. DEFINIÇÃO DAS PROPRIEDADES DAS VARIÁVEIS

Para além da definição do tipo de variável, o utilizador poder ainda definir outras
propriedades como, por exemplo, os descritivos (Lables) dos nomes das variáveis e dos valores
numéricos assumidos pelas assumidos pelas mesmas (Value Labels). A adição destes
descritivos torna a leitura e interpretação dos dados e dos outputs estatísticos muito mais
simples.

3.1. ADIÇÃO DE DESCRITIVOS PARA VARIÁVEIS (VARIABLE LABELS)

Os descritivos fornecem informações adicionais relativas ao conteúdo da variável, ou seja,


constituem a versão longa do nome da variável, com capacidade de 256 caracteres. Os
descritivos clarificam a leitura da variável. Por exemplo, uma pessoa que não conheça o
questionário ao qual se está a elaborar a presente base de dados, não saberá a que dizem
respeito as variáveis S1; S2; S3; S4; P1_1; P1_2; P1_3; P1_4; P2_1; P2_2; P2_3 e P2_4 que estão
expressas em código, da mesma maneira, para o caso do questionário ou base de dados ser
muito extensa, qualquer pessoa poderá confundir-se com as designações das variáveis.

Assim, a Etiqueta da variável (Lable) permite facilmente saber o nome da variável.

Clique na coluna Label da linha ID e escreva Código do Inquirido

Clique na coluna Label da linha S1 e escreva Género do Inquirido

Clique na coluna Label da linha S2 e escreva Habilitações Académicas do Inquirido

Clique na coluna Label da linha S3 e escreva Idade do Inquirido

22 INTRODUÇÃO AO IBM SPSS STATISTICS


Clique na coluna Label da linha S4 e escreva Localidade
Clique na coluna Label da linha P1_1 e escreva Utilização do SPSS
Clique na coluna Label da linha P1_2 e escreva Utilização do Excel
Clique na coluna Label da linha P1_3 e escreva Utilização do PowerPoint
Clique na coluna Label da linha P1_4 e escreva Utilização do Word
Clique na coluna Label da linha P2_1 e escreva Conhecimentos de SPSS
Clique na coluna Label da linha P2_2 e escreva Conhecimentos de Excel
Clique na coluna Label da linha P2_3 e escreva Conhecimentos de PowerPoint
Clique na coluna Label da linha P2_4 e escreva Conhecimentos de Word

Figura 26 – Definição de Etiquetas das variáveis (Labels) no separador Variable View

Note-se que a partir deste momento, se o utilizador passar para o Separador Data View (Editor
de Dados) passará a visualizar a Etiqueta da variável quando o cursor e colocado sobre o nome
da mesma, permitindo-lhe assim facilmente saber a designação correcta da variável.

Figura 26 – Visualização das Etiquetas das variáveis no separador Data View

INTRODUÇÃO AO IBM SPSS STATISTICS 23


3.2. ADIÇÃO DE RÓTULOS PARA VALORES NUMÉRICOS (VALUES LABELS)

De forma semelhante, o utilizador pode associar rótulos (descritivos) aos valores numéricos
assumidos pelas variáveis. No exemplo do inquérito utilizado, a variável do género do
inquirido (S1) assume dois valores – o valor 1 significa que o indivíduo é do género feminino e
o valor 2 significa que é do género masculino.

Abra o separador Variable View

Clique na área Values da linha S1 e no respectivo botão para aceder à caixa de diálogo
Value Labels

Figura 27 – Caixa de diálogo de Value Labels

Onde:

Value é o valor numérico assumido pela variável, e

Label é o descritivo (rótulo) aplicado ao valor numérico anteriormente especificado.

Digite 1 no campo Value


Digite Feminino no campo Label
Clique em Add para adicionar o descritivo à lista
Digite 2 no campo Value
Digite Masculino no campo Label
Clique em Add
Clique em OK

Figura 28 – Caixa de diálogo de Value Labels preenchida

24 INTRODUÇÃO AO IBM SPSS STATISTICS


Os rótulos dos valores do género do inquirido, estão agora no Editor de Dados. E da mesma
forma, estes descritivos irão surgir nas análises afectas à variável S1.

Figura 29 – Rótulos dos valores de variáveis visíveis no separador Data View

Com recurso ao menu View ou ao botão Value Labels , será accionada a opção de
visualização dos rótulos dos valores.

Clique em View » Value Lables ou,


Clique no botão Value Labels da barra de ferramentas

Figura 30 – Editor de Dados sem Rótulos dos valores de variáveis activos no separador Data View

Repita o processo para a variável S2 Habilitações Académicas

INTRODUÇÃO AO IBM SPSS STATISTICS 25


3.3. ADIÇÃO DE RÓTULOS PARA VALORES ALFANUMÉRICOS (VALUES LABELS)

O utilizador poderá ainda atribuir rótulos a variáveis alfanuméricas através do método


anteriormente utilizado. Por exemplo, poderão ser utilizadas as letras L e B para identificar a
localidade de residência do inquirido. Os rótulos permitem associar L a Luanda e B a Benguela.

Clique no separador Variable View


Clique na área Values da linha S4 e clique no respectivo botão para aceder à caixa de
diálogo Value Labels
Digite L no campo Value, e Luanda no campo Label
Clique em Add para adicionar o rótulo à lista
Repita o processo, digitando B no campo Value e Benguela em Label
Clique em Add e de seguida em OK para gravar alterações e voltar ao Data View

Figura 31 – Caixa de diálogo Value Labels com listagem alfanumérica

Nota: O utilizador deverá ter em conta que as variáveis alfanuméricas são sensíveis à alteração de letra
maiúscula para minúscula (e vice-versa), bem como com a adição de espaços. O caso classificado com b é
completamente diferente de um caso classificado com B.

3.4. UTILIZAÇÃO DOS RÓTULOS DE VALORES (NUMÉRICOS OU ALFANUMÉRICOS) PARA INTRODUÇÃO


DE DADOS

Ao seleccionar a opção Value Labels no menu View o utilizador optou por visualizar os
rótulos ao invés dos valores introduzidos. Neste sentido, o utilizador poderá recorrer a estes
descritivos na tarefa de introdução de dados. Note-se que só será possível com a opção Values
Labels ( ) seleccionada.

Clique no separador Data View

Coloque o cursor na primeira linha da coluna S4, de um clique e seleccione Benguela


a partir da listagem apresentada

Na mesma coluna, mas na segunda linha, seleccione Luanda a partir da listagem

26 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 32 – Utilização dos rótulos para introdução de dados

Note-se que apenas serão listados os valores previamente definidos, o que permite assegurar
que os dados sejam introduzidos com o formato correcto.

Figura 33 – Visualização dos dados introduzidos com recurso aos rótulos de valores

4. TRATAMENTO DA NÃO RESPOSTA (MISSING VALUES)

A existência de não resposta, ou de resposta inválida, é demasiado vulgar para ser ignorada.
Os inquiridos de um estudo poderão recusar-se a responder a determinadas questões ou
responder erradamente. Neste contexto, a qualidade das análises dependerá da correcta
identificação e tratamento deste tipo de informação.

INTRODUÇÃO AO IBM SPSS STATISTICS 27


Para variáveis numéricas, um campo de dados vazio ou preenchido com um valor inválido é
automaticamente convertido em missing (não resposta). Esta não resposta é denominada
system missing e é representada por um ponto (.) na janela do Editor de Dados.

Os valores de system missing são excluídos de cálculos estatísticos.

System Missing

Figura 34 – Visualização dos system missing

Os inquéritos dão muitas vezes oportunidade aos inquiridos de responder “Não Sabe” ou
“Nenhuma das anteriores” a algumas questões. Nas ciências, na engenharia, na física e
biologia, alguns aparelhos automáticos registam dados que contêm só 9s (por exemplo 999)
quando a medição falha por alguma razão. Nestes casos o SPSS proporciona uma forma de
os tratar como se eles fossem missing.

Para as variáveis alfanuméricas, campos de dados em branco constituem valores válidos e


têm de se declarados como missing values se os quisermos excluir da análise.

Podemos declarar até três códigos como missing values para cada variável (e dois destes
podem definir intervalos de missing values). A razão para serem três códigos para missing será
para normalizar, de alguma forma, os três tipos de respostas mais comuns de valores missing
em inquéritos: “Não aplicável”, “Não sabe”, “Não responde”.

As não respostas são definidas na caixa de diálogo Missing Values, que pode ser acedida
clicando no botão da coluna Missing no separador Variable View.

4.1. DEFINIÇÃO DE NÃO RESPOSTA (MISSING) PARA UMA VARIÁVEL NUMÉRICA

Para demonstrar como definir missing values (uma não resposta) para uma variável numérica,
irá utilizar-se a variável S1 (Género do Inquirido).

Para declara valores como não resposta:

Clique no separador Variable View

Clique na célula da coluna Missing referente à linha S1 e clique no respectivo botão


para aceder à caixa de diálogo de Missing Values

28 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 35 – Caixa de diálogo Missing Values

Por defeito, a opção No missing values encontra-se seleccionada o que, não implica que não
existam missing values para a variável (neste caso o género do inquirido), indica apenas que
nenhuma informação desse tipo foi declarada. A segunda escolha, Discrete missing values, é
a opção mais comum. Aqui, pode-se especificar até três tipos de códigos distintos (discretos)
de não resposta para a variável. Finalmente, Range plus one discrete missing value, permite
declarar como missing values todos os valores contidos num determinado intervalo mais um
valor específico. Estas escolhas resultam numa grande flexibilidade na declaração de missing
values, especialmente se se considerar que esses valores podem ser diferentes para variáveis
diferentes.

Seleccione a opção Discrete missing values

Digite 99 na primeira caixa de texto

Clique em OK para guardar as alterações e voltar ao Editor de Dados

Figura 36 – Preenchimento do Missing Values

Será útil definir um rótulo para o valor anteriormente adicionado como não resposta.

Clique na célula da coluna Values referente à linha S1 e clique no respectivo botão


para aceder à caixa de diálogo Value Lables

Digite 99 no campo Value

Escreva Não Responde no campo Label

Clique em Add para adicionar o descritivo à lista e posteriormente clique em OK para


guardar alterações e voltar ao Editor de Dados

INTRODUÇÃO AO IBM SPSS STATISTICS 29


Figura 37 – Preenchimento da caixa de diálogo Value Lables para variável numérica

Quais quer erros de digitação que ocorram podem ser editados clicando na caixa de texto
correspondente e alterando o valor.

Se mais tarde quisermos desactivar a declaração de missing value, basta regressar a esta caixa
de diálogo e clicar na opção No missing values.

Repita o processo para a variável S2 Habilitações Académicas

Repita o processo para a variável S3 Idade do Inquirido (ter em conta que o inquirido
poderá ter 99 anos, assim utilizar o valor 999 para missing value)

4.2. DEFINIÇÃO DE NÃO RESPOSTA (MISSING) PARA UMA VARIÁVEL ALFANUMÉRICA

Os missing values são declarados para variáveis alfanuméricas através de um processo


semelhante ao das variáveis numéricas, no entanto, contrariamente ao que acontece para os
valores numéricos, os campos vazios não são automaticamente classificados como sytem
missing.

Clique no separador Variable View

Clique na célula da coluna Missing referente à linha S4 e clique no respectivo botão


para aceder à caixa de diálogo Missing Values

Seleccione a opção Discrete missing values

Escreva NR na primeira caixa de texto

Clique em OK ara guardar as alterações

Há que ter especial cuidado para que letras maiúsculas/minúsculas e espaços sejam os
mesmos do que os indicados ao declarar os missing. Por exemplo, se para uma variável
alfanumérica o valor ‘NR’ indica não resposta, então este valor deverá ser introduzido na caixa
de diálogo Missing Values. Note que ‘N R’, ‘Nr’, ‘nR’, ‘nr’, ou ‘n r’ não coincidem com ‘NR’ e não foi
definido correctamente o missing. O espaço vazio poderá também ser considerado como
missing e inclusivamente ser tido como um segundo tipo de não resposta para a variável (neste
caso localidade correspondendo a S4).

30 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 38 – Definição de missing value alfanumérico

Será útil definir um rótulo para o descritivo anteriormente adicionado como não resposta.

Clique na célula da coluna Values referente à linha S4 e clique no respectivo botão


para aceder à caixa de diálogo Value Lables

Digite NR no campo Value

Escreva Não Responde no campo Label

Clique em Add para adicionar o descritivo à lista e posteriormente clique em OK para


guardar alterações e voltar ao Editor de Dados

Figura 39 – Preenchimento da caixa de diálogo Value Lables para variável alfanumérica

5. COPIAR E COLAR ATRIBUTOS DE VARIÁVEIS

Uma vez definidos, os atributos de uma variável podem ser aplicados a outras variáveis.

Clique no separador Variable View

Digite idade_t na linha em branco a seguira P2_4

Clique na coluna Label da linha idade_t e escreva Idade com que começou a
trabalhar

Clique na Coluna Values da linha S3

INTRODUÇÃO AO IBM SPSS STATISTICS 31


Clique Edit » Copy

Clique na coluna Values da linha idade_t

Clique Edit » Paste

Figura 40 – Variável idade_t criada com atributos copiados de S3

Para aplicar atributos a múltiplas variáveis basta seleccionar várias células (clique e arraste até
à célula pretendida)

Figura 41 – Selecção de múltiplas células

e cole através de:

Clique Edit » Paste

32 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 42 – Atributo copiado e colado em várias células

Ao aplicar atributos são automaticamente criadas novas variáveis.

O utilizador poderá, ainda, copiar todos os atributos de uma variável para outra:

Clique no número da linha da variável S1

Clique Edit » Copy

Clique na primeira linha que estiver sem informação

Clique Edit » Paste

Figura 43 – Linha seleccionada

INTRODUÇÃO AO IBM SPSS STATISTICS 33


Figura 44 – Atributos copiados

Todos os atributos da variável S1 foram aplicados à nova variável.

6. GUARDAR OS DADOS

Para guardar um ficheiro de dados do SPSS selecciona-se a janela do Editor de Dados que se
pretende guardar.

Clique na janela *Untitled1.sav [DataSet1] para a seleccionar

Clique em File » Save As

Verifique se se encontra na directoria de trabalho pretendida (neste caso, 04.


Formacao SPSS ISPTEC) em Look in:

Digite o nome pretendido (este caso, Base_Dados) em File name:

Clique em Save

Figura 45 – Caixa de diálogo Save Data As

34 INTRODUÇÃO AO IBM SPSS STATISTICS


Esta caixa de diálo possui, ainda, o botão Variables… que pode ser utilizado para seleccionar
quais as variáveis que o utilizador pretende guardar no novo ficheiro. Por defeito, todas as
variáveis existentes no Editor de Dados são mantidas.

Figura 46 – Ficheiro guardado no Editor de Dados

Note-se que o nome atribuído surge na barra de título da janela do Editor de Dados, alterando-
se de *Untitled1.sav [DataSet1] para Base_dados.sav [DataSet1]. Tal confirma que os dados
foram devidamente guardados.

7. SAIR DO SPSS

Para sair e voltar ao ambiente de trabalho do Windows:

Clique em File » Exit ou Pressione o botão de fecho de janela  no canto superior


direito do ecrã

Figura 47 – Mensagem relativa à opção de guardar os conteúdos da janela de resultados (Output)

Ao sair verá mensagens a questionar se deseja guardar conteúdos de outras janelas que
foram alteradas durante a sessão.

Neste caso, uma vez que não foi efectuada qualquer alteração no editor de Dados (por já ter
sido guardado anteriormente) não será efectuado o pedido para guardar nessa janela. E
aparecerá a questão e se quer guardar a janela de Resultados (Output).

Dado esta não ter sido utilizada proceder-se-á clicando em No

INTRODUÇÃO AO IBM SPSS STATISTICS 35


CAPÍTULO 3 – IMPORTAÇÃO DE FICHEIROS DE DADOS

1. IMPORTAÇÃO DE UM FICHEIRO DE DADOS

Os ficheiros de dados SPSS, que possuem a extensão *.sav, contêm informação anteriormente
gravada neste formato. Para abrir o ficheiro de dados Basa_Dados.sav:

Clique File » Open » Data (por defeito a extensão seleccionada é *.sav)

O IBM SPSS Statistics mostra a caixa de diálogo Open Data (Figura 48) que lhe permite
especificar o nome, directoria e tipo de ficheiro que retende ler. Por defeito, são visualizados
ficheiros de dados SPSS (*.sav). Para abrir o ficheiro Base_Dados.sav, procure a directoria onde
foi guardado e seleccione Base_Dados.sav.

Figura 48 – Caixa de diálogo Open Data

Seleccione o ficheiro Base_Dados.sav e dê um duplo clique ou clique em Open

Desta forma abre-se o ficheiro anteriormente criado.

Relembra-se que os ficheiros de dados são organizados numa matriz, onde as linhas
correspondem a cada caso do inquérito ou questionário, representando uma resposta
individual, e as colunas corresponde às variáveis, sendo cada variável equivalente a uma
questão colocada no inquérito.

Clique em File » Exit ou Pressione o botão  no canto superior direito do ecrã

Clique em No nas restantes janelas para não guardar alterações

2. IMPORTAÇÃO DE FOLHAS DE CÁLCULO (EXCEL)

O utilizador pode importar informação a partir de aplicações como o Microsoft Excel (entre
outros). Neste caso os títulos das colunas podem ser lidos como designações das variáveis,
mas deverão respeitar as regras de especificação de variáveis.

Clique File » Import Data » Excel (ou então pode clicar no botão Open Data )

Seleccione Excel (*.xls, *.xlsx, *.xlsm) na lista Files of type

36 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 49 – Caixa de diálogo Open Data seleccionando o tipo de ficheiros pretendido (Excel)

Seleccione o ficheiro Base_Dados.xlsx

Clique em Open

Figura 50 – Caixa de diálogo Opening Excel Data Source

Nesta caixa de diálogo o utilizador indica qual a folha de cálculo que pretende importar (neste
caso apenas existe uma) e determina se as designações das variáveis estão presentes na
primeira linha do ficheiro (opção por defeito – Read variable names from first row of data).
É ainda possível definir um intervalo de células, relativo aos dados que o utilizador quer
importar (no campo Range).

Dependendo da versão do programa que está a utilizar, deverá assinalar as opções Remove
leading spaces from string e Remove trailing spaces from string values para remover espaços
que possam existir no início e no fim das cadeias de texto (strings) que o ficheiro possa conter.

Clique em OK para concluir a importação

Mesmo que os cabeçalhos das colunas não estejam em conformidade com as regras do SPSS
relativamente à designação das variáveis, estes serão convertidos em designações válidas (e
os cabeçalhos originais serão transformados em descritivos - labels – das variáveis).

Será, então, aberta uma nova janela Data Editor que incluirá os dados importados do ficheiro
Excel.

INTRODUÇÃO AO IBM SPSS STATISTICS 37


Figura 51 – Ficheiro importado a partir de uma folha de cálculo

Clique em File » Exit e No de forma a sair e não gravar o ficheiro

3. EXPORTAÇÃO DE UM FICHEIRO PARA O FORMATO DE FOLHA DE CÁLCULO (EXCEL)

Da mesma forma que é possível importar um ficheiro de Excel para o programa SPSS, o
contrário também é exequível, podendo o utilizador passar um ficheiro de dados SPSS para
uma folha de cálculo do Excel.

Active o ficheiro de dados Base_Dados.sav

Clique File » Save as

Em Save as type escolha Excel 2007 through 2010 (*.xlsx)

ou clique File » Export » Excel (depende da versão do programa)

Figura 52 – Caixa de diálogo Save Data As

38 INTRODUÇÃO AO IBM SPSS STATISTICS


Em Look in localize o caminho de dados para a pasta de trabalho

Especifique a designação do ficheiro (File name) de dados: Exporta_BD

Figura 53 – Caixa de diálogo Save Data As com especificação do tipo de ficheiro Excel

Por defeito, as designações das variáveis serão exportadas para o ficheiro Excel (opção Write
variable names to spreasheet), se a opção não for seleccionada o ficheiro não irá ter um
cabeçalho com a designação das variáveis.

Clique em Save

Figura 54 – Ficheiro de dados exportado para Microsoft Excel

Adicionalmente será listada, num ficheiro de resultados (Output), informação de suporte ao


processo de exportação contendo a identificação das variáveis exportadas bem como a
identificação do seu tipo (numéricas ou alfanuméricas) e do número de caracteres e casas
decimais assumidas.

INTRODUÇÃO AO IBM SPSS STATISTICS 39


Figura 55 – Output resultante do processo de exportação

Clique File » Exit e No para sair e não gravar

Por defeito, quando definidos os value labels são exportados contendo os códigos numéricos
(ou alfanuméricos). Contudo, aquando do processo de exportação o utilizador tem a
possibilidade de optar pela exportação dos descritivos dos atributos das variáveis.

Active o ficheiro de dados Base_Dados.sav

Clique File » Save as

Em Save as type escolha Excel 2007 through 2010 (*.xlsx)

Em Look in localize o caminho de dados para a pasta de trabalho

Especifique a designação do ficheiro (File name) de dados: Exporta2_BD

Seleccione a opção Save value labels where defined instead of data values

Figura 56 – Caixa de diálogo Save Data As com a opção Save value labels… seleccionada

40 INTRODUÇÃO AO IBM SPSS STATISTICS


Clique em Save

Figura 57 – Ficheiro de dados exportado para Excel contendo os descritivos dos atributos das variáveis

Clique File » Close e No para sair e não gravar o ficheiro de resultados (Output)

Por defeito quando um ficheiro de dados SPSS é guardado, tal é extensível a todas as variáveis
do ficheiro. Porém o utilizador pode apenas gravar um subconjunto de variáveis relevante
para determinada análise.

Para tal, será apenas necessário seleccionar a opção “Variables” incluída na caixa de diálogo
Save Data As.

A partir da janela do Data Editor:

Clique File » Save as

Em Save as type escolha Excel 2007 through 2010 (*.xlsx)

Em Look in localize o caminho de dados para a pasta de trabalho

Especifique a designação do ficheiro (File name) de dados: Exporta3_BD

Seleccione a opção Save value labels where defined instead of data values

Clique no botão Variables

Figura 58 – Caixa de diálogo Save Data As: Variables

INTRODUÇÃO AO IBM SPSS STATISTICS 41


Esta caixa de diálogo contém a lista de todas as variáveis presentes no ficheiro de dados.

Por defeito, todas as variáveis existentes no ficheiro serão guardadas, o que será indicado
pelas check boxes seleccionadas da coluna Keep. As variáveis que não estiverem seleccionadas
serão excluídas do ficheiro.

Os botões Keep All e Drop All, permitem que o utilizador inclua (ou exclua) todas as variáveis,
seleccionando depois as que pretende excluir (ou incluir).

Clique em Cancel em Save Data As: Variables

Clique em Cancel para sair da caixa de diálogo de exportação de resultados

Feche o programa e não guarde.

CAPÍTULO 4 – OPERAÇÕES DE TRANSFORMAÇÃO DE DADOS

Os dados que o utilizador pode receber de uma fonte exterior, como por exemplo de
questionários ou entrevistas, podem não estar no melhor formato para o estudo ou para a
análise que se pretende efectuar, e por essa razão, pode ser necessário realizarem-se algumas
transformações ao dados para os adaptar às necessidades reais dos estudos.

Assim, no menu Transform do IBM SPSS Statistics existem diferentes procedimentos para
realizar essas operações. Desta forma, abordar-se-ão alguns dos procedimentos mais
utilizados por um analista de dados.

1. DEFINIR GRUPOS A PARTIR DE UMA VARIÁVEL QUANTITATIVA

São várias as variáveis do ficheiro Demo.sav que foram obtidas a partir da transformação de
variáveis quantitativas.

Por exemplo, a variável Rendimento_cat é constituída por 4 intervalos de rendimento (variável


Rendimento_agregado). Esta variável utiliza códigos 1 a 4 para representar as seguintes
categorias de rendimento: < 25.000; 25.000 – 49.000; 50.000 – 74.000; e  75.000.

Assim, para obter a variável Rendimento_cat a partir da variável Rendimento_agregado:

Abra o ficheiro Demo.sav

Clique Transform » Visual Bining

42 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 59 – Caixa de diálogo inicial de Visual Binning

Na caixa de diálogo inicial o utilizador deverá seleccionar as variáveis (quantitativas ou


ordinais) que serão agrupadas em categorias.

Clique e arraste Rendimento do agregado familiar (milhares)


[Rendimento_agregado] da lista Variables para Variables to Bin

Clique em Continue

Figura 60 – Caixa de diálogo principal de Visual Binning

Seleccione Rendimento do agregado familiar (milhares) [Rendimento_agregado]


em Scanned Variable List (por defeito aparecerá seleccionada, pois só há essa variável)

É apresentado um histograma com a distribuição da variável seleccionada.

INTRODUÇÃO AO IBM SPSS STATISTICS 43


Digite para Binned Variable, Rendimento_cat2 como nome e Rendimento familiar
como descritivo da variável

Clique em Make Cutpoints

Clique em Equal Width Intervals

Digite 25 em First Cutpoint Location, 3 em Number of Cutpoints, e 25 em Width

Figura 61 – Caixa de diálogo de Make Cutpoints (vazia e preenchida)

O número final de categorias será igual ao número de cutpoints + 1. Neste exemplo serão 4
categorias em que, para as 3 primeiras a amplitude dos intervalos será de 25 e o último
intervalo contém todos os valores acima do cutpoint final (75).

Clique em Apply

Figura 62 – Caixa de diálogo principal de Visual Binning com cutpoints definidos

Os valores agora apresentados correspondem aos cutpoints anteriormente definidos. Estes


valores representam os limites superiores dos intervalos gerados. As linhas verticais incluídas
no histograma indicam também a localização dos cutpoints.

44 INTRODUÇÃO AO IBM SPSS STATISTICS


Por defeito, os valores dos cutpoints são incluídos nas categorias correspondentes (neste caso,
25 – valor limite do primeiro cutpoint é incluído no primeiro intervalo). Porém, como se
pretende as categorias <25.000; 25.000 – 49.000; 50.000 – 74.000;  75.000, ter-se-á de excluir
os limites da regra por defeito.

Na área Upper Endpoints, seleccione Excluded (<)

Clique em Make Labels

Esta opção, gera automaticamente os descritivos dos valores para os códigos numéricos
assumidos pelas variáveis. O utilizador poderá, ainda, alterar manualmente os cutpoints e os
respectivos descritivos.

Corrija os valores para milhares de dólares (dado que a variável


Rendimento_agregado não estava assim definida)

Figura 63 – Caixa de diálogo principal de Visual Binning com cutpoints definidos e descritivos dos valores

Clique em OK para ser criada a nova variável

Figura 64 – Variável Rendimento_cat2 no Editor de Dados

INTRODUÇÃO AO IBM SPSS STATISTICS 45


2. CÁLCULO DE NOVAS VARIÁVEIS

O procedimento COMPUTE permite a obtenção de novas variáveis com base em simples ou


complexas expressões matemáticas. Um exemplo simples é criar uma nova variável pela
diferença de duas já existentes.

Dos dados do ficheiro Demo.sav pretende-se obter a idade com que o inquirido começou a
trabalhar no último emprego (ou reformado), para tal terá de ser calculada a diferença entre
a idade actual do individuo e o tempo no trabalho actual.

Se não estiver aberto, abra o ficheiro Demo.sav

Clique Transform » Compute Variable

Figura 65 – Caixa de diálogo de Compute Variable

A caixa de diálogo Compute Variable inclui a caixa Target Variable, onde será definido o nome
da variável, e a caixa Numeric Expression, onde será construída a expressão.

A expressão pode incluir variáveis já existentes, constantes, operadores aritméticos e funções,


e é possível digitar directamente a expressão, ou construí-la a partir dos botões disponíveis.
Adicionalmente, em “If”, poderá especificar um critério para efeitos de criação da variável de
interesse.

Em Target Variable digite Idade_InicioTrabalho

Em Type & Label digite Idade no início da última actividade, e escolha Continue

Seleccione Idade da lista das variáveis e arraste para Numeric Expression

Clique no botão da calculadora no sinal de subtracção ou no teclado

Seleccione Tempo_Trabalho da lista das variáveis e arraste para Numeric Expression

46 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 65 – Caixa de diálogo de Compute Variable com expressão incluída

O SPSS cria a nova variável e coloca-a no final do editor de dados.

Posicione-se na última coluna do Editor de Dados no separador Data View para


visualizar Idade_inicioTrabalho.

Figura 66 – Editor de dados com a nova variável

INTRODUÇÃO AO IBM SPSS STATISTICS 47


3. RECODIFICAR VALORES NUMA NOVA VARIÁVEL

Para algumas análises, o utilizador poderá ter a necessidade de reorganizar as categorias de


variáveis ordinais e nominais. Por exemplo, as categorias “casado”, “viúvo”, “divorciado”,
“separado” e “solteiro” podem ser reorganizadas em duas: “casado” e “não casado”.

Para ilustrar este exemplo, serão convertidos os cinco valores (1 = “Muito insatisfeito”; 2 =
“Insatisfeito”; 3 = “Indiferente”; 4 = “Satisfeito”; 5 = “Muito Satisfeito”) assumidos pela variável
Satisfação no trabalho do ficheiro Demo.sav, em apenas duas categorias: Neutro e Não
Neutro (pretendendo-se saber quais os inquiridos que não são indiferentes às condições de
trabalho).

Se não estiver aberto, abra o ficheiro Demo.sav

Clique em Transform » Recode » Into Different Variables

Coloque Satisfacao_Trabalho na caixa Numeric_Variable -> Output Variable

Digite Nova_Class_SatisTrabalho em Name da área Output Variable e Nova


Classificação Satisfação em Label

Clique em Change

Figura 67 – Caixa de diálogo Recode into Differente Variables

A variável Satisfação_trabalho constitui a base desta recodificação que irá dar origem à nova
variável Nova_Class_SatisTrabalho.

Nota: A opção Recode Into Same Variable poderá também ser utilizada para alterar variáveis já
existentes (Transforme » Recode » Into Same Variable), no entanto, tal operação deve ser utilizada com
alguma precaução, dado que se estará a substituir valores de uma variável existente.

Pretende-se então, gerar duas categorias: “Neutro”, que corresponde ao valor 3 da variável
Satisfação_trabalho; e “Não Neutro”, correspondente aos valores 1, 2, 4 e 5 da mesma variável.

48 INTRODUÇÃO AO IBM SPSS STATISTICS


Clique em Old and New Values

Na caixa de texto Old Value, com Value seleccionado, digite 3

Digite 1 na caixa de texto New Value

Clique em Add

Digite 1 em Value e 0 na caixa de texto New Value

Clique Add

Digite 2 em Value e 0 na caixa de texto New Value

Clique Add

Seleccione a primeira opção Range

Digite 4 para limite inferior e 5 para limite superior

Digite 0 na caixa de texto New Value

Clique Add

Figura 68 – Antigos e novos valores da variável

Nota: A área Old Value inclui vários tipos de especificações: um só valor, um intervalo de valores, valores
system-missing, valores system- or user missing e ainda, a opção All other values. Mesmo que sejam
detectados erros após a operação, as definições poderão ser alteradas (botão Change) ou até removidas
(botão Remove).

A variável Nova_Class_SatisTrabalho assume o valor 0 (“Não Neutro”) quando a variável


Satisfacao_Trabalho assume os valores 1, 2, 4 ou 5, e é igual 1 (“Neutro”) quando
Satisfacao_Trabalho é igual a 3. Todos os outros valores são classificados como system-missing.

Clique Continue

Clique OK

INTRODUÇÃO AO IBM SPSS STATISTICS 49


Figura 69 – Editor de Dados com a variável Nova_Class_SatisTrabalho adicionada

4. RECODIFICAR VALORES NA PRÓPRIA VARIÁVEL

É, também, possível recodificar valores na própria variável. Contudo, dever-se-á ter especial
atenção neste processo, dado que serão substituídos valores da variável existente (alteração
dos dados de origem).

Para exemplificar, será utilizado o ficheiro Demo.sav, e serão recodificados os missing values
da variável internet.

Se não estiver aberto, abra o ficheiro Demo.sav

Clique em Transform » Recode » Into Same Variables

Coloque Internet na caixa Variables (que passa a Numeric Variables)

Figura 70 – Caixa de diálogo Recode into Same Variables

50 INTRODUÇÃO AO IBM SPSS STATISTICS


Clique em Old and New Values

Dado que em Variable View existem dois missing values definidos para esta variável, pode-se
assumir que os user-missing passarão a assumir um novo código.

Seleccione a opção System-or-user-missing em Old Value

Digite 99 na caixa de texto New Value

Clique em Add

Figura 71 – Caixa de Old and New Values de Recode into Same Variables

Clique Continue

Clique OK

Deste modo não só os missing values definidos pelo utilizador, como também os de sistema
passarão a assumir um novo código (99).

Figura 72 – Editor de Dados com a variável internet alterada

INTRODUÇÃO AO IBM SPSS STATISTICS 51


5. AUTOMATIC RECODE

A opção Automatic Recode converte automaticamente variáveis alfanuméricas em numéricas,


criando para isso uma nova variável (numérica). Para tal, o programa SPSS atribui um valor
único e sequencial a cada valor alfanumérico diferente que a variável original possui, e os
valores alfanuméricos transformam-se nos descritivos (labels) dos valores assumidos na nova
variável.

Resumindo, é gerada uma versão numérica de uma variável alfanumérica já existente.

Será exemplificada a criação de uma nova variável a partir da variável original Género do
ficheiro Demo.sav.

Se não estiver aberto, abra o ficheiro Demo.sav

Clique em Transform » Automatic Recode

Coloque Genero na caixa Variable -> New Name

Escreva Sexo na caixa de texto New Name:

Clique no botão Add New Name

Figura 73 – Caixa de diálogo Automatic Recode

Clique em OK

O SPSS ordena as categorias de Genero, atribuindo o valor 1 à primeira categoria, 2 à segunda,


etc… e gera a nava variável Sexo. O utilizador poderá, ainda, seleccionar a ordem a respeitar -
Lowest Value (ordem ascendente) ou Highest Value (ordem descendente). Neste exemplo,
seleccionar-se-á a ordenação a partir do valor mais baixo (opção por defeito).

52 INTRODUÇÃO AO IBM SPSS STATISTICS


Na variável Sexo, cada valor terá como descritivo a categoria referente ao sexo do inquirido.
Esta transformação gera ainda um relatório com a listagem das diferentes categorias
identificadas. Para ver o relatório:

Posicione-se na janela Viewer (Output)

Identifique o item Log na área Contents

Figura 74 – Visão do relatório em Output

Figura 75 – Editor de Dados com a variável original Género e a nova variável Sexo gerada

INTRODUÇÃO AO IBM SPSS STATISTICS 53


6. CONTABILIZAR ATRIBUTOS NUM CONJUNTO DE VARIÁVEIS

O SPSS permite construir novas variáveis com base na contagem de ocorrências de atributos
num conjunto de variáveis existentes. Para cada caso, a nova variável irá traduzir o número
de vezes que determinado valor (ou valores) ocorre num conjunto de variáveis.

No próximo exemplo, e ainda no ficheiro Demo.sav, existe um conjunto de variáveis que


identificam a posse de diversos equipamentos - ter_tv a ter_fax – e pretende-se identificar
quantos equipamentos cada inquirido possui. Ou seja, serão contabilizados todos os códigos
1 (Sim) da referida lista de variáveis (6 equipamentos).

Se não estiver aberto, abra o ficheiro Demo.sav

Clique em Transform » Count Values within Cases

Coloque Equipamentos na caixa Target Variable

Em Target Label escreva Número de Equipamentos

Seleccione de ter_tv a ter_fax para Variables

Figura 76 – Caixa de diálogo de Count Ocurrences of Values within Cases

Na próxima caixa de diálogo deverão ser indicados quais, ou qual, o valor a contabilizar. Neste
exemplo será 1 que é o código para Sim.

Clique em Define Values

Digite 1 na caixa Value

Clique em Continue

Clique em OK

54 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 77 – Caixa de diálogo para escolha de valores a contabilizar

Clique em Continue

Clique em OK

Figura 78 – Editor de Dados com a variável Equipamentos criada

Fechar o programa e guardar

INTRODUÇÃO AO IBM SPSS STATISTICS 55


7. CÁLCULO DE UMA NOVA VARIÁVEL A PARTIR DE OUTRA DE FORMATO DE DATA

A ferramenta Date and Time Wizard permite a obtenção de novas variáveis com base em
valores em formatos específicos de datas ou de tempo. Um exemplo desta situação, é quando
se possui a informação da data de nascimento dos inquiridos e se pretende saber a idade dos
mesmos em anos.

Para exemplificar a questão usar-se-á o ficheiro Palimenta.sav. Desta forma deverá:

Abrir o ficheiro Palimenta.sav

Clique em Transform » Data and Time Wizard

Seleccionar na caixa de diálogo Calculate with dates and times

Clique em Next

Seleccionar na caixa de diálogo Calculate the number of time units between two dates

Clique em Next

Seleccione $TIME (data do dia actual da análise) para a caixa Date 1

Seleccione Q1_6 (variável Data de nascimento) para a caixa minus Date2

Escolha Years na caixa Unit

Em Result Treatment seleccione Truncate to integer

Figura 79 – Caixa de diálogo Date and Time Wizard com definição da nova variável

Clique em Next

Na caixa Result Variable escreva Idade

Na caixa Variable Label escreva Número de anos

Escolha Create the variable now na área Execution

Clique em Finish

56 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 80 – Editor de Dados com a nova variável Idade

Fechar o programa e guardar

CAPÍTULO 5 – MODIFICAÇÕES SOBRE FICHEIROS DE DADOS

São várias as situações em que os utilizadores têm a necessidade de alterar a estrutura dos
dados originais para efectuarem determinadas análises. Tais situações, podem envolver a
ordenação de observações, verificar os casos duplicados, a partição do ficheiro, ou pelo
contrário, a agregação de casos ou variáveis, entre outros.

Seguidamente serão abordadas as situações mais usuais.

1. ORDENAÇÃO DE DADOS

Os ficheiros de dados nem sempre se encontram ordenados no formato desejado. A


ordenação do ficheiro poderá ser efectuada com base em apenas uma, ou em múltiplas
variáveis.

A ordenação de casos (ordenação de linhas num ficheiro de dados) será ilustrada com recurso
a um pequeno ficheiro de transacções financeiras. O ficheiro é pequeno de modo a facilitar a
visualização da acção do procedimento, pois na prática é mais aplicado a ficheiros de grandes
dimensões.

Abrir o ficheiro AccountBalance.sav

INTRODUÇÃO AO IBM SPSS STATISTICS 57


Figura 81 – Ficheiro AccountBalance.sav

O objectivo será ordenar a apresentação de casos por código de cliente (CustID) e pela data
da transacção financeira.

Clique no menu Data » Sorte Cases

Figura 82 – Caixa de diálogo Sort Cases

Nesta caixa é possível seleccionar múltiplas variáveis para efeitos de ordenação e, para cada
variável seleccionada, é também possível controlar a forma de ordenação (ascendente ou
descendente).

A ordem das variáveis em Sort by, determina a ordenação a seguir (isto é, primeiro será a
ordenada a variável que se encontra em primeiro lugar).

Finalmente, em Save Sorted Data, tem a possibilidade de gerar um novo ficheiro de dados
(em formato .sav, contendo os dados ordenados, conforme critérios especificados).

Seleccionar na caixa de diálogo CustID para Sort by

Selecionar Data para Sort by

Altere para Descending em Sort Order para a variável Data

Clique em OK

Nota: Exemplo para ordenar o ficheiro de dados por código de cliente e por data de transacção mais recente.

58 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 82 – Ficheiro AccountBalance.sav ordenado

Se pretender, guarde o ficheiro.

2. IDENTIFICAR CASOS DUPLICADOS

Quando as análises são realizadas com base em ficheiros construídos a partir de dados de
diferentes origens, existe um risco associado à presença de casos duplicados que pode
influenciar os resultados.

O procedimento Identify Duplicate Cases permite identificar casos duplicados recorrendo a


variáveis especificadas pelo utilizador.

Esta situação será demonstrada recorrendo ao ficheiro AccountBalance.sav onde existem 3


casos que a variável Identificação do cliente (CustID) são iguais (G22505), e onde 2 destes
apresentam a totalidade de variáveis exactamente iguais. Além disso o cliente G22789 aparece
2 vezes, mas com valores de balanço e datas diferentes.

Suponhamos que em caso de duplicação de cliente, o analista pretende reter o valor da data
mais recente.
Nota: Neste exemplo apenas será utilizada uma variável de identificação de casos duplicados (CustID), contudo podem ser
utilizadas várias variáveis. O analista poderá até utilizar todas as variáveis para identificar casos exactamente iguais –
duplicação integral de um caso.

Selecionar Data » Identify Duplicate Cases

Coloque CustID na caixa Define matching cases by

Coloque Date na caixa Sort within macthing groups by

Seleccione a opção Move Macthing cases to the top of the file

INTRODUÇÃO AO IBM SPSS STATISTICS 59


Figura 83 – Caixa de diálogo Identify Duplicate Cases

Tendo em conta as opções definidas em Variables to Create, sempre que existam duplicações
o caso mais recente será o caso a reter (Primary Case). Para isso será automaticamente criada
uma nova variável (PrimaryLast) – na qual também se pode alterar o nome – codificada com o
valor 1 (primary) para o caso mais recente e com o valor 0 (duplicate) para casos duplicados.

Os casos únicos (sem duplicações) serão também codificados com o valor 1.

A opção Filter by indicator values activa um filtro para selecção de casos com base na variável
PrimaryLast. Assim, quando seleccionado, os casos duplicados permanecem no ficheiro, mas
não são tidos em conta nas análises estatísticas a efectuar.

Poderá, ainda, ser gerada uma variável que identifica sequencialmente os casos duplicados
(quando activada a opção Sequential count of matching case in each group).

Por defeito, os casos duplicados serão posicionados no topo do ficheiro para uma melhor
visualização dos resultados. É, ainda, produzida uma tabela de frequências que permite
verificar rapidamente o número de casos duplicados (a variável PrimaryLast permite
identificar os casos duplicados).

Clique em OK

Figura 84 – Tabela de frequências para os casos duplicados na janela de Output

60 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 85 – Variável de identificação da duplicação no Editor de Dados

A variável PrimaryLast assume o valor 1 quando o caso é único ou a reter. Para o cliente
G22505 (CustID) o caso mais recente (05/31/2003) será o caso a reter (Primary Case). Já os casos
com datas anteriores estão codificados como duplicados (Duplicate Case). O cliente G22789
segue o mesmo padrão.

Após a identificação e verificação dos casos duplicados, estes poderão ser filtrados, ou até
retirados definitivamente do ficheiro de dados.

Feche o ficheiro de dados.

3. JUNTAR OBSERVAÇÕES DE DOIS FICHEIROS (CASOS)

Ocasionalmente há a necessidade de se juntar informação que se encontra distribuída por


mais do que um ficheiro de dados.

Se todos os dados estão no mesmo formato de ficheiro e contêm os mesmos campos de


informação (variáveis) o software utilizado facilmente os pode juntar, por exemplo através de
um copy-paste como no caso do Excel, ou através de um processo simples do programa que
se está a utilizar. Assim, o ficheiro resultante pode ser lido pelo IBM SPSS Statistics.

Se os ficheiros não se encontram no mesmo formato, ou se nem todos os campos de dados


são comuns aos dois ficheiros, será necessário encontrar-se uma solução diferente e
apropriada.

O SPSS permite, através de uma ferramenta, juntar observações com origem em vários
ficheiros que não são totalmente iguais (mas que contenham em si a mesma informação),
alinhando-os pelos nomes das variáveis e não pela sua ordem ou posição no ficheiro. Assim,

INTRODUÇÃO AO IBM SPSS STATISTICS 61


se as variáveis utilizadas nos dois ficheiros tiverem o mesmo nome, ou se se souber a
correspondência dos nomes das variáveis dos diferentes ficheiros (dado que a informação é
a mesma) o SPSS permite adicionar as observações dos dois ficheiros, e posteriormente
permite a análise estatística do conjunto total da informação.

Proceder-se-á à exemplificação da junção de casos de dois ficheiros gravados em formatos


distintos, um em SPSS e outro em dBASE (extensão .sav e outro em .dbf, respectivamente). E
que apenas contêm a diferença de a variável que assinala o género do inquirido estar
designada de forma diferente: num chamar-se “sex” e no outro se chamar “gender”.

Verificar o ficheiro SPSS

Será aberto, primeiro, o ficheiro Movie3.sav para se verificarem os nomes das variáveis

Clique em File » Open » Data

Posicione-se na directoria 04. Formacao SPSS ISPTEC

Seleccione o ficheiro Movies3.sav

Clique em Open

Figura 86 – Ficheiro de dados Movies3.sav

As designações das variáveis, assim como tipo das mesmas (numéricas ou alfanuméricas)
devem ser consistentes com o segundo ficheiro.

Neste ficheiro, nota-se que a variável que identifica o género do indivíduo se designa por
“gender” (no próximo ficheiro designar-se-á por “sex”). E, embora, seja possível emparelhar ou
alterar o nome das variáveis é mais simples e obtém-se uma menor probabilidade de erro se
os nomes forem iguais desde o início.

62 INTRODUÇÃO AO IBM SPSS STATISTICS


Verificar o ficheiro dBASE

O ficheiro dBASE (Movies4.dbf) contém informação do questionário a 10 inquiridos. As


variáveis são as mesmas, e possuem o mesmo nome, das do o ficheiro SPSS (Movies3.sav)
com excepção de “gender” que neste ficheiro se designa por “sex”.

Clique em File » Open » Data

Posicione-se na directoria 04. Formacao SPSS ISPTEC

Seleccione dBase (*.dbf) na caixa Files of type

Seleccione o ficheiro Movies4.dbf

Clique em Open

Um ficheiro Untitled.sav abre-se, e este corresponde à importação do ficheiro Movies4.dbf


para o formato SPSS (poder-se-á gravar nesta altura com o nome de Movies4.sav). Ficando,
então, dois ficheiros SPSS abertos.

Pode-se, então, verificar se os nomes e o tipo das variáveis são iguais para ambos os ficheiros.
No ficheiro Untitled.sav verifica-se a variável D_R que é um campo da dBASE e deve estar em
branco, e os restantes campos referem-se às questões do inquérito existindo apenas a
diferença do nome da variável referente ao género do indivíduo.

Juntar casos

Neste momento, os dois ficheiros encontram-se aptos para serem utilizados: o editor de
dados contém a informação vinda do ficheiro Movies4.dbf em formato SPSS, tal como o
ficheiro anteriormente aberto, o Movies3.sav.

Para prosseguir com a junção de casos:

Clique em Data » Merge Files

Figura 87 – Opções Merge Files

INTRODUÇÃO AO IBM SPSS STATISTICS 63


Nota: Existem duas opções Add Cases e Add Variables. A primeira junta observações (cases) de dois
ficheiros de variáveis similares. A segunda junta variáveis (variables) de dois ficheiros com observações
semelhantes.

Clique em Add Cases no submenu Merge Files

Neste momento, o analista deverá seleccionar o ficheiro SPSS cujas observações serão
adicionadas ao ficheiro existente no editor de dados SPSS. Quando estão abertas 2 ou mais
janelas o Data Editor, o SPSS necessita saber se o ficheiro a adicionar já está ou não aberto e
qual o seu nome.

Seleccione Movies3.sav

Figura 88 – Caixa de diálogo Add Cases to

Clique em Continue

Abre-se uma nova caixa de diálogo Add Cases From onde à direita Variables in the New Active
Dataset aparecem as variáveis comuns aos dois ficheiros (caso não se queiram manter no
novo ficheiro poder-se-á proceder à sua deslocação para Unpaired Variables), e à esquerda
Unpaired Variables são visíveis as variáveis que não têm correspondência entre os dois
ficheiros. O asterisco (*) ou o sinal de adição (+), que surgem a seguir aos nomes das variáveis
não emparelhadas indicam qual o ficheiro de origem de cada variável (a legenda encontra-se
no canto inferior esquerdo da caixa de diálogo).

Figura 89 – Caixa de diálogo Add Cases From e emparelhamento de variáveis

Sabendo o utilizador que, neste caso, “sex” e “gender” representam a mesma informação
embora não tendo o mesmo nome, pode indicar ao SPSS para emparelhar. Para tal:

64 INTRODUÇÃO AO IBM SPSS STATISTICS


Seleccione sex na lista Unpaired Variables

Clique na tecla CTRL ao mesmo tempo que selecciona gender em Unpaired Variables

Seleccione Pair

Figura 90 – Emparelhamento das variáveis sex e gender

Note que sex e gender aparecem agora juntas na caixa Variables in the New Active DataSet
(sex & gender<) e formarão uma só coluna sob o nome de sex.

Nota: Poder-se-á agora clicar em OK para ter o novo ficheiro no Editor de dados, contudo vai-se aguardar
para se poder explicar a situação seguinte.

Criar uma variável que indique a proveniência dos dados

Ao combinar estes ficheiros, é possível criar uma variável que indique de que ficheiro os casos
são provenientes. Este procedimento nem sempre é necessário, aliás não é na maioria das
vezes, apenas quando se quer efectuar uma comparação entre a proveniência (ficheiro) dos
dados por algum motivo (quando o resultado pode estar relacionado com datas de execução,
grupos de trabalho, localização geográfica dos inquiridos na altura do inquérito… por
exemplo).

Figura 91 – Criar variável de indicação proveniência dos casos em Add Cases From

Seleccione a caixa Indicate case source as variable:

Na caixa em baixo escrever Ficheiro

INTRODUÇÃO AO IBM SPSS STATISTICS 65


Clique OK

Na janela do editor de dados do ficheiro Untitled.sav verificar que agora contém as


observações dos dois ficheiros. Ao deslocar para a direita do ficheiro poderá observar-
se que existe a nova variável Ficheiro. Note-se que a variável Ficheiro está codificada
com “0” nas dez observações (que estavam no ficheiro Movies4.dbf) e “1” para as
restantes que se encontravam no ficheiro Movies3.sav.

Figura 92 – Ficheiro resultante da junção de casos

Guardar o novo ficheiro clicando em File » Save as

Escrever Movies na caixa File Name

Clicar em Save

4. JUNTAR VARIÁVEIS DE DOIS FICHEIROS

Um método diferente de combinar ficheiros é juntar novas variáveis (com informação distinta)
a um ficheiro existente. Por exemplo, os clientes de uma empresa podem ser inquiridos antes
de um novo sistema de distribuição ser lançado e sê-lo novamente um ano depois. Pode
querer conhecer os clientes que retiraram mais benefícios da inovação. Neste caso, se os
dados forem arquivados em dois ficheiros diferentes, devem ser juntos pela identificação do
cliente de modo a permitir calcular a diferenças nas respostas de cada cliente. Uma outra
situação é, por exemplo, querer-se adicionar respostas a um inquérito sobre o
comportamento de compras do cliente, com um outro contendo informação sobre as vendas.

66 INTRODUÇÃO AO IBM SPSS STATISTICS


Resumindo, existem várias situações em que é desejável juntar fontes de informação diversas
sobre os mesmos indivíduos ou observações. E a ferramenta Merge Files » Add Variables do
SPSS permite esta funcionalidade.

Existem 3 formas básicas de juntar variáveis a partir de diferentes ficheiros. Esta distinção é
importante, pois o tipo de junção aplicados aos mesmo dados produzirão resultados
diferentes:

− Junção de um-para-um baseada na ordem: A ordem dos casos em ambos os


ficheiros é usada para fazer corresponder os casos em ambos os ficheiros. É a opção
por defeito se não for encontrada nenhuma variável com o mesmo nome e tipo em
ambos os ficheiros.
− Junção de um-para-um baseada numa chave-única: A correspondência entre os
casos de ambos os ficheiros é feita através de uma, ou mais variáveis-chave. Esta é a
opção por defeito quando existe pelo menos uma variável com o mesmo nome e tipo
em ambos os ficheiros.
− Junção de um-para-muitos baseada numa chave-única: um ficheiro contém os
dados, o outro é uma tabela de referência. Os casos da tabela de referência são juntos
aos casos do ficheiro de dados com base numa variável-chave. O mesmo valor pode
ocorrer várias vezes no ficheiro de dados. Um registo na tabela de referência pode ser
junto a vários casos do ficheiro de dados. Note-se que: (a) todos os casos do ficheiro
de dados são incluídos no ficheiro final; (b) os casos na tabela de referência que não
têm correspondência no ficheiro de dados não são incluídos no ficheiro final; e (c) o
ficheiro com a tabela de referência não pode ter duplicados para os valores da variável
chave.

CONSIDERAÇÕES GERAIS:

1. Importância da ordenação
Para qualquer tipo de junção de variáveis ter sucesso, os ficheiros devem ser ordenados
pela(s) variável(eis) chave. Se os ficheiros não estiverem ordenados a operação falhará.

2. Importância do tipo de ficheiro

Para que o SPSS junte ficheiros adicionando variáveis, ambos os ficheiros devem estar
definidos como ficheiro IBM SPSS Statistics (isto é, em formato *.sav ou estar activo no editor
de dados).

3. Cuidados com os nomes das variáveis

Uma vez que serão juntas variáveis de dois (ou mais) ficheiros é importante utilizar
designações exclusivas para cada variável. Se o mesmo nome da variável é utilizado nos dois
ficheiros o programa só reterá a informação existente num dos ficheiros. Muito embora a
possibilidade de renomear esteja disponível na caixa de diálogo Merge Files » Add Variables, é
mais seguro utilizar designações únicas desde o início.

INTRODUÇÃO AO IBM SPSS STATISTICS 67


Junção por variável chave (opção junção um-para-um baseada numa chave-única, sendo
este exemplo a forma mais usual de juntar variáveis de diferentes ficheiros)

Será, agora, demonstrada a junção por variável chave adicionando variáveis dos ficheiros de
World60.sav e World90.sav, utilizando o nome do país como variável chave para juntar os
ficheiros.

Preparação dos dados de World90.sav

Abrir o ficheiro World90.sav

Posicionar-se no separador Data View (Editor de Dados)

Clicar com botão direito do rato em Name e seleccionar Sort Ascending

Figura 93 – Verificação da ordenação do ficheiro World1990.sav

Não fechar o ficheiro, pois será utilizado para a junção das variáveis.

Preparação dos dados de World60.sav

Abrir o ficheiro World60.sav

Posicionar-se no separador Data View (Editor de Dados)

Clicar com botão direito do rato em Name e seleccionar Sort Ascending

Juntar as variáveis dos dois ficheiros

Neste momento, ambos os ficheiros estão prontos para serem juntos.

Clicar em Data » Merge Files » Add Variables

68 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 94 – Caixa de diálogo Data com as opções de Merge File

Ao clicar em Add Variables, é aberta uma caixa de diálogo intermédia, tal como apresentado
na Figura 95.

Figura 95 – Caixa de diálogo Add Variables

O programa precisa da indicação se as variáveis que se pretendem adicionar se encontram


num ficheiro que já está aberto, ou se pelo contrário, se encontram num ficheiro fechado. O
utilizador através da caixa de diálogo Add Variables dará essa indicação ao SPSS. Neste
exemplo, o ficheiro a utilizar é o Wordl90.sav que á se encontra aberto.

Seleccione Wordl90.sav

Clicar em Continue

Figura 96 – Caixa de diálogo Add Variables from (na versão 25 do SPSS)

INTRODUÇÃO AO IBM SPSS STATISTICS 69


Utilizando a caixa de diálogo Add Variables From o utilizador especifica o tipo de junção que
quer efectuar, as variáveis que quer manter no ficheiro final e o que fazer com as variáveis
com a mesma designação nos dois ficheiros.

No separador Merge Method será definido o tipo de junção.

Seleccionar a opção One-to-One merge base on key values


Nota: neste separador há uma opção que permite ordenar os ficheiros antes da junção. Esta opção é particularmente
útil para os casos em que não existe garantia de que os ficheiros tivessem sido anteriormente ordenados. Contudo,
por uma questão de segurança, dever-se-á sempre ordenar os ficheiros na sua preparação e manter assinalado Sorte
files by key valuebefore merging neste separador.

De forma a concluir a tarefa de junção dever-se-á indicar a variável a utilizar como chave.

No separador Variables da caixa de diálogo Add Variables From o SPSS irá, por defeito, listar
as variáveis a manter no final da junção. Poder-se-á excluir variáveis, caso o utilizador não as
queira considerar, para tal, basta seleccionar e mover para a caixa de Excluded Variables. Após
cada variável na listagem aparece um símbolo (asterisco ou sinal de adição entre parêntesis)
que indica o ficheiro de origem de cada uma das variáveis. Note-se que no canto inferior
esquerdo da caixa de diálogo aparece a legenda desta simbologia.

Nesta caixa de diálogo, verifica-se que para o exemplo em causa, existem duas variáveis na
caixa Key Variables: Name e Region. As duas são colocadas aí, pois os dois ficheiros (o activo e
o “escondido”) apresentam essas variáveis. Uma vez que se definiu a variável Name como a
variável chave para a junção, a variável Region pode ser colocada na caixa de Excluded Variables.

Figura 97 – Caixa de diálogo Add Variables from separador Variables (na versão 25 do SPSS)

Nota: Se se pretender manter ambos os conjuntos de códigos poder-se-á seleccionar a variável Region presente na
lista de Excluded Variables e utilizar o botão Rename para lhe atribuir uma nova designação e inclui-la na caixa Included
Variables.

70 INTRODUÇÃO AO IBM SPSS STATISTICS


No exemplo em causa, como os países do ficheiro Wordl60.sav são um subconjunto dos que
aparecem no ficheiro World90.sav, será de manter os códigos de Region do ficheiro
World90.sav, pois assim haverá códigos de região para todos os países. Se se mantivesse os
códigos de World60.sav, dado que existem menos 18 países do que no outro ficheiro seriam
atribuídos system-missing.

Deslocar Region (+) de Key Variables para Exclued Variables

Assim, os códigos referentes à região a manter serão os do ficheiro World90.sav.

Clicar no botão OK

Figura 98 – Caixa de diálogo de aviso de ordenação

O SPSS emite um aviso relativo ao cuidado a ter na ordenação da variável chave dos dois
ficheiros. Este aviso aparecerá sempre e não quer dizer que exista algum erro.

Clicar no botão OK

Procurar o Editor de Dados correspondente e deslocar o ficheiro para a direita para


verificar que as variáveis de 1990 estão incluídas no ficheiro.

Figura 99 – Editor de Dados após junção de variáveis

Verificar-se-á que vários países (exemplo, Bahrain e Barbados) têm valores em falta para as
variáveis relativas a 1960, pois só existia informação no ficheiro de 1990 mas não no de 1960.

INTRODUÇÃO AO IBM SPSS STATISTICS 71


Tais países mantêm-se no editor de dados mas com valores em falta nos dados relativos a
1960.

Gravar o ficheiro seguindo File » Save As

Digitar World_60_90 na caixa de File Name

Clicar em Save

Gravar e fechar os outros ficheiros

5. SELECÇÃO DE DADOS

O SPSS pode seleccionar temporariamente (filtrar) ou reter somente um determinado


conjunto de observações. Quando o filtro é activado todas as observações permanecem, por
defeito, no editor de dados, mas só aquelas que obedecem ao critério estabelecido são
utilizadas nos vários procedimentos seguintes. As observações não seleccionadas apresentam
um risco sobre o número de linha do editor de dados SPSS.

Se o analista pretende executar uma ou duas análises sobre um subgrupo de observações,


dever-se-á utilizar a opção Filter out unselected cases (filtra observações); se se pretender
executar uma análise exaustiva com as observações seleccionadas, as opções Copy selected
cases to a new dataset (criar um novo ficheiro somente com os casos seleccionados) ou Delete
unselected cases (apaga observações) são mais eficientes.

A selecção de casos é acedida a partir do menu Data, opção Select Cases.

Abrir ficheiro World_60_90.sav (se este estiver fechado)

Clicar em Data » Select Cases

Figura 100 – Caixa de diálogo Select Cases

72 INTRODUÇÃO AO IBM SPSS STATISTICS


Por defeito, todas as observações estão seleccionadas para análise.

Ao escolher a opção If condition is satisfied o analista deverá especificar a condição que as


observações deverão respeitar. Assim, apenas os casos que respeitem essa condição ficam
disponíveis para análise (são seleccionados).

A opção Random sample of cases permite seleccionar uma amostra de observações gerada
por um número pseudo-aleatório.

A opção Use filter variable permite excluir da selecção os casos que apresentam missing ou
valores 0 das variáveis dicotómicas (tipo sim-1; não-0, em que apenas são seleccionados os
valor 1).

Na área Output o utilizador poderá escolher como tratar os casos seleccionados:

• A opção Filter out unselected cases é utilizada quando se pretende que os casos não
seleccionados permaneçam no ficheiro;
• A opção Copy selected cases to a new dataset é utilizada quando se pretende criar
um novo ficheiro que contenha apenas as observações seleccionadas;
• A opção Delete unselected cases é utilizada quando se pretende que as observações
não seleccionadas sejam apagadas do editor de dados.

Como exemplo, para demonstrar a aplicação da funcionalidade do filtro (Select Cases), será
primeiramente aplicado um filtro e depois serão apagadas as observações não seleccionadas.
O critério de selecção será o de seleccionar os países da região North and Central América
(region=2) para os quais a esperança de vida em 1987 (lifeex87) é igual ou superior a 75 anos.

Seleccionar a opção If condition is satisfied

Clicar no botão If…

Digitar region=2 & lifeex87>=75

Figura 101 – Caixa de diálogo Select Cases: If

INTRODUÇÃO AO IBM SPSS STATISTICS 73


O critério de selecção pode ser bastante elaborado, envolvendo múltiplas variáveis,
operadores lógicos, operações aritméticas ou outras várias funções.

Os critérios ou regras de selecção, podem ser escritos directamente na caixa existente para o
efeito, ou criados a partir da lista de variáveis e dos botões da calculadora que aparecem na
caixa de diálogo Select Cases: If.

Clicar em Continue para confirmar a regra

Clicar em OK para aplicar o filtro

Ir para o Editor de Dados

Localizar a última coluna do editor de dados

Posicionar o cursor sobre a nova variável filter_$

Figura 102 – Editor de dados com a nova variável Filter_$ e casos seleccionados

O programa SPSS gerou, no final do ficheiro de dados, uma nova variável filter_$ codificada
com os valores Selected (1) e Not Selected (0), correspondendo à regra ou critérios indicados
(1 indica que satisfaz a regra aplicada).

Note-se que a mensagem Filter On é apresentada na barra de estado (canto inferior direito)
do editor de dados e cada observação (caso) não seleccionada apresenta um traço indicando
que a observação foi filtrada e não fará parte das análises a realizar.

Este filtro manter-se-á activo até que o analista o cancele, seleccionando a opção All Cases na
caixa de diálogo de Select Cases.

Para se demonstrar a utilização da opção Deleted unselected cases:

Clicar em Data » Select Cases (ou no botão )

Seleccionar em Delet unselected cases

Clicar em OK

74 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 103 – Editor de dados após a aplicação do comando Delet unselected cases

O editor de dados apresenta, agora, apenas os casos que respeitam a regra aplicada, neste
caso os países da região 2 com uma esperança de vida em 1987 maior ou igual a 75 anos.

Os resultados das análises serão os mesmos, independentemente do facto de escolher a


opção Delet unselected cases ou Filter out unselected cases. Contudo, com a opção Filter out
unselected cases é muito mais fácil voltar às observações originais (basta seleccionar All cases),
com a opção Delet unselected cases será necessário voltar a ler o ficheiro original, dado que
não se consegue anular (undo) a operação.

Clicar em File » Save » As

Digitar World_60_90_Filtros na caixa de texto File Name

6. AGREGAR INFORMAÇÃO

Muitas vezes, procedimentos estatísticos simples (estatísticas sumárias – Case Summaries),


como por exemplo médias; somatórios; número de casos; entre outros, aplicados a grupos de
observações de um ficheiro, podem ser interessantes de se incluírem no ficheiro original de
dados (por exemplo a dados relativos a consumo de água ou energia per capita por região
num ficheiro nacional).

O SPSS possui a opção Aggregate no menu Data que permite agregar observações com base
numa combinação única de valores, de uma ou mais variáveis de agrupamento e gerar um
novo ficheiro de dados contendo uma observação para cada grupo e cujas estatísticas
sumárias se tornaram em variáveis.

INTRODUÇÃO AO IBM SPSS STATISTICS 75


Para exemplificar esta situação, será utilizado o ficheiro World_60_90.sav e serão agrupados
os países por regiões, especificando a variável população em 1990 (variável que será
agregada) para criar novas variáveis, nomeadamente a média da população de 1990 por
região e o somatório da população de 1990, também por região.

Abrir o ficheiro World_60_90.sav

Seleccionar Data » Aggregate

Figura 104 – Caixa de diálogo Aggregate Data

Na Caixa de diálogo Aggregate Data todas as variáveis do ficheiro World_60_90.sav são


apresentadas na lista de variáveis.

Dever-se-á especificar pelo menos uma variável para agrupamento (Break Variable(s)) que
neste caso será a região (Region) e escolherem-se as variáveis de agregação (Aggregate
Variable(s)) da lista de variáveis apresentada.

Variável(eis) de grupo (Break Variables)

A caixa Break Variable(s) permite definir as variáveis de agrupamento. Deve ser especificada
pelo menos uma. Podem-se utilizar variáveis numéricas e alfanuméricas.

Se se especificar mais do que uma variável de grupo, a ordem de colocação das variáveis é
importante. A primeira variável define o primeiro agrupamento e assim sucessivamente. Tal
determinará a ordem das observações no ficheiro agregado. As combinações de valores das
variáveis de agrupamento definem as observações no ficheiro agregado. Cada combinação
única das variáveis de grupo definirá uma observação. Se num grupo não há observações, o
ficheiro agregado não terá observação para esse grupo.

76 INTRODUÇÃO AO IBM SPSS STATISTICS


Colocar Região [region] na caixa Break Variabl(s)

A caixa Break Variables, inclui agora a variável region. As variáveis de grupo, com os seus rótulos
e outra informação de dicionário, serão arquivadas no ficheiro agregado.

Variáveis agregadas

Ao aplicar-se funções de agregação a variáveis existentes na lista, criam-se as variáveis


agregadas. Estas, bem como as variáveis de grupo serão as variáveis no novo ficheiro
agregado.

Só variáveis numéricas podem ser especificadas como variáveis de agregação.

Pode-se recorrer à mesma variável para agregar, com funções de agregação diferentes
(estatísticas simples diferentes) para serem criadas mais do que uma variável agregada no
novo ficheiro, por exemplo a média e a soma da variável.

Para criar a primeira variável agregada “Média da população em 1990”:

Colocar pop1990 na caixa de Summaries of Variables (por defeito, o nome da variável que
o SPSS atribui à variável agregada é pop1990_mean, pois a função agregação é a média MEAN).

Carregar o botão Name & Label…

Escrever Média da População de 1990

Clicar em Continue

Figura 105 – Caixa de diálogo Aggregate Data: Variable Name & Label

INTRODUÇÃO AO IBM SPSS STATISTICS 77


Para criar a segunda variável agregada “População total em 1990”:

Colocar novamente pop1990 na caixa de Summaries of Variables

Carregar o botão Function

Seleccionar Sum (para alterar a função de média para somatório) na nova caixa de
diálogo (Aggregate Data: Aggregate Funcion)

Figura 105 – Caixa de diálogo Aggregate Data: Aggregate Funcion

Clicar em Continue

Carregar o botão Name & Label…

Escrever População Total em 1990

Clicar em Continue

Para se criar uma variável que contenha o número de observações em cada grupo agregado
(que contribuíram para cada uma das observações), basta seleccionar Number of cases na
caixa de diálogo principal (Aggregate Data).

Seleccionar Number of cases

78 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 106 – Caixa de diálogo Aggregate Data com Number of cases seleccionado

Por defeito o SPSS denomina esta variável de N_BREAK. Neste exemplo o analista sabe que
cada caso é um país, assim pode alterar este nome para NUM_PAISES:

Na caixa Name: substituir o nome escrevendo N_PAISES

A variável N_PAISES (n.º de países) será incluída no ficheiro agregado. Assim, no novo ficheiro
ter-se-á quatro variáveis: a variável de grupo region, as duas variáveis agregadas
pop1990_mean e pop1990_sum e a variável N_PAISES.

Na caixa de diálogo principal (Aggregate Data) existem 3 opções na área Save. O utilizador
poderá optar por adicionar as variáveis agregadas ao ficheiro de dados inicial (esta é a opção
por defeito do programa – Add aggregated variables to active dataset). Contudo, existem
mais duas opções adicionais que permitem a criação de um novo ficheiro de dados com as
variáveis sumariadas para os grupos especificados na área Break Variable(s).

A opção Create a new dataset containing only the aggregated variables vai, na mesma
sessão, abrir uma nova janela do Data Editor deixando inalterado o ficheiro de dados original.
O utilizador poderá fornecer um nome ao novo ficheiro na caixa de texto Dataset name. Ao
escolher esta opção o SPSS não irá gravar automaticamente o novo ficheiro agregado, o que
significa que este deverá ser gravado a partir da janela do editor de dados.

A opção Write a new data file containing only the aggregated variables vai guardar um
ficheiro de dados no formato SPSS com a designação e na directoria que o utilizador
especificar. Por defeito, o nome do ficheiro é aggr.sav sendo direccionado para a directoria

INTRODUÇÃO AO IBM SPSS STATISTICS 79


em que está a trabalhar. O utilizador poderá alterar o nome do ficheiro e/ou a directoria,
clicando no botão File.

No exemplo que se está a seguir, irá ser criado um novo dataset. Para tal:

Seleccionar Create a new dataset containing only the aggregated variables

Escrever Regiões na caixa de texto Dataset

Figura 107 – Caixa de diálogo Aggregate Data para criar o ficheiro agregado

Clicar em OK

Posicionar-se na janela do Data View *Untitled [Regiões]

Figura 108 – Novo ficheiro agregado – Data View

80 INTRODUÇÃO AO IBM SPSS STATISTICS


Nota-se que há uma observação para cada grupo definido pela variável de grupo. Assim
existem sete observações, uma para cada região. O utilizador pode, ainda, verificar as
características das novas variáveis no separador Variable View.

Note-se que o SPSS utiliza, por defeito, o formato F8.2 (8 caracteres e 2 casas decimais) para
as novas variáveis agregadas. A Variável N_PAISES é definida como variável numérica com sete
caracteres inteiros. Tanto o descritivo como a codificação da variável region foram transferidos
para o ficheiro agregado.

Figura 109 – Novo ficheiro agregado – Variable View

Adicionar variáveis agregadas por região ao ficheiro original

Por vezes o analista pretende comparar as diferenças dos dados não agregados (originais)
com os obtidos na agregação, no caso do exemplo em curso, poder-se-á querer comparar os
valores da população dos diferentes países com as médias populacionais da região onde estão
inseridos, ou até mesmo comparar a população total de cada país com a população total da
região. Para tal há que juntar as variáveis agregadas ao ficheiro inicial (original). Para tal:

Abrir ou posicionar-se na janela do Data Editor do ficheiro World_60_90.sav

Seleccionar Data » Aggregate (se não se tiver fechado o ficheiro, a caixa de diálogo
manteve as especificações anteriores, que poderão ser reutilizadas agora). A região é,
novamente, a variável pela qual os valores serão agregados e as variáveis agregadas
serão pop1990_mean e pop1990_sum, tal como aparecerá a variável de contagem de
número de países.

Na área referente a Save alterar para Add aggregated variables to active dataset

INTRODUÇÃO AO IBM SPSS STATISTICS 81


Figura 109 – Caixa de diálogo Aggregate Data para adicionar variáveis ao ficheiro de dados activo

Seleccionar OK na caixa de diálogo

Figura 109 – Editor de dados do ficheiro original após a junção de variáveis agregadas

Note-se que para países da mesma região as novas variáveis (as agregadas) assumem valores
iguais, independentemente do país em questão (pois as variáveis referem-se a valores da
população – média e somatório – das regiões). Desta forma, a partir deste momento poder-
se-ia verificar como cada país se comporta face à região onde está inserido.

Clicar em File » Save

82 INTRODUÇÃO AO IBM SPSS STATISTICS


CAPÍTULO 6 – ANÁLISE DESCRITIVA DE DADOS

Neste capítulo será reforçada a apresentação das unidades de medida de uma variável SPSS
e a forma como influenciam os tipos de análise estatística a serem utilizadas. Serão, também,
apresentados diversos procedimentos de análise descritiva dos dados.

1. ESCALAS DE MEDIDA

As variáveis SPSS podem ser agrupadas em dois grandes grupos (Variáveis Qualitativas e
Quantitativas). A cada grupo está associado uma escala de medida, ou seja, ou são variáveis
categóricas (cada unidade representa uma categoria) ou são variáveis contínuas (cada
unidade representa um valor numérico na escala de valores infinitos):

Variáveis Qualitativas (Categorical): A informação é limitada a um dado número de


categorias (por exemplo, variáveis tipo ‘género’, ‘estado civil’, ou ‘escala de satisfação’). Este
tipo de variáveis tanto pode assumir o formato alfanumérico (string) como numérico (em que
os códigos numéricos representam categorias, por exemplo 0=Feminino e 1=Masculino). Estas
variáveis qualitativas subdividem-se em:

▪ Nominal – Informação qualitativa em que as respectivas categorias não possuem


nenhuma ordem específica (por exemplo, é indiferente o posicionamento das
categorias da variável ‘género’, isto é, não é importante atribuir a uma das categorias
o 0 ou o1).
▪ Ordinal – Informação qualitativa para a qual os respectivos valores assumem uma
determinada ordem, com uma diferença desconhecida entre valores adjacentes. (Por
exemplo, numa escala de satisfação é usual que a categoria ‘muito insatisfeito’
corresponda ao valor mais baixo da escala enquanto que a categoria ‘muito satisfeito’
corresponda ao valor mais alto. Da mesma forma para variável ‘nível de ensino’ em
que existe uma ordenação específica desde a ‘pré-primária’ até ao grau de
‘doutorado’).

Variáveis Quantitativas (Scale): A informação é medida numa escala de intervalo ou ratio,


para a qual uma variação unitária representa a mesma diferença em toda a escala. São
exemplos as variáveis: idade, rendimento, volume de vendas, etc.

Nota:

Estatísticas apropriadas

Para cada tipo de variável existe assim um tipo apropriado de método para averiguar acerca da
tendência central. Por tendência central quer se indicar um valor que melhor caracterize a distribuição
da variável. Note-se que as variáveis medidas numa escala contínua, como scale, podem utilizar medidas
da tendência central de variáveis categóricas. No entanto, as mais utilizadas (segundo o tipo de variável)
são:

INTRODUÇÃO AO IBM SPSS STATISTICS 83


Escala de Medição: Medida da Tendência Central mais utilizada

Nominal Moda: O valor mais frequente numa distribuição

Ordinal Mediana: O valor que divide a distribuição de respostas em dois


grupos de dimensão igual (o valor do percentil 50)

Scale Média: A média aritmética da distribuição

2. TABELAS DE FREQUÊNCIAS

ESTATÍSTICAS DESCRITIVAS PARA VARIÁVEIS QUALITATIVAS

Para variáveis qualitativas uma listagem de casos e percentagem de cada categoria é muitas
vezes suficiente para se conhecer a sua frequência. Para estas variáveis poderemos também
obter a moda (o valor mais frequente) e, caso estejamos perante uma variável ordinal,
poderemos ainda obter a mediana.

A partir do procedimento Frequencies o analista poderá obter tabelas de frequências com o


número de casos e percentagens para os valores observados.

Abrir o ficheiro Demo.sav

Seleccionar Analyse » Descriptive Statistics » Frequencies

Seleccionar as variáveis ‘Tem PDA’ [ter_pda] e ‘Tem TV’ [ter_tv] e desloca-las para a
área Variable(s)

Figura 110 – Caixa de diálogo Frequencies preenchida

Clicar em OK

Ir para a janela *Output 1

84 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 111 – Distribuição das respostas às questões ‘Tem PDA’ e ‘Tem TV’ na janela de Output

As tabelas de frequência são apresentadas na janela SPSS Viewer (Output). A tabela de


estatísticas (Statistics) produzida por Frequencies indica a quantidade de casos válidos e
missing para cada variável na análise de frequências. No exemplo, nenhuma das variáveis tem
missing values.

As tabelas de frequências (‘Tem PDA’ e ‘Tem TV’) contêm:

▪ O descritivo da variável e dos valores que esta assume (ou nome da variável caso esta
não tenha descritivo);
▪ O identificador Valid na primeira coluna indica que valores são válidos (para cada
categoria de resposta). O identificador Missing precede as linhas que representam
missing values, caso existam.
▪ A segunda coluna representa a frequência de casos para cada categoria.
▪ A terceira coluna apresenta a percentagem de casos para as várias categorias.
▪ A quarta coluna apresenta a percentagem de casos válidos das categorias, baseada
no seu total. Caso não existam missing values, como no exemplo, os valores da terceira
e da quarta coluna são iguais.
▪ A quinta coluna indica a percentagem acumulada para os valores registados. É
calculada somando as percentagens válidas dos valores com as percentagens
acumuladas dos valores anteriores.
▪ Os totais aparecem na última linha das tabelas de frequências.

Nota:

Caso antes de clicar em OK na caixa de diálogo Frequencies tivesse sido seleccionado o botão Statistics, poder-se-ia
seleccionar outros cálculos estatísticos (por exemplo de medidas centrais como a média, mediana, moda e
somatório). E estes seriam apresentados num quadro separado chamado Statistics.

INTRODUÇÃO AO IBM SPSS STATISTICS 85


Figura 112 – Caixa de diálogo Frequencies (botão Statistics) e Caixa de diálogo Frequencies: Statistiscs

GRÁFICOS PARA VARIÁVEIS QUALITATIVAS

É comum, em apresentações ou relatórios, representar graficamente a informação da tabela


de frequências. Os gráficos de barras e os gráficos circulares são eficazes se visualizar a
distribuição de valores para uma variável nominal ou ordinal. No SPSS poder-se-á utilizar o
botão Charts na Caixa de diálogo de Frequencies para especificar o tipo de gráfico pretendido.

No ficheiro Demo.sav

Seleccionar Analyse » Descriptive Statistics » Frequencies

Seleccionar as variáveis ‘Tem PDA’ [ter_pda] e ‘Tem TV’ [ter_tv] e desloca-las para a
área Variable(s)

Clicar em Charts…

Seleccionar Bar Charts (para obter gráficos de barras)

Figura 113 – Caixa de diálogo Frequencies (botão Charts…) e Caixa de diálogo Frequencies: Charts

Escolher o botão Continue

Clicar em OK

86 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 114 – Gráfico de barras em SPSS Viewer (janela Output)

ESTATÍSTICAS DESCRITIVAS PARA VARIÁVEIS QUANTITATIVAS

Uma tabela de frequências ou um gráfico de barras para uma variável contínua torna-se
menos perceptível para analisar a informação. Por norma, o analista (para este tipo de
variáveis) opta por representar a distribuição das frequências das variáveis através de um
histograma. O histograma agrupa valores adjacentes e mostra uma barra no ponto médio do
grupo. Exemplificando:

No ficheiro Demo.sav

Seleccionar Analyse » Descriptive Statistics » Frequencies

Seleccionar o botão Reset (para voltar às definições iniciais da caixa de diálogo)

Seleccionar a variável Rendimento do agregado familiar [Rendimento_agregado] e


desloca-la para a área Variable(s)

Figura 115 – Selecção da variável Rendimento do agregado familiar

INTRODUÇÃO AO IBM SPSS STATISTICS 87


Clicar no botão Statistics…

Seleccionar Mean, Median, Std. Deviation, Minimum e Maximum

Figura 116 – Selecção de cálculos estatísticos na caixa de diálogo Frequencies: Statistics

Escolher o botão Continue

Clicar em OK

Figura 116 – Tabela com as estatísticas solicitadas e tabela de frequências para a variável Rendimento
do agregado familiar

88 INTRODUÇÃO AO IBM SPSS STATISTICS


Nota: A tabela de frequências é muito extensa, pois indica o número de vezes que um dado valor da variável contínua
se repete (a frequência) para o total de 6400 casos. Tal facto poderá tornar a sua leitura difícil e a tabela das estatísticas
que foram solicitadas serve, por si só, para o analista interpretar os resultados. Assim, poder-se-á optar por não
solicitar a apresentação da tabela de frequências. Para tal, na caixa de diálogo Frequencies bastará desseleccionar a
opção Display frequency tables.

Para as variáveis contínuas a informação contida na tabela Statistics dispensa a produção de


uma tabela de frequências. Algumas vezes, a tabela de frequências para este tipo de variáveis
não é legível porque se torna muito extensa por apresentar a frequência de cada valor que a
variável assume.

No exemplo exposto existe uma grande diferença entre a média e a mediana. Tal constitui um
indicador que os valores não têm uma distribuição normal. O utilizador poderá confirmar esta
situação através da visualização de um histograma.

HISTOGRAMAS (GRÁFICOS) PARA VARIÁVEIS QUANTITATIVAS

Seguindo o mesmo exemplo…

No ficheiro Demo.sav

Seleccionar Analyse » Descriptive Statistics » Frequencies

Seleccionar a variável Rendimento do agregado familiar [Rendimento_agregado] e


desloca-la para a área Variable(s) (já deverá aparecer, pois continua-se com o mesmo
exemplo)

Clicar o botão Charts

Seleccionar Histograms e a opção show normal curve on histogram (para aparecer


a curva de distribuição normal)

Figura 117 – Caixa de diálogo Frequencies: Charts preenchida

Escolher o botão Continue

Clicar em OK

INTRODUÇÃO AO IBM SPSS STATISTICS 89


Figura 118 – Histograma da variável Rendimento do agregado familiar na janela Viewer

Poder-se-á, facilmente, verificar que a maior parte das observações se situa abaixo dos
100.000 e existem poucos casos acima de 400.000. Como os casos com valores mais elevados
têm um efeito significativo na média, mas pouco ou nenhum efeito na mediana, é este último
indicador o melhor para descrever a tendência central desta situação.

3. PROCEDIMENTO DESCRIPTIVES

Para além do procedimento Frequencies existe outro modo de obter no SPSS estatísticas
descritivas para as variáveis numéricas. É o chamado procedimento Descriptives.

Por defeito, o procedimento Descriptives apresentará a média, o desvio padrão, o mínimo, o


máximo e o número de observações válidas para cada variável numérica. Enquanto a média
e o desvio padrão não são relevantes para variáveis nominais, os valores mínimos e máximos
assinalarão qualquer valor para além dos limites associados a determinada variável.

Se o número de observações válidas é notoriamente pequeno para uma determinada variável,


esta deverá ser analisada em detalhe. Como o procedimento Descriptives só fornece
estatísticas sumarizadas não nos indicará quais as observações que contêm valores
superiores aos limites pré-estabelecidos. Contudo, essas observações podem facilmente ser
identificadas uma vez que esses valores são conhecidos. O procedimento Case Summaries
pode ser utilizado para este propósito.

90 INTRODUÇÃO AO IBM SPSS STATISTICS


O procedimento Descriptives pode ser executado no sistema de menus do SPSS escolhendo
‘Analyse » Descriptive Statistics » Descriptives’ e seleccionando variáveis na Caixa de diálogo
Descriptives.

No ficheiro Demo.sav

Seleccionar Analyse » Descriptive Statistics » Descriptives

Seleccionar as variáveis Idade [idade], tempo de residência na actual morada


[tempo_residencia], Rendimento do agregado familiar [Rendimento_agregado] e
Internet [internet]

Figura 119 – Caixa de diálogo Descriptives

Nota: Apenas as variáveis numéricas estão disponíveis na caixa de diálogo Descriptives.

Clicar em OK

Figura 120 – Estatísticas descritivas com o procedimento Descriptives na janela de Output

INTRODUÇÃO AO IBM SPSS STATISTICS 91


A coluna N contém o número de observações válidas para cada variável presente na tabela.
Poder-se-á observar variações no número de observações válidas – a maior parte das variáveis
têm 6400 observações, mas Internet (se o inquirido tem acesso à internet) tem apenas 6145
observações válidas.

Estão também informações sobre o mínimo, o máximo, a média e o desvio padrão de cada
variável em análise.

4. CASE SUMMARIES

Muitas vezes o primeiro passo na verificação dos introduzidos anteriormente no computador


é visualizar as primeiras observações e compará-las com os formulários originais, pois poder-
se-ão detectar muitos erros grosseiros (geralmente cometidos por lapsos) na definição dos
dados. Esta visualização poderá ser facilmente efectuada utilizando o procedimento Case
Summaries.

O procedimento Case Summaries pode listar os valores de cada observação das variáveis
seleccionadas. Por exemplo, para o ficheiro Demo.sav, poder-se-á visualizar os valores das
primeiras 10 observações relativas às variáveis criadas:

No ficheiro Demo.sav

Seleccionar Analyse » Reports » Case Summaries

Colocar Categoria de rendimento, Categoria do automóvel principal, e Tempo no


trabalho actual (anos) na lista de variáveis a analisar

Localizar em Limit cases to first e digite 10 (lista os primeiros 10 casos do ficheiro)

Figura 121 – Caixa de diálogo Cases Summaries

92 INTRODUÇÃO AO IBM SPSS STATISTICS


Clique em OK

Figura 121 – Output de Cases Summaries para os primeiros 10 casos

No exemplo, podem-se observar os dados dos 10 casos para as variáveis seleccionadas. E


pode-se verificar que existem 10 observações válidas para todas as variáveis (na primeira
tabela do Output e na última linha da segunda tabela) e que os dados estão correctamente
inscritos na base de dados (segunda tabela – Cases Summaries).

A tabela intitulada Case Processing Summary informa o número de observações válidas para
as variáveis escolhidas nos 10 primeiros casos seleccionados.

A tabela denominada por Cases Summaries revela os valores assumidos pelas variáveis nos
10 casos seleccionados.

5. PROCEDIMENTO EXPLORE

Este procedimento é adequado para analisar com maior detalhe variáveis contínuas.

Esta análise só é aplicável a variáveis quantitativas. E, o resultado obtido inclui, por defeito,
uma série de medidas como a média aritmética, a média aparada a 5% e intervalos de
confiança.

O interessante nesta função reside também na possibilidade de efectuar testes da


normalidade, extrair histogramas e ainda detectar Outliers.

No ficheiro Demo.sav

Seleccionar Analyse » Descriptive Statistics » Explore

colocar a variável Idade [idade] na caixa Dependent List

INTRODUÇÃO AO IBM SPSS STATISTICS 93


Figura 122 – Caixa de diálogo Explore

As variáveis a analisar (descrever) aparecem na caixa Dependent List. A caixa Factor List pode
conter uma ou mais variáveis categóricas e, se utilizada, obriga à apresentação de resultados
estatísticos para cada subgrupo definido pelas variáveis aqui colocadas. Pode-se, ainda,
especificar quais as estatísticas e gráficos a apresentar, utilizando os botões Statistics e Plots
(por defeito apresentam estatísticas descritivas e gráficos).

UTILIZAÇÃO DOS ‘MISSING VALUES’

Normalmente o SPSS exclui observações com não respostas (‘missing values’) da execução de
alguns procedimentos. É o caso do procedimento Explore.

Quando se utilizam várias variáveis o analista tem a opção de escolher se a análise deve ser
realizada só com as observações com valores válidos em todas as variáveis em estudo
(chamada ‘listwise deletion’) ou se as não respostas devem ser excluídas separadamente para
cada variável (chamada ‘pairwise deletion’). Quando se considera só uma variável qualquer
destes métodos gera um mesmo resultado, mas essa resposta não será a mesma quando se
estudam várias variáveis. Por defeito o método proposto é o ‘listwise deletion’.

A opção ‘Report values’ é raramente utilizada. Permite a inclusão das não respostas definidad
pelo analista (‘user missing values’) nas tabelas de frequências, mas exclui-as dos gráficos e das
estatísticas descritivas.

Seleccionar o botão Options

Figura 123 – Caixa de diálogo Explore (botão Options) e Explore: Options com ‘Missing values’

94 INTRODUÇÃO AO IBM SPSS STATISTICS


Clicar no botão Continue

Seleccionar OK

Figura 124 – Janela Viewer com resultados de Explore para a variável idade

Para além da tabela ‘Case Processing Summary’ que no exemplo indica que não existem missing
values, este procedimento fornece informação estatística para a variável escolhida (Idade).

INTRODUÇÃO AO IBM SPSS STATISTICS 95


Assim, aparecem várias medidas de tendência central, de dispersão e de distribuição. Bem
como representações gráficas da variável (Gráfico Stem & Leaf e Gráfico Box & Whisker).

A. Medidas de tendência central

‘Mean’ é a média aritmética.

‘Median’ é o valor no centro da distribuição, ou seja, metade dos valores são maiores
que, e metade dos valores são menores que o valor da mediana (valor do caso no meio
da amostra). As medianas são resistentes aos valores extremos e, por isso, são
consideradas medidas robustas da tendência central.

‘5% trimmed mean’ é a média calculada após se ter retirado os valores que se
encontram nos extremos 5% superior e 5% inferior. Esta medida será resistente a
pequenos números ou a extremos com valores muito elevados.

Nota: Estas três medidas no exemplo têm valores muito próximos (entre 41 e 42,06). Se a média
fosse consideravelmente superior ou inferior à mediana e à ‘trimmed mean’, tal sugeria uma
distribuição assimétrica ou enviesada (‘skewed’). Numa distribuição perfeitamente simétrica, por
exemplo a normal, os valores seriam iguais nas três medidas de tendência central.

B. Medidas de dispersão

O procedimento Explore informa, igualmente, várias medidas sobre a variação entre


os inquiridos. Indicam até que ponto tendem as observações a distribuírem-se
próximo do centro da distribuição.

São apresentadas duas medidas de dispersão – o ‘Std. Deviation’ (desvio padrão) e a


‘Variance’ (variância) que é a raiz quadrada do desvio padrão.

Um desvio padrão de 0 indica que todas as observações possuem o mesmo valor


(variação é 0). O ‘Std. Error’ (erro padrão) é o valor estimado do desvio padrão da
média se se utilizarem amostras com a mesma dimensão repetidamente. O erro
padrão é utilizado para cálculo do intervalo de confiança de 95% da média da amostra.

Aparece, também, informação sobre a amplitude interquartil – ‘Interquartil Range’,


que é essencialmente a amplitude entre os valores dos quartis 25% e 75%. Esta
informação representa 50% de observações intermédias da amostra. É uma medida
de variabilidade mais resistente a valores extremos que o desvio padrão.

Também fornece informação sobre o valor ‘Minimum’ e ‘Maximum’ (valores mínimo


e máximo) e a amplitude – ‘Range’. É sempre útil reparar nos mínimos e máximos para
assegurar que não existe nenhum valor (número) impossível (no exemplo dado de
idade valores inferiores a 18 e por exemplo 150 anos).

C. Intervalo de confiança para a média

O intervalo de confiança de 95% (chamado simplesmente de intervalo de confiança)


indica que se se fizer um estudo repetidamente, seja expectável em média que num
intervalo de confiança de 95% esteja incluída a média da população em cerca de 95%
das vezes.

96 INTRODUÇÃO AO IBM SPSS STATISTICS


É útil na medida em que conjuga medidas de tendência central (média) e de variação
(erro padrão da média) para informar onde é expectável que se situe a média da
população. No exemplo dado o intervalo de confiança para a média é muito próximo
(41,76 – 42,36) o que dá a ideia precisa da média da população para a idade dos
inquiridos (respondentes).

D. Medidas de distribuição

‘Skewnwess’ e ‘Kurtosis’ informam sobre a forma da distribuição dos dados.

Enquanto para muitos utilizadores bastará visualizar os histogramas para ajuizar a


distribuição da variável, outros recorrem a estas medidas que quantificam a forma da
distribuição.

‘Skewnwess’ é uma medida da simetria da distribuição. Por definição uma distribuição


simétrica tem uma ‘skewnwess’ de zero. ‘Skewnwess’ positivo indica uma longa cauda
à direita na curva de distribuição; ‘Skewnwess’ negativo indica o padrão inverso.
Também é apresentado o ‘Standard error of skewness’ que pode ser utilizado para
determinar se os dados estão significativamente enviesados (‘skewed’). No exemplo
dado sobre a idade, o valor de ‘Skewnwess’ é positivo, pelo que a curva de distribuição
apresenta uma cauda à direita.

‘Kurtosis’ é uma medida de forma da distribuição que caracteriza o achatamento da


curva (sobre quantos dados que são considerados próximo do centro da distribuição).
Por definição a curva normal tem um ‘kurtosis’ de zero. Uma curva com ‘kurtosis’
positivo é mais alta (afunilada) e concentrada que a distribuição normal, pelo contrário
se for negativo a curva será mais achatada.

E. Gráfico Stem & Leaf

O gráfico ‘Stem & Leaf’ é criado a partir de um histograma, mas utiliza valores como
símbolos gráficos. A forma da distribuição é representada e o gráfico pode ser lido
para obter valores específicos.

Figura 125 – Gráfico ‘Stem & Leaf’ para a variável idade

INTRODUÇÃO AO IBM SPSS STATISTICS 97


Num gráfico ‘Stem & Leaf’ (caule e folha) o ‘Stem’ é o eixo vertical e os ‘Leaves’ (plural de ‘leaf’)
são as partes horizontais que saem do ‘stem’.

O comprimento do ‘stem’ (caule ou ramo) indica como interpretar as unidades no


‘stem’, no exemplo idade, cada ‘stem’ representa 10 anos. Um comprimento de 10
indica que o valor de ‘stem’ deverá ser multiplicado por 10 para reproduzir as unidades
originais da análise.

Os números presentes no gráfico (como ‘leaves’ ou folhas) representam as casas


decimais extra existentes nos valores. Assim, para além de se visualizar a distribuição
também é fornecido valores específicos. Sob o gráfico é apresentada uma nota que
indica que cada ‘leaf’ representa dez observações. É ainda indicado um símbolo ‘&’
para identificar um ‘leaf’ parcial.

A última linha identifica os ‘outliers’ (quando existem). Estes são pontos afastados do
centro que podem merecer algum cuidado de verificação. Os pontos extremos podem
ser erros ou possivelmente representar um subgrupo separado. Se o gráfico ‘Stem &
Leaf’ fosse mais extenso de modo a incluir os ‘outliers’ seria visível o ‘skewness’ positivo
do exemplo.

Resumindo o gráfico ‘Stem & leaf’ descreve os dados mostrando todas as observações

F. Gráfico Box & Whisker


Este gráfico, também chamado de caixa e bigode, representa apenas algumas
medidas estatísticas e informa sobre a distribuição de uma variável. Nele também se
identificam os ‘outliers’ (valores afastados do centro da distribuição).

Figura 126 – Gráfico ‘Box & Whisker’ para a variável idade

No gráfico, alinha sólida dentro da caixa representa a mediana.

Os ‘hinges’ são os limites superiores e inferiores da caixa e correspondem aos quartis


75% e 25% da variável. Ou seja, a caixa representa os 50% intermédios da variável,
também conhecida por amplitude interquartil ou IQR.

Os ‘whiskers’ (bigodes) são os últimos valores que cabem no espaço definido do


gráfico. Valores que estejam para além deste espaço encontram-se de tal forma
afastados do centro que devem ser considerados ‘outliers’ e seriam representados

98 INTRODUÇÃO AO IBM SPSS STATISTICS


com um círculo ou com um asterisco (neste último caso, os casos afastados mais de 3
comprimentos da caixa a cada ‘higine’).

No exemplo da variável idade, não existem ‘outliers’.

6. CROSSTABS

As tabelas de contingência apresentam a relação entre duas ou mais variáveis qualitativas


(nominais e ordinais). A dimensão da tabela é determinada pelo número de valores que cada
variável assume, com cada célula da tabela a representar uma combinação de valores.

As medidas estatísticas apropriadas para análise são as percentagens e o número de casos


em cada célula. Poder-se-á, ainda, requisitar testes estatísticos para determinar se existe, ou
não, relação entre as variáveis da tabela.

Por exemplo, poder-se-á querer conhecer-se os condicionalismos que levam o consumidor a


comprar. Provavelmente o dinheiro que este tem para gastar pode ser a principal razão de
não se efectuar a aquisição de um dado equipamento… No ficheiro Demo.sav será analisada
a relação entre o nível de rendimento e a posse de um PDA.

Abrir o ficheiro Demo.sav, se este estiver fechado

Seleccionar Analyse » Descriptive Statistics » Crosstabs

Nota: A especificação mínima para uma Crosstabs é uma variável em linha e uma variável em coluna. É
de alguma forma arbitrária a colocação das variáveis em linha ou em coluna.

Clicar em Categoria de rendimento [Rendimento_cat] e colocar em Row(s)

Clicar em Tem PDA [ter_pda] e colocar em Column(s)

Clicar em OK

Figura 127 – Caixa de diálogo Crosstabs para se proceder a uma tabela

INTRODUÇÃO AO IBM SPSS STATISTICS 99


Figura 128 – Tabela de contingência (categoria de rendimento e Tem PDA)

São produzidas duas tabelas na Janela de Resultados (Output Viewer). A primeira tabela, ‘Case
Processing Summary’ apresenta o número de casos válidos da tabela. A segunda, é a verdadeira
tabela de contingência. As células apresentam o número de casos para cada combinação das
categorias das variáveis. Por exemplo, 455 inquiridos com rendimento entre $25.000 e
$49.000 têm PDA.

Contagens vs percentagens

O propósito de criar uma tabela de contingência é sem dúvida o de estudar as relações entre
variáveis. Neste sentido torna-se difícil analisar a tabela somente com o número de dados.
Normalmente são incluídas percentagens de forma a melhorar a leitura da tabela. O tipo de
percentagem requisitada – em linha ou em coluna – será determinado pelo utilizador.

Na tabela Categoria de rendimento por Tem PDA, pode interessar perceber qual a influência
do rendimento relativamente à posse de um PDA.

Seleccionar Analyse » Descriptive Statistics » Crosstabs

As especificações mantêm-se:

Clicar em Categoria de rendimento [Rendimento_cat] e colocar em Row(s)

Clicar em Tem PDA [ter_pda] e colocar em Column(s)

Clicar no botão Cells

100 INTRODUÇÃO AO IBM SPSS STATISTICS


Seleccionar Row na caixa de Percentagens

Clicar em Continue

Figura 129 – Caixa de diálogo Cell Display

Clicar em OK na caixa de diálogo geral de Crosstabs para processar a tabela

Figura 130 – Tabela de contingência com percentagens em linha

O novo resultado (no Output Viewer) verifica-se que em cada linha, aparecem agora, as
percentagens consoante o rendimento e a posse de PDA, sendo que no total para cada classe
de rendimento a soma das percentagens é de 100%.

Também, neste momento, é fácil de constatar que a percentagem de inquiridos que possui
PDA aumenta à medida que a categoria de rendimento aumenta.

INTRODUÇÃO AO IBM SPSS STATISTICS 101


7. MEANS

O procedimento Means permite apresentar um conjunto de estatísticas descritivas –


somatório, média, mediana, mínimo, máximo, erro padrão da média, etc… – para variáveis
dependentes segundo um conjunto de categorias referentes a variáveis independentes.

As variáveis dependentes devem assumir uma escala de medida quantitativa enquanto que
as variáveis independentes, a serem seleccionadas, deverão assumir uma tipologia categórica
podendo esta ser numérica ou alfanumérica.

Abrir o ficheiro Demo.sav, se este estiver fechado

Seleccionar Analyse » Compare Means » Means

Colocar a variável Idade em Dependent List

Colocar a variável Género em Independent List

Nota: O utilizador pode especificar diversas variáveis independentes em Layer (no mesmo layer). Assim,
os resultados s~erão apresentados numa tabela cruzada, em oposição a várias tabelas separadas para
cada variável independente seleccionada.

Figura 131 – Caixa de diálogo Means

Seleccionar OK

102 INTRODUÇÃO AO IBM SPSS STATISTICS


Figura 132 – Resultado do procedimento Means

Os resultados da tabela apresentam as estatísticas seleccionadas por defeito (a média, o


número de respondentes e o desvio padrão) para cada categoria de género dos inquiridos
(feminino e masculino).

No exemplo dado, verifica-se que os respondentes do género feminino têm, em média, uma
idade inferior aos do sexo masculino.

INTRODUÇÃO AO IBM SPSS STATISTICS 103

Você também pode gostar