Escolar Documentos
Profissional Documentos
Cultura Documentos
Sara Vieira
VF: Fevereiro de 2020
ÍNDICE
INTRODUÇÃO À FORMAÇÃO.......................................................................................................................... 5
3.4. Utilização dos Rótulos de Valores (numéricos ou alfanuméricos) para Introdução de Dados26
4.1. Definição de Não Resposta (Missing) para uma Variável Numérica ............................................ 28
4.2. Definição de Não Resposta (Missing) para uma Variável Alfanumérica ...................................... 30
6. Guardar os Dados..................................................................................................................................34
6. Crosstabs ................................................................................................................................................ 99
Esta formação tem como principais objectivos a contextualização da utilização geral do IBM
SPSS Statistics, permitir aos formandos familiarizarem-se com o ambiente de trabalho do SPSS
através do contacto com uma primeira sessão do programa, e dotá-los de conhecimentos que
possibilitem a obtenção de análises estatísticas relevantes a partir desta ferramenta.
O SPSS (Statistical Package for Social Science) é uma ferramenta para análise de dados utilizando
técnicas estatísticas básicas e avançadas. É um software estatístico da IBM, de fácil
manuseamento, e que permite a utilização de dados em diversos formatos para gerar
relatórios, calcular estatísticas descritivas, conduzir analises estatísticas complexas e elaborar
gráficos.
A primeira versão data de 1968 e, a mais recente é a SPSS for Windows 26 (2019).
A utilização do SPSS apresenta diversas vantagens, como sejam, a sua flexibilidade para
diferentes naturezas de variáveis; a facilidade de utilização, sendo um programa muito
amigável (baseado no ambiente Windows), com diversos níveis de complexidade, de acordo
com as necessidades dos seus utilizadores, possibilitando a elaboração de relatórios, quer
pelo próprio programa, quer por uma articulação com um processador de texto.
Para a análise estatística dos dados o SPSS Statistics engloba várias funcionalidades, como
sejam:
• Acesso e gestão de elevada quantidade de dados – possibilita uma ligação simples com
diverso software para importação de dados, nomeadamente Excel, SAS, Stata,..
Assim, aparecerá o ecrã de abertura do SPSS, com uma caixa de diálogo inicial que permite
iniciar uma nova sessão no SPSS ou aceder à importação de uma base de dados.
Open an
existing
data source
- para abrir
um ficheiro
existente
Figura 3 – Caixa de diálogo inicial para abertura de nova janela ou de ficheiro existente
Desta forma, abre-se de imediato a janela do Editor de Dados, que funciona de forma
semelhante a uma folha de cálculo.
Figura 4 – Janela do Editor de Dados (Data Editor) - neste caso após clicar em Type in data, por isso aparece
vazio
O Editor de Dados apresenta uma Barra de Menus, uma Barra de Ferramentas e dois Separadores.
Dois Separadores
No IBM SPSS Statistiscs existem, quando se acede a dados ou se cria um ficheiro de dados,
dois separadores: Data View (que permite a visualização e introdução ou edição dos dados)
e Variable View (que permite a visualização e a definição ou alteração das características das
variáveis).
No SPSS os dados são colocados no separador Data View do Editor de Dados visível na Figura
6.
Barra de Menus Barra de Ferramentas
Variáveis
Casos
Características
das Variáveis
Variáveis
Na Figura 8 podem-se ver os vários atributos que se podem associar a uma variável.
2. Type ou Tipo da variável - Especificação do tipo de cada variável. Por defeito assume-
se que as variáveis são numéricas.
9. Align – Propriedade que permite controlar a forma como os valores são apresentados
no separador Data View.
Os procedimentos utilizados no SPSS são acessíveis a partir dos menus disponíveis e/ou da
barra de ferramentas.
A Barra de Menus é uma área do software SPSS, onde são apresentados os menus que
contêm as funcionalidades do programa. Os menus são, geralmente, presentes em interfaces
gráficas que possuem janelas e estas vários comandos.
1. File: Acede-se a este menu quando se pretende, entre outras funções, importar
ficheiros de dados, no formato IBM SPSS Statistics ou a partir de outra fonte (Microsoft
Office Excel, bases de dados, texto), ou construir um novo ficheiro. Também se pode
abrir/criar novas janelas de programação (Sintaxe) ou de resultados (Outputs) ou de
Scripts. Adicionalmente poderá obter informação do ficheiro (Display Data File
Information), guardar o ficheiro (Save), listar os últimos ficheiros de dados utilizados
(Recently Data Files) e sair da aplicação (Exit).
2. Edit: Permite efectuar operações de edição sobre ficheiros de dados, bem como
modificar, copiar, seleccionar e procurar texto ou dados.
11. Help: Permite o acesso aos diversos tópicos de ajuda disponíveis no IBM SPSS
Statistics.
Figura 15 – Localização dos menus File, Edit, View e Data da Barra de Menus
Comutar
Procedimentos Informação entre janelas;
de análise sobre as minimizar
estatística variáveis janelas
Figura 16 – Localização dos menus Transform, Analyse, Graphs, Utilities, Add-ons, Window e Help da
Barra de Menus
6. TIPOS DE FICHEIROS
Para cada uma das janelas referidas (dados e resultados) são gerados ficheiros específicos
que são identificados com extensões e ícones diferentes:
▪ Ficheiro de dados: extensão - .sav;
▪ Ficheiros de resultados: extensão - .spv
Nota: Existem ainda outras janelas, nomeadamente a Syntax (para programação, e que não é abordada
neste manual/formação) e que tem uma extensão - .sps.
Ainda a este respeito, indica-se que é possível ter múltiplos ficheiros de dados (e de resultados)
abertos na mesma sessão de trabalho, no entanto apenas um será o ficheiro de dados activo.
A cruz que se apresenta na respectiva janela (de dados ou de resultados) indica qual o
ficheiro activo. Tal significa que todas as análises (tabelas / gráficos ou comandos de
programação) serão realizadas sobre esse ficheiro. O utilizador pode alterar o ficheiro activo,
clicando no ficheiro de seu interesse a partir do menu Window.
Além da importação de dados desde fontes distintas, assunto a ser abordado posteriormente,
o utilizador poderá optar por introduzir directamente a informação no SPSS. Esta opção é
muito útil para ficheiros de pequena dimensão.
S1 Género
1.1 Feminino
1.2 Masculino
S2 Habilitações Académicas
S3 Idade
S4 Localidade
Utilização de Sotware
1.1 SPSS
1.2 Excel
1.3 PowerPoint
1.4 Word
2.2 Excel
2.3 PowerPoint
2.4 Word
Após a introdução dos nomes das variáveis, estas são automaticamente formatadas como
sendo numéricas. Mesmo que o utilizador não introduza os nomes, o SPSS define-os
automaticamente. O utilizador deve, no entanto, ter em conta que estes nomes não espelham
o conteúdo da informação, nem são aconselháveis para ficheiros de maior dimensão.
Os nomes definidos no Variable View aparecem agora no topo das primeiras quatro colunas
do Data View. A introdução dos dados deverá iniciar-se na primeira linha, a partir da primeira
coluna.
Na coluna ID digite 1
Na coluna S1 digite 1
Na coluna S2 digite 1
Neste momento todas as variáveis possuem duas casas decimais, ainda que estas apenas
assumam valores inteiros.
A coluna Tye regista o formato da variável (numérica, alfanumérica, data, etc…). Os formatos
Numeric (numérico) e String (alfanumérico) são os mais comuns e coexistem com uma
apreciável variedade de formatos.
Para além da definição do tipo de variável, o utilizador poder ainda definir outras
propriedades como, por exemplo, os descritivos (Lables) dos nomes das variáveis e dos valores
numéricos assumidos pelas assumidos pelas mesmas (Value Labels). A adição destes
descritivos torna a leitura e interpretação dos dados e dos outputs estatísticos muito mais
simples.
Note-se que a partir deste momento, se o utilizador passar para o Separador Data View (Editor
de Dados) passará a visualizar a Etiqueta da variável quando o cursor e colocado sobre o nome
da mesma, permitindo-lhe assim facilmente saber a designação correcta da variável.
De forma semelhante, o utilizador pode associar rótulos (descritivos) aos valores numéricos
assumidos pelas variáveis. No exemplo do inquérito utilizado, a variável do género do
inquirido (S1) assume dois valores – o valor 1 significa que o indivíduo é do género feminino e
o valor 2 significa que é do género masculino.
Clique na área Values da linha S1 e no respectivo botão para aceder à caixa de diálogo
Value Labels
Onde:
Com recurso ao menu View ou ao botão Value Labels , será accionada a opção de
visualização dos rótulos dos valores.
Figura 30 – Editor de Dados sem Rótulos dos valores de variáveis activos no separador Data View
Nota: O utilizador deverá ter em conta que as variáveis alfanuméricas são sensíveis à alteração de letra
maiúscula para minúscula (e vice-versa), bem como com a adição de espaços. O caso classificado com b é
completamente diferente de um caso classificado com B.
Ao seleccionar a opção Value Labels no menu View o utilizador optou por visualizar os
rótulos ao invés dos valores introduzidos. Neste sentido, o utilizador poderá recorrer a estes
descritivos na tarefa de introdução de dados. Note-se que só será possível com a opção Values
Labels ( ) seleccionada.
Note-se que apenas serão listados os valores previamente definidos, o que permite assegurar
que os dados sejam introduzidos com o formato correcto.
Figura 33 – Visualização dos dados introduzidos com recurso aos rótulos de valores
A existência de não resposta, ou de resposta inválida, é demasiado vulgar para ser ignorada.
Os inquiridos de um estudo poderão recusar-se a responder a determinadas questões ou
responder erradamente. Neste contexto, a qualidade das análises dependerá da correcta
identificação e tratamento deste tipo de informação.
System Missing
Os inquéritos dão muitas vezes oportunidade aos inquiridos de responder “Não Sabe” ou
“Nenhuma das anteriores” a algumas questões. Nas ciências, na engenharia, na física e
biologia, alguns aparelhos automáticos registam dados que contêm só 9s (por exemplo 999)
quando a medição falha por alguma razão. Nestes casos o SPSS proporciona uma forma de
os tratar como se eles fossem missing.
Podemos declarar até três códigos como missing values para cada variável (e dois destes
podem definir intervalos de missing values). A razão para serem três códigos para missing será
para normalizar, de alguma forma, os três tipos de respostas mais comuns de valores missing
em inquéritos: “Não aplicável”, “Não sabe”, “Não responde”.
As não respostas são definidas na caixa de diálogo Missing Values, que pode ser acedida
clicando no botão da coluna Missing no separador Variable View.
Para demonstrar como definir missing values (uma não resposta) para uma variável numérica,
irá utilizar-se a variável S1 (Género do Inquirido).
Por defeito, a opção No missing values encontra-se seleccionada o que, não implica que não
existam missing values para a variável (neste caso o género do inquirido), indica apenas que
nenhuma informação desse tipo foi declarada. A segunda escolha, Discrete missing values, é
a opção mais comum. Aqui, pode-se especificar até três tipos de códigos distintos (discretos)
de não resposta para a variável. Finalmente, Range plus one discrete missing value, permite
declarar como missing values todos os valores contidos num determinado intervalo mais um
valor específico. Estas escolhas resultam numa grande flexibilidade na declaração de missing
values, especialmente se se considerar que esses valores podem ser diferentes para variáveis
diferentes.
Será útil definir um rótulo para o valor anteriormente adicionado como não resposta.
Quais quer erros de digitação que ocorram podem ser editados clicando na caixa de texto
correspondente e alterando o valor.
Se mais tarde quisermos desactivar a declaração de missing value, basta regressar a esta caixa
de diálogo e clicar na opção No missing values.
Repita o processo para a variável S3 Idade do Inquirido (ter em conta que o inquirido
poderá ter 99 anos, assim utilizar o valor 999 para missing value)
Há que ter especial cuidado para que letras maiúsculas/minúsculas e espaços sejam os
mesmos do que os indicados ao declarar os missing. Por exemplo, se para uma variável
alfanumérica o valor ‘NR’ indica não resposta, então este valor deverá ser introduzido na caixa
de diálogo Missing Values. Note que ‘N R’, ‘Nr’, ‘nR’, ‘nr’, ou ‘n r’ não coincidem com ‘NR’ e não foi
definido correctamente o missing. O espaço vazio poderá também ser considerado como
missing e inclusivamente ser tido como um segundo tipo de não resposta para a variável (neste
caso localidade correspondendo a S4).
Será útil definir um rótulo para o descritivo anteriormente adicionado como não resposta.
Uma vez definidos, os atributos de uma variável podem ser aplicados a outras variáveis.
Clique na coluna Label da linha idade_t e escreva Idade com que começou a
trabalhar
Para aplicar atributos a múltiplas variáveis basta seleccionar várias células (clique e arraste até
à célula pretendida)
O utilizador poderá, ainda, copiar todos os atributos de uma variável para outra:
6. GUARDAR OS DADOS
Para guardar um ficheiro de dados do SPSS selecciona-se a janela do Editor de Dados que se
pretende guardar.
Clique em Save
Note-se que o nome atribuído surge na barra de título da janela do Editor de Dados, alterando-
se de *Untitled1.sav [DataSet1] para Base_dados.sav [DataSet1]. Tal confirma que os dados
foram devidamente guardados.
7. SAIR DO SPSS
Ao sair verá mensagens a questionar se deseja guardar conteúdos de outras janelas que
foram alteradas durante a sessão.
Neste caso, uma vez que não foi efectuada qualquer alteração no editor de Dados (por já ter
sido guardado anteriormente) não será efectuado o pedido para guardar nessa janela. E
aparecerá a questão e se quer guardar a janela de Resultados (Output).
Os ficheiros de dados SPSS, que possuem a extensão *.sav, contêm informação anteriormente
gravada neste formato. Para abrir o ficheiro de dados Basa_Dados.sav:
O IBM SPSS Statistics mostra a caixa de diálogo Open Data (Figura 48) que lhe permite
especificar o nome, directoria e tipo de ficheiro que retende ler. Por defeito, são visualizados
ficheiros de dados SPSS (*.sav). Para abrir o ficheiro Base_Dados.sav, procure a directoria onde
foi guardado e seleccione Base_Dados.sav.
Relembra-se que os ficheiros de dados são organizados numa matriz, onde as linhas
correspondem a cada caso do inquérito ou questionário, representando uma resposta
individual, e as colunas corresponde às variáveis, sendo cada variável equivalente a uma
questão colocada no inquérito.
O utilizador pode importar informação a partir de aplicações como o Microsoft Excel (entre
outros). Neste caso os títulos das colunas podem ser lidos como designações das variáveis,
mas deverão respeitar as regras de especificação de variáveis.
Clique File » Import Data » Excel (ou então pode clicar no botão Open Data )
Clique em Open
Nesta caixa de diálogo o utilizador indica qual a folha de cálculo que pretende importar (neste
caso apenas existe uma) e determina se as designações das variáveis estão presentes na
primeira linha do ficheiro (opção por defeito – Read variable names from first row of data).
É ainda possível definir um intervalo de células, relativo aos dados que o utilizador quer
importar (no campo Range).
Dependendo da versão do programa que está a utilizar, deverá assinalar as opções Remove
leading spaces from string e Remove trailing spaces from string values para remover espaços
que possam existir no início e no fim das cadeias de texto (strings) que o ficheiro possa conter.
Mesmo que os cabeçalhos das colunas não estejam em conformidade com as regras do SPSS
relativamente à designação das variáveis, estes serão convertidos em designações válidas (e
os cabeçalhos originais serão transformados em descritivos - labels – das variáveis).
Será, então, aberta uma nova janela Data Editor que incluirá os dados importados do ficheiro
Excel.
Da mesma forma que é possível importar um ficheiro de Excel para o programa SPSS, o
contrário também é exequível, podendo o utilizador passar um ficheiro de dados SPSS para
uma folha de cálculo do Excel.
Figura 53 – Caixa de diálogo Save Data As com especificação do tipo de ficheiro Excel
Por defeito, as designações das variáveis serão exportadas para o ficheiro Excel (opção Write
variable names to spreasheet), se a opção não for seleccionada o ficheiro não irá ter um
cabeçalho com a designação das variáveis.
Clique em Save
Por defeito, quando definidos os value labels são exportados contendo os códigos numéricos
(ou alfanuméricos). Contudo, aquando do processo de exportação o utilizador tem a
possibilidade de optar pela exportação dos descritivos dos atributos das variáveis.
Seleccione a opção Save value labels where defined instead of data values
Figura 56 – Caixa de diálogo Save Data As com a opção Save value labels… seleccionada
Figura 57 – Ficheiro de dados exportado para Excel contendo os descritivos dos atributos das variáveis
Clique File » Close e No para sair e não gravar o ficheiro de resultados (Output)
Por defeito quando um ficheiro de dados SPSS é guardado, tal é extensível a todas as variáveis
do ficheiro. Porém o utilizador pode apenas gravar um subconjunto de variáveis relevante
para determinada análise.
Para tal, será apenas necessário seleccionar a opção “Variables” incluída na caixa de diálogo
Save Data As.
Seleccione a opção Save value labels where defined instead of data values
Por defeito, todas as variáveis existentes no ficheiro serão guardadas, o que será indicado
pelas check boxes seleccionadas da coluna Keep. As variáveis que não estiverem seleccionadas
serão excluídas do ficheiro.
Os botões Keep All e Drop All, permitem que o utilizador inclua (ou exclua) todas as variáveis,
seleccionando depois as que pretende excluir (ou incluir).
Os dados que o utilizador pode receber de uma fonte exterior, como por exemplo de
questionários ou entrevistas, podem não estar no melhor formato para o estudo ou para a
análise que se pretende efectuar, e por essa razão, pode ser necessário realizarem-se algumas
transformações ao dados para os adaptar às necessidades reais dos estudos.
Assim, no menu Transform do IBM SPSS Statistics existem diferentes procedimentos para
realizar essas operações. Desta forma, abordar-se-ão alguns dos procedimentos mais
utilizados por um analista de dados.
São várias as variáveis do ficheiro Demo.sav que foram obtidas a partir da transformação de
variáveis quantitativas.
Clique em Continue
O número final de categorias será igual ao número de cutpoints + 1. Neste exemplo serão 4
categorias em que, para as 3 primeiras a amplitude dos intervalos será de 25 e o último
intervalo contém todos os valores acima do cutpoint final (75).
Clique em Apply
Esta opção, gera automaticamente os descritivos dos valores para os códigos numéricos
assumidos pelas variáveis. O utilizador poderá, ainda, alterar manualmente os cutpoints e os
respectivos descritivos.
Figura 63 – Caixa de diálogo principal de Visual Binning com cutpoints definidos e descritivos dos valores
Dos dados do ficheiro Demo.sav pretende-se obter a idade com que o inquirido começou a
trabalhar no último emprego (ou reformado), para tal terá de ser calculada a diferença entre
a idade actual do individuo e o tempo no trabalho actual.
A caixa de diálogo Compute Variable inclui a caixa Target Variable, onde será definido o nome
da variável, e a caixa Numeric Expression, onde será construída a expressão.
Em Type & Label digite Idade no início da última actividade, e escolha Continue
Para ilustrar este exemplo, serão convertidos os cinco valores (1 = “Muito insatisfeito”; 2 =
“Insatisfeito”; 3 = “Indiferente”; 4 = “Satisfeito”; 5 = “Muito Satisfeito”) assumidos pela variável
Satisfação no trabalho do ficheiro Demo.sav, em apenas duas categorias: Neutro e Não
Neutro (pretendendo-se saber quais os inquiridos que não são indiferentes às condições de
trabalho).
Clique em Change
A variável Satisfação_trabalho constitui a base desta recodificação que irá dar origem à nova
variável Nova_Class_SatisTrabalho.
Nota: A opção Recode Into Same Variable poderá também ser utilizada para alterar variáveis já
existentes (Transforme » Recode » Into Same Variable), no entanto, tal operação deve ser utilizada com
alguma precaução, dado que se estará a substituir valores de uma variável existente.
Pretende-se então, gerar duas categorias: “Neutro”, que corresponde ao valor 3 da variável
Satisfação_trabalho; e “Não Neutro”, correspondente aos valores 1, 2, 4 e 5 da mesma variável.
Clique em Add
Clique Add
Clique Add
Clique Add
Nota: A área Old Value inclui vários tipos de especificações: um só valor, um intervalo de valores, valores
system-missing, valores system- or user missing e ainda, a opção All other values. Mesmo que sejam
detectados erros após a operação, as definições poderão ser alteradas (botão Change) ou até removidas
(botão Remove).
Clique Continue
Clique OK
É, também, possível recodificar valores na própria variável. Contudo, dever-se-á ter especial
atenção neste processo, dado que serão substituídos valores da variável existente (alteração
dos dados de origem).
Para exemplificar, será utilizado o ficheiro Demo.sav, e serão recodificados os missing values
da variável internet.
Dado que em Variable View existem dois missing values definidos para esta variável, pode-se
assumir que os user-missing passarão a assumir um novo código.
Clique em Add
Figura 71 – Caixa de Old and New Values de Recode into Same Variables
Clique Continue
Clique OK
Deste modo não só os missing values definidos pelo utilizador, como também os de sistema
passarão a assumir um novo código (99).
Será exemplificada a criação de uma nova variável a partir da variável original Género do
ficheiro Demo.sav.
Clique em OK
Figura 75 – Editor de Dados com a variável original Género e a nova variável Sexo gerada
O SPSS permite construir novas variáveis com base na contagem de ocorrências de atributos
num conjunto de variáveis existentes. Para cada caso, a nova variável irá traduzir o número
de vezes que determinado valor (ou valores) ocorre num conjunto de variáveis.
Na próxima caixa de diálogo deverão ser indicados quais, ou qual, o valor a contabilizar. Neste
exemplo será 1 que é o código para Sim.
Clique em Continue
Clique em OK
Clique em Continue
Clique em OK
A ferramenta Date and Time Wizard permite a obtenção de novas variáveis com base em
valores em formatos específicos de datas ou de tempo. Um exemplo desta situação, é quando
se possui a informação da data de nascimento dos inquiridos e se pretende saber a idade dos
mesmos em anos.
Clique em Next
Seleccionar na caixa de diálogo Calculate the number of time units between two dates
Clique em Next
Figura 79 – Caixa de diálogo Date and Time Wizard com definição da nova variável
Clique em Next
Clique em Finish
São várias as situações em que os utilizadores têm a necessidade de alterar a estrutura dos
dados originais para efectuarem determinadas análises. Tais situações, podem envolver a
ordenação de observações, verificar os casos duplicados, a partição do ficheiro, ou pelo
contrário, a agregação de casos ou variáveis, entre outros.
1. ORDENAÇÃO DE DADOS
A ordenação de casos (ordenação de linhas num ficheiro de dados) será ilustrada com recurso
a um pequeno ficheiro de transacções financeiras. O ficheiro é pequeno de modo a facilitar a
visualização da acção do procedimento, pois na prática é mais aplicado a ficheiros de grandes
dimensões.
O objectivo será ordenar a apresentação de casos por código de cliente (CustID) e pela data
da transacção financeira.
Nesta caixa é possível seleccionar múltiplas variáveis para efeitos de ordenação e, para cada
variável seleccionada, é também possível controlar a forma de ordenação (ascendente ou
descendente).
A ordem das variáveis em Sort by, determina a ordenação a seguir (isto é, primeiro será a
ordenada a variável que se encontra em primeiro lugar).
Finalmente, em Save Sorted Data, tem a possibilidade de gerar um novo ficheiro de dados
(em formato .sav, contendo os dados ordenados, conforme critérios especificados).
Clique em OK
Nota: Exemplo para ordenar o ficheiro de dados por código de cliente e por data de transacção mais recente.
Quando as análises são realizadas com base em ficheiros construídos a partir de dados de
diferentes origens, existe um risco associado à presença de casos duplicados que pode
influenciar os resultados.
Suponhamos que em caso de duplicação de cliente, o analista pretende reter o valor da data
mais recente.
Nota: Neste exemplo apenas será utilizada uma variável de identificação de casos duplicados (CustID), contudo podem ser
utilizadas várias variáveis. O analista poderá até utilizar todas as variáveis para identificar casos exactamente iguais –
duplicação integral de um caso.
Tendo em conta as opções definidas em Variables to Create, sempre que existam duplicações
o caso mais recente será o caso a reter (Primary Case). Para isso será automaticamente criada
uma nova variável (PrimaryLast) – na qual também se pode alterar o nome – codificada com o
valor 1 (primary) para o caso mais recente e com o valor 0 (duplicate) para casos duplicados.
A opção Filter by indicator values activa um filtro para selecção de casos com base na variável
PrimaryLast. Assim, quando seleccionado, os casos duplicados permanecem no ficheiro, mas
não são tidos em conta nas análises estatísticas a efectuar.
Poderá, ainda, ser gerada uma variável que identifica sequencialmente os casos duplicados
(quando activada a opção Sequential count of matching case in each group).
Por defeito, os casos duplicados serão posicionados no topo do ficheiro para uma melhor
visualização dos resultados. É, ainda, produzida uma tabela de frequências que permite
verificar rapidamente o número de casos duplicados (a variável PrimaryLast permite
identificar os casos duplicados).
Clique em OK
A variável PrimaryLast assume o valor 1 quando o caso é único ou a reter. Para o cliente
G22505 (CustID) o caso mais recente (05/31/2003) será o caso a reter (Primary Case). Já os casos
com datas anteriores estão codificados como duplicados (Duplicate Case). O cliente G22789
segue o mesmo padrão.
Após a identificação e verificação dos casos duplicados, estes poderão ser filtrados, ou até
retirados definitivamente do ficheiro de dados.
O SPSS permite, através de uma ferramenta, juntar observações com origem em vários
ficheiros que não são totalmente iguais (mas que contenham em si a mesma informação),
alinhando-os pelos nomes das variáveis e não pela sua ordem ou posição no ficheiro. Assim,
Será aberto, primeiro, o ficheiro Movie3.sav para se verificarem os nomes das variáveis
Clique em Open
As designações das variáveis, assim como tipo das mesmas (numéricas ou alfanuméricas)
devem ser consistentes com o segundo ficheiro.
Neste ficheiro, nota-se que a variável que identifica o género do indivíduo se designa por
“gender” (no próximo ficheiro designar-se-á por “sex”). E, embora, seja possível emparelhar ou
alterar o nome das variáveis é mais simples e obtém-se uma menor probabilidade de erro se
os nomes forem iguais desde o início.
Clique em Open
Pode-se, então, verificar se os nomes e o tipo das variáveis são iguais para ambos os ficheiros.
No ficheiro Untitled.sav verifica-se a variável D_R que é um campo da dBASE e deve estar em
branco, e os restantes campos referem-se às questões do inquérito existindo apenas a
diferença do nome da variável referente ao género do indivíduo.
Juntar casos
Neste momento, os dois ficheiros encontram-se aptos para serem utilizados: o editor de
dados contém a informação vinda do ficheiro Movies4.dbf em formato SPSS, tal como o
ficheiro anteriormente aberto, o Movies3.sav.
Neste momento, o analista deverá seleccionar o ficheiro SPSS cujas observações serão
adicionadas ao ficheiro existente no editor de dados SPSS. Quando estão abertas 2 ou mais
janelas o Data Editor, o SPSS necessita saber se o ficheiro a adicionar já está ou não aberto e
qual o seu nome.
Seleccione Movies3.sav
Clique em Continue
Abre-se uma nova caixa de diálogo Add Cases From onde à direita Variables in the New Active
Dataset aparecem as variáveis comuns aos dois ficheiros (caso não se queiram manter no
novo ficheiro poder-se-á proceder à sua deslocação para Unpaired Variables), e à esquerda
Unpaired Variables são visíveis as variáveis que não têm correspondência entre os dois
ficheiros. O asterisco (*) ou o sinal de adição (+), que surgem a seguir aos nomes das variáveis
não emparelhadas indicam qual o ficheiro de origem de cada variável (a legenda encontra-se
no canto inferior esquerdo da caixa de diálogo).
Sabendo o utilizador que, neste caso, “sex” e “gender” representam a mesma informação
embora não tendo o mesmo nome, pode indicar ao SPSS para emparelhar. Para tal:
Clique na tecla CTRL ao mesmo tempo que selecciona gender em Unpaired Variables
Seleccione Pair
Note que sex e gender aparecem agora juntas na caixa Variables in the New Active DataSet
(sex & gender<) e formarão uma só coluna sob o nome de sex.
Nota: Poder-se-á agora clicar em OK para ter o novo ficheiro no Editor de dados, contudo vai-se aguardar
para se poder explicar a situação seguinte.
Ao combinar estes ficheiros, é possível criar uma variável que indique de que ficheiro os casos
são provenientes. Este procedimento nem sempre é necessário, aliás não é na maioria das
vezes, apenas quando se quer efectuar uma comparação entre a proveniência (ficheiro) dos
dados por algum motivo (quando o resultado pode estar relacionado com datas de execução,
grupos de trabalho, localização geográfica dos inquiridos na altura do inquérito… por
exemplo).
Figura 91 – Criar variável de indicação proveniência dos casos em Add Cases From
Clicar em Save
Um método diferente de combinar ficheiros é juntar novas variáveis (com informação distinta)
a um ficheiro existente. Por exemplo, os clientes de uma empresa podem ser inquiridos antes
de um novo sistema de distribuição ser lançado e sê-lo novamente um ano depois. Pode
querer conhecer os clientes que retiraram mais benefícios da inovação. Neste caso, se os
dados forem arquivados em dois ficheiros diferentes, devem ser juntos pela identificação do
cliente de modo a permitir calcular a diferenças nas respostas de cada cliente. Uma outra
situação é, por exemplo, querer-se adicionar respostas a um inquérito sobre o
comportamento de compras do cliente, com um outro contendo informação sobre as vendas.
Existem 3 formas básicas de juntar variáveis a partir de diferentes ficheiros. Esta distinção é
importante, pois o tipo de junção aplicados aos mesmo dados produzirão resultados
diferentes:
CONSIDERAÇÕES GERAIS:
1. Importância da ordenação
Para qualquer tipo de junção de variáveis ter sucesso, os ficheiros devem ser ordenados
pela(s) variável(eis) chave. Se os ficheiros não estiverem ordenados a operação falhará.
Para que o SPSS junte ficheiros adicionando variáveis, ambos os ficheiros devem estar
definidos como ficheiro IBM SPSS Statistics (isto é, em formato *.sav ou estar activo no editor
de dados).
Uma vez que serão juntas variáveis de dois (ou mais) ficheiros é importante utilizar
designações exclusivas para cada variável. Se o mesmo nome da variável é utilizado nos dois
ficheiros o programa só reterá a informação existente num dos ficheiros. Muito embora a
possibilidade de renomear esteja disponível na caixa de diálogo Merge Files » Add Variables, é
mais seguro utilizar designações únicas desde o início.
Será, agora, demonstrada a junção por variável chave adicionando variáveis dos ficheiros de
World60.sav e World90.sav, utilizando o nome do país como variável chave para juntar os
ficheiros.
Não fechar o ficheiro, pois será utilizado para a junção das variáveis.
Ao clicar em Add Variables, é aberta uma caixa de diálogo intermédia, tal como apresentado
na Figura 95.
Seleccione Wordl90.sav
Clicar em Continue
De forma a concluir a tarefa de junção dever-se-á indicar a variável a utilizar como chave.
No separador Variables da caixa de diálogo Add Variables From o SPSS irá, por defeito, listar
as variáveis a manter no final da junção. Poder-se-á excluir variáveis, caso o utilizador não as
queira considerar, para tal, basta seleccionar e mover para a caixa de Excluded Variables. Após
cada variável na listagem aparece um símbolo (asterisco ou sinal de adição entre parêntesis)
que indica o ficheiro de origem de cada uma das variáveis. Note-se que no canto inferior
esquerdo da caixa de diálogo aparece a legenda desta simbologia.
Nesta caixa de diálogo, verifica-se que para o exemplo em causa, existem duas variáveis na
caixa Key Variables: Name e Region. As duas são colocadas aí, pois os dois ficheiros (o activo e
o “escondido”) apresentam essas variáveis. Uma vez que se definiu a variável Name como a
variável chave para a junção, a variável Region pode ser colocada na caixa de Excluded Variables.
Figura 97 – Caixa de diálogo Add Variables from separador Variables (na versão 25 do SPSS)
Nota: Se se pretender manter ambos os conjuntos de códigos poder-se-á seleccionar a variável Region presente na
lista de Excluded Variables e utilizar o botão Rename para lhe atribuir uma nova designação e inclui-la na caixa Included
Variables.
Clicar no botão OK
O SPSS emite um aviso relativo ao cuidado a ter na ordenação da variável chave dos dois
ficheiros. Este aviso aparecerá sempre e não quer dizer que exista algum erro.
Clicar no botão OK
Verificar-se-á que vários países (exemplo, Bahrain e Barbados) têm valores em falta para as
variáveis relativas a 1960, pois só existia informação no ficheiro de 1990 mas não no de 1960.
Clicar em Save
5. SELECÇÃO DE DADOS
A opção Random sample of cases permite seleccionar uma amostra de observações gerada
por um número pseudo-aleatório.
A opção Use filter variable permite excluir da selecção os casos que apresentam missing ou
valores 0 das variáveis dicotómicas (tipo sim-1; não-0, em que apenas são seleccionados os
valor 1).
• A opção Filter out unselected cases é utilizada quando se pretende que os casos não
seleccionados permaneçam no ficheiro;
• A opção Copy selected cases to a new dataset é utilizada quando se pretende criar
um novo ficheiro que contenha apenas as observações seleccionadas;
• A opção Delete unselected cases é utilizada quando se pretende que as observações
não seleccionadas sejam apagadas do editor de dados.
Como exemplo, para demonstrar a aplicação da funcionalidade do filtro (Select Cases), será
primeiramente aplicado um filtro e depois serão apagadas as observações não seleccionadas.
O critério de selecção será o de seleccionar os países da região North and Central América
(region=2) para os quais a esperança de vida em 1987 (lifeex87) é igual ou superior a 75 anos.
Os critérios ou regras de selecção, podem ser escritos directamente na caixa existente para o
efeito, ou criados a partir da lista de variáveis e dos botões da calculadora que aparecem na
caixa de diálogo Select Cases: If.
Figura 102 – Editor de dados com a nova variável Filter_$ e casos seleccionados
O programa SPSS gerou, no final do ficheiro de dados, uma nova variável filter_$ codificada
com os valores Selected (1) e Not Selected (0), correspondendo à regra ou critérios indicados
(1 indica que satisfaz a regra aplicada).
Note-se que a mensagem Filter On é apresentada na barra de estado (canto inferior direito)
do editor de dados e cada observação (caso) não seleccionada apresenta um traço indicando
que a observação foi filtrada e não fará parte das análises a realizar.
Este filtro manter-se-á activo até que o analista o cancele, seleccionando a opção All Cases na
caixa de diálogo de Select Cases.
Clicar em OK
O editor de dados apresenta, agora, apenas os casos que respeitam a regra aplicada, neste
caso os países da região 2 com uma esperança de vida em 1987 maior ou igual a 75 anos.
6. AGREGAR INFORMAÇÃO
O SPSS possui a opção Aggregate no menu Data que permite agregar observações com base
numa combinação única de valores, de uma ou mais variáveis de agrupamento e gerar um
novo ficheiro de dados contendo uma observação para cada grupo e cujas estatísticas
sumárias se tornaram em variáveis.
Dever-se-á especificar pelo menos uma variável para agrupamento (Break Variable(s)) que
neste caso será a região (Region) e escolherem-se as variáveis de agregação (Aggregate
Variable(s)) da lista de variáveis apresentada.
A caixa Break Variable(s) permite definir as variáveis de agrupamento. Deve ser especificada
pelo menos uma. Podem-se utilizar variáveis numéricas e alfanuméricas.
Se se especificar mais do que uma variável de grupo, a ordem de colocação das variáveis é
importante. A primeira variável define o primeiro agrupamento e assim sucessivamente. Tal
determinará a ordem das observações no ficheiro agregado. As combinações de valores das
variáveis de agrupamento definem as observações no ficheiro agregado. Cada combinação
única das variáveis de grupo definirá uma observação. Se num grupo não há observações, o
ficheiro agregado não terá observação para esse grupo.
A caixa Break Variables, inclui agora a variável region. As variáveis de grupo, com os seus rótulos
e outra informação de dicionário, serão arquivadas no ficheiro agregado.
Variáveis agregadas
Pode-se recorrer à mesma variável para agregar, com funções de agregação diferentes
(estatísticas simples diferentes) para serem criadas mais do que uma variável agregada no
novo ficheiro, por exemplo a média e a soma da variável.
Colocar pop1990 na caixa de Summaries of Variables (por defeito, o nome da variável que
o SPSS atribui à variável agregada é pop1990_mean, pois a função agregação é a média MEAN).
Clicar em Continue
Figura 105 – Caixa de diálogo Aggregate Data: Variable Name & Label
Seleccionar Sum (para alterar a função de média para somatório) na nova caixa de
diálogo (Aggregate Data: Aggregate Funcion)
Clicar em Continue
Clicar em Continue
Para se criar uma variável que contenha o número de observações em cada grupo agregado
(que contribuíram para cada uma das observações), basta seleccionar Number of cases na
caixa de diálogo principal (Aggregate Data).
Por defeito o SPSS denomina esta variável de N_BREAK. Neste exemplo o analista sabe que
cada caso é um país, assim pode alterar este nome para NUM_PAISES:
A variável N_PAISES (n.º de países) será incluída no ficheiro agregado. Assim, no novo ficheiro
ter-se-á quatro variáveis: a variável de grupo region, as duas variáveis agregadas
pop1990_mean e pop1990_sum e a variável N_PAISES.
Na caixa de diálogo principal (Aggregate Data) existem 3 opções na área Save. O utilizador
poderá optar por adicionar as variáveis agregadas ao ficheiro de dados inicial (esta é a opção
por defeito do programa – Add aggregated variables to active dataset). Contudo, existem
mais duas opções adicionais que permitem a criação de um novo ficheiro de dados com as
variáveis sumariadas para os grupos especificados na área Break Variable(s).
A opção Create a new dataset containing only the aggregated variables vai, na mesma
sessão, abrir uma nova janela do Data Editor deixando inalterado o ficheiro de dados original.
O utilizador poderá fornecer um nome ao novo ficheiro na caixa de texto Dataset name. Ao
escolher esta opção o SPSS não irá gravar automaticamente o novo ficheiro agregado, o que
significa que este deverá ser gravado a partir da janela do editor de dados.
A opção Write a new data file containing only the aggregated variables vai guardar um
ficheiro de dados no formato SPSS com a designação e na directoria que o utilizador
especificar. Por defeito, o nome do ficheiro é aggr.sav sendo direccionado para a directoria
No exemplo que se está a seguir, irá ser criado um novo dataset. Para tal:
Figura 107 – Caixa de diálogo Aggregate Data para criar o ficheiro agregado
Clicar em OK
Note-se que o SPSS utiliza, por defeito, o formato F8.2 (8 caracteres e 2 casas decimais) para
as novas variáveis agregadas. A Variável N_PAISES é definida como variável numérica com sete
caracteres inteiros. Tanto o descritivo como a codificação da variável region foram transferidos
para o ficheiro agregado.
Por vezes o analista pretende comparar as diferenças dos dados não agregados (originais)
com os obtidos na agregação, no caso do exemplo em curso, poder-se-á querer comparar os
valores da população dos diferentes países com as médias populacionais da região onde estão
inseridos, ou até mesmo comparar a população total de cada país com a população total da
região. Para tal há que juntar as variáveis agregadas ao ficheiro inicial (original). Para tal:
Seleccionar Data » Aggregate (se não se tiver fechado o ficheiro, a caixa de diálogo
manteve as especificações anteriores, que poderão ser reutilizadas agora). A região é,
novamente, a variável pela qual os valores serão agregados e as variáveis agregadas
serão pop1990_mean e pop1990_sum, tal como aparecerá a variável de contagem de
número de países.
Na área referente a Save alterar para Add aggregated variables to active dataset
Figura 109 – Editor de dados do ficheiro original após a junção de variáveis agregadas
Note-se que para países da mesma região as novas variáveis (as agregadas) assumem valores
iguais, independentemente do país em questão (pois as variáveis referem-se a valores da
população – média e somatório – das regiões). Desta forma, a partir deste momento poder-
se-ia verificar como cada país se comporta face à região onde está inserido.
Neste capítulo será reforçada a apresentação das unidades de medida de uma variável SPSS
e a forma como influenciam os tipos de análise estatística a serem utilizadas. Serão, também,
apresentados diversos procedimentos de análise descritiva dos dados.
1. ESCALAS DE MEDIDA
As variáveis SPSS podem ser agrupadas em dois grandes grupos (Variáveis Qualitativas e
Quantitativas). A cada grupo está associado uma escala de medida, ou seja, ou são variáveis
categóricas (cada unidade representa uma categoria) ou são variáveis contínuas (cada
unidade representa um valor numérico na escala de valores infinitos):
Nota:
Estatísticas apropriadas
Para cada tipo de variável existe assim um tipo apropriado de método para averiguar acerca da
tendência central. Por tendência central quer se indicar um valor que melhor caracterize a distribuição
da variável. Note-se que as variáveis medidas numa escala contínua, como scale, podem utilizar medidas
da tendência central de variáveis categóricas. No entanto, as mais utilizadas (segundo o tipo de variável)
são:
2. TABELAS DE FREQUÊNCIAS
Para variáveis qualitativas uma listagem de casos e percentagem de cada categoria é muitas
vezes suficiente para se conhecer a sua frequência. Para estas variáveis poderemos também
obter a moda (o valor mais frequente) e, caso estejamos perante uma variável ordinal,
poderemos ainda obter a mediana.
Seleccionar as variáveis ‘Tem PDA’ [ter_pda] e ‘Tem TV’ [ter_tv] e desloca-las para a
área Variable(s)
Clicar em OK
▪ O descritivo da variável e dos valores que esta assume (ou nome da variável caso esta
não tenha descritivo);
▪ O identificador Valid na primeira coluna indica que valores são válidos (para cada
categoria de resposta). O identificador Missing precede as linhas que representam
missing values, caso existam.
▪ A segunda coluna representa a frequência de casos para cada categoria.
▪ A terceira coluna apresenta a percentagem de casos para as várias categorias.
▪ A quarta coluna apresenta a percentagem de casos válidos das categorias, baseada
no seu total. Caso não existam missing values, como no exemplo, os valores da terceira
e da quarta coluna são iguais.
▪ A quinta coluna indica a percentagem acumulada para os valores registados. É
calculada somando as percentagens válidas dos valores com as percentagens
acumuladas dos valores anteriores.
▪ Os totais aparecem na última linha das tabelas de frequências.
Nota:
Caso antes de clicar em OK na caixa de diálogo Frequencies tivesse sido seleccionado o botão Statistics, poder-se-ia
seleccionar outros cálculos estatísticos (por exemplo de medidas centrais como a média, mediana, moda e
somatório). E estes seriam apresentados num quadro separado chamado Statistics.
No ficheiro Demo.sav
Seleccionar as variáveis ‘Tem PDA’ [ter_pda] e ‘Tem TV’ [ter_tv] e desloca-las para a
área Variable(s)
Clicar em Charts…
Figura 113 – Caixa de diálogo Frequencies (botão Charts…) e Caixa de diálogo Frequencies: Charts
Clicar em OK
Uma tabela de frequências ou um gráfico de barras para uma variável contínua torna-se
menos perceptível para analisar a informação. Por norma, o analista (para este tipo de
variáveis) opta por representar a distribuição das frequências das variáveis através de um
histograma. O histograma agrupa valores adjacentes e mostra uma barra no ponto médio do
grupo. Exemplificando:
No ficheiro Demo.sav
Clicar em OK
Figura 116 – Tabela com as estatísticas solicitadas e tabela de frequências para a variável Rendimento
do agregado familiar
No exemplo exposto existe uma grande diferença entre a média e a mediana. Tal constitui um
indicador que os valores não têm uma distribuição normal. O utilizador poderá confirmar esta
situação através da visualização de um histograma.
No ficheiro Demo.sav
Clicar em OK
Poder-se-á, facilmente, verificar que a maior parte das observações se situa abaixo dos
100.000 e existem poucos casos acima de 400.000. Como os casos com valores mais elevados
têm um efeito significativo na média, mas pouco ou nenhum efeito na mediana, é este último
indicador o melhor para descrever a tendência central desta situação.
3. PROCEDIMENTO DESCRIPTIVES
Para além do procedimento Frequencies existe outro modo de obter no SPSS estatísticas
descritivas para as variáveis numéricas. É o chamado procedimento Descriptives.
No ficheiro Demo.sav
Clicar em OK
Estão também informações sobre o mínimo, o máximo, a média e o desvio padrão de cada
variável em análise.
4. CASE SUMMARIES
O procedimento Case Summaries pode listar os valores de cada observação das variáveis
seleccionadas. Por exemplo, para o ficheiro Demo.sav, poder-se-á visualizar os valores das
primeiras 10 observações relativas às variáveis criadas:
No ficheiro Demo.sav
A tabela intitulada Case Processing Summary informa o número de observações válidas para
as variáveis escolhidas nos 10 primeiros casos seleccionados.
A tabela denominada por Cases Summaries revela os valores assumidos pelas variáveis nos
10 casos seleccionados.
5. PROCEDIMENTO EXPLORE
Este procedimento é adequado para analisar com maior detalhe variáveis contínuas.
Esta análise só é aplicável a variáveis quantitativas. E, o resultado obtido inclui, por defeito,
uma série de medidas como a média aritmética, a média aparada a 5% e intervalos de
confiança.
No ficheiro Demo.sav
As variáveis a analisar (descrever) aparecem na caixa Dependent List. A caixa Factor List pode
conter uma ou mais variáveis categóricas e, se utilizada, obriga à apresentação de resultados
estatísticos para cada subgrupo definido pelas variáveis aqui colocadas. Pode-se, ainda,
especificar quais as estatísticas e gráficos a apresentar, utilizando os botões Statistics e Plots
(por defeito apresentam estatísticas descritivas e gráficos).
Normalmente o SPSS exclui observações com não respostas (‘missing values’) da execução de
alguns procedimentos. É o caso do procedimento Explore.
Quando se utilizam várias variáveis o analista tem a opção de escolher se a análise deve ser
realizada só com as observações com valores válidos em todas as variáveis em estudo
(chamada ‘listwise deletion’) ou se as não respostas devem ser excluídas separadamente para
cada variável (chamada ‘pairwise deletion’). Quando se considera só uma variável qualquer
destes métodos gera um mesmo resultado, mas essa resposta não será a mesma quando se
estudam várias variáveis. Por defeito o método proposto é o ‘listwise deletion’.
A opção ‘Report values’ é raramente utilizada. Permite a inclusão das não respostas definidad
pelo analista (‘user missing values’) nas tabelas de frequências, mas exclui-as dos gráficos e das
estatísticas descritivas.
Figura 123 – Caixa de diálogo Explore (botão Options) e Explore: Options com ‘Missing values’
Seleccionar OK
Figura 124 – Janela Viewer com resultados de Explore para a variável idade
Para além da tabela ‘Case Processing Summary’ que no exemplo indica que não existem missing
values, este procedimento fornece informação estatística para a variável escolhida (Idade).
‘Median’ é o valor no centro da distribuição, ou seja, metade dos valores são maiores
que, e metade dos valores são menores que o valor da mediana (valor do caso no meio
da amostra). As medianas são resistentes aos valores extremos e, por isso, são
consideradas medidas robustas da tendência central.
‘5% trimmed mean’ é a média calculada após se ter retirado os valores que se
encontram nos extremos 5% superior e 5% inferior. Esta medida será resistente a
pequenos números ou a extremos com valores muito elevados.
Nota: Estas três medidas no exemplo têm valores muito próximos (entre 41 e 42,06). Se a média
fosse consideravelmente superior ou inferior à mediana e à ‘trimmed mean’, tal sugeria uma
distribuição assimétrica ou enviesada (‘skewed’). Numa distribuição perfeitamente simétrica, por
exemplo a normal, os valores seriam iguais nas três medidas de tendência central.
B. Medidas de dispersão
D. Medidas de distribuição
O gráfico ‘Stem & Leaf’ é criado a partir de um histograma, mas utiliza valores como
símbolos gráficos. A forma da distribuição é representada e o gráfico pode ser lido
para obter valores específicos.
A última linha identifica os ‘outliers’ (quando existem). Estes são pontos afastados do
centro que podem merecer algum cuidado de verificação. Os pontos extremos podem
ser erros ou possivelmente representar um subgrupo separado. Se o gráfico ‘Stem &
Leaf’ fosse mais extenso de modo a incluir os ‘outliers’ seria visível o ‘skewness’ positivo
do exemplo.
Resumindo o gráfico ‘Stem & leaf’ descreve os dados mostrando todas as observações
6. CROSSTABS
Nota: A especificação mínima para uma Crosstabs é uma variável em linha e uma variável em coluna. É
de alguma forma arbitrária a colocação das variáveis em linha ou em coluna.
Clicar em OK
São produzidas duas tabelas na Janela de Resultados (Output Viewer). A primeira tabela, ‘Case
Processing Summary’ apresenta o número de casos válidos da tabela. A segunda, é a verdadeira
tabela de contingência. As células apresentam o número de casos para cada combinação das
categorias das variáveis. Por exemplo, 455 inquiridos com rendimento entre $25.000 e
$49.000 têm PDA.
Contagens vs percentagens
O propósito de criar uma tabela de contingência é sem dúvida o de estudar as relações entre
variáveis. Neste sentido torna-se difícil analisar a tabela somente com o número de dados.
Normalmente são incluídas percentagens de forma a melhorar a leitura da tabela. O tipo de
percentagem requisitada – em linha ou em coluna – será determinado pelo utilizador.
Na tabela Categoria de rendimento por Tem PDA, pode interessar perceber qual a influência
do rendimento relativamente à posse de um PDA.
As especificações mantêm-se:
Clicar em Continue
O novo resultado (no Output Viewer) verifica-se que em cada linha, aparecem agora, as
percentagens consoante o rendimento e a posse de PDA, sendo que no total para cada classe
de rendimento a soma das percentagens é de 100%.
Também, neste momento, é fácil de constatar que a percentagem de inquiridos que possui
PDA aumenta à medida que a categoria de rendimento aumenta.
As variáveis dependentes devem assumir uma escala de medida quantitativa enquanto que
as variáveis independentes, a serem seleccionadas, deverão assumir uma tipologia categórica
podendo esta ser numérica ou alfanumérica.
Nota: O utilizador pode especificar diversas variáveis independentes em Layer (no mesmo layer). Assim,
os resultados s~erão apresentados numa tabela cruzada, em oposição a várias tabelas separadas para
cada variável independente seleccionada.
Seleccionar OK
No exemplo dado, verifica-se que os respondentes do género feminino têm, em média, uma
idade inferior aos do sexo masculino.