Escolar Documentos
Profissional Documentos
Cultura Documentos
Data
Autor
1.0
18/06/2015
Joo Tiago
Fonte: Manual de utilizao da PSE Applets para SPSS (PSE Produtos e Servios de Estatstica, Lda)
1 Introduo
O IBM SPSS Statistics, o software de anlise estatstica com maior quota de mercado no
poderamos deixar de colocar disposio dos seus utilizadores o conhecimento acumulado da PSE
(empresa distribuidora do IBM SPSS Statistics ) de modo a facilitar processos de preparao e de
anlise de dados que, sendo possveis de forma nativa no software, requerem tarefas mais ou
menos complexas. Esta a razo de existncia da aplicao que designamos por PSE applets for
SPSS.
Nesta primeira verso inclumos 4 processos de preparao de dados:
Juno de casos
Juno de variveis
Extrao de caracteres
Criao de ndices
Todos os processos so possveis de realizar no IBM SPSS Statistics atravs de sintaxe, de mltiplas
opes de menus ou pela repetio de um mesmo procedimento. Nos menus que crimos
facilitamos a realizao dos processos indicados atravs de um interface nico (uma caixa de
dilogo) o utilizador faz as especificaes do que pretende e obtm um resultado.
A cada menu est associado um boto de Help onde pode aceder informao sobre cada
processo. Para alm disso, crimos este manual em que de uma forma mais detalhada o ajudamos
na utilizao da aplicao PSE applets for SPSS.
Esta aplicao estar disponvel comercialmente seja para utilizao dos atuais utilizadores SPSS, de
acordo com a politica comercial definida pela PSE, seja para novos utilizadores.
Para novos utilizadores a PSE passa a disponibilizar a soluo SPSS for Statistical Analysis que, para
alm de incluir o software IBM SPSS Statistics em qualquer configurao, incluir tambm a
aplicao PSE applets for SPSS.
A aplicao PSE applets for SPSS s pode ser utilizada com as verses de software IBM SPSS
Statistics 21 ou superior.
2 Juno de Casos
A utilizao deste procedimento tem as seguintes vantagens face queles que esto disponveis
nativamente com o IBM SPSS Statistics:
Permite identificar o ficheiro de origem de cada caso presente no novo ficheiro de dados.
2.1 Funcionalidades
Este menu permite juntar informaao proveniente de um mnimo de 2 at um mximo de 50
ficheiros SPSS (.sav) utilizando uma caixa de dilogo de fcil utilizao.
Para executar o procedimento todos os ficheiros tm de estar no formato SPSS e, os ficheiros a
serem juntos, disponveis numa nica pasta de dados. As designaes das variveis devero ser as
mesmas, por forma a que se consiga juntar diversos casos para uma mesma varivel.
O utilizador pode selecionar, a partir do ficheiro principal, as variveis para que pretende juntar
informao. As restantes variveis, no selecionadas, no sero consideradas no novo ficheiro de
dados. Esta funcionalidade extremamente til quando o ficheiro principal, ou qualquer um dos
outros ficheiros a juntar, contm um nmero elevado de variveis e muitas delas no so de
interesse para uma qualquer anlise em que necessita de juntar informao distribuda.
Por exemplo, consideremos que analista de vendas de uma empresa e que dispe de um ficheiro de
vendas para cada distrito. Esses ficheiros contm informao diversa e normalizada em que, para
alm do volume de vendas, contm muita outra informao. Se o seu objetivo exclusivamente o de
prever a evoluo do volume de vendas, -lhe muito til poder juntar a informao dos 18 ficheiros
num nico e somente com uma varivel de data, uma outra de localizao e outra de volume de
vendas.
O resultado de juno um novo dataset (ficheiro de dados) que contm todos os casos
(anteriormente dispersos por todos os ficheiros) e as variveis especificadas no procedimento. Os
casos do ficheiro principal encontram-se no incio do novo dataset, seguindo-se os restantes casos
UNIVERSIDADE NOVA DE LISBOA
ENSP Escola Nacional de Sade Pblica
dos ficheiros identificados na pasta de dados, definida pelo analista. No final do novo dataset
criada automaticamente uma varivel que 7
identifica o ficheiro de origem de cada caso. uma varivel numrica em que o descritivo de cada
nmero o nome do respetivo ficheiro de dados origem.
No ficheiro de resultados do SPSS (Output) so listados os ficheiros e as variveis utilizadas no
procedimento.
2.2 Utilizao
Depois de abrir o ficheiro de dados principal, clique no menu Custom e selecione a opo Juno de
casos. Aparece no ecr a seguinte janela:
Na opo Lista de variveis disponveis, aparecero as variveis existentes no ficheiro principal. Por
ficheiro principal, referimo-nos ao ficheiro a partir do qual sero identificadas as variveis possveis
de utilizar na execuo do procedimento.
Para executar a operao de juno tem que obrigatoriamente especificar a pasta onde se
encontram os ficheiros a juntar com o ficheiro principal aberto. Clique no boto Browse e selecione
a pasta que contm os ficheiros a juntar. Quando estiver dentro da pasta que pretende selecionar,
clique no boto Open. O caminho completo especificado na caixa Folder name.
Na imagem abaixo foi especificada a pasta EXEMPLO - JUNO DE CASOS. Esta pasta inclui os
ficheiros que pretendemos juntar. Apenas considerado o contedo desta pasta, no o contedo
das subpastas.
Aps selecionar a opo Open, o caminho para a pasta de interesse encontrar-se- j definido,
conforme prxima imagem.
Para especificar as variveis de interesse no ficheiro final, selecione as variveis da Lista de variveis
disponveis e arraste-as para a lista na parte direita da janela e denominada por Variveis a incluir
no ficheiro final.
Nota:
As variveis utilizadas no procedimento de juno de casos podem assumir qualquer escala de
medida (Nominal, Ordinal, Scale, Data e String (alfanumricas). Variveis de resposta mltipla no
podero ser utilizadas neste procedimento.
Em Pretendo identificar para cada caso o ficheiro de origem (seleo opcional), o analista tem a
possibilidade de identificar a que ficheiro de dados correspondem os casos adicionados. A
designao da nova varivel corresponder a FICHEIRO_FONTE e assumir tantos valores quanto o
nmero de ficheiros de dados utilizados na operao de juno. Cada valor ter como descritivo a
designao de um ficheiro de dados.
Finalmente, so apresentados cinco botes para efeitos de execuo:
OK Corresponde execuo do procedimento. Esta opo tem como retorno a criao de
dois novos ficheiros. Um ficheiro de dados cuja designao
O dataset JUNCAO contm todos os casos que existem nos ficheiros juntos (no nosso exemplo,
existem na pasta 3 ficheiros).
Adicionalmente, ser produzido o seguinte resultado na janela Output:
Paste Tal como acontece com os restantes procedimentos de menu do IBM SPSS
Statistics, esta opo corresponde apresentao dos comandos de programao
associados ao procedimento de juno de casos. Esta janela de programao poder ser
guardada e utilizada conjuntamente com outros comandos de programao disponveis no
IBM SPSS Statistics.
Poder partilh-la com outros analistas, todavia esta partilha s ter sucesso na sua
execuo desde que o menu se encontre implementado no computador dos restantes
utilizadores.
10
Reset Opo que permite limpar definies tidas no menu de juno de casos.
Cancel Opo que permite sair do procedimento de juno de casos.
Help Opo que permite aceder ao sistema de ajuda associado ao procedimento de
juno de casos.
11
Consideraes
O dataset principal tem que ser um ficheiro SPSS arquivado numa pasta de dados. Este
ficheiro pode estar arquivado na mesma pasta que os outros ficheiros a juntar.
Sugerimos que, antes de proceder juno de casos, mantenha apenas o ficheiro principal
aberto. Os restantes devero manter-se fechados na respetiva pasta de dados.
12
3 Juno de variveis
Este procedimento permite juntar variveis a um ficheiro de dados com origem de mltiplos
ficheiros SPSS de um mnimo de 2 a um mximo de 50 - atravs de um interface grfico e de uma
nica vez. No IBM SPSS Statistics, atravs da opo de menu Data Merge Files Add Variables, s
possvel juntar variveis de 1 ficheiro de dados em cada operao.
3.1 Funcionalidades
Para executar o procedimento todos os ficheiros a incluir no procedimento devem estar no formato
SPSS (.sav) e colocados numa nica pasta de dados.
Existem duas opes no que respeita ao processo de juno de variveis - Com ou sem especificao
de varivel(eis) chave.
Aconselhamos a que s proceda a esta operao utilizando pelo menos uma varivel chave que,
devendo ser unvoca, garante a correta incluso da informao das variveis a juntar nos casos
existentes no designado ficheiro principal.
Ao especificar uma ou mais variveis chave (obrigatoriamente comuns a todos os ficheiros de dados
a utilizar), estas devero ter a mesma designao e o mesmo tipo em todos os ficheiros.
A opo de menu de juno de variveis permite identificar a forma como a informao em todos os
ficheiros ser identificada univocamente (Variveis chave), ou seja, como sero ligados os diferentes
ficheiros com o ficheiro principal a cujos casos sero juntos a informao contida nas novas variveis
a juntar.
Ao executar este procedimento obter dois resultados - um novo dataset que ir conter todos os
casos e as variveis do ficheiro principal juntamente com as variveis identificadas para juno e
provenientes dos restantes ficheiros de dados. Adicionalmente, um ficheiro de resultados SPSS
(Output) que identificar os ficheiros e as variveis juntas e possveis inconsistncias que possam
ocorrer. (Por exemplo, se estiver a utilizar uma varivel chave que, sendo do tipo alfanumrico,
apresente o campo Width diferente entre os diversos ficheiros, ser reportada uma inconsistncia).
13
3.2 Utilizao
Nota:
Para exemplificar uma aplicao prtica desta opo de menu foram criados 3 ficheiros de
dados - ADDVARS_1.sav (que corresponder ao ficheiro principal), ADDVARS_2.sav e
ADDVARS_3.sav.
Os dois ltimos ficheiros encontram-se numa pasta com o seguinte caminho:
ADDVARS_1.sav
ADDVARS_2.sav
ADDVARS_3.sav
Variveis
1. ID
1. ID
1. ID
14
2. *A
2. B
2. C
onde a varivel ID corresponder varivel chave (isto a varivel que permitir associar
univocamente os casos de todos os ficheiros). O ficheiro final conter as variveis ID, A, B e
C, mantendo para cada caso a respetiva correspondncia entre ficheiros.
Depois de abrir o ficheiro de dados, clique no menu Custom e selecione a opo Juno de
variveis.
No ecr aparecer uma janela igual da imagem seguinte:
Para executar a juno de variveis tem que obrigatoriamente especificar a pasta onde se
encontram os ficheiros a juntar ao ficheiro principal (que est aberto).
Clique no boto Browse e selecione a pasta que contem os ficheiros a juntar.
UNIVERSIDADE NOVA DE LISBOA
ENSP Escola Nacional de Sade Pblica
15
Quando estiver dentro da pasta que pretende selecionar, clique no boto Open
O caminho completo especificado na caixa Folder name.
Na imagem abaixo foi especificada a pasta EXEMPLO - JUNO DE VARIVEIS. Esta pasta inclui os
ficheiros que pretendemos juntar. Apenas considerado o contedo desta pasta, no o contedo
das subpastas.
Aps selecionar a opo Open, o caminho para a pasta encontrar-se- j definido, conforme
prxima imagem.
16
gerado um novo dataset gerado com a designao JUNCAO, onde os casos sero juntos
de forma sequencial em cada varivel. Nada garante que a informao relativa ao caso com
o ID 1 seja igual informao para este ID em cada um dos 3 ficheiros. Tal s ocorrer se os
3 ficheiros estiverem ordenados da mesma forma pela varivel ID.
17
Para evitar quaisquer problemas de inconsistncia da informao para cada caso, na caixa Variveis
chave deve especificar a(s) varivel(eis) que constituiro a chave nivoca de ligao entre os
ficheiros de dados.
Da caixa Lista de variveis disponveis deve selecionar as variveis a incluir como variveis chave e
com o boto coloc-las na caixa Variveis chave.
Retomamos o nosso exemplo, desta vez especificando a varivel ID em Variveis chave.
18
Um novo dataset com a designao JUNCAO, onde a informao constante para cada caso
corresponde informao que cada ID tinha nos ficheiros iniciais.
19
Reset Opo que permite limpar definies tidas no menu de juno variveis.
Cancel Opo que permite sair do procedimento de juno de variveis.
Help Opo que permite aceder ao sistema de ajuda associado ao procedimento de
juno de variveis.
20
Consideraes
O dataset principal tem de ser um ficheiro SPSS arquivado numa pasta de dados. Este
ficheiro pode estar arquivado na mesma pasta que os outros ficheiros a juntar.
Quando se especifica uma (ou mais) variveis chave, estas tm que conter as mesmas
designaes (Name), o mesmo tipo (Type) e o mesmo formato (Width e Decimals) em todos
os ficheiros a juntar. Caso contrrio, no ficheiro de resultados SPSS (Output) ser feita a
respetiva referncia como erro.
21
S o ficheiro principal deve estar aberto no IBM SPSS Statistics e todos os outros fechados e
arquivados na pasta indicada.
22
4 Extrao de carateres
Este menu permite muito facilmente extrair informao de variveis alfanumricas, o que s
possvel de fazer no IBM SPSS Statistics atravs de programao em sintaxe.
De uma forma fcil extrai informao com um nmero fixo ou varivel de carateres, com uma
determinada posio e/ou delimitados por determinados carateres. A execuo do procedimento
feita exclusivamente pela utilizao de caixas de dilogo.
4.1 Funcionalidades
So vrias as opes que o utilizador tem para proceder extrao de carateres, incluindo a
possibilidade de, a partir da informao existente numa varivel, criar mltiplas variveis. Todas as
opes de seleo sero descritas adiante.
Tudo o que tem a fazer indicar a varivel donde pretende extrair a informao e qual a operao a
realizar.
O resultado que se obtm aps executar este procedimento a criao no ficheiro de dados em
utilizao de novas variveis com a informao extrada de uma varivel existente.
4.2 Utilizao
Para exemplificar a utilizao deste procedimento vamos utilizar diferentes ficheiros de dados com
pouca informao mas ilustrativos de cada uma das operaes.
23
24
Extrair N carateres a partir de uma posio Nesta operao o utilizador apenas necessita
de indicar o nmero de carateres a extrair e a posio (nmero de carater) a partir da qual
se iniciar a extrao.
Nota: A posio indicada contar para a extrao.
O resultado final ser a criao de uma nova varivel cod_post(nome da varivel original)_EXTR
contendo os carateres de interesse.
25
Extrair carateres do incio at encontrar o carater Com esta opo sero extrados todos os
carateres desde o incio at que seja identificado o delimitador especificado pelo analista.
O delimitador parte integrante da nova varivel.
No exemplo abaixo queremos extrair todos os carateres desde o incio at ser encontrado o carater
-.
UNIVERSIDADE NOVA DE LISBOA
ENSP Escola Nacional de Sade Pblica
26
Extrair N carateres a partir do carater Com esta seleo todos os carateres contidos aps o
delimitador especificado, sero extrados. O delimitador tambm contar como carater.
27
Extrair tudo entre dois carateres Opo que permite extrair os carateres contidos entre
dois carateres delimitadores.
Num ficheiro que descreve os distritos, os concelhos e as freguesias, existe uma varivel que
conjuga os cdigos de cada uma dessas variveis identificando cada um com 2 carateres. Cada
cdigo est separado elo carater -. Ou seja na varivel CODIGOS as duas primeiras posies so o
cdigo do distrito, as duas posies intermdias correspondem ao cdigo dos concelhos e,
finalmente, as duas ltimas posies correspondem ao cdigo da freguesia.
UNIVERSIDADE NOVA DE LISBOA
ENSP Escola Nacional de Sade Pblica
28
29
Extrair blocos separados pelo carater Opo muito til quando se pretende gerar blocos
de variveis. Blocos de variveis correspondem a novas variveis (at um mximo de dez)
cujo contedo corresponder ao texto especificado na varivel de origem e que tem de
conter um delimitador. O delimitador far a separao de informao a ser apresentada nas
novas variveis geradas.
30
31
32
Consideraes
33
Criao de ndice
A utilizao deste procedimento tem as seguintes vantagens face queles que esto disponveis
nativamente com o IBM SPSS Statistics:
Criao de um ndice para numerar sequencialmente todos os casos num ficheiro de dados
SPSS.
Criao de um ndice para numerar os casos de acordo com os valores assumidos por uma
varivel ou um grupo de variveis. Os casos em que a(s) varivel(eis) especificadas tm o
mesmo valor, assumem o mesmo nmero de ndice.
Ordenao dos casos com o mesmo nmero de ndice de acordo com os valores assumidos
por uma ou mais variveis selecionadas.
Criao de uma varivel que conta o nmero de casos dentro do mesmo ndice
Estas operaes so possveis no IBM SPSS Statistics atravs de comandos de sintaxe, enquanto que
no PSE applets for SPSS obtm-se atravs de caixas de dilogo.
5.1 Funcionalidades
Ao abrir o procedimento, e sem fazer qualquer seleo, se escolher o boto de opo OK
automaticamente criada uma varivel designada INDICE que contm a numerao sequencial de
todos os casos do ficheiro de dados na ordem em que eles se encontram.
Se colocar uma varivel na caixa Variveis de criao do ndice ser criado um ndice para cada
valor dessa varivel e cada caso ser identificado pelo respetivo ndice.
Caso pretenda ordenar os casos com o mesmo ndice de acordo com os valores assumidos por uma
ou mais variveis, deve colocar estas na caixa Variveis que determinam a ordem dentro do ndice.
Caso pretenda numerar sequencialmente os casos que tenham o mesmo nmero de ndice basta
selecionar a opo Numerar sequencialmente os casos dentro de cada ndice.
Caso pretenda obter a informao sobre o nmero de casos includos em cada nmero de ndice
deve selecionar a opo Nmero de casos em cada ndice.
A execuo deste procedimento tem como resultado a criao de novas variveis no final do ficheiro
de dados conforme as escolhas efetuadas.
34
5.2 Utilizao
O exemplo, que vamos utilizar para ilustrar este procedimento, apresenta para um conjunto de
indivduos (identificados com a varivel ID) os respetivos anos de escolaridade. Para cada caso
tambm indicado o concelho e o distrito (e respetivos cdigos) a que pertence. Com base nesta
ltima informao sero criados as nossas variveis de ndice.
35
Assim que acede ao menu de criao de ndice, pode, sem especificar uma varivel obter um ndice
sequencial de casos (conforme indicao no canto inferior esquerdo).
No ficheiro de dados surgir uma nova varivel INDICE que lhe permite identificar,
exclusivamente, os casos presentes.
No nosso exemplo o ndice assume os valores de 1 a 13 que correspondem aos 13 casos do ficheiro
de dados, conforme prxima imagem.
36
Em Lista de variveis disponveis sero identificadas todas as variveis disponveis no seu ficheiro
de dados.
Em Variveis de criao do ndice devero ser colocadas todas as variveis para efeitos de criao
de um ndice para cada valor que assumam (se selecionar mais que uma varivel, cada ndice
corresponder a uma combinao dos respetivos valores). Para o caso de incluir duas ou mais
variveis, a criao do ndice respeitar a ordem de variveis colocadas.
Vejamos os prximos exemplos:
O ficheiro de dados ser ordenado pelos cdigos dos Concelhos. A varivel ndice assumir dois
cdigos: 1 respeitante ao concelho (01) - e 2 respeitante ao concelho (11).
37
O ficheiro de dados ser ordenado pelos cdigos dos Concelhos (01 e 11) e seguidamente pelos
cdigos do distrito (01, 03 e 11).
Selecionando uma ou mais variveis em Variveis que determinam a ordem dentro do ndice tem a
possibilidade de determinar a ordenao de casos dentro de cada grupo gerado. Para o caso de
incluir duas ou mais variveis, a ordenao do ndice respeitar a ordem de variveis colocadas.
No nosso exemplo, vamos supor que pretendemos que a varivel INDICE seja gerada com base nos
cdigos dos distritos e a sua apresentao seja feita com base numa ordenao por designao dos
descritivos.
De referir que caso pretenda especificar apenas informao nesta seo, o procedimento tambm o
permite.
No prximo exemplo, pretendemos a apresentao de resultados com base na descrio dos
concelhos.
38
O ndice gerado, corresponder ordenao sequencial dos casos (dado que no especificamos
variveis na seo de variveis a constiturem grupos), mas ordenados de forma alfabtica
(ascendente) consoante os descritivos assumidos pela varivel selecionada (Concelho_desc).
Em Operaes sobre ndices com mltiplos casos o utilizador poder selecionar uma ou mais das
opes disponveis:
Numerar sequencialmente os casos dentro de cada ndice Opo que ter como retorno a
criao de uma nova varivel - INDICE_SEQUENCIAL que listar sequencialmente os casos
identificados. A partir do momento que o ndice identifica um novo caso, este contador
inicia-se.
Como se pode verificar, existem dois cdigos de concelho (apresentados nova varivel INDICE). A
contagem sequencial varivel INDICE_SEQUENCIAL lista, para o cdigo de concelho 01 os 7
primeiros casos. De seguida, o contador inicia-se (correspondente ao novo cdigo 11 do Concelho,
sendo os restantes 6 casos referentes ao segundo concelho identificado.
Nmero de casos em cada ndice Para o caso de pretender saber quantos casos pertencem
a cada grupo (ou nmero de ndice). Para o efeito, ser apresentada a varivel N_CASOS_GRUPO que listar as respetivas ocorrncias.
39
40
Consideraes
A criao do ndice feita por ordem ascendente dos valores ordenados do ficheiro de
dados ou das variveis selecionadas para definio de grupos.
Caso no ficheiro de dados j tenham criadas variveis de ndice (atravs do menu Criao de
ndice) e pretenda voltar a executar uma outra vez este procedimento (por exemplo, porque
tem outro critrio definido de criao de ndices) alertamos que, por defeito, as variveis
sero recalculadas. Se pretender manter os vrios ndices criados, sugerimos que atribua
novas designaes s variveis criadas pelo procedimento.
41