Você está na página 1de 58

Como se familiarizar com seu banco de dados usando o SPSS

Profa. Suzi Camey


GPPG - Hospital de Clnicas Depto de Estatstica - UFRGS

Como se familiarizar com seu banco de dados

Construo de BD

O banco de dados (BD) pode ser construdo diretamente no SPSS ou em qualquer tipo de planilha eletrnica (como por exemplo Excel)
Principal desvantagem: ausncia de um sistema de controle de entrada de dados
Alternativa: EpiData que pode ser obtido gratuitamente no endereo http://www.epidata.dk/

Como se familiarizar com seu banco de dados

Construo de BD

Usando o Excel lembrar que:


Colocar o nome de cada varivel na primeira linha da planilha;

Cada linha representa um sujeito;


Cada coluna uma varivel; Dados perdidos (missing): mais fcil deixar a casela vazia; No colocar letras em colunas destinadas variveis numricas.

Como se familiarizar com seu banco de dados

Construo de BD
Usando o Excel lembrar que:
Cada varivel s pode aparecer uma vez no banco, no podendo haver 2 colunas com o mesmo nome. No incluir no nome de uma varivel acentos, cedilhas, espaos ou caracteres especiais (%, vrgulas, pontos, *, & ...), pois dependendo da verso do SPSS, eles sero lidos de um jeito diferente. Mesmo j existindo a numerao padro do excel, deve existir uma coluna enumerando os casos no arquivo.

Como se familiarizar com seu banco de dados

Construo de BD
Usando o Excel lembrar que:
Para facilitar a digitao, algumas linhas e algumas colunas podem ficar fixas na planilha. Por exemplo se voc quer fixar o nome do paciente (coluna b) e o nome das variveis (linha 1), ento deve colocar o cursor na clula B2 e clicar em Janela no menu superior, e depois em congelar painis. Neste caso, em qualquer ponto da planilha que voc estiver, sempre aparecer o nome do paciente e o nome da varivel.

Como se familiarizar com seu banco de dados

Construo de BD

Depois clique aqui. Primeiro posicione o cursor nesta casela.

Como se familiarizar com seu banco de dados

Construo de BD
Caso voc use a verso 2010 do Excel:
Para facilitar a digitao, algumas linhas e algumas colunas podem ficar fixas na planilha. Por exemplo se voc quer fixar o nome do paciente (coluna b) e o nome das variveis (linha 1), ento deve colocar o cursor na clula B2 e clicar em Exibio no menu superior, e depois em Congelar Painis. Neste caso, em qualquer ponto da planilha que voc estiver, sempre aparecer o nome do paciente e o nome da varivel.

Como se familiarizar com seu banco de dados

Construo de BD

Depois clique aqui.


Primeiro posicione o cursor nesta casela.

Como se familiarizar com seu banco de dados

Construo de BD

O ideal que daqui em diante os prximos passos sejam executados no arquivo milsa.xls

Como se familiarizar com seu banco de dados

Construo de BD Vamos iniciar o uso do SPSS. Como exemplo vamos usar o arquivo milsa.xls.

O ideal que daqui em diante os prximos passos sejam executados nesse arquivo, que pode ser obtido em:
http://www.mat.ufrgs.br/~camey/HCPA/

Como se familiarizar com seu banco de dados

Iniciando o SPSS
Quando abrimos o SPSS ele tem a seguinte aparncia:

Clicar aqui

Como se familiarizar com seu banco de dados

Lendo dados do Excel


Escolher tipo de arquivo

Clicar aqui

Como se familiarizar com seu banco de dados

Lendo dados do Excel


Escolher tipo de arquivo

Clicar aqui

Como se familiarizar com seu banco de dados

Lendo dados do Excel


Escolher arquivo: primeiro escolher o subdiretrio onde o arquivo se encontra.

Clicar 2x aqui

Como se familiarizar com seu banco de dados

Lendo dados do Excel


Escolher a planilha

Escolher esta opo se houver o nome das variveis na 1a. linha do arquivo Excel

Clicar aqui

Aqui pode ser escolhida a planilha do arquivo Excel

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das variveis e categorias, no. de casas decimais e dados perdidos

Clicar aqui

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das variveis

Nesta coluna podemos colocar os rtulos das variveis. Basta clicar em uma das caselas e digitar o rtulo.

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das variveis

Neste exemplo ficaria assim

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das categorias

Nesta coluna podemos colocar os rtulos das categorias. Clicando na 2a. casela.

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das categorias

Clique aqui

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das categorias

Aqui digite o valor

Aqui digite o rtulo

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das categorias

Para a varivel civil fica assim.

Aps adicionar cada Value e seu Label deve-se clicar aqui.

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Rtulos das categorias: colocar rtulos das variveis abaixo. Instruo:
1: Ensino Fundamental 2: Ensino Mdio 3: Superior

Regio:
1: capital 2: interior

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Casas decimais

Nesta coluna podemos definir o no. de casas decimais. Basta clicar em uma das caselas e digitar o no. de casas decimais ou usar as setas.

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Dados perdidos

Nesta coluna podemos definir quais so os cdigos para valores perdidos.

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Dados perdidos

Clicar aqui

Como se familiarizar com seu banco de dados

Definies: pelo Menu


Dados perdidos

Podem ser definidos at 3 valores diferentes. No nosso exemplo o valor perdido definido pelo nmero 9.

Como se familiarizar com seu banco de dados

Definies: pela sintaxe


Agora vamos definir rtulos das variveis e categorias, no. de casas decimais e dados perdidos construindo um arquivo de sintaxe. Esse mtodo til principalmente quando se pretende fazer anlises parciais do banco de dados, pois cada vez que lemos um BD do Excel temos que reaplicar as definies.

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Clicar aqui

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Esta a janela do arquivo de sintaxe. O arquivo de sintaxe pode ser construdo em qualquer editor de texto e conveniente que seja salvo com a terminao .sps

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Nomes dos comandos

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Nomes das variveis a serem definidas

Como se familiarizar com seu banco de dados

Definies: pela sintaxe


Rtulo da varivel

Nome da categoria Nmero da categoria

Cdigo do valor perdido

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Os rtulos devem estar entre aspas simples e o cdigo do dado perdido est entre parnteses.
Todos os comandos devem terminar com ponto final.

Agora voc deve definir os rtulos de variveis e categorias para todas as variveis!

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Clicando aqui aps selecionar o comando com o mouse, o comando ser executado.

Como se familiarizar com seu banco de dados

Definies: pela sintaxe

Lembrar de salvar a sintaxe!

Como se familiarizar com seu banco de dados

Lembrar de salvar o banco de dados!

Como se familiarizar com seu banco de dados

Limpeza do BD

Aps colocar todos os rtulos e definir quais so os valores perdidos devemos fazer uma distribuio de frequncias de todas as variveis para detectar possveis erros de digitao.

Como se familiarizar com seu banco de dados

Limpeza do BD

Clicar aqui

Como se familiarizar com seu banco de dados

Limpeza do BD

Clicar aqui depois de selecionar todas as variveis com o mouse. Depois clicar em OK.

Como se familiarizar com seu banco de dados

Limpeza do BD

Quando esse comando executado, uma nova janela aberta: a janela de resultados.

Como se familiarizar com seu banco de dados

Limpeza do BD

Aqui temos todas as variveis analisadas, o nmero de casos vlidos e o nmero de casos perdidos. Por exemplo: temos 13 observaes perdidas na varivel Regio onde mora e 23 observaes vlidas.
Como se familiarizar com seu banco de dados

Limpeza do BD

Agora vamos fazer uma anlise de cada uma

das variveis buscando inconsistncias.

Como se familiarizar com seu banco de dados

Limpeza do BD
Nmero do Suj eito

Varivel Nmero do sujeito:


Valid

Como esta a varivel de identificao dos casos no podemos ter nenhuma freqncia diferente de 1, pois neste caso teramos dois sujeitos com a mesma identificao.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Total

Frequency 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 36

Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0

Valid Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0

Cumulative Percent 2,8 5,6 8,3 11,1 13,9 16,7 19,4 22,2 25,0 27,8 30,6 33,3 36,1 38,9 41,7 44,4 47,2 50,0 52,8 55,6 58,3 61,1 63,9 66,7 69,4 72,2 75,0 77,8 80,6 83,3 86,1 88,9 91,7 94,4 97,2 100,0

Como se familiarizar com seu banco de dados

Limpeza do BD
Varivel Estado civil:
Estado civ il Frequency 16 19 1 36 Percent 44,4 52,8 2,8 100,0 Valid Percent 44,4 52,8 2,8 100,0 Cumulative Percent 44,4 97,2 100,0

Valid

Solteiro Casado 4 Total

Aqui encontramos um problema: na distribuio de frequncia aparece um cdigo 4. Temos que identificar qual o caso e corrigi-lo.

Como se familiarizar com seu banco de dados

Limpeza do BD

Temos vrias maneiras de localizar o caso. Uma delas marcando a coluna da varivel onde se encontra o problema e depois clicar em Find.

Como se familiarizar com seu banco de dados

Limpeza do BD

Digitar aqui o valor estranho e depois em Find Next.

Como se familiarizar com seu banco de dados

Limpeza do BD

Depois de identificado o sujeito...

Como se familiarizar com seu banco de dados

Limpeza do BD

... verificar o erro e corrigi-lo.

Como se familiarizar com seu banco de dados

Limpeza do BD
Varivel Grau de instruo:
Aqui no h inconsistncia.
Grau de instruo Frequency 12 18 6 36 Percent 33,3 50,0 16,7 100,0 Valid Percent 33,3 50,0 16,7 100,0 Cumulative Percent 33,3 83,3 100,0

Valid

Ensino Fundamental Ensino Mdio Supeior Total

Uma das possveis observaes que podemos fazer : h 33,3% de pessoas que concluram o Ensino Fundamental.
Como se familiarizar com seu banco de dados

Limpeza do BD
Varivel Nmero de filhos:
Nesta varivel aparece um sujeito com 55 filhos. Devemos novamente localizar o sujeito e verificar se a informao est correta.
Nmero de filhos Frequency 4 5 7 3 1 1 21 15 36 Percent 11,1 13,9 19,4 8,3 2,8 2,8 58,3 41,7 100,0 Valid Percent 19,0 23,8 33,3 14,3 4,8 4,8 100,0 Cumulative Percent 19,0 42,9 76,2 90,5 95,2 100,0

Valid

Missing Total

0 1 2 3 5 55 Total System

Como se familiarizar com seu banco de dados

Limpeza do BD

Agora vamos ver outra maneira de localizar o caso. Quando o valor procurado for o maior ou o menor de todos, basta marcar a coluna da varivel onde se encontra o problema, clicar com o boto direito do mouse e depois clicar em Sort Descending ou Sort Ascending, dependendo do caso.
Como se familiarizar com seu banco de dados

Limpeza do BD

Identificado o sujeito e o erro, devemos corrigir o banco. Neste caso corrija para 5.

Como se familiarizar com seu banco de dados

Limpeza do BD
Nmero de salrios mnimos

Varivel Nmero de salrios mnimos: Nesta varivel no h inconsistncia.

Valid

A partir da tabela podemos ver que 50,0% dos sujeitos ganham no mximo 9,8 salrios mnimos.

4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,44 7,59 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 Total

Frequency 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 36

Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0

Valid Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0

Cumulative Percent 2,8 5,6 8,3 11,1 13,9 16,7 19,4 22,2 25,0 27,8 30,6 33,3 36,1 38,9 41,7 44,4 47,2 50,0 52,8 55,6 58,3 61,1 63,9 66,7 69,4 72,2 75,0 77,8 80,6 83,3 86,1 88,9 91,7 94,4 97,2 100,0

Como se familiarizar com seu banco de dados

Limpeza do BD
Idade - anos

Varivel Idade-anos:
Valid

H um sujeito com idade igual a 330. Escolha um dos mtodos descritos anteriormente e corrija a idade do sujeito para 33.

20 23 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 46 48 330 Total

Frequency 1 1 1 2 1 1 1 2 2 2 1 2 2 2 2 1 1 2 2 1 2 1 1 1 1 36

Percent 2,8 2,8 2,8 5,6 2,8 2,8 2,8 5,6 5,6 5,6 2,8 5,6 5,6 5,6 5,6 2,8 2,8 5,6 5,6 2,8 5,6 2,8 2,8 2,8 2,8 100,0

Valid Percent 2,8 2,8 2,8 5,6 2,8 2,8 2,8 5,6 5,6 5,6 2,8 5,6 5,6 5,6 5,6 2,8 2,8 5,6 5,6 2,8 5,6 2,8 2,8 2,8 2,8 100,0

Cumulative Percent 2,8 5,6 8,3 13,9 16,7 19,4 22,2 27,8 33,3 38,9 41,7 47,2 52,8 58,3 63,9 66,7 69,4 75,0 80,6 83,3 88,9 91,7 94,4 97,2 100,0

Como se familiarizar com seu banco de dados

Limpeza do BD
Varivel Idade-meses:
No h inconsistncia.
Idade - meses Frequency 4 1 3 1 3 5 3 6 3 1 4 2 36 Percent 11,1 2,8 8,3 2,8 8,3 13,9 8,3 16,7 8,3 2,8 11,1 5,6 100,0 Valid Percent 11,1 2,8 8,3 2,8 8,3 13,9 8,3 16,7 8,3 2,8 11,1 5,6 100,0 Cumulative Percent 11,1 13,9 22,2 25,0 33,3 47,2 55,6 72,2 80,6 83,3 94,4 100,0

Valid

0 1 2 3 4 5 6 7 8 9 10 11 Total

Como se familiarizar com seu banco de dados

Limpeza do BD
Varivel Regio onde mora: H um cdigo 8, identificar o sujeito e corrigir para 9.

Regio onde mora Frequency 12 10 1 23 13 36 Percent 33,3 27,8 2,8 63,9 36,1 100,0 Valid Percent 52,2 43,5 4,3 100,0 Cumulative Percent 52,2 95,7 100,0

Valid

Missing Total

capital interior 8 Total 9

Como se familiarizar com seu banco de dados

FIM
Agora este banco est pronto para ser analisado!!!
Repita todos os procedimentos com o seu prprio banco de dados.

Como se familiarizar com seu banco de dados

Você também pode gostar