Escolar Documentos
Profissional Documentos
Cultura Documentos
Como Se Familiarizar Com Seu Banco de Dados
Como Se Familiarizar Com Seu Banco de Dados
Construo de BD
O banco de dados (BD) pode ser construdo diretamente no SPSS ou em qualquer tipo de planilha eletrnica (como por exemplo Excel)
Principal desvantagem: ausncia de um sistema de controle de entrada de dados
Alternativa: EpiData que pode ser obtido gratuitamente no endereo http://www.epidata.dk/
Construo de BD
Construo de BD
Usando o Excel lembrar que:
Cada varivel s pode aparecer uma vez no banco, no podendo haver 2 colunas com o mesmo nome. No incluir no nome de uma varivel acentos, cedilhas, espaos ou caracteres especiais (%, vrgulas, pontos, *, & ...), pois dependendo da verso do SPSS, eles sero lidos de um jeito diferente. Mesmo j existindo a numerao padro do excel, deve existir uma coluna enumerando os casos no arquivo.
Construo de BD
Usando o Excel lembrar que:
Para facilitar a digitao, algumas linhas e algumas colunas podem ficar fixas na planilha. Por exemplo se voc quer fixar o nome do paciente (coluna b) e o nome das variveis (linha 1), ento deve colocar o cursor na clula B2 e clicar em Janela no menu superior, e depois em congelar painis. Neste caso, em qualquer ponto da planilha que voc estiver, sempre aparecer o nome do paciente e o nome da varivel.
Construo de BD
Construo de BD
Caso voc use a verso 2010 do Excel:
Para facilitar a digitao, algumas linhas e algumas colunas podem ficar fixas na planilha. Por exemplo se voc quer fixar o nome do paciente (coluna b) e o nome das variveis (linha 1), ento deve colocar o cursor na clula B2 e clicar em Exibio no menu superior, e depois em Congelar Painis. Neste caso, em qualquer ponto da planilha que voc estiver, sempre aparecer o nome do paciente e o nome da varivel.
Construo de BD
Construo de BD
O ideal que daqui em diante os prximos passos sejam executados no arquivo milsa.xls
Construo de BD Vamos iniciar o uso do SPSS. Como exemplo vamos usar o arquivo milsa.xls.
O ideal que daqui em diante os prximos passos sejam executados nesse arquivo, que pode ser obtido em:
http://www.mat.ufrgs.br/~camey/HCPA/
Iniciando o SPSS
Quando abrimos o SPSS ele tem a seguinte aparncia:
Clicar aqui
Clicar aqui
Clicar aqui
Clicar 2x aqui
Escolher esta opo se houver o nome das variveis na 1a. linha do arquivo Excel
Clicar aqui
Clicar aqui
Nesta coluna podemos colocar os rtulos das variveis. Basta clicar em uma das caselas e digitar o rtulo.
Nesta coluna podemos colocar os rtulos das categorias. Clicando na 2a. casela.
Clique aqui
Regio:
1: capital 2: interior
Nesta coluna podemos definir o no. de casas decimais. Basta clicar em uma das caselas e digitar o no. de casas decimais ou usar as setas.
Clicar aqui
Podem ser definidos at 3 valores diferentes. No nosso exemplo o valor perdido definido pelo nmero 9.
Clicar aqui
Esta a janela do arquivo de sintaxe. O arquivo de sintaxe pode ser construdo em qualquer editor de texto e conveniente que seja salvo com a terminao .sps
Os rtulos devem estar entre aspas simples e o cdigo do dado perdido est entre parnteses.
Todos os comandos devem terminar com ponto final.
Agora voc deve definir os rtulos de variveis e categorias para todas as variveis!
Clicando aqui aps selecionar o comando com o mouse, o comando ser executado.
Limpeza do BD
Aps colocar todos os rtulos e definir quais so os valores perdidos devemos fazer uma distribuio de frequncias de todas as variveis para detectar possveis erros de digitao.
Limpeza do BD
Clicar aqui
Limpeza do BD
Clicar aqui depois de selecionar todas as variveis com o mouse. Depois clicar em OK.
Limpeza do BD
Quando esse comando executado, uma nova janela aberta: a janela de resultados.
Limpeza do BD
Aqui temos todas as variveis analisadas, o nmero de casos vlidos e o nmero de casos perdidos. Por exemplo: temos 13 observaes perdidas na varivel Regio onde mora e 23 observaes vlidas.
Como se familiarizar com seu banco de dados
Limpeza do BD
Limpeza do BD
Nmero do Suj eito
Como esta a varivel de identificao dos casos no podemos ter nenhuma freqncia diferente de 1, pois neste caso teramos dois sujeitos com a mesma identificao.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 Total
Frequency 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 36
Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0
Valid Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0
Cumulative Percent 2,8 5,6 8,3 11,1 13,9 16,7 19,4 22,2 25,0 27,8 30,6 33,3 36,1 38,9 41,7 44,4 47,2 50,0 52,8 55,6 58,3 61,1 63,9 66,7 69,4 72,2 75,0 77,8 80,6 83,3 86,1 88,9 91,7 94,4 97,2 100,0
Limpeza do BD
Varivel Estado civil:
Estado civ il Frequency 16 19 1 36 Percent 44,4 52,8 2,8 100,0 Valid Percent 44,4 52,8 2,8 100,0 Cumulative Percent 44,4 97,2 100,0
Valid
Aqui encontramos um problema: na distribuio de frequncia aparece um cdigo 4. Temos que identificar qual o caso e corrigi-lo.
Limpeza do BD
Temos vrias maneiras de localizar o caso. Uma delas marcando a coluna da varivel onde se encontra o problema e depois clicar em Find.
Limpeza do BD
Limpeza do BD
Limpeza do BD
Limpeza do BD
Varivel Grau de instruo:
Aqui no h inconsistncia.
Grau de instruo Frequency 12 18 6 36 Percent 33,3 50,0 16,7 100,0 Valid Percent 33,3 50,0 16,7 100,0 Cumulative Percent 33,3 83,3 100,0
Valid
Uma das possveis observaes que podemos fazer : h 33,3% de pessoas que concluram o Ensino Fundamental.
Como se familiarizar com seu banco de dados
Limpeza do BD
Varivel Nmero de filhos:
Nesta varivel aparece um sujeito com 55 filhos. Devemos novamente localizar o sujeito e verificar se a informao est correta.
Nmero de filhos Frequency 4 5 7 3 1 1 21 15 36 Percent 11,1 13,9 19,4 8,3 2,8 2,8 58,3 41,7 100,0 Valid Percent 19,0 23,8 33,3 14,3 4,8 4,8 100,0 Cumulative Percent 19,0 42,9 76,2 90,5 95,2 100,0
Valid
Missing Total
0 1 2 3 5 55 Total System
Limpeza do BD
Agora vamos ver outra maneira de localizar o caso. Quando o valor procurado for o maior ou o menor de todos, basta marcar a coluna da varivel onde se encontra o problema, clicar com o boto direito do mouse e depois clicar em Sort Descending ou Sort Ascending, dependendo do caso.
Como se familiarizar com seu banco de dados
Limpeza do BD
Identificado o sujeito e o erro, devemos corrigir o banco. Neste caso corrija para 5.
Limpeza do BD
Nmero de salrios mnimos
Valid
A partir da tabela podemos ver que 50,0% dos sujeitos ganham no mximo 9,8 salrios mnimos.
4,00 4,56 5,25 5,73 6,26 6,66 6,86 7,39 7,44 7,59 8,12 8,46 8,74 8,95 9,13 9,35 9,77 9,80 10,53 10,76 11,06 11,59 12,00 12,79 13,23 13,60 13,85 14,69 14,71 15,99 16,22 16,61 17,26 18,75 19,40 23,30 Total
Frequency 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 36
Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0
Valid Percent 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 2,8 100,0
Cumulative Percent 2,8 5,6 8,3 11,1 13,9 16,7 19,4 22,2 25,0 27,8 30,6 33,3 36,1 38,9 41,7 44,4 47,2 50,0 52,8 55,6 58,3 61,1 63,9 66,7 69,4 72,2 75,0 77,8 80,6 83,3 86,1 88,9 91,7 94,4 97,2 100,0
Limpeza do BD
Idade - anos
Varivel Idade-anos:
Valid
H um sujeito com idade igual a 330. Escolha um dos mtodos descritos anteriormente e corrija a idade do sujeito para 33.
20 23 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 46 48 330 Total
Frequency 1 1 1 2 1 1 1 2 2 2 1 2 2 2 2 1 1 2 2 1 2 1 1 1 1 36
Percent 2,8 2,8 2,8 5,6 2,8 2,8 2,8 5,6 5,6 5,6 2,8 5,6 5,6 5,6 5,6 2,8 2,8 5,6 5,6 2,8 5,6 2,8 2,8 2,8 2,8 100,0
Valid Percent 2,8 2,8 2,8 5,6 2,8 2,8 2,8 5,6 5,6 5,6 2,8 5,6 5,6 5,6 5,6 2,8 2,8 5,6 5,6 2,8 5,6 2,8 2,8 2,8 2,8 100,0
Cumulative Percent 2,8 5,6 8,3 13,9 16,7 19,4 22,2 27,8 33,3 38,9 41,7 47,2 52,8 58,3 63,9 66,7 69,4 75,0 80,6 83,3 88,9 91,7 94,4 97,2 100,0
Limpeza do BD
Varivel Idade-meses:
No h inconsistncia.
Idade - meses Frequency 4 1 3 1 3 5 3 6 3 1 4 2 36 Percent 11,1 2,8 8,3 2,8 8,3 13,9 8,3 16,7 8,3 2,8 11,1 5,6 100,0 Valid Percent 11,1 2,8 8,3 2,8 8,3 13,9 8,3 16,7 8,3 2,8 11,1 5,6 100,0 Cumulative Percent 11,1 13,9 22,2 25,0 33,3 47,2 55,6 72,2 80,6 83,3 94,4 100,0
Valid
0 1 2 3 4 5 6 7 8 9 10 11 Total
Limpeza do BD
Varivel Regio onde mora: H um cdigo 8, identificar o sujeito e corrigir para 9.
Regio onde mora Frequency 12 10 1 23 13 36 Percent 33,3 27,8 2,8 63,9 36,1 100,0 Valid Percent 52,2 43,5 4,3 100,0 Cumulative Percent 52,2 95,7 100,0
Valid
Missing Total
FIM
Agora este banco est pronto para ser analisado!!!
Repita todos os procedimentos com o seu prprio banco de dados.