DEPARTAMENTO DE ECONOMIA AGRCOLA PROGRAMA DE PS-GRADUAO EM ECONOMIA RURAL
CURSO DE NOES BSICAS: SOFTWARE STATA E EXTRAO DOS DADOS DA PNAD
AGOSTO, 2014 SUMRIO 1
O SOFTWARE STATA.................................................................................. 02 1 APRESENTAO DO STATA.12................................................................. 02 1.1 Iniciando o STATA.12...................................................................................... 02 1.2 Salvando os Comandos.................................................................................... 04 1.3 Principais Operadores..................................................................................... 05 1.4 Executando os Comandos............................................................................... 05 1.4.1 Comandos de Ajuda......................................................................................... 05 1.4.2 Comando de estatstica descritiva.................................................................. 06 1.4.3 Criando novas variveis.................................................................................. 07 1.5 Criando Grficos.............................................................................................. 08
PESQUISA NACIONAL POR AMOSTRA DE DOMICLIOS (PNAD).... 09 2 APRESENTAO DA PNAD........................................................................ 09 2.1 Uma breve Evoluo da PNAD....................................................................... 10 2.2 Abrangncia Geogrfica.................................................................................. 11 2.3 Dados................................................................................................................. 11 2.4 Extrao dos dados.......................................................................................... 13 2.5 Manipulao dos dados no STATA.12............................................................ 17
Mtodos estatsticos para anlise de dados so utilizados por pesquisadores de diversas reas: economia, sociologia, cincias polticas, marketing, epidemiologia, nutrio, sade pblica, etc. Para o processo de anlise dos dados, os pesquisadores necessitam de pacotes que sejam de fcil manipulao e tenham uma ampla variedades de tcnicas estatsticas. Como o caso do Software STATA, que oferece uma variedade de tcnicas estatsticas das mais elementares s mais sofisticadas, tem uma sintaxe simples e usado por meio de linha de comandos de fcil execuo. Foi desenvolvido no Texas (EUA), em 1984, e j distribudo para 132 pases. Periodicamente, o grupo que desenvolve este programa (StataCorp) disponibiliza atualizaes via internet e tem lanado novas verses a cada trs anos, em mdia. O StataCorp tambm mantm a publicao de um peridico (Stata Journal) e uma lista de discusso virtual. O STATA.12 a verso mais atual lanada pela StataCorp, um pacote estatstico completo e integrado que fornece tudo que voc precisa para a anlise de dados e grficos. Com as mais variadas ferramentas estatsticas ao seu alcance como DPD (Painel dinmico de dados), GEE (Estimativas de Equaes Generalizadas), GLM (Modelo Linear Generalizado), ANOVA, padronizao de taxas, tabulaes estatsticas e muito mais. Por sua simplicidade em apresentao, este programa permite usar bancos de dados extensos com um nmero grande de variveis. Admite ainda, que voc tenha um controle de todos os tipos de dados podendo modificar informaes e gerenciar variveis. Sua capacidade permite uma publicao grfica de qualidade, podendo adicionar ttulos, observaes, linhas, setas e textos. No STATA somente um arquivo de dados pode ser aberto e utilizado de cada vez
1.1 Iniciando o STATA.12
O programa pode ser aberto diretamente pelo cone (clicando duas vezes sobre ele) na tela de abertura do Windows. Quando o programa aberto, abre-se uma tela 3
contendo janelas menores, com cabealhos. A finalidade de cada janela apresentada a seguir:
Janela Finalidade Review Janela onde so armazenados os comandos, ou seja, o histrico de comandos executados. Variables Janela que apresenta a lista das variveis do banco de dados ativo. a lista e descrio das variveis. Stata Results Janela que apresenta os resultados obtidos com a execuo dos comandos. Stata Command Janela em que h a digitao dos comandos a serem executados. Properties Janela de propriedades das variveis. Podemos modificar o nome ou a descrio das variveis (Nome ou Label). O cadeado no canto da janela permite o bloqueio ou desbloqueio dos dados.
Obs.: Na janela Stata Command para executar o comando s digita-lo e pressionar a tecla Enter. E assim, o comando ser armazenado na janela Review. Na janela Review, o comando pode ser reutilizado e corrigido utilizando-se o mouse ou as teclas PgUp (page up) e PgDn (page down).
Na Barra de Ferramentas do STATA permite a execuo de diversas tarefas de forma anloga a maioria dos programas para o sistema Windows. Mas essas tarefas, podem ser digitados em forma de comandos (ou rotinas de programao) a partir da janela de programao (Stata Command). O menu que est disponvel na primeira linha e possui os recursos: File Edit Data Graphics Statistics Window e Help
Na Barra de Ferramentas, podemos: Abrir e salvar bases de dados no formato STATA (.dta); Abrir e Salvar grficos criados pelo STATA; Executar programas de comandos criados, do-files ( .do); Importar e salvar arquivos em outros formatos.
4
O STATA trabalha com vrios tipos de arquivos, mas os principais so: Tipo de Arquivo Formato Arquivo que contm os dados .dta Arquivo que guarda os comandos e resultados obtidos durante a sesso de trabalho .log; .smcl Arquivo que contm comandos .do Arquivo que contm sub-rotinas .ado
Na segunda linha encontra-se a Barra de Ferramentas com os cones: Open (use): Carrega ou abre um banco de dados no formato do STATA (.dta). Save: Salva um arquivo no formato do STATA (.dta). Print Results: Imprime a janela de resultados. Log Begin/Close/Suspend/Resume: Carrega, abre ou cria um arquivo do tipo ".log" ou ".smcl". Start Viewer: Exibe a tela de ajuda (Help) em primeiro plano. Bring Results Window to Front: Exibe a tela dos resultados em primeiro plano. Bring Graph Window to Front: Exibe a tela com o grfico em primeiro plano. Do-file Editor: Edita um arquivo de comandos (arquivo tipo ".do"). Data Editor: Edita o arquivo de dados que est sendo utilizado. Data Browser: Visualiza o arquivo de dados que est sendo utilizado. Clear: prossegue a execuo do comando. Break: Interrompe a execuo de uma tarefa ou comando.
1.2 Salvando os Comandos
Logo que for iniciado o trabalho no STATA, aconselhvel abrir um arquivo .log, que armazenar todos os comandos e seus resultados (com exceo de grficos). Para abrir um arquivo .log s clicar sobre o quarto cone (Log Begin/Close/Suspend/Resume). O arquivo .log um arquivo de tipo somente texto e no permite alterao. Como arquivo .log no permitido alterao nos comandos, o mais aconselhvel a criao do arquivo .do (Do-file Editor), pois permite alteraes, correes e 5
execuo. Ou, obtendo o mesmo resultado, pode-se criar um arquivo .do apenas clicando no boto direito do mouse na janela Review. J que todos os comandos digitados na janela Stata Command so enviados para a janela Review. Estes comandos podem ser guardados em um arquivo para, posteriormente, serem editados e utilizados em uma nova anlise. No caso do banco de dados, o arquivo salvo no formato .dta. Depois de salvo s clicar duas vezes sobre o arquivo e o STATA j abre com os dados salvos.
1.3 Principais Operadores
Como operadores aritmticos, temos: + Adio; - Subtrao; * Multiplicao / Diviso ^ Elevada a uma potncia. Como operadores lgicos, temos: & e; | ou; ~ ou (!) No; Como operadores relacionais, temos: = Igual, que tambm pode ser implementado como ==; ~= Diferente; >= Maior igual; > Maior; <= Menor Igual; < Menor.
1.4 Executando os Comandos
1.4.1 Comandos de Ajuda
Inicialmente, um dos principais comandos consiste no comando de ajuda, digitado na janela de comandos e definidos por: 6
help A utilizao do help fortemente recomendada; clicando-se em help no menu principal, pode-se pesquisar qualquer comando utilizando-se a opo Contents (todo o manual), Search (palavras chaves) ou Stata command (comando). Exemplo: caso necessite de informaes especficas sobre alguma rotina (sintax), tipo regresso de mnimos quadrados ordinrios, devemos especificar aps o comando de ajuda: help regress (ou reg)
1.4.2 Comando de estatstica descritiva
Uma vez selecionada a base de dados no programa, podemos descrever as principais estatsticas descritivas da amostra de dados. Alguns Comandos bsicos do STATA: Comandos Funes describe Descreve o arquivo de dados em uso display Calculadora de mo drop Elimina variveis ou observaes edit Edita e lista dados generate ou gen Cria ou muda contedos de variveis graph Cria grficos list Lista os valores das variveis por registro memory Muda o tamanho da memria a ser utilizada obs Aumenta o nmero de observaes no banco de dados recode Recodificar, agrupar cdigos sort Ordena os dados sumarize ou sum Calcula medidas de tendncia central tabulate ou tab Produz tabelas simples e cruzadas clear Limpar a memria do STATA rename Renomear as variveis exit Encerrar o STATA
Comando bsicos de Regresso Linear 7
O mtodo bsico de estimao de regresso linear consiste nos mnimos quadrados ordinrios que definido pelo comando: regress var_dependentes var_independentes Ex.: Usando o banco de dados sobre o preo de carros, temos: reg vendas pd vendas pd captang
A. Estimativa dos parmetros por MQO; B. Estimativa do erro-padro dos parmetros; C. Estatstica t-student calculada; D. P-valor associado s estatstics t-student. O programa usa como procedimento padro um nvel de significncia de 5%.
1.4.3 Criando novas variveis
O STATA permite criar novas variveis a partir do banco de dados em uso. Neste caso precisamos usar o comando generate ou gen; gen nova_varvel = transformao_na_varivel_existente ou expresso matemtica gen logpd = log(pd)
Principais expresses de transformao: log ( ) Logaritmo na base 10 ln ( ) logaritmo natural exp ( ) exponencial 8
gen pd2 = pd^2
1.5 Criando Grficos
Um importante comando na gerao de grficos corresponde ao avplot. Este comando gera a reta de regresso estimada junto ao grfico de disperso, reportanto as principais estatsticas: coeficiente da varivel, erro-padro e a estatstica t-student. Contudo ele somente pode ser executado aps o comando da regresso.
avplot var_independente
Este comando pode ser usado gerando o grfico para todas os regresses, sem que necessariamente precisssemos digitar cada um deles:
avplots
Para visualizar o grfico de disperso considerando duas variveis, basta usa o comando scatter:
scatter var_dependente var_independente
Se a descrio da varivel estiver definida (label) o grfico gerado reporta as informaes da descrio. Caso contrrio, somente as informaes da varivel, como o nome, sero reportados.
9
PESQUISA NACIONAL POR AMOSTRA DE DOMICLIOS (PNAD)
2. APRESENTAO DA PNAD
Na dcada de 60, tornou-se evidente que o Brasil carecia de informaes para planejar e acompanhar o seu desenvolvimento social, econmico e demogrfico, pois os dados decenais, oriundas dos censos demogrficos, eram insuficientes e demasiadamente defasados no tempo para atender s demandas. As pesquisas por amostra de domiclios eram o caminho possvel para o atendimento das demandas existentes, tendo em vista que, alm de possibilitarem um maior controle das fases operacionais e uma significativa reduo do tempo de execuo e dos custos, permitem a ampliao e o aprofundamento dos temas captados pelos levantamentos que investigam toda a populao. Considerando a impossibilidade de investigar continuamente todos os temas de interesse, a Pnad foi estruturada para ter uma pesquisa bsica, pesquisas suplementares e pesquisas especiais. A pesquisa bsica investiga, de forma contnua, os temas definidos como de maior importncia para medir e acompanhar o nvel socioeconmico da populao: habitao e mo-de-obra, alm de caractersticas demogrficas e educacionais. As pesquisas suplementares aprofundam os temas permanentes e investigam outros assuntos de interesse que se interliguem com os da pesquisa bsica. As pesquisas especiais abordam assuntos de maior complexidade, que exigem tratamento parte da pesquisa bsica, podendo at requerer um esquema de amostragem distinto. Portanto, a Pesquisa Nacional por Amostra de Domiclios (PNAD) fornecida anualmente pelo Instituto Brasileiro de Geografia e Estatstica (IBGE). Os microdados das PNADs consistem em dados individuais das principais caractersticas socioeconmicas dos indivduos e famlias, umas de carter permanente, como as caractersticas gerais da populao, de educao, trabalho, rendimento e habitao, e outras com periodicidade varivel, como as caractersticas sobre migrao, fecundidade, nupcialidade, sade, nutrio e outros temas que so includos no sistema de acordo com as necessidades de informao para o Pas (IBGE, 2007). O perodo de referncia das PNADs nos anos noventa e 2000 foi o ms de setembro de cada ano. Alm da 10
abrangncia temtica da PNAD, o tamanho da amostra tambm consiste em importante fator para garantir a robustez dos resultados, principalmente em termos de inferncia estatstica. Sendo assim, o objetivo principal da PNAD coletar dados sistematicamente atravs da pesquisa por amostra de domiclios, investigando assim diversas caractersticas socioeconmicas, algumas de carter permanente, para ajudar a promover o desenvolvimento do Brasil.
2.1 Uma breve Evoluo da PNAD
Na dcada de 70: Principais temas estudados: aspectos gerais da populao, educao, trabalho, rendimento e habitao como caractersticas permanentes. Tambm foram pesquisados, como caractersticas de periodicidade varivel: migrao e fecundidade. Nos anos de 74 e 75 foi feita uma pesquisa especial chamada Estudo Nacional da Despesa Familiar (ENDEF), que tambm investigou o consumo alimentar e oramentos familiares.
Na dcada de 80: Mantiveram-se constantes as caractersticas realizadas na dcada de 70, objetivando assim a criao de uma srie histrica. Em 87 foi incorporado s pesquisas o questionamento sobre a cor das pessoas, e a existncia de aparelhos eletrnicos como televiso e rdio em 88. A caracterstica sade foi incorporado em 81, de maneira provisria, assim como a educao. Em 82, mo-de-obra e previdncia. Em 83, fecundidade feminina. E trabalho em 89 e 90.
Na dcada de 90: No ano de 92, a PNAD adicionou de forma permanente os temas de migrao, fecundidade, nupcialidade, trabalho infantil e ensino supletivo. No ano de 1994 no foi realizado a pesquisa. Em 96, foi includo o tema suplementar mobilidade social. Entretanto, o mesmo foi retirado em 97.
Na dcada de 2000: 11
Alm de aspectos gerais da populao, educao, trabalho, rendimento e habitao, vm sendo mantidos os temas suplementares migrao e fecundidade, que tambm fizeram parte de todas as pesquisas da PNAD da dcada de 1990. Em 2002 foram introduzidas novas caractersticas no tema domiclio. J em 2003, foi adicionado o tpico suplementar participao em programas sociais voltados para a educao.
2.2 Abrangncia Geogrfica
A PNAD, de acordo com o IBGE, teve sua abrangncia prevista desde o seu incio para ser nacional. Porm, objetivo a ser alcanado de forma progressiva. Iniciada em 1967 no Estado da Guanabara (atual RiodeJaneiro), em 1969 a PNAD j abrangia as regies Nordeste, Sudeste e Sul. Em1973 foi includo o Centro- Oeste, o Distrito Federal e a rea urbana da regio Norte, excluindo-se assim a regio rural dos estados de RO, AC, AM, RR e AP. Apenas em 2004 que as reas rurais de RO, AC, AM, RR, PA e AP foram includas na pesquisa e a PNAD alcanou a cobertura completa do Territrio Nacional.
2.3 Dados
O bando de dados da PNAD dividido em duas vertentes: Arquivo Pessoas e Arquivo Domiclios. E consequentemente os seus dicionrios. Em relao a Pessoas so pesquisadas atualmente: Parte 1 identificao e controle Parte 3 identificao dos moradores Parte 4 caractersticas gerais dos moradores Parte 5 caractersticas de migrao dos moradores Parte 6 caractersticas de educao dos moradores Parte 7 caractersticas de trabalho das crianas moradoras de 5 a 9 anos de idade Parte 9 caractersticas de trabalho e rendimento dos moradores de 10 anos ou mais de idade Parte 11 - caractersticas de fecundidade das mulheres moradoras de 10 anos ou mais de idade Variveis derivadas 12
J em relao a Domiclios pesquisada as caractersticas dos domiclios particulares permanentes que so atualmente: Parte 1 identificao e controle Parte 2 caractersticas da unidade domiciliar Tipo do domiclio Material das paredes Material da cobertura Cmodo Dormitrio Condio de ocupao do domiclio Aluguel mensal Prestao mensal Propriedade do terreno Abastecimento de gua Banheiro ou sanitrio Uso do banheiro ou sanitrio Esgotamento sanitrio Destino do lixo Forma de iluminao Telefone Fogo Filtro de gua Rdio Televiso Geladeira Freezer Mquina de lavar roupa Microcomputador Acesso Internet
Apresentao dos Dados
A partir desse arquivo de dados e do arquivo do dicionrio, parte-se agora para a extrao dos dados. 2.4 Extrao dos Dados
comum dificuldades para se extrair dados de bancos de dados como a PNAD. Vrias so as formas de extrao, mas nesse curso ser abordada apenas a extrao pelo software STATA.12. Inicialmente vamos baixar os arquivos do site do IBGE. Site: http://www.ibge.gov.br/home/ Clica em Populao, e logo em seguida clica em Pesquisa Nacional por Amostra e Domiclio. Como o alvo principal so os Microdados, partimos direto para baixa-los. Sendo assim, clica em Microdados (em formato zip). E ser feito o download da pasta contendo todos os arquivos referentes ao ano de interesse. Dentro da pasta contm: arquivo dados, dicionrios e input, leia-me PNAD, leitura em R, marca de imputao, metodologia e questionrio, todos respectivamente de pessoas e domiclios Depois de feito o download dos anos nos quais vo ser trabalhados, parte-se para a edio dos arquivos inputs. Pois por meio deles o STATA far a leitura dos arquivos de dados de pessoas e domiclios.
Arquivo Input antes das modificaes
Arquivo Input depois das modificaes
Percebemos assim que deve haver modificaes nos arquivos inputs tanto de pessoas quanto de domiclios. E essa modificao ser feita no prprio arquivo do bloco de notas. Deve-se portanto, fazer as seguintes modificaes:
1 Fazer o caminho dos dados: Dentro do arquivo do bloco de notas ser colocado o endereo onde se encontra o arquivo de dados (tambm em bloco de notas), ambos em formato .txt. Como veremos a seguir:
Apagaremos as informaes:
/* PROGRAMA DE LEITURA EM SAS DO ARQUIVO DE MICRODADOS DE DOMICLIOS DA PNAD 2012 PESQUISAS BSICA E SUPLEMENTARES DE VITIMIZAO E JUSTIA */ /* Obs.: As duas primeiras posies de V0102 (Nmero de controle) so o cdigo da UF (Unidade da Federao). Obs.2: Ajuste o endereo do arquivo DOM2012.TXT no comando INFILE */ DATA DOM2012; Substituiremos: INFILE '...\dados\DOM2012.TXT' LRECL=236 MISSOVER;
Por: dictionary using "C:\Curso_PNADs_UFPI\DADOSDOM20122.txt"
obs.: No qual "C:\Curso_PNADs_UFPI\DADOSDOM20122.txt" o endereo onde ser puxado o arquivo de dados, quando for executado o comando dentro do STATA, como veremos mais adiante. E DADOSDOM20122, como est nomeado o arquivo de dados.
2 Mudana nos Smbolos: Substituir: Por: INPUT { @ _column( $ % . G /* */
Obs.: IMPORTANTE! Uma dica! Para no ser preciso digitar o feixe do parntese e a palavra float em todas a observaes, descobriu-se o seguinte: Para fechar o parntese necessrio inserir um ponto (.) em todas a observaes. Para em seguida substituir o ponto (. ) por o fechamento do parntese aberto, seguido da palavra float. Exemplo: Antes: @00001 Depois: _column(00001) float
Depois de feito essas mudanas, partiremos para alguns detalhes especficos, que caso no sejam modificados, o STATA no consegue l o arquivo input, e consequentemente o arquivo de dados.
3 Mudanas especificas:
A primeira mudana especifica com relao a palavra float, ela s ser usada pra valores at 7 (%1g, %2g ... %7g). Mudar quando o valor for acima de 8, e logo em seguida voc trocar o g pelo f. Que ficar assim: Exemplos: _column(00005) double V0102 %8g " NUMERO DE CONTROLE " _column(00161) float V4617 %7f " STRAT - IDg AUTO E NAUT "
run; } . ) float
Segunda mudana que ocorre mais comumente no arquivo domiclios a seguinte: Antes: _column(00031) double V0208 12f ALUGUEL PAGO EM 09/08 Depois: _column(00031) double V0208 %12f " ALUGUEL PAGO EM 09/08 "
A variveis com valores iguais a 10 ou 12, normalmente no vem com a %, portanto, quando for fazer essas pequena modificaes observar bem essa falta, e assim inserir o smbolo da percentagem.
E uma terceira, e ltima, mudana : Antes: _column(00096) double V4605 12.10 PROBABILIDADE DO MUNICPIO Depois: _column(00095) double V4605 %12.10f " PROBABILIDADE DO MUNICPIO "
Que nesses casos especficos o ponto (.), no deve ser substitudo por g quando vem precedido por outro nmero. Ele permanece, sendo apenas acrescentado o f quando for maior do que 7. Estando o arquivo salvo o prximo passo abrir o arquivo no stata para poder executar as tarefas do seu trabalho. 2.5 Manipulao dos dados no STATA.12
Continuando a tarefa de extrair os dados, o prximo passo a leitura das variveis pelo STATA. Ento, agora inicia-se a criao do arquivo .do, arquivo no formato STATA. Mais conhecido como Sintax ou Rotina, no qual sero encontrados os comandos que manipularo a base de dados dos arquivos pessoas e domiclios, e a unio dessas duas bases. A base de dados poder ser trabalhada de acordo com o trabalho do pesquisador. Podendo ser utilizadas por regies, estados, municpios, micro ou macro regies brasileiras. Cada pesquisador far a seleo especifica das variveis de seu estudo. Podendo excluir as variveis que no lhe interessa, diminuindo o tamanho do arquivo e facilitando sua manipulao.
Principais comandos utilizados para a manipulao dos dados da PNAD no STATA:
Inicialmente, para inserir comentrios no STATA, simplesmente utilize asterisco (*) antes do texto: *Isso um tido como um comentrio no Stata Ou utilize os smbolos "/*" e "*/", ou epenas /// antes e depois do comentrio: /*Essa uma outra forma de inserir comentrio no Stata*/
1 Comando: clear Geralmente o comando "clear" inicia um programa ".do" para limpar a memria do STATA.
LEITURA DOS DADOS DA PNAD 2012 - VARIAVEIS DO ARQUIVO DE DOMICILIOS
2 Comando: cd Logo em seguida, deve-se especificar onde o arquivo ficar salvo. Ex.: cd "C:\Curso_PNADs_UFPI" Digita o comando, espao, e o endereo onde os arquivos esto salvos.
3 Comando: infile using Mostra o caminho do arquivo que se encontra os arquivos que sero utilizados. Ex.: infile using "C:\Curso_PNADs_UFPI\DADOSDOM2012.txt" Nesse caso, o comando est puxando o arquivo input dos domiclios da PNAD do ano de 2012. E dentro desse arquivo, como foi visto antes, tem o endereo do arquivo dos dados. Que sero trazidos para o formato STATA, .dta, quando o comando for executado.
4 Comando: save Para salvar o banco de dados pela primeira vez, usa-se save e o nome que ir nomear o arquivo, nesse caso no precisar digitar um novo endereo, pois o mesmo ficara salvo junto aos outros arquivos que j foram puxados.
Ex.: save "domicilio2012"
5 Comando: keep Se tratando dos dados da PNAD, quando observamos o dicionrio do arquivo domiclios, sempre preciso fazer o corte para as entrevistas realizadas, contando assim, a varivel V0104 (do arquivo domicilio), com a descrio igual a 1, que equivale as entrevistas realizadas. Ex.: Keep if V0104==1
6 Comando: sort Para ordenar um banco de dados por uma varivel ou conjunto de variveis, utilize a opo "sort". No caso da PNAD preciso ordenar as variveis: Unidade da Federao, nmero de controle e nmero de srie. Ex.: sort UF V0102 V0103
7 Comando: repetindo o keep Agora ser feito o corte nas variveis de interesse. O pesquisador dever saber precisamente as variveis de estudo para fazer o corte e diminuir o arquivo e facilitar o trabalho. Ex.: keep V0101 UF V0102 V0103 V0105 V4617 V0201 V0202 V0203 V0204 V0206 V0211 V0212 V0215 V0216 V0207 V0217 V0218 V0219 V0220 V2020 V0225 V0226 V0227 V0230 V0232 V4618 V4621 V0231 V0228 V0230 V4105 V0229 V4621
8 Comando: Salvar um novo arquivo, com as variveis que foram selecionadas. Com uma nova nomenclatura. Ex.: save "domicilio2012pm"
9 Comando: Depois de salvo o arquivo domiclios com as variveis de interesse, parte- se agora para o arquivo pessoas. Usa-se o comando clear para limpar o STATA.
LEITURA DOS DADOS DA PNAD 2012 - VARIAVEIS DO ARQUIVO DE PESSOAS
Segue os mesmo comando da leitura dos dados do arquivo domiclios: 10 Comando: infile using
Ex.: infile using "C:\Curso_PNADs_UFPI\DADOSPES2012.txt"
11 Comando: sort
Ex.: sort UF V0102 V0103
12 Comando: save
Ex.: save "pessoas2012"
13 Comando: Fazendo um corte (Keep) nas variveis de interesse do arquivo pessoas
14 Comando: Salvar o arquivo com as variveis de interesse.
Ex.: save "pessoas2012pm" 15 Comando: Como ser feito a unio dos dois arquivos no vamos usar o comando clear, para limpar o STATA.
16 Comando: merge Combinar Arquivos pessoas2012pm com domicilios2012pm.
Ex.: merge UF V0102 V0103 using "C:\Curso_PNADs_UFPI\domicilio2012pm.dta", uniqusing
17 Comando: tab Saber se o arquivo com a unio dos dois arquivos esto com 100% dos valores.
Ex.: tab _merge
18 Comando: save Salvar o arquivo completo.
Ex.: save "pobreza2012completa"
Obs.: Para salvar um banco pela primeira vez, utiliza-se save. Se o arquivo j existir, e voc quiser gravar o banco por cima do anterior:
Ex.: save "pobreza2012completa", replace
Ou seja, um banco salvo somente com o comando "save", tornando difcil perder os dados originais. Mesmo se o comando "save" no for usado intencionalmente, o Stata recusar gravar o banco por cima do original, se a opo "replace" no for colocada.
19 Comando: A partir da unio dos dois arquivos, e havendo o corte das variveis de interesse, segue para os comandos especficos de cada pesquisa, de cada reviso de literatura, de cada metodologia adotada.
REFERNCIAS
AMARAL, E. F. L. Curso de Introduo ao Stata Aula 1. Universidade Federal de Minas Gerais. 2009. Disponvel em: <http://www.ernestoamaral.com>. Acesso em 10 de Junho de 2014.
BERGAMASCHI, D. P.; SOUZA, J. M. P.; ALENCAR, G. P. A.; BUENO, M. B. Stata Bsico. V Programa de Vero, Universidade de So Paulo. 2002. Disponvel em: <http://www.bvs-sp.fsp.usp.br/tecom/docs/2002/ber001.pdf>. Acesso em 10 de Junho de 2014.
BERGAMASCHI, D. P.; BUENO, M. B.; SOUZA, J. M. P. Stata Bsico. VI Programa de Vero, Universidade de So Paulo. 2004. Disponvel em:
<http://www.bvs-sp.fsp.usp.br/tecom/docs/2002/ber001.pdf>. Acesso em 10 de Junho de 2014.
FRAGA, R. O desafio de estrai micrdodados. Disponvel em: <http://www.4- shared.eu/download/3re3heu2QPedDJd6gqnLTE/O-desafio-de-extrai- microdados.html>. Acesso em 10 de Junho de 2014.
IBGE Instituto Brasileiro de Geografia e Estatstica. Disponvel em: <http://www.ibge.gov.br/home/>. Acesso em 10 de Junho de 2014.
LEAL, G. Pesquisa Nacional por Amostra de Domiclios, IBGE. Laboratrio de Economia da UFJF. 2010. Disponvel em: <http://www.ufjf.br/econs/files/2010/05/PNAD-Apresenta%C3%A7%C3%A3o-da- Pesquisa-Nacional-por-Amostra-de-Domic%C3%ADlios-12-de-Abril-de-2010.pdf>. Acesso em 10 de Junho de 2014.
ROCHA, L. A. Curso de Mtodos Quantitativos Aplicados: Estatstica Aplicada com o uso do Software Stata. Ministrio da Educao, Universidade Federal Rural do Semi-rido. 2013.
SANTOS, G. C. Aula Prtica: Tratamento e Extrao dos Microdados da PNAD. Universidade Federal de Viosa. 2010. Disponvel em: <http://pt.scribd.com/doc/89903913/Aula-Microdados-PNAD>. Acesso em 10 de Junho de 2014.