Você está na página 1de 23

UNIVERSIDADE FEDERAL DO CEAR

CENTRO DE CINCIAS AGRRIAS


DEPARTAMENTO DE ECONOMIA AGRCOLA
PROGRAMA DE PS-GRADUAO EM ECONOMIA RURAL









CURSO DE NOES BSICAS:
SOFTWARE STATA E EXTRAO DOS DADOS DA PNAD














AGOSTO, 2014
SUMRIO
1


O SOFTWARE STATA.................................................................................. 02
1 APRESENTAO DO STATA.12................................................................. 02
1.1 Iniciando o STATA.12...................................................................................... 02
1.2 Salvando os Comandos.................................................................................... 04
1.3 Principais Operadores..................................................................................... 05
1.4 Executando os Comandos............................................................................... 05
1.4.1 Comandos de Ajuda......................................................................................... 05
1.4.2 Comando de estatstica descritiva.................................................................. 06
1.4.3 Criando novas variveis.................................................................................. 07
1.5 Criando Grficos.............................................................................................. 08

PESQUISA NACIONAL POR AMOSTRA DE DOMICLIOS
(PNAD)....
09
2 APRESENTAO DA
PNAD........................................................................
09
2.1 Uma breve Evoluo da PNAD....................................................................... 10
2.2 Abrangncia Geogrfica.................................................................................. 11
2.3 Dados................................................................................................................. 11
2.4 Extrao dos dados.......................................................................................... 13
2.5 Manipulao dos dados no STATA.12............................................................ 17

REFERNCIAS............................................................................................... 22










2


O SOFTWARE STATA

1. APRESENTAO DO STATA.12

Mtodos estatsticos para anlise de dados so utilizados por pesquisadores de
diversas reas: economia, sociologia, cincias polticas, marketing, epidemiologia,
nutrio, sade pblica, etc. Para o processo de anlise dos dados, os pesquisadores
necessitam de pacotes que sejam de fcil manipulao e tenham uma ampla variedades
de tcnicas estatsticas.
Como o caso do Software STATA, que oferece uma variedade de tcnicas
estatsticas das mais elementares s mais sofisticadas, tem uma sintaxe simples e
usado por meio de linha de comandos de fcil execuo. Foi desenvolvido no Texas
(EUA), em 1984, e j distribudo para 132 pases. Periodicamente, o grupo que
desenvolve este programa (StataCorp) disponibiliza atualizaes via internet e tem
lanado novas verses a cada trs anos, em mdia. O StataCorp tambm mantm a
publicao de um peridico (Stata Journal) e uma lista de discusso virtual.
O STATA.12 a verso mais atual lanada pela StataCorp, um pacote
estatstico completo e integrado que fornece tudo que voc precisa para a anlise de
dados e grficos. Com as mais variadas ferramentas estatsticas ao seu alcance como
DPD (Painel dinmico de dados), GEE (Estimativas de Equaes Generalizadas), GLM
(Modelo Linear Generalizado), ANOVA, padronizao de taxas, tabulaes estatsticas
e muito mais.
Por sua simplicidade em apresentao, este programa permite usar bancos de
dados extensos com um nmero grande de variveis. Admite ainda, que voc tenha um
controle de todos os tipos de dados podendo modificar informaes e gerenciar
variveis. Sua capacidade permite uma publicao grfica de qualidade, podendo
adicionar ttulos, observaes, linhas, setas e textos. No STATA somente um arquivo de
dados pode ser aberto e utilizado de cada vez

1.1 Iniciando o STATA.12

O programa pode ser aberto diretamente pelo cone (clicando duas vezes sobre
ele) na tela de abertura do Windows. Quando o programa aberto, abre-se uma tela
3

contendo janelas menores, com cabealhos. A finalidade de cada janela apresentada a
seguir:

Janela Finalidade
Review Janela onde so armazenados os comandos, ou seja, o histrico
de comandos executados.
Variables Janela que apresenta a lista das variveis do banco de dados
ativo. a lista e descrio das variveis.
Stata Results Janela que apresenta os resultados obtidos com a execuo dos
comandos.
Stata Command Janela em que h a digitao dos comandos a serem executados.
Properties Janela de propriedades das variveis. Podemos modificar o nome
ou a descrio das variveis (Nome ou Label). O cadeado no
canto da janela permite o bloqueio ou desbloqueio dos dados.

Obs.: Na janela Stata Command para executar o comando s digita-lo e pressionar a
tecla Enter. E assim, o comando ser armazenado na janela Review.
Na janela Review, o comando pode ser reutilizado e corrigido utilizando-se o mouse ou
as teclas PgUp (page up) e PgDn (page down).

Na Barra de Ferramentas do STATA permite a execuo de diversas tarefas
de forma anloga a maioria dos programas para o sistema Windows. Mas essas tarefas,
podem ser digitados em forma de comandos (ou rotinas de programao) a partir da
janela de programao (Stata Command).
O menu que est disponvel na primeira linha e possui os recursos:
File Edit Data Graphics Statistics Window e Help

Na Barra de Ferramentas, podemos:
Abrir e salvar bases de dados no formato STATA (.dta);
Abrir e Salvar grficos criados pelo STATA;
Executar programas de comandos criados, do-files ( .do);
Importar e salvar arquivos em outros formatos.

4



O STATA trabalha com vrios tipos de arquivos, mas os principais so:
Tipo de Arquivo Formato
Arquivo que contm os dados .dta
Arquivo que guarda os comandos e resultados obtidos durante a sesso
de trabalho
.log; .smcl
Arquivo que contm comandos .do
Arquivo que contm sub-rotinas .ado

Na segunda linha encontra-se a Barra de Ferramentas com os cones:
Open (use): Carrega ou abre um banco de dados no formato do STATA (.dta).
Save: Salva um arquivo no formato do STATA (.dta).
Print Results: Imprime a janela de resultados.
Log Begin/Close/Suspend/Resume: Carrega, abre ou cria um arquivo do tipo ".log" ou
".smcl".
Start Viewer: Exibe a tela de ajuda (Help) em primeiro plano.
Bring Results Window to Front: Exibe a tela dos resultados em primeiro plano.
Bring Graph Window to Front: Exibe a tela com o grfico em primeiro plano.
Do-file Editor: Edita um arquivo de comandos (arquivo tipo ".do").
Data Editor: Edita o arquivo de dados que est sendo utilizado.
Data Browser: Visualiza o arquivo de dados que est sendo utilizado.
Clear: prossegue a execuo do comando.
Break: Interrompe a execuo de uma tarefa ou comando.

1.2 Salvando os Comandos

Logo que for iniciado o trabalho no STATA, aconselhvel abrir um arquivo
.log, que armazenar todos os comandos e seus resultados (com exceo de grficos).
Para abrir um arquivo .log s clicar sobre o quarto cone (Log
Begin/Close/Suspend/Resume). O arquivo .log um arquivo de tipo somente texto e
no permite alterao.
Como arquivo .log no permitido alterao nos comandos, o mais aconselhvel
a criao do arquivo .do (Do-file Editor), pois permite alteraes, correes e
5

execuo. Ou, obtendo o mesmo resultado, pode-se criar um arquivo .do apenas
clicando no boto direito do mouse na janela Review.
J que todos os comandos digitados na janela Stata Command so enviados
para a janela Review. Estes comandos podem ser guardados em um arquivo para,
posteriormente, serem editados e utilizados em uma nova anlise. No caso do banco de
dados, o arquivo salvo no formato .dta. Depois de salvo s clicar duas vezes sobre o
arquivo e o STATA j abre com os dados salvos.

1.3 Principais Operadores

Como operadores aritmticos, temos:
+ Adio;
- Subtrao;
* Multiplicao
/ Diviso
^ Elevada a uma potncia.
Como operadores lgicos, temos:
& e;
| ou;
~ ou (!) No;
Como operadores relacionais, temos:
= Igual, que tambm pode ser implementado como ==;
~= Diferente;
>= Maior igual;
> Maior;
<= Menor Igual;
< Menor.

1.4 Executando os Comandos

1.4.1 Comandos de Ajuda

Inicialmente, um dos principais comandos consiste no comando de ajuda,
digitado na janela de comandos e definidos por:
6

help
A utilizao do help fortemente recomendada; clicando-se em help no menu
principal, pode-se pesquisar qualquer comando utilizando-se a opo Contents (todo o
manual), Search (palavras chaves) ou Stata command (comando).
Exemplo: caso necessite de informaes especficas sobre alguma rotina (sintax), tipo
regresso de mnimos quadrados ordinrios, devemos especificar aps o comando de
ajuda:
help regress (ou reg)

1.4.2 Comando de estatstica descritiva

Uma vez selecionada a base de dados no programa, podemos descrever as
principais estatsticas descritivas da amostra de dados.
Alguns Comandos bsicos do STATA:
Comandos Funes
describe Descreve o arquivo de dados em uso
display Calculadora de mo
drop Elimina variveis ou observaes
edit Edita e lista dados
generate ou gen Cria ou muda contedos de variveis
graph Cria grficos
list Lista os valores das variveis por registro
memory Muda o tamanho da memria a ser utilizada
obs Aumenta o nmero de observaes no banco de dados
recode Recodificar, agrupar cdigos
sort Ordena os dados
sumarize ou sum Calcula medidas de tendncia central
tabulate ou tab Produz tabelas simples e cruzadas
clear Limpar a memria do STATA
rename Renomear as variveis
exit Encerrar o STATA

Comando bsicos de Regresso Linear
7

O mtodo bsico de estimao de regresso linear consiste nos mnimos
quadrados ordinrios que definido pelo comando:
regress var_dependentes var_independentes
Ex.: Usando o banco de dados sobre o preo de carros, temos:
reg vendas pd vendas pd captang


A. Estimativa dos parmetros por MQO;
B. Estimativa do erro-padro dos parmetros;
C. Estatstica t-student calculada;
D. P-valor associado s estatstics t-student.
O programa usa como procedimento padro um nvel de significncia de 5%.

1.4.3 Criando novas variveis

O STATA permite criar novas variveis a partir do banco de dados em uso. Neste
caso precisamos usar o comando generate ou gen;
gen nova_varvel = transformao_na_varivel_existente ou expresso matemtica
gen logpd = log(pd)

Principais expresses de transformao:
log ( ) Logaritmo na base 10
ln ( ) logaritmo natural
exp ( ) exponencial
8

gen pd2 = pd^2

1.5 Criando Grficos

Um importante comando na gerao de grficos corresponde ao avplot. Este
comando gera a reta de regresso estimada junto ao grfico de disperso, reportanto as
principais estatsticas: coeficiente da varivel, erro-padro e a estatstica t-student.
Contudo ele somente pode ser executado aps o comando da regresso.

avplot var_independente

Este comando pode ser usado gerando o grfico para todas os regresses, sem
que necessariamente precisssemos digitar cada um deles:

avplots

Para visualizar o grfico de disperso considerando duas variveis, basta usa o
comando scatter:

scatter var_dependente var_independente

Se a descrio da varivel estiver definida (label) o grfico gerado reporta as
informaes da descrio. Caso contrrio, somente as informaes da varivel, como o
nome, sero reportados.










9



PESQUISA NACIONAL POR AMOSTRA DE DOMICLIOS (PNAD)


2. APRESENTAO DA PNAD

Na dcada de 60, tornou-se evidente que o Brasil carecia de informaes para
planejar e acompanhar o seu desenvolvimento social, econmico e demogrfico, pois os
dados decenais, oriundas dos censos demogrficos, eram insuficientes e
demasiadamente defasados no tempo para atender s demandas. As pesquisas por
amostra de domiclios eram o caminho possvel para o atendimento das demandas
existentes, tendo em vista que, alm de possibilitarem um maior controle das fases
operacionais e uma significativa reduo do tempo de execuo e dos custos, permitem
a ampliao e o aprofundamento dos temas captados pelos levantamentos que
investigam toda a populao.
Considerando a impossibilidade de investigar continuamente todos os temas de
interesse, a Pnad foi estruturada para ter uma pesquisa bsica, pesquisas suplementares e
pesquisas especiais. A pesquisa bsica investiga, de forma contnua, os temas definidos
como de maior importncia para medir e acompanhar o nvel socioeconmico da
populao: habitao e mo-de-obra, alm de caractersticas demogrficas e
educacionais. As pesquisas suplementares aprofundam os temas permanentes e
investigam outros assuntos de interesse que se interliguem com os da pesquisa bsica.
As pesquisas especiais abordam assuntos de maior complexidade, que exigem
tratamento parte da pesquisa bsica, podendo at requerer um esquema de amostragem
distinto.
Portanto, a Pesquisa Nacional por Amostra de Domiclios (PNAD) fornecida
anualmente pelo Instituto Brasileiro de Geografia e Estatstica (IBGE). Os microdados
das PNADs consistem em dados individuais das principais caractersticas
socioeconmicas dos indivduos e famlias, umas de carter permanente, como as
caractersticas gerais da populao, de educao, trabalho, rendimento e habitao, e
outras com periodicidade varivel, como as caractersticas sobre migrao, fecundidade,
nupcialidade, sade, nutrio e outros temas que so includos no sistema de acordo
com as necessidades de informao para o Pas (IBGE, 2007). O perodo de referncia
das PNADs nos anos noventa e 2000 foi o ms de setembro de cada ano. Alm da
10

abrangncia temtica da PNAD, o tamanho da amostra tambm consiste em importante
fator para garantir a robustez dos resultados, principalmente em termos de inferncia
estatstica.
Sendo assim, o objetivo principal da PNAD coletar dados sistematicamente
atravs da pesquisa por amostra de domiclios, investigando assim diversas
caractersticas socioeconmicas, algumas de carter permanente, para ajudar a
promover o desenvolvimento do Brasil.

2.1 Uma breve Evoluo da PNAD

Na dcada de 70:
Principais temas estudados: aspectos gerais da populao, educao, trabalho,
rendimento e habitao como caractersticas permanentes. Tambm foram pesquisados,
como caractersticas de periodicidade varivel: migrao e fecundidade.
Nos anos de 74 e 75 foi feita uma pesquisa especial chamada Estudo Nacional
da Despesa Familiar (ENDEF), que tambm investigou o consumo alimentar e
oramentos familiares.

Na dcada de 80:
Mantiveram-se constantes as caractersticas realizadas na dcada de 70,
objetivando assim a criao de uma srie histrica.
Em 87 foi incorporado s pesquisas o questionamento sobre a cor das pessoas, e
a existncia de aparelhos eletrnicos como televiso e rdio em 88.
A caracterstica sade foi incorporado em 81, de maneira provisria, assim como
a educao. Em 82, mo-de-obra e previdncia. Em 83, fecundidade feminina. E
trabalho em 89 e 90.

Na dcada de 90:
No ano de 92, a PNAD adicionou de forma permanente os temas de migrao,
fecundidade, nupcialidade, trabalho infantil e ensino supletivo.
No ano de 1994 no foi realizado a pesquisa. Em 96, foi includo o tema
suplementar mobilidade social. Entretanto, o mesmo foi retirado em 97.

Na dcada de 2000:
11

Alm de aspectos gerais da populao, educao, trabalho, rendimento e
habitao, vm sendo mantidos os temas suplementares migrao e fecundidade, que
tambm fizeram parte de todas as pesquisas da PNAD da dcada de 1990.
Em 2002 foram introduzidas novas caractersticas no tema domiclio. J em
2003, foi adicionado o tpico suplementar participao em programas sociais voltados
para a educao.

2.2 Abrangncia Geogrfica

A PNAD, de acordo com o IBGE, teve sua abrangncia prevista desde o seu
incio para ser nacional. Porm, objetivo a ser alcanado de forma progressiva.
Iniciada em 1967 no Estado da Guanabara (atual RiodeJaneiro), em 1969 a
PNAD j abrangia as regies Nordeste, Sudeste e Sul. Em1973 foi includo o Centro-
Oeste, o Distrito Federal e a rea urbana da regio Norte, excluindo-se assim a regio
rural dos estados de RO, AC, AM, RR e AP.
Apenas em 2004 que as reas rurais de RO, AC, AM, RR, PA e AP foram
includas na pesquisa e a PNAD alcanou a cobertura completa do Territrio Nacional.

2.3 Dados

O bando de dados da PNAD dividido em duas vertentes: Arquivo Pessoas e
Arquivo Domiclios. E consequentemente os seus dicionrios.
Em relao a Pessoas so pesquisadas atualmente:
Parte 1 identificao e controle
Parte 3 identificao dos moradores
Parte 4 caractersticas gerais dos moradores
Parte 5 caractersticas de migrao dos moradores
Parte 6 caractersticas de educao dos moradores
Parte 7 caractersticas de trabalho das crianas moradoras de 5 a 9 anos de idade
Parte 9 caractersticas de trabalho e rendimento dos moradores de 10 anos ou mais de
idade
Parte 11 - caractersticas de fecundidade das mulheres moradoras de 10 anos ou mais de
idade
Variveis derivadas
12

J em relao a Domiclios pesquisada as caractersticas dos domiclios
particulares permanentes que so atualmente:
Parte 1 identificao e controle
Parte 2 caractersticas da unidade domiciliar
Tipo do domiclio
Material das paredes
Material da cobertura
Cmodo
Dormitrio
Condio de ocupao do domiclio
Aluguel mensal
Prestao mensal
Propriedade do terreno
Abastecimento de gua
Banheiro ou sanitrio
Uso do banheiro ou sanitrio
Esgotamento sanitrio
Destino do lixo
Forma de iluminao
Telefone
Fogo
Filtro de gua
Rdio
Televiso
Geladeira
Freezer
Mquina de lavar roupa
Microcomputador
Acesso Internet

Apresentao dos Dados





A partir desse arquivo de dados e do arquivo do dicionrio, parte-se agora para a
extrao dos dados.
2.4 Extrao dos Dados

comum dificuldades para se extrair dados de bancos de dados como a PNAD.
Vrias so as formas de extrao, mas nesse curso ser abordada apenas a extrao pelo
software STATA.12.
Inicialmente vamos baixar os arquivos do site do IBGE.
Site: http://www.ibge.gov.br/home/
Clica em Populao, e logo em seguida clica em Pesquisa Nacional por
Amostra e Domiclio. Como o alvo principal so os Microdados, partimos direto para
baixa-los. Sendo assim, clica em Microdados (em formato zip). E ser feito o
download da pasta contendo todos os arquivos referentes ao ano de interesse.
Dentro da pasta contm: arquivo dados, dicionrios e input, leia-me PNAD,
leitura em R, marca de imputao, metodologia e questionrio, todos respectivamente
de pessoas e domiclios
Depois de feito o download dos anos nos quais vo ser trabalhados, parte-se para
a edio dos arquivos inputs. Pois por meio deles o STATA far a leitura dos arquivos
de dados de pessoas e domiclios.

Arquivo Input antes das modificaes





Arquivo Input depois das modificaes



Percebemos assim que deve haver modificaes nos arquivos inputs tanto de
pessoas quanto de domiclios. E essa modificao ser feita no prprio arquivo do bloco
de notas.
Deve-se portanto, fazer as seguintes modificaes:



1 Fazer o caminho dos dados:
Dentro do arquivo do bloco de notas ser colocado o endereo onde se encontra
o arquivo de dados (tambm em bloco de notas), ambos em formato .txt. Como veremos
a seguir:

Apagaremos as informaes:

/* PROGRAMA DE LEITURA EM SAS DO ARQUIVO DE MICRODADOS DE
DOMICLIOS
DA PNAD 2012 PESQUISAS BSICA E SUPLEMENTARES DE
VITIMIZAO E JUSTIA */
/* Obs.: As duas primeiras posies de V0102 (Nmero de controle)
so o cdigo da UF (Unidade da Federao).
Obs.2: Ajuste o endereo do arquivo DOM2012.TXT no comando INFILE */
DATA DOM2012;
Substituiremos:
INFILE '...\dados\DOM2012.TXT' LRECL=236 MISSOVER;

Por:
dictionary using "C:\Curso_PNADs_UFPI\DADOSDOM20122.txt"

obs.: No qual "C:\Curso_PNADs_UFPI\DADOSDOM20122.txt" o endereo onde ser
puxado o arquivo de dados, quando for executado o comando dentro do STATA, como
veremos mais adiante.
E DADOSDOM20122, como est nomeado o arquivo de dados.

2 Mudana nos Smbolos:
Substituir: Por:
INPUT {
@ _column(
$ %
. G
/*
*/













Obs.: IMPORTANTE!
Uma dica! Para no ser preciso digitar o feixe do parntese e a palavra float
em todas a observaes, descobriu-se o seguinte:
Para fechar o parntese necessrio inserir um ponto (.) em todas a observaes.
Para em seguida substituir o ponto (. ) por o fechamento do parntese aberto, seguido da
palavra float.
Exemplo: Antes: @00001
Depois: _column(00001) float

Depois de feito essas mudanas, partiremos para alguns detalhes especficos, que
caso no sejam modificados, o STATA no consegue l o arquivo input, e
consequentemente o arquivo de dados.

3 Mudanas especificas:

A primeira mudana especifica com relao a palavra float, ela s ser usada
pra valores at 7 (%1g, %2g ... %7g). Mudar quando o valor for acima de 8, e logo em
seguida voc trocar o g pelo f. Que ficar assim:
Exemplos:
_column(00005) double V0102 %8g " NUMERO DE CONTROLE "
_column(00161) float V4617 %7f " STRAT - IDg AUTO E NAUT "

run; }
. ) float


Segunda mudana que ocorre mais comumente no arquivo domiclios a
seguinte:
Antes:
_column(00031) double V0208 12f ALUGUEL PAGO EM 09/08
Depois:
_column(00031) double V0208 %12f " ALUGUEL PAGO EM 09/08 "

A variveis com valores iguais a 10 ou 12, normalmente no vem com a %,
portanto, quando for fazer essas pequena modificaes observar bem essa falta, e assim
inserir o smbolo da percentagem.

E uma terceira, e ltima, mudana :
Antes:
_column(00096) double V4605 12.10 PROBABILIDADE DO MUNICPIO
Depois:
_column(00095) double V4605 %12.10f " PROBABILIDADE DO MUNICPIO "

Que nesses casos especficos o ponto (.), no deve ser substitudo por g
quando vem precedido por outro nmero. Ele permanece, sendo apenas acrescentado o
f quando for maior do que 7.
Estando o arquivo salvo o prximo passo abrir o arquivo no stata para poder
executar as tarefas do seu trabalho.
2.5 Manipulao dos dados no STATA.12

Continuando a tarefa de extrair os dados, o prximo passo a leitura das
variveis pelo STATA. Ento, agora inicia-se a criao do arquivo .do, arquivo no
formato STATA. Mais conhecido como Sintax ou Rotina, no qual sero encontrados os
comandos que manipularo a base de dados dos arquivos pessoas e domiclios, e a unio
dessas duas bases.
A base de dados poder ser trabalhada de acordo com o trabalho do pesquisador.
Podendo ser utilizadas por regies, estados, municpios, micro ou macro regies
brasileiras. Cada pesquisador far a seleo especifica das variveis de seu estudo.
Podendo excluir as variveis que no lhe interessa, diminuindo o tamanho do arquivo e
facilitando sua manipulao.



Principais comandos utilizados para a manipulao dos dados da PNAD no
STATA:

Inicialmente, para inserir comentrios no STATA, simplesmente utilize asterisco
(*) antes do texto:
*Isso um tido como um comentrio no Stata
Ou utilize os smbolos "/*" e "*/", ou epenas /// antes e depois do comentrio:
/*Essa uma outra forma de inserir comentrio no Stata*/

1 Comando: clear
Geralmente o comando "clear" inicia um programa ".do" para limpar a memria
do STATA.

LEITURA DOS DADOS DA PNAD 2012 - VARIAVEIS DO ARQUIVO DE
DOMICILIOS

2 Comando: cd
Logo em seguida, deve-se especificar onde o arquivo ficar salvo.
Ex.: cd "C:\Curso_PNADs_UFPI"
Digita o comando, espao, e o endereo onde os arquivos esto salvos.

3 Comando: infile using
Mostra o caminho do arquivo que se encontra os arquivos que sero utilizados.
Ex.: infile using "C:\Curso_PNADs_UFPI\DADOSDOM2012.txt"
Nesse caso, o comando est puxando o arquivo input dos domiclios da PNAD
do ano de 2012. E dentro desse arquivo, como foi visto antes, tem o endereo do
arquivo dos dados. Que sero trazidos para o formato STATA, .dta, quando o comando
for executado.

4 Comando: save
Para salvar o banco de dados pela primeira vez, usa-se save e o nome que ir
nomear o arquivo, nesse caso no precisar digitar um novo endereo, pois o mesmo
ficara salvo junto aos outros arquivos que j foram puxados.


Ex.: save "domicilio2012"

5 Comando: keep
Se tratando dos dados da PNAD, quando observamos o dicionrio do arquivo
domiclios, sempre preciso fazer o corte para as entrevistas realizadas, contando
assim, a varivel V0104 (do arquivo domicilio), com a descrio igual a 1, que equivale
as entrevistas realizadas.
Ex.: Keep if V0104==1

6 Comando: sort
Para ordenar um banco de dados por uma varivel ou conjunto de variveis,
utilize a opo "sort". No caso da PNAD preciso ordenar as variveis: Unidade da
Federao, nmero de controle e nmero de srie.
Ex.: sort UF V0102 V0103

7 Comando: repetindo o keep
Agora ser feito o corte nas variveis de interesse. O pesquisador dever saber
precisamente as variveis de estudo para fazer o corte e diminuir o arquivo e facilitar o
trabalho.
Ex.: keep V0101 UF V0102 V0103 V0105 V4617 V0201 V0202 V0203 V0204 V0206
V0211 V0212 V0215 V0216 V0207 V0217 V0218 V0219 V0220 V2020 V0225 V0226
V0227 V0230 V0232 V4618 V4621 V0231 V0228 V0230 V4105 V0229 V4621

8 Comando: Salvar um novo arquivo, com as variveis que foram selecionadas.
Com uma nova nomenclatura.
Ex.: save "domicilio2012pm"

9 Comando: Depois de salvo o arquivo domiclios com as variveis de interesse, parte-
se agora para o arquivo pessoas.
Usa-se o comando clear para limpar o STATA.

LEITURA DOS DADOS DA PNAD 2012 - VARIAVEIS DO ARQUIVO DE
PESSOAS



Segue os mesmo comando da leitura dos dados do arquivo domiclios:
10 Comando: infile using

Ex.: infile using "C:\Curso_PNADs_UFPI\DADOSPES2012.txt"

11 Comando: sort

Ex.: sort UF V0102 V0103

12 Comando: save

Ex.: save "pessoas2012"

13 Comando: Fazendo um corte (Keep) nas variveis de interesse do arquivo pessoas

Ex.: keep V0101 UF V0102 V0103 V8005 V0401 V0402 V0302 V4722 V4724 V4728
V4729 V0301 V4011 V0404 V0601 V0602 V0504 V4803 V4706 V4805 V4704 V4810
V4706 V4711 V9027 V9021 V9008 V9058 V1251 V1254 V1257 V1263 V4718 V4720
V4721 V4727 V4742

14 Comando: Salvar o arquivo com as variveis de interesse.

Ex.: save "pessoas2012pm"
15 Comando: Como ser feito a unio dos dois arquivos no vamos usar o comando
clear, para limpar o STATA.

16 Comando: merge
Combinar Arquivos pessoas2012pm com domicilios2012pm.

Ex.: merge UF V0102 V0103 using "C:\Curso_PNADs_UFPI\domicilio2012pm.dta",
uniqusing

17 Comando: tab
Saber se o arquivo com a unio dos dois arquivos esto com 100% dos valores.



Ex.: tab _merge

18 Comando: save
Salvar o arquivo completo.

Ex.: save "pobreza2012completa"

Obs.: Para salvar um banco pela primeira vez, utiliza-se save. Se o arquivo j existir,
e voc quiser gravar o banco por cima do anterior:

Ex.: save "pobreza2012completa", replace

Ou seja, um banco salvo somente com o comando "save", tornando difcil
perder os dados originais. Mesmo se o comando "save" no for usado intencionalmente,
o Stata recusar gravar o banco por cima do original, se a opo "replace" no for
colocada.

19 Comando: A partir da unio dos dois arquivos, e havendo o corte das variveis de
interesse, segue para os comandos especficos de cada pesquisa, de cada reviso de
literatura, de cada metodologia adotada.



REFERNCIAS

AMARAL, E. F. L. Curso de Introduo ao Stata Aula 1. Universidade Federal de
Minas Gerais. 2009. Disponvel em: <http://www.ernestoamaral.com>. Acesso em 10
de Junho de 2014.

BERGAMASCHI, D. P.; SOUZA, J. M. P.; ALENCAR, G. P. A.; BUENO, M. B.
Stata Bsico. V Programa de Vero, Universidade de So Paulo. 2002. Disponvel
em: <http://www.bvs-sp.fsp.usp.br/tecom/docs/2002/ber001.pdf>. Acesso em 10 de
Junho de 2014.

BERGAMASCHI, D. P.; BUENO, M. B.; SOUZA, J. M. P. Stata Bsico. VI
Programa de Vero, Universidade de So Paulo. 2004. Disponvel em:


<http://www.bvs-sp.fsp.usp.br/tecom/docs/2002/ber001.pdf>. Acesso em 10 de Junho
de 2014.

FRAGA, R. O desafio de estrai micrdodados. Disponvel em: <http://www.4-
shared.eu/download/3re3heu2QPedDJd6gqnLTE/O-desafio-de-extrai-
microdados.html>. Acesso em 10 de Junho de 2014.

IBGE Instituto Brasileiro de Geografia e Estatstica. Disponvel em:
<http://www.ibge.gov.br/home/>. Acesso em 10 de Junho de 2014.

LEAL, G. Pesquisa Nacional por Amostra de Domiclios, IBGE. Laboratrio de
Economia da UFJF. 2010. Disponvel em:
<http://www.ufjf.br/econs/files/2010/05/PNAD-Apresenta%C3%A7%C3%A3o-da-
Pesquisa-Nacional-por-Amostra-de-Domic%C3%ADlios-12-de-Abril-de-2010.pdf>.
Acesso em 10 de Junho de 2014.

ROCHA, L. A. Curso de Mtodos Quantitativos Aplicados: Estatstica Aplicada
com o uso do Software Stata. Ministrio da Educao, Universidade Federal Rural do
Semi-rido. 2013.

SANTOS, G. C. Aula Prtica: Tratamento e Extrao dos Microdados da PNAD.
Universidade Federal de Viosa. 2010. Disponvel em:
<http://pt.scribd.com/doc/89903913/Aula-Microdados-PNAD>. Acesso em 10 de Junho
de 2014.