Escolar Documentos
Profissional Documentos
Cultura Documentos
AGOSTO, 2015
CRATO – CE
SUMÁRIO
O SOFTWARE STATA.................................................................................. 02
1 APRESENTAÇÃO DO STATA.12................................................................. 02
1.1 Iniciando o STATA.12...................................................................................... 02
1.2 Salvando os Comandos.................................................................................... 05
1.3 Principais Operadores..................................................................................... 05
1.4 Executando os Comandos............................................................................... 06
1.4.1 Comandos de Ajuda......................................................................................... 06
1.4.2 Comando de estatística descritiva.................................................................. 07
1.4.3 Criando novas variáveis.................................................................................. 08
1.5 Criando Gráficos.............................................................................................. 09
REFERÊNCIAS............................................................................................... 23
1
O SOFTWARE STATA
1. APRESENTAÇÃO DO STATA.12
O programa pode ser aberto diretamente pelo ícone (clicando duas vezes sobre
ele) na tela de abertura do Windows. Quando o programa é aberto, abre-se uma tela
contendo janelas menores, com cabeçalhos. A finalidade de cada janela é apresentada a
seguir:
2
Obs.: Usar o arquivo “ARQUIVO 1_dados financeiros de empresa” para iniciar o
STATA.
Janela Finalidade
Review Janela onde são armazenados os comandos, ou seja, é o histórico
de comandos executados.
Variables Janela que apresenta a lista das variáveis do banco de dados ativo.
É a lista e descrição das variáveis.
Stata Results Janela que apresenta os resultados obtidos com a execução dos
comandos.
Stata Command Janela em que há a digitação dos comandos a serem executados.
Properties Janela de propriedades das variáveis. Podemos modificar o nome
ou a descrição das variáveis (Nome ou Label). O cadeado no canto
da janela permite o bloqueio ou desbloqueio dos dados.
3
Na “Barra de Ferramentas” do STATA permite a execução de diversas tarefas
de forma análoga a maioria dos programas para o sistema Windows. Mas essas tarefas,
podem ser digitados em forma de comandos (ou rotinas de programação) a partir da
“janela de programação” (Stata Command).
O menu que está disponível na primeira linha e possui os recursos:
File Edit Data Graphics Statistics Window e Help
4
Data Browser: Visualiza o arquivo de dados que está sendo utilizado.
Clear: prossegue a execução do comando.
Break: Interrompe a execução de uma tarefa ou comando.
Logo que for iniciado o trabalho no STATA, é aconselhável abrir um arquivo .log,
que armazenará todos os comandos e seus resultados (com exceção de gráficos). Para
abrir um arquivo .log é só clicar sobre o quarto ícone (Log
Begin/Close/Suspend/Resume). O arquivo .log é um arquivo de tipo somente texto e não
permite alteração.
Como arquivo .log não é permitido alteração nos comandos, o mais aconselhável
é a criação do arquivo .do (Do-file Editor), pois permite alterações, correções e execução.
Ou, obtendo o mesmo resultado, pode-se criar um arquivo .do apenas clicando no botão
direito do “mouse” na janela Review.
Já que todos os comandos digitados na janela Stata Command são enviados para
a janela Review. Estes comandos podem ser guardados em um arquivo para,
posteriormente, serem editados e utilizados em uma nova análise. No caso do banco de
dados, o arquivo é salvo no formato .dta. Depois de salvo é só clicar duas vezes sobre o
arquivo e o STATA já abre com os dados salvos.
5
‘=’ —› Igual, que também pode ser implementado como ‘==’;
‘~=’ —› Diferente;
‘>=’ —› Maior igual;
‘>’ —› Maior;
‘<=’ —› Menor Igual;
‘<’ —› Menor.
help
A utilização do help é fortemente recomendada; clicando-se em help no menu
principal, pode-se pesquisar qualquer comando utilizando-se a opção Contents (todo o
manual), Search (palavras chaves) ou Stata command (comando).
Exemplo: caso necessite de informações específicas sobre alguma rotina (sintax), tipo
“regressão de mínimos quadrados ordinários”, devemos especificar após o comando de
ajuda:
help regress (ou reg)
6
1.4.2 Comando de estatística descritiva
7
A. Estimativa dos parâmetros por MQO;
B. Estimativa do erro-padrão dos parâmetros;
C. Estatística t-student calculada;
D. P-valor associado às estatístics t-student.
O programa usa como procedimento padrão um nível de significância de 5%.
O STATA permite criar novas variáveis a partir do banco de dados em uso. Neste
caso precisamos usar o comando ‘generate’ ou ‘gen’;
gen nova_varável = transformação_na_variável_existente ou expressão matemática
gen logpd = log(pd)
8
1.5 Criando Gráficos
avplot var_independente
Este comando pode ser usado gerando o gráfico para todas os regressões, sem que
necessariamente precisássemos digitar cada um deles:
avplots
9
PESQUISA NACIONAL POR AMOSTRA DE DOMICÍLIOS (PNAD)
2. APRESENTAÇÃO DA PNAD
10
socioeconômicas, algumas de caráter permanente, para ajudar a promover o
desenvolvimento do Brasil.
Na década de 70:
Principais temas estudados: aspectos gerais da população, educação, trabalho,
rendimento e habitação como características permanentes. Também foram pesquisados,
como características de periodicidade variável: migração e fecundidade.
Nos anos de 74 e 75 foi feita uma pesquisa especial chamada Estudo Nacional da
Despesa Familiar (ENDEF), que também investigou o consumo alimentar e orçamentos
familiares.
Na década de 80:
Mantiveram-se constantes as características realizadas na década de 70,
objetivando assim a criação de uma série histórica.
Em 87 foi incorporado às pesquisas o questionamento sobre a cor das pessoas, e
a existência de aparelhos eletrônicos como televisão e rádio em 88.
A característica saúde foi incorporado em 81, de maneira provisória, assim como
a educação. Em 82, mão-de-obra e previdência. Em 83, fecundidade feminina. E trabalho
em 89 e 90.
Na década de 90:
No ano de 92, a PNAD adicionou de forma permanente os temas de migração,
fecundidade, nupcialidade, trabalho infantil e ensino supletivo.
No ano de 1994 não foi realizado a pesquisa. Em 96, foi incluído o tema
suplementar mobilidade social. Entretanto, o mesmo foi retirado em 97.
Na década de 2000:
Além de aspectos gerais da população, educação, trabalho, rendimento e
habitação, vêm sendo mantidos os temas suplementares migração e fecundidade, que
também fizeram parte de todas as pesquisas da PNAD da década de 1990.
11
Em 2002 foram introduzidas novas características no tema domicílio. Já em 2003,
foi adicionado o tópico suplementar “participação em programas sociais voltados para a
educação”.
A PNAD, de acordo com o IBGE, teve sua abrangência prevista desde o seu início
para ser nacional. Porém, objetivo a ser alcançado de forma progressiva.
Iniciada em 1967 no Estado da Guanabara (atual Rio de Janeiro), em 1969 a
PNAD já abrangia as regiões Nordeste, Sudeste e Sul. Em1973 foi incluído o Centro-
Oeste, o Distrito Federal e a área urbana da região Norte, excluindo-se assim a região
rural dos estados de RO, AC, AM, RR e AP.
Apenas em 2004 é que as áreas rurais de RO, AC, AM, RR, PA e AP foram
incluídas na pesquisa e a PNAD alcançou a cobertura completa do Território Nacional.
2.3 Dados
12
Parte 1 – identificação e controle
Parte 2 – características da unidade domiciliar
•Tipo do domicílio •Destino do lixo
•Material das paredes •Forma de iluminação
•Material da cobertura •Telefone
•Cômodo •Fogão
•Dormitório •Filtro de água
•Condição de ocupação do domicílio •Rádio
•Aluguel mensal •Televisão
•Prestação mensal •Geladeira
•Propriedade do terreno •Freezer
•Abastecimento de água •Máquina de lavar roupa
•Banheiro ou sanitário •Microcomputador
•Uso do banheiro ou sanitário •Acesso à Internet
•Esgotamento sanitário
13
2.4 Extração dos Dados
Apagaremos as informações:
E substituir por:
Substituir: Por:
INPUT {
@ _column(
$ %
. G
/* “
*/ ”
run; }
. ) float
Obs.: IMPORTANTE!
Uma dica! Para não ser preciso digitar o feixe do parêntese e a palavra “float” em
todas a observações, descobriu-se o seguinte:
Para fechar o parêntese é necessário inserir um ponto (.) em todas a observações.
Para em seguida substituir o ponto (. ) por o fechamento do parêntese aberto, seguido da
palavra “float”.
Exemplo: Antes: @00001
Depois: _column(00001) float
Depois de feito essas mudanças, partiremos para alguns detalhes específicos, que
caso não sejam modificados, o STATA não consegue lê o arquivo input, e
consequentemente o arquivo de dados.
3º Mudanças especificas:
A primeira mudança especifica é com relação a palavra “float”, ela só será usada
pra valores até 7 (%1g, %2g ... %7g). Mudará quando o valor for acima de 8, e logo em
seguida você trocará o “g” pelo “f”. Que ficará assim:
Exemplos:
_column(00005) double V0102 %8g " NUMERO DE CONTROLE "
_column(00161) float V4617 %7f " STRAT - IDg AUTO E NAUT "
Segunda mudança que ocorre mais comumente nos arquivos é a seguinte:
Antes:
_column(00031) double V0208 12f “ ALUGUEL PAGO EM 09/08 “
Depois:
_column(00031) double V0208 %12f " ALUGUEL PAGO EM 09/08 "
A variáveis com valores iguais a 10 ou 12, normalmente não vem com a “%”,
portanto, quando for fazer essas pequena modificações observar bem essa falta, e assim
inserir o símbolo da percentagem.
Antes:
_column(00096) double V4605 12g10 “ PROBABILIDADE DO MUNICÍPIO “
Depois:
_column(00095) double V4605 %12.10f " PROBABILIDADE DO MUNICÍPIO "
Que nesses casos específicos o ponto (.) não deve ser substituído por “g” quando
vem precedido por outro número. Ele permanece, sendo apenas acrescentado o “f”
quando for maior do que 7.
Estando o arquivo salvo o próximo passo é abrir o arquivo no stata para poder
executar as tarefas do seu trabalho.
2.5 Manipulação dos dados no STATA.12
1º Comando: “clear”
Geralmente o comando "clear" inicia um programa ".do" para limpar a memória
do STATA.
2º Comando: “cd”
Logo em seguida, deve-se especificar onde o arquivo ficará salvo.
Ex.: cd "C:\Curso_Crato"
Digita o comando, espaço, e o endereço onde os arquivos estão salvos.
3º Comando: “infile using”
Mostra o caminho do arquivo que se encontra os arquivos que serão utilizados.
Ex.: infile using "C:\Curso_Crato\INPUTDOM2013.txt"
Nesse caso, o comando está puxando o arquivo input dos domicílios da PNAD do
ano de 2013. E dentro desse arquivo, como foi visto antes, tem o endereço do arquivo dos
dados. Que serão trazidos para o formato STATA, .dta, quando o comando for executado.
4º Comando: “save”
Para salvar o banco de dados pela primeira vez, usa-se “save” e o nome que irá
nomear o arquivo, nesse caso não precisará digitar um novo endereço, pois o mesmo
ficara salvo junto aos outros arquivos que já foram puxados.
Ex.: save "domicilio2013"
5º Comando: “keep”
Se tratando dos dados da PNAD, quando observamos o dicionário do arquivo
domicílios, é sempre preciso fazer o corte para as “entrevistas realizadas”, contando
assim, a variável V0104 (do arquivo domicilio), com a descrição igual a 1, que equivale
as entrevistas realizadas.
Ex.: Keep if V0104==1
6º Comando: “sort”
Para ordenar um banco de dados por uma variável ou conjunto de variáveis, utilize
a opção "sort". No caso da PNAD é preciso ordenar as variáveis: Unidade da Federação,
número de controle e número de série.
Ex.: sort UF V0102 V0103
13º Comando: Fazendo um corte (Keep) nas variáveis de interesse do arquivo pessoas
Ex.: keep V0101 UF V0102 V0103 V8005 V0401 V0402 V0302 V4803 V4713 V4814
V4722 V4724 V4728 V4729 V0301 V4011 V0404 V0601 V0602 V0504 V4803 V9058
V1251 V1254 V1257 V1263 V4718 V4720 V4721 V4727 V4742
14º Comando: Salvar o arquivo com as variáveis de interesse.
15º Comando: Como será feito a união dos dois arquivos não vamos usar o comando
“clear”, para limpar o STATA.
Obs.: Para salvar um banco pela primeira vez, utiliza-se “save”. Se o arquivo já existir, e
você quiser gravar o banco por cima do anterior:
Ou seja, um banco é salvo somente com o comando "save", tornando difícil perder
os dados originais. Mesmo se o comando "save" não for usado intencionalmente, o Stata
recusará gravar o banco por cima do original, se a opção "replace" não for colocada.
19º Comando: A partir da união dos dois arquivos, e havendo o corte das variáveis de
interesse, segue para os comandos específicos de cada pesquisa, de cada revisão de
literatura, de cada metodologia adotada.
REFERÊNCIAS