Você está na página 1de 4

Comandos STATA – Giovani Baggio

DIVERSAS
set matsize 800 Define o tamanho da matriz que armazenará os dados
sysuse dir Mostra os bancos de dados do STATA
sysuse auto.dta Abre o banco de dados auto.dta
rename X Xx Renomeia a variável X para Xx
label var X “Anos de estudo” Descreve a variável X como “Anos de estudo”
drop X Exclui a variável X
drop X if X>10 Exclui as observações em que X é maior que 10
describe Descreve o banco de dados em uso
display 3+1 Calculadora
edit X Editar a variável X
list in 1 Lista os valores das variáveis na linha 1
sort X Ordena os valores da variável X em ordem crescente
replace X=8.5 in 1 Muda o valor de X na linha 1 para 8.5
replace X=2 if idade>=21 & idade<30 Modifica a variável X para 2 se a variável idade for maior ou igual
a 21 e menor que 30
recode X 1=0 0=1 Troca 1 por 0 e 0 por 1 na variável X
recode idade 17/30=1 31/40=2 Modifica a variável idade: valores entre 17 e 30 = 1 e entre 31 e
40 = 2
recode idade min/30=1 31/max=2 Modifica a variável idade: do menor valor até 30 = 1 e entre 31 e
o valor máximo = 2
list X Y Lista/mostra as variáveis X e Y
list X Y IF X>Y Lista X e Y se X for maior que Y
clear all Apaga todo banco de dados
clear Fecha um arquivo sem salvar (apaga tudo)
format X %7.2f Modifica o tamanho da variável X para: 7 espaços antes da
vírgula e 2 depois da vírgula
format X %15s Modifica o tamanho da variável “string” para 15 espaços
order _all, alphabetic Ordena as variáveis em ordem alfabética
order X, after (Y) Coloca a variável X depois da variável Y
order X, before (Y) Coloca a variável X antes da variável Y
db reg Abre a caixinha para colocar as variáveis da regressão
db .... Abre a caixinha para você interagir com o programa (método
alternativo ao Command)
TESTES ESTATÍSTICOS
ttest X==Y Teste de médias para amostras dependentes
ttest X, by(tratamento) Teste de diferença de médias para X segundo tratamento
(primeiro dar o comando sort tratamento) – Considera
distribuição normal e mesmo desvio-padrão
ttest X, by(tratamento) unequal Teste de diferença de médias para X segundo tratamento
(primeiro dar o comando sort tratamento) – Considera variâncias
diferentes
ttest X=35 Teste para ver se a média de X é estatisticamente igual a 35
sdtest X, by(tratamento) Teste de razão de variâncias – teste de homocedasticidade
(primeiro dar o comando sort tratamento)
ci X Constrói um intervalo de confiança para a variável X
corr X Y Correlação entre X e Y
ESTATÍSTCIAS DESCRITIVAS E DISTRIBIOÇÕES DE FREQUÊNCIA
tab X Distribuição de frequência de X
tab X Y Distribuição de frequência cruzada entre X e Y
tab X Y, col Cruzada com os percentuais de participação na coluna
tab X Y, row Cruzada com os percentuais de participação na linha
sum X Principais estatísticas descritivas de X
sum X, detail Estatísticas descritivas detalhadas
REGRESSÕES
reg Y X MQO - Y é a variável dependente e X é a independente
reg Y X, robust MQO com desvios-padrões robustos a heterocedasticidade
reg Y X, level (90) Considera como 90% o intervalo de confiança
reg Y X, noconstant MQO sem constante
reg Y X, noconstant level (99) MQO sem constante e com 90% de intervalo de confiança
probit Y X Modelo Probit
logit Y X Modelo Logístico
db reg Abre a caixinha para selecionar as variáveis da regressão
CRIAR VARIÁVEIS
gen log_X=log(X) ou gen ln_X=ln(X) Gera uma nova variável “log_X” com o logaritmo de X, ou
logaritmo natural de X
gen X_2=X^2 if Y==1 Gera uma nova variável “X_2” elevando X ao quadrado quando Y
for igual a 1
gen N=1 if X>10 Gera uma nova variável “N” colocando o valor 1 quando X for
maior que 10
gen F=3 if X<=5 Gera uma nova variável “F” colocando o valor 3 quando X for
menor ou igual a 5
. input id str10 nome sexo Criar variáveis com seus respectivos valores.
. 1 “Ana” 1 str10 = indica que a informação não é numérica (string) com 10
. 2 “Celso” 2 espaços
. end
GRÁFICOS
scatter Y X Dispersão
line Y X Linha
graph bar Y X Barras (médias de X e Y)
graph pie Y X Pizza
hist X Histograma
hist X, nolmal freq Adiciona ao histograma uma curva de distribuição normal com
média e desvio-padrão

SÍMBOLOS
< Menor que
<= Menor ou igual a
> Maior que
>= Maior ou igual a
== Igual a
~= ou != Diferente de
~ Não
& E
| Ou
OPERADORES
sqrt( ) Raiz quadrada
esp( ) Exponencial
log ( ) Logaritmo de base 10
ln ( ) Logaritmo de base e (natural)

Carregar dados da PNAD

 Abrir um documento no Bloco de Notas;

o Escrever: dictionary using “...endereço do arquivo .txt dos dados da pnad...”

 Ex: dictionary using “C:\Documents and Settings\Usuario\Desktop\IBGE - PNAD 2011 -


Microdados\Dados\pnad_2011PES.txt”

o Abre chaves, da dois “enter”, fecha chaves e da mais um “enter”:

o Na linha entre as chaves, colar os dados do dicionário:

{
@00001 V0101 $4. /* ANO DE REFERÊNCIA */

@00005 UF $2. /* UF */

@00005 V0102 $8. /* NÚMERO DE CONTROLE */

@00013 V0103 $3. /* NÚMERO DE SÉRIE */

@00016 V0301 $2. /* NÚMERO DE ORDEM */

o Utilizar Ctrl + H (localizar e substituir) para:

 Localizar @ e substituir por _column(

 Localizar $ e substituir por %

 Localizar . e substituir por g (cuidar que vai substituir o . lá em cima no .txt do


endereço dos dados)

 Localizar /* e substituir por “

 Localizar */ e substituir por “

 Localizar ‘ V ’ (espaço e depois V) e substituir por ) float V

o Colocar % onde falta na 3ª coluna e nestas linhas trocar g por f

o De 1 a 7 caracteres (%1g a %7g, pode ser f também): deixar float

o De 8 a 12 caracteres (%8g a %12g, pode ser f também): colocar double

o Variáveis de texto:

 Ao invés de colocar float ou duble, devemos colocar str28 (para 28 caracteres), str59 (para
59 caracteres) etc.

 O formato também muda: ao invés de %28g, devemos colocar %28s (para 28 caracteres); ou
ao invés de %59g, devemos colocar %59s (para 59 caracteres).

o SALVAR este arquivo com .dct

 Ex: pnad_2011_dic.dct

 No STATA:

o Dar o comando: infile using “...endereço do arquivo .dct feito anteriomente...”

 Ex: infile using “C:\Documents and Settings\Usuario\Desktop\IBGE - PNAD 2011 -


Microdados\pnad_2011_dic.dct”

o A base será carregada!!!

o Para diminuir o “peso” da base, dar o comando: compress (comprime os dados)

o Para salvar, dar o comando: save “...endereço onde quer salvar...”, adicionando o nome que quer pro
arquivo no final com .dta
 Ex: save “C:\Documents and Settings\Usuario\Desktop\PNAD 2011\pnad_2011_pes.dta”

Você também pode gostar