Escolar Documentos
Profissional Documentos
Cultura Documentos
DIVERSAS
set matsize 800 Define o tamanho da matriz que armazenará os dados
sysuse dir Mostra os bancos de dados do STATA
sysuse auto.dta Abre o banco de dados auto.dta
rename X Xx Renomeia a variável X para Xx
label var X “Anos de estudo” Descreve a variável X como “Anos de estudo”
drop X Exclui a variável X
drop X if X>10 Exclui as observações em que X é maior que 10
describe Descreve o banco de dados em uso
display 3+1 Calculadora
edit X Editar a variável X
list in 1 Lista os valores das variáveis na linha 1
sort X Ordena os valores da variável X em ordem crescente
replace X=8.5 in 1 Muda o valor de X na linha 1 para 8.5
replace X=2 if idade>=21 & idade<30 Modifica a variável X para 2 se a variável idade for maior ou igual
a 21 e menor que 30
recode X 1=0 0=1 Troca 1 por 0 e 0 por 1 na variável X
recode idade 17/30=1 31/40=2 Modifica a variável idade: valores entre 17 e 30 = 1 e entre 31 e
40 = 2
recode idade min/30=1 31/max=2 Modifica a variável idade: do menor valor até 30 = 1 e entre 31 e
o valor máximo = 2
list X Y Lista/mostra as variáveis X e Y
list X Y IF X>Y Lista X e Y se X for maior que Y
clear all Apaga todo banco de dados
clear Fecha um arquivo sem salvar (apaga tudo)
format X %7.2f Modifica o tamanho da variável X para: 7 espaços antes da
vírgula e 2 depois da vírgula
format X %15s Modifica o tamanho da variável “string” para 15 espaços
order _all, alphabetic Ordena as variáveis em ordem alfabética
order X, after (Y) Coloca a variável X depois da variável Y
order X, before (Y) Coloca a variável X antes da variável Y
db reg Abre a caixinha para colocar as variáveis da regressão
db .... Abre a caixinha para você interagir com o programa (método
alternativo ao Command)
TESTES ESTATÍSTICOS
ttest X==Y Teste de médias para amostras dependentes
ttest X, by(tratamento) Teste de diferença de médias para X segundo tratamento
(primeiro dar o comando sort tratamento) – Considera
distribuição normal e mesmo desvio-padrão
ttest X, by(tratamento) unequal Teste de diferença de médias para X segundo tratamento
(primeiro dar o comando sort tratamento) – Considera variâncias
diferentes
ttest X=35 Teste para ver se a média de X é estatisticamente igual a 35
sdtest X, by(tratamento) Teste de razão de variâncias – teste de homocedasticidade
(primeiro dar o comando sort tratamento)
ci X Constrói um intervalo de confiança para a variável X
corr X Y Correlação entre X e Y
ESTATÍSTCIAS DESCRITIVAS E DISTRIBIOÇÕES DE FREQUÊNCIA
tab X Distribuição de frequência de X
tab X Y Distribuição de frequência cruzada entre X e Y
tab X Y, col Cruzada com os percentuais de participação na coluna
tab X Y, row Cruzada com os percentuais de participação na linha
sum X Principais estatísticas descritivas de X
sum X, detail Estatísticas descritivas detalhadas
REGRESSÕES
reg Y X MQO - Y é a variável dependente e X é a independente
reg Y X, robust MQO com desvios-padrões robustos a heterocedasticidade
reg Y X, level (90) Considera como 90% o intervalo de confiança
reg Y X, noconstant MQO sem constante
reg Y X, noconstant level (99) MQO sem constante e com 90% de intervalo de confiança
probit Y X Modelo Probit
logit Y X Modelo Logístico
db reg Abre a caixinha para selecionar as variáveis da regressão
CRIAR VARIÁVEIS
gen log_X=log(X) ou gen ln_X=ln(X) Gera uma nova variável “log_X” com o logaritmo de X, ou
logaritmo natural de X
gen X_2=X^2 if Y==1 Gera uma nova variável “X_2” elevando X ao quadrado quando Y
for igual a 1
gen N=1 if X>10 Gera uma nova variável “N” colocando o valor 1 quando X for
maior que 10
gen F=3 if X<=5 Gera uma nova variável “F” colocando o valor 3 quando X for
menor ou igual a 5
. input id str10 nome sexo Criar variáveis com seus respectivos valores.
. 1 “Ana” 1 str10 = indica que a informação não é numérica (string) com 10
. 2 “Celso” 2 espaços
. end
GRÁFICOS
scatter Y X Dispersão
line Y X Linha
graph bar Y X Barras (médias de X e Y)
graph pie Y X Pizza
hist X Histograma
hist X, nolmal freq Adiciona ao histograma uma curva de distribuição normal com
média e desvio-padrão
SÍMBOLOS
< Menor que
<= Menor ou igual a
> Maior que
>= Maior ou igual a
== Igual a
~= ou != Diferente de
~ Não
& E
| Ou
OPERADORES
sqrt( ) Raiz quadrada
esp( ) Exponencial
log ( ) Logaritmo de base 10
ln ( ) Logaritmo de base e (natural)
{
@00001 V0101 $4. /* ANO DE REFERÊNCIA */
@00005 UF $2. /* UF */
o Variáveis de texto:
Ao invés de colocar float ou duble, devemos colocar str28 (para 28 caracteres), str59 (para
59 caracteres) etc.
O formato também muda: ao invés de %28g, devemos colocar %28s (para 28 caracteres); ou
ao invés de %59g, devemos colocar %59s (para 59 caracteres).
Ex: pnad_2011_dic.dct
No STATA:
o Para salvar, dar o comando: save “...endereço onde quer salvar...”, adicionando o nome que quer pro
arquivo no final com .dta
Ex: save “C:\Documents and Settings\Usuario\Desktop\PNAD 2011\pnad_2011_pes.dta”