Você está na página 1de 28

05/04/2011

1
Prof Dr Alcione Miranda dos Santos
Departamento de Sade Pblica UFMA
Programa de Ps-Graduao em Sade Coletiva-UFMA
INTRODUO AO INTRODUO AO
Por que STATA?
Muitos dos pacotes estatsticos so bastante extensos
em termos de opes de anlise disponveis.
Alguns so mais voltados para reas especficas.

O STATA tem recursos para trabalhar por meio da


Internet.
Site: www.stata.com
O STATA j est em sua verso 11.0.
05/04/2011
2
Iniciando o STATA
Command entrada dos comandos STATA.
Results mostra o comando que voc digitou e o respectivo
resultado. (Se more apresentado, pressione enter para
continuar os resultados ou q para sair).
Review mostra o histrico dos comandos digitados
recentemente.
Variables lista as variveis contidas na base de dados.
Data Editor mostra a base de dados atual em forma de
uma planilha. Esta janela pode ser fechada posteriormente.
Graph apresenta os resultados dos grficos.
Quando iniciamos o STATA, vrias janelas aparecem:
05/04/2011
3
Introduo aos comandos do STATA
Todos os comandos do STATA devem ser digitados
em letras minsculas.
O programa sensvel a letras maisculas e
minsculas, ou seja
Sexo sexo
Muitos comandos podem ser abreviados (por
exemplo:
summary summ
tabulate tab
describe desc
Existem duas maneiras de trabalhar com o STATA:
Modo interativo: Comandos podem ser digitados
diretamente na janela Command e executados
pressionando Enter.
Modo em lote: Comandos podem ser escritos em um
arquivo separado (chamado arquivo do) e executado
em uma nica vez.
Primeiramente, usaremos o modo interativo para os
exerccios, posteriormente veremos como criar
arquivos do.
Introduo aos comandos do STATA
05/04/2011
4
Para saber qual diretrio est sendo usado,
digite pwd
pwd
D:\stata10\Stata10
Para criar um diretrio, use o comando
mkdir
mkdir aulas
cd aulas
pwd
D:\stata10\Stata10\aulas
Introduo aos comandos do STATA
EXERCCIO 1: Conhecendo o STATA
Abra o programa Stata 10.0
Identifique as janelas: Results, Command, Review,
Variables.
Abra o editor de dados ( ) e tente entrar com
alguns valores (digite os valores e pressione
Enter).
Feche o editor de dados e ento digite o
comando clear na janela Command.
Clique no cone Help (Help Contents).
05/04/2011
5
Abrindo a base de dados
O STATA pode ler os seguintes tipos de arquivos:
.dta formato Stata
.txt - formato ASCII (text)
.raw formato ASCII (text)
.xls formato Excel
Base de dados criada no STATA tem a extenso .dta.
Para acessar o arquivo existente (por exemplo,
filename.dta) selecionando File Open ou digitando:
use filename, clear
Se o nome do arquivo contm espaos em branco, ele
deve ser colocado entre aspas.
Abrindo a base de dados
05/04/2011
6
O STATA mantm a base de dados na memria.
Se voc estiver trabalhando com uma base de dados, e
desejar trabalhar com outra base, preciso remover a
base de dados atual da memria, para isto digite clear
Para grandes bases de dados, faz-se necessrio
aumentar o limite de memria do STATA (o padro
1 megabyte).
set memory #
# representa o nmero de kilobytes (k), megabytes (m) ou
gigabytes (g).
Abrindo a base de dados
Por exemplo:
set memory 100m
Por default, STATA assume que todos os arquivos
esto em
c:\data.
Para mudar o diretrio digite:
cd nomedapasta
Se o nome da pasta contm espaos em branco,
ele deve ser colocado entre aspas.
Abrindo a base de dados
05/04/2011
7
Se uma base de dados j est na memria (e no
necessrio salv-lo), limpe a memria com a opo
clear
Para salvar a base de dados, clique em ou
digite:
save filename, replace
Use a opo replace se voc deseja substituir a
base de dados existente no STATA (.dta).
Salvando a base de dados
Existem vrias maneiras de inserir dados no
STATA, a escolha depende da natureza dos
dados.
Entrada manual: digitando ou colando os dados
dentro do editor de dados.
Usando arquivo no formato ASCII (por exemplo,
arquivos txt)
Uso de outros programas que criam base de
dados no formato do STATA (ex: SAS, SPSS)
Criando a base de dados no STATA
05/04/2011
8
Usando arquivos ASCII
A base de dados deve estar no formato ASCII
(texto).
Se voc usou o EXCEL para criar a base de dados,
salve o arquivo como texto (.txt), e no como .xls.
Opes:
Dados sem formatao (i.e. as colunas so
separadas por espao, tabulao ou vrgula): use
infile ou insheet.
Dados com formatao(i.e. dados com colunas
fixas): use infix.
Abrindo dados sem formatao
Voc pode usar insheet quando a base de
dados foi criada em um pacote computacional
que utiliza planilhas, por exemplo Excel:
insheet using nomedoarquivo
A primeira linha da base de dados deve conter o
nome das variveis.
Podemos tambm usar infile para base de
dados com outros formatos, mas necessita
especificar todas as variveis.
05/04/2011
9
EXERCCIO 2
Crie uma pasta para guardar as bases de dados
criadas no STATA (c:\statadados) e mude o
diretrio usando o comando cd
Use insheet para ler a base de dados:
pediatrics.txt
Salve o arquivo (no seu diretrio de trabalho)
como
pediatrics.dta
Rotulando as variveis
Rtulo (label) uma descrio de uma varivel em
at 80 caracteres.
til quando construmos grficos, etc.
Para criar rtulos para as variveis, clique duas vezes
na coluna da varivel a ser rotulado ou digite:
label variable nomevar label
Rtulos para valores numricos tambm podem ser
definidos.
05/04/2011
10
Rotulando as variveis
Exemplos:
label variable idade Idade dos pacientes(anos)
label variable sexo Sexo dos pacientes
Os rtulos tambm ajudam a lembrar o significado
dos cdigos de 0 e 1, definidos para determinada
varivel categrica.
Definindo os rtulos
Dois passos para criar rtulos para os cdigos da varivel:
label define nomelabel 0 label" 1label"
label values nomevar nomelabel
Exemplo:
label define sex 1 feminino 0 masculino
label values sexo sex
Nota: Para modificar um rtulo use
label define nomelabel 0 label" 1label, modify
05/04/2011
11
Arquivos Log
Todos os comandos do STATA e seus resultados
(exceto grficos) so guardados em um arquivo
log.
Ao iniciar uma sesso no STATA, aconselhvel
abrir um arquivo log, usando o comando:
log using nomearquivo
(onde nomearquivo escolhido pelo usurio)
Para fechar o log, digite:
log close
Criando arquivos Log
log using c:\pasta1\resulta_1.txt,text
Cria o arquivo resulta_1.txt e salva os resultados no formato
texto.
log using c:\pasta1\resulta_1.txt,text replace
Grava o contedo do arquivo resulta_1.txt com os novos
resultados
log using c:\pasta1\resulta_1.txt,text append
Adiciona novos resultados no final do arquivo resulta_1.txt
05/04/2011
12
Formatos das variveis
Todas as variveis so formatadas por valores
numricos (real) ou alfanumricos (string).
Voc identificar o formato da varivel pela cor:
preto para numrica e vermelho para
alfanumrica.
Alternativamente, podemos ver o tipo da
varivel digitando: describe
Examinando os dados
codebook til para verificar erros nos dados.
Fornece informao de cada varivel com
relao ao tipo, rtulo, valores ausentes, etc.
Alternativamente, list permite o usurio ver a
base de dados para inspeo.
Os comandos codebook e list podem ser
restritos a variveis especficas ou obervaes.
05/04/2011
13
Examinando os dados
Utilizando o comando codebook
Examinando os dados
Usaremos os seguintes comandos
Informaes das variveis e estatsticas descritivas
describe propriedades de cada varivel
list mostra os dados
summarize medidas descritivas
tabulate constri tabelas de frequncias
Grficos
scatter diagrama de disperso
line grfico de linhas
hist histograma
graph box box plot
graph bar grfico de barras
graph pie grfico de setores
05/04/2011
14
Examinando os dados
Comando describe ou desc
Examinando os dados
Comando list
05/04/2011
15
Analisando os dados
summarize - mostra o nmero de casos,
mdia, desvio padro, mnimo e mximo.
sum - modo abreviado de summarize.
sum nomevar, detail - mostra os percentis,
coeficiente de curtose, coeficiente de assimetria
da varivel nomevar
Analisando os dados
05/04/2011
16
Analisando os dados
Para produzir tabelas de frequncias, usamos o
comando
tabulate nomevar
Analisando os dados
O comando tabulate nomevar1 nomevar2
constri uma tabela de contingncia para duas
variveis.
05/04/2011
17
Analisando os dados
Para mostrar o nmero de casos e porcentagem,
devemos usar um dos comandos:
tabulate nomevar1 nomevar2,row
tabulate nomevar1 nomevar2,col
Caso deseja-se apresentar a frequncia de valores
ausentes (missings), digite:
tabulate nomevar1 nomevar2,missing
Analisando os dados
05/04/2011
18
Analisando os dados
Algumas vezes, desejamos representar as frequncias
de uma varivel para cada valor de outra varivel.
Por exemplo, queremos analisar a varivel idade por
sexo. Para isto, usamos o comando
by sexo:summary idade
Antes de usar o comando by, precisamos ordenar os
valores da varivel sexo. Para isto, usa-se o comando
sort sexo
Analisando os dados
05/04/2011
19
Analisando os dados
Operadores matemticos e lgicos
+ soma
sqrt() raiz quadrada
> maior que
- diferena
exp() exponencial
>= maior ou igual que
/ diviso
< menor que
* multiplicao
~ negao
<= menor ou igual que
^ potncia
& e
== igual
ln() logaritmo natural
| ou
~= diferente
!= diferente
05/04/2011
20
Transformaes de variveis
Novas variveis podem ser criadas usando o comando
generate:
generate novavar = expresso
expresso pode conter funes ou combinaes de variveis
existentes, por exemplo:
gen imc=peso/altura^2
replace pode ser usado para mudar o contedo da varivel
existente:
replace oldvar = expressao1 [if expressao2]
Qualquer funo pode ser usada com generate ou com
replace.
if usado para restringir o comando a um subconjunto de
observaes:
replace idade=. if idade==999
Note que dois sinais de igualdade == so usados para testar a
igualdade, enquanto um sinal = usado para atribuir o valor.
Operadores lgicos tambm podem ser usado aps if:
& denota and
| denota or
~ or ! denota not (ex: ~= significa diferente de)
Transformaes de variveis
05/04/2011
21
Por exemplo, para criar uma varivel dummy use:
gen sobrepeso=0
replace sobrepeso=1 if imc>=25.0 & imc<29.9
Uma simples alternativa para o cdigo acima :
gen sobrepeso=(imc>=25.0 & imc<29.9)
Transformaes de variveis
rename pode ser usado para renomear a varivel.
rename oldvarname newvarname
Para deletar uma varivel ou mais, digite:
drop nomevar
Alternativamente, o comando keep nomevar elimina
todas as variveis, menos as variveis descritas no
comando.
Para deletar certas observaes use:
drop if exp
Por exemplo, drop if idade==.
Transformaes de variveis
05/04/2011
22
EXERCCIO 3
Abra a base de dados pediatric.dta.
Use describe para verificar quais variveis so
alfanumricas e quais so as numricas.
Renomeie a estatura como comprimento.
Converta peso em kilogramas para gramas, usando
replace.
Rotule peso como peso do rn (em gramas).
Crie a varivel razao usando:
gen razao = (peso * 1000)/estatura
Faa uma tabela de frequncia para a varivel
sexo
Apresenta as variveis sexo e anomalia em uma
tabela de contigncia.
EXERCCIO 3 (cont.)
05/04/2011
23
Determine as medidas descritivas para as variveis
peso e estatura.
Guarde somente as observaes dos recm-
nascidos com anomalia. (use drop ou keep).
Salve a base de dados modificada. (Lembre-se de
colocar outro nome para a base de dados modificada.)
EXERCCIO 3 (cont.)
Construindo Grficos
Podemos construir diversos grficos no STATA.
Vejamos os principais grficos:
Grficos de barras e de setores
Box-plot
Histograma
Grficos de linhas
Diagrama de disperso
05/04/2011
24
Grficos de barras
graph bar cigs, over(year) title("Cigarette Consumption
Per Person, US") b2(Year) ytitle("number of
Cigarettes") ylabel(0(2000)4000)
0
2
,
0
0
0
4
,
0
0
0
N
u
m
b
e
r

o
f

C
i
g
a
r
e
t
t
e
s
1900 1910 1920 1930 1940 1950 1960 1970 1980 1990
Year
Cigarette Consumption Per Person, US
Grfico de setores
vaginal cesrea
frceps
Tipo de parto das mes dos recm-nascidos, MA
graph pie, over(parto) title("Tipo de parto das mes dos
recm-nascidos, MA")
05/04/2011
25
Histograma
hist idademae, frequency title("Idade (em anos) das mes
dos recm-nascidos, MA") xtitle("idade") ytitle("Nmero
de mes")
0
2
0
0
4
0
0
6
0
0
8
0
0
N

m
e
r
o

d
e

m

e
s
10 20 30 40 50
idade
Idade (em anos) das mes dos recm-nascidos, MA
Histograma
hist idademae, bin(10)frequency title("Idade (em anos)
das mes dos recm-nascidos, MA") xtitle("idade")
ytitle("Nmero de mes")
0
1
0
0
0
2
0
0
0
3
0
0
0
N

m
e
r
o

d
e

m

e
s
10 20 30 40 50
idade
Idade (em anos) das mes dos recm-nascidos, MA
05/04/2011
26
Box plot
graph box idademae, title(Idade(em anos) das mes dos
recm-nascidos, MA") ytitle(idade")
1
0
2
0
3
0
4
0
5
0
i
d
a
d
e
Idade (em anos) das mes dos recm-nascidos, MA
Box plot por grupo
graph box idademae, by(parto) ytitle(idade da me(em
anos)")
1
0
2
0
3
0
4
0
5
0
1
0
2
0
3
0
4
0
5
0
vaginal cesrea
frceps
i
d
a
d
e

d
a

m

e

(
e
m

a
n
o
s
)
Graphs by tipo de parto
05/04/2011
27
Grfico de linhas
6
0
8
0
1
0
0
1
2
0
1
4
0
N


d
e

c
a
s
o
s
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
ano
dados fictcios
N de casos de tuberculose, 1999-2009, So Lus-MA
line casos ano
Diagrama de disperso
0
2
0
0
0
4
0
0
0
6
0
0
0
p
e
s
o

a
o

n
a
s
c
e
r

e
m

g
r
a
m
a
s
30 40 50 60
comp ao nascer cm
graph twoway scatter pesonasc compnasc
05/04/2011
28
Links teis
http://www.iies.su.se/~masa/stata.htm
Contm links para outros sites
http://www.princeton.edu/~erp/stata/main.html
http://www.ats.ucla.edu/stat/stata/webbooks/reg/
default.htm
Obtendo mais informaes sobre o STATA
STATA tem arquivos de ajuda para todos os
comandos.
Comandos do STATA so descritos com detalhes no
STATA Users Guide and Reference Manual.
Finalmente, voc pode obter vrios tutoriais na
internet. Um fcil caminho para encontrar usar o
Google e procurar por Stata tutorial.
(Este tutorial foi preparado usando informaes do livro Data analysis using STATA
Ulrich Kohler e Frauke Kreuter, Stata Press, 2009. )

Você também pode gostar