Você está na página 1de 13

Universidade Federal do Rio de Janeiro

Faculdade de Medicina
Introduo ao STATA
Departamento de Medicina Preventiva
Instituto de Estudos de Sade Coletiva
O STATA um Software que permite analisar grandes bases de dados,
usando mtodos estatsticos.
 tcnicas descritivas simples
 ou ajuste de modelos complexos
Introduo ao
STATA

Tania Guilln de Torres


(tguillen@iesc.ufrj.br)

Rejane Sobrino Pinheiro


(rejane @iesc.ufrj.br)

Introduo ao STATA Introduo ao STATA


Vantagens: Operadores usados pelo STATA :
Operadores Aritmticos
1. Requer pouco espao no disco rgido
+ Adio
2. Requer pouca memria RAM - se necessrio possvel aumenta-la, - Subtrao
atravs do comando set mem 300m por exemplo. * Multiplicao
/ Diviso
3. Mtodos grficos poderosos na parte de diagnstico de modelos
^ exponenciao
4. Boa interface com processadores de texto e impressoras Operadores Lgicos
& e
5. atualizado con freqncia - e publica o Stata Technical Bulletin .
| ou
6. Na pgina http://www.stata.com encontram-se disponveis diversas ~ no
rotinas que podem ser copiadas para o diretrio c:\ado e executadas Operadores Relacionais
dentro do Stata. = igual ( Obs. Aps o comando if devemos usar == )
~= diferente
> maior
Desvantagens >= maior igual
 No importa arquivos de bancos de dados (Dbase, Epi Info, Acces, etc.) < menor

diretamente requer de um programa de interface (Stat-Transfer) <= menor igual

Obs. As expresses lgicas assumem o valor 1 para verdadeiro e 0 para falso.


Janelas do STATA
Iniciando o STATA
Clicar 2 vezes no cone do STATA do Windows

Caso no exista o cone clique a seguinte seqncia


iniciar Programas Stata

 Command : Dos comandos a serem executados


 Results : Sadas dos comandos executados
 Variables : Lista de variveis do banco em uso
 Review : Comandos j executados
 Stata Graph : Grficos

Barra de Ferramentas File


O menu do STATA permite a execuo de diversas tarefas de
forma anloga a maioria dos programas para o sistema Windows.
Permite realizar tarefas do tipo:
 Abrir e salvar bases de dados no formato
STATA (*.dta)
Os comandos tambm podem ser digitados a partir da janela dos  Abrir e salvar grficos criados pelo
comandos. STATA
 Executar programas de comandos criados
pelo usurio (*.do)
 Abrir e salvar arquivo que guarde as sadas
e se necessrio podem ser repetidos clicando duas vezes no comando da janela de resultados,
desejado a partir da janela [Review]
 Importar e salvar arquivos em formato
ASCII
Edit Preferences

possvel: Copiar e colar


Permite personalizar
 bases de dados
As cores das janelas do Stata
 Sadas da janela de Resultados em formato texto ou
Dos Grficos
tabela
Voltar as configuraes Padro.

Data Graphics

Descrever o banco de dados Elaborar grficos tipo:

Editar a base de dados  Histograma

Sortear o banco  Boxplot

Combinar bases de Dados do tipo:  Barra


Append ou Merge  Setores
Criar rtulos para a base de dados,  Disperso,
variveis ou categorias de variveis
 Diagnsticos para os modelos de
Mudar o nome das variveis, regresso
eliminar observaes / variveis  Series Temporais
Procurar observaes duplicadas  Controle de qualidade
Operaes com matrizes  Etc.
Calculadora
Statistics Janela do HELP:
 Estatstica descritiva (Mdias, propores,
intervalos de confiana, testes de hipteses,
etc.
 Modelos de Regresso :
 Linear
 Logstica
 Sobrevida
 Lineares Generalizados Permite lembrar a sintaxe dos comandos,
 Sries Temporais (Arima, Arch/Garch)  Pesquisar tpicos no site do STATA.
 Dados Longitudinais
 Obter verses atualizadas do STATA.exe e dos programas com
 Amostragem Complexa extenso *.ado
 Analise Multivariada (Componente
principais, Analise Fatorial, etc.)
 Importar e instalar rotinas desenvolvidas por outros
pesquisadores,
 Bootstrap/Jackknife

Barra de Ferramentas ....cont Barra de Ferramentas

Abrir arquivos do tipo *.dta


Janela [Log]
]:
]
Salvar arquivo *.dta em uso As sadas da janela de Resultados podem ser salvas em formato:
Janela do Log *.log ou *.smcl
Editar base de dados O formato *.log pode ser editado no bloco de notas, Word, etc.

Browse nao permite modificar a base


 mostrar contedo do arquivo que guarda as sadas
de dados
 fechar o arquivo *.log
Editor de arquivos de comandos (*.do)  suspender temporariamente a gravao das sadas no
Janela do Help arq.log
 Resume redireciona as sadas novamente ao
Interrompe execuo de comandos arq.log
Entrada de Dados
Bases de Dados no STATA
Clicar no boto [Editor]

1. possvel criar a base diretamente no editor


2. Importar ou exportar arquivos do tipo ASCII e planilhas
3. E copiar e colar no editor do STATA dados de outras planilhas
Digitar os dados na planilha Stata - uma coluna por varivel e uma linha por
paciente.
O Stata automaticamente escolhera o tipo da varivel de acordo com os
valores digitados.

Obs. No esquecer de apertar o boto Preserve para manter as alteraes


feitas no banco de dados no editor de dados

Nome de variveis Adicionando novas observaes


Na janela do [Data Editor ], bastar digitar as novas observaes nas linhas vazias
Para dar nome varivel clique 2 vezes numa clula da coluna que se encontram aps a ltima preenchida.
correspondente e digite o nome da varivel, que dever ter no mximo 8
caracteres no campo Name e o rtulo da varivel no campo Label. Adicionando novas variveis
Na janela do editor basta digitar os valores da nova variavel numa coluna vazia e
depois atribuir-lhe um nome

 No esquea de apertar o boto [Preserve] para que o Stata guarde


as mudanas feitas no banco de dados
 Aperte o [X] no canto superior direito para sair da janela do
editor.
 Salve o banco na opo File  [Save as] indique o diretrio e
Stata usa o ponto . para indicar que a observao missing escreva o nome do arquivo.
Importao / Exportao de dados Importao / Exportao de dados
Lembre que o Stata tem os recursos do windows copiar e Lembre que o Stata tem os recursos do windows copiar e
colar que permitem importar qualquer planilha tipo windows colar que permitem importar qualquer planilha tipo windows ou
ou salvar bancos do tipo Stata (*.dta) em outros tipos de planilhas. salvar bancos do tipo Stata (*.dta) em outros tipos de planilhas.
Exemplo: Os comandos Import ou infile na janela de
comandos do STATA permitem ler um banco de dados em formato
1. Abrir a planilha leucemia0.xls no programa Excell
ASCII e Export ou outfile- na janela de
2. Marque e copie as linhas e colunas com o nome e o contedo das comandos permitem salvar o banco de dados em uso, no formato
variveis que sero coladas no Stata (use o cone de copiar ou ASCII, para que possa ser importado por qualquer outro pacote que
Ctrl+c") leia este formato.
3. No Stata posicione o cursor na clula da primeira linha e primeira Existem ainda 2 aplicativos o Stat/Transfer do propio STATA e o
coluna e cole a rea selecionada, apertando o boto direito do DBMSCOPY que permitem transformar bancos tipo Stata para outros
mouse selecione a opo colar ou use a opo Ctrl+v formatos.

Stat/Transfer Sintaxe de um comando STATA


possvel transformar bancos de dados em formatos DBASE, Lotus, [by varlist:] comando [varlist] [=exp] [if exp] [in range] [weight] [, options]
Excel, Paradox, SPSS, Splus, SAS, etc. para o formato STATA ou os elementos nos colchetes so opcionais
para qualquer um dos formatos anteriores
by : o comando repetido para cada valor da varivel ou variveis contidas na varlist
input file type varlist : lista de variveis para as quais ser executado o comando, se varlist for
o tipo do banco de dados omitida, o comando ser executado para todas as variveis
de entrada
=exp : opo usada nos comandos generate, replace, egen para definir ou transformar
file especification
variveis ( generate imc=peso/(altura*altura)
a unidade, a pasta, e o
nome do banco origem if : restringe a ao do comando a aquelas observaes para as quais a expresso
ouput file type verdadeira (edit if sexo==masculino  editor de dados mostrara as observaes de
o tipo do banco de dados indivduos do sexo masculino )
de saida
in : restringe a ao do comando a aquelas observaes contidas no intervalo definido
file especification
a unidade, a pasta, e o
no range (ex.: edit in1/10  editor de dados mostrara as primeiras 10 observaes)
nome do banco destino weight : varivel contendo os pesos que sero usados para ponderar as observaes
options : indica as opes especficas a cada comando que sero usadas, devem ser
Obs: Tambm possvel escolher as variveis e as observaes a serem includas precedidas sempre por uma vrgula.
no banco destino.
Conhecendo o contedo do Banco Conhecendo o contedo do Banco
describe ou desc: . desc
Contains data from F:\Regressao\Introd_Stata9\leucemia_wbc0.dta
permite conhecer o contedo de um banco de dados tipo STATA, obs: 42 Leukemia Remission Study
vars: 8 6 Aug 2008 08:26
fornecendo uma srie de detalhes como por exemplo: nmero de size: 1,008 (99.9% of memory free)
--------------------------------------------------------------------
observaes, nmero de variveis, data da ltima atualizao, lista de
storage display value
variveis com seus respectivos tipos e formatos e os rtulos criados. variable name type format label variable label
--------------------------------------------------------------------
Describe variables weeks byte %8.0g Weeks in remission
Data Describe Data relapse byte %8.0g yesno Relapse
in memory
trtment byte %8.0g trtment Treatment
logwbcc float %9.0g White blood cell count (ln)
sex byte %8.0g sexlbl Sex
trtwbcc float %9.0g trtment x logwbcc
lgwbccat float %9.0g wbc
trlwbcat float %9.0g
--------------------------------------------------------------------
Sorted by:

Label: colocando Rtulos Data  Labels  Label dataset


Podemos associar descries (rtulos ou labels) a uma base de
dados, a uma varivel ou aos cdigos de uma varivel. label dataset
No Banco de Dados Para associar uma descrio, de at 31 caracteres, a um banco de
Para associar uma descrio, de at 31 caracteres, a uma base de dados dados.

Inserir comentrio
sobre o banco de
dados

Data  Labels  Label dataset


Data  Labels  Label variable
Labels a definir nas observaes
Label Variable . label list
Para associar uma descrio, de at 31 caracteres, a uma varivel
do banco de dados.
wbc: 0: Baixo 1: Medio 2: Alto
yesno: 0:Nao 1:Sim
sexlbl: 0: Feminino 1: Masculino
trtment: 0:tratamento 1:placebo

Inserir comentrio
sobre a varivel

Nas Observaes Nas Observaes


Para criar e associar uma descrio, as categorias ou valores de
uma varivel do banco de dados b. Nome do conjunto de rtulos

c. Clique em OK

Data  Labels  Label values  Define or modify value labels

1. Defina os rtulos para cada uma das categorias


Cdigo
Rtulo

d. Digite os cdigos e seus respectivos rtulos para cada uma das


a. Clique 2 vezes no categorias
boto Define.... e. Aps digitar o ltimo cdigo e rtulo, clique no [Cancel] e na janela seguinte no [Close]
Associar o conjunto de rtulos varivel original Gerando novas variveis: logwbcc = log(wbcc)
Cria uma varivel newvar adicional no banco de dados, que ir
receber o valor da expresso exp , para as observaes
selecionadas na condio if e/ou no intervalo in.
Labels  Label values  Assign value labels to variables
Create or change Create new
Data
variables Variable

nome da nova
1 varivel:
logwbcc

2 escolha a 3 escolha o Expresso que


varivel conjunto de define a nova
rtulos varivel:
log(wbcc)

4 . generate float logwbcc = log(wbcc)

Gerando novas variveis: wbcc2 = (wbcc)^2 Gerando novas variveis


Create or change Create new Create or change Create new
Data Data
variables Variable variables Variable

Obs: Quando h muitas categorias, interessante buscar uma frmula


matemtica que automatize a atribuio de valores s categorias.

. generate float wbcc2 = (wbcc)^2 . generate float logwbcat = int(logwbcc/2)


Corrigindo os valores de uma varivel Corrigindo valores
Replace - muda o contedo de variveis e/ou de observaes j definidas de acordo Recode - muda o contedo de alguns valores ou de toda a varivel j
com as regras especificadas na expresso =exp definida de acordo as regras especificadas
Create or change Change contents Create or change Change contents
Data Data
variables of Variable variables of Variable

Muda contedo
da varivel:
wbcc2

Expresso que
corrige a
varivel:
sqrt(wbcc)

Observao:
sqrt(wbcc)=
raz quadrada
da varivel . replace wbcc2 = sqrt(wbcc) . replace wbccat2 = 2 if logwbcc>=4
wbcc (42 real changes made) (7 real changes made)

Gerando novas variveis: varivel Indicadora Gerando novas variveis: Pontos de corte (2.3, 3)
Create or change Create new Create or change Create new
Data Data
variables Variable variables Variable extended

Condio Opo: pontos


de corte

Indicar: mnimo, valores


anteriores aos pontos de
corte e mximo

. generate float wbccat2 = (wbcc>10) & wbcc~=. . egen float logwbccat3 = cut(logwbcc), at(0,2.29999,2.999999,5.1) icodes
Gerando novas variveis: Pontos de corte (com largura Escolha de variveis e/ou observaes
de intervalo fixa) Drop elimina as variveis ou observaes selecionadas do banco em uso.

Create or change Create new keep um comando similar ao drop, porem neste comando especifica-se as
Data variveis e/ ou observaes que ficaram no banco
variables Variable extended

Data Variables utilities Keep or drop variables


Nome da nova
varivel
Nome da varivel
Opo: Cut - original
pontos de corte

Usar os
Indicar: mnimo, (largura do cdigos:
intervalo) e mximo. 0,1,2,..
Obs: 0(1)6 vai gerar os
cdigos: 0,1,2,3,4 que
representam as faixas:
1|-2, 2 |-3, 3 |-4, 4 |-5 e 5 |-6 . egen float logwbccat5 = cut(logwbcc), at(0(1)6) icodes

Escolha de observaes Escolha de observaes


Data Variables utilities Keep or drop observations Data Variables utilities Keep or drop observations

Keep
Exemplos
drop wbcc2  elimina a varivel wbcc2
keep weeks relapse trtment sex wbcc logwbcc  variveis que
Manter as ficam no banco
observaes 1 at 35
drop if relapse==1  elimina todas as observaes para as
quais relapse==1
. keep in 1/35
(7 observations deleted)
Olhando somente algumas observaes Olhando somente algumas observaes
Existem diferentes maneiras de visualizar o contedo dos arquivos Edit:
de dados:
 O icone do Edit permite, acessar a planilha de dados do
Edit,
[Editor] do Stata. Apresentando o contedo de todas as variveis
List e e todos os registros, sendo possvel tambm criar novas
variveis, fazer entrada de novas observaes, edio dos j
Browse.
existentes, etc.
 O comando edit (digitado na janela de comandos) pode ser
usado para visualizar subconjuntos de variveis ou de
observaes.

Edit: Olhando somente algumas observaes


Edit:
Data  Data editor Exemplos para digitar na janela de comandos:
 edit weeks relapse
 edit weeks relapse if trtment==0
 edit weeks relapse if trtment==0 in 15/35
List List
um comando permite que os valores das variveis e/ou observaes Na Janela Main do List List values of variables selecione as
selecionadas na expresso do list sejam apresentados na janela de variveis que sero listadas na janela de resultados.
resultados.
Para tal siga a seqncia:

Data  Describe data  List data

Na Janela Main do List List values of variables selecione as


variveis que sero listadas na janela de resultados.
se deseja selecionar somente algumas observaes digite a
condio no retngulo do if
por exemplo: sexo==0 ou se deseja pode usar a opo [Use
a range of observations] na janela by/if/in

List List values of variables Browse:


Se deseja selecionar somente algumas observaes digite a um comando que tambm permite visualizar a
condio no retngulo do if (por exemplo: sex==0 & trtment==1) planilha de dados ou uma parte dela, com a
na opo [Restrict to observations] na janela by/if/in diferena que este comando no permite
realizar mudanas nas celulas da planilha.
. list weeks relapse if
sex==0 & trtment==1 uma alternativa ao comando list
+-----------------+
| weeks relapse |
|-----------------|
5. | 17 0 | Data  Data browser (read-only editor)
6. | 19 0 |
13. | 10 1 |
15. | 6 1 |
17. | 11 0 |
|-----------------|
20. | 13 1 |
. browse weeks relapse if trtment==0 in 15/35 , nolabel
21. | 10 0 |
25. | 9 0 |
27. | 6 0 |
38. | 6 1 |
|-----------------|
41. | 7 1 |
+-----------------+

Você também pode gostar