Você está na página 1de 17

Stata verso10 Noes bsicas

Tpicos que sero vistos neste material 1. 2. 3. 4. 5. 6. 7. Informaes sobre o Stata Iniciando o Stata Leitura e salvamento de banco de dados Criando banco de dados com entrada de dados diretamente no Stata, pelo teclado Variveis Sintaxe dos comandos Manipulao de dados 7.1 Expresses 7.2 Gerando e recodificando variveis Descrevendo dados 8.1 Grficos 8.2 Tabelas e resumo de dados Inferncia tomando decises Modo de programa (extenso do ?)

8.

9. 10.

1. Informaes sobre o Stata

Stata um pacote comercial estatstico (no de domnio pblico) desenvolvido por Stata Corporation. Este curso referente ao Intercooled Stata, verso 10 para Sistema Windows.
O Stata descrito em cinco manuais e em Hamilton (1998). Cada comando est associado a um arquivohelp que pode ser acessado durante a utilizao do programa. Informaes sobre o Stata, bem como atualizaes, realizao de cursos via Internet e lista das dvidas mais freqentes podem ser obtidas no site: http://www.stata.com. O Stata possui suporte tcnico e informaes que podem ser obtidas pelo Help disponvel no menu principal. O Stata diferencia entre letra maiscula e minscula.

2. Iniciando o Stata O programa pode ser aberto diretamente pelo cone (clicando duas vezes sobre ele) na tela de abertura do

Windows ou seguindo o caminho Iniciar, Programas ...


Quando o programa aberto, abre-se uma tela contendo janelas menores, com cabealhos. A finalidade de cada janela apresentada a seguir:

Cabealho

Finalidade Armazenamento dos comandos j utilizados Apresentao das variveis contidas no banco de dados Apresentao dos resultados obtidos com a execuo dos comandos Digitao dos comandos a serem executados

Review Variables Stata Results Stata Command

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

Review (comandos j executados)

Results (resultados)

Variables (variveis que compem o banco de dados)

Commands (comandos)

Quando o prompt (sinal de barra | intermitente) aparece na janela Stata Command, significa que o comando pode ser digitado. A execuo de um comando feita digitando-se o comando segundo uma sintaxe definida e pressionando a tecla Enter. O comando, uma vez executado, ir aparecer na janela Review e pode ser reutilizado e corrigido, se necessrio, posicionando o cursor sobre ele e pressionando Enter (para retornar na linha de comando para correo) e mais um Enter para ser executado; ou utilizando-se as teclas PgUp (page up) e PgDown (page down). Aps a execuo do comando, o resultado aparecer na janela Stata Results. Se o espao necessrio para a apresentao dos resultados no for suficiente, aparecer a palavra ---more---. Neste caso deve-se pressionar Enter at que todo o resultado seja apresentado. Para desligar esta funo, deve-se digitar o comando set more off <E>. A janela de resultados pode ser rolada para baixo e para cima utilizando-se a barra de ferramenta posicionada direita da janela. No Stata somente um arquivo de dados pode ser aberto e utilizado de cada vez. Os dados so apresentados em formato de matriz onde as colunas representam as variveis e as linhas as observaes para cada registro. Quando um banco de dados (dataset) aberto, as variveis aparecem listadas na janela Variables. O Stata um programa de comandos, que na verso 10 utiliza a estrutura de menus para facilidade do usurio. Os comandos tm uma forma geral do tipo comando lista de variveis (command varlist). Por exemplo, se o banco de dados contm as variveis x e y , ento, o comando para list-las : list x y. Outros componentes podem ser adicionados, por exemplo, if x>y far com que sejam listados somente os registros onde os valores de x so maiores que os de y. As opes so includas no comando aps uma vrgula. A estrutura completa de um comando ser descrita oportunamente. A utilizao do Help fortemente recomendada; clicando-se em Help no menu principal, uma segunda janela apresentada, onde possvel pesquisar qualquer comando utilizando-se a opo Contents , Search ou Stata command.

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

O Stata trabalha com basicamente 4 tipos de arquivos: tipo de arquivo arquivo que contm arquivo que contm arquivo que contm arquivo que contm Extenso .dta .log .do .ado

os dados os comandos e resultados obtidos durante a sesso de trabalho comandos sub-rotinas

Arquivo log Logo que for iniciado o trabalho no Stata, aconselhvel abrir um arquivo log que armazenar todos os comandos e resultados da execuo destes. O arquivo log de tipo somente texto e no permite alterao em outro programa a no ser que seja convertido em arquivo texto, do Word, por exemplo. Caso isto seja de interesse, pode-se abrir um arquivo *.log, no Word for Windows e, aps salvamento como um documento do Word (com extenso .doc), ser manipulado segundo a necessidade. possvel abrir um arquivo .log clicando no cone arquivo *.log, dar um nome tal como analise1.log. referente a Begin log. Deve-se escolher tipo de

Observar a sintaxe do comando para abrir um arquivo .log Ex: log using <C:\HEP139_2011\analise1.log>, text replace Para fechar um arquivo log deve-se utilizar o comando log close. 3. Leitura e salvamento de banco de dados O Stata possui seu prprio formato de banco de dados com extenso .dta. Para ler um arquivo no Stata, necessrio o comando use. Antes de utilizar este comando deve-se limpar os dados utilizados anteriormente porque podem estar ainda na memria de execuo do programa. Devese, portanto, rodar o comando clear antes do comando use. Dois modos para abrir um banco de dados: Pelo menu: clicar sobre File e escolher Open

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

Tambm pode-se digitar o comando use <caminho\oswego.dta>

Para salvar um arquivo de dados (extenso .dta) Para salvar o banco com o mesmo nome, necessrio acrescentar a opo replace ao comando save: save c:\diurno\oswego, replace ou save, replace Neste caso, o Stata salvar o banco atual com as eventuais modificaes introduzidas no banco durante a sesso de trabalho; o banco inicial ser substitudo.

Banco de dados em um formato diferente de .dta: Os dados que no estiverem no formato Stata devem ser convertidos, utilizando-se, por exemplo, o Stat/Transfer ou outro pacote que realize converso de bancos de dados (Anexo I).

Leitura e salvamento de banco de dados via caixa de dilogo (menu principal)

O salvamento do banco pode ser realizado selecionando-se Save ou Save As na opo File

4. Criando banco de dados Abrir o modo de edio clicando sobre o cone Data editor e digitar os dados dos registros.

Usar Tab para entrada horizontal e Enter para entrada vertical. Quando terminar, escolha Close

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

Ex: Criar um banco de dados com nome banco1 que contenha as variveis: identificao (id), nome (nome), tratamento (tratamen), peso inicial (pesoinic) e sexo (sexo); para 5 pacientes, com dados apresentados a seguir. id 1 2 3 4 5 nome A S G S V G M C A C tratamen 0 1 1 0 0 pesoinic 98.4 75.5 93.6 80.2 70.0 sexo 1 2 2 1 2 marital 1 1 2 3 4

O arquivo deve ser salvo utilizando a caixa de dilogo, na seqncia: File, Save As ...

Abrir o banco de dados oswego.dta


5. Variveis Existem essencialmente dois tipos de variveis no Stata: string e numrica. Estas variveis so armazenadas de formas diferentes que requerem tamanhos diferentes: byte, int, long e float para variveis numricas e str1 at str80 para variveis string de tamanhos diferentes. Alm disto, associado cada varivel existe um nome, um rtulo (label) e um formato. Utilizar o comando describe para investigar as variveis que compem o banco de dados. Utilizar o comando codebook para descrever as variveis O nome de uma varivel pode ser alterado. Por exemplo, a varivel ill pode ser mudada para doente usando o comando: rename ill doente (ou ren ill doente, utilizando as 3 primeiras letras do comando) O rtulo da varivel pode ser definido com o comando label variable age idade ou label var onsetdate data de inicio A definio de rtulos para categorias de variveis pode ser feita com os comandos: label define ill 1 doente 0 no doente nome do label label values doente ill nome da varivel tab doente tab doente,nolabel ou tab doente,nol Dando rtulos para a varivel sex A varivel sex string Primeiro necessrio construir uma varivel em numrica utilizando-se o comando gen: gen sexo = 1 if sex==M replace sexo=0 if sex==F tab sexo Agora possvel associar um rtulo aos valores 0 e 1:
FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

label define s 1 masculino 0feminino label val sexo s tab sexo OBS Quando o label for igual para vrias variveis, possvel direcionar o label utilizando do comando: label val <var1> <var2> ....<varn> <nome do label>

Para fechar o banco contendo as modificaes mudando-se o nome do banco de dados utilize o comando save as <nome novo>. Para salvar por cima do banco original utilizar o comando save, replace 6. Sintaxe dos comandos Os comandos seguem a forma [by varlist:] command [varlist] [weight] [if exp] [in range] [using filename] [,options] onde, [by varlist:] instrui Stata para repetir o comando para cada combinao de valores nas variveis listadas em varlist; command o nome do comando, ex: list [varlist] a lista de variveis para as quais o comando executado [weight] permite que pesos sejam associados s observaes [if exp] restringe o comando a um subconjunto de observaes que satisfazem a expresso lgica definida em exp [in range] restringe o comando quelas observaes cujos ndices pertencem a um determinado subconjunto [using filename] especifica o arquivo que deve ser utilizado [,options] so especficas de cada comando. Ex: help log fornece a informao:

log: comando using filename: arquivo onde ser armazenada a sesso de trabalho (extenso .log) append: esta opo instrui programa a salvar a sesso atual, como continuao de uma sesso anterior. replace: esta opo instrui programa a salvar a sesso atual sobre um texto j existente.
FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

text|smcl: tipo de arquivo

7. Manipulao de dados 7.1 - Expresses Existem expresses lgicas, string e algbricas, no Stata. Expresses lgicas atribuem 1 (verdadeiro) ou 0 (falso) e utiliza os operadores: Operador < <= > >= if (y~=2 & z>x) | x= =1 Significa: se y for diferente de 2 e z maior do que x ou x for igual a 1 Expresses algbricas utilizam os operadores: Operador +*/ ^ Sqrt( ) Significado soma, subtrao multiplicao, diviso elevado potncia funo raiz quadrada Operador Exp( ) log( ) ln( ) Significado funo exponencial funo logartmica (base 10) funo logartmica (base e) - logaritmo natural Significado menor que menor ou igual a maior que maior ou igual a Operador == ~= ~ & Significado igual a diferente de no E

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

Situao 1: Uma enzima (ornithine carbonyl transferase) do fgado de pessoas que sofrem de dois tipos de hepatite (viral aguda e crnica) quantificada. Medida da enzima entre pacientes com hepatite viral aguda (log das medidas)
2,66 2,85 2,51 2,45 2,93 3,01 3,32 3,18 2,28 2,38 2,67 2,51 2,75 2,78 2,99 2,21 2,84 2,84 2,37 2,37 2,80 2,56 2,57 2,60 1,71 2,84 2,80 2,31 2,40 2,50 2,50 2,62 2,47 2,60 2,31 3,02 2,50 2,79 2,57 3,00 2,71 3,04 2,79 2,71 1,96 1,82 2,54 2,94 2,18 1,92 2,71 2,47 2,85 3,00 2,53 2,46 3,21 2,17 2,64 2,72 2,68 2,50 2,78 2,83 2,86 2,33 2,52 3,71 1,76 2,36 2,07 3,61 2,51 2,07 2,21 2,73 2,36 2,48 2,35 2,99 2,56 2,60 2,98 2,78 2,09 2,42 2,31 3,02

Medida da enzima entre pacientes com hepatite crnica (log das medidas)
2,30 2,58 3,69 2,56 2,40 3,40 2,11 2,45 2,77

Banco de dados: enzima.dta

Para repetir comandos para variveis ou categorias de variveis, utilizar by varlist; os dados precisam estar ordenados antes disto, o que feito utilizando o comando sort. Fornecendo rtulos varivel tipo label define tipo 1hepatite aguda 2hepatite crnica label val tipo tipo tab tipo Listando os dados segundo tipo by tipo: list medida OBS: o comando by pede que os dados sejam ordenados (utilizar o comando sort) sort tipo by tipo: list medida Resumindo os dados segundo a varivel tipo utilizando o comando summaryze ou sum by tipo:sum medida

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

7.2 Gerando e recodificando variveis Uma varivel existente pode ser retirada do banco de dados com o comando drop <var> Banco de dados: colesterolhomens.dta Investigando a existncia de valores ignorados; normalmente codificados com 99 ou -99. Recodificando valores ignorados -99 para valores missing, utilizando o comando recode: recode colesterol -99=. Utilizar o comando tab com opo mis ou o comando codebook para investigar a existncia de valores missing tab colesterol, mis ou codebook colesterol O comando generate iguala uma nova varivel a uma expresso que construda para cada observao Gerando uma varivel colesterol2 construda a partir da varivel colesterol. A nova varivel ser categrica com duas categorias: abaixo de 200 e igual ou maior que 200. generate colesterol2= 1 if colesterol>=200 & colesterol ~=. Gerar uma nova varivel (colesterol2) que contm valores 1 (se colesterol >=200 e diferente de missing) e missing (se colesterol <200). Para substituir os valores missing por um valor numrico, utilizar o comando replace que permite alterar uma varivel j existente. replace colesterol2= 0 if colesterol<200 list colesterol colesterol2 tab colesterol2 tab colesterol2,mis label define colesterol2 0 <200 1 > =200 label val colesterol2 colesterol2 tab colesterol2

Ex2: Dividir a varivel em 4 partes iguais, utilizando os valores dos percentis como pontos de corte. sum colesterol,d gen colesterolg =colesterol recode colesterolg 100/187=1 188/215 =2 216/234=3 235/382=4 tab colesterolg label define colesterolg 1 100 187 2 188 215 3 216 234 4 235 382 label val colesterolg colesterolg tab colesterolg Ex3: A varivel colesterol pode ser recodificada em duas ou mais categoria por meio do comando recode. Criando uma nova varivel colesterol codificada em duas categorias (abaixo e acima do valor da mediana) gen colesterolg3 = colesterolg recode colesterolg3 1 2 =0 3 4 =1 (ou recode colesterolg3 1/2=0 3/4=1) tab colesterolg3 label define colesterolg3 0 100 215 1 216-382 label val colesterolg3 colesterolg3 tab colesterolg3 Fazendo tabelas cruzadas Para cruzar duas variveis qualitativas deve-se utilizar o comando tab <va1> <var2>.

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

Ex: Cruzando as variveis colesterol2 e dic tab dic colesterol2, col Fornecendo rtulos para a varivel dic: label define dic 0DIC ausente 1 DIC presente label val dic dic tab dic colesterol2, col Ex: Cruzando as variveis colesterolg e dic tab colesterolg dic, row Ex: Cruzando as variveis colesterolg3 e dic tab colesterolg3 dic,col Banco de dados: enzima.dta Supor que se deseja transformar os cdigos da varivel tipo (1 e 2) de 1 para 0 e de 2 para 1, ou seja hepatite aguda era 1 e passa a ser 0 e hepatite crnica era 2 e passa a ser 1: gen tipo2=tipo recode tipo2 1=0 2=1 label define tipo2 0 hepatite aguda 1 hepatite crnica label val tipo2 tipo2 tab tipo2 tipo (para checar se deu certo) 8. Descrio de dados 8.1 - Grficos Abrir o arquivo oswego.dta Grfico de barras Antes de fazer o grfico da idade (age) mdia segundo sexo, necessrio transformar a varivel sexo de string em numrica. Para isto, utilizar a seqncia de comandos: desc gen sexo=1 if sex==F replace sexo=2 if sex==M tab sexo label define sexo 1Feminino 2Masculino label val sexo sexo Grfico da varivel sexo Utilizando-se os menus: Graphics; Bar chart; Main [Statistic:counting nonmissing; variables:sexo]; By[sex]

OBS: veja a sintaxe do comando graph bar (count) sexo, by(sex)


FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

10

Fazer o grfico da varivel ill (doente) graph bar (count) ill, by(sex)

Histograma Para desenhar um histograma utilizar o menu Graphics; Histogram seguida da seleo da varivel, tipo de varivel, a amplitude dos intervalos (bins) bem como o valor de incio do primeiro intervalo e no eixo Y a freqncia de ocorrncia.

OBS: veja a sintaxe do comando histogram age, width(10) start(0) frequency Boxplot Construindo-se o box plot para a varivel idade segundo a varivel ill

Utilizando-se o menu: Graphics; Box plot; e opes apresentadas nos quadros acima. OBS: veja a sintaxe do comando graph box age, by(ill) Utilizar o banco de dados: gordura.dta

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

11

Diagrama de disperso Utilizando-se o menu: Graphics; Twoway; Create ;(scatterplot, line, etc.); Scatter; Y variable: gordura; X variable: idade; Marker properties [variable: sexo]

OBS: perceba a sintaxe do comando twoway (scatter gordura idade, sort mlabel(sexo))

Para construir dois grficos de disperso, um para cada sexo twoway (scatter gordura idade, sort mlabel(sexo)), by(sexo)

8.2 Tabelas e resumo dos dados Os dados que sero utilizados nesta sesso constituem uma amostra de 118 pacientes psiquitricas, do sexo feminino e esto disponveis em Hand DJ, et al. A Handbook of Small Data Sets. Chapman & Hall, London, 1994. Algumas das variveis estudadas foram: age: idade em anos iq: escore de inteligncia (-99 = ignorado) anxiety: ansiedade (1= nenhuma, 2= leve, 3= moderada, 4=grave, -99=ignorado) depress: depresso (1=nenhuma, 2= leve, 3= moderada, 4=grave, -99=ignorado) sleep: voc pode dormir normalmente? (1=sim, 2=no, -99=ignorado) weight: mudana no peso durante os ltimos 6 meses (em libras)

Banco de dados: fem.dta As variveis medidas em escala de razes (contnuas) so age, iq e weight. As variveis qualitativas ordinais so anxiety e depress e a varivel sleep qualitativa nominal A seguir, apresenta-se uma lista de comandos utilizados para a construo de tabelas de freqncia uni e bidimensionais, para resumo dos dados em medidas de tendncia central e de disperso Comando describe ou desc Permite verificar as variveis que compem o banco de dados Comando tabulate ou tab ou tab1 construir uma tabela de freqncias simples de cada varivel Possibilidades: tab1 _all tab1 age anxiety iq depress sleep weight tab age
FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

12

tab tab tab tab tab

anxiety iq depress sleep weight

Comando recode Utilizado para recodificar valores Recodificar os valores faltantes das variveis, codificadas como -99 recode sleep 99=. recode depress 99=. Comandos label define e label values Permitem fornecer rtulos para as variveis Para a varivel anxiety label define grau 1 nenhum 2 leve 3 moderada 4 grave label val anxiety grau label val depress grau tab anxiety tab depress Para a varivel sleep label define sn 1 sim 2 no label val sleep sn Comando summarize ou sum Permite resumir uma varivel quantitativa contnua (clculo de medidas de tendncia central e de disperso) Resumindo as variveis iq; age e weight sum iq sum iq,d sum weight,d sum age,d Resumir a varivel weight segundo a varivel sleep sort sleep by sleep: sum weight,d ou table sleep ,c(mean weight sd weight) Comando generate ou gen Permite gerar novas variveis Gerando nova varivel peso construda a partir da varivel weight. A varivel peso deve ser igual a 1 se a pessoa perdeu peso e 0 se permaneceu no mesmo peso ou se ganhou peso. gen peso= 1 if weight<0 replace peso =0 if weight >=0 tab peso label define peso 0 ganhou peso 1 perdeu peso label val peso peso tab peso Criar uma varivel ageg contendo a varivel age em intervalos de classes de 5 anos gen ageg=age recode ageg 25/29=1 30/34=2 35/39=3 40/44=4 45/49=5 label define idade 1 25-29 2 30-34 3 35-39 4 40-44 5 45-49 label val ageg idade tab ageg Criar a varivel agedic contendo a varivel age em duas categorias (<= mdia e acima da mdia) sum age gen agedic =age recode agedic min/37.5=1 37.6/max=2
FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

13

label define agedic 1 <=37.5 2 37.6 e mais label val agedic agedic tab agedic

9. Testes de hipteses Com base nos dados do banco fem.dta, apresenta-se a seguir a comparao de algumas medidas estatsticas mediante a realizao de testes de hipteses. Para comparar as variveis quantitativas pode-se utilizar o teste t de "Student" que assume que as observaes nos dois grupos so independentes; as amostras foram retiradas de populaes com distribuio normal, com mesma varincia. Tambm possvel calcular correlaes entre variveis contnuas. Se for de interesse testar se o coeficiente de correlao de Pearson estatisticamente diferente de zero, o Stata apresenta um teste que pressupe que as variveis so normais bivariadas. Para as variveis qualitativas nominais pode-se utilizar o teste Qui-quadrado, de Pearson. Teste de hipteses para uma, duas e mais de duas mdias; associao pelo qui-quadrado de Pearson e intervalos de confiana para proporo e mdia populacional Utilize o banco de dados: enzima.dta Teste de igualdade de varincias Testar a diferena entre as varincias da varivel medida segundo tipo sort tipo sdtest medida,by(tipo) Teste de igualdade de duas mdias Testar se existe diferena entre a mudana mdia de nveis da enzima nos dois tipos de hepatite sort tipo ttest medida,by(tipo) Intervalo de confiana para a mdia populacional Apresentar o intervalo de confiana para as mdias de medida segundo tipo sort tipo ci medida,by(tipo) Intervalo de confiana para uma mdia populacional Construir o intervalo de confiana de 95% para uma amostra de 100 pessoas, mdia observada igual a 2 e desvio padro populacional igual a 1,0 cii 100 2 1.0 Utilizando o banco fem.dta Teste de uma mdia populacional Testar a hiptese de que a mdia observada da varivel weight ( x obs populacional (

= 1,585 ) igual mdia

= 2 ) de mulheres sem doena mental

ttest weight=2 Intervalo de confiana para proporo populacional Construir um intervalo de confiana (exato) para a proporo de pacientes com problemas para dormir tab sleep cii 112 0.125

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

14

Teste de uma proporo populacional Testar a hiptese de que a proporo de pacientes com problemas para dormir igual proporo populacional de pessoas sem doena mental (p=0.2) recode sleep -99=. recode sleep 2=1 1=0 bitest sleep=0.20 ou bitesti 117 14 0.20 Teste de associao pelo Qui-quadrado Verificar a existncia de associao entre as variveis peso e agedic e entre peso e sleep OBS: se as variveis peso e agedic j estiverem no banco, considerar apenas os dois ltimos comandos. Caso contrrio realizar todos os comando abaixo que geram novas variveis categricas para peso e idade gen peso= 1 if weight<0 replace peso =0 if weight >=0 tab peso label define peso 0 ganhou peso 1 perdeu peso label val peso peso tab peso sum age gen agedic =age recode agedic min/37.5=1 37.6/max=2 label define agedic 1 <=37.5 2 37.6 e mais label val agedic agedic tab agedic tab peso agedic,col chi tab peso sleep,row chi Calcular a correlao entre as variveis weight, iq e age corr weight iq age ou pwcorr weight iq age,obs sig

10. Introduo programao s vezes necessrio realizar uma anlise igual para conjuntos de dados diferentes. Isto possvel realizar armazenando-se os comandos em um arquivo com extenso .do, por exemplo analise1.do, que pode ser executado com o comando: do <C:\ ...\analise1.do> ou

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

15

utilizando o editor Do-file

A seguir apresentada uma estrutura bsica de um arquivo do: clear set memory 32M *comentrio descrendo o que o arquivo programa faz* version capture log close log using c:\not2002\analise1, replace text set more off use c:\not2002\oswego.dta desc tab ill ci ill sum age,d sort ill ttest age, by(ill) tab sex ill,row chi tab vanilla ill,row chi log close exit clear

Rodar o programa diretamente pelo cone Do-file Editor ou digitando do <c:\ .....\analise1.do na janela de comandos Significado de cada linha: 1. Se houver algum banco de dados aberto, o programa comea limpando da memria, os dados utilizados anteriormente. 2. Se for necessria mais memria para a realizao do programa. 3. Os asteriscos fazem com que seja ignorado o que est entre eles; so usados para comentrios. 4. Especifica a verso do Stata em que o programa foi escrito; til para futura atualizao do programa. 5. O comando capture faz com que o Stata continue rodando mesmo que ocorra um erro na execuo de um comando. O comando capture log close fecha o arquivo log em uso se for aberto outro ou envia mensagem de erro. 6. O comando log using filename,replace abre um arquivo log substituindo o j existente. 7. O comando set more off faz com que a sada seja apresentada na tela automaticamente sem ter que manualmente instruir o Stata para mostrar o que est faltando. 8. O comando abre o arquivo de dados que ser utilizado inicialmente. 9. Depois que a anlise feita, o arquivo .log fechado com o comando log close.
FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

16

10. A ltima linha do programa contendo o comando exit no necessria. Ela til para fazer o programa parar de ser rodado. Utilizando o Stata/transfer - Clicar em Iniciar, Programas, Transfer, Statatransfer ou clicar sobre o cone na rea de trabalho; - Clicar sobre a seta da caixa de dilogo Input File Type e escolher o programa onde o banco de dados foi criado; - Clicar em Browse para escolher o arquivo (File Specification); - Automaticamente o transfer oferece o nome e caminho do arquivo em formato dta; - Clicar sobre a caixa Transfer. - Notar o nome e caminho onde o arquivo foi armazenado.

FSP/USP. HEP139 Informtica/Nutrio 2011 Denise P Bergamaschi; Patrcia Hinnig

17