Você está na página 1de 28

05/04/2011

INTRODUO AO

Prof Dr Alcione Miranda dos Santos Departamento de Sade Pblica UFMA Programa de Ps-Graduao em Sade Coletiva-UFMA

Por que STATA?


Muitos dos pacotes estatsticos so bastante extensos em termos de opes de anlise disponveis. Alguns so mais voltados para reas especficas. O STATA tem recursos para trabalhar por meio da Internet. Site: www.stata.com O STATA j est em sua verso 11.0.

05/04/2011

Iniciando o STATA
Quando iniciamos o STATA, vrias janelas aparecem: Command entrada dos comandos STATA. Results mostra o comando que voc digitou e o respectivo resultado. (Se more apresentado, pressione enter para continuar os resultados ou q para sair). Review mostra o histrico dos comandos digitados recentemente. Variables lista as variveis contidas na base de dados. Data Editor mostra a base de dados atual em forma de
uma planilha. Esta janela pode ser fechada posteriormente.

Graph

apresenta

os

resultados

dos

grficos.

05/04/2011

Introduo aos comandos do STATA


Todos os comandos do STATA devem ser digitados em letras minsculas. O programa sensvel a letras maisculas e minsculas, ou seja

Sexo sexo
Muitos comandos podem ser abreviados (por exemplo:
summary tabulate describe summ tab desc

Introduo aos comandos do STATA


Existem duas maneiras de trabalhar com o STATA:
Modo interativo: Comandos podem ser digitados diretamente na janela Command e executados pressionando Enter. Modo em lote: Comandos podem ser escritos em um arquivo separado (chamado arquivo do) e executado em uma nica vez.

Primeiramente, usaremos o modo interativo para os exerccios, posteriormente veremos como criar arquivos do.

05/04/2011

Introduo aos comandos do STATA


Para saber qual diretrio est sendo usado, digite pwd
pwd D:\stata10\Stata10

Para criar um diretrio, use o comando mkdir


mkdir aulas cd aulas pwd D:\stata10\Stata10\aulas

EXERCCIO 1: Conhecendo o STATA


Abra o programa Stata 10.0 Identifique as janelas: Results, Command, Review,
Variables.

Abra o editor de dados ( ) e tente entrar com alguns valores (digite os valores e pressione Enter). Feche o editor de dados e ento digite o comando clear na janela Command. Clique no cone Help (Help Contents).

05/04/2011

Abrindo a base de dados


O STATA pode ler os seguintes tipos de arquivos:
.dta formato Stata

.txt - formato ASCII (text) .raw formato ASCII (text) .xls formato Excel

Abrindo a base de dados


Base de dados criada no STATA tem a extenso .dta. Para acessar o arquivo existente (por exemplo, filename.dta) selecionando File Open ou digitando:

use filename, clear


Se o nome do arquivo contm espaos em branco, ele deve ser colocado entre aspas.

05/04/2011

Abrindo a base de dados


O STATA mantm a base de dados na memria. Se voc estiver trabalhando com uma base de dados, e desejar trabalhar com outra base, preciso remover a base de dados atual da memria, para isto digite clear

Para grandes bases de dados, faz-se necessrio aumentar o limite de memria do STATA (o padro 1 megabyte). set memory #
# representa o nmero de kilobytes (k), megabytes (m) ou gigabytes (g).

Abrindo a base de dados


Por exemplo: set memory 100m Por default, STATA assume que todos os arquivos esto em c:\data. Para mudar o diretrio digite: cd nomedapasta Se o nome da pasta contm espaos em branco, ele deve ser colocado entre aspas.

05/04/2011

Salvando a base de dados


Se uma base de dados j est na memria (e no necessrio salv-lo), limpe a memria com a opo clear Para salvar a base de dados, clique em digite: save filename, replace ou

Use a opo replace se voc deseja substituir a base de dados existente no STATA (.dta).

Criando a base de dados no STATA


Existem vrias maneiras de inserir dados no STATA, a escolha depende da natureza dos dados. Entrada manual: digitando ou colando os dados
dentro do editor de dados. Usando arquivo no formato ASCII (por exemplo, arquivos txt) Uso de outros programas que criam base de dados no formato do STATA (ex: SAS, SPSS)

05/04/2011

Usando arquivos ASCII


A base de dados deve estar no formato ASCII (texto). Se voc usou o EXCEL para criar a base de dados, salve o arquivo como texto (.txt), e no como .xls. Opes: Dados sem formatao (i.e. as colunas so separadas por espao, tabulao ou vrgula): use infile ou insheet. Dados com formatao(i.e. dados com colunas fixas): use infix.

Abrindo dados sem formatao


Voc pode usar insheet quando a base de dados foi criada em um pacote computacional que utiliza planilhas, por exemplo Excel: insheet using nomedoarquivo A primeira linha da base de dados deve conter o nome das variveis. Podemos tambm usar infile para base de dados com outros formatos, mas necessita especificar todas as variveis.

05/04/2011

EXERCCIO 2
Crie uma pasta para guardar as bases de dados criadas no STATA (c:\statadados) e mude o diretrio usando o comando cd Use insheet para ler a base de dados: pediatrics.txt Salve o arquivo (no seu diretrio de trabalho) como pediatrics.dta

Rotulando as variveis
Rtulo (label) uma descrio de uma varivel em at 80 caracteres. til quando construmos grficos, etc. Para criar rtulos para as variveis, clique duas vezes na coluna da varivel a ser rotulado ou digite: label variable nomevar label Rtulos para valores numricos tambm podem ser definidos.

05/04/2011

Rotulando as variveis
Exemplos:
label variable idade Idade dos pacientes(anos) label variable sexo Sexo dos pacientes

Os rtulos tambm ajudam a lembrar o significado dos cdigos de 0 e 1, definidos para determinada varivel categrica.

Definindo os rtulos
Dois passos para criar rtulos para os cdigos da varivel: label define nomelabel 0 label" 1label" label values nomevar nomelabel Exemplo: label define sex 1 feminino 0 masculino label values sexo sex Nota: Para modificar um rtulo use
label define nomelabel 0 label" 1label, modify

10

05/04/2011

Arquivos Log
Todos os comandos do STATA e seus resultados (exceto grficos) so guardados em um arquivo log. Ao iniciar uma sesso no STATA, aconselhvel abrir um arquivo log, usando o comando: log using nomearquivo
(onde nomearquivo escolhido pelo usurio)

Para fechar o log, digite: log close

Criando arquivos Log


log using c:\pasta1\resulta_1.txt,text Cria o arquivo resulta_1.txt e salva os resultados no formato texto. log using c:\pasta1\resulta_1.txt,text replace Grava o contedo do arquivo resulta_1.txt com os novos resultados log using c:\pasta1\resulta_1.txt,text append Adiciona novos resultados no final do arquivo resulta_1.txt

11

05/04/2011

Formatos das variveis


Todas as variveis so formatadas por valores numricos (real) ou alfanumricos (string). Voc identificar o formato da varivel pela cor: preto para numrica e vermelho para alfanumrica. Alternativamente, podemos ver varivel digitando: describe o tipo da

Examinando os dados
codebook til para verificar erros nos dados. Fornece informao de cada varivel com relao ao tipo, rtulo, valores ausentes, etc. Alternativamente, list permite o usurio ver a base de dados para inspeo. Os comandos codebook e list podem ser restritos a variveis especficas ou obervaes.

12

05/04/2011

Examinando os dados
Utilizando o comando codebook

Examinando os dados
Usaremos os seguintes comandos
Informaes das variveis e estatsticas descritivas
describe propriedades de cada varivel list mostra os dados summarize medidas descritivas tabulate constri tabelas de frequncias

Grficos
scatter diagrama de disperso line grfico de linhas hist histograma graph box box plot graph bar grfico de barras graph pie grfico de setores

13

05/04/2011

Examinando os dados
Comando describe ou desc

Examinando os dados
Comando list

14

05/04/2011

Analisando os dados
summarize - mostra o nmero de casos, mdia, desvio padro, mnimo e mximo. sum - modo abreviado de summarize. sum nomevar, detail - mostra os percentis, coeficiente de curtose, coeficiente de assimetria da varivel nomevar

Analisando os dados

15

05/04/2011

Analisando os dados
Para produzir tabelas de frequncias, usamos o comando tabulate nomevar

Analisando os dados
O comando tabulate nomevar1 nomevar2 constri uma tabela de contingncia para duas variveis.

16

05/04/2011

Analisando os dados
Para mostrar o nmero de casos e porcentagem, devemos usar um dos comandos: tabulate nomevar1 nomevar2,row tabulate nomevar1 nomevar2,col Caso deseja-se apresentar a frequncia de valores ausentes (missings), digite: tabulate nomevar1 nomevar2,missing

Analisando os dados

17

05/04/2011

Analisando os dados

Analisando os dados
Algumas vezes, desejamos representar as frequncias de uma varivel para cada valor de outra varivel. Por exemplo, queremos analisar a varivel idade por sexo. Para isto, usamos o comando by sexo:summary idade Antes de usar o comando by, precisamos ordenar os valores da varivel sexo. Para isto, usa-se o comando sort sexo

18

05/04/2011

Analisando os dados

Operadores matemticos e lgicos

soma sqrt() raiz quadrada > maior que diferena exp() exponencial >= maior ou igual que / diviso < menor que * multiplicao

~ negao <= menor ou igual que ^ potncia & e == igual ln() logaritmo natural | ou ~= diferente != diferente

19

05/04/2011

Transformaes de variveis
Novas variveis podem ser criadas usando o comando generate: generate novavar = expresso expresso pode conter funes ou combinaes de variveis existentes, por exemplo: gen imc=peso/altura^2 replace pode ser usado para mudar o contedo da varivel existente: replace oldvar = expressao1 [if expressao2] Qualquer funo pode ser usada com generate ou com replace.

Transformaes de variveis
if usado para restringir o comando a um subconjunto de observaes: replace idade=. if idade==999 Note que dois sinais de igualdade == so usados para testar a igualdade, enquanto um sinal = usado para atribuir o valor. Operadores lgicos tambm podem ser usado aps if: & denota and | denota or ~ or ! denota not (ex: ~= significa diferente de)

20

05/04/2011

Transformaes de variveis
Por exemplo, para criar uma varivel dummy use:
gen sobrepeso=0 replace sobrepeso=1 if imc>=25.0 & imc<29.9

Uma simples alternativa para o cdigo acima :


gen sobrepeso=(imc>=25.0 & imc<29.9)

Transformaes de variveis
rename pode ser usado para renomear a varivel. rename oldvarname newvarname Para deletar uma varivel ou mais, digite: drop nomevar Alternativamente, o comando keep nomevar elimina todas as variveis, menos as variveis descritas no comando. Para deletar certas observaes use: drop if exp Por exemplo, drop if idade==.

21

05/04/2011

EXERCCIO 3
Abra a base de dados pediatric.dta. Use describe para verificar quais alfanumricas e quais so as numricas. variveis so

Renomeie a estatura como comprimento. Converta peso em kilogramas para gramas, usando replace. Rotule peso como peso do rn (em gramas).

EXERCCIO 3 (cont.)
Crie a varivel razao usando: gen razao = (peso * 1000)/estatura Faa uma tabela de frequncia para a varivel sexo Apresenta as variveis sexo e anomalia em uma tabela de contigncia.

22

05/04/2011

EXERCCIO 3 (cont.)
Determine as medidas descritivas para as variveis peso e estatura.

Guarde somente as observaes dos recmnascidos com anomalia. (use drop ou keep). Salve a base de dados modificada. (Lembre-se de
colocar outro nome para a base de dados modificada.)

Construindo Grficos
Podemos construir diversos grficos no STATA. Vejamos os principais grficos:
Grficos de barras e de setores Box-plot Histograma Grficos de linhas Diagrama de disperso

23

05/04/2011

Grficos de barras
graph bar cigs, over(year) title("Cigarette Consumption Per Person, US") b2(Year) ytitle("number of Cigarettes") ylabel(0(2000)4000)
Cigarette Consumption Per Person, US
4,000 0 1900 Number of Cigarettes 2,000

1910

1920

1930

1940 1950 Year

1960

1970

1980

1990

Grfico de setores
graph pie, over(parto) title("Tipo de parto das mes dos recm-nascidos, MA")
Tipo de parto das mes dos recm-nascidos, MA

vaginal frceps

cesrea

24

05/04/2011

Histograma
hist idademae, frequency title("Idade (em anos) das mes dos recm-nascidos, MA") xtitle("idade") ytitle("Nmero de mes")
Idade (em anos) das mes dos recm-nascidos, MA
800 0 10 200 Nmero de mes 400 600

20

30 idade

40

50

Histograma
hist idademae, bin(10)frequency title("Idade (em anos) das mes dos recm-nascidos, MA") xtitle("idade") ytitle("Nmero de mes")
Idade (em anos) das mes dos recm-nascidos, MA
3000 0 10 Nmero de mes 1000 2000

20

30 idade

40

50

25

05/04/2011

Box plot
graph box idademae, title(Idade(em anos) das mes dos recm-nascidos, MA") ytitle(idade")
Idade (em anos) das mes dos recm-nascidos, MA
50

Box plot por grupo


graph box idademae, by(parto) ytitle(idade da me(em anos)")
vaginal
50

10

20

idade 30

40

cesrea

idade da me (em anos)

10

20

30

40

frceps
50
Graphs by tipo de parto

10

20

30

40

26

05/04/2011

Grfico de linhas
line casos ano
N de casos de tuberculose, 1999-2009, So Lus-MA
140 60 80 N de casos 100 120

2000
dados fictcios

2001

2002

2003

2004 ano

2005

2006

2007

2008

2009

Diagrama de disperso
graph twoway scatter
6000

pesonasc compnasc

0 30

peso ao nascer em gramas 2000 4000

40

comp ao nascer cm

50

60

27

05/04/2011

Links teis
http://www.iies.su.se/~masa/stata.htm Contm links para outros sites http://www.princeton.edu/~erp/stata/main.html http://www.ats.ucla.edu/stat/stata/webbooks/reg/ default.htm

Obtendo mais informaes sobre o STATA


STATA tem arquivos de ajuda para todos os comandos. Comandos do STATA so descritos com detalhes no STATA Users Guide and Reference Manual. Finalmente, voc pode obter vrios tutoriais na internet. Um fcil caminho para encontrar usar o Google e procurar por Stata tutorial.
(Este tutorial foi preparado usando informaes do livro Data analysis using STATA Ulrich Kohler e Frauke Kreuter, Stata Press, 2009. )

28

Você também pode gostar