Escolar Documentos
Profissional Documentos
Cultura Documentos
INTRODUO AO
Prof Dr Alcione Miranda dos Santos Departamento de Sade Pblica UFMA Programa de Ps-Graduao em Sade Coletiva-UFMA
05/04/2011
Iniciando o STATA
Quando iniciamos o STATA, vrias janelas aparecem: Command entrada dos comandos STATA. Results mostra o comando que voc digitou e o respectivo resultado. (Se more apresentado, pressione enter para continuar os resultados ou q para sair). Review mostra o histrico dos comandos digitados recentemente. Variables lista as variveis contidas na base de dados. Data Editor mostra a base de dados atual em forma de
uma planilha. Esta janela pode ser fechada posteriormente.
Graph
apresenta
os
resultados
dos
grficos.
05/04/2011
Sexo sexo
Muitos comandos podem ser abreviados (por exemplo:
summary tabulate describe summ tab desc
Primeiramente, usaremos o modo interativo para os exerccios, posteriormente veremos como criar arquivos do.
05/04/2011
Abra o editor de dados ( ) e tente entrar com alguns valores (digite os valores e pressione Enter). Feche o editor de dados e ento digite o comando clear na janela Command. Clique no cone Help (Help Contents).
05/04/2011
.txt - formato ASCII (text) .raw formato ASCII (text) .xls formato Excel
05/04/2011
Para grandes bases de dados, faz-se necessrio aumentar o limite de memria do STATA (o padro 1 megabyte). set memory #
# representa o nmero de kilobytes (k), megabytes (m) ou gigabytes (g).
05/04/2011
Use a opo replace se voc deseja substituir a base de dados existente no STATA (.dta).
05/04/2011
05/04/2011
EXERCCIO 2
Crie uma pasta para guardar as bases de dados criadas no STATA (c:\statadados) e mude o diretrio usando o comando cd Use insheet para ler a base de dados: pediatrics.txt Salve o arquivo (no seu diretrio de trabalho) como pediatrics.dta
Rotulando as variveis
Rtulo (label) uma descrio de uma varivel em at 80 caracteres. til quando construmos grficos, etc. Para criar rtulos para as variveis, clique duas vezes na coluna da varivel a ser rotulado ou digite: label variable nomevar label Rtulos para valores numricos tambm podem ser definidos.
05/04/2011
Rotulando as variveis
Exemplos:
label variable idade Idade dos pacientes(anos) label variable sexo Sexo dos pacientes
Os rtulos tambm ajudam a lembrar o significado dos cdigos de 0 e 1, definidos para determinada varivel categrica.
Definindo os rtulos
Dois passos para criar rtulos para os cdigos da varivel: label define nomelabel 0 label" 1label" label values nomevar nomelabel Exemplo: label define sex 1 feminino 0 masculino label values sexo sex Nota: Para modificar um rtulo use
label define nomelabel 0 label" 1label, modify
10
05/04/2011
Arquivos Log
Todos os comandos do STATA e seus resultados (exceto grficos) so guardados em um arquivo log. Ao iniciar uma sesso no STATA, aconselhvel abrir um arquivo log, usando o comando: log using nomearquivo
(onde nomearquivo escolhido pelo usurio)
11
05/04/2011
Examinando os dados
codebook til para verificar erros nos dados. Fornece informao de cada varivel com relao ao tipo, rtulo, valores ausentes, etc. Alternativamente, list permite o usurio ver a base de dados para inspeo. Os comandos codebook e list podem ser restritos a variveis especficas ou obervaes.
12
05/04/2011
Examinando os dados
Utilizando o comando codebook
Examinando os dados
Usaremos os seguintes comandos
Informaes das variveis e estatsticas descritivas
describe propriedades de cada varivel list mostra os dados summarize medidas descritivas tabulate constri tabelas de frequncias
Grficos
scatter diagrama de disperso line grfico de linhas hist histograma graph box box plot graph bar grfico de barras graph pie grfico de setores
13
05/04/2011
Examinando os dados
Comando describe ou desc
Examinando os dados
Comando list
14
05/04/2011
Analisando os dados
summarize - mostra o nmero de casos, mdia, desvio padro, mnimo e mximo. sum - modo abreviado de summarize. sum nomevar, detail - mostra os percentis, coeficiente de curtose, coeficiente de assimetria da varivel nomevar
Analisando os dados
15
05/04/2011
Analisando os dados
Para produzir tabelas de frequncias, usamos o comando tabulate nomevar
Analisando os dados
O comando tabulate nomevar1 nomevar2 constri uma tabela de contingncia para duas variveis.
16
05/04/2011
Analisando os dados
Para mostrar o nmero de casos e porcentagem, devemos usar um dos comandos: tabulate nomevar1 nomevar2,row tabulate nomevar1 nomevar2,col Caso deseja-se apresentar a frequncia de valores ausentes (missings), digite: tabulate nomevar1 nomevar2,missing
Analisando os dados
17
05/04/2011
Analisando os dados
Analisando os dados
Algumas vezes, desejamos representar as frequncias de uma varivel para cada valor de outra varivel. Por exemplo, queremos analisar a varivel idade por sexo. Para isto, usamos o comando by sexo:summary idade Antes de usar o comando by, precisamos ordenar os valores da varivel sexo. Para isto, usa-se o comando sort sexo
18
05/04/2011
Analisando os dados
soma sqrt() raiz quadrada > maior que diferena exp() exponencial >= maior ou igual que / diviso < menor que * multiplicao
~ negao <= menor ou igual que ^ potncia & e == igual ln() logaritmo natural | ou ~= diferente != diferente
19
05/04/2011
Transformaes de variveis
Novas variveis podem ser criadas usando o comando generate: generate novavar = expresso expresso pode conter funes ou combinaes de variveis existentes, por exemplo: gen imc=peso/altura^2 replace pode ser usado para mudar o contedo da varivel existente: replace oldvar = expressao1 [if expressao2] Qualquer funo pode ser usada com generate ou com replace.
Transformaes de variveis
if usado para restringir o comando a um subconjunto de observaes: replace idade=. if idade==999 Note que dois sinais de igualdade == so usados para testar a igualdade, enquanto um sinal = usado para atribuir o valor. Operadores lgicos tambm podem ser usado aps if: & denota and | denota or ~ or ! denota not (ex: ~= significa diferente de)
20
05/04/2011
Transformaes de variveis
Por exemplo, para criar uma varivel dummy use:
gen sobrepeso=0 replace sobrepeso=1 if imc>=25.0 & imc<29.9
Transformaes de variveis
rename pode ser usado para renomear a varivel. rename oldvarname newvarname Para deletar uma varivel ou mais, digite: drop nomevar Alternativamente, o comando keep nomevar elimina todas as variveis, menos as variveis descritas no comando. Para deletar certas observaes use: drop if exp Por exemplo, drop if idade==.
21
05/04/2011
EXERCCIO 3
Abra a base de dados pediatric.dta. Use describe para verificar quais alfanumricas e quais so as numricas. variveis so
Renomeie a estatura como comprimento. Converta peso em kilogramas para gramas, usando replace. Rotule peso como peso do rn (em gramas).
EXERCCIO 3 (cont.)
Crie a varivel razao usando: gen razao = (peso * 1000)/estatura Faa uma tabela de frequncia para a varivel sexo Apresenta as variveis sexo e anomalia em uma tabela de contigncia.
22
05/04/2011
EXERCCIO 3 (cont.)
Determine as medidas descritivas para as variveis peso e estatura.
Guarde somente as observaes dos recmnascidos com anomalia. (use drop ou keep). Salve a base de dados modificada. (Lembre-se de
colocar outro nome para a base de dados modificada.)
Construindo Grficos
Podemos construir diversos grficos no STATA. Vejamos os principais grficos:
Grficos de barras e de setores Box-plot Histograma Grficos de linhas Diagrama de disperso
23
05/04/2011
Grficos de barras
graph bar cigs, over(year) title("Cigarette Consumption Per Person, US") b2(Year) ytitle("number of Cigarettes") ylabel(0(2000)4000)
Cigarette Consumption Per Person, US
4,000 0 1900 Number of Cigarettes 2,000
1910
1920
1930
1960
1970
1980
1990
Grfico de setores
graph pie, over(parto) title("Tipo de parto das mes dos recm-nascidos, MA")
Tipo de parto das mes dos recm-nascidos, MA
vaginal frceps
cesrea
24
05/04/2011
Histograma
hist idademae, frequency title("Idade (em anos) das mes dos recm-nascidos, MA") xtitle("idade") ytitle("Nmero de mes")
Idade (em anos) das mes dos recm-nascidos, MA
800 0 10 200 Nmero de mes 400 600
20
30 idade
40
50
Histograma
hist idademae, bin(10)frequency title("Idade (em anos) das mes dos recm-nascidos, MA") xtitle("idade") ytitle("Nmero de mes")
Idade (em anos) das mes dos recm-nascidos, MA
3000 0 10 Nmero de mes 1000 2000
20
30 idade
40
50
25
05/04/2011
Box plot
graph box idademae, title(Idade(em anos) das mes dos recm-nascidos, MA") ytitle(idade")
Idade (em anos) das mes dos recm-nascidos, MA
50
10
20
idade 30
40
cesrea
10
20
30
40
frceps
50
Graphs by tipo de parto
10
20
30
40
26
05/04/2011
Grfico de linhas
line casos ano
N de casos de tuberculose, 1999-2009, So Lus-MA
140 60 80 N de casos 100 120
2000
dados fictcios
2001
2002
2003
2004 ano
2005
2006
2007
2008
2009
Diagrama de disperso
graph twoway scatter
6000
pesonasc compnasc
0 30
40
comp ao nascer cm
50
60
27
05/04/2011
Links teis
http://www.iies.su.se/~masa/stata.htm Contm links para outros sites http://www.princeton.edu/~erp/stata/main.html http://www.ats.ucla.edu/stat/stata/webbooks/reg/ default.htm
28