Você está na página 1de 9

LLA

APPII
Laboratório de apoio à pesquisa e informática

Guia de utilização do comandos oferecidos pelo usuário. Se os

software Stata para comandos não forem dados corretamente,

análise do estado o software não os entenderá, e erros serão


gerados. Por isso, algumas precauções
nutricional iniciais devem ser tomadas. Por exemplo, o

Parte I: Stata não entende acentos ortográficos e


“ç”. Outra precaução é evitar nomear as
“Conhecendo o Stata”
variáveis entre aspas, caso contrário elas
podem ser substituídas por variáveis
derivadas, geradas pelo software.

Passo a passo no Stata:

 Arquivo log
Introdução:
Ao iniciar os trabalhos no Stata, é
O Stata é um software amplamente
recomendável gerar um arquivo log. O log
utilizado na Saúde Pública para análise
é um arquivo de texto que armazena todos
estatística. Ele serve tanto para cálculos
os comandos e resultados gerados por
mais simples, média aritmética e desvio
eles. Ele só permite alteração por
padrão, como para análises mais
programas da mesma extensão, como
sofisticadas como, por exemplo, regressão
Word e o bloco de notas.
múltipla e análise de sobrevivência.
Para abrir um arquivo log basta clicar
Tendo em vista a dificuldade apresentada
no ícone referente a “ log begin”
por muitas pessoas no manuseio deste
programa, este material objetiva auxiliá-las
e escolher a extensão de
na utilização do mesmo para análise do arquivo *.log.
estado nutricional. Para encerrar o arquivo log basta
digitar o comando log close.

Conhecimentos iniciais:

O Stata, assim como softwares de


programação, funciona através de

http://www.fsp.usp.br/site/paginas/mostrar/60
 Arquivo do O Stata trabalha basicamente com dois
tipos de variáveis: string e numérica.
Recomenda-se também que ao iniciar
Estas variáveis requerem tamanhos
os trabalhos o usuário crie um arquivo de
diferentes e também são armazenadas
extensão *. do. O arquivo *.do também
de formas diferentes. Por isso, é
armazena os comandos, no entanto, ao
importante se atentar na hora da
contrário do arquivo *.log, ele pode ser
criação do banco, para que estas duas
executado, o que facilita em casos nos
variáveis não sejam misturadas, o que
quais se deseja realizar a mesma análise
ocasionaria erros na criação do banco.
com um banco de dados diferente.
Para renomear as variáveis do novo
Para gerar um arquivo de extensão
banco, basta clicar com a esquerda no
*.do basta clicar em Window> Do-file-
mouse em “rename”. O Stata não
Editor> New- Do-file-Editor. Para executar
aceita nomes múltiplos, a não ser que
o arquivo do basta clicar no ícone
entre eles esteja o símbolo “_”, como

. em: circunferência_cintura.

 Banco de dados
 Outros comandos básicos no
O Stata possui a extensão .dta para banco
Stata
de dados.
clear: limpa os dados utilizados

Abrindo um banco de dados: anteriormente pelo programa, que ainda

Para abrir um banco de dados, basta podem estar em execução.

clicar em e escolher o help: fornece informações sobre os


banco desejado. Ou então, o usuário comandos. Basta que o usuário digite help
pode optar pelo comando: “nome do comando”, que uma nova janela
use: “caminho\nome do banco de
abrirá dando detalhamentos sobre o
dados.dta”, clear
comando desejado.

Criando um banco de dados:


set more 1: utilizado para pedir mais
Para criar um banco de dados, deve-se
memória ao software, quando se quer
clicar no ícone referente a Data Editor
manusear um banco de grande extensão.

, e digitar os registros na
planilha correspondente.

http://www.fsp.usp.br/site/paginas/mostrar/60
set memory 50 m e set maxvar 10000: label define: este comando cria rótulos
após a execução de um comando o para as categorias de uma variável. Por
resultado aparecerá na tela Stata Results. exemplo, se quisermos atribuir, a categoria
No entanto, caso o espaço destinado não 1 da variável weight, o rótulo peso normal
seja suficiente aparecerá a palavra – more - e, a categoria 0, o rótulo peso inadequado,
-- e o usuário deve apertar a tecla enter, basta digitar os seguinte comandos:
até que todo o resultado apareça label define weight 1 “peso normal” 0
disponível. Com o comando set more off “peso inadequado”
esta função é desligada, e a janela de label values peso normal weight
resultados pode ser rolada para baixa ou
para cima, com o mouse. tab: este comando pode ser utilizado para
gerar tabelas de freqüências simples. Basta
describe e codebook: estes comandos digitar: tab nome da variável
servem respectivamente para investigar e
descrever as variáveis que compõem o recode: este comando é utilizado para
banco de dados. recodificar valores. Exemplo: recode
altura-99.
label var: este comando define rótulos
para as variáveis. Por exemplo, se Summarize ou sum: utilizado para resumir
queremos atribuir a variável age o rótulo uma variável.
idade, o comando é: label var age “idade”
Observação: No Stata é possível recuperar
comandos através da tecla PageUp.

 ATENÇÃO !!

Quando a variável é string, é necessário criar a partir dela uma variável numérica, para
posteriormente atribuir rótulos às categorias. Para isso utiliza-se o comando gen. Por
exemplo, vejamos a seqüência de comandos abaixo, com a variável sex que é string.

Criando a variável numérica: Atribuindo os rótulos:


gen sexo = 1 if sex == “M” label define s “1” masculino “0” feminino
replace sexo = 0 if sex == “F” label val sexo s
tab sexo tab sexo

http://www.fsp.usp.br/site/paginas/mostrar/60
LLA
APPII
Laboratório de apoio à pesquisa e informática
Parte II:

“Stata e Avaliação do estado


referências da OMS. Por isso, é
nutricional”
imprescindível que as variáveis no banco
de dados do usuário estejam nomeadas da
mesma forma que nos bancos da OMS.
Os valores de score z implausíveis

Introdução: para cada indicador são sinalizados, pelo


software da seguinte forma:
O Stata calcula escore z para três
indicadores antropométricos: Índice de
escore z de peso para idade
massa corporal (IMC) para idade, peso para
(zwfa)....................... zwfa < -6 ou zwfa > 5
a idade e estatura para a idade. Para
avaliação nutricional dos escores z destes
escore z de altura para idade
índices antropométricos são utilizados
(zhfa)........................... zhfa < -6 ou zhfa > 6
valores padrões de indicadores, disponíveis
neste software.
escore z de IMC para idade
Também podem ser realizados
(zbfa)............................ zbfa < -5 ou zbfa >5
estimativas específicas, para sexo e idade,
de estado nutricional inadequado e
estatísticas de resumo, média e desvio Variáveis para análise do estado
padrão, dos escores z para cada indicador. nutricional:
A análise nutricional no Stata é A análise do estado nutricional no
realizada segundo três bancos de dados Stata utiliza dez parâmetros que devem ser
padrões, que contém os valores referências especificados. Vejamos a seguir:
da OMS para os indicadores: peso para
 reflib: especifica o diretório do
idade, altura para idade e IMC para idade.
pacote no qual os três conjuntos
É importante salientar que para
de dados que contém as
efetuar a análise do estado nutricional o
referências da OMS 2007, para
usuário deverá mesclar o seu banco de
indicadores do estado nutricional,
dados com os três bancos de dados
estão armazenados.

http://www.fsp.usp.br/site/paginas/mostrar/60
arredondamentos, para tal o
 datalib: especifica o diretório no usuário deve entrar com a data de
qual o conjunto de dados de nascimento e a data atual. Caso
entrada que contém as medidas nenhum dos escores relacionados
antropométricas foi armazenado. com a idade forem calculados, o
usuário deve codificar as idades
desconhecidas como “.”

 datalab: especifica o nome pelo


qual os arquivos de saída serão  ageunit: especifica a unidade da

pré-fixados. Por exemplo: variável idade. Elas podem ser


especificadas como “days”,
(datalab_z, datalab_prev).
“months” ou “years”. O software

 sex: especifica o nome da variável converte a idade em dias ou anos

que contém a informação para para meses, dividindo por 30,4375

sexo. Se a variável for numérica dias ou multiplicando por doze

assumirá os valores: um para sexo meses, respectivamente.

masculino e dois para feminino. Se


a variável for string “m” ou “M”
representará o sexo masculino, e  weight: especifica o nome da
“f” ou “F” o sexo feminino. No caso variável numérica que contém a
dos escores z não serem informação para peso corpóreo, e
calculados, os usuários devem deve ser expressa em quilogramas.
codificar os valores desconhecidos, Se o escore z relacionado a peso
da seguinte maneira: “.” para não for calculado, o usuário deve
variável numérica ou “ ” para codificar as informações
variável string. desconhecidas para esta variável,
como “.”.

 age: especifica o valor numérico  height: especifica o nome da

que contém a informação para variável numérica que contem a

idade. A idade pode estar em dias informação para altura ou

meses ou anos. É recomendada a comprimento, e deve ser expressa

acurácia para a informação de em centímetros. Se os escores z

idade, que não deve conter relacionados a esta medida não

http://www.fsp.usp.br/site/paginas/mostrar/60
foram calculados, o usuário deve
codificar os valores desconhecidos
 oedema: especifica o nome da
para altura, como “.”.
variável string que contém a
informação para edemas. Esta
variável assume os caracteres “n” além das seguintes variáves, derivadas do
ou “N” se a resposta for negativa, e software:
“y” ou “Y” em caso positivo. As
 agedays: calcula a idade, em dias,
informações desconhecidas para
para os cores z derivados .
edemas devem ser codificadas
 cbmi: calcula o Índice de massa
como “ “ e, neste caso, o software
corporal ( ).
supões que estes indivíduos não
 zwfa: score z de peso para idade.
possuem edemas. Nos casos em
 zhfa: score z de altura (ou
que há edemas, os scores z peso
comprimento) para idade.
para idade, altura para idade e IMC
 zbfa: score z de IMC para idade.
para idade, não são calculados,
 fwfa: valores implausíveis zwfa< -6
mas eles são considerados como
ou zwfa> 5.
inferiores a três desvios padrões,
 fhfa: valores implausíveis zhfa< -6
nas estimativas de prevalência.
ou zhfa > 6.
 fbfa: Valores implausíveis zbfa<
 sw: especifica o nome de uma
-5 ou zbfa > 5.
variável numérica que contém os
pesos amostrais. Se para todos os
registros sw=1 é realizada uma Além deste, o software também
análise não ponderada. Valores cria, no diretório de trabalho um banco de
negativos não são permitidos, e dados no formato xls, o datalab_z.xls. É um
neste caso as tabelas de arquivo MS Excel que contém estimativas
prevalência não serão produzidas. pontuais e intervalos com 95% de
confiança para as prevalências de
indicadores e estatísticas de scores z.
Exportando arquivos: Nesta análise estão incluídos
Este Macro cria, no diretório de trabalho, apenas os indivíduos 61 e 228 meses
um banco de dados do Stata, completos (5 a 19 anos). Para análise do
datalab_z.dta. Este banco de dados contém estado nutricional de crianças com menos
todos os registros e dados de entrada,

http://www.fsp.usp.br/site/paginas/mostrar/60
de 61 meses é recomendado o software são adequados. Já para aquelas acima de
Anthro. 120 meses completos o indicador de peso
Para crianças de 61 meses a 120 para idade já não é mais adequado.
completos os indicadores de peso para
idade, altura para idade e IMC para idade

http://www.fsp.usp.br/site/paginas/mostrar/60
Praticando:

está disponibilizado para download


juntamente com este material, no

Um exemplo de banco de dados endereço eletrônico do LAPI .Este banco de

(survey_who2007) está disponível para dados deve ser rodado com o arquivo em

download na plataforma da OMS, também .do a seguir:

/* Exemplo: survey_who2007.do using survey_who2007.dta */


clear
set more 1
/*Comando utilizado para aumentar a memória, quando o banco de dados é grande*/
set memory 50m
set maxvar 10000
/* Indica ao copilador do Stata aonde o arquivo who2007. ado está armazenado*/
adopath + "D:\WHO 2007 Stata/"
/* Abrindo um banco de dados*/
use "D:\WHO 2007 workdata\survey_who2007.dta", clear
/* Gerando os três primeiros parâmetros reflib, datalib & datalab */
gen str60 reflib="D:\WHO 2007 Stata"
lab var reflib "Directory of reference tables"
gen str60 datalib="D:\WHO 2007 workdata"
lab var datalib "Directory for datafiles"
gen str30 datalab="survey_2007"
lab var datalab "Working file"
/* Investigando a variável "sex" 1 = male, 2=female */
desc sex
tab sex
/* Investigando a variável "age" */
desc agemons
summ agemons
/* Definindo a unidade */
gen str6 ageunit="months" /* or gen ageunit="days", gen
ageunit="years" */
lab var ageunit "=days or =months or =years"
/* check Investigando a variável "weight" que deve estar em quilogramas*/
/* NOTA: Se não estiver disponível, crie como[gen weight=.]*/
desc weight
summ weight
/* Investigando a variável "height" que deve estar em centímetros*/
/* NOTA: Se não estiver disponível, crie como[gen height=.]*/
desc height
summ height
/* Investigando a variável "oedema"*/
/* NOTA: Se não estiver disponível, crie como[gen str1 oedema="n"]*/
desc oedema
tab oedema
/* Investigando a variável "sw" para pesos amostrais*/
/* NOTA: Se não estiver disponível, crie como [gen sw=1]*/
desc sw
summ sw
/* Preenchendo os parâmetros do software para executar o comando*/
who2007 reflib datalib datalab sex agemons ageunit weight height oedema sw

http://www.fsp.usp.br/site/paginas/mostrar/60
Referências
www.who.int/ Fale com o LAPI
http://www.stata.com/ Departamento de Nutrição, Faculdade de
Saúde Pública, Universidade de São Paulo
Elaborado por: Av. Dr. Arnaldo, 715 – Cerqueira César- São
Samara Fernandes de Barros Paulo/ SP
Bolsista de Cultura e Extensão

Telefone: 3061 7817


Revisão e Apoio:
Email: lapi@fsp.usp.br
Larissa Galastri Baraldi Página eletrônica:
Técnica Responsável pelo LAPI
http://www.fsp.usp.br/site/paginas/mostrar/60

http://www.fsp.usp.br/site/paginas/mostrar/60

Você também pode gostar