Escolar Documentos
Profissional Documentos
Cultura Documentos
SEM MISTRIOS:
UM MANUAL PRTICO
Chanceler
Dom Dadeus Grings
Reitor
Joaquim Clotet
Vice-Reitor
Evilzio Teixeira
Conselho Editorial
Ana Maria Mello
Armando Luiz Bortolini
Augusto Buchweitz
Beatriz Regina Dorfman
Bettina Steren dos Santos
Carlos Graef Teixeira
Clarice Beatriz de C. Sohngen
Elaine Turk Faria
rico Joo Hammes
Gilberto Keller de Andrade
Helenita Rosa Franco
Jane Rita Caetano da Silveira
Lauro Kopper Filho
Luciano Klckner
Ndio Antonio Seminotti
Nuncia Maria S. de Constantino
EDIPUCRS
Jernimo Carlos S. Braga Diretor
Jorge Campos da Costa Editor-Chefe
ngelo Jos Gonalves Bs
Instituto de Geriatria e Gerontologia
Programa de ps-graduao em Gerontologia Biomdica
Pontifcia Universidade Catlica do Rio Grande do Sul (PUCRS)
EPI INFO
SEM MISTRIOS:
UM MANUAL PRTICO
Porto Alegre
2012
EDIPUCRS, 2012
CAPA Luana Santos e Thatiana Pandolfo
REVISO DE TEXTO Caren Capaverde
EDITORAO ELETRNICA Andressa Rodrigues
B741e Bs, ngelo Jos Gonalves
Epi Info sem mistrios : um manual prtico [recurso
eletrnico] / ngelo Jos Gonalves Bs. Dados eletrnicos
Porto Alegre : EDIPUCRS, 2012.
211 p.
Sistema requerido: Adobe Acrobat Reader
Modo de acesso: http://www.pucrs.br/edipucrs/
ISBN: 978-85-397-0157-5
1. Informtica Mdica. 2. Epi Info (Programa de
Computador). I. Ttulo.
CDD 610.28
TODOS OS DIREITOS RESERVADOS. Proibida a reproduo total ou parcial, por qualquer meio ou processo, especialmente por sistemas
grficos, microflmicos, fotogrficos, reprogrficos, fonogrficos, videogrficos. Vedada a memorizao e/ou a recuperao total ou parcial,
bem como a incluso de qualquer parte desta obra em qualquer sistema de processamento de dados. Essas proibies aplicam-se tambm
s caractersticas grficas da obra e sua editorao. A violao dos direitos autorais punvel como crime (art. 184 e pargrafos, do Cdigo
Penal), com pena de priso e multa, conjuntamente com busca e apreenso e indenizaes diversas (arts. 101 a 110 da Lei 9.610, de 19.02.1998,
Lei dos Direitos Autorais).
Agradecimentos
Desde a publicao da primeira edio deste livro tenho recebido
apoio de muitos pesquisadores, muitos desses verdadeiros amigos virtuais.
No posso deixar de mencionar e agradecer o incansvel Jean Ezequiel
Limongi, do Centro de Controle de Zoonoses de Uberlndia que, desde
novembro de 2008, tem me mandado e-mails com relativa frequncia
sempre com suas dvidas intrigantes. A querida Sumire Sakabe, outra
pessoa sensacional que muito me estimulou a manter este livro atualizado.
Agradeo a todos os alunos tanto dos cursos de Epi Info
no CEARGS
quanto das disciplinas de Mtodos Quantitativos de Pesquisa e de
Demografa e Epidemiologia Gerontolgica do Programa de Gerontologia
Biomdica da PUCRS, pois foram eles que me incentivaram a reeditar
este livro. Particularmente, tenho que agradecer a Mayara Sartori, que
revisou grande parte das fguras deste livro e a Denielli da Silva Gonalves
Bs (sobrinha e parceira de muitas empreitadas) por terem me ajudado a
atualizar algumas partes do livro.
Ainda sou eternamente grato Pr-Reitoria de Extenso (PROEX) da
PUCRS, ao Centro de Estudos da AIDS do RGS (CEARGS) e faculdade de
Sade Pblica das Ilhas Fiji que acreditaram e proporcionaram condies para
a realizao das aulas que desenvolvi e que culminaram no desenvolvimento
da primeira edio deste livro. Em especial, agradeo o apoio excepcional do
professor e amigo Emlio A. Jeckel-Neto e do Monsenhor Urbano Zilles.
Pessoas especiais merecem agradecimentos especiais principalmente
por terem tido papel importante na formao deste autor. Meus pais Amaury
Lobato Bs e Aurea Gonalves Bs, ambos falecidos, mas de quem recebi muito
apoio para seguir sempre em frente na conquista do meu espao, ganhando, de
cada um, habilidades importantes que culminaram na criao deste projeto que
hora se cristaliza com a segunda edio. Ao professor Yukio Moriguchi, meu
pai da Geriatria e da pesquisa, a quem agradeo por ter me estimulado a seguir a
carreira acadmica e cientfca. Ao Dr. Newton Luiz Terra ou simplesmente Tio
Terra, uma pessoa que sempre valorizou minhas qualidades. Pessoas tambm
especiais que infelizmente fcaram de fora da primeira edio, mas que esto
sempre no meu corao: Antnio Miguel Bs, Paulo Consoni, Ayako Kamijo,
Evaldo Nascimento, Nair Mnica e os saudosos Antonio Carlos e Valdemarina.
No posso deixar de agradecer ao CDC por desenvolver esse programa
e mant-lo atualizado corrigindo constantemente os problemas detectados.
Quero fnalmente agradecer ao Programa de Gerontologia Biomdica
e Pr-reitoria de pesquisa e Ps-graduao. Tambm EDIPUCRS, de quem
recebi o apoio publicao das edies deste livro.
professora Helen Abbey (in memoriam) e ao professor Larry Brant,
cujos ensinamentos e mtodos de ensino me ajudaram a desenvolver meu
interesse pela docncia, dedico novamente este livro.
Sumrio
Prefcio da primeira edio ........................................................................... 9
Gerao e acesso ao conhecimento ................................................................ 9
Prefcio da segunda edio ...........................................................................11
Introduo .................................................................................................... 14
Captulo 1
HISTRICO E PRINCIPAIS COMPONENTES DO EPI INFO
.............. 18
Captulo 2
USANDO O EPI MAP ................................................................................ 30
Captulo 3
CRIANDO UM BANCO DE DADOS ........................................................ 46
Captulo 4
GERENCIANDO OS DADOS .................................................................... 79
Captulo 5
IMPORTANDO DADOS E MANIPULANDO VARIVEIS .................... 96
Captulo 6
ADICIONANDO DADOS EPIDEMIOLGICOS AO EPI MAP ............ 106
Captulo 7
CRIANDO GRFICOS COM O COMANDO GRAPH .......................... 122
Captulo 8
ANALISANDO DADOS, UMA INTRODUO .................................... 144
Captulo 9
CONSTRUINDO E INTERPRETANDO TABELAS ............................... 154
Captulo 10
CALCULANDO E COMPARANDO MDIAS ....................................... 163
Captulo 11
ESTUDANDO VARIVEIS NUMRICAS COM A
REGRESSO LINEAR..............................................................................174
Captulo 12
ENTENDENDO A REGRESSO LOGSTICA E AS
MEDIDAS DE RISCO ...............................................................................187
Captulo 13
USANDO CURVAS DE KAPLAN-MEIER E REGRESSO
DE DANO DE COX NA ANLISE DE SOBREVIDA ............................202
Prefcio da primeira edio
Gerao e acesso ao conhecimento
A Cincia muito mais que o simples acmulo de conhecimento,
permitir que o prprio conhecimento seja repensado e reconstrudo
constantemente. A atual perspectiva de que todo conhecimento passvel de
ser aprimorado, questionado e at mesmo substitudo fundamental para quem
quer se aventurar na rea cientfca. Nunca na histria da humanidade a Cincia
avanou de forma to rpida e abrangente quanto nos dias de hoje. Conceitos
como risco, acaso, aleatoriedade e incerteza, por exemplo, foram sendo
incorporados no linguajar das pessoas. A Estatstica uma das importantes
ferramentas necessrias para entender esses avanos, especialmente no
processo de tomada de deciso frente incerteza.
O constante avano cientfco tambm remete a uma outra importante
questo que a da necessidade de preservar o rigor metodolgico. Durante
muito tempo houve uma confuso conceitual entre rigidez e rigor metodolgico.
Neste perodo, a Cincia reconhecia apenas uma abordagem como tendo
rigor metodolgico sufciente para ser aceito como vlido. Ao longo do
sculo XX, essa perspectiva foi contestada e alterada. Mltiplas abordagens
metodolgicas foram tambm aceitas como vlidas, desde que mantido o
rigor na sua aplicao. Ao contrrio de reduzir a importncia da Estatstica,
essa fexibilizao fez com que a necessidade de familiarizao com anlises
estatsticas fosse ampliada a outros segmentos cientfcos e sociais.
Um dos limitantes da difuso da Estatstica era a difculdade de
obteno de resultados atravs de anlises muito trabalhosas e de difcil
compreenso. A associao da Estatstica com a Informtica foi extremamente
benfca nesse sentido. Os inmeros programas estatsticos vieram a facilitar
a anlise de dados. Clculos que antes demoravam at mesmo dias para serem
realizados estavam disponveis de maneira mais rpida e confvel. Algumas
difculdades, contudo, ainda permaneciam: os ambientes de informtica
nem sempre eram muito amigveis ao usurio, a montagem dos bancos de
dados eram difceis e poucos tinham os recursos fnanceiros e de informtica
necessrios para utiliz-los.
O programa Epi Info
, para quem j
usa e para quem esqueceu como se faz aquele teste especifcamente, esta
obra no por acaso est em sua segunda edio. Com sua estrutura passo
a passo apresentada de maneira objetiva e simplifcada, tem por trs a longa
experincia e extenso conhecimento do professor Bs no tratamento de dados
quantitativos e do seu ensino na rea das Cincias da Sade.
O usurio deste manual ter uma excelente ajuda para obter o mximo
possvel dos recursos que o Epi Info
ou de
outro banco de dados.
Por ser desenvolvido pelo Governo Americano, o Epi Info
um
programa de domnio pblico, ou seja, pode ser baixado a partir da Internet
gratuitamente. Cpias de CD-ROM e manuais impressos, assim como a
traduo do programa, podem ser disponibilizados por vendedores privados.
As principais vantagens que o Epi Info
proporciona.
O presente livro nasceu a partir de aulas desenvolvidas pelo autor nos
cursos: Introduo ao uso do Epi Info
,
a verso 6.0 para DOS. No decorrer dos captulos, eles vo observar diversas
semelhanas da verso atual com a antiga e tero certa facilidade em utilizar
alguns dos comandos desta verso. O autor preocupou-se em utilizar algumas
das caractersticas em comum a ambas verses para facilitar a adaptao dos
usurios do sistema anterior.
O livro segue, em parte, o roteiro das aulas desenvolvidas. Em alguns
captulos necessria a conexo com a Internet. Inicialmente, expe-se um
pouco da histria do programa familiarizando o leitor a algumas expresses
e peculiaridades do Epi Info
sobre as
Unidades da Federao do Brasil.
O terceiro captulo exemplifca como se cria um banco de dados,
seus passos e as principais opes que o Epi Info
.
O quinto captulo elucida como se importa um banco de dados criado
por outro programa ou pela verso DOS do Epi Info
. Observa-se a utilidade
do comando IF (Se), como se salva e executa um programa de comandos,
como se cria um questionrio (fcha) a partir de um banco de dados e como se
observa a frequncia de determinadas variveis. Finalmente, o leitor observar
como se compacta o arquivo do Epi Info
.
No captulo sexto, observa-se como obter dados epidemiolgicos para
a criao de mapas. So importados dados de mortalidade e da populao
brasileira visitando o site do DATASUS. Para tanto so abordadas noes
17 EPI INFO
e como esses
dados so transferidos para um mapa.
O captulo stimo versa sobre o comando de criao de grfcos.
Os diferentes tipos de grfcos disponibilizados pelo Epi Info
sero
minuciosamente descritos, abordando, principalmente, a sua utilidade com
exemplos prticos.
Noes de anlise de dados so introduzidas no captulo 8. O captulo
revisa conceitos bsicos, como tipos de variveis, importncia da anlise
descritiva, hiptese nula, hiptese alternativa e os tipos de erros relacionados
s hipteses. Neste contexto, o programa StatCalc, do Epi Info
, utilizado
para calcular o tamanho amostral de uma pesquisa.
No captulo nono, abordada a noo de anlise de dados categricos, com
teste do Qui-quadrado, utilizando inicialmente o programa Tables do StatCalc. Na
continuao, a construo de tabelas, a partir de um banco de dados, tambm
explicada, utilizando o programa Analysis do Epi Info
: Curvas
de Kaplan Meier e da Regresso de Dano de Cox.
Captulo 1
HISTRICO E PRINCIPAIS COMPONENTES
DO EPI INFO
.
Fonte: site do Epi Info
produzia
tabelas simples de contingncia sem nenhuma estatstica, conforme a fgura
1.2. Cinco meses aps o lanamento do programa, um Manual de 27 pginas
foi criado e o nome do programa EnterInfo foi chamado de Epi Info
.
Figura 1.2. Exemplo de tabela produzida pela primeira verso do Epi Info
.
Fonte: site do Epi Info
, verso 2.
Fonte: site do Epi Info
6.0 (fgura 1.4), lanado em 1992 e que continua sendo utilizado at hoje. At
1997, haviam sido realizadas 145 mil cpias das verses DOS do Epi Info
em 117
pases. O manual e programa da verso DOS foram traduzidos para 13 idiomas.
Figura 1.4. Tela principal do Epi Info
, verso 6.
Fonte: site do Epi Info
.
Uma reviso interna das visitas ao servidor do Epi Info
tem crescido muito com essas novas verses, o site menciona mais de 1 milho
de cpias baixadas. Lembramos que, como os programas de instalao podem ser
copiados livremente, muito mais computadores devem ter o Epi Info
instalado.
Novas verses tm sido lanadas com frequncia. Para buscar atualizaes,
recomendvel ao usurio do Epi Info
O Epi Info
.
1. Download a partir do Website do CDC:
O CDC mantm sempre a verso mais atual do programa. Para baixar
o programa e instal-lo devemos seguir os seguintes passos:
a. Ao visitar o site www.cdc.gov/epiinfo vo surgir duas opes:
Web Install, que teoricamente instala o programa diretamente
do website sem salvar os arquivos de instalao no computador
(esta opo salva espao), e Download Setup.exe, que baixa
o programa completo de instalao. Na prtica, ambos os
comandos salvam o programa no computador, necessitando
pelo menos 70 megabites de espao no computador.
b. Recomendamos selecionar a opo Download Setup.exe,
pois assim possvel salvar o programa em um local conhecido
e reinstalar o programa se necessrio ou at mesmo salvar em
um CD-ROM para ser ofertado a outras pessoas. O tempo de
instalao praticamente o mesmo, visto que o Web Install
literalmente baixa o programa no computador do usurio em
uma pasta temporria.
22
ngelo Jos Gonalves Bs
c. Uma nova janela vai aparecer, ento escolha salvar em disco
e clica OK;
Figura 1.5. Janela padro de salvamento de arquivo em ambiente Windows destacando a opo de criao
de nova pasta. Fonte: Windows XP.
d. A nova janela vai aparecer (fgura 1.5), oferecendo opes de
salvamento. aconselhvel ter um diretrio (folder ou pasta)
para armazenar os arquivos que so baixados da Internet. Para
criar um novo Folder, clicamos no cone que est circulado
na fgura. Isso cria uma nova pasta, que automaticamente
se chama Nova pasta ou New folder. Podemos mudar
o nome do novo Folder para, por exemplo, Baixados,
sem precisarmos clicar em lugar nenhum. Aps trocarmos
de nome, apertamos o ENTER () duas vezes. Depois, basta
clicar em salvar ou save. Na opo WebInstall, um
arquivo provisrio tambm salvo no computador. Nesse
caso, as orientaes so muito parecidas.
23 EPI INFO
,
atravs do site: http://www.pucrs.br\igg\epiinfo pasta Programas.
Clicando esquerda do mouse no link Tradutor para Portugus,
selecione Save link as (Salvar destino como...). Assim, ir abrir uma janela
com as opes de download. Na janela, aconselhamos escolher a opo salvar
o arquivo em disco. Devemos salvar no mesmo lugar onde salvamos o arquivo
de instalao. Devemos abrir o arquivo com o winzip. Se o seu computador no
tiver o winzip e no conseguir abrir o arquivo, voc poder baixar o programa
no site (www.winzip.com). Neste caso, a janela do Winzip mostrar somente
um arquivo: Portugus.exe. Devemos clicar no cone Extract ( ). Na nova
janela (fgura 1.6), na esquerda em cima, existe uma opo Extract to e
uma janela pequena. Nessa janela devemos colocar o folder TRANSEXE do
Epi_Info (diretrio onde o Epi Info
des-seleciona a linguagem
automaticamente. Se isso acontecer, basta escolher a linguagem novamente.
A linguagem no necessita ser instalada outra vez. Infelizmente, nem todos
os comandos foram traduzidos e, s vezes, encontramos difculdades em
usar a linguagem em portugus, pois ela interfere em alguns comandos,
principalmente o comando Criar Ficha (Make View). Em algumas verses
do Windows, como o Windows 2000, a traduo no funciona. Alm disso,
como o Epi Info
O Epi Info
, verso 3.5.1.
Fonte: Epi Info
.
26
ngelo Jos Gonalves Bs
1. Componentes de tela: so componentes que aparecem
imediatamente quando se executa o Epi Info
, eles aparecem
tambm no Menu Programas.
Verso em ingls Verso em portugus
Make View Criar Ficha
Enter Data Entrar Dados
Analyze Data Analisar Dados
Create Reports Criao de Relatrio
Create Maps Criar Mapas (Epi Map)
2. Componentes de menu: so componentes que esto
localizados na barra de menu da janela do Epi Info
. Esses
componentes possuem funes de confgurao (troca ou
instalao de linguagem e escolha da verso do Banco de
Dados), programas, j vistos anteriormente, edio da imagem
do Epi Info
. So quatro comandos:
1. Picture (tela): altera o fundo da tela do Epi Info
.
Clicando nesse comando, o programa nos direciona a escolher
outro arquivo tipo fgura ou grfco para substituir. Podemos
escolher outras fguras existentes no prprio diretrio do Epi
Info
.
3. Altere as posies dos botes da tela.
4. Modifque a linguagem para ingls.
5. Restaure o Menu do Epi Info
(opcional).
Captulo 2
USANDO O EPI MAP
O Epi Map um programa que permite construir uma variedade de
mapas com dados de distribuio geogrfca e que oferece um grau alto de
compatibilidade com o programa ArcView do Instituto de Pesquisa de Sistemas
Ambiental, Inc. (ESRI).
Baixando mapas para o Epi Map no site do Epi Info
(www.
cdc.gov/EpiInfo), junto com link para vrias informaes epidemiolgicas
tanto dos Estados Unidos quanto de outros pases. Assim, h no site do Epi
Info
.
Como o nome diz, gratuito e nos permite baixar os arquivos de formato dos
mapas. Clicando na primeira palavra, o site nos direciona a uma pgina onde
esto todos os continentes. Clicando no continente Amrica do Sul teremos
o nosso Brasil. Observamos que o programa solicita um local para salvar.
Podemos salvar o arquivo em um diretrio novo no c:Epi_Info, chamado,
por exemplo, Mapas. O arquivo a ser salvo chama-se de BR.exe. Esse um
arquivo tipo Zip que contm cinco arquivos compactados, que podem ser
extrados mesmo sem o programa Winzip.
Uma cpia desse arquivo, junto com todos os outros mapas do site do
Epi Info
posiciona um
31 EPI INFO
contm, na
realidade, cinco diferentes arquivos compactados, um desses arquivos tem a
extenso .shp, que signifca Shape, ou formato em ingls. Esse arquivo Br.shp
contm os formatos dos estados brasileiros e conecta com os outros arquivos.
Existe tambm outro arquivo chamado Br.dbf, que escrito em Dbase IV, ele
um arquivo de banco de dados que contm algumas informaes sobre o
Brasil e os estados. Para iniciar, devemos abrir um formato (Shape) atravs do
Map Manager (Gerenciador de Mapas).
Utilizando o Map Manager (Gerenciador de Mapas)
Na primeira janela do programa Create Map, aparece somente um
cone, o primeiro esquerda, que o cone do administrador ou gerenciador
de mapas (Map Manager circulado na fgura 2.2).
33 EPI INFO
A primeira coisa que temos que fazer para introduzir dados a partir do
nada para o Epi Info
.
Na tela do Epi Info
.
Observe que o ltimo arquivo usado fca registrado na parte baixa do
comando. Uma janela nova, muito comum do Windows, aparecer: a janela
de abrir ou salvar. Vamos salvar o arquivo como: Seunome. Isso cria um
arquivo em branco. Antes de salvar, vamos criar um novo diretrio, para
armazenar nossos arquivos, dentro do C:\Epi_info, chamaremos de EpiAula.
Como vimos, o banco de dados de Epi Info
.
1. Question or Prompt (Pergunta): o primeiro
componente da janela e est localizado na parte superior da
mesma. suposto que descrevamos a pergunta relacionada
varivel que estamos criando neste componente. Isso pode ser
bastante longo, com vrios caracteres. Essa pergunta aparecer
em alguns resultados quando analisarmos os dados.
2. Field Name (Nome do Campo): automaticamente o
programa sugestiona um nome do campo. O nome do novo campo
ser criado conforme o Prompt: utilizando as primeiras palavras
da pergunta. Podemos mudar o nome do campo usando um mais
reconhecvel ou mais conveniente para ns. Esse nome se tornar
o nome da varivel, por isso importante observarmos como ele
denominado. O nome da varivel pode ser longo (mais de 40
caracteres), aceita acentos, mas no aceita caracteres especiais
nem espaos, quando o defnimos usando o Make View. O nome da
49 EPI INFO
o
Registro REGISTRO Nmero ###
Data de
Nascimento
DATANASC Data DD/MM/YYYY
Data do Exame DATAEXAME Data DD/MM/YYYY
Idade (anos) IDADE Nmero ### (0-130)
Gnero GENERO Texto
Masculino
Feminino
Cor (raa) COR Texto
Branca Negra
Mulata
Estado civil ESTADOCIV Texto
Solteiro Casado
Vivo Separado
D
a
d
o
s
c
l
n
i
c
o
s
Altura (cm) ALTURA Nmero ### (70-250)
Peso atual (kg) PESOATUAL Nmero ###.# (20-200)
Peso aos 20 a (kg) PESO20A Nmero ###.# (20-200)
Tabagismo TABAGISMO Opo
Atual fuma
atualmente
Exfumante
fumou por mais
de um ano
Nunca todos os
outros
Atvidade Fsica
Regular
ATIVIDADE
Check
Box
Yes / No
Fonte: criao do autor.
51 EPI INFO
.
53 EPI INFO
.
6. Variveis ALTURA, PESOATUAL, PESO20: sero
defnidas como variveis numricas (Number) e defnir as faixas
conforme orientado.
7. Text com Comment Legal (Comentrio legal): os
valores das variveis tipo texto ou categricas devem ser
sucintos, com poucas letras e de preferncia com palavras
nicas. Entretanto, s vezes necessitamos fornecer uma
descrio maior da defnio do valor. Esse pode ser o caso da
varivel TABAGISMO, a pessoa que introduzir os dados pode
fcar confusa principalmente entre ex-fumante e nunca fumante.
Assim usamos o artifcio (ou artimanha) do Comment Legal que
aceita colocarmos uma descrio junto ao valor da varivel.
Praticamente o mesmo procedimento do Legal Value, a nica
diferena que, depois do valor, devemos colocar um hfen (
) e ento a descrio que desejamos. Tanto o valor quanto o
comentrio aparecero quando entrarmos com os dados, mas
somente o valor ser colocado na tabela de dados.
55 EPI INFO
.
56
ngelo Jos Gonalves Bs
10. Outros tipos de variveis:
a. Yes/No: insere uma varivel que aceita s dois tipos de resposta.
praticamente igual varivel Check Box, mas permite que
tenhamos valores omissos, quando as pessoas no respondem.
b. Multiline: cria uma varivel onde podemos colocar um texto
com vrias linhas.
Modifcando posio das variveis e o tamanho da janela de
resposta na fcha
Podemos facilmente modifcar a posio da varivel clicando
em cima dela e arrastando com o mouse at o local que desejamos. Para
aumentarmos ou diminuirmos o tamanho da janela de resposta devemos
clicar em cima da janela uma vez. Nas variveis com Legal Value devemos
clicar o mouse sobre a janela e pressionar a tecla Alt. Isso faz aparecer
nmeros no fundo da janela e pequenos quadrados ou pontos quadrilteros
nos quatro cantos e no meio da mesma. Devemos posicionar o mouse
exatamente em cima do ponto do meio no canto direito da janela, pois isso
far com que a ponta do mouse modifque a sua forma, passando a ter duas
setas horizontais, conforme a fgura: . Com o mouse assim
posicionado podemos arrastar para a direita ou esquerda at chegarmos
ao tamanho desejado. Essa opo particularmente importante para a
varivel TABAGISMO, onde temos os comentrios dos valores legais. S
podemos alterar o tamanho da janela de entrada de dados quando temos
uma fcha nova sem dados na tabela correspondente.
Agrupando variveis em uma Ficha (comando Group)
As variveis podem ser agrupadas na fcha, segundo suas caractersticas
ou simplesmente pelo desejo do seu criador. Essa caracterstica poder ser
usada quando estivermos analisando essas variveis. Esse grupo de variveis
poder ser movido facilmente na pgina e poder ser usado para gerar
uma anlise separada. Para englobarmos as variveis REG, DATANASC,
DATAEXAME, IDADE, GENERO, COR, ESTADOCIV, devemos clicar
algo acima da primeira varivel e arrastando de tal forma a criar um quadrado
ao redor das variveis. Com o quadro ativo clicamos no menu Insert, Group.
Surge uma janela (conforme a fgura 3.6) onde colocamos uma denominao
ou descrio do grupo, que dever ser diferente das variveis.
57 EPI INFO
.
Essa descrio, sem espao, aparecer como varivel em algumas
anlises no Epi Info
,
termos um nmero bastante grande de opes que nos deixam bastante
58
ngelo Jos Gonalves Bs
atrapalhados. Temos que sempre lembrar o que queremos, no caso trabalhar
com uma varivel, especifcamente atribuir um valor a uma varivel.
Selecionamos, ento, o comando Variables (Variveis) (3), onde temos o
comando Assign (Atribuir) (4), esse comando muito til e aparecer mais
vezes em vrias partes deste livro.
Figura 3.7. Janela de criao de Check Code do Make View.
Fonte: Epi Info
.
Atribuindo a data do dia (Assign Systemdate)
Clicando no boto Assign (4) da janela do Check Code abre uma
janela (fgura 3.8) onde podemos atribuir um valor a uma varivel. A
varivel qual queremos atribuir o valor deve ser escolhida ou escrita no
primeiro compartimento da janela do Assign (1). Escrevendo o comando
SYSTEMDATE no compartimento = Expression (2), introduziremos a data
(dia, ms e ano) do sistema do computador que estamos usando. esperado
que essa data seja a data do dia em que estamos usando o computador, mas
bom checar o relgio do mesmo. Como vemos na janela, podemos usar
letras minsculas ou maisculas nesse comando.
59 EPI INFO
.
Ao clicarmos OK, na janela do Assign, observamos que o comando
ser adicionado no compartimento inferior da janela do Check Code, esse
comando, por sinal, no muito complicado e poderia ter sido escrito
diretamente no compartimento se soubssemos como. Clicamos em Save no
compartimento dos comandos para salvar o que fzemos.
Calculando os anos entre duas datas (Years)
Podemos calcular os anos entre duas datas; no nosso caso, para calcular
a idade entre a data de nascimento e a data de hoje. No nosso exerccio,
desejaremos calcular a idade aps introduzirmos a data de nascimento, pois
a data de hoje ser colocada to logo digitemos o registro. Escolheremos,
inicialmente, a varivel DATANASC na janela das variveis do comando
Check Code (1) e, no compartimento de comandos das variveis, poderemos
simplesmente digitar: Assign idade=years(datanasc,dataexame). Ateno:
cuidado com a posio das variveis!
Clicamos Save novamente e fnalmente OK para fecharmos a janela.
Esses comandos somente sero executados quando terminarmos de entrar
os valores das variveis correspondentes. Podemos editar as variveis
DATAEXAME e IDADE clicando duas vezes em cima delas e selecionar
a opo Read Only, isso evitar que coloquemos outros valores que no os
determinados pelo nosso programa.
60
ngelo Jos Gonalves Bs
Funes do Epi Info
que podem ser observadas clicando na barra Functions (Funes) do comando
Assign (Atribuir). Elas so dispostas na fgura 3.9 e so descritas junto a alguns
operadores como operaes aritmticas. As funes so divididas, ento, em
funes de data (Date Functions), sistema (System), tempo (Time) e de texto
(Text). Descreveremos a seguir algumas delas:
Figura 3.9. Lista de funes e operadores do Epi Info
.
Fonte: Epi Info
.
1. Funes de Data (Date Functions): J vimos um
exemplo de funo de data, a funo Years, que conta o nmero
de anos entre duas datas. As funes Months e Days so muito
parecidas, pois contam, respectivamente, o nmero de meses e
dias entre duas datas. As outras trs funes extraem uma parte de
uma data, respectivamente o ano, o ms e o dia, quando usamos
as funes Year, Month e Day. Note que a diferena est somente
no fato de uma funo ser plural ou singular, por isso devemos
tomar cuidado. O uso das ltimas trs funes muito parecido.
Por exemplo, se quisermos obter somente o ano de uma varivel
data como a DATANASC, criando uma varivel chamada
ANONASC, colocaramos: Assign Anonasc=Year(Datanasc).
61 EPI INFO
.
Outra opo podermos ou no voltar janela inicial, aps
completarmos o preenchimento da fcha (2), vamos checar a opo. importante
ressaltar que a nova fcha criar uma nova tabela de dados, independente da
tabela criada pela fcha inicial. Assim, devemos incluir algumas variveis,
principalmente a varivel REG (Registro) se quisermos relacionar as duas
tabelas posteriormente. Ao clicarmos OK surge a opo de relacionarmos
a uma fcha existente ou criarmos outra. Vamos criar outra fcha, por isso
clicamos nessa opo. O boto surge na tela da fcha que estamos criando.
Editando o boto de ligao entre fchas
Quando colocamos o mouse em cima do boto de ligao entre fchas,
sem clicar no mesmo, aparece uma caixa orientando para algumas opes: Alt
Click to resize, com a tecla Alt pressionada clicamos com o mouse em cima
do boto, aparecero os pontos quadriculados nos cantos e no meio das bordas
do boto, usando o mouse, podemos alterar o tamanho. Shift left click to move,
com a tecla Shift pressionada, que aciona as maisculas, podemos arrastar
o boto com o mouse at o local que desejamos que ele fque posicionado.
Shift right click to edit, com a tecla Shift pressionada ou no, clicando com
o boto da direita do mouse, voltamos janela de edio onde podemos
inclusive deletar o boto. A ltima dica a mais importante: Control click
64
ngelo Jos Gonalves Bs
to go to related fle, pressionando ento a tecla Ctrl e clicando somente uma
vez em cima do boto, movemos para uma nova fcha, onde colocaremos as
seguintes variveis: REG, MENARCA. Voltamos janela clicando no boto
Home ou Back que esto esquerda da janela, logo abaixo dos comandos de
gerenciamento de pginas. Antes surgir uma janela perguntando o nome da
tabela a ser criada. No caso, o programa sugere o mesmo nome do campo:
MULHERES. Aceitando, voltamos janela da primeira fcha.
Modifcando a ordem de entrada dos dados (Order of
FieldEntry [Taborder])
Quando criamos o questionrio, o Epi Info
.
65 EPI INFO
.
Depois de ter concludo isso, podemos passar para a prxima fase, que
a de introduo de dados. Para tanto, precisamos fechar o programa Criar
Ficha (Make View).
Criando a tabela de dados do View
Quando terminamos de criar a fcha e clicamos exit no menu File,
o programa nos pede um nome para a tabela nova, criando um arquivo de
dados em branco, podemos pr o mesmo nome que usamos para a fcha.
Quando colocamos os dados em uma tabela, o programa cria uma varivel
chave nica que identifca cada um dos registros, essa chave chamada
UniqueKey. O programa nos pergunta se queremos iniciar essa varivel pelo
nmero 1 ou outro valor. Ela no nos ajuda muito, por isso tanto faz iniciarmos
essa contagem a partir do nmero 1 ou no, assim deixamos como est e
simplesmente clicamos OK para criarmos a tabela.
Como criar duas fchas com as mesmas informaes
Para que os valores de uma fcha sejam transportados para
outra necessitamos copi-los para variveis permanentes. As variveis
permanentes mantm o valor que posteriormente dever ser copiado para
as variveis da outra fcha.
66
ngelo Jos Gonalves Bs
Os passos para a criao dessas variveis so (fgura 3.13):
1. No programa Criar Ficha (MakeView) abrir o
CheckCode no menu View.
2. Na janela que pede para escolher o campo onde a ao
vai ocorrer (Choose Field where action will occur), escolher a
opo DEFINEVARIABLES.
3. Defnir cada varivel como permanente (sugesto: para
transportar a varivel nome criar a varivel nome_transp).
Figura 3.13 Passos para a criao de variveis permanentes.
Fonte: Epi Info
.
Depois de criadas as variveis, necessitamos criar uma varivel que
executar a cpia dos valores para as variveis de transporte. Pode ser uma
varivel Check-code. No exemplo, estou criando a varivel copia e colocando
no prompt para selecionar a opo para enviar os dados para a fcha 2.
Assumindo que as variveis que queremos copiar da fcha inicial para
a outra fcha j estejam defnidas, devemos criar os comandos de cpia:
67 EPI INFO
.
2. Atribumos ento para as variveis transporte os
valores das variveis da fcha 1. No exemplo teramos conforme
o ilustrado na fgura 3.15.
Figura 3.15. Ilustrao dos comandos que copiam os valores desejados.
Fonte: Epi Info
.
3. Clicamos em ok para confrmar.
68
ngelo Jos Gonalves Bs
4. Agora necessitamos criar a fcha 2 criando um boto
de ligao. Antes disso necessitamos salvar a fcha 1 e fech-la.
Dessa maneira a tornamos me da prxima fcha.
5. Abrimos novamente a fcha 1 e criamos o boto de
ligao. O boto de ligao nada mais que uma nova varivel,
no caso chamada fcha2, onde escolhemos a opo Related
View na janela de defnio da varivel. Aps, abre uma janela
que nos permitir defnir se a fcha estar acessvel sempre
ou quando alguma condio for verdadeira. Como queremos
utilizar a varivel copia como comando para copiar as variveis,
vamos determinar que essa varivel precisa ser selecionada para
que a fcha seja acessvel. Os comandos para isso so simples,
conforme vemos na fgura 3.16.
Figura 3.16. Comandos para tornar a fcha 2 visvel.
Fonte: Epi Info
.
6. Agora necessitamos criar a nova fcha, ao clicarmos
OK, o programa vai perguntar se queremos criar uma fcha nova
ou associar o comando a uma fcha existente.
7. Com o boto Ctrl apertado clicamos em Ficha2. Isso
nos levar a uma fcha nova onde devemos criar as variveis
que desejamos copiar. Os nomes das variveis a serem copiadas
devem ser exatamente iguais aos da fcha 1. Esse procedimento
na realidade somente uma sugesto, mas vai facilitar muito.
Podemos tambm criar as variveis com a opo de somente
leitura, conforme vimos anteriormente na fgura 3.2. importante
que o tipo e formato da varivel seja idntico varivel da fcha 1.
69 EPI INFO
.
Introduzindo dados (Entrar Dados Enter Data)
uma etapa que no requer muita tecnologia, mas descreveremos
algumas dicas para facilitar nosso trabalho e evitar maiores transtornos.
Para tanto, vamos abrir o arquivo que queremos usando o programa Entrar
Dados (Enter Data). Clicar no menu File (Arquivo), ento Open (abrir) e
selecionamos o arquivo, no caso escolheremos o arquivo Seunome.mdb.
Depois de clicar Open, uma janela abrir perguntando que fcha (View)
queremos abrir. Temos duas fchas: Dados e Mulheres, como queremos a
fcha dados, selecion-la-emos.
70
ngelo Jos Gonalves Bs
Falaremos, agora, um pouco nos componentes da tela de introduo de
dados ilustrada na fgura 3.18.
Figura 3.18. Tela do Data Enter do Epi Info
.
A primeira janela, a maior direita, a de introduo dos dados
(marcada como (1) na ilustrao). Os dados so colocados ou editados nesse
componente. Para mover entre uma varivel e outra usamos a tecla TAB ou
Enter. Se preenchermos totalmente o espao da varivel, automaticamente
o cursor passar para a prxima varivel, conforme defnida pela ordem de
entrada. direita em cima na tela, temos a janela das pginas (2), nela podemos
observar qual pgina est aberta, no caso estamos trabalhando com a pgina 1,
que nica. As pginas movem automaticamente depois que a ltima varivel
de cada pgina introduzida, at mesmo se a pgina estiver em branco, exceto
se existir uma varivel cujo valor foi defnido como necessrio (Required).
Igualmente, quando terminamos de colocar os dados na ltima pgina, um
registro novo aberto. Se, por alguma razo, quisermos colocar um registro
novo antes que terminemos de colocar todos os dados do registro atual,
podemos clicar no boto New (5). Na parte mais baixa da janela, esquerda
(3), o programa mostra o nmero do registro que estamos trabalhando e se
aquele registro novo (New Record Registro novo) ou no. Se quisermos,
podemos mover para o registro prvio clicando no sinal <. Isso far com que
o cursor mova para o registro prvio (na mesma pgina). Se o registro que
estamos trabalhando novo e no tem nenhum dado, o Epi Info
nos dar a
opo para salvar o registro em branco. Fazendo isso, podemos nos mover
ao registro prvio sem salvar ou podemos cancelar o comando e retornar ao
71 EPI INFO
introduzir
o correto valor antes de salvar os dados.
2. Variveis Check Box: no precisamos clicar com o
mouse no local da varivel, bastante apertar a barra de espao
do teclado e a caixa fcar selecionada. Para desselecionar, basta
apertarmos a barra de espao novamente.
3. Data contendo ano: podemos digitar somente os ltimos
dois dgitos do ano, o Epi Info
transformar automaticamente
em quatro dgitos. Porm, deveremos ter cuidado porque valores
iguais ou superiores a 50 o programa converter para 19NN.
72
ngelo Jos Gonalves Bs
Porm, se tivermos um valor inferior, por exemplo, 49, o programa
transformar em 2049! Por isso, um bom hbito sempre introduzir
todos os quatro dgitos do ano.
4. Variveis tipo Texto com valores legais: no precisamos
escrever a resposta inteira, nem usar o mouse para selecionar a
resposta, na caixa de respostas. Basta digitar as primeiras letras
da resposta. Precisamos introduzir mais de uma letra se tivermos
duas ou mais respostas que comeam com as mesmas letras. Por
exemplo, se temos duas variveis que comeam com a letra s
teremos que colocar as primeiras duas letras. Se tivermos duas ou
mais respostas que comeam com se deveremos colocar trs,
e assim por diante, at que coloquemos um nmero sufciente de
letras de forma que a resposta fque nica.
5. Variveis Yes/No: elas funcionam como uma varivel
tipo texto com valores legais: precisamos colocar s a primeira
letra: y ou n.
73 EPI INFO
.
Fonte: Epi Info
.
Na janela Analysis esto os comandos de anlise, cujos resultados
sero vistos na janela Analysis Output. Na janela Program Editor aparecer o
comando em sua linguagem de programao.
Abrindo banco de dados no Epi Info
.
Mudando o projeto ativo (Change Project)
Ao clicarmos em Change Project (Mudar Projeto), surgir ento a janela
para localizarmos o arquivo que desejamos abrir ou criar. Para criar um novo
arquivo, basta colocar um nome novo. Devemos prestar ateno onde ele ser
salvo. Criar um arquivo novo pode ser importante quando estamos importando
81 EPI INFO
.
82
ngelo Jos Gonalves Bs
Observando os dados (Comando List)
Figura 4.4. Janela do comando List do Analysis.
Fonte: Epi Info
.
O comando List o primeiro comando do grupo Statistics da janela
Analysis Command. Ele utilizado para visualizar ou editar os dados. Clicando
uma vez no comando, aparecer a janela do comando (fgura 4.4): No item
Variables (1), podemos escolher as variveis que desejamos. O Epi Info
dispe as variveis em ordem alfabtica, no respeitando a ordem em que as
coloquemos na tabela. Devemos selecionar uma varivel de cada vez ou todas,
aceitando o comando asterisco (*), que seleciona todas. No caso, desejamos
mostrar todas as variveis. Poderamos tambm selecionar s as variveis que
no desejssemos, assim deveramos marcar a caixa All (*) Except e selecionar
as variveis no desejadas. Na lista obteremos as variveis selecionadas tambm
em ordem alfabtica no importando a ordem de seleo que escolhermos.
83 EPI INFO
.
Automaticamente o Epi Info
.
A janela do comando Merge muito parecida com a janela do Read.
Se o arquivo que queremos juntar no est no formato Epi Info
2000,
85 EPI INFO
.
86
ngelo Jos Gonalves Bs
Mais um passo necessrio para juntarmos dois bancos de dados: criar
uma chave de ligao. Essa chave (Key) ensinar o Epi Info
quais fchas so
iguais e sero atualizadas e quais so diferentes e sero adicionadas. Na janela
do Merge (juntar) clicamos no boto Build Key (5) situado em baixo esquerda.
Se a opo no est disponvel por que nenhum View foi selecionado. Surgir
a janela Relate Build Key (fgura 4.7), com trs componentes principais: (1)
Current Table(s) que se refere tabela inicialmente aberta (antiga). Available
Variables (2) onde selecionaremos a(s) varivel(is) que vo compor a chave
de relacionamento e o boto Related Table que se refere nova tabela a ser
juntada. Na maioria das vezes, temos uma nica varivel que identifca as
fchas. No caso do nosso exerccio, a varivel REG a que ser utilizada. Com
o Current Table(s) selecionado, procuramos na janela Available Variables a
varivel REG. As variveis estaro, como sempre, em ordem alfabtica, mas
podemos digitar algumas letras da varivel e ela aparecer mais facilmente.
Depois de selecionada a varivel da tabela atual (antiga), passaremos para
defnio da varivel da tabela nova (tabela relacionada). Para tanto devemos
selecionar o boto Related Table. Observamos que a varivel REG da tabela
antiga est na janela logo abaixo do Current Table(s). Novamente, na lista
de variveis, procuramos a varivel da tabela nova, no caso tem o mesmo
nome da tabela antiga: REG. Feito isso, clicamos OK duas vezes para retornar
janela Merge. Com a chave pronta podemos fnalizar o processo clicando
OK. O programa solicita um nome para realizar a ligao dos dois bancos de
dados. Podemos colocar qualquer palavra como, por exemplo, junta.
Aparecer, na janela Analysis Output, o resultado do processo de
agrupamento, com mais fchas que anteriormente. Podemos verifcar o
processo pelo comando List.
Criando novas variveis (comando Defne)
Podemos criar novas variveis, por exemplo, a partir de variveis j
existentes. Esse processo, no Epi Info
.
Variveis podem ser defnidas como Permanent(e) quando desejamos utiliz-
las em todas as vezes que utilizamos o Epi Info
.
O primeiro compartimento, Assign Variable (1), serve para defnir para
qual varivel ser atribudo o valor. No segundo, = Expression (2), ser colocada
a frmula que defnir o valor e as variveis da frmula sero selecionadas no j
conhecido Available Variables (3). No exerccio, para calcular o IMC, devemos
ento colocar essa varivel no primeiro compartimento (Assign Variable). O IMC
defnido como o peso, em quilos, dividido pela altura, em metros, ao quadrado.
88
ngelo Jos Gonalves Bs
Nossa frmula ser ento: PESOATUAL/(ALTURA/100)^2, onde devemos dividir
a altura por 100, porque ela est em centmetros, a expresso ^2 eleva ao quadrado
nosso valor. Ao clicar OK, o programa no nos informa se nossa frmula est
correta ou no. Por isso, observaremos o resultado usando o List para ALTURA,
PESOATUAL e IMC, mas com a opo Update checada, que permite atualizao.
Figura 4.9. Janela de resultado do commando List aps a criao da varivel IMC.
Fonte: Epi Info
.
Observamos na fgura 4.9 que um dos IMC (chamado aqui de Expr1002)
no compatvel com a vida, pois tem um valor muito maior que os outros.
Observamos tambm que o valor de peso desse registro foi introduzido de forma
incorreta: 663. Revisando o questionrio da mesma pessoa observamos que o
valor correto 66,3. Podemos corrigir na prpria janela, pois estamos usando a
opo que permite atualizao. Em algumas verses de Windows, o valor de IMC
ser corrigido automaticamente. Caso isto no acontecer, poderemos tambm
corrigir o IMC na janela, mas existe uma forma mais segura de recalcular o
mesmo rodando o comando Assign novamente.
Utilizando o Program Editor
Quando desejamos repetir um comando, basta localiz-lo na janela
de programao: Program Editor, que fca situada na parte inferior direita
na tela. Colocamos o cursor em cima do programa que fez o Assign do
IMC, dentro da janela de programao, clicando somente uma vez. No
necessitamos selecionar o programa, basta que o cursor fque piscando em
qualquer parte dele. Feito isso, clicamos na ltima barra da direita da janela
Program Editor, chamada Run This Command. Novamente podemos fazer o
List para verifcar o resultado do novo Assign. Para tanto, podemos novamente
89 EPI INFO
.
90
ngelo Jos Gonalves Bs
Observamos que o critrio mais baixo 20 e que se modifca a cada
5 kg/m
2
at 30Kg/m
2
. Existem duas maneiras de colocar esses cdigos. A
maneira mais fcil nos ensinar como colocar os cdigos da outra maneira.
Vamos abrir a janela do Recode. No primeiro compartimento superior
esquerda (From (1)) da janela do comando (fgura 4.10) colocamos a varivel
que vai defnir os critrios de recodifcao. A varivel a ser recodifcada ser
colocada ao lado, no compartimento To (2). No exerccio temos duas variveis,
mas poderia ser a mesma varivel. Antes de iniciarmos a defnir os intervalos,
devemos observar se o valor que usamos como limite pertence margem
superior ou inferior. No caso do IMC, os valores 20, 25 e 30 pertencem
margem inferior, pois esta est classifcada como maior ou igual, as margens
superiores no incluem o igual. Observamos que os intervalos tm tamanho
fxo de 5 nos grupos. A maneira mais fcil de defnir os intervalos usando a
opo Fill Ranges, no boto em baixo esquerda marcado com (3).
Usando a opo Fill Ranges
Figura 4.11. Janela Fill Ranges do comando Recode destacando seus compartimentos.
Fonte: Epi Info
.
91 EPI INFO
.
Ao clicarmos OK, o programa retorna para a janela anterior (fgura
4.12) com os intervalos j construdos: o cdigo HIVALUE defne que o
92
ngelo Jos Gonalves Bs
intervalo incluir o valor maior que existir na nossa amostra, independente do
valor (corresponderia ao infnito positivo). O cdigo LOVALUE corresponderia
ao menos infnito (ou infnito negativo). Observamos que nas colunas de
defnio dos valores de referncia so colocados somente os nmeros ou os
dois cdigos de limite mximo e mnimo.
Observamos tambm que a primeira defnio inclui o valor (>=30). Se
no tivssemos colocado a opo Reverse, a primeira opo seria <=20, o que
no corresponderia a nossa defnio de Magro (<20). Para fnalizar podemos
substituir os cdigos na coluna Recoded Value pelos cdigos que tnhamos: obeso,
sobrepeso, normal e magro, conforme a sequncia do exerccio e clicamos OK.
Figura 4.13. Detalhe da janela Fill Ranges para a varivel DISLIPIDEMIA.
Fonte: Epi Info
.
Em outro exemplo, vamos defnir a varivel DISLIPIDEMIA como
sendo valores maiores que 200 como DISLIPIDEMIA sim, e 200 ou menores
como sendo DISLIPIDEMIA no. Nesse caso, o valor de referncia pertence
ao limite superior do intervalo. Podemos tambm utilizar o Fill Range
novamente. O limite mximo e mnimo ser igual: 200; como temos que
colocar um By, colocamos 200 novamente, como na fgura 4.13. Observamos
que no caso no usamos a opo Reverse, porque o limite mnimo no valor de
referncia pertence ao limite superior e no ao inferior.
Salvando o arquivo (comando Write)
Para salvar as variveis que criamos e torn-las, assim, permanentes,
devemos salvar o nosso arquivo. Com esse objetivo usamos o comando
Write (Export) da seco Data. Na fgura 4.14 observamos que o programa
automaticamente seleciona a opo Append enquanto, na maioria das
vezes, vamos querer utilizar a opo Replace (1). Imediatamente devemos
93 EPI INFO
.
No compartimento Variables, podemos escolher quais variveis
queremos salvar ou, ao contrrio, no salvar. No compartimento File Name
escolhemos o nome do arquivo que queremos salvar. No exerccio, salvaremos
no mesmo nome que tnhamos aberto: Seunome.mdb. Necessitamos ainda
defnir em qual tabela sero salvos os dados, na mesma tabela ou em outra no
compartimento Data Table. No exerccio, usaremos a mesma tabela: Dados.
Podemos salvar o arquivo em outro formato que no o de Epi Info
, mas isso
fca como lembrana aqui.
94
ngelo Jos Gonalves Bs
Salvando o programa Obesidade
Figura 4.15. Janela Save Program do Program Editor.
Fonte: Epi Info
.
Muitas vezes criamos alguns comandos que nos sero muito teis
no futuro. Por exemplo, os comandos que defnem e recodifcam a varivel
OBESIDADE. Podemos salvar esses comandos para um uso futuro. Assim, na
janela Program Editor, apagamos todos os comandos que no pertencem aos
cdigos da defnio e recodifcao fcando s os comandos:
DEFINE obesidade
RECODE imc TO obesidade
30 - HIVALUE = obeso
25 - 30 = sobrepeso
20 - 25 = normal
LOVALUE - 20 = magro
END
No Program Editor, escolher Save. Aparecer a janela, onde colocaremos
o nome do programa: Obesidade, conforme a fgura 4.15.
95 EPI INFO
6.0
Como vimos, o Epi Info
.
Quando desejamos importar informaes de um banco de dados com outra
formatao, devemos tomar alguns cuidados. Antes de abrirmos o arquivo
devemos ver se ele est estruturado apropriadamente para podermos import-
lo sem difculdade. Em primeiro lugar, os dados devem estar todos em uma
mesma planilha ou que tenham, em todas as planilhas, uma varivel que
identifque cada um dos registros (no caso do Excel, linhas). Essa varivel
pode ser, por exemplo: REGISTRO, NOME ou outro indicador. As variveis
devem estar indicadas na primeira linha, sem espao, sem acento e com nomes
distintos como na fgura 5.1.
97 EPI INFO
.
No compartimento (1) da janela do comando IF (fgura 5.2),
colocamos nossa condio: PAS>140 or PAD >90. Na janela (2) colocamos o
que queremos que seja feito nessa condio: assign HIPERTENSAO= Sim
100
ngelo Jos Gonalves Bs
ou o smbolo de SIM do Epi Info
escolhemos a opo Table-to-View. Clicando em qualquer um dos comandos,
a janela de seleo de arquivo ser aberta. Vamos selecionar o arquivo que
recm criamos: Avaliacao.mdb. Aps isso o programa pedir a tabela que ser
a nica do arquivo: Avaliacao. Surgir uma nova janela ilustrada na fgura 5.3.
Figura 5.3. Janela de criao de fcha a partir de uma tabela.
Fonte: Epi Info
.
101 EPI INFO
.
Na seco Statistics do Analysis, com o comando Frequencies, que o
segundo comando, podemos observar a frequncia de distribuio das variveis
de tipo texto. Na realidade poderamos ver a frequncia das respostas de todas
as variveis, mas as variveis numricas contnuas so pouco apropriadas para
isso. Como elas so contnuas, a maioria dos valores vai ser nica. Valores como
12 e 12,01 sero caracterizados como valores distintos e frequncias computadas
distintamente. Assim, frequncias so instrumentos de anlise descritiva para
as variveis de tipo texto (tambm chamadas categricas). No exerccio, vamos
calcular as frequncias das variveis: ESTADOCIV e COR. Na janela do Frequencies
(fgura 5.4), observamos dois compartimentos importantes. No compartimento do
Frequency of (1) procuramos as variveis cujas frequncias queremos calcular e
no compartimento Stratify by (2) podemos selecionar a(s) variveis que desejamos
estratifcar. Inicialmente, vamos calcular somente as frequncias das variveis,
no estratifcando. E, depois, calcularemos as frequncias de maneira estratifcada
102
ngelo Jos Gonalves Bs
para o gnero. Estratifcar signifca calcular as frequncias, da varivel a ser
observada, para cada valor da varivel a ser estratifcada. Assim nosso resultado
trar distribuio da frequncia para cada valor de GENERO.
Estrutura da Janela de Resultado (OUTPUT) do Epi Info
destacando o
caminho e nome do arquivo e a tabela criada pelo comando Frequencies.
Fonte: Epi Info
, arquivo Avaliacao.mdb.
O Epi Info
(verso 1 e 2) possuam dois programas para compactar o banco de dados: um
executado a partir do menu File do Enter data (Entrar dados), onde tnhamos a
opo Compress database (Compactar banco de dados); e a opo Compact &
Repair MDB Utility... (Compactar e Reparar MDB) do programa Visualize data
(Visualizar dados) que fca no menu Utilities (Ferramentas) da tela principal do
Epi Info
. No
menu File do programa, escolhe-se a opo Compact & Repair MDB Utility...
(Compactar e Reparar MDB). Onde aparecer a janela exposta na fgura 5.6.
104
ngelo Jos Gonalves Bs
Figura 5.6. Janela do comando Compact destacando os compartimentos de
denominao dos arquivos a compactar e compactado.
Fonte: Epi Info
.
Ao lado do primeiro compartimento temos o cone (1) que clicamos
para escolher o arquivo que desejamos. No compartimento abaixo (2)
escolhemos primeiro o mesmo arquivo e clicamos Abrir, depois, na tela
do Compact, alteramos o nome, por exemplo, adicionando uma letra,
conforme a seta ilustrada na fgura 5.6. importante trocarmos o nome,
pois se o programa no funcionar direito, poderemos perder os nossos
dados para sempre!
Aps isso podemos clicar em OK. O programa, ento, mostra uma caixa
informando que o processo foi executado. Antes de sair do programa, devemos
confrmar se o novo arquivo foi realmente criado, clicando em um dos cones de
seleo, para ver se o arquivo aparece na tela. Aps verifcar isso, podemos sair
do programa clicando em Exit. Assim podemos deletar o arquivo antigo, aps
termos certeza de que o novo pode ser utilizado sem problemas.
105 EPI INFO
onde
calcularemos as taxas de mortalidade e, fnalmente, transportaremos os
dados para o Epi Map onde criaremos um mapa desses valores.
107 EPI INFO
, a primeira linha da
planilha deve conter somente o nome das variveis. Devemos, ento, excluir
as primeiras linhas da planilha que possuem as descries da tabela. Para
fazer isso podemos selecionar as linhas clicando com o mouse no nmero
que denomina a linha. Com as linhas que desejamos excluir selecionadas,
114
ngelo Jos Gonalves Bs
podemos pressionar as teclas Ctrl (menos) ou clicarmos no menu Editar
(Edit), opo Excluir (Delete). Aparecer uma janela pequena perguntando
o que se deseja excluir, escolhemos linha inteira e, depois, OK. No caso
do comando Ctrl , no necessitaremos confrmar, se selecionarmos a
linha corretamente. Nossa planilha ter, ento, o ttulo (rtulo) das colunas
na primeira linha e os demais valores nas outras linhas. Temos, muito
frequentemente, uma coluna com o sexo ignorado. Essa informao no nos
importante e podemos ou no exclu-la. Para tanto repetimos, mais ou
menos, o mesmo procedimento anterior: selecionamos a coluna clicando
na letra que a denomina e pressionamos Ctrl . No mapa fornecido pelo
site do Epi Info
.
Juntando dois arquivos com variveis diferentes
(comando Relate Relacionar)
Vimos que, quando temos dois arquivos com as mesmas variveis,
podemos junt-los com o comando Merge (Juntar). No comando Merge
(Juntar) somente os dados das variveis comuns so juntados. Quando temos
dois arquivos com variveis diferentes e queremos juntar essas variveis em
um mesmo arquivo, usamos o comando Relate (Relacionar).
O comando Relate (Relacionar) muito semelhante ao do Merge
(Juntar), primeiro devemos abrir o arquivo que receber as variveis novas.
No caso vamos abrir o arquivo bitos Diabete BR 2000.xls, usando o
comando Read (Abrir ou Ler), sem esquecer que o arquivo est em formato
Excel e que temos que selecionar a planilha. Confrmando que a primeira linha
possui o nome das variveis, clicamos OK e observamos que o nosso arquivo
possui 28 observaes: 26 Estados, Distrito Federal e Total. Imediatamente
clicamos em Relate (Relacionar). Observamos que a janela tambm muito
semelhante do Merge (Juntar). Trocando o Data Format (Formato do banco
de dados) para Excel 8.0, selecionamos o arquivo Populao BR 2000.xls.
Selecionando a planilha Populacao, devemos construir a chave de ligao
dos dois arquivos atravs do Build Key (Construir chave). Escolhemos em
ambos os arquivos a varivel UnidFederao. Nosso comando deve fcar
mais ou menos conforme a fgura 6.7.
117 EPI INFO
.
Ao clicarmos OK, o programa nos pergunta sobre um Link permanente
dos arquivos. Como iremos salvar o arquivo em seguida, simplesmente clicamos
OK, sem acrescentar nenhum nome. Completada essa etapa, poderemos salvar
o nosso projeto como bitos BR 2000, tabela Diabetes, usando o comando
Write (Salvar), no esquecendo de selecionar a opo Replace (Substituir).
Devemos agora defnir as variveis que contero as taxas: TxMasc, TxFem,
TxTotal, por exemplo. Devemos usar o comando Defne (Defnir), evidentemente.
Calculando taxas de mortalidade
As taxas de mortalidade so normalmente calculadas para cada mil,
10 mil ou at 100 mil habitantes. Esses valores variam conforme a raridade
da doena: quando temos uma doena com mortalidade baixa, menos de
uma morte para 10 mil habitantes, usaremos o valor mortes por 100 mil para
denominar a taxa. O nosso caso uma doena bastante comum, temos mais
de 35 mil mortes no ano, para uma populao brasileira de 170 milhes,
poderemos usar a denominao de mortes por 10 mil habitantes. Usando o
Assign, teremos nosso comando, demonstrado na fgura 6.8.
118
ngelo Jos Gonalves Bs
Figura 6.8. Janela do comando Assign exemplifcando a frmula para o clculo da taxa de mortalidade.
Fonte: Epi Info
.
Devemos fazer o mesmo para TxFem e TxTotal.
Salvamos novamente o nosso projeto com o mesmo nome, no
esquecendo de selecionar Replace (Substituir).
Adicionando dados ao Epi Map
Vimos como importar informaes de sade do Datasus para o Epi
Info
,
esse comando muitas vezes no funciona. Por isso, recomendvel abrir o
mapa atravs do Epi Map. Abrindo o programa e com o Layer (Camada) j
contendo o mapa do Brasil (BR.shp), clicamos no boto Add data (Adicionar
dados). Abrimos, ento, o projeto bitos BR 2000.mdb, que contm os dados
que desejamos. Aps pensar um pouco, o programa abre uma janela onde
escolheremos as variveis que tm os valores que vo juntar os arquivos, no
caso o nome das Unidades da Federao (primeira janela em ingls: ADMIN_
NAME e na segunda janela em portugus: UnidFederao), assim como o
nome das variveis que sero adicionadas, conforme a fgura 6.9.
119 EPI INFO
.
O programa automaticamente seleciona as primeiras variveis de tipo
texto, em ordem alfabtica. Casualmente so justamente as variveis que
desejamos juntar. Caso as variveis que contm os nomes dos Estados no
estejam selecionadas, devemos corrigir isso, selecionando o nome correto.
A seguir o programa informa valores das duas variveis que no
encontraram nomes semelhantes (fgura 6.10). No caso, temos quatro zonas
de litgio que existem entre os Estados da Paraba e Piau, e entre o Estado
do Amazonas e do Par. No arquivo que criamos temos o total das taxas de
mortalidade que tambm no encontra semelhante no mapa.
Figura 6.10. Janela de aviso dos campos que no encontraram correspondentes nos dois
arquivos, mapa e banco de dados novo.
Fonte: Epi Info
.
120
ngelo Jos Gonalves Bs
Como esses valores no atrapalham nosso resultado, simplesmente
os ignoramos. importante observar, entretanto, se existem Estados que
no encontraram correspondentes nos dois arquivos. Isso pode ocorrer se,
por exemplo, um Estado possui acento, como o da Paraba, cujo acento nem
sempre bem visvel. Se ocorrer uma incompatibilidade de nomenclatura
entre Estados, eles aparecero em ambas as janelas. Nesse caso deveremos
encerrar o programa e alterar o nome do arquivo criado por ns, adequando
o nome do(s) Estado(s) com problema. Independente disso, clicamos
em Continue para fechar a janela. Se no tivermos nenhum problema,
observamos o mapa com a primeira varivel do arquivo (ObFem), j com
a distribuio por faixas (Choropleth) criada. Podemos salvar todo mapa
ou cada um dos mapas.
121 EPI INFO
e
retire a palavra Regio antes dos nomes das regies.
3. Troque o nome das colunas para obitomasc, obitofem e obitotot,
no arquivo dos bitos e para popmasc, popfem e poptotal no
arquivo da populao.
4. Modifque os nomes das planilhas para obitos e populacao (sem
acento) e salve como pasta do Excel como bito Regio BR
2000 e Populao Regio BR2000 respectivamente
5. Importe o arquivo dos bitos para o Epi Info
e depois relacione
(juntar pelo Relate) com a populao.
6. Calcule a taxa de mortalidade para cada sexo e total.
7. Salve o projeto como bitos BR 2000 e tabela RegiaoGeral.
8. Abra o mapa Regies.map, criado no primeiro captulo.
9. Adicione dados a partir do projeto bitos Br tabela RegiaoGeral.
10. Faa o mapa Choropleth da Mortalidade Total.
Captulo 7
CRIANDO GRFICOS COM O COMANDO
GRAPH
Finalmente chegamos ao comando to esperado de criao de grfcos
pelo Epi Info
.
No compartimento Graph Type (1) escolhemos o tipo de grfco
que desejamos, que automaticamente nos d a opo de grfco tipo
barra; colocamos depois um ttulo que opcional (2). Logo abaixo do
compartimento do tipo de grfco, existe a opo de criarmos grfcos
123 EPI INFO
, arquivo Apoe.mdb.
Inicialmente, o Epi Info
.
4. Plotting Method: podemos alterar o tipo de grfco
se nos arrependermos ou quisermos testar outras formas de
visualizao (fgura 7.3.), os grfcos de linha (Line), ponto
(Point), rea (Area) e Spline podem ser criados diretamente
selecionando a opo tipo de grfco no comando Graph;
veremos alguma descrio de cada um mais adiante.
5. Data Shadows: defnimos se queremos colocar uma
sombra ou dar um formato tridimensional s barras.
6. Grid Lines: d a opo de colocarmos linhas
horizontais, verticais ou ambas no grfco.
7. Grid in Front: quando optamos por ter linhas
horizontais ou verticais no grfco; podemos mostrar as linhas
na frente do grfco ao selecionarmos essa opo.
126
ngelo Jos Gonalves Bs
8. Graph and/or Table: oferece a opo de incluirmos
uma tabela junto com o grfco ou s a tabela, no caso aparecer
o nmero de indivduos em cada nvel de obesidade com a
preciso decimal defnida pelo Numeric Precision.
9. What to Table: defne se mostra todos os resultados ou
somente os que aparecem no grfco (posteriormente veremos
que podemos selecionar quais grupos mostrar).
10. Point Label Orientation: opo para colocarmos
os rtulos do eixo do X na posio horizontal, vertical ou
inclinada (Slanted).
Figura 7.4. Janela do Customization dialog do Graph.
Fonte: Epi Info
.
11. Customization dialog: a opo mais importante e pode
ser aberta tambm se clicarmos com o boto da esquerda do mouse
duas vezes sobre o grfco. Na janela, visualizada na fgura 7.4,
temos quase todas as opes anteriores e outras novas. No item
General (1), podemos defnir um ttulo e subttulo, alm das
opes anteriormente vistas (Viewing Style, Font Size, Numeric
Precision, Grid Lines, Display Graph and/or Table e Subsets to
127 EPI INFO
.
Color (7) (fgura 7.5) modifca somente as cores dos textos (Desk
Foreground), fundo atrs do grfco (Desk Background), cor da sombra do
grfco (Shadow Color, que no inclui a sombra das barras), cor das linhas
dentro do grfco (Graph Foreground), cor do fundo do grfco (Graph
Background) e as cores das tabelas (Table Foreground e Table Background)
quando as mesmas existirem. Finalmente, no item Style (8), podemos
modifcar a cor das barras, quando no caso estamos trabalhando com o tipo
Bar, e algumas opes que nos sero teis para outros grfcos como tipo
de pontos e tipo de linhas. Essa opo particularmente til quando temos
duas variveis categricas num mesmo grfco. Vamos ver como funciona
128
ngelo Jos Gonalves Bs
colocando GENERO junto com a varivel OBESIDADE um pouco mais
adiante, quando estivermos criando um outro grfco.
Figura 7.6. Janela do Export Dialog do Graph destacando o formato e local de exportao do grfco
em edio.
Fonte: Epi Info
.
12. Export Dialog: opo para exportar o grfco em
diversos formatos (1) e no nome que desejarmos (2). Primeiro
devemos escolher a opo formato de exportao. No nosso
caso, se exportarmos como Metafle, o arquivo ocupar
somente 4Kb, se exportarmos como BMP ocupar 2.602
Kb, enquanto exportando como JPG ocupa 64 Kb. Metafle
nem sempre facilmente visualizvel por programas. Por
exemplo, o programa Paint no consegue abrir. J o JPG
o que, depois do BMP, pode ser visualizado e editado por
um nmero razovel de programas. Depois de escolhermos
o formato, devemos decidir se queremos colocar o grfco
na memria imediata do computador (ClipBoard), salvar em
arquivo (File) ou ainda imprimir diretamente mandando para
a impressora (Printer). Caso quisermos salvar em arquivo
devemos, aps escolher essa opo, clicar em Browse para
defnirmos o nome do arquivo e onde desejamos salvar.
Finalmente clicamos em Export.
129 EPI INFO
, arquivo Apoe.mdb.
130
ngelo Jos Gonalves Bs
1. Grfco tipo Bar com duas variveis categricas (tipo
texto): podemos colocar mais do que uma varivel categrica,
tipo texto, como Main Variable (eixo X), mas isso far com
que se crie uma barra para cada diferente valor das variveis.
Assim, se colocarmos as variveis OBESIDADE e GENERO
juntas, aparecer um grfco mais ou menos como na fgura
7.7. A linha de comando : GRAPH OBESIDADE GENERO
GRAPHTYPE =Bar Observamos que todas as colunas tm a
mesma cor, tendo tanto a varivel GENERO quanto a varivel
OBESIDADE a mesma cor. Se quisermos, podemos modifcar a
cor das barras, mas todas se mantero iguais. Grfcos separados
de cada varivel talvez fcaria melhor.
Figura 7.8. Exemplo de grfco tipo barra utilizando a opo Bar for each value of.
Fonte: Epi Info
, arquivo Apoe.mdb.
Outra maneira, talvez mais interessante, de colocarmos duas variveis
categricas num mesmo grfco utilizando a opo Bar for each value of que
a opo nmero (5) da janela de criao de grfcos. A linha de comando muito
semelhante anterior, mas aparece um asterisco entre OBESIDADE e GENERO:
GRAPH OBESIDADE * GENERO GRAPHTYPE= Bar. O grfco aparece
com quatro sequncias de duas barras com cores diferentes, uma para cada valor
131 EPI INFO
.
132
ngelo Jos Gonalves Bs
O grfco teria quatro barras, uma para cada valor de OBESIDADE,
mas com tamanhos (eixo Y) relacionados mdia das idades em cada
um dos grupos de obesidade. Mais uma vez o Epi Info
inicia a escala do
valor da varivel Y prximo ao melhor valor da amostra. Isto faz com que
observemos uma diferena bastante grande nos valores de IDADE, estando,
no caso, os magros com uma barra muito menor que os outros nveis de
OBESIDADE. Se prestarmos ateno, o valor mdio de idade dos magros est
em torno de 47 anos enquanto o valor dos com sobrepeso no chega a 54 anos.
Assim, a diferena entre o grupo mais velho e o mais jovem menor que sete
anos. Ao corrigirmos a escala iniciando no zero, observamos, conforme a
fgura 7.10, que as barras no so to diferentes assim.
Figura 7.10. Grfco das mdias de IDADE para cada valor de OBESIDADE aps a correo da escala do
eixo vertical.
Fonte: Epi Info
, arquivo Apoe.mdb.
3. Grfco Rotate Bar: o mesmo grfco anterior s que
com barras horizontais.
4. Grfco tipo Histograma (Histogram): um grfco
de barra usado para as variveis numricas como IDADE, IMC
etc. Cada barra construda com intervalos fxos, que devemos
determinar usando a opo Interval a partir de um determinado
valor (1st Value). Se no colocarmos nenhum valor na opo de
133 EPI INFO
.
134
ngelo Jos Gonalves Bs
O histograma aparece como um grfco de barras onde temos no eixo X
os valores dos intervalos e no eixo Y o nmero de pessoas correspondentes a
cada intervalo. Quando temos uma varivel numrica, espera-se que tenhamos
um formato semelhante ao de um sino, com um nmero reduzido de pessoas
nos intervalos extremos (mnimos e mximos) e um nmero mais concentrado
de pessoas ao redor da mdia. O grfco do histograma da idade desta nossa
amostra apresenta mais ou menos essa caracterstica (fgura 7.12).
Figura 7.12. Exemplo de grfco tipo histograma.
Fonte: Epi Info
, arquivo Apoe.mdb.
5. Grfcos tipo Spline e Points: so grfcos semelhantes
ao grfco de barra que produzem respectivamente grfco de
linhas arredondadas conectando os valores ou somente pontos.
Ao contrrio do tipo barra, o comando s aceita variveis
numricas. No caso s funcionariam se tivssemos valores
numricos para as variveis categricas. Como os grfcos
podem ser criados a partir do tipo barra, recomenda-se criar
primeiro esse tipo de grfco e edit-lo para Spline ou pontos,
conforme o desejado.
135 EPI INFO
.
Na opo Data Label Type (1), destacada na fgura 7.13, podemos
mostrar valores percentuais ou os valores absolutos. No caso dos valores
percentuais podemos modifcar o nmero de casas decimais atravs do
comando Numeric Precision. Group Percentages (2). Podemos agrupar
valores pequenos (=< 5%). Podemos destacar uma fatia. Para tanto devemos
clicar duas vezes no rtulo prximo da mesma. Por exemplo, para destacar a
fatia atual, clicamos duas vezes na palavra atual ou no nmero 17%.
136
ngelo Jos Gonalves Bs
Na opo Style podemos modifcar a cor de cada uma das fatias. Nosso
grfco poderia fcar como na fgura 7.14.
Figura 7.14. Exemplo de grfco tipo pizza, destacando a fatia atual.
Fonte: Epi Info
, arquivo Apoe.mdb.
7. Grfco tipo rea (Area): semelhante ao grfco de
barras produzindo uma rea abaixo de uma linha que une os
pontos. Este grfco pode ser convertido em grfco de barra,
linha ou ponto.
Figura 7.15. Exemplo de grfco tipo Pareto.
Fonte: Epi Info
, arquivo Apoe.mdb.
137 EPI INFO
, arquivo Apoe.mdb.
10. Grfco de barra com mais de um nvel (Stacked bar):
Vimos que podemos criar grfcos de barra com mais de uma
138
ngelo Jos Gonalves Bs
varivel. Usando a opo Bar for each value of, teremos mais do
que uma barra para cada valor varivel principal. O tamanho de
cada barra corresponde ao nmero de indivduos em cada nvel
das duas variveis. Podemos, entretanto, dividir cada barra da
varivel principal conforme o nmero de pessoas pertencentes
ao nvel da segunda varivel. Assim teremos barras com mais
de uma cor, cada cor estaria relacionada com o nvel da segunda
varivel. Seria como tivssemos barras, uma em cima da outra,
conforme o nmero de nveis que a segunda varivel possua. O
comando do grfco tipo Stacked bar semelhante ao comando
barra. Uma principal vantagem deste tipo de barra que, na
opo Plot do Customization dialog podemos selecionar barras
percentuais tornando todas as barras iguais e podendo visualizar
as diferenas de distribuio percentual com mais facilidade do
que com os valores absolutos. As duas verses, com valores
absolutos e percentuais das barras de obesidade para valores de
gnero fcariam como nas fguras 7.17 e 7.18 respectivamente.
Figura 7.17. Exemplo de grfco tipo Stacked bar para valores absolutos.
Fonte: Epi Info
, arquivo Apoe.mdb.
139 EPI INFO
, arquivo Apoe.mdb.
11. Grfco em formato de vela (Box-Whisker): quando
queremos mostrar o comportamento de uma varivel numrica
em diferentes grupos, nem sempre s a mdia o sufciente.
Alguma informao sobre o grau de disperso da amostra
ao redor dessa mdia importante. Para isto existe o grfco
tipo vela (Box-Whisker) onde podemos ilustrar esse grau de
disperso. Quando escolhemos esse tipo de grfco no comando
Graph do Epi Info
.
O grfco, por sua vez, aparece como uma barra futuante com dois
traos verticais e um ponto central. O ponto central representa justamente a
mdia, a barra futuante, representa um desvio padro superior e inferior e os
traos dois desvios. Observamos, no grfco da fgura 7.20, que os homens
apresentam mdia superior, mas um desvio padro maior que as mulheres.
Figura 7.20. Exemplo de grfco tipo Box-Whisker.
Fonte: Epi Info
, arquivo Apoe.mdb.
141 EPI INFO
, arquivo Apoe.mdb.
13. Histograma com mais de um nvel (Stacked
Histogram): assim como temos um grfco de barras com
mais de um nvel e o histograma que cria barras para variveis
numricas, podemos tambm criar histogramas com mais de um
nvel utilizando o grfco tipo Stacked Histogram. O comando
similar aos dois. Depois de selecionar a varivel numrica, o
intervalo e o valor inicial, devemos selecionar a varivel grupo.
Por exemplo, se colocarmos a idade, para cada 20 anos, tendo
o valor inicial de 20, agrupando por gnero, teremos o grfco
da fgura 7.22.
142
ngelo Jos Gonalves Bs
Figura 7.22. Exemplo de grfco tipo Stacked Histogram.
Fonte: Epi Info
, arquivo Apoe.mdb.
14. Criando pirmides (Pyramid Graph): o grfco tipo
pirmide na realidade um grfco tipo barra horizontal que tem
duas sries, uma a direita outra a esquerda. Este grfco utilizado
para criar as famosas pirmides populacionais. O comando exige
que a varivel principal (Main variable) seja numrica, mas
no d opes de se criar intervalos. Assim, se criarmos uma
varivel chamada DCADA onde teremos as idades divididas em
intervalos de 10, poderemos criar um grfco tipo pirmide para
cada valor de GENERO como a fgura 7.23.
Figura 7.23. Exemplo de grfco tipo Pyramid.
Fonte: Epi Info
, arquivo Apoe.mdb.
143 EPI INFO
1
Em linguagem humana: variana igual ao somatrio do quadrado das
diferenas entre cada valor de x e a mdia (quanto mais prximos da mdia os
valores de cada pessoa, menor ser essa diferena, consequentemente menor
ser a variana), dividido pelo nmero da amostragem, menos um. Quanto maior
o nmero de pessoas na nossa amostragem, menor ser nossa variana. Assim
podemos diminuir a probabilidade de termos um erro tipo beta aumentando o
nmero de participantes de nossa pesquisa. A capacidade de uma amostragem
rejeitar a hiptese nula chamada de Poder Estatstico. Assim o erro tipo
beta muito utilizado para calcular o nmero (N) amostral, ou seja, o nmero
antecipado de pessoas ou participantes em uma pesquisa necessrio para se
observar signifcncia estatstica em uma diferena entre grupos.
Usando o Programa StatCalc para calcular o N Amostral
O programa StatCalc, criado em 1993, usado para clculos estatsticos
rpidos. Basicamente possui trs componentes: Tabelas 2xN, clculo no N
amostral e o Qui-quadrado para tendncia (fgura 8.1).
Figura 8.1. Janela inicial do StatCalc.
Fonte: Epi Info
.
148
ngelo Jos Gonalves Bs
Sample Size & Power: calcula o nmero amostral necessrio para se
conduzir uma pesquisa, baseado em propores.
Figura 8.2. Janela do StatCalc mostrando as opes do Sample size & power.
Fonte: Epi Info
.
O delineamento das pesquisas determinar o tipo de clculo a ser
realizado. Quando desejamos obter uma amostra representativa de uma
populao para saber a prevalncia de determinada caracterstica usamos o
Population survey.
Exemplo: vamos supor que queremos estudar o nmero de fumantes
entre estudantes de uma universidade. Sabendo que o nmero de fumantes em
uma populao normalmente de 30%, e encontramos em um estudo piloto
que 45% dos estudantes fumam, queremos saber quantas pessoas devemos
estudar para confrmarmos essa hiptese. O nmero total de estudantes 10
mil. Assim colocaremos os dados como mostra a fgura 8.3.
149 EPI INFO
, dados fctcios.
Pressionando o F4 obteremos o resultado, ilustrado na fgura 8.4.
Figura 8.4. Janela com os resultados do clculo amostral de uma pesquisa populacional pelo StatCalc.
Fonte: Epi Info
, dados fctcios.
Neste caso, o N amostral calculado sobre o intervalo de confana
(Confdence level). O intervalo de confana calculado como (1 erro alfa)
e, assim, devemos usar o intervalo de 95%. O programa oferece, assim, vrios
nveis de Intervalo de confana, para o nvel de 95% necessitamos entrevistar
36 pessoas aleatoriamente.
150
ngelo Jos Gonalves Bs
Exerccio :
Calcule o tamanho de amostra para uma pesquisa de populao de
700,000 pessoas para uma doena em que esperada uma prevalncia que seja
10%, mas o pior resultado que se espera poderia ser tanto quanto 20%. D os
valores por um nvel de confana de 95%.
N amostral para Estudo de Coorte ou Estudo Transversal
Estudo de Coorte um estudo onde acompanhamos um grupo de
pessoas com caractersticas especiais. Estudo Transversal um estudo onde
temos dados coletados somente uma vez e comparamos a prevalncia de
determinada doena ou caracterstica em pessoas com determinado fator.
Para calcular o N amostral de um Estudo de Coorte ou de um Estudo
Transversal, necessitamos ter uma ideia da proporo de pessoas no grupo
exposto ao fator e no grupo no exposto. Signifca, proporo de pessoas
que tm determinado fator como, por exemplo, o nmero de pessoas que
fumam ou tm desnutrio, a proporo esperada de doentes no grupo no
exposto e uma das trs alternativas: o risco relativo, a razo de chance ou
a proporo esperada de doentes no grupo exposto. Como exemplo vamos
calcular o tamanho de amostra de estudo Transversal (cross-sectional) para
uma pesquisa sobre bronquite crnica e tabagismo, onde sabemos, atravs da
reviso da literatura, que a proporo de tabagismo na populao 30%, entre
os no fumantes a frequncia da bronquite 5% e entre os fumantes 15%.
Explicando, temos que a proporo de expostos ao tabagismo 30%, ou seja,
70 no fumantes para 30 fumantes. Antes devemos confrmar o intervalo de
confana e o poder estatstico que queremos (95% e 80% respectivamente).
Finalmente, o programa pede a razo de chance (odds ratio), risco relativo ou
a proporo de doentes entre os expostos.
151 EPI INFO
, dados fctcios.
Como temos somente esse ltimo valor, entramos 15% na ltima
linha, conforme a fgura 8.5. Clicando em F4 temos os resultados:
Figura 8.6. Janela de resultados do clculo amostral de um Estudo de Coorte ou Transversal pelo StatCalc.
Fonte: Epi Info
, dados fctcios.
152
ngelo Jos Gonalves Bs
O resultado parece um pouco complicado, mas calcula valores para
outros nveis de IC e Poder. O que nos interessa est na primeira linha de
nmeros. Temos o nmero de no expostos que seria 247 e de expostos
106, com o total de 353. Igualmente, podemos modifcar os valores tanto da
proporo de no expostos/expostos, e a proporo de doentes nos expostos.
E devemos recalcul-los clicando F4.
N amostral para estudo de caso controle
Figura 8.7. Janela de defnio dos parmetros para o clculo amostral de uma pesquisa tipo Caso Controle
pelo StatCalc.
Fonte: Epi Info
, dados fctcios.
Para clculo do N amostral de um estudo de caso controle, as
informaes necessrias so quase as mesmas do Estudo de Coorte ou
Transversal. A nica diferena que no temos o risco relativo, somente a
razo de chance e a percentagem de expostos entre os doentes. O resultado
tambm ser parecido.
153 EPI INFO
, dados fctcios.
Captulo 9
CONSTRUINDO E INTERPRETANDO TABELAS
Diferentes testes estatsticos so usados dependendo do tipo de
varivel que dispomos. Como vimos, as variveis podem ser numricas ou
categricas. As variveis numricas podem ser contnuas ou no. Exemplos
de variveis contnuas seriam a presso arterial, o colesterol e o peso. Um
exemplo de varivel no contnua seria o nmero de mortes de um hospital.
De maneira geral podemos dizer que a anlise dos dados vai ser baseada
nas caractersticas da varivel dependente e das variveis independentes. A
varivel dependente assim chamada, pois a varivel que desejamos observar
a relao ou efeito das outras sobre elas. Dizemos que a varivel dependente vai
depender das outras, que so chamadas independentes. Por exemplo, dizemos
que o nmero de mortes estar na dependncia do tratamento. No caso a varivel
dependente vai ser o nmero de mortes e a varivel independente o tratamento.
Assim defnindo podemos sintetizar a abordagem de anlise de dados
conforme a tabela 9.1.
Tabela 9.1 Sistematizao da anlise dos dados conforme as caractersticas das variveis dependente
e independente.
Varivel
dependente
Varivel
independente
Teste Interpretao
Categrica Categrica Qui-quadrado Relao
Numrica Categrica t Student ou ANOVA Comparao
Numrica Numrica
Regresso linear ou
correlao
Correlao
Categrica
dicotmica
Numrica Regresso logstca Associao
Calculando o c (qui-quadrado) para variveis categricas
O qui-quadrado (identifcado pela letra grega qui - c ao quadrado),
o teste estatstico utilizado para determinar se a distribuio de uma tabela
teria ocorrido por chance (hiptese nula) ou no (hiptese alternativa). O c
155 EPI INFO
.
Temos como exemplo hipottico a frequncia do uso de culos entre
homens e mulheres. Estudamos 100 pessoas, 50 homens e 50 mulheres, deste
grupo teramos igualmente 50 pessoas usando e 50 pessoas no usando culos
conforme a tabela 9.2.
Tabela 9.2. Distribuio do nmero de pessoas que usa ou no culos entre homens e mulheres.
Usa culos No usa Total
Homens 30 (60%) 20 (40%) 50 (50%)
Mulheres 20 (40%) 30 (60%) 50 (50%)
Total 50 (50%) 50(50%) 100
Fonte: dados fctcios.
Observamos que o nmero de homens usando culos foi de 30/50 =
60%, enquanto essa frequncia nas mulheres foi de 20/50 = 40%. Notamos
assim que os homens usam proporcionalmente mais culos que as mulheres.
Se o gnero no tivesse relao nenhuma com o uso de culos, 50% dos
homens e 50% das mulheres usariam culos. Assim, na interpretao de
uma tabela procuramos sempre comparar o percentual dos totais (fora
da tabela) com os percentuais observados. Os percentuais fora da tabela
(totais) so os percentuais ESPERADOS, e os percentuais dentro da tabela
so os percentuais OBSERVADOS. Se os percentuais observados forem
diferentes que os esperados, mais do que a chance dizemos que existe uma
relao signifcativa entre as variveis, no caso gnero e uso de culos. O
teste do c nada mais que a o somatrio dos quadrados das diferenas
entre os valores observados e esperados, divididos pelos valores esperados
como veremos a diante. Felizmente, na maioria das vezes os programas
fazem todo esse clculo para ns, mas veremos como feito s para
matar nossa curiosidade. Para calcular os valores esperados multiplicamos
a percentagem dos valores totais das linhas. No caso teramos 50% de
homens vezes 50 usando culos, assim o esperado seria termos 25 homens
usando culos. Se no tivermos os valores percentuais podemos usar as
frmulas a partir da tabela:
156
ngelo Jos Gonalves Bs
Classicamente denominamos a tabela 2x2 com quatro letras a, b, c, e d:
Usa culos No usa Total
Homens a b a+b=50
Mulheres c d c+d=50
Total a+c=50 b+d=50 a+b+c+d=100
Os valores esperados de a seria o total da linha (a+b) vezes o total
da coluna (a+c) dividido pelo total geral (a+b+c+d), ou seja, 50x50/100=25.
Usando o mesmo princpio, todas as frmulas seriam:
Assim, a tabela esperada se a distribuio ocorresse ao acaso seria:
Usa culos No usa Total
Homens Ea=25 Eb=25 50
Mulheres Ec=25 Ed=25 50
Total 50 50 100
Notamos que na segunda tabela (tabela esperada) 25/50=50% dos
homens usam culos, o mesmo esperado para as mulheres. A principal
caracterstica dessa tabela o fato de ser homognea, ou seja, que a
distribuio nas casas obedece distribuio dos subtotais. Finalmente,
poderemos calcular o qui-quadrado, que a soma dos resultados obtidos pela
diviso do quadrado das diferenas entre o observado e o esperado de cada
clula pelo esperado de cada clula:
; ;
;
157 EPI INFO
foi originalmente
criado pensando em uma anlise de dados epidemiolgicos, essa varivel da
coluna chamada de Disease (doena) possuindo os nveis positivo (com
doena) e negativo (sem doena), como pode ser observado na fgura 9.1. A
outra varivel chamada de exposio que aceita dois ou mais nveis.
Figura 9.1 Janela de defnio dos valores da tabela a ser avaliada pelo StatCalc.
Fonte: Epi Info
.
1
A tabela 2x2 tem um grau de liberdade, pois, sabendo os totais, necessitamos saber somente o valor de uma
casa, para podermos calcular as outras. Grau de liberdade um parmetro estatstico utilizado para calcular
o valor crtico do teste que utilizamos, nesse caso o qui-quadrado.
158
ngelo Jos Gonalves Bs
O StatCalc tambm no aceita o comando do Mouse, para navegar
nele devemos apertar o Enter () e os comandos de funo que fcam na parte
de cima do teclado. A sequncia de entrada dos nmeros tambm no muda.
Comea no canto esquerdo depois na clula da direita para retornar a esquerda
j na clula em baixo e fnalmente na clula da direita.
Vamos digitar a seguinte tabela:
Falecidos Sobreviventes Total
Tratamento 40 232 272
Controle 35 93 128
Total 75 325 400
Devemos colocar primeiro o 40, que corresponde ao nmero de
falecidos (com doena) e em tratamento (exposto). Apertamos o Enter e
depois 232, sobreviventes em tratamento e Enter novamente. Logo a seguir
colocamos 35 e Enter, e fnalmente digitamos 325. Quando terminamos a
tabela devemos apertar o Enter duas vezes ou F4, se seguirmos digitando
nmeros logo aps cada Enter, uma nova linha aparecer. Aps apertarmos
dois Enter seguidos os resultados da anlise da tabela aparecero, segundo
a fgura 9.2. No caso estamos trabalhando com uma tabela 2x2, assim
os resultados da Razo de Chance (Odds ratio) e do Risco Relativo com
seus respectivos intervalos de confana aparecero. Discutiremos esses
resultados quando estivermos falando sobre a avaliao do risco, no dcimo
primeiro captulo deste livro.
159 EPI INFO
, dados fctcios.
Nota-se uma das caractersticas do Epi Info
:
comando Tables
O comando Tables o terceiro comando da seco Statistics e fornece
alguns resultados estatsticos. Como se trata de tabelas teremos assim duas
variveis categricas. Como vimos o teste estatstico para testar a relao
entre duas variveis categricas o Qui-Quadrado. O Qui-quadrado nada
mais faz que determinar se existe um balano das casas na tabela observada
ao comparar essa tabela a uma tabela aleatria, chamada de tabela esperada.
Se a tabela observada tiver uma distribuio nas casas diferente das esperadas
dizemos que uma varivel est relacionada com a outra, pois produz uma
distribuio no aleatria. Vamos ver um exemplo, usando o banco de dados
Avaliacao.mdb e as variveis: ESTADOCIV e GENERO.
Na janela do comando temos dois compartimentos importantes
observados na fgura 9.3.
Figura 9.3. Janela do comando Tables do Analysis mostrando os compartimentos de
defnio das variveis da tabela.
Fonte: Epi Info
.
161 EPI INFO
, arquivo Avaliacao.mdb.
162
ngelo Jos Gonalves Bs
2. Usando o banco de dados Apoe*, tabela Grupo1, construa e
interprete as tabelas:
a. SEXO X OBESIDADE.
b. SEXO X HIPERTENSAO.
c. SEXO X DISLIPIDEMIA.
*Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo.
Captulo 10
CALCULANDO E COMPARANDO MDIAS
Comparando duas mdias pelo teste t de Student
O teste t de Student utilizado para comparar mdias de dois
grupos; necessita que a varivel a ser medida (dependente) seja contnua e,
evidentemente, a varivel a ser comparada (independente ou varivel resposta)
seja dicotmica (categrica com somente dois nveis). O teste utilizado para
resolver a seguinte hiptese nula: Ho : 1- 2= 0 (mdia do grupo 1 menos a
mdia do grupo 2 igual a zero, ou seja, no h diferena entre as mdias dos
dois grupos), com duas possveis hipteses alternativas: Ha : 1- 20 teste
de duas caudas (as duas mdias so diferentes) ou Ha : 1- 2>0 teste de uma
cauda (uma mdia de 1 maior que a mdia de 2). Assume dois diferentes
grupos, que podero ser de tamanhos diferentes.
Para calcular o t no pareado utilizamos a seguinte frmula:
Observamos na frmula que, quanto maior a diferena entre as mdias,
maior vai ser o t. No denominador existem dois fatores que podem infuenciar:
o somatrio das diferenas entre os diversos valores de x de um grupo com a
mdia do mesmo, isto determina que se a varincia dos grupos for pequena,
menor vai ser o denominador, portanto maior o valor do t; por ltimo,
devemos comentar que o nmero de observaes infuencia inversamente
o denominador da equao. Por isto, quanto maior a diferena das mdias,
menor a variabilidade dos grupos e, principalmente, maior o nmero de
observaes, maior sero as chances de encontrarmos um t signifcativamente
grande. Quanto maior o t maior seria a diferena entre os dois grupos e,
consequentemente, menor o erro alfa. O erro alfa estaria relacionado rea
comum existente entre os dois grupos.
( ) ( )
+
+
=
2 1 2 1
2
2 2
2
1 1
2 1
1 1
2 n n n n
X X X X
X X
t
164
ngelo Jos Gonalves Bs
Comparando duas ou mais mdias
Supomos que estamos testando o efeito de trs tratamentos diferentes
para hipertenso. Um grupo recebeu diurtico outro betabloqueador e outro
bloqueadores do clcio. Se usarmos o t de Student para comparar as trs
mdias, obteremos trs valores diferentes de p (erro tipo I ou alfa). Assumindo
um alfa de 0,05, teremos que a probabilidade de no estarmos errados ao
rejeitar a hiptese nula para cada um dos testes de 95%. Entretanto, a
probabilidade de no estarmos errados ao rejeitar a hiptese nula, em nenhum
dos testes, ser o produto das trs possibilidades, ou seja: 0,95 x 0,95 x 0,95
= 0,86. A probabilidade de no cometermos o erro tipo I em nenhuma das trs
comparaes possveis , ento, 0.86. Em outras palavras, a probabilidade
de ocorrer um erro tipo I nas trs comparaes ser de 0,14. Por isso,
a probabilidade de no ocorrer um erro tipo I, rejeitarmos a hiptese nula
quando na realidade ela for verdadeira, nessa trplice comparao ser maior
que a desejada de 0,05. Quanto maior o nmero de comparaes, maior ser a
possibilidade de ocorrer um erro tipo I.
Entendendo a Anlise de Variana
A tcnica apropriada para analisar variveis contnuas quando
desejamos comparar dois ou mais grupos (varivel categrica) a Anlise de
Varincia, tambm conhecida como ANOVA.
Os princpios envolvidos na Anlise de Varincia so os mesmos que
o t-teste. Dentro da hiptese nula, deveremos ter a seguinte situao: existe
uma grande populao e, se tivermos diversas amostras de um tamanho
determinado dessa populao, teremos vrias mdias, que devem variar,
aleatoriamente, entorno da mdia global de toda a populao. Se as amostras
variarem em torno da mdia total, mais do que o esperado pela chance, talvez
tenhamos algum fator, alm da chance, infuenciando essa alterao. Talvez
as amostras colhidas no sejam da mesma populao. Poderemos, assim,
rejeitando a hiptese nula de que todas as mdias so iguais, concluir que as
mdias diferem entre si mais do que o esperado pela chance.
A ANOVA calcula o F estatstico usando uma frmula menos complicada,
mas mais trabalhosa que a do clculo do t de Student. Tentaremos explicar um
pouco, mas no se preocupe se no conseguir entender o todo. Essencialmente,
queremos observar se a variabilidade dos valores entre os grupos (externa)
maior do que a variabilidade dos valores dentro de cada grupo (interna). As
variabilidades so calculadas pela soma dos valores dos grupos e as somas
165 EPI INFO
x
x
n
x
n
x
n
x
2
2 2 2
2
~
166
ngelo Jos Gonalves Bs
Confgurando o computador para realizar clculos estatsticos
Figura 10.1. Janela de seleo da lngua do sistema do computador.
Fonte: Windows 7.
Na maioria das vezes nossos computadores esto confgurados para
utilizar a lngua portuguesa. A lngua portuguesa utiliza vrgula no lugar de
ponto decimal. A maioria das verses de Windows faz com que o Epi Info
se atrapalhe ao fazer clculos usando vrgula como marcador decimal. Isso
faz com que variveis com valores decimais como peso ou altura tenham
suas mdias alteradas. Esse problema tambm poder afetar outros clculos
estatsticos. Por isso, devemos alterar as Opes Regionais (Regional Options)
na janela de Painel de Controle do Windows. Para tanto devemos abrir o Meu
computador e localizar a pasta Painel de Controle, abrir Opes Regionais e
alter-las escolhendo uma das tantas lnguas inglesas, observadas na fgura
10.1. Em alguns computadores isso no necessrio, como no Windows 2000,
por exemplo. Recomenda-se testar o Epi Info
antes.
167 EPI INFO
:
comando Means
Podemos calcular mdias e comparar as mesmas usando testes
estatsticos atravs do quinto comando do Statistics chamado Means.
Normalmente, testes estatsticos so usados para verifcar se as diferenas
das mdias de dois ou mais grupos poderiam ter ocorrido ao acaso (Hiptese
nula). Vimos que o teste t de Student usado para comparar duas mdias
e, quando temos mais que duas mdias, utilizamos a ANOVA (Anlise de
Varincia). Na realidade ambos os testes se equivalem, porque a ANOVA
tambm serve para testar diferenas entre as mdias de dois grupos. Por
isso o Epi Info
.
Temos que alterar um pouco a confgurao, por isso vamos clicar
em Settings.
168
ngelo Jos Gonalves Bs
Figura 10.3. Janela da opo Settings do Analysis destacando as opes Show Percents e
Show Tables in Output.
Fonte: Epi Info
.
A janela do Settings do comando Means (fgura 10.3) muito semelhante
aos outros comandos do Epi Info
, arquivo Avaliacao.mdb.
Descrevendo de cima para baixo os resultados, temos uma anlise
descritiva dos resultados para cada valor da varivel independente (no caso
gnero). Temos uma linha para o gnero feminino e outra para o masculino.
Inicialmente, o programa fornece o nmero de observaes, depois o somatrio
das idades, que no nos interessa muito, e, fnalmente, a mdia, varincia e o
desvio padro. importante, inicialmente, determinar se o nmero total das
observaes, nmero de pessoas no gnero masculino mais o nmero de pessoas
no gnero feminino, igual ao total de observaes no banco de dados. Isso
importante para verifcar se o programa est calculando adequadamente as mdias
com os valores no inteiros, quando estamos usando a linguagem portuguesa no
sistema, ao contrrio do orientado anteriormente. No caso temos o nmero total
de 66 pessoas que corresponde ao nmero total de pessoas no banco de dados.
Entretanto, a varivel IDADE no se presta para observar se a linguagem afeta os
clculos, por que s temos valores inteiros (anos). Observando as mdias, vemos
que no existe muita diferena nas idades entre os dois gneros, sendo as mulheres
170
ngelo Jos Gonalves Bs
um pouco mais idosas. Depois devemos observar as varincias, no caso, temos
uma varincia maior para as mulheres. Gostaria de destacar a importncia do
segundo grupo de anlise que justamente os valores mnimos e mximos. Eles
nos ajudam a observar se existem observaes com valores colocados errados.
Por exemplo, se tivssemos um valor mnimo de 5 poderamos pensar que, para
uma pessoa adulta, como todas as pessoas dessa amostra, esse valor no correto.
Assim observando, deveremos tentar corrigi-lo e repetir a anlise.
Depois dessa anlise descritiva, iniciam-se os resultados da ANOVA e
do teste t, que, no nosso exerccio, no foram signifcativas. O Epi Info
chama
a mdia externa de MS Between e a interna de MS Within. O F estatstico
calculado ento dividindo a mdia das somas entre os grupos (MS Between) e
a mdia das somas dentro dos grupos (MS Within) (135,9363/153,3334=0,89).
importante observarmos a similaridade da ANOVA e o t de Student quanto
aos resultados. Apesar de terem um clculo diferente chegam a resultados
idnticos, pois se elevarmos o t de Student ao quadrado chegaremos ao mesmo
valor do F calculado pela ANOVA (0,9416^2=0.8866).
O teste mais importante quando estamos trabalhando com o teste t
de Student e a ANOVA se as varincias so homogneas ou no. Assim,
o Epi Info
, arquivo Avaliacao.mdb.
171 EPI INFO
no fornece nenhum.
Um teste que podemos realizar o teste de Bonferroni que ajusta o p crtico
ao nmero de comparaes. Assim, usando o mesmo motivo de o porqu
da necessidade da ANOVA quando temos mais de dois grupos. Quando
temos trs grupos precisamos fazer trs comparaes: A com B; B com C e
A com C. Se usarmos o limite de p de 0,05 temos (0,95x0,95x0,95= 0.86),
se dividirmos 0,05 por 3 chegamos a um p de 0,01666, calculando o p total
nas trs comparaes temos (0.983x0.983x0.983=0.95). Assim, conseguimos
ajustar o p para mltipla comparao, dividindo o mesmo pelo nmero de
comparaes necessrias para comparar todos os grupos. Podemos utilizar
essa estratgia quando temos uma ANOVA signifcativa.
173 EPI INFO
.
175 EPI INFO
.
Observamos o novo grfco na fgura 11.2 que apresenta algumas
caractersticas semelhantes e outras diferentes. Igualmente ao grfco anterior
este grfco tambm apresenta uma reta com mais ou menos metade da
amostra acima e outra metade abaixo da reta. Observamos, entretanto, que a
reta apresenta-se ascendente e as observaes mais prximas da reta (menos
disperso). Existem, assim, dois importantes fatores a observar quando
176
ngelo Jos Gonalves Bs
analisamos a associao entre duas variveis numricas: o grau de disperso
das observaes e a anlise da reta. O grau de disperso medido pelo
Coefciente de Correlao e seu valor independe de qual varivel dependente
ou independente; ela independe tambm do tipo de unidade utilizada para
medir as variveis (kg ou libras, metros ou polegadas, por exemplo).
Entendendo o Coefciente de Correlao
Duas variveis contnuas podem estar correlacionadas uma com
a outra. Por exemplo, pessoas mais altas tendem a serem mais pesadas.
O Coefciente de Correlao (tambm chamado de r) uma medida da
associao entre duas variveis contnuas. O r pode variar de 0 a 1. Se for
zero, signifca que as duas variveis no tm nenhuma correlao. Se o r =
1, signifca que existe perfeita correlao, ou seja, uma varivel pode predizer
outra. O coefciente de correlao est relacionado com o grau de disperso de
duas variveis. Quanto mais prximas forem as observaes em torno de uma
reta imaginria (linha de regresso), maior vai ser o r.
A frmula para o clculo do r a seguinte:
Elevando ao quadrado teremos o r.
Observamos que poderamos muito bem trocar a posio do X e do Y
na frmula sem alterar o seu resultado, corroborando com o que foi explicado.
Entendendo a Regresso Linear
Para representarmos grafcamente a associao entre duas variveis,
utilizamos a Regresso Linear, que poder ser simples, se utilizarmos
apenas uma varivel dependente (resposta) e uma varivel independente
(fator). A Regresso Linear mltipla utiliza tambm uma varivel resposta,
que dever ser contnua, e dois ou mais fatores, que podero ser contnuos
ou no. Iniciaremos com a Regresso simples. Ilustraremos essa relao
pelo grfco abaixo, com cinco diferentes pessoas, A, B, C, D e E com seus
pesos e alturas.
r
n XY X Y
n X X n Y Y
=
( ) ( )( )
( ) ( )
177 EPI INFO
calcula esses
parmetros. Primeiro vamos calcular a Regresso para Y=IMC e X=ALTURA.
Na seco Advanced Statistics clicamos em Linear Regression e obtemos a
janela da fgura 11.5.
Figura 11.5. Janela do comando Linear Regression do Analysis destacando os compartimentos mais importantes.
Fonte: Epi Info
.
179 EPI INFO
chama
de Outcome Variable (Varivel de Sada), que poderamos chamar de Varivel
Resposta, mas usualmente chamamos de Varivel Dependente. No caso
especfco a varivel Y da nossa equao, no nosso exemplo ser o IMC. No
compartimento Other Variables (2) seriam as Variveis Independentes, como
podemos notar pode ser mais do que uma. No nosso caso ser ALTURA. Mais
tarde usaremos mais do que uma varivel independente, mas por enquanto
vamos ver como o programa nos mostra os resultados:
Linear Regression
Variable Coefcient Std Error F-test P-Value
ALTURA -0.177 0.055 10.4070 0.001992
CONSTANT 56.365 8.849 40.5705 0.000000
Observamos os coefcientes dos parmetros da Regresso:
ALTURA=-0,177, com seu teste estatstico (F) e signifcncia (p=0,001992),
e o que o Epi Info
.
Finalmente podemos construir o grfco PESOATUAL X IMCC
usando a opo Series para cada valor de Genero, observado na fgura 11.7.
Figura 11.7. Distribuio do IMC calculado para cada valor de GENERO em funo do PESOATUAL.
Fonte: Epi Info
, arquivo Avaliacao.mdb.
20.0
22.5
25.0
27.5
30.0
32.5
35.0
45 50 55 60 65 70 75 80 85 90 95
i
m
c
c
PESOATUAL
Feminino Masculino
183 EPI INFO
, arquivo Avaliacao.mdb.
Observamos que os homens, em tringulo no grfco, fcam, em sua
maioria, inferiormente colocados. Mas as duas curvas no so, aparentemente,
paralelas. O grfco mostra que a linha das mulheres tem um ngulo maior
que a dos homens, levando a acreditar que um aumento no peso das mulheres
est relacionado a um aumento maior no IMC do que aconteceria nos homens.
Como medir ou verifcar se isso signifcativo ou no? Usamos um artifcio
chamado de interao. Nossa frmula fcar: IMC= peso genero peso*genero,
onde teremos mais um coefciente para medir a diferena no efeito do peso
sobre o IMC nos diferentes gneros. No comando da Regresso Linear, para
criar uma interao, devemos selecionar as variveis desejadas colocando-
as na lista de variveis do modelo. Depois devemos marc-las clicando em
cada uma delas conforme a fgura 11.9 (1). A barra que fca entre a janela de
seleo das variveis e as variveis selecionadas muda de nome, para Make
Interaction (2); clicando nessa barra a frmula da interao passa para a janela
de interao, fcando a janela fnal semelhante observada na fgura 11.10.
20.0
22.5
25.0
27.5
30.0
32.5
35.0
45 50 55 60 65 70 75 80 85 90 95
i
m
c
PESOATUAL
Feminino Masculino
184
ngelo Jos Gonalves Bs
Figura 11.9. Detalhe do comando Linear Regression mostrando como criar uma interao entre
duas variveis.
Fonte: Epi Info
.
Figura 11.10. Janela do commando Linear Regression mostrando os comandos para a criao de uma
regresso linear com interao entre GENERO e PESOATUAL.
Fonte: Epi Info
.
185 EPI INFO
, dados fctcios.
Vimos que os valores so muito grandes, pois representam um
estudo transversal populacional; existem tambm mais sadios que doentes,
pois a prevalncia da doena de 1/100. Como vimos anteriormente,
estudos populacionais so muito difceis, principalmente quando
trabalhamos com doenas raras. Assim nos valemos de estudos de caso-
controle, onde sabemos de antemo quem doente e sadio. Geralmente,
a proporo de doentes ser maior que o da populao total e podemos
escolher a mesma quantidade de casos e controles ou um pouco mais
controles que casos. No estudo de caso-controle, devemos escolher os
casos e controles sem controlarmos, nesse momento, quem exposto ou
no. Assim, se escolhermos uma amostra menor, a proporo de expostos
191 EPI INFO
, dados fctcios.
Observamos que, como a proporo do fator de risco em ambos os
grupos, doentes e controles, o mesmo do estudo transversal, o resultado
do clculo do risco deveria ser o mesmo. Entretanto, o Risco Relativo
calculado no caso-controle bem diferente do calculado no estudo
transversal. J na Razo de Chance, os resultados de ambos os estudos
192
ngelo Jos Gonalves Bs
so muito semelhantes, comprovando que a Razo de Chance pode ser
utilizada nos dois desenhos.
Se trocarmos a posio do fator, pelo evento, teremos o resultado
conforme a fgura 12.3.
Figura 12.3. Resultado da anlise da transposio da tabela do exemplo 2 pelo StatCalc.
Fonte: Epi Info
, dados fctcios.
Novamente, o resultado do clculo da Razo de Chance mantm-se e
o resultado do Risco Relativo se altera.
Usando a Regresso Logstica
Utilizamos a regresso logstica para calcular a Razo de Chance
de uma pesquisa cujo desenho seja caso-controle com mais de um fator de
risco. Como vimos, a regresso tenta descrever a relao de duas ou mais
variveis em uma frmula. No caso do estudo do risco teremos nossa varivel
dependente categrica com dois nicos valores possveis: ter ou no ter o
evento. Esse evento pode ser um evento adverso ou favorvel: morte ou
ganhar na loteria, infelizmente a Razo de Chance do primeiro maior que
a do segundo. Quando montamos um estudo sobre o risco de um evento,
devemos, inicialmente, caracterizar ou descrever claramente que critrios
sero utilizados para caracterizar o evento. A frmula da regresso logstica :
bx
e RC
=
193 EPI INFO
.
No nosso banco de dados (Apoe), temos, como evento, o
episdio coronariano, caracterizado como angina, infarto ou alteraes
no eletrocardiograma, que sugerem alteraes isqumicas das artrias
coronarianas. Sabemos que essas alteraes esto relacionadas Aterosclerose
das artrias e que possui muitos fatores de risco e muitos deles esto
relacionados entre si. Por exemplo, sabemos que a idade um fator de risco,
quanto maior a idade maior a chance de desenvolver um evento coronariano.
Para calcular esse risco podemos utilizar a Regresso Logstica.
Neste nico caso, o Epi Info
, arquivo Apoe.mdb.
Entretanto, quando usamos o comando Display, que nos mostra as
caractersticas das variveis do projeto em uso, observamos, na fgura 12.5,
que a varivel , na realidade, uma varivel tipo texto, provavelmente porque
o arquivo havia sido importado do Excel.
194
ngelo Jos Gonalves Bs
Figura 12.5. Resultado do comando Display destacando as caractersticas originais da varivel EVENTO.
Fonte: Epi Info
, arquivo Apoe.mdb.
Devemos, ento, transformar a varivel EVENTO em varivel tipo
Yes/No. O que parece fcil exige alguns cuidados, pois no basta usar o
Recode da varivel com os valores Yes e No. Existem as siglas especiais
que o Epi Info
.
195 EPI INFO
.
Como resultado, teremos a fgura 12.8.
Figura 12.8. Janela do resultado do comando Logistic Regression.
Fonte: Epi Info
, arquivo Apoe.mdb.
196
ngelo Jos Gonalves Bs
O resultado fornece todas as informaes de que precisamos. O
coefciente para idade 0,0389 que, aplicando a frmula RC=e
0,0389
, temos
justamente o valor dado para a razo de chance, ou seja, 1,0396. Na interpretao,
uma pessoa com um ano a mais tem um risco de 1,0389 vezes o risco de ter
evento, ou 3,9% a mais de ter o evento. O intervalo de confana de 95% vai de
1,0254 a 1,0541, como no inclui o 1, ento a razo de chance signifcativa.
Figura 12.9. Janela da calculadora do Windows destacado os comandos para o clculo do logaritmo
natural de um nmero.
Fonte: Windows 7.
Importante: uma pessoa 10 anos mais velha no ter uma razo de
chance de 10,396 (1,0396x10) mas de e
(10x0.0389)
, ou seja 1,4755. Para calcular
isso podemos usar a calculadora do Windows.
No boto iniciar do Windows temos a opo programas, acessrios,
calculadora (calculator). No menu Exibir (View) da calculadora (fgura12.9)
selecionamos Cientfca. Primeiro temos que colocar o valor do coefciente j
multiplicado por 10: 0.389 (1). Selecionamos a opo Inv(invertido)(2) depois
clicamos em ln (logaritmo natural) (3). E, assim, temos o resultado (1,4755).
Se quisermos que o Epi Info
.
A Censored Variable (1) justamente a varivel que contm
informaes sobre o evento, no nosso caso chama-se EVENTO. O valor para
o caso no censurado (Value for Uncensored (2)) o valor atribudo ao evento
positivo, no caso Yes. A Time Variable (3) a varivel que informa o tempo
decorrente entre o incio do acompanhamento e o evento, para os casos de
evento positivo ou do tempo decorrente entre o incio do acompanhamento
e o ltimo perodo no qual o participante estava ativo. Essa varivel , no
exerccio, TEMPO. No nosso caso especfco, como estamos interessados
somente em evento cardaco, a pessoa pode ter falecido de outra causa,
desistido do trabalho, sumido ou ainda estar ativo. Todos esses casos sero
enquadrados como censurados e tero a varivel EVENTO igual a No.
Para que o resultado da curva seja correto devemos informar a unidade de
medida de tempo utilizada por essa varivel no item: Time Units (4), no
nosso caso estamos tratando de anos. Podemos criar uma curva nica ou para
dois ou mais grupos escolhendo a varivel no item Group Variable (5), no
nosso caso escolheremos a varivel APOE4. Finalmente podemos escolher
o tipo de curva que queremos no item Graph Type (6), na quase totalidade
escolheremos Survival Probability, que automaticamente aparecer mesmo se
no a selecionamos. Clicando OK teremos nosso resultado:
205 EPI INFO
, arquivo Apoe.mdb.
Observamos que cada valor de APOE4 apresenta-se em curva distinta
com a curva APOE4=No ou grupo sem o alelo 4 da Apoe apresentam uma curva
superiormente colocada e que, ao contrrio, a curva do grupo com APOE4
inferior. Isso signifca que o grupo APOE4 apresenta uma probabilidade de
sobrevida menor que o grupo sem o alelo 4. Podemos analisar essas curvas
de duas maneiras: usando o parmetro probabilidade de sobrevida ou o tempo
de sobrevida. Normalmente se descreve o tempo de 50% de sobrevida, no
nosso caso no somente o grupo de APOE4 tem valor para a sobrevida de
50%, assim podemos usar uma sobrevida de 70%. Na interpretao teremos
uma sobrevida de 70% do Grupo com APOE4 de 32 anos e do grupo sem
o alelo de 35 anos. Na outra interpretao teremos uma sobrevida de 84%
para os com APOE4 e de 88% para os sem. O Epi Info
.
O resultado do modelo de Cox no s fornece a curva de probabilidade
de sobrevivncia como tambm a razo de dano que interpretada da mesma
forma que o Risco Relativo e, logicamente, fornece o Intervalo de Confana
para podermos interpretar os resultados. No resultado da regresso, usando
somente o sexo como varivel, teramos:
207 EPI INFO
, arquivo Apoe.mdb.
Interpretando os dados observados veramos que a razo de dano dos
homens, em relao s mulheres, seria de 0,8445, no signifcativa, pois o
intervalo de confana varia de 0,5185 e 1,3755. A regresso de Dano de Cox
uma regresso que tem componentes paramtricos e no paramtricos. A
razo de dano um resultado paramtrico, pois estabelece um parmetro a
partir dos dados. O modelo como um todo analisado no parametricamente
pela Razo de Verossimilhana, em ingls: Likelihood Ratio. No caso, ambos
critrios no so signifcativos. Por no ser signifcativo, o modelo do Epi
Info
, arquivo Apoe.mdb.
Observamos que, comparando com a DUODCADA menor que 40
anos (DUODECADA = 20), as demais possuem razes de dano muito maiores.
209 EPI INFO
, arquivo Apoe.mdb.
Usando as curvas de Kaplan-Meier, entretanto, podemos observar, na
fgura 13.7, um comportamento mais coerente com os resultados.
210
ngelo Jos Gonalves Bs
Figura 13.7. Grfco criado pelo comando Kaplan-Meier Survival para cada valor de DUODECADA.
Fonte: Epi Info
, arquivo Apoe.mdb.
Confrmando haver algum problema na confgurao do grfco no
programa do Cox do Epi Info