Você está na página 1de 212

EPI INFO

SEM MISTRIOS:
UM MANUAL PRTICO
Chanceler
Dom Dadeus Grings
Reitor
Joaquim Clotet
Vice-Reitor
Evilzio Teixeira
Conselho Editorial
Ana Maria Mello
Armando Luiz Bortolini
Augusto Buchweitz
Beatriz Regina Dorfman
Bettina Steren dos Santos
Carlos Graef Teixeira
Clarice Beatriz de C. Sohngen
Elaine Turk Faria
rico Joo Hammes
Gilberto Keller de Andrade
Helenita Rosa Franco
Jane Rita Caetano da Silveira
Lauro Kopper Filho
Luciano Klckner
Ndio Antonio Seminotti
Nuncia Maria S. de Constantino
EDIPUCRS
Jernimo Carlos S. Braga Diretor
Jorge Campos da Costa Editor-Chefe
ngelo Jos Gonalves Bs
Instituto de Geriatria e Gerontologia
Programa de ps-graduao em Gerontologia Biomdica
Pontifcia Universidade Catlica do Rio Grande do Sul (PUCRS)
EPI INFO

SEM MISTRIOS:
UM MANUAL PRTICO
Porto Alegre
2012
EDIPUCRS, 2012
CAPA Luana Santos e Thatiana Pandolfo
REVISO DE TEXTO Caren Capaverde
EDITORAO ELETRNICA Andressa Rodrigues

B741e Bs, ngelo Jos Gonalves
Epi Info sem mistrios : um manual prtico [recurso
eletrnico] / ngelo Jos Gonalves Bs. Dados eletrnicos
Porto Alegre : EDIPUCRS, 2012.
211 p.
Sistema requerido: Adobe Acrobat Reader
Modo de acesso: http://www.pucrs.br/edipucrs/
ISBN: 978-85-397-0157-5
1. Informtica Mdica. 2. Epi Info (Programa de
Computador). I. Ttulo.
CDD 610.28
TODOS OS DIREITOS RESERVADOS. Proibida a reproduo total ou parcial, por qualquer meio ou processo, especialmente por sistemas
grficos, microflmicos, fotogrficos, reprogrficos, fonogrficos, videogrficos. Vedada a memorizao e/ou a recuperao total ou parcial,
bem como a incluso de qualquer parte desta obra em qualquer sistema de processamento de dados. Essas proibies aplicam-se tambm
s caractersticas grficas da obra e sua editorao. A violao dos direitos autorais punvel como crime (art. 184 e pargrafos, do Cdigo
Penal), com pena de priso e multa, conjuntamente com busca e apreenso e indenizaes diversas (arts. 101 a 110 da Lei 9.610, de 19.02.1998,
Lei dos Direitos Autorais).
Agradecimentos
Desde a publicao da primeira edio deste livro tenho recebido
apoio de muitos pesquisadores, muitos desses verdadeiros amigos virtuais.
No posso deixar de mencionar e agradecer o incansvel Jean Ezequiel
Limongi, do Centro de Controle de Zoonoses de Uberlndia que, desde
novembro de 2008, tem me mandado e-mails com relativa frequncia
sempre com suas dvidas intrigantes. A querida Sumire Sakabe, outra
pessoa sensacional que muito me estimulou a manter este livro atualizado.
Agradeo a todos os alunos tanto dos cursos de Epi Info

no CEARGS
quanto das disciplinas de Mtodos Quantitativos de Pesquisa e de
Demografa e Epidemiologia Gerontolgica do Programa de Gerontologia
Biomdica da PUCRS, pois foram eles que me incentivaram a reeditar
este livro. Particularmente, tenho que agradecer a Mayara Sartori, que
revisou grande parte das fguras deste livro e a Denielli da Silva Gonalves
Bs (sobrinha e parceira de muitas empreitadas) por terem me ajudado a
atualizar algumas partes do livro.
Ainda sou eternamente grato Pr-Reitoria de Extenso (PROEX) da
PUCRS, ao Centro de Estudos da AIDS do RGS (CEARGS) e faculdade de
Sade Pblica das Ilhas Fiji que acreditaram e proporcionaram condies para
a realizao das aulas que desenvolvi e que culminaram no desenvolvimento
da primeira edio deste livro. Em especial, agradeo o apoio excepcional do
professor e amigo Emlio A. Jeckel-Neto e do Monsenhor Urbano Zilles.
Pessoas especiais merecem agradecimentos especiais principalmente
por terem tido papel importante na formao deste autor. Meus pais Amaury
Lobato Bs e Aurea Gonalves Bs, ambos falecidos, mas de quem recebi muito
apoio para seguir sempre em frente na conquista do meu espao, ganhando, de
cada um, habilidades importantes que culminaram na criao deste projeto que
hora se cristaliza com a segunda edio. Ao professor Yukio Moriguchi, meu
pai da Geriatria e da pesquisa, a quem agradeo por ter me estimulado a seguir a
carreira acadmica e cientfca. Ao Dr. Newton Luiz Terra ou simplesmente Tio
Terra, uma pessoa que sempre valorizou minhas qualidades. Pessoas tambm
especiais que infelizmente fcaram de fora da primeira edio, mas que esto
sempre no meu corao: Antnio Miguel Bs, Paulo Consoni, Ayako Kamijo,
Evaldo Nascimento, Nair Mnica e os saudosos Antonio Carlos e Valdemarina.
No posso deixar de agradecer ao CDC por desenvolver esse programa
e mant-lo atualizado corrigindo constantemente os problemas detectados.
Quero fnalmente agradecer ao Programa de Gerontologia Biomdica
e Pr-reitoria de pesquisa e Ps-graduao. Tambm EDIPUCRS, de quem
recebi o apoio publicao das edies deste livro.
professora Helen Abbey (in memoriam) e ao professor Larry Brant,
cujos ensinamentos e mtodos de ensino me ajudaram a desenvolver meu
interesse pela docncia, dedico novamente este livro.
Sumrio
Prefcio da primeira edio ........................................................................... 9
Gerao e acesso ao conhecimento ................................................................ 9
Prefcio da segunda edio ...........................................................................11
Introduo .................................................................................................... 14
Captulo 1
HISTRICO E PRINCIPAIS COMPONENTES DO EPI INFO

.............. 18
Captulo 2
USANDO O EPI MAP ................................................................................ 30
Captulo 3
CRIANDO UM BANCO DE DADOS ........................................................ 46
Captulo 4
GERENCIANDO OS DADOS .................................................................... 79
Captulo 5
IMPORTANDO DADOS E MANIPULANDO VARIVEIS .................... 96
Captulo 6
ADICIONANDO DADOS EPIDEMIOLGICOS AO EPI MAP ............ 106
Captulo 7
CRIANDO GRFICOS COM O COMANDO GRAPH .......................... 122
Captulo 8
ANALISANDO DADOS, UMA INTRODUO .................................... 144
Captulo 9
CONSTRUINDO E INTERPRETANDO TABELAS ............................... 154
Captulo 10
CALCULANDO E COMPARANDO MDIAS ....................................... 163
Captulo 11
ESTUDANDO VARIVEIS NUMRICAS COM A
REGRESSO LINEAR..............................................................................174
Captulo 12
ENTENDENDO A REGRESSO LOGSTICA E AS
MEDIDAS DE RISCO ...............................................................................187
Captulo 13
USANDO CURVAS DE KAPLAN-MEIER E REGRESSO
DE DANO DE COX NA ANLISE DE SOBREVIDA ............................202
Prefcio da primeira edio
Gerao e acesso ao conhecimento
A Cincia muito mais que o simples acmulo de conhecimento,
permitir que o prprio conhecimento seja repensado e reconstrudo
constantemente. A atual perspectiva de que todo conhecimento passvel de
ser aprimorado, questionado e at mesmo substitudo fundamental para quem
quer se aventurar na rea cientfca. Nunca na histria da humanidade a Cincia
avanou de forma to rpida e abrangente quanto nos dias de hoje. Conceitos
como risco, acaso, aleatoriedade e incerteza, por exemplo, foram sendo
incorporados no linguajar das pessoas. A Estatstica uma das importantes
ferramentas necessrias para entender esses avanos, especialmente no
processo de tomada de deciso frente incerteza.
O constante avano cientfco tambm remete a uma outra importante
questo que a da necessidade de preservar o rigor metodolgico. Durante
muito tempo houve uma confuso conceitual entre rigidez e rigor metodolgico.
Neste perodo, a Cincia reconhecia apenas uma abordagem como tendo
rigor metodolgico sufciente para ser aceito como vlido. Ao longo do
sculo XX, essa perspectiva foi contestada e alterada. Mltiplas abordagens
metodolgicas foram tambm aceitas como vlidas, desde que mantido o
rigor na sua aplicao. Ao contrrio de reduzir a importncia da Estatstica,
essa fexibilizao fez com que a necessidade de familiarizao com anlises
estatsticas fosse ampliada a outros segmentos cientfcos e sociais.
Um dos limitantes da difuso da Estatstica era a difculdade de
obteno de resultados atravs de anlises muito trabalhosas e de difcil
compreenso. A associao da Estatstica com a Informtica foi extremamente
benfca nesse sentido. Os inmeros programas estatsticos vieram a facilitar
a anlise de dados. Clculos que antes demoravam at mesmo dias para serem
realizados estavam disponveis de maneira mais rpida e confvel. Algumas
difculdades, contudo, ainda permaneciam: os ambientes de informtica
nem sempre eram muito amigveis ao usurio, a montagem dos bancos de
dados eram difceis e poucos tinham os recursos fnanceiros e de informtica
necessrios para utiliz-los.
O programa Epi Info

um exemplo de como se pode progressivamente


suplantar essas difculdades. O programa foi concebido para ser utilizado por
pessoas de diferentes nacionalidades e nveis educacionais. A sua caracterstica
de maior impacto, sem dvida, foi a de ser um programa de livre distribuio. Isso
10
ngelo Jos Gonalves Bs
possibilitou que muitos usurios tivessem acesso a formas de anlise estatstica
antes apenas disponveis mediante grandes investimentos. A democratizao de
meios para permitir a gerao e a compreenso de conhecimentos fundamental
para a construo de uma sociedade humana mais justa.
Os programas de informtica disponibilizam inmeros recursos que
muitas vezes no so utilizados por que os usurios desconhecem at mesmo
a sua existncia, ou no sabem como acess-los adequadamente. Muitas vezes
so utilizados menos de 5% dos recursos oferecidos pelos sistemas.
As reaes frente a contedos ainda no conhecidos variam desde
a atrao at a averso. Os manuais disponibilizados pelos fabricantes ou
autores deveriam ser elementos facilitadores para o adequado acesso ao
sistema informatizado, porm no so lidos por muitos dos seus usurios. Sem
o uso dos manuais, o aprendizado acaba por ser feito atravs de descoberta
casual, tentativa, erro e informaes prestadas por outros usurios, que
tambm passaram por este mesmo processo. Os motivos alegados para no
ler um manual so vrios: tamanho dos manuais, ansiedade em utilizar o
sistema, falta de hbito de estudo, texto de difcil compreenso e estrutura do
material montada para quem j o conhece e no para quem o est explorando.
Em muitos casos, todas essas caractersticas esto presentes em um mesmo
manual, tornando-o acessvel apenas para os usurios que j dominam a sua
utilizao, o que um contrassenso. Um manual deveria ser um documento
altamente amigvel, isto , deveria ser escrito de forma a possibilitar que o
leitor se sentisse simultaneamente atrado e vontade em explorar o sistema.
Deve permitir que um iniciante se sinta tranquilo para avanar, para testar, para
se apropriar do uso adequado do sistema que est buscando se familiarizar.
Por outro lado, deve permitir que um usurio j mais qualifcado tambm se
sinta contemplado com suas explicaes e orientaes. O manual, como o
seu nome mesmo diz, algo para se ter mo, um volume de consulta e
orientao, um recurso para aprender e para sanar dvidas.
No presente volume, o Professor ngelo Bs conseguiu consolidar
a sua experincia de usurio do Epi Info

, como pesquisador e professor,


em um volume acessvel. Este um manual elaborado justamente com essas
caractersticas, permitindo que os surpreendentes recursos disponveis no
programa Epi Info

sejam adequadamente compreendidos e utilizados.


Porto Alegre, abril de 2004.
Professor Jos Roberto Goldim, PhD.
Prefcio da segunda edio
Qual o n da amostra? Esta uma das primeiras perguntas que
fazem tanto os que entendem de estatstica quanto aqueles que querem que os
outros pensem que eles entendem de estatstica.
As outras perguntas a serem feitas, somente as fazem aqueles que, de
fato, entendem de estatstica. So aquelas relacionadas coleta dos dados,
constituio do banco de dados e, fundamental, escolha dos testes estatsticos
adequados pesquisa proposta e interpretao dos resultados obtidos por
meio dos testes utilizados.
Atualmente, existe um grande nmero de softwares que facilitam
enormemente o trabalho de montagem de bancos de dados e a aplicao das
muitas vezes extensas e complexas frmulas matemticas utilizadas nos
testes estatsticos. Se, por um lado, essas ferramentas tornam o trabalho mais
fcil para o pesquisador, tambm trazem embutido um risco muito grande, que
o de se obter com rapidez um resultado completamente errado ou inadequado.
A facilidade em usar tambm traz consigo a facilidade de errar. Por isso,
essencial que um pesquisador tenha uma slida formao em estatstica se
pretende usar essa poderosa ferramenta nas suas investigaes cientfcas.
Na rea das Cincias da Sade, pode-se dizer que o pioneirismo
na utilizao de dados quantitativos e a sua anlise para fundamentar uma
argumentao se deve a Florence Nightingale, a enfermeira britnica que, ao
publicar o seu livro Notes on Nursing, em 1860, revolucionou a maneira de
cuidar de pacientes hospitalizados. Durante a Guerra da Crimia, iniciada em
1854, com a declarao de guerra entre, de um lado, a Rssia e, de outro,
Inglaterra, Frana e Turquia, o exrcito britnico foi duramente criticado por
uma srie de erros militares e pelas suas pssimas instalaes hospitalares.
Florence foi enviada para l para introduzir e supervisionar o servio de
enfermagem nos hospitais de campanha.
Alm do fato de ser mulher num ambiente militar em plena poca
Vitoriana, Florence se deparou com resistncias e crticas de toda ordem ao
tentar reformular o sistema hospitalar vigente. Os soldados eram, muitas vezes,
deitados diretamente no cho sujo e rodeados de insetos e ratos. As cirurgias
eram realizadas em condies sem um mnimo de higiene e o ps-operatrio era
um martrio que desrespeitava a condio humana. Alm das mortes nos campos
de batalha, muitos soldados morriam porque eram levados aos hospitais. Porm,
no morriam por causa dos ferimentos da luta, mas de clera e tifo.
12
ngelo Jos Gonalves Bs
Ao deparar-se com essa realidade, Florence iniciou sua rdua tarefa de
tentar mudar os hbitos e a cultura arraigados num sistema que se caracterizava
pelo descuido no tratamento das pessoas e, principalmente, pela mortalidade
de muitos que tinham problemas de sade simples e que perdiam sua vida
por causa do prprio sistema hospitalar. A maneira que Florence escolheu
para convencer os responsveis pelo sistema hospitalar e seus superiores
hierrquicos foi a demonstrao lgica a partir de dados, nmeros, tabelas e
grfcos. O que para ns, hoje, parece bvio, naquele momento provocou tal
repercusso que convenceu a todos da necessidade de mudanas drsticas.
Da mesma maneira, foi possvel demonstrar o resultado que tais mudanas
promoveram posteriormente nas condies de sade das tropas e dos hospitais.
Ao utilizar os dados coletados criteriosamente nos hospitais de
campanha desde o momento da sua chegada zona de combate, organiz-los
em bancos de dados apropriados e realizar clculos de ndices de mortalidade,
Florence demonstrou que suas aes eram efcazes. O simples fato de
estabelecer um suprimento de gua fresca, preparar refeies que incluam
frutas e vegetais e substituir alguns equipamentos hospitalares fez com que as
taxas de mortalidade se alterassem signifcativamente. Em alguns meses, a taxa
que era de 60% quando Florence e sua equipe chegaram ao front baixou para
42,7% no vero de 1855. Na primavera do mesmo ano, a taxa de mortalidade
nos hospitais de campanha britnicos estava em 2,2%!
Essa maneira de apresentar e defender sua argumentao e os resultados
obtidos no foi um processo intuitivo. Nightingale tinha uma slida formao
em Matemtica, era extremamente cuidadosa com seus registros e rigorosa no
tratamento dos dados e nos clculos que fazia.
Ao retornar para Londres, continuou aplicando e refnando as suas
metodologias de coleta e anlise de dados em todos os hospitais militares.
Assim, demonstrou que a taxa de mortalidade de soldados na faixa etria
entre 20 e 35 anos de idade em tempo de paz era o dobro da dos civis por
causa das condies sanitrias dos hospitais militares. A divulgao do caso
provocou uma investigao formal, fazendo com que a Rainha Vitria e o
primeiro-ministro Lord Palmerston estabelecessem a Comisso Real sobre a
Sade nas Foras Armadas.
As contribuies de Florence Nightingale para a estatstica
hospitalar e as repercusses que tiveram nos sistemas de sade fzeram com
ela se tornasse a primeira mulher eleita como membro da Real Sociedade
de Estatstica do Reino Unido.
13 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


A histria de Florence Nightingale nos leva a imaginar: e se ela tivesse
sua disposio um computador com o software Epi Info instalado? Inicialmente,
podemos pensar que ela fcaria extremamente feliz e entusiasmada com o poder e
efcincia da ferramenta que estaria sua disposio. Mas, inteligente como era,
se daria conta de imediato que necessitaria aprender como utilizar o programa
para tirar dele resultados confveis e informaes consistentes. Ela iria precisar
de um manual como este Epi Info sem mistrios: um manual prtico, escrito
brilhantemente pelo professor ngelo Bs e que hoje temos em mos.
Escrito para quem est pretendendo usar o Epi Info

, para quem j
usa e para quem esqueceu como se faz aquele teste especifcamente, esta
obra no por acaso est em sua segunda edio. Com sua estrutura passo
a passo apresentada de maneira objetiva e simplifcada, tem por trs a longa
experincia e extenso conhecimento do professor Bs no tratamento de dados
quantitativos e do seu ensino na rea das Cincias da Sade.
O usurio deste manual ter uma excelente ajuda para obter o mximo
possvel dos recursos que o Epi Info

coloca sua disposio. Mas, como o


exemplo de Florence Nightingale nos mostra, preciso ter conhecimentos slidos,
perspiccia e preocupao com as pessoas e no somente com os nmeros para
que o trabalho da investigao cientfca tenha relevncia para a sociedade.
Porto Alegre, abril de 2010.
Emilio A. Jeckel Neto
Professor titular da Faculdade de Biocincias PUCRS.
Introduo
Epi Info

um pacote que contm uma srie de programas


desenvolvidos para o Microsoft Windows. Os programas foram criados
pelo Centro para o Controle e Preveno de Doenas (CDC), do governo
americano, e so destinados ao uso por profssionais de sade que conduzem
investigaes de epidemias, administrao de bancos de dados para vigilncia
de sade pblica e outras tarefas, alm de ser um banco de dados para uso geral
e aplicaes estatsticas. Com Epi Info

, alunos e profssionais de sade, bem


como outros trabalhadores podem desenvolver um questionrio rapidamente
ou podem personalizar o processo de entrada de dados e gerenciar a entrada e
a anlise de um banco de dados.
So produzidas anlises estatsticas, grfcos e tabelas com comandos
simples como READ, FREQ, LIST, TABLES e GRAPH. Um componente
chamado Epi Map exibe mapas geogrfcos com dados do Epi Info

ou de
outro banco de dados.
Por ser desenvolvido pelo Governo Americano, o Epi Info

um
programa de domnio pblico, ou seja, pode ser baixado a partir da Internet
gratuitamente. Cpias de CD-ROM e manuais impressos, assim como a
traduo do programa, podem ser disponibilizados por vendedores privados.
As principais vantagens que o Epi Info

oferece frente a outros programas


que ele um programa, alm de gratuito, completo, pois proporciona a criao
de um formulrio de entrada de dados, um programa de introduo de dados e
um programa que no s analisa, mas, tambm, cria grfcos e relatrios. Muitos
pesquisadores j esto acostumados a criar o banco de dados em um programa,
criando uma planilha de dados, depois utilizar outro programa para a anlise de
dados e, fnalmente, um programa grfco para gerar grfcos e tabelas. O leitor
ter a oportunidade, neste manual, de observar e se familiarizar com as inmeras
aplicaes que o Epi Info

proporciona.
O presente livro nasceu a partir de aulas desenvolvidas pelo autor nos
cursos: Introduo ao uso do Epi Info

2002, Anlise de dados com o Epi


Info

2002 e Curso internacional de introduo e anlise de dados com o


Epi Info

2002 promovidos pelo Programa de Gerontologia Biomdica e


Pr-reitoria de Extenso da Pontifcia Universidade Catlica do Rio Grande
do Sul, tambm nos cursos lecionados pelo autor e promovidos pelo Centro
de Estudos sobre AIDS do Rio Grande do Sul (CEARGS) e pela School of
Public Health das ilhas Fiji, Pacfco Sul. O livro, assim, assume no somente
15 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


as caractersticas de um manual, mas tambm de um curso terico-prtico
com exerccios a serem desenvolvidos durante o decorrer dos captulos.
Recomenda-se ao leitor, na sua primeira utilizao, seguir a leitura desde o
primeiro captulo, executando os exerccios de todos os captulos. Os arquivos
utilizados durante a execuo dos exerccios propostos podem ser obtidos nas
pastas Dados e Exerccios da pgina www.pucrs.br\igg\epiinfo. Aconselha-se a
cpia dos mesmos no computador do leitor, em uma pasta (folder) prpria (ex.:
EpiAula). Entretanto, o livro pode ser utilizado, tambm, como um manual,
pois destaca os comandos e suas opes facilitando ao leitor localiz-los. O
ndice remissivo ajudar o leitor a encontrar as informaes que necessita para
determinado comando. No decorrer dos captulos, o leitor ter a oportunidade
de se familiarizar com outros sites como o do IBGE (Instituto Brasileiro de
Geografa e Estatstica) e do DATASUS (Banco de Dados do Sistema nico
de Sade do Ministrio da Sade Brasileiro), onde conseguir algumas
informaes e arquivos necessrios execuo de exerccios propostos e
quem sabe at utilizar esses dados em sua prpria pesquisa.
Alguns pesquisadores, assim como alguns alunos do autor, podem ter
tido a oportunidade de utilizar a verso at ento mais popular do Epi Info

,
a verso 6.0 para DOS. No decorrer dos captulos, eles vo observar diversas
semelhanas da verso atual com a antiga e tero certa facilidade em utilizar
alguns dos comandos desta verso. O autor preocupou-se em utilizar algumas
das caractersticas em comum a ambas verses para facilitar a adaptao dos
usurios do sistema anterior.
O livro segue, em parte, o roteiro das aulas desenvolvidas. Em alguns
captulos necessria a conexo com a Internet. Inicialmente, expe-se um
pouco da histria do programa familiarizando o leitor a algumas expresses
e peculiaridades do Epi Info

. Imediatamente, o mesmo passa a familiarizar-


se com o site do Epi Info

, onde poder, no somente baixar o programa de


instalao, mas tambm observar a existncia de novas verses. Ainda neste
captulo, observam-se os passos necessrios instalao do programa, bem
como onde procurar sua traduo para o portugus, alm de apresentar o menu
principal do Epi Info

e seus diversos componentes. Como o desenvolvimento


da verso em portugus muitas vezes no acompanha a atualizao do
Programa Epi Info

, no livro utilizada a verso em ingls. Na experincia


do autor, quando o usurio est familiarizado com a verso em ingls poder
utilizar a verso em portugus sem problema. Entretanto, caso o mesmo,
inicialmente, familiarizar-se com a verso em portugus e passar a no poder
16
ngelo Jos Gonalves Bs
mais utiliz-la, porque o programa foi atualizado, por exemplo, esse ter
muitas difculdades em utilizar a verso original em ingls. Nos captulos,
cada comando descrito em sua verso original em ingls com a verso (caso
existente) em portugus entre parnteses. Os comandos e funes originais
esto sempre digitados em itlico para facilitar o entendimento.
No segundo captulo introduzido o uso do Epi Map, um programa
desenvolvido para gerar mapas de distribuio epidemiolgica. Um exerccio
prtico sobre como criar um mapa de distribuio da populao brasileira ser
executado. Aps esse exerccio, visita-se o site do IBGE, onde se conseguem
mapas mais detalhados do que o disponvel no site do Epi Info

sobre as
Unidades da Federao do Brasil.
O terceiro captulo exemplifca como se cria um banco de dados,
seus passos e as principais opes que o Epi Info

disponibiliza para facilitar


o trabalho de digitao dos dados, que assunto tambm abordado neste
captulo. Descrevem-se detalhadamente os diferentes tipos de variveis
utilizados pelo Epi Info

, bem como as caractersticas de cada um deles.


Tambm so abordados alguns instrumentos de controle de introduo de
dados, agrupamento de variveis, criao automtica de variveis e criao de
banco de dados acessrio. Cuidados na digitao dos dados e caractersticas
do programa de introduo dos dados so particularizados durante a execuo
do exerccio proposto.
No quarto captulo, o leitor tem o primeiro contato com o programa
mais importante do Epi Info

: o programa anlise de dados. Este captulo


aborda noes de gerenciamento de dados: abrir um banco de dados, observar
e editar valores, juntar dois bancos de dados diferentes, criar novas variveis
e, fnalmente, salvar o banco de dados editado. tambm utilizado o programa
editor do Epi Info

, que facilita a execuo de comandos semelhantes, alm de


ser muito semelhante ao encontrado na verso 6.0 do Epi Info

.
O quinto captulo elucida como se importa um banco de dados criado
por outro programa ou pela verso DOS do Epi Info

. Observa-se a utilidade
do comando IF (Se), como se salva e executa um programa de comandos,
como se cria um questionrio (fcha) a partir de um banco de dados e como se
observa a frequncia de determinadas variveis. Finalmente, o leitor observar
como se compacta o arquivo do Epi Info

.
No captulo sexto, observa-se como obter dados epidemiolgicos para
a criao de mapas. So importados dados de mortalidade e da populao
brasileira visitando o site do DATASUS. Para tanto so abordadas noes
17 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


de utilizao do programa Excel do Microsoft, confgurando os bancos de
dados importados do site brasileiro para a posterior importao e utilizao
pelo Epi Info

. O captulo tambm aborda como juntar dois arquivos que


tm contedos (variveis) diferentes. Finalizando o captulo, observa-se
como se pode calcular a taxa de mortalidade com o Epi Info

e como esses
dados so transferidos para um mapa.
O captulo stimo versa sobre o comando de criao de grfcos.
Os diferentes tipos de grfcos disponibilizados pelo Epi Info

sero
minuciosamente descritos, abordando, principalmente, a sua utilidade com
exemplos prticos.
Noes de anlise de dados so introduzidas no captulo 8. O captulo
revisa conceitos bsicos, como tipos de variveis, importncia da anlise
descritiva, hiptese nula, hiptese alternativa e os tipos de erros relacionados
s hipteses. Neste contexto, o programa StatCalc, do Epi Info

, utilizado
para calcular o tamanho amostral de uma pesquisa.
No captulo nono, abordada a noo de anlise de dados categricos, com
teste do Qui-quadrado, utilizando inicialmente o programa Tables do StatCalc. Na
continuao, a construo de tabelas, a partir de um banco de dados, tambm
explicada, utilizando o programa Analysis do Epi Info

, junto com noes de


interpretao da distribuio dos valores nas tabelas, bem como a interpretao da
signifcncia do Qui-quadrado na rejeio da sua hiptese nula.
O clculo de mdias usando o Epi Info

, com sua interpretao e anlise,


o assunto do captulo dcimo. Tanto o teste t de Student quanto a Anlise de
Varincia so frutos de reviso terica e suas aplicabilidades so discutidas.
Regresso linear, suas bases tericas e sua utilizao, bem como sua
expresso grfca, o assunto do captulo dcimo primeiro do livro que
seguido da Regresso Logstica no captulo dcimo segundo, onde so revistas
noes de anlise de medidas de risco utilizando tambm o programa Tables
do StatCalc. O ltimo captulo do livro trata das bases tericas da anlise de
sobrevida e a utilizao de dois instrumentos de anlise do Epi Info

: Curvas
de Kaplan Meier e da Regresso de Dano de Cox.
Captulo 1
HISTRICO E PRINCIPAIS COMPONENTES
DO EPI INFO

Breve Histrico do Epi Info

At metade dos anos 70, os programas de computao eram infexveis:


tanto os comandos e clculos estatsticos quanto os dados a serem analisados
eram colocados no computador manualmente. Esse processo exigia a
participao de um programador de computador que, muitas vezes, no estava
presente ou disponvel. A ideia de se tornar os programas de computao,
usados em sade pblica, mais fexveis, possibilitando que epidemiologistas
utilizassem os programas sem a necessidade de um programador, surgiu
em 1976. Nesse ano, um auditrio do CDC, convertido em quartel-general
para a crise da Gripe Suna de 1976, estava cheio de epidemiologistas e
um Equipamento Digital PDP 11, um minicomputador do tamanho de um
refrigerador. Naquele momento, um programa chamado SOCRATES, escrito
em linguagem FORTRAN pelo programador Rick Curtis, possibilitou aos
epidemiologistas defnirem questes, entrada de dados e produzir resultados
em formato tabular (tabelas) sem a presena de um programador.
A primeira verso do Epi Info

foi lanada somente em setembro


de 1985. Era chamado de Sistema de Anlise Epidemiolgica, conforme
a fgura 1.1.
Figura 1.1. Tela principal da primeira verso do Epi Info

.
Fonte: site do Epi Info

: www.cdc.gov/epiInfo/epiinfo1.htm, ltimo acesso em 20/02/2010.




19 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


O programa era basicamente composto de trs comandos digitados
diretamente no monitor e foi criado em linguagem DOS. A primeira verso
possibilitava somente a introduo e edio dos dados (programa EnterInfo),
criao de regras de converso de dados (programa Convert) e construo de
tabelas de convergncia (Crosstab). A primeira verso do Epi Info

produzia
tabelas simples de contingncia sem nenhuma estatstica, conforme a fgura
1.2. Cinco meses aps o lanamento do programa, um Manual de 27 pginas
foi criado e o nome do programa EnterInfo foi chamado de Epi Info

.
Figura 1.2. Exemplo de tabela produzida pela primeira verso do Epi Info

.
Fonte: site do Epi Info

: www.cdc.gov/epiinfo/epiinfo1.htm, ltimo acesso em 20/02/2010.


Em 1987, foi lanado o Epi Info

, verso 2, escrito em linguagem


Turbo Pascal, que tinha um manual de 112 pginas, um menu de navegao
com o cursor, o EPED, processador de textos para a criao de questionrios;
ENTER, ANALYSIS, um calculador epidemiolgico chamado STATCALC,
EPICURVE para a criao de histogramas, um programa para juntar bancos
de dados e programas IMPORT e CONVERT para a converso de arquivos. O
comando TABLES comea a oferecer resultados estatsticos.
Figura 1.3. Exemplo de tabela produzida pelo Epi Info

, verso 2.
Fonte: site do Epi Info

: www.cdc.gov/epiinfo/epiinfo23.htm, ltimo acesso em 20/02/2010.


20
ngelo Jos Gonalves Bs
A partir da verso 4 do Epi Info

, a Organizao Mundial da Sade


(OMS) iniciou a colaborar com o CDC na elaborao e distribuio do programa,
tornando-o internacionalmente conhecido. A verso mais popular foi o Epi Info


6.0 (fgura 1.4), lanado em 1992 e que continua sendo utilizado at hoje. At
1997, haviam sido realizadas 145 mil cpias das verses DOS do Epi Info

em 117
pases. O manual e programa da verso DOS foram traduzidos para 13 idiomas.
Figura 1.4. Tela principal do Epi Info

, verso 6.
Fonte: site do Epi Info

: www.cdc.gov/epiinfo/epiinfo6.htm, ltimo acesso em 20/02/2010.


Em 1994, foi criada uma pgina na Internet, possibilitando o download
do programa gratuitamente e o acesso a verses mais atualizadas do Epi Info

.
Uma reviso interna das visitas ao servidor do Epi Info

site observou que, em


2001, foram documentados mais de 250 mil downloads. A verso 2000, lanada
em 2001, transporta o Epi Info

para a tecnologia Windows, utilizando o formato


do programa de gerenciamento de dados Microsoft Access. No fnal de 2002, uma
nova verso do Epi Info

para Windows foi lanada. A popularidade do Epi Info


tem crescido muito com essas novas verses, o site menciona mais de 1 milho
de cpias baixadas. Lembramos que, como os programas de instalao podem ser
copiados livremente, muito mais computadores devem ter o Epi Info

instalado.
Novas verses tm sido lanadas com frequncia. Para buscar atualizaes,
recomendvel ao usurio do Epi Info

visitar o site do programa. Atualizaes


deste livro tambm so disponveis no site www.pucrs.br/igg/epiinfo.
Sobre o Epi Info

O Epi Info

escrito em programao Visual Basic e usa o formato


de arquivo Microsoft Access (.mdb) como uma forma de padronizar o banco
de dados tornando-o acessvel para outros programas. Embora os dados do
Epi Info

sejam armazenados em formato .mdb, outros formatos de arquivos


podem ser lidos, analisados, importados ou exportados pelo programa.
21 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


O Epi Info

inclui um programa que usa o Sistema de Informao


Geogrfca (GIS), chamado Epi Map, executado por meio de um programa
atualmente denominado Criar Mapas (Create Maps). Esse sistema foi
construdo a partir do programa MapObjects da empresa Environmental
Systems Research (ESRI), produtores tambm do ArcView. Epi Map
compatvel com dados de GIS de numerosos locais de Internet nos populares
formatos ESRI. Veremos no captulo seguinte como conseguir mapas
brasileiros no site do IBGE.
A verso para Windows do Epi Info

mantm muitas caractersticas do


conhecido Epi Info

para DOS, enquanto oferece as vantagens do ambiente


Windows, como a facilidade de uso, grfcos, fontes e impresso indolor.
Os programas, documentao e materiais pedaggicos esto no domnio
pblico (embora Epi Info seja marca registrada de CDC), e pode ser copiado
livremente, distribudo ou traduzido.
Como conseguir o Epi Info

Existem basicamente duas maneiras de se conseguir a verso mais


atual do programa do Epi Info

.
1. Download a partir do Website do CDC:
O CDC mantm sempre a verso mais atual do programa. Para baixar
o programa e instal-lo devemos seguir os seguintes passos:
a. Ao visitar o site www.cdc.gov/epiinfo vo surgir duas opes:
Web Install, que teoricamente instala o programa diretamente
do website sem salvar os arquivos de instalao no computador
(esta opo salva espao), e Download Setup.exe, que baixa
o programa completo de instalao. Na prtica, ambos os
comandos salvam o programa no computador, necessitando
pelo menos 70 megabites de espao no computador.
b. Recomendamos selecionar a opo Download Setup.exe,
pois assim possvel salvar o programa em um local conhecido
e reinstalar o programa se necessrio ou at mesmo salvar em
um CD-ROM para ser ofertado a outras pessoas. O tempo de
instalao praticamente o mesmo, visto que o Web Install
literalmente baixa o programa no computador do usurio em
uma pasta temporria.
22
ngelo Jos Gonalves Bs
c. Uma nova janela vai aparecer, ento escolha salvar em disco
e clica OK;
Figura 1.5. Janela padro de salvamento de arquivo em ambiente Windows destacando a opo de criao
de nova pasta. Fonte: Windows XP.
d. A nova janela vai aparecer (fgura 1.5), oferecendo opes de
salvamento. aconselhvel ter um diretrio (folder ou pasta)
para armazenar os arquivos que so baixados da Internet. Para
criar um novo Folder, clicamos no cone que est circulado
na fgura. Isso cria uma nova pasta, que automaticamente
se chama Nova pasta ou New folder. Podemos mudar
o nome do novo Folder para, por exemplo, Baixados,
sem precisarmos clicar em lugar nenhum. Aps trocarmos
de nome, apertamos o ENTER () duas vezes. Depois, basta
clicar em salvar ou save. Na opo WebInstall, um
arquivo provisrio tambm salvo no computador. Nesse
caso, as orientaes so muito parecidas.
23 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


e. Aps salvar o arquivo, deve-se procurar novamente o novo
folder no Meu Computador. O arquivo baixado na realidade
um arquivo que junta vrios arquivos comprimidos. Ao clicar
duas vezes no arquivo far com que o arquivo se descomprima
temporariamente. Aguarde um pouco at aparecer uma tela
escrita Epi Info

e uma janela com o escrito Next. Clicar


Next quatro vezes. E a instalao fcar completa. Observe que
o programa instalado num novo diretrio chamado Epi_Info.
2. Atravs do site www.pucrs.br\igg\epiinfo, no diretrio
Programas: Basta clicar no arquivo EpiInfosetup.exe quatro
vezes.
Como instalar a verso (traduo) em portugus
Para instalar a verso em portugus, temos duas maneiras:
1. Conseguindo a verso em portugus para o Epi Info

,
atravs do site: http://www.pucrs.br\igg\epiinfo pasta Programas.
Clicando esquerda do mouse no link Tradutor para Portugus,
selecione Save link as (Salvar destino como...). Assim, ir abrir uma janela
com as opes de download. Na janela, aconselhamos escolher a opo salvar
o arquivo em disco. Devemos salvar no mesmo lugar onde salvamos o arquivo
de instalao. Devemos abrir o arquivo com o winzip. Se o seu computador no
tiver o winzip e no conseguir abrir o arquivo, voc poder baixar o programa
no site (www.winzip.com). Neste caso, a janela do Winzip mostrar somente
um arquivo: Portugus.exe. Devemos clicar no cone Extract ( ). Na nova
janela (fgura 1.6), na esquerda em cima, existe uma opo Extract to e
uma janela pequena. Nessa janela devemos colocar o folder TRANSEXE do
Epi_Info (diretrio onde o Epi Info

foi instalado) conforme a fgura a seguir:


24
ngelo Jos Gonalves Bs
Figura 1.6. Tela de extrao de arquivos compactados.
Fonte: Winzip.
Feito isso, podemos clicar Extract que est na janela direita. A
traduo ainda no est instalada.
2. Atravs de um disquete (ou CD) de instalao: copiar o
arquivo Portugus.exe para o diretrio C:\Epi_Info\TRANSEXE.
Devemos, agora, iniciar o Epi Info

, fechando as janelas e clicando


no cone do Epi Info

( ) na tela principal do computador. Com o Epi


Info

aberto, vemos que h um menu superior. Nesse menu, escolhemos


a opo Settings e depois Install Language. Na janela escolhemos
Port e depois clicamos em Install. Surgir uma mensagem dizendo
que uma nova janela aparecer e que essa janela poder no fechar
automaticamente. Clicando OK, observamos uma janela preta do Prompt
DOS extraindo dois arquivos. Se na barra superior aparecer a palavra
fnished e a janela continuar aberta, fechar essa janela clicando no X
do canto superior direito dela. Finalmente pode-se sair do programa de
instalao de linguagem e escolher a linguagem Portugus, no mesmo menu
Settings, agora Choose Language escolher Port e OK. Observa-se
que, na tela, esquerda, em cima, logo abaixo do menu Programs aparece
os dizeres Language=Portugus.
25 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Problemas com o uso da traduo para o Portugus
Algumas vezes, o Epi Info

des-seleciona a linguagem
automaticamente. Se isso acontecer, basta escolher a linguagem novamente.
A linguagem no necessita ser instalada outra vez. Infelizmente, nem todos
os comandos foram traduzidos e, s vezes, encontramos difculdades em
usar a linguagem em portugus, pois ela interfere em alguns comandos,
principalmente o comando Criar Ficha (Make View). Em algumas verses
do Windows, como o Windows 2000, a traduo no funciona. Alm disso,
como o Epi Info

est sempre sendo atualizado, novas verses podem


no ser compatveis com a linguagem. Por essa razo, recomendamos
a no utilizao dessa linguagem, ou desistir dela quando comear a
dar problema. Em funo desses problemas, neste manual utilizada a
verso em ingls.
Componentes de Epi Info

O Epi Info

tem vrios componentes; podemos dividi-los em


componentes de tela e componentes de menu, de acordo com a sua disposio
(fgura 1.7).
Figura 1.7. Tela principal do Epi Info

, verso 3.5.1.
Fonte: Epi Info

.
26
ngelo Jos Gonalves Bs
1. Componentes de tela: so componentes que aparecem
imediatamente quando se executa o Epi Info

, eles aparecem
tambm no Menu Programas.
Verso em ingls Verso em portugus
Make View Criar Ficha
Enter Data Entrar Dados
Analyze Data Analisar Dados
Create Reports Criao de Relatrio
Create Maps Criar Mapas (Epi Map)
2. Componentes de menu: so componentes que esto
localizados na barra de menu da janela do Epi Info

. Esses
componentes possuem funes de confgurao (troca ou
instalao de linguagem e escolha da verso do Banco de
Dados), programas, j vistos anteriormente, edio da imagem
do Epi Info

, e utilitrios onde temos o tradicional Statcalc, cuja


utilidade ser observada nos captulos oitavo, nono e dcimo
primeiro. No menu Ajuda (Help) tambm h dois programas de
treinamento: o programa Tutorial e exerccios.
Menu Edit (Editar)
O menu Edit possui basicamente comandos que permitem personalizar
a tela do Epi Info

. So quatro comandos:
1. Picture (tela): altera o fundo da tela do Epi Info

.
Clicando nesse comando, o programa nos direciona a escolher
outro arquivo tipo fgura ou grfco para substituir. Podemos
escolher outras fguras existentes no prprio diretrio do Epi
Info

ou em outro diretrio qualquer como, por exemplo, no


folder imagens dos meus documentos.
2. Edit this menu: abre uma tela de edio do arquivo
EpiInfo.MNU que, em linguagem Visual Basic, nos permite
alterar todos os comandos e arquivos gerenciados pelo Epi
Info

. recomendvel no alterar esse arquivo, principalmente


27 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


se no entendermos como ele escrito. interessante ter uma
cpia em algum lugar seguro. Para tanto basta clicar no menu
Arquivo e selecionar Save as (Salvar como).
3. Bottons on or off: somente esconde ou mostra os
botes dos programas de tela.
4. Move/Resize button <Shift F2>: Permite que alteremos
o tamanho e posio dos botes dos programas de tela. Isso pode
ser til quando queremos destacar um programa a ser utilizado
mais constantemente. til principalmente para pessoas que tm
medo de computador e no conseguem enxergar o programa
que queremos que ela use. Podemos, com esse comando, tambm
apagar algum dos programas, o que muito perigoso, pois difcil
recuperarmos um boto apagado. Esse comando, na realidade, faz
uma edio do arquivo EpiInfo.MNU.
Menu Settings (Confguraes)
Alm de instalar e modifcar a linguagem, o menu Settings proporciona
outras confguraes que podem ser teis:
1. Choose Epi Info

Database Version: possibilita


trabalharmos com uma verso de arquivo MS ACCESS 97 ou
2000. Isso importante se quisermos editar o arquivo do banco de
dados do Epi Info

usando esse programa, o que, na experincia


do autor, desaconselhvel, mas algumas vezes necessria. Por
defnio, o Epi Info usa o formato MS ACCESS 2000.
2. Set Working Directory: automaticamente o Epi
Info

determina que o diretrio de trabalho seja o Epi_Info.


interessante modifc-lo, mas existem outras maneiras de
trabalhar com outros diretrios, como veremos mais adiante
neste livro.
3. Set INIFile Directory: modifca o local do EpiInfo.
INI, programa que estabelece algumas instrues iniciais ao
Windows. Modifcar esse arquivo s aconselhvel para pessoas
que tenham experincia com essa linguagem.
28
ngelo Jos Gonalves Bs
Menu Utilities (Utilidades)
1. StatCalc: Programa escrito em 1993 que faz alguns
clculos estatsticos interativamente; veremos a maioria deles
nos captulos seguintes.
2. Datacompare: compara dois bancos de dados e
descreve as diferenas. Isso vale tanto em questo de dados
diferentes quanto na inexistncia de alguns dados. Esse
programa particularmente importante quando usamos o
artifcio da dupla digitao dos dados para minimizar o erro na
introduo dos dados.
3. Table-to-View: cria uma fcha (View) para uma tabela
(banco de dados) j existente; veremos mais adiante sua utilidade.
4. Visualize Data: Compacta e corrige o arquivo do
banco de dados, propicia apagar subarquivos temporrios. A
compactao no interfere na utilizao do arquivo tornando-o
sim mais leve. s vezes temos que utilizar essa ferramenta
quando criamos muitas variveis novas. Veremos, mais adiante,
no captulo quinto, sua utilidade e execuo.
5. EpiLock: Programa que serve para codifcar ou
comprimir um arquivo. Codifcao importante para salvarmos o
arquivo de espies, e a compresso serve para diminuir o tamanho
do arquivo para transporte, distribuio ou armazenamento.
6. Compact: Compacta o banco de dados, o mesmo
programa que est contido no Visualize Data.
7. Word Processor: Chama-se o processador de texto (na
maioria das vezes, o WordPad).
29 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Salve o arquivo EpiInfo.MNU no diretrio Epi_Info/Backup.
2. Modifque a tela da apresentao do Epi Info

.
3. Altere as posies dos botes da tela.
4. Modifque a linguagem para ingls.
5. Restaure o Menu do Epi Info

, copiando novamente o arquivo


EpiInfo.MNU salvo no diretrio Backup para o diretrio
principal do Epi Info

(opcional).
Captulo 2
USANDO O EPI MAP
O Epi Map um programa que permite construir uma variedade de
mapas com dados de distribuio geogrfca e que oferece um grau alto de
compatibilidade com o programa ArcView do Instituto de Pesquisa de Sistemas
Ambiental, Inc. (ESRI).
Baixando mapas para o Epi Map no site do Epi Info

Vrios mapas so distribudos gratuitamente no site do Epi Info

(www.
cdc.gov/EpiInfo), junto com link para vrias informaes epidemiolgicas
tanto dos Estados Unidos quanto de outros pases. Assim, h no site do Epi
Info

um link chamado Maps direita da tela na seo de download. Esse link


nos leva para o que o site chama de Resources for Creating Public Health
Maps. Nessa pgina encontram-se, ento, os links que mencionamos. O link
que nos interessa agora o primeiro: Download free shapefles for Epi Info

.
Como o nome diz, gratuito e nos permite baixar os arquivos de formato dos
mapas. Clicando na primeira palavra, o site nos direciona a uma pgina onde
esto todos os continentes. Clicando no continente Amrica do Sul teremos
o nosso Brasil. Observamos que o programa solicita um local para salvar.
Podemos salvar o arquivo em um diretrio novo no c:Epi_Info, chamado,
por exemplo, Mapas. O arquivo a ser salvo chama-se de BR.exe. Esse um
arquivo tipo Zip que contm cinco arquivos compactados, que podem ser
extrados mesmo sem o programa Winzip.
Uma cpia desse arquivo, junto com todos os outros mapas do site do
Epi Info

, pode ser encontrada tambm no site www.pucrs.br\igg\epiinfo no


diretrio Programas/Maps/South America.
Descompactando o BR.EXE
Para descompactar os arquivos do mapa do Brasil, localizaremos o
arquivo BR.exe no diretrio c:/Epi_Info/Mapas, usando ou o Meu computador
ou o Windows Explorer. Clicando duas vezes no arquivo aparecer uma
mensagem avisando da descompresso dos arquivos. Ao clicar OK, aparece
uma nova janela, conforme a fgura 2.1, informando o local onde sero
descompactados os arquivos. Automaticamente, o Epi Info

posiciona um
31 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


diretrio inexistente (Epi2000).
Figura 2.1. Tela de autoextrao de arquivos.
Fonte: Winzip self-extractor.
No nos interessa criar um novo diretrio com esse nome, pois ir nos
atrapalhar no futuro. aconselhvel mudar o destino para c:/Epi_Info/Mapas,
pois queremos deixar os mapas organizados. Uma nova mensagem informa a
descompresso bem-sucedida dos arquivos. Veremos, a seguir, o contedo do
arquivo descomprimido.
Utilizando o programa Create Map (Criar mapa)
Como vimos, o Epi Map um programa que permite construir uma
variedade de mapas com dados de distribuio geogrfca. Vimos tambm que
o Epi Map oferece um alto grau de compatibilidade com o programa ArcView
do Instituto de Pesquisa de Sistemas Ambiental, Inc. (ESRI). Na tela principal
do Epi Info

, clicamos no programa Create Map. A tela que aparece (fgura


2.2) muito estimulante, pois aparece uma foto area de algum local. Mas os
mapas no so assim to reais.
32
ngelo Jos Gonalves Bs
Figura 2.2. Tela inicial do Epi Map, destacando o cone do Map Manager.
Fonte: Epi Map.
Os arquivos dos mapas distribudos pelo site do Epi Info

contm, na
realidade, cinco diferentes arquivos compactados, um desses arquivos tem a
extenso .shp, que signifca Shape, ou formato em ingls. Esse arquivo Br.shp
contm os formatos dos estados brasileiros e conecta com os outros arquivos.
Existe tambm outro arquivo chamado Br.dbf, que escrito em Dbase IV, ele
um arquivo de banco de dados que contm algumas informaes sobre o
Brasil e os estados. Para iniciar, devemos abrir um formato (Shape) atravs do
Map Manager (Gerenciador de Mapas).
Utilizando o Map Manager (Gerenciador de Mapas)
Na primeira janela do programa Create Map, aparece somente um
cone, o primeiro esquerda, que o cone do administrador ou gerenciador
de mapas (Map Manager circulado na fgura 2.2).
33 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 2.3. Janela inicial do Map Manager.
Fonte: Epi Map.
O Gerenciador de Mapas (Map Manager) a ferramenta mais importante
do programa Epi Map. Na janela inicial, fgura 2.3, aparecem somente duas
possveis opes: Add Layer e Add Layer Partial. Layer (folha, ou camada) ser
o nosso mapa, ou seja, o arquivo .shp. Automaticamente, o programa procura
por um arquivo .shp no diretrio do Epi Info

, assim devemos abrir o folder


Mapas, pois l salvamos o Br.shp. Selecionamos o arquivo e clicamos Open
(abrir). Surgir, assim, um mapa do Brasil todo em branco e, na janela do Map
Manager, outras opes tornar-se-o possveis (fgura 2.4):
34
ngelo Jos Gonalves Bs
Figura 2.4. Tela do Map Manager, destacando as opes Properties e Remove Layer na janela do Map Manager.
Fonte: Epi Map.
A opo mais importante a das propriedades (Properties... (1)).
Imediatamente observaremos algumas funes dessa opo, clicando na barra
correspondente. Aparecero seis opes de apresentao grfca (fgura 2.5).
Figura 2.5. Janela de opes do Properties ... do Map Manager.
Fonte: Epi Map.
35 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Cada opo de grfco ter uma explicao sucintamente descrita logo
abaixo da janela do nome da folha (Layer name:), que, por sinal, pode ser
mudado, mas no afetar o nome no Gerenciador de Mapas (Map Manager).
1. Single, estabelece um nico padro para todas as
caractersticas da folha ou mapa.
2. Unique, coloca todas as diferentes caractersticas
ou informaes contidas no banco de dados do mapa em
cores distintas.
3. Choropleth, estabelece intervalos dos valores dos
dados que desejamos mostrar. Vamos ver como essa opo
funciona. O banco de dados original do mapa oferece a
populao de cada Estado (POP_ADMIN), a rea do Estado
em quilmetros quadrados (SQKM_ADMIN) ou em milhas
quadradas (SQMI_ADMIN). Essa opo escolhida no
Numeric Field (1).
Figura 2.6. Janela da opo Choropleth, propriedades de tela do Map Manager.
Fonte: Epi Map.
36
ngelo Jos Gonalves Bs
Toda vez que mudarmos alguma coisa na opo, ela s ser efetiva se
clicarmos em Reset Legend (2) e poderemos visualizar no mapa clicando em
Apply (3) que s fca acessvel quando clicamos no Reset Legend primeiro.
Podemos modifcar o nmero de classes na opo (4). Observamos que os
intervalos que automaticamente aparecem no so inteiros. Podemos modifc-
los colocando o nmero inteiro na coluna da esquerda. Observamos que, os
primeiros valores so fxos para valores ausentes ou excludos. Podemos
modifcar somente os valores a partir da segunda linha. Primeiro colocamos
zero na primeira casa acessvel (a segunda de cima para baixo esquerda). s
vezes necessitamos colocar esse valor e clicar no Reset Legend duas vezes,
por isso no se preocupe se o valor voltar ao original na primeira vez. Aps
isso, poderemos arredondar os outros intervalos. Mantendo o mesmo nmero
de classes, 5, podemos ver que os intervalos poderiam ser arredondados para
valores a cada 8 000 000. Assim, colocaramos esse valor na terceira casa da
esquerda e clicamos no Reset Legend. Observamos que a segunda casa da
direita torna-se 7 999 999.99. A quarta casa da esquerda poderia ser, ento,
16 000 000. No temos mais casa na esquerda, ento colocamos o prximo
valor na quinta casa da direita: 23 999 999.99. Novamente, para observarmos
o resultado, clicamos no Reset Legend e depois no Apply. Podemos modifcar
as cores de cada uma das classes conforme nosso bel-prazer. Para tanto
basta clicarmos duas vezes no quadrado colorido ao lado de cada classe (6).
Aparecer uma janela com vrias cores e tonalidades para escolhermos. Nesse
caso especfco no necessitamos clicar no Reset Legend antes de clicar no
Apply, basta clicar OK na janela das cores. Para fechar a janela basta clicar
OK, mas continuaremos a observar as outras opes de mapas.
4. Outras opes do Gerenciador de Mapas so as Std
Labels (Etiquetas padro) que coloca os valores da caracterstica
que queremos, entre elas podemos colocar o nome dos Estados.
Observe que junto a essa opo aparecem algumas zonas que
o banco de dados chama de zonas de litgio (entre o Cear e
o Piau e o Amazonas e o Par). Nessa opo poderemos
tambm colocar os valores numricos de cada Estado, no caso a
populao total ou a rea. A prxima opo (Adv Labels) muito
parecida, mas s permite colocar as variveis no numricas.
37 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 2.7. Janela da opo Dot Density, propriedades de tela do Map Manager.
Fonte: Epi Map.
A ltima opo (fgura 2.7), Dot Density, muito perigosa, pois se no
modifcarmos nada e, sem querer, clicamos em Apply, o programa coloca um ponto
para cada valor da varivel, isso demora sculos, principalmente se selecionamos
a caracterstica Populao (Pop_Admin). Como ilustrao dessa opo, podemos
selecionar essa mesma caracterstica anterior: (1) populao. Depois modifcamos
o valor de cada ponto (Dot Value (2)) para 1 000 000, conforme a fgura 2.7.
Podemos, assim, clicar em Apply (3) e observarmos o resultado. Aparecem pontos
correspondentes a cada milho de habitantes; alguns Estados possuem menos de
um milho de habitantes, por isso no recebem nenhum ponto.
Novamente selecionamos o Choropleth, aplicamos, para ento
fecharmos a janela das propriedades do grfco e fechamos o Gerenciador
de Mapas. Assim, veremos mais algumas opes interessantes sobre esse
programa. A legenda das classes da populao aparece no canto esquerdo, mas
podem ser arrastadas com nosso mouse para mais perto do grfco.
38
ngelo Jos Gonalves Bs
Opes do Epi Map
Clicando no boto da direita do mouse, em qualquer lugar no mapa,
ou no menu view, obtemos uma janela com algumas opes do Epi Map,
conforme a fgura 2.8.
Figura 2.8. Janela de opes do Epi Map.
Fonte: Epi Map.
Podemos defnir as propriedades do ttulo para o grfco assim
como cri-lo (Title Properties (1)), mas essa opo cria um ttulo na parte
superior ou inferior do grfco e difcil mov-lo. Como veremos mais
adiante, no captulo 7, muito inconveniente criarmos um ttulo em um
grfco, pois, aps salvar o mesmo, no poderemos edit-lo ajustando para
as exigncias do local onde queremos public-lo ou mostr-lo. Podemos
localizar determinado local no mapa ou mostrar os dados de um local
utilizando respectivamente os comandos Find (2) e Identify (3). possvel
ainda esconder a legenda das classes (Legend) e ampliar uma parte do mapa
atravs do Zoom in. Poderemos, por exemplo, ampliar algumas ilhas no
mapa direita. Para voltar ao tamanho mximo, clicamos em Full Extent.
Outra opo interessante o Identity, que nos mostra informaes sobre
cada Estado que clicarmos. Para adicionarmos um texto e tambm um ttulo
39 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


no lugar que quisermos, clicamos na opo Graphics ou no cone que tem
um tringulo, um quadrado e um crculo ( ) no menu do programa. Esse
comando gera outros cones: , o primeiro adiciona um texto
onde clicarmos. Podemos, com essa opo, adicionar nomes ou valores ao
grfco. Finalmente podemos salvar nosso mapa como um arquivo tipo mapa,
para edit-lo mais tarde, ou como um arquivo bitmap (.bmp) (menu Arquivo,
Salvar como BMP) que pode ser adicionado a um texto. Infelizmente, como
esse arquivo muito grande, podemos transform-lo em um formato mais
compactado como .jpg, usando um editor grfco ou o prprio Paintbrush do
Windows, dependendo da confgurao do computador. Usaremos o Epi Map
de novo, mais adiante, mostrando como adicionar novos dados ao mapa.
Como conseguir mapas mais detalhados do Brasil
O IBGE (Instituto Brasileiro de Geografa e Estatstica) mantm um
site que disponibiliza vrios tipos de grfcos brasileiros. Nesse site poderemos
baixar mapas, por exemplo, de qualquer Unidade da Federao por municpio.
O endereo do site http://mapas.ibge.gov.br/divisao/viewer.htm. Note que
no temos o www no endereo. Caso o link no funcione, procure o site
www.pucrs.br/igg/epiinfo, folder atualizaes para obter a verso atualizada
do link e novas instrues a respeito do site.
Figura 2.9. Tela da pgina de gerao de mapas do IBGE, destacando as camadas dos mapas, cones de
ampliao, reduo e de importao de mapas.
Fonte: http://mapas.ibge.gov.br/divisao/viewer.htm, ltimo acesso em 4 de abril de 2011.
Automaticamente, depois de algum tempo, abre-se uma tela com
o mapa do Brasil com as regies delimitadas, conforme fgura 2.9. Na
40
ngelo Jos Gonalves Bs
janela, esquerda, temos as camadas onde podemos modifcar o que
queremos visualizar (no crculo) ou selecionar (no quadrado) no mapa.
Vemos que existem as opes de visualizao por Unidade da Federao,
Mesorregio, Microrregio e fnalmente, Municpio. Mais do que uma
opo de visualizao possvel, at mesmo todas. Somente uma camada
pode ser ativa. Uma camada ativa (segunda coluna, crculo) signifca que
podemos procurar no mapa a localizao de uma cidade, por exemplo.
Veremos mais adiante a sua utilidade.
Na parte superior do mapa vemos alguns cones. Veremos a funo
deles. O primeiro da esquerda faz aparecer ou desaparecer uma verso
compacta do mapa no canto superior esquerdo. Os dois prximos cones
da esquerda para a direita aumentam ou diminuem o mapa. Selecionando
o cone da lupa com o sinal de mais, aumentamos o tamanho do local que
circularmos com o mouse. Como exerccio, selecionaremos a regio Sul.
Depois do cone da lupa com sinal menos, vemos, na sequncia, os cones
que retornam extenso total, extenso prvia e movimentao do mapa
com o mouse (cone da mo). Os trs prximos itens referem-se ao contedo
do mapa. O cone do i d informaes ao local no mapa que clicarmos.
As informaes so basicamente a localizao, quanto a regio, unidade da
federao, mesorregio, microrregio, municpio e rea, dependendo do nvel
que estamos visualizando. Assim, se clicarmos na Regio Sul, s teremos
como informao a regio e a rea. Podemos utilizar o cone do binculo para
localizarmos um municpio. Mas, para localizar uma cidade, por exemplo, a
cidade de Catupe, devemos ter a camada Municpio ativa e visvel. Feito isso,
clicamos no cone do binculo que abre uma caixa, onde colocamos o nome
da cidade: Catupe (com acento e primeira letra maiscula). Ao clicarmos o
boto Localizar, temos a cidade em amarelo, no meio do mapa. Se quisermos
informaes sobre a cidade, devemos clicar no prximo cone, que parece uma
planilha com um ponto de interrogao. A janela um pouco mais complicada,
por isso ela apresentada na fgura 2.10.
41 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 2.10. Janela de consulta de dados do programa de gerao de mapas do IBGE.
Fonte: http://map.ibge.gov.br/divisao/viewer.htm, ltimo acesso em 04 de abril de 2011.
No primeiro compartimento (Campo (1)) devemos escolher o que
desejamos, no caso: Municpio. O Operador serve para escolhermos locais
com valores acima ou abaixo de determinado nvel que determinamos
no compartimento Valor (2). No caso, colocaremos de novo a palavra
Catupe. Temos que adicionar esse valor na janela de busca clicando na
barra correspondente (3). Finalmente podemos clicar no boto Executar (4),
para observarmos as informaes em uma nova janela. Devero aparecer
informaes sobre o municpio, localizao quanto a regio, unidade da
federao, mesorregio, microrregio e, fnalmente, a rea do municpio.
Podemos selecionar uma regio pela localizao, clicando no cone do
quadrado tracejado, que o prximo cone (Seleo por retngulo). O cone
direita da Seleo por retngulo o chamado Buffer, que seleciona uma zona
ao redor da localizao previamente selecionada, a uma atribuda distncia,
no caso, poderamos selecionar as cidades que fcam 10 quilmetros ao redor
de Catupe. Para tanto, selecionamos a opo municpio na janela Destacar as
Feies de (1), colocamos o valor na janela correspondente (2) e, fnalmente,
clicamos em Criar Buffer (3), conforme a fgura 2.11.
Figura 2.11. Janela de criao de Buffer do programa de gerao de mapas do IBGE.
Fonte: http://map.ibge.gov.br/divisao/viewer.htm, ltimo acesso em 4 de abril de 2011.
42
ngelo Jos Gonalves Bs
O prximo cone tem um formato que deveria ser o de uma
borracha justamente para apagarmos a seleo. Vamos clicar nesse
cone para limparmos as selees realizadas at aqui. Como temos duas
selees, municpio e entorno, temos que clicar duas vezes no cone. Os
prximos cones so para medir distncias (rgua) e para alternar lista
de camadas/legendas. Passando pelo cone de imprimir, fnalmente
chegamos ao cone que salva o mapa ( , Download). Como exerccio,
vamos visualizar somente as mesorregies com o mapa mostrando todo o
Rio Grande do Sul. Evidentemente que acabaremos visualizando mais do
que o Estado, mas iremos corrigir isso, posteriormente. Clicando no cone
do Download, abre uma janela informando a rea selecionada (longitudes
e latitudes superiores e inferiores) e um boto com o comando Extrair.
Nova janela se abre informando que o arquivo foi criado e indicando o
Link para baixar o arquivo (Download). Ao clicarmos nesse Link, surge
a janela de salvar ou abrir o arquivo; clicamos em abrir. O comando abre
o arquivo com o WinZip e observamos que existem trs arquivos: Meso.
shp, Meso.dbf e Meso.shx. Vamos extrair todos os arquivos no diretrio:
C:/Epi_Info/Mapas, criando um novo subdiretrio RS, pois os nomes dos
arquivos extrados so muito genricos.
Quando importamos arquivos desse site, algumas vezes temos que
corrigir o nome de alguma localidade. Por exemplo, nomes com acento
podem ser importados errados. Por isso devemos observar se os nomes das
localidades esto corretos. Esses nomes esto no arquivo com extenso .dbf.
Editando arquivo .dbf
Os arquivos com a extenso .dbf so arquivos em formato dBase. O
site do IBGE cria os arquivos na verso IV do programa. Podemos observar e
editar esse tipo de arquivo usando o Excel. Com o Excel aberto, clicamos em
Abrir (Open). Devemos modifcar o tipo de arquivo para arquivo do dBase, no
compartimento inferior da janela de abertura, conforme a fgura 2.12.
43 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 2.12. Janela de seleo de arquivo a abrir pelo Excel, destacando o nome do arquivo e o tipo de arquivo.
Fonte: Microsoft Excel.
Selecionamos o arquivo meso.dbf localizado no diretrio que o havamos
salvo. Clicando no boto Abrir (open), visualizamos os dados. Observamos que
foram salvas informaes a mais do que queramos, pois temos mesorregies
inclusive de outros Estados. No podemos apagar esses dados extras, pois eles
esto relacionados a outros arquivos. Podemos modifcar e corrigir alguns nomes
que estejam mal escritos. Se isso ocorrer, devemos salvar o arquivo com o formato
e nomes originais (dBase IV e meso), mesmo que o programa recomende que no.
Depois de salvo o arquivo em formato dBase, quando desejamos sair do Excel,
uma mensagem indicando que o arquivo no foi salvo aparece. Devemos ignorar
essa mensagem, pois est informando que o arquivo no foi salvo em formato
Excel. O Epi Map no trabalha com arquivos em formato Excel, por isso devemos
manter o formato original. Como os outros arquivos so chamados meso, devemos
manter o mesmo nome, ou mudar todos os nomes.
Selecionando regies em um arquivo .shp (Add Layer Partial)
Como vimos, o arquivo meso.shp que importamos do IBGE possui
regies que no pertencem ao Rio Grande do Sul. Como desejamos ter um mapa
s com essas regies, podemos utilizar o comando Adicionar camada parcial
44
ngelo Jos Gonalves Bs
(Add layer partial) do Epi Map. Aps abrir o programa, escolhemos o arquivo
meso.shp. Modifcando um pouco a largura das colunas obteremos a janela
conforme a fgura 2.13.
Figura 2.13. Janela de seleo de componentes de um mapa pelo Epi Map.
Fonte: Epi Map.
Se clicarmos na barra do nome da Unidade da Federao (NOMEUF),
a mesma passa a ser a primeira da lista e passa a fcar em ordem alfabtica.
Prestando um pouco de ateno, notamos que as primeiras localidades do
Rio Grande do Sul so: Lagoa Mirim e Lagoa dos Patos. Vamos selecionar
todas as localidades do Rio Grande do Sul, exceto as duas lagoas. Aps
selecionar as sete mesorregies do Estado, clicamos OK. Aparecer uma
janela para salvarmos os arquivos com um nome que seja fcil lembrar, como
Mesorregio do RS. Finalmente podemos salvar o mapa como est, utilizando
o mesmo nome do arquivo .shp.
45 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Baixe o mapa contendo as Regies do Brasil, no site do IBGE,
salvando como Regies do BR no diretrio c:/Epi_Info/Mapas/
BR (extraia os arquivos).
2. Faa um mapa Choropleth das reas das regies, arredonde as
faixas e salve como Regies BR.map.
3. Edite o arquivo Regies BR.dbf usando o Excel, observe como os
nomes das regies esto escritos (principalmente observe se esto
com os nomes completos, com ou sem acento etc.). No importa
se os nomes estejam em maisculas ou minsculas. Como no
necessita nenhuma alterao, simplesmente feche o arquivo.
Captulo 3
CRIANDO UM BANCO DE DADOS
Estrutura do arquivo Epi Info

Os arquivos do Epi Info

so chamados de Projetos (Projects) e


tm o formato do MS-ACCESS. O arquivo do MS-ACCESS um banco
de dados, por isso tem a extenso .mdb (Microsoft DataBase). Esse tipo
de arquivo pode conter muitos subarquivos, assim como os arquivos
EXCEL, que podem ter muitas planilhas. O Epi Info

salva dois diferentes


principais subarquivos: Tabela (Table) e Ficha (View). Tambm h outros
arquivos diferentes, onde so salvos cdigos e links, mas aqueles dois
quase sempre esto presentes. Tabela (Table) o real banco de dados e
contm todos os dados. Esse arquivo essencial. O arquivo fcha ou em
ingls View corresponde ao arquivo formulrio do MS-ACCESS, mas tem
uma estrutura diferente. O subarquivo fcha salva os cdigos e a tela de
introduo de dados, bem como descrio das variveis.
Criando um projeto e uma fcha (Make View) no Epi Info

A primeira coisa que temos que fazer para introduzir dados a partir do
nada para o Epi Info

construir uma View (Ficha). O programa para isso


o Make View (Criar Ficha). Antes, porm, devemos verifcar se a linguagem
selecionada do programa o ingls, pois o portugus nos traz alguns
problemas. Para tanto, basta olhar no canto superior esquerdo da tela principal
do Epi Info

e observaremos a linguagem. Vimos, no primeiro captulo, como


modifcar a linguagem do Epi Info

.
Na tela do Epi Info

clicamos em Make View (Criar Ficha), para


iniciar a criao da nossa fcha.
O Make View tem duas janelas: a janela da direita que a janela do
registro e a janela da esquerda a que guia as diferentes pginas do questionrio.
Primeiro temos que abrir ou criar um projeto (arquivo de banco de
dados) que o Epi Info

chama de Project. No nosso caso, criaremos um


arquivo novo: Menu File (Arquivo), clicar em New (novo) de acordo com
a fgura 3.1.
47 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 3.1. Janela de opes do menu File do Make View.
Fonte: Epi Info

.
Observe que o ltimo arquivo usado fca registrado na parte baixa do
comando. Uma janela nova, muito comum do Windows, aparecer: a janela
de abrir ou salvar. Vamos salvar o arquivo como: Seunome. Isso cria um
arquivo em branco. Antes de salvar, vamos criar um novo diretrio, para
armazenar nossos arquivos, dentro do C:\Epi_info, chamaremos de EpiAula.
Como vimos, o banco de dados de Epi Info

tem os Views (Fichas). Epi


Info

pede um nome agora para a nova fcha. Podemos chamar Dados e


clicar OK. A tela muda e uma grade aparece. Automaticamente, o programa
estabelece que os campos sero alinhados grade. Podemos mudar essa regra
no Menu Format (Formato), Settings (confguraes). Tambm podemos
mudar algumas outras confguraes, como aumentar ou diminuir o espao
entre as linhas da grade.
Criando campos (variveis)
Para criar um campo novo (Field) devemos clicar no boto da
direita do mouse no lugar onde queremos que ele fque. Isso nos leva a
outra janela (Field Defnition) cujos componentes sero descritos a seguir
e observados na fgura 3.2.
48
ngelo Jos Gonalves Bs
Figura 3.2. Janela Field Defnition do Make View.
Fonte: Epi Info

.
1. Question or Prompt (Pergunta): o primeiro
componente da janela e est localizado na parte superior da
mesma. suposto que descrevamos a pergunta relacionada
varivel que estamos criando neste componente. Isso pode ser
bastante longo, com vrios caracteres. Essa pergunta aparecer
em alguns resultados quando analisarmos os dados.
2. Field Name (Nome do Campo): automaticamente o
programa sugestiona um nome do campo. O nome do novo campo
ser criado conforme o Prompt: utilizando as primeiras palavras
da pergunta. Podemos mudar o nome do campo usando um mais
reconhecvel ou mais conveniente para ns. Esse nome se tornar
o nome da varivel, por isso importante observarmos como ele
denominado. O nome da varivel pode ser longo (mais de 40
caracteres), aceita acentos, mas no aceita caracteres especiais
nem espaos, quando o defnimos usando o Make View. O nome da
49 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


varivel no Epi Info

no pode iniciar com nmeros, podendo ter


tantos nmeros quanto quisermos, a partir do segundo caractere.
aconselhvel que o campo no tenha mais que 8 caracteres,
pois alguns programas (como o SPSS) no aceitam mais do que
esse nmero de caracteres. Construindo nossas variveis somente
com 8 caracteres no teremos difculdades ao importar o banco de
dados em outro programa. Tambm no aconselhvel usarmos
acentos nos nomes das variveis justamente pelo mesmo motivo.
3. Field or Variable Type: existem diferentes tipos de
variveis em Epi Info

. Observaremos esses tipos logo aps


terminarmos de observar mais algumas opes da tela de
defnio de campo (Field Defnition).
4. Field or Variable Size: defne o tamanho do campo ou
varivel, veremos sua utilidade para cada um dos tipos de campo.
5. Legal Values (Valores Legais): codifca valores vlidos
como resposta s variveis do tipo texto.
6. Comment Legal (Comentrios Legais): parecido
com os valores legais, mas propicia a colocao de um
comentrio ao lado do valor, somente o valor armazenado
na tabela de dados.
7. Outras opes: Repeat Last (Repetir o ltimo) repete o
ltimo valor colocado; interessante quando temos uma varivel
constante para grupos de amostras (por exemplo, pessoas
avaliadas em um mesmo dia). Required (Necessrio) no deixa
seguir a introduo de dados se nenhum valor for colocado,
muitas vezes teremos problemas ao colocar esse tipo de opo.
Read Only (S leitura), no permite que anotemos o valor da
varivel, importante quando criamos automaticamente um
valor para ela e Range (Faixa) estabelece uma faixa de valores
vlidos para variveis numricas.
Como um exemplo, construiremos um questionrio que pergunta
algumas informaes sobre ns mesmos, conforme as orientaes da tabela 3.1.
Como queremos juntar nossos dados posteriormente, importante que
o nome dos campos (Field Name) e os seus tamanhos sejam exatamente os
50
ngelo Jos Gonalves Bs
mesmos para todos. Assim, importante seguir as instrues da tabela 3.1,
principalmente a da sugesto do nome do campo.
Tabela 3.1. Lista de variveis do questionrio a ser utilizado como exemplo durante a explicao dos
diversos tipos de variveis do Make View.
Grupo
Pergunta
(Prompt)
Nome do campo
(Varivel)
Tipo de
varivel
Valor Legal/
Formato/Faixa
Questonrio QUESTIONARIO
Text/
Label
I
d
e
n
t
f
c
a

o
Registro REGISTRO Nmero ###
Data de
Nascimento
DATANASC Data DD/MM/YYYY
Data do Exame DATAEXAME Data DD/MM/YYYY
Idade (anos) IDADE Nmero ### (0-130)
Gnero GENERO Texto
Masculino
Feminino
Cor (raa) COR Texto
Branca Negra
Mulata
Estado civil ESTADOCIV Texto
Solteiro Casado
Vivo Separado
D
a
d
o
s

c
l

n
i
c
o
s
Altura (cm) ALTURA Nmero ### (70-250)
Peso atual (kg) PESOATUAL Nmero ###.# (20-200)
Peso aos 20 a (kg) PESO20A Nmero ###.# (20-200)
Tabagismo TABAGISMO Opo
Atual fuma
atualmente
Exfumante
fumou por mais
de um ano
Nunca todos os
outros
Atvidade Fsica
Regular
ATIVIDADE
Check
Box
Yes / No
Fonte: criao do autor.
51 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Field or Variable Type (tipos de campos ou variveis)
Seguindo a sequncia do exemplo, temos os seguintes tipos de campo:
1. Label/Title: de fato no uma varivel, porque s insere
um texto ou comentrio. Todavia, pode ser utilizado para gerar
informaes importantes para o responsvel pelo preenchimento.
No caso usaremos para gerar um ttulo que ser o ttulo do
nosso questionrio: colocaremos como Question or Prompt (1)
a palavra Questionrio, no nome do Campo (3) QUEST, e
como Tipo: Lable/Title. Podemos modifcar a fonte do Prompt
clicando no boto direita da janela (1).
2. Number defne uma varivel numrica. O Epi
Info

trabalha as variveis numricas com smbolos ###. ##


(sustenidos com marcador decimal ponto, mesmo como no Epi
Info

6.0). O Epi Info

oferece um nmero restrito de opes de


formatos no compartimento Size (4). Mas podemos, e devemos,
defnir o tamanho da varivel utilizando o smbolo # tantas
vezes quantas necessrias para confgurarmos o nmero de
dgitos que desejamos para a varivel.
A segunda varivel do nosso questionrio numrica:
registro, no caso, chamada de REGISTRO. importante
termos uma varivel que identifque cada um dos nossos registros
para podemos revis-los posteriormente ou usar como chave de
ligao com outro banco de dados. O registro deve ser nico,
infelizmente o Epi Info

no evita que coloquemos dois registros


iguais, por isso temos que tomar cuidado.
3. Date: insere datas; esse tipo de varivel oferece
diferentes padres de opes que temos que escolher de acordo
com a necessidade. Podemos tambm digitar o formato das
datas manualmente ou o escolher no compartimento Size (4). No
nosso caso, usaremos esses tipos para defnir as duas variveis
seguintes: Data de nascimento, chamada DATANASC, e
Data do Exame, chamada DATAEXAME e ser para ns a
data de hoje com o formato DD/MM/YYYY.
4. Varivel IDADE: Sempre que construmos um banco
de dados precisamos pensar no tamanho mximo de cada valor
52
ngelo Jos Gonalves Bs
das variveis. Esse o caso, em nosso exemplo, da varivel
IDADE. A maioria das pessoas tem menos de 100 anos, mas, at
mesmo quando pensamos que ningum ultrapassar aquele nvel,
deveremos defnir o tamanho da varivel com trs dgitos, exceto,
evidentemente, se tivermos trabalhando somente com crianas.
Podemos defnir uma faixa de idade para evitar que algum,
menos avisado, entre com dados fora de um limite razovel, assim,
clicamos em Range (Faixa) e defnimos como mnimo 0 (zero)
e mximo 130 (desconfe da veracidade de algum com mais de
130 anos!). Isso vai depender da nossa amostra. Se estivermos
trabalhando com uma populao peditrica, deveremos adequar a
faixa a essa clientela. Observe que no Prompt podemos colocar a
unidade de sua medida, no caso a idade estar sendo medida em
anos (poderia ser em dias, se a pesquisa fosse com recm-nascidos).
Figura 3.3. Janela de criao de Legal Values do Field Defnition.
Fonte: Epi Info

.
53 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


5. Text (texto) com Legal Values (Valores Legais):
nossas trs prximas variveis sero variveis tipo texto. Text:
o tipo que automaticamente aparece toda vez que desejamos
criar um campo, cria variveis que aceitam textos e vrios tipos
de caracteres. No precisamos decidir o nmero mximo de
caracteres especifcando seu tamanho (4), veremos o porqu.
O tipo de varivel TEXT aceita Legal Values (5) ou, observada
na primeira fgura desta sesso. Legal Values so valores
preestabelecidos que a varivel pode ter. Essa caracterstica
previne a introduo de dados com textos mal escritos,
incompletos ou semelhantes, mas diferentes do que queremos.
Tambm nos ajuda a introduzir os dados, como veremos mais
adiante. No caso do exerccio, a varivel GENERO possuir
dois valores legais: Masculino ou Feminino. Para criar os
valores legais devemos que clicar em Legal Values (5) da
janela do Field Defnition, que nos levar a uma nova janela
(fgura 3.2) que sugere o nome da varivel como um cdigo
novo, mas oferece a possibilidade de usarmos um cdigo de
uma tabela (Table) existente (2). Ao clicarmos em CreateNew
(1), uma nova janela (fgura 3.4) aparecer para colocamos,
ento, os dois valores: Masculino e Feminino, pulando de
uma linha para a outra com o Enter. Automaticamente,
os valores sero dispostos em ordem alfabtica, podemos
evitar isso se checarmos a opo logo acima do OK (Do not
sort), conforme a fgura. (Esse comando no afetar a forma
como sero mostrados os resultados da anlise.) Faremos o
mesmo para as outras duas variveis: cor (COR) e estado civil
(ESTADOCIV). salutar preservar as maisculas.
54
ngelo Jos Gonalves Bs
Figura 3.4. Janela de defnio dos valores no Legal Values do Field Defnition, destacando a opo no
ordenar (Do not sort).
Fonte: Epi Info

.
6. Variveis ALTURA, PESOATUAL, PESO20: sero
defnidas como variveis numricas (Number) e defnir as faixas
conforme orientado.
7. Text com Comment Legal (Comentrio legal): os
valores das variveis tipo texto ou categricas devem ser
sucintos, com poucas letras e de preferncia com palavras
nicas. Entretanto, s vezes necessitamos fornecer uma
descrio maior da defnio do valor. Esse pode ser o caso da
varivel TABAGISMO, a pessoa que introduzir os dados pode
fcar confusa principalmente entre ex-fumante e nunca fumante.
Assim usamos o artifcio (ou artimanha) do Comment Legal que
aceita colocarmos uma descrio junto ao valor da varivel.
Praticamente o mesmo procedimento do Legal Value, a nica
diferena que, depois do valor, devemos colocar um hfen (
) e ento a descrio que desejamos. Tanto o valor quanto o
comentrio aparecero quando entrarmos com os dados, mas
somente o valor ser colocado na tabela de dados.
55 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


8. Check Box: insere uma caixa de checagem pequena,
trabalha como uma varivel de Yes/No; usaremos esse tipo para
defnir a varivel ATIVIDADE. No caso, os valores omissos
sero sempre considerados como resposta negativa, o que nem
sempre interessante.
9. Option: cria uma caixa com as opes desejadas. Tem
a mesma funo do tipo texto com Legal Values, mas os mesmos
aparecem mais claramente. Seguindo os passos da fgura 3.5,
selecionamos o tipo Option na lista de tipos de variveis (1) e
clicamos OK (2). Vai aparecer outra janela onde devemos colocar
o nmero de opes que desejamos (3). Podemos aumentar ou
diminuir o nmero de opes posteriormente. No caso estamos
criando uma varivel com 3 opes. Aps colocarmos o nmero
de opes devemos apertar a tecla enter, surgindo os espaos para
colocarmos as opes desejadas (4). Finalizando isso podemos
clicar OK (5), para observarmos o resultado que aparece em
destaque ainda na fgura 3.5.
Figura 3.5 Passos para a criao de uma varivel Option (Opo), no exemplo a varivel Tabagismo,
destacando no quadrado o resultado dos comandos.
Fonte: Epi Info

.
56
ngelo Jos Gonalves Bs
10. Outros tipos de variveis:
a. Yes/No: insere uma varivel que aceita s dois tipos de resposta.
praticamente igual varivel Check Box, mas permite que
tenhamos valores omissos, quando as pessoas no respondem.
b. Multiline: cria uma varivel onde podemos colocar um texto
com vrias linhas.
Modifcando posio das variveis e o tamanho da janela de
resposta na fcha
Podemos facilmente modifcar a posio da varivel clicando
em cima dela e arrastando com o mouse at o local que desejamos. Para
aumentarmos ou diminuirmos o tamanho da janela de resposta devemos
clicar em cima da janela uma vez. Nas variveis com Legal Value devemos
clicar o mouse sobre a janela e pressionar a tecla Alt. Isso faz aparecer
nmeros no fundo da janela e pequenos quadrados ou pontos quadrilteros
nos quatro cantos e no meio da mesma. Devemos posicionar o mouse
exatamente em cima do ponto do meio no canto direito da janela, pois isso
far com que a ponta do mouse modifque a sua forma, passando a ter duas
setas horizontais, conforme a fgura: . Com o mouse assim
posicionado podemos arrastar para a direita ou esquerda at chegarmos
ao tamanho desejado. Essa opo particularmente importante para a
varivel TABAGISMO, onde temos os comentrios dos valores legais. S
podemos alterar o tamanho da janela de entrada de dados quando temos
uma fcha nova sem dados na tabela correspondente.
Agrupando variveis em uma Ficha (comando Group)
As variveis podem ser agrupadas na fcha, segundo suas caractersticas
ou simplesmente pelo desejo do seu criador. Essa caracterstica poder ser
usada quando estivermos analisando essas variveis. Esse grupo de variveis
poder ser movido facilmente na pgina e poder ser usado para gerar
uma anlise separada. Para englobarmos as variveis REG, DATANASC,
DATAEXAME, IDADE, GENERO, COR, ESTADOCIV, devemos clicar
algo acima da primeira varivel e arrastando de tal forma a criar um quadrado
ao redor das variveis. Com o quadro ativo clicamos no menu Insert, Group.
Surge uma janela (conforme a fgura 3.6) onde colocamos uma denominao
ou descrio do grupo, que dever ser diferente das variveis.
57 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 3.6. Janela de denominao de grupo do Make View.
Fonte: Epi Info

.
Essa descrio, sem espao, aparecer como varivel em algumas
anlises no Epi Info

. Podemos tambm selecionar a cor do fundo do grupo.


Como outro exerccio, vamos agrupar as variveis que esto identifcadas como
Dados Clnicos na tabela 3.1, margem da esquerda. Devemos escrever a palavra
Clinicos, sem acento, pois ele ser transformado em outra letra ou caractere.
Podemos incluir uma nova varivel dentro do grupo simplesmente
arrastando a mesma para dentro da caixa do grupo. A caixa tambm pode
ser aumentada ou diminuda de tamanho. bom movimentarmos um pouco
a caixa do grupo para saber se todas as variveis esto realmente no grupo.
s vezes, uma varivel fca nas margens do grupo e no includa, se ela no
estiver includa ela no se movimentar junto com o resto do grupo.
Criando variveis com preenchimento automtico (Check Code)
Podemos automaticamente preencher algumas variveis. Temos, na
fcha que estamos criando, trs variveis: data do exame (DATAEXAME),
data de nascimento (DATANASC) e idade (IDADE). A data do exame ser
para ns, no exerccio, a data do dia do preenchimento, e a idade pode ser
calculada como o nmero de anos entre a data de nascimento e a data de
hoje. A data do dia do preenchimento pode ser inserida automaticamente
aps, por exemplo, da varivel registro (REG). Igualmente, a idade pode
ser calculada to logo tenhamos colocado a data de nascimento. Assim
entendendo, passaremos ao comando Check Code (Cdigo Check), nica
opo do menu View. Abre uma janela, como na fgura 3.7. Na primeira
opo, superiormente colocada (1), escolhemos a varivel que desejamos
que o comando ocorra, antes ou depois (2) da introduo do dado nela,
no nosso caso depois da varivel REG. muito comum, no Epi Info

,
termos um nmero bastante grande de opes que nos deixam bastante
58
ngelo Jos Gonalves Bs
atrapalhados. Temos que sempre lembrar o que queremos, no caso trabalhar
com uma varivel, especifcamente atribuir um valor a uma varivel.
Selecionamos, ento, o comando Variables (Variveis) (3), onde temos o
comando Assign (Atribuir) (4), esse comando muito til e aparecer mais
vezes em vrias partes deste livro.
Figura 3.7. Janela de criao de Check Code do Make View.
Fonte: Epi Info

.
Atribuindo a data do dia (Assign Systemdate)
Clicando no boto Assign (4) da janela do Check Code abre uma
janela (fgura 3.8) onde podemos atribuir um valor a uma varivel. A
varivel qual queremos atribuir o valor deve ser escolhida ou escrita no
primeiro compartimento da janela do Assign (1). Escrevendo o comando
SYSTEMDATE no compartimento = Expression (2), introduziremos a data
(dia, ms e ano) do sistema do computador que estamos usando. esperado
que essa data seja a data do dia em que estamos usando o computador, mas
bom checar o relgio do mesmo. Como vemos na janela, podemos usar
letras minsculas ou maisculas nesse comando.
59 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 3.8 Janela do Assign do Epi Info

demonstrando a atribuio da data do sistema a uma varivel.


Fonte: Epi Info

.
Ao clicarmos OK, na janela do Assign, observamos que o comando
ser adicionado no compartimento inferior da janela do Check Code, esse
comando, por sinal, no muito complicado e poderia ter sido escrito
diretamente no compartimento se soubssemos como. Clicamos em Save no
compartimento dos comandos para salvar o que fzemos.
Calculando os anos entre duas datas (Years)
Podemos calcular os anos entre duas datas; no nosso caso, para calcular
a idade entre a data de nascimento e a data de hoje. No nosso exerccio,
desejaremos calcular a idade aps introduzirmos a data de nascimento, pois
a data de hoje ser colocada to logo digitemos o registro. Escolheremos,
inicialmente, a varivel DATANASC na janela das variveis do comando
Check Code (1) e, no compartimento de comandos das variveis, poderemos
simplesmente digitar: Assign idade=years(datanasc,dataexame). Ateno:
cuidado com a posio das variveis!
Clicamos Save novamente e fnalmente OK para fecharmos a janela.
Esses comandos somente sero executados quando terminarmos de entrar
os valores das variveis correspondentes. Podemos editar as variveis
DATAEXAME e IDADE clicando duas vezes em cima delas e selecionar
a opo Read Only, isso evitar que coloquemos outros valores que no os
determinados pelo nosso programa.
60
ngelo Jos Gonalves Bs
Funes do Epi Info

Alm do Systemdate e do Years, existem outras funes do Epi Info


que podem ser observadas clicando na barra Functions (Funes) do comando
Assign (Atribuir). Elas so dispostas na fgura 3.9 e so descritas junto a alguns
operadores como operaes aritmticas. As funes so divididas, ento, em
funes de data (Date Functions), sistema (System), tempo (Time) e de texto
(Text). Descreveremos a seguir algumas delas:
Figura 3.9. Lista de funes e operadores do Epi Info

.
Fonte: Epi Info

.
1. Funes de Data (Date Functions): J vimos um
exemplo de funo de data, a funo Years, que conta o nmero
de anos entre duas datas. As funes Months e Days so muito
parecidas, pois contam, respectivamente, o nmero de meses e
dias entre duas datas. As outras trs funes extraem uma parte de
uma data, respectivamente o ano, o ms e o dia, quando usamos
as funes Year, Month e Day. Note que a diferena est somente
no fato de uma funo ser plural ou singular, por isso devemos
tomar cuidado. O uso das ltimas trs funes muito parecido.
Por exemplo, se quisermos obter somente o ano de uma varivel
data como a DATANASC, criando uma varivel chamada
ANONASC, colocaramos: Assign Anonasc=Year(Datanasc).
61 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


2. Funes de Sistema (System Functions): Dentre
as funes de sistema, as mais interessantes so justamente
as que se referem data e ao tempo do sistema: Systemdate
e Systemtime, cujas utilizaes so semelhantes e j foram
abordadas anteriormente.
3. Funes de Tempo (Time Functions): As funes de
tempo usam a mesma estrutura e tm a mesma utilidade que as
funes de data.
4. Funes de Texto (Text Functions): As funes
texto, Txttonum e Txttodate, servem para manipular variveis
do tipo texto, transformando-as em varivel numrica ou
varivel tipo data. Isso til quando, erroneamente, essas
variveis foram defnidas, no incio, como variveis tipo
texto. A funo Format tem a mesma funo que as anteriores,
mas possibilita a transformao em vrios formatos.
aconselhvel a leitura do ajuda para obter maiores detalhes
sobre o seu uso.
5. Funes Substring e Findtext ajudam a procurar
informaes dentro de variveis do tipo texto. Substring extrai
o contedo de uma faixa determinada da varivel. Por exemplo,
podemos extrair quatro letras da esquerda para a direita da
varivel a partir da segunda letra: Assign variavelnova=substri
ng(variavelvelha, 2,4).
6. J a funo Findtext atribui a posio em que se
encontra o parmetro desejado.
7. Finalmente, a funo Uppercase transforma todos os
valores da varivel texto em maiscula.
Adicionando pginas (Add/Insert Page)
Quando temos um questionrio muito grande, podemos acrescentar
uma ou mais pginas nossa fcha. O comando Add page acrescenta uma
pgina antes e o comando Insert page acrescenta uma pgina depois da
pgina atual.
62
ngelo Jos Gonalves Bs
Limite de tamanho da Ficha
Cada fcha do Epi Info

pode abrigar at 250 variveis, neste


nmero no esto includos os Lable/Title, mas inclui as variveis que
defnem os grupos. Podemos criar, entretanto, vrias fchas dentro de um
mesmo projeto.
Criando boto de ligao entre fchas (Related View)
Podemos criar uma nova fcha a ser preenchida logo aps a introduo
dos dados ou quando temos algum dado especial que desejamos preencher
quando nos deparamos com algum caso especial. Por exemplo, poderemos
criar uma fcha para colocar dados especfcos para mulheres como data
da primeira menstruao, nmero de gravidezes etc. Esse boto criado
como se fosse uma varivel, colocamos o Prompt e o nome da varivel
exatamente da mesma forma como se estivssemos colocando uma varivel
Text. No caso, poderemos colocar no Prompt Dados sobre as Mulheres e
como nome do campo MULHERES. Temos, entretanto, que clicar na opo
Related View. Isso far aparecer uma nova janela (fgura 3.9) que possui duas
opes importantes: O boto ser sempre ativo (Any time) ou ativo quando
certas condies forem verdadeiras (Only when ...) (1). No caso, se quisermos
que o boto seja ativo somente quando a varivel GENERO for Feminino
devemos, alm de checar o boto correspondente, colocar o seguinte comando:
GENERO=Feminino. Ateno: no esquecer as aspas, colocar exatamente
como aparece na fgura 3.10 no compartimento (3).
63 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 3.10. Janela de criao de Related View no Make View.
Fonte: Epi Info

.
Outra opo podermos ou no voltar janela inicial, aps
completarmos o preenchimento da fcha (2), vamos checar a opo. importante
ressaltar que a nova fcha criar uma nova tabela de dados, independente da
tabela criada pela fcha inicial. Assim, devemos incluir algumas variveis,
principalmente a varivel REG (Registro) se quisermos relacionar as duas
tabelas posteriormente. Ao clicarmos OK surge a opo de relacionarmos
a uma fcha existente ou criarmos outra. Vamos criar outra fcha, por isso
clicamos nessa opo. O boto surge na tela da fcha que estamos criando.
Editando o boto de ligao entre fchas
Quando colocamos o mouse em cima do boto de ligao entre fchas,
sem clicar no mesmo, aparece uma caixa orientando para algumas opes: Alt
Click to resize, com a tecla Alt pressionada clicamos com o mouse em cima
do boto, aparecero os pontos quadriculados nos cantos e no meio das bordas
do boto, usando o mouse, podemos alterar o tamanho. Shift left click to move,
com a tecla Shift pressionada, que aciona as maisculas, podemos arrastar
o boto com o mouse at o local que desejamos que ele fque posicionado.
Shift right click to edit, com a tecla Shift pressionada ou no, clicando com
o boto da direita do mouse, voltamos janela de edio onde podemos
inclusive deletar o boto. A ltima dica a mais importante: Control click
64
ngelo Jos Gonalves Bs
to go to related fle, pressionando ento a tecla Ctrl e clicando somente uma
vez em cima do boto, movemos para uma nova fcha, onde colocaremos as
seguintes variveis: REG, MENARCA. Voltamos janela clicando no boto
Home ou Back que esto esquerda da janela, logo abaixo dos comandos de
gerenciamento de pginas. Antes surgir uma janela perguntando o nome da
tabela a ser criada. No caso, o programa sugere o mesmo nome do campo:
MULHERES. Aceitando, voltamos janela da primeira fcha.
Modifcando a ordem de entrada dos dados (Order of
FieldEntry [Taborder])
Quando criamos o questionrio, o Epi Info

ordena os dados conforme


sua posio na pgina: horizontalmente da esquerda para a direita e de cima
para baixo. Se mudarmos a posio da varivel, sua ordem tambm ser
alterada. Mas podemos modifcar essa ordem, se quisermos, talvez porque
sentimos que seria melhor de outro jeito.
Para modifcar a ordem de entrada de campo devemos usar o programa
Criar Ficha. Com a fcha aberta deveremos abrir o menu Edit, Order of
FieldEntry (Taborder). Uma janela aparecer (fgura 3.11). Nessa janela, Tab
Index signifca o nmero da ordem de entrada do campo. Podemos mudar essa
ordem selecionando a varivel que queremos e clicando nos botes Up (1) ou
Down (2) at chegar ao lugar ou ordem desejada. Repetimos esse procedimento
com as outras variveis at que todas estejam na ordem que quisermos.
Figura 3.11. Janela do Order of FieldEntry do Make View destacando os botes de movimentao das variveis.
Fonte: Epi Info

.
65 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Nossa tela fcaria mais ou menos conforme a fgura 3.12.
Figura 3.12. Viso fnal da fcha criada pelo exemplo.
Fonte: Epi Info

.
Depois de ter concludo isso, podemos passar para a prxima fase, que
a de introduo de dados. Para tanto, precisamos fechar o programa Criar
Ficha (Make View).
Criando a tabela de dados do View
Quando terminamos de criar a fcha e clicamos exit no menu File,
o programa nos pede um nome para a tabela nova, criando um arquivo de
dados em branco, podemos pr o mesmo nome que usamos para a fcha.
Quando colocamos os dados em uma tabela, o programa cria uma varivel
chave nica que identifca cada um dos registros, essa chave chamada
UniqueKey. O programa nos pergunta se queremos iniciar essa varivel pelo
nmero 1 ou outro valor. Ela no nos ajuda muito, por isso tanto faz iniciarmos
essa contagem a partir do nmero 1 ou no, assim deixamos como est e
simplesmente clicamos OK para criarmos a tabela.
Como criar duas fchas com as mesmas informaes
Para que os valores de uma fcha sejam transportados para
outra necessitamos copi-los para variveis permanentes. As variveis
permanentes mantm o valor que posteriormente dever ser copiado para
as variveis da outra fcha.
66
ngelo Jos Gonalves Bs
Os passos para a criao dessas variveis so (fgura 3.13):
1. No programa Criar Ficha (MakeView) abrir o
CheckCode no menu View.
2. Na janela que pede para escolher o campo onde a ao
vai ocorrer (Choose Field where action will occur), escolher a
opo DEFINEVARIABLES.
3. Defnir cada varivel como permanente (sugesto: para
transportar a varivel nome criar a varivel nome_transp).

Figura 3.13 Passos para a criao de variveis permanentes.
Fonte: Epi Info

.
Depois de criadas as variveis, necessitamos criar uma varivel que
executar a cpia dos valores para as variveis de transporte. Pode ser uma
varivel Check-code. No exemplo, estou criando a varivel copia e colocando
no prompt para selecionar a opo para enviar os dados para a fcha 2.
Assumindo que as variveis que queremos copiar da fcha inicial para
a outra fcha j estejam defnidas, devemos criar os comandos de cpia:
67 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


1. Menu View => Checkcode, escolher a varivel copia.
Vamos criar um comando para copiar os valores somente quando
a varivel for escolhida (valor=sim), usando um comando if
copia=(+) como na fgura 3.14.
Figura 3.14. Passos para a criao do comando que copia os valores entre as fchas
somente quando desejamos.
Fonte: Epi Info

.
2. Atribumos ento para as variveis transporte os
valores das variveis da fcha 1. No exemplo teramos conforme
o ilustrado na fgura 3.15.
Figura 3.15. Ilustrao dos comandos que copiam os valores desejados.
Fonte: Epi Info

.
3. Clicamos em ok para confrmar.
68
ngelo Jos Gonalves Bs
4. Agora necessitamos criar a fcha 2 criando um boto
de ligao. Antes disso necessitamos salvar a fcha 1 e fech-la.
Dessa maneira a tornamos me da prxima fcha.
5. Abrimos novamente a fcha 1 e criamos o boto de
ligao. O boto de ligao nada mais que uma nova varivel,
no caso chamada fcha2, onde escolhemos a opo Related
View na janela de defnio da varivel. Aps, abre uma janela
que nos permitir defnir se a fcha estar acessvel sempre
ou quando alguma condio for verdadeira. Como queremos
utilizar a varivel copia como comando para copiar as variveis,
vamos determinar que essa varivel precisa ser selecionada para
que a fcha seja acessvel. Os comandos para isso so simples,
conforme vemos na fgura 3.16.
Figura 3.16. Comandos para tornar a fcha 2 visvel.
Fonte: Epi Info

.
6. Agora necessitamos criar a nova fcha, ao clicarmos
OK, o programa vai perguntar se queremos criar uma fcha nova
ou associar o comando a uma fcha existente.
7. Com o boto Ctrl apertado clicamos em Ficha2. Isso
nos levar a uma fcha nova onde devemos criar as variveis
que desejamos copiar. Os nomes das variveis a serem copiadas
devem ser exatamente iguais aos da fcha 1. Esse procedimento
na realidade somente uma sugesto, mas vai facilitar muito.
Podemos tambm criar as variveis com a opo de somente
leitura, conforme vimos anteriormente na fgura 3.2. importante
que o tipo e formato da varivel seja idntico varivel da fcha 1.
69 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


8. Deveremos criar uma varivel que nos d o comando
para copiar os valores das variveis transporte para a fcha
2. No exemplo a seguir, a varivel confrma. importante
que ela seja a primeira varivel da fcha, fcando na posio
mais superior e esquerda da mesma para que seja a primeira
varivel a receber o cursor.
9. No comando CheckCode criamos, fnalmente, os
comandos que vo copiar os valores aps sairmos da varivel
confrma, conforme a fgura 3.17.
Figura 3.17. Comandos necessrios para copiar os valores das variveis que vo ter os mesmos resultados
em ambas as fchas.
Fonte: Epi Info

.
Introduzindo dados (Entrar Dados Enter Data)
uma etapa que no requer muita tecnologia, mas descreveremos
algumas dicas para facilitar nosso trabalho e evitar maiores transtornos.
Para tanto, vamos abrir o arquivo que queremos usando o programa Entrar
Dados (Enter Data). Clicar no menu File (Arquivo), ento Open (abrir) e
selecionamos o arquivo, no caso escolheremos o arquivo Seunome.mdb.
Depois de clicar Open, uma janela abrir perguntando que fcha (View)
queremos abrir. Temos duas fchas: Dados e Mulheres, como queremos a
fcha dados, selecion-la-emos.
70
ngelo Jos Gonalves Bs
Falaremos, agora, um pouco nos componentes da tela de introduo de
dados ilustrada na fgura 3.18.
Figura 3.18. Tela do Data Enter do Epi Info

destacando seus componentes.


Fonte: Epi Info

.
A primeira janela, a maior direita, a de introduo dos dados
(marcada como (1) na ilustrao). Os dados so colocados ou editados nesse
componente. Para mover entre uma varivel e outra usamos a tecla TAB ou
Enter. Se preenchermos totalmente o espao da varivel, automaticamente
o cursor passar para a prxima varivel, conforme defnida pela ordem de
entrada. direita em cima na tela, temos a janela das pginas (2), nela podemos
observar qual pgina est aberta, no caso estamos trabalhando com a pgina 1,
que nica. As pginas movem automaticamente depois que a ltima varivel
de cada pgina introduzida, at mesmo se a pgina estiver em branco, exceto
se existir uma varivel cujo valor foi defnido como necessrio (Required).
Igualmente, quando terminamos de colocar os dados na ltima pgina, um
registro novo aberto. Se, por alguma razo, quisermos colocar um registro
novo antes que terminemos de colocar todos os dados do registro atual,
podemos clicar no boto New (5). Na parte mais baixa da janela, esquerda
(3), o programa mostra o nmero do registro que estamos trabalhando e se
aquele registro novo (New Record Registro novo) ou no. Se quisermos,
podemos mover para o registro prvio clicando no sinal <. Isso far com que
o cursor mova para o registro prvio (na mesma pgina). Se o registro que
estamos trabalhando novo e no tem nenhum dado, o Epi Info

nos dar a
opo para salvar o registro em branco. Fazendo isso, podemos nos mover
ao registro prvio sem salvar ou podemos cancelar o comando e retornar ao
71 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


registro novo. Se quisermos pular para o primeiro registro, clicamos em <<.
Igualmente, se quisermos mover para o prximo registro clicamos > e para o
ltimo registro em >>. Esse comando s mover para um prximo registro
existente, no comea um registro novo.
Apagando registros (Mark Record as Deleted)
Se quisermos apagar um registro, podemos fazer isso clicando em Mark
Record as Deleted (Marcar registro como apagado) (4). Como o comando
diz, na realidade o programa no ir apagar o registro, somente o esconde.
Poderemos recuper-lo posteriormente clicando na opo Recuperar.
O Epi Info

salvar o arquivo automaticamente, aps cada adio de


fcha, mas sempre um hbito saudvel salvar o arquivo de vez em quando.
Fazendo isso, nosso trabalho no sofre surpresas desagradveis. Para esse
propsito temos um boto chamado Save data (Salvar dados) (4). Como o
Epi Info

salva os dados automaticamente enquanto introduzimos os dados,


tambm um bom hbito manter pelo menos uma cpia de segurana do
projeto que estamos trabalhando.
Caractersticas de introduo de algumas variveis
1. Variveis Numricas com ponto decimal: quando
temos que colocar uma varivel com valores decimais, devemos
colocar, evidentemente, os nmeros inteiros primeiro e, depois, o
carter decimal, ponto, mesmo se no tivermos preenchido todo o
espao inteiro. Por exemplo, para colocar o peso de uma mesma
pessoa magra: 22.5. Deveremos digitar exatamente assim: 2 2 .
5 . Observe que ter um espao entre o segundo 2 e o . 5. No
precisamos nos preocupar com isso, pois o Epi Info

introduzir
o correto valor antes de salvar os dados.
2. Variveis Check Box: no precisamos clicar com o
mouse no local da varivel, bastante apertar a barra de espao
do teclado e a caixa fcar selecionada. Para desselecionar, basta
apertarmos a barra de espao novamente.
3. Data contendo ano: podemos digitar somente os ltimos
dois dgitos do ano, o Epi Info

transformar automaticamente
em quatro dgitos. Porm, deveremos ter cuidado porque valores
iguais ou superiores a 50 o programa converter para 19NN.
72
ngelo Jos Gonalves Bs
Porm, se tivermos um valor inferior, por exemplo, 49, o programa
transformar em 2049! Por isso, um bom hbito sempre introduzir
todos os quatro dgitos do ano.
4. Variveis tipo Texto com valores legais: no precisamos
escrever a resposta inteira, nem usar o mouse para selecionar a
resposta, na caixa de respostas. Basta digitar as primeiras letras
da resposta. Precisamos introduzir mais de uma letra se tivermos
duas ou mais respostas que comeam com as mesmas letras. Por
exemplo, se temos duas variveis que comeam com a letra s
teremos que colocar as primeiras duas letras. Se tivermos duas ou
mais respostas que comeam com se deveremos colocar trs,
e assim por diante, at que coloquemos um nmero sufciente de
letras de forma que a resposta fque nica.
5. Variveis Yes/No: elas funcionam como uma varivel
tipo texto com valores legais: precisamos colocar s a primeira
letra: y ou n.
73 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Crie uma fcha para o questionrio fornecido abaixo, denomine
o arquivo ApoeA e tabela Grupo1. Chame os nomes dos
campos como:
ID (identifcao ###),
GENERO (texto Masc/Fem),
VISITA (data da primeira visita (MM-DD-YYYY)),
IDADE (nmero ###.#),
COLESTEROL (###),
PAS (primeiro valor, presso sistlica, ###),
PAD (segundo valor, presso diastlica, ###),
IMC (##.##),
CIGARRO (Nunca, Atual, Exfumante),
TEMPO (##.#),
EVENTO (yes/no),
APOE4 (check box).
Inclua informao sobre o modo como os dados deveriam ser
introduzidos. (Observao: a presso arterial no necessita aparecer como no
formulrio, pois deve ser defnida com duas variveis separadas.)
2. Introduza os dados conforme os questionrios abaixo:
Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 1
Gnero: Masc
Data da primeira visita: 5/15/80
Idade na primeira visita: 17.2
Estado na primeira visita:
74
ngelo Jos Gonalves Bs
Colesterol total: 167 (mg/dl)
Presso arterial:107/74(mmHg)
ndice de Massa Corporal: 20.81 (kg/m)
Fumou alguma vez: Nunca
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 18.6
Alelo ApoE4: No
Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 2
Gnero: Fem
Data da primeira visita: 6/8/88
Idade na primeira visita: 19.5
Estado na primeira visita:
Colesterol total: 106 (mg/dl)
Presso arterial: 99 / 54(mmHg)
ndice de Massa Corporal: 20.80 (kg/m)
Fumou alguma vez: Atual
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 10.5
Alelo ApoE4: Sim
75 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 3
Gnero: Masc
Data da primeira visita: 3/27/90
Idade na primeira visita: 19.8
Estado na primeira visita:
Colesterol total: 175 (mg/dl)
Presso arterial: 130/90(mmHg)
ndice de Massa Corporal: 21.53 (kg/m)
Fumou alguma vez: Nunca
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 8.7
Alelo ApoE4: No
Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 4
Gnero: Masc
Data da primeira visita: 7/20/71
Idade na primeira visita: 19.9
Estado na primeira visita:
Colesterol total: 166 (mg/dl)
76
ngelo Jos Gonalves Bs
Presso arterial: 110/80(mmHg)
ndice de Massa Corporal: 20.34 (kg/m)
Fumou alguma vez: Nunca
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 27.4
Alelo ApoE4: No
Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 5
Gnero: Masc
Data da primeira visita: 7/20/69
Idade na primeira visita: 21.3
Estado na primeira visita:
Colesterol total: 206 (mg/dl)
Presso arterial: 123/88(mmHg)
ndice de Massa Corporal: 34.44 (kg/m)
Fumou alguma vez: Nunca
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 29.4
Alelo ApoE4: Sim
77 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 6
Gnero: Masc
Data da primeira visita: 7/16/87
Idade na primeira visita: 21.3
Estado na primeira visita:
Colesterol total: 158 (mg/dl)
Presso arterial: 115/65(mmHg)
ndice de Massa Corporal: 21.7 (kg/m)
Fumou alguma vez: Exfumante
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 11.4
Alelo ApoE4: Sim
Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 7
Gnero: Masc
Data da primeira visita: 12/8/90
Idade na primeira visita: 21.4
Estado na primeira visita:
Colesterol total: 124 (mg/dl)
78
ngelo Jos Gonalves Bs
Presso arterial: 140/90(mmHg)
ndice de Massa Corporal: 25.07 (kg/m)
Fumou alguma vez: Exfumante
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 8
Alelo ApoE4: No
Questionrio para Alelo ApoE4 e Evento Coronrio.
ID: 8
Gnero: Fem
Data da primeira visita: 6/8/91
Idade na primeira visita: 21.5
Estado na primeira visita:
Colesterol total: 146 (mg/dl)
Presso arterial: 109/70(mmHg)
ndice de Massa Corporal: 22.61 (kg/m)
Fumou alguma vez: Exfumante
Sobre o evento:
Teve evento coronariano? No
Tempo de acompanhamento: 7.5
Alelo ApoE4: Sim
Captulo 4
GERENCIANDO OS DADOS
Estrutura do Programa Analysis Data (Anlise de Dados):
Quando abrimos o programa Analysis Data (Anlise de Dados)
aparece uma tela (fgura 4.1) com trs janelas: Analysis esquerda, Analysis
Output em cima e Program Editor abaixo:
Figura 4.1. Tela do Analysis do Epi Info

.
Fonte: Epi Info

.
Na janela Analysis esto os comandos de anlise, cujos resultados
sero vistos na janela Analysis Output. Na janela Program Editor aparecer o
comando em sua linguagem de programao.
Abrindo banco de dados no Epi Info

Para abrirmos um banco de dados para anlise ou visualizao,


utilizamos o comando Read (Import) [Abrir (Importar)]. Automaticamente,
quando clicamos nesse comando, abrir uma janela posicionando para abrir o
80
ngelo Jos Gonalves Bs
ltimo projeto (arquivo) utilizado. Observamos na janela READ (fgura 4.2)
que o primeiro compartimento chama-se Current Project (Projeto atual). O
compartimento informa o projeto que est ativo, mas no podemos alterar o
projeto nessa janela. Se o projeto ativo no for o projeto (arquivo .mbd) que
queremos utilizar, devemos clicar no boto Change Project (Mudar Projeto).
Se abrirmos um outro banco de dados, sem alterarmos o projeto ativo, criar-
se- um vnculo desnecessrio com o projeto antigo.
Figura 4.2. Janela do comando Read do Analysis.
Fonte: Epi Info

.
Mudando o projeto ativo (Change Project)
Ao clicarmos em Change Project (Mudar Projeto), surgir ento a janela
para localizarmos o arquivo que desejamos abrir ou criar. Para criar um novo
arquivo, basta colocar um nome novo. Devemos prestar ateno onde ele ser
salvo. Criar um arquivo novo pode ser importante quando estamos importando
81 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


um banco de dados em outro formato, por exemplo, Epi 6 ou Excel.
Vamos selecionar o arquivo criado no captulo anterior: Seunome.mdb.
(o leitor poder utilizar o arquivo Exemplo.mdb, que se encontra no folder
Dados do Site www.pucrs.br\igg\epiinfo).
Aps abrirmos um projeto (banco de dados), aparecer, na janela
chamada Views, o nome do questionrio ou tabela de dados existente
precedido da palavra view (no exemplo: ViewDados). Devemos selecion-
la clicando com o mouse uma vez e, em seguida, clicamos OK para abrir a
tabela de dados. Veremos que, na janela Analysis Output aparece o nome
do arquivo e a respectiva tabela que estamos trabalhando (1). Na linha
seguinte aparece o nmero de fchas vlidas com detalhes a respeito da data
da ltima atualizao. Na janela Program Editor aparece o comando em sua
linguagem de programao (2).
Figura 4.3. Janela de resultado (Analysis Output) e programa editor (Program Editor) criados pelo
comando Read.
Fonte: Epi Info

.
82
ngelo Jos Gonalves Bs
Observando os dados (Comando List)
Figura 4.4. Janela do comando List do Analysis.
Fonte: Epi Info

.
O comando List o primeiro comando do grupo Statistics da janela
Analysis Command. Ele utilizado para visualizar ou editar os dados. Clicando
uma vez no comando, aparecer a janela do comando (fgura 4.4): No item
Variables (1), podemos escolher as variveis que desejamos. O Epi Info


dispe as variveis em ordem alfabtica, no respeitando a ordem em que as
coloquemos na tabela. Devemos selecionar uma varivel de cada vez ou todas,
aceitando o comando asterisco (*), que seleciona todas. No caso, desejamos
mostrar todas as variveis. Poderamos tambm selecionar s as variveis que
no desejssemos, assim deveramos marcar a caixa All (*) Except e selecionar
as variveis no desejadas. Na lista obteremos as variveis selecionadas tambm
em ordem alfabtica no importando a ordem de seleo que escolhermos.
83 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Tipo de sada dos dados no List
Figura 4.5. Janela do comando List do Analysis usando a opo Web (HTML).
Fonte: Epi Info

.
Automaticamente o Epi Info

posiciona a opo do tipo de sada


(Display Mode (3)) para o formato de Grade (Grid). Essa opo dispe os
dados em colunas muito parecidas com planilhas tipo Excel. Podemos alterar a
largura das colunas colocando o cursor do mouse entre os nomes das colunas,
essa opo no permite atualizao. Se quisermos ter a oportunidade de editar
os dados, devemos selecionar a opo Allow Updates (Permitir Atualizao).
Ela til para corrigir valores incorretos que descobrimos durante a anlise
de dados. Iremos ver alguns exemplos de seu uso mais adiante. Se quisermos
imprimir as variveis, devemos utilizar outra opo. A opo Web (HTML) salva
as variveis em formato de pgina da Web, permitindo que se imprima ou que
se edite posteriormente. Algumas opes adicionais so possveis conforme
84
ngelo Jos Gonalves Bs
a fgura 4.5. Podemos selecionar quantas colunas desejamos por pgina na
opo Fields per Page, no caso devemos colocar o nmero de variveis. As
observaes so normalmente identifcadas pelo nmero da linha em que elas
esto posicionadas. A opo Line Numbers no necessita ser selecionada.
Juntando dois bancos de dados com o comando Merge
O comando Merge til para juntar dois bancos de dados, que devem
ter pelo menos algumas variveis idnticas, com dados a serem adicionados
ou atualizados. Pode ser o caso de dois pesquisadores colocarem dados
separadamente, ou quando utilizamos mais do que um computador para colocar
os dados e desejamos transferir esses dados para um nico computador. O
comando o ltimo comando da seco Data da janela Analysis Command.
Figura 4.6. Janela do comando Merge do Analysis destacando seus diversos componentes.
Fonte: Epi Info

.
A janela do comando Merge muito parecida com a janela do Read.
Se o arquivo que queremos juntar no est no formato Epi Info

2000,
85 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


devemos selecionar o formato na janela Data Formats (1). Selecionamos o
local do banco de dados que queremos juntar na janela Data Source, clicando
no cone da direita que tem trs pontos (2). No exerccio vamos abrir o arquivo
Avaliacao.mdb que est no folder Exerccios do site www.pucrs.br\igg\epiinfo.
Selecionamos o ViewPalma. Note que devemos estar com o arquivo Seunome.
mbd ou Exemplo.mdb aberto.
O comando Merge possui duas opes importantes: o Update (Atualiza)
e o Append (Adiciona) (3). O Update vai juntar os arquivos procurando
somente dados em comum que tenham a mesma fcha, identifcada por uma
chave que veremos a seguir. Quando encontra uma fcha semelhante, atualiza
os dados pelo arquivo novo, alterando os dados do arquivo inicialmente
aberto. Quando a varivel a mesma (exatamente a mesma) os valores so
atualizados. Quando a varivel nova, ou com nome diferente, no acrescenta
essa varivel ao banco de dados antigo (que estava aberto antes de iniciar o
comando Merge). importante destacar que o Epi Info

trata variveis com


nomes parecidos como variveis diferentes. Por exemplo, as variveis EST_
CIV e ESTCIV so consideradas variveis distintas. A opo Append adiciona
fchas novas ao banco de dados antigo. Igualmente, nessa opo, variveis
com nomes no idnticos sero consideradas variveis diferentes.
Figura 4.7. Janela do comando Relate do Merge destacando os compartimentos Current table(s),
Available Variables e Related Table.
Fonte: Epi Info

.
86
ngelo Jos Gonalves Bs
Mais um passo necessrio para juntarmos dois bancos de dados: criar
uma chave de ligao. Essa chave (Key) ensinar o Epi Info

quais fchas so
iguais e sero atualizadas e quais so diferentes e sero adicionadas. Na janela
do Merge (juntar) clicamos no boto Build Key (5) situado em baixo esquerda.
Se a opo no est disponvel por que nenhum View foi selecionado. Surgir
a janela Relate Build Key (fgura 4.7), com trs componentes principais: (1)
Current Table(s) que se refere tabela inicialmente aberta (antiga). Available
Variables (2) onde selecionaremos a(s) varivel(is) que vo compor a chave
de relacionamento e o boto Related Table que se refere nova tabela a ser
juntada. Na maioria das vezes, temos uma nica varivel que identifca as
fchas. No caso do nosso exerccio, a varivel REG a que ser utilizada. Com
o Current Table(s) selecionado, procuramos na janela Available Variables a
varivel REG. As variveis estaro, como sempre, em ordem alfabtica, mas
podemos digitar algumas letras da varivel e ela aparecer mais facilmente.
Depois de selecionada a varivel da tabela atual (antiga), passaremos para
defnio da varivel da tabela nova (tabela relacionada). Para tanto devemos
selecionar o boto Related Table. Observamos que a varivel REG da tabela
antiga est na janela logo abaixo do Current Table(s). Novamente, na lista
de variveis, procuramos a varivel da tabela nova, no caso tem o mesmo
nome da tabela antiga: REG. Feito isso, clicamos OK duas vezes para retornar
janela Merge. Com a chave pronta podemos fnalizar o processo clicando
OK. O programa solicita um nome para realizar a ligao dos dois bancos de
dados. Podemos colocar qualquer palavra como, por exemplo, junta.
Aparecer, na janela Analysis Output, o resultado do processo de
agrupamento, com mais fchas que anteriormente. Podemos verifcar o
processo pelo comando List.
Criando novas variveis (comando Defne)
Podemos criar novas variveis, por exemplo, a partir de variveis j
existentes. Esse processo, no Epi Info

, obedece algumas etapas. Primeiro,


devemos defnir um nome para essa varivel, criando assim uma varivel
em branco, ou virtual. No exerccio, devemos criar uma varivel para ndice
de Massa Corporal, ou simplesmente IMC. O IMC um parmetro muito
utilizado que relaciona o peso e a altura de uma pessoa e proporciona critrios
para defnir se uma pessoa obesa ou magra. Assim, depois de criado,
utilizaremos o IMC para criar uma varivel chamada OBESIDADE. Enquanto
no salvarmos o arquivo, essas variveis sero sempre temporrias.
87 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Primeiro vamos defnir as variveis: na seco Variables (Variveis),
clicaremos no primeiro comando, Defne (Defnir). Na janela, colocamos
o nome das variveis, uma de cada vez. Manteremos selecionada a opo
Standard que mantm a varivel somente durante a execuo do Epi Info

.
Variveis podem ser defnidas como Permanent(e) quando desejamos utiliz-
las em todas as vezes que utilizamos o Epi Info

, enquanto varivel Global


manter-se- na memria do programa, enquanto estivermos usando o mesmo
projeto. No exerccio, nossas variveis sero padres. Colocamos ento o
nome da primeira varivel (IMC) e clicamos OK. Repetimos o processo para
criar a varivel OBESIDADE.
Usando comando Assign (Atribuir)
Usamos o comando Assign (Atribuir) para transformar variveis,
principalmente as numricas. No caso do nosso exerccio, vamos usar as variveis
ALTURA e PESOATUAL para calcular o IMC. O comando o terceiro da seco
Variables (Variveis). Clicando nele obteremos a janela observada na fgura 4.8.
Figura 4.8. Janela do comando Assign destacando seus trs compartimentos.
Fonte: Epi Info

.
O primeiro compartimento, Assign Variable (1), serve para defnir para
qual varivel ser atribudo o valor. No segundo, = Expression (2), ser colocada
a frmula que defnir o valor e as variveis da frmula sero selecionadas no j
conhecido Available Variables (3). No exerccio, para calcular o IMC, devemos
ento colocar essa varivel no primeiro compartimento (Assign Variable). O IMC
defnido como o peso, em quilos, dividido pela altura, em metros, ao quadrado.
88
ngelo Jos Gonalves Bs
Nossa frmula ser ento: PESOATUAL/(ALTURA/100)^2, onde devemos dividir
a altura por 100, porque ela est em centmetros, a expresso ^2 eleva ao quadrado
nosso valor. Ao clicar OK, o programa no nos informa se nossa frmula est
correta ou no. Por isso, observaremos o resultado usando o List para ALTURA,
PESOATUAL e IMC, mas com a opo Update checada, que permite atualizao.
Figura 4.9. Janela de resultado do commando List aps a criao da varivel IMC.
Fonte: Epi Info

.
Observamos na fgura 4.9 que um dos IMC (chamado aqui de Expr1002)
no compatvel com a vida, pois tem um valor muito maior que os outros.
Observamos tambm que o valor de peso desse registro foi introduzido de forma
incorreta: 663. Revisando o questionrio da mesma pessoa observamos que o
valor correto 66,3. Podemos corrigir na prpria janela, pois estamos usando a
opo que permite atualizao. Em algumas verses de Windows, o valor de IMC
ser corrigido automaticamente. Caso isto no acontecer, poderemos tambm
corrigir o IMC na janela, mas existe uma forma mais segura de recalcular o
mesmo rodando o comando Assign novamente.
Utilizando o Program Editor
Quando desejamos repetir um comando, basta localiz-lo na janela
de programao: Program Editor, que fca situada na parte inferior direita
na tela. Colocamos o cursor em cima do programa que fez o Assign do
IMC, dentro da janela de programao, clicando somente uma vez. No
necessitamos selecionar o programa, basta que o cursor fque piscando em
qualquer parte dele. Feito isso, clicamos na ltima barra da direita da janela
Program Editor, chamada Run This Command. Novamente podemos fazer o
List para verifcar o resultado do novo Assign. Para tanto, podemos novamente
89 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


utilizar o programa que est no Program Editor, dessa vez apagando a palavra
update, e clicar novamente na barra Run This Command.
Utilizando o Recode
Utilizamos o Recode, quarto comando da seco Variables, para
recodifcar variveis categricas (texto). O comando Recode utiliza somente
uma nica varivel para recodifcar outra ou ela mesma. No exerccio,
utilizaremos o comando para defnir nveis de obesidade, baseados no IMC.
Utilizaremos o seguinte critrio:
Se IMC menor que 20 kg/m
2
ento OBESIDADE = magro
Se IMC maior ou igual a 20 e menor que 25 ento OBESIDADE = normal
Se IMC maior ou igual a 25 e menor que 30 ento OBESIDADE = sobrepeso
Se IMC maior ou igual a 30 ento OBESIDADE = obeso
Figura 4.10. Janela do comando Recode destacando os compartimentos From, To e Fill Ranges.
Fonte: Epi Info

.
90
ngelo Jos Gonalves Bs
Observamos que o critrio mais baixo 20 e que se modifca a cada
5 kg/m
2
at 30Kg/m
2
. Existem duas maneiras de colocar esses cdigos. A
maneira mais fcil nos ensinar como colocar os cdigos da outra maneira.
Vamos abrir a janela do Recode. No primeiro compartimento superior
esquerda (From (1)) da janela do comando (fgura 4.10) colocamos a varivel
que vai defnir os critrios de recodifcao. A varivel a ser recodifcada ser
colocada ao lado, no compartimento To (2). No exerccio temos duas variveis,
mas poderia ser a mesma varivel. Antes de iniciarmos a defnir os intervalos,
devemos observar se o valor que usamos como limite pertence margem
superior ou inferior. No caso do IMC, os valores 20, 25 e 30 pertencem
margem inferior, pois esta est classifcada como maior ou igual, as margens
superiores no incluem o igual. Observamos que os intervalos tm tamanho
fxo de 5 nos grupos. A maneira mais fcil de defnir os intervalos usando a
opo Fill Ranges, no boto em baixo esquerda marcado com (3).
Usando a opo Fill Ranges
Figura 4.11. Janela Fill Ranges do comando Recode destacando seus compartimentos.
Fonte: Epi Info

.
91 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


A opo Fill Ranges do Recode produz uma nova janela que nos
facilita montar os cdigos. Como vemos na fgura 4.11, existem trs
compartimentos importantes: o Start, que defne o valor do intervalo menor,
o End, que defne o valor do intervalo maior, e, fnalmente, o By que defne
o intervalo entre os grupos. No caso do exerccio, o valor do intervalo menor
20, que o limite mximo para defnio de magro, o valor do intervalo
maior 30, pois o menor valor para a defnio de obeso, e o intervalo entre
os grupos 5. Assim nossa janela fcar conforme a fgura 4.11. Como os
valores de referncia pertencem aos limites inferiores dos intervalos temos
que selecionar a opo Reverse, por motivos que veremos a seguir.
Figura 4.12. Janela do comando Recode mostrando os cdigos para a varivel OBESIDADE.
Fonte: Epi Info

.
Ao clicarmos OK, o programa retorna para a janela anterior (fgura
4.12) com os intervalos j construdos: o cdigo HIVALUE defne que o
92
ngelo Jos Gonalves Bs
intervalo incluir o valor maior que existir na nossa amostra, independente do
valor (corresponderia ao infnito positivo). O cdigo LOVALUE corresponderia
ao menos infnito (ou infnito negativo). Observamos que nas colunas de
defnio dos valores de referncia so colocados somente os nmeros ou os
dois cdigos de limite mximo e mnimo.
Observamos tambm que a primeira defnio inclui o valor (>=30). Se
no tivssemos colocado a opo Reverse, a primeira opo seria <=20, o que
no corresponderia a nossa defnio de Magro (<20). Para fnalizar podemos
substituir os cdigos na coluna Recoded Value pelos cdigos que tnhamos: obeso,
sobrepeso, normal e magro, conforme a sequncia do exerccio e clicamos OK.
Figura 4.13. Detalhe da janela Fill Ranges para a varivel DISLIPIDEMIA.
Fonte: Epi Info

.
Em outro exemplo, vamos defnir a varivel DISLIPIDEMIA como
sendo valores maiores que 200 como DISLIPIDEMIA sim, e 200 ou menores
como sendo DISLIPIDEMIA no. Nesse caso, o valor de referncia pertence
ao limite superior do intervalo. Podemos tambm utilizar o Fill Range
novamente. O limite mximo e mnimo ser igual: 200; como temos que
colocar um By, colocamos 200 novamente, como na fgura 4.13. Observamos
que no caso no usamos a opo Reverse, porque o limite mnimo no valor de
referncia pertence ao limite superior e no ao inferior.
Salvando o arquivo (comando Write)
Para salvar as variveis que criamos e torn-las, assim, permanentes,
devemos salvar o nosso arquivo. Com esse objetivo usamos o comando
Write (Export) da seco Data. Na fgura 4.14 observamos que o programa
automaticamente seleciona a opo Append enquanto, na maioria das
vezes, vamos querer utilizar a opo Replace (1). Imediatamente devemos
93 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


marcar o boto correspondente para que no venhamos a nos arrepender
quando for tarde demais.
Figura 4.14. Janela do comando Write destacando seus componentes.
Fonte: Epi Info

.
No compartimento Variables, podemos escolher quais variveis
queremos salvar ou, ao contrrio, no salvar. No compartimento File Name
escolhemos o nome do arquivo que queremos salvar. No exerccio, salvaremos
no mesmo nome que tnhamos aberto: Seunome.mdb. Necessitamos ainda
defnir em qual tabela sero salvos os dados, na mesma tabela ou em outra no
compartimento Data Table. No exerccio, usaremos a mesma tabela: Dados.
Podemos salvar o arquivo em outro formato que no o de Epi Info

, mas isso
fca como lembrana aqui.
94
ngelo Jos Gonalves Bs
Salvando o programa Obesidade
Figura 4.15. Janela Save Program do Program Editor.
Fonte: Epi Info

.
Muitas vezes criamos alguns comandos que nos sero muito teis
no futuro. Por exemplo, os comandos que defnem e recodifcam a varivel
OBESIDADE. Podemos salvar esses comandos para um uso futuro. Assim, na
janela Program Editor, apagamos todos os comandos que no pertencem aos
cdigos da defnio e recodifcao fcando s os comandos:
DEFINE obesidade
RECODE imc TO obesidade
30 - HIVALUE = obeso
25 - 30 = sobrepeso
20 - 25 = normal
LOVALUE - 20 = magro
END
No Program Editor, escolher Save. Aparecer a janela, onde colocaremos
o nome do programa: Obesidade, conforme a fgura 4.15.
95 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Abra o arquivo ApoeA.mdb tabela Grupo1, criado no captulo
passado (ou contido no folder Dados do site www.pucrs.br\
igg\epiinfo), modifcando o projeto ativo. Junte com o arquivo
ApoeB.mdb tabela Grupo2, no folder Exerccios do site www.
pucrs.br\igg\epiinfo, usando como Build Key a varivel ID.
2. Defna e crie a varivel OBESIDADE utilizando o programa
criado durante a aula. (Detalhe: clique em OPEN no Program
Editor, para achar o programa necessrio mudar o projeto na
janela de abertura.) Execute o programa e faa o List do IMC e
obesidade.
3. Defna as variveis IDADEEVENTO, DISLIPIDEMIA e
HIPERTENSO.
4. Recodifque DISLIPIDEMIA a partir do nvel de COLESTEROL
sendo >200 sim, 200 ou menos no. (Cuidado com a posio
das variveis!!=> na primeira janela vai o COLESTEROL.)
5. Recodifque HIPERTENSO a partir do nvel de PAS sendo
>=140 sim, menos no.
6. Atribua IDADEEVENTO=IDADE+TEMPO.
7. Salve com o mesmo nome original: ApoeA, tabela Grupo1
(cuidado com a opo Adicionar, o nome da tabela no pode ter
espao nem acento).
Captulo 5
IMPORTANDO DADOS E MANIPULANDO
VARIVEIS
Abrindo banco de dados em formato Epi Info

6.0
Como vimos, o Epi Info

trabalha com um banco de dados em formato


MS-ACCESS. Esse formato nos permite trabalhar com vrias tabelas; no Epi
Info

essas tabelas (tables) so relacionadas a uma fcha (View). Se quisermos


usar um arquivo em formato Epi Info

verso 6.0 poderemos transformar esse


em um com formato Epi Info

, pelo programa Make View.


Com o programa MakeView (CriarFicha) sem qualquer arquivo
aberto, devemos clicar no menu Tools (Ferramentas), a primeira opo Import
Epi 6 REC fle (Importar arquivo .Rec do Epi 6). Selecionando o arquivo que
queremos abrir, o programa pede o nome do novo arquivo que queremos criar
(arquivo novo) ou o nome do arquivo onde queremos colocar a fcha e a tabela
(se o arquivo j existe). Depois de fazer isso, clicamos em Abrir (Open) e
esperamos uns segundos. O programa ento pede o nome da tabela de dados
que queremos criar. Automaticamente o programa oferece o mesmo nome do
arquivo do Epi 6, podemos aceitar aquela sugesto ou usar a vantagem de
usar um nome mais longo. No exerccio, ao fnal do capitulo, o leitor ter a
oportunidade de executar esse comando.
Importando dados em formato Excel
Vamos ver como se importa um arquivo do Excel no Epi Info

.
Quando desejamos importar informaes de um banco de dados com outra
formatao, devemos tomar alguns cuidados. Antes de abrirmos o arquivo
devemos ver se ele est estruturado apropriadamente para podermos import-
lo sem difculdade. Em primeiro lugar, os dados devem estar todos em uma
mesma planilha ou que tenham, em todas as planilhas, uma varivel que
identifque cada um dos registros (no caso do Excel, linhas). Essa varivel
pode ser, por exemplo: REGISTRO, NOME ou outro indicador. As variveis
devem estar indicadas na primeira linha, sem espao, sem acento e com nomes
distintos como na fgura 5.1.
97 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 5.1. Detalhe de um arquivo com formato Excel pronto para ser importado.
Fonte: Microsoft Excel, arquivo Avaliacao.xls.
Alm disso, nas planilhas que queremos importar no devem conter
fguras, outras tabelas ou valores e informaes alm dos dados que desejamos.
Para evitar possveis incompatibilidades recomendvel no utilizar acentos
ou espaos na primeira linha.
Partindo dessas premissas, podemos importar os dados utilizando o
programa Analysis Data, comando Read (Import). No compartimento Data
Formats, escolhemos a verso mais apropriada do Excel; dependendo da verso
que foi utilizada. Costumo, na dvida, escolher a verso mais atual: Excel 8.0,
que utilizada pelo Offce 2000. No exerccio vamos importar o banco de
dados Avaliacao.xls que est no folder Exerccio do site www.pucrs.br\igg\
epiinfo. Observamos que o programa automaticamente mostra as planilhas
(Worksheets) do arquivo, por isso ele demora um pouco, pois necessita ler o
arquivo primeiro. Vamos escolher a planilha avaliacao. Observe que no
alteramos o projeto anteriormente em uso. Aps clicar OK surgir uma janela
confrmando se a primeira linha possui o nome das variveis. Como sempre,
aps abrir um banco de dados, o programa informa o nmero de observaes
98
ngelo Jos Gonalves Bs
e o dia da ltima atualizao do arquivo lido. Sempre importante, aps
importarmos ou lermos um banco de dados, que no nos familiar; observar
quais os tipos de variveis dispomos. Assim, aps importarmos os dados,
deveremos fazer um List de todas as variveis.
Utilizando o Recode (reviso)
Observamos, no banco de dados recm-importado, que existe a
varivel IMC, mas no existem as variveis OBESIDADE, DISLIPIDEMIA
e HIPERTENSO. Utilizaremos o Recode, de novo, para recodifcar essas
variveis. Antes disso devemos defni-las, usando o comando Defne.
Utilizaremos o seguinte critrio para OBESIDADE:
Se IMC maior ou igual a 30 ento OBESIDADE= obeso.
Se IMC maior ou igual a 25 e menor que 30 ento OBESIDADE= sobrepeso.
Se IMC maior ou igual a 20 e menor que 25 ento OBESIDADE = normal.
Se IMC menor que 20 kg/m
2
ento OBESIDADE= magro.
Nosso comando deve fcar assim:
RECODE imc TO obesidade
30 - HIVALUE = obeso
25 - 30 = sobrepeso
20 - 25 = normal
LOVALUE - 20 = magro
END
Finalmente, utilizaremos o seguinte critrio para Dislipidemia:
Se COLESTEROL >=240 ento DISLIPIDEMIA = Elevada.
Se COLESTEROL >=200 e < 240 ento DISLIPIDEMIA = Moderada.
Se COLESTEROL <200 ento DISLIPIDEMIA = Normal.
99 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Nosso comando deve fcar assim:
RECODE COLESTEROL TO DISLIPIDEMIA
240 HIVALUE = Elevada
200 240 = Moderada
LOVALUE 200 = Normal
END
Utilizando o comando IF
Podemos utilizar o comando IF para recodifcar uma varivel baseada
em duas outras variveis. Por exemplo, podemos chamar uma pessoa de
hipertensa se ela tiver a presso sistlica maior que 140 ou diastlica maior
que 90. Para tanto usamos o comando IF.
Figura 5.2. Janela do comando IF destacando os compartimentos If Condition, Then e Else.
Fonte: Epi Info

.
No compartimento (1) da janela do comando IF (fgura 5.2),
colocamos nossa condio: PAS>140 or PAD >90. Na janela (2) colocamos o
que queremos que seja feito nessa condio: assign HIPERTENSAO= Sim
100
ngelo Jos Gonalves Bs
ou o smbolo de SIM do Epi Info

(+). No else (3) colocamos um novo assign:


HIPERTENSAO = (-). A janela vai fcar assim:
IF PAS>140 or PAD >90 THEN
ASSIGN HIPERTENSAO= yes
ELSE
ASSIGN HIPERTENSAO=no
END
Vamos salvar esse programa para utiliz-lo novamente no exerccio de
hoje. Antes disso, devemos salvar o nosso projeto como Avaliacao.mdb e tabela
Avaliacao. Aps vamos apagar todos os comandos que no nos interessam
como o Read, o List e o Write, salvaremos o programa como classifcacao.
Fechamos o Analysis Data.
Criando uma fcha a partir da tabela (Make View from Data Table)
Quando criamos um programa em outro formato e salvamos os dados
no formato Epi Info

, ser conveniente criarmos tambm uma fcha (View).


Para tanto, utilizamos o programa Make View; no menu Tools encontramos
o Make View from Data Table ou no prprio menu Utilities do Epi Info


escolhemos a opo Table-to-View. Clicando em qualquer um dos comandos,
a janela de seleo de arquivo ser aberta. Vamos selecionar o arquivo que
recm criamos: Avaliacao.mdb. Aps isso o programa pedir a tabela que ser
a nica do arquivo: Avaliacao. Surgir uma nova janela ilustrada na fgura 5.3.
Figura 5.3. Janela de criao de fcha a partir de uma tabela.
Fonte: Epi Info

.
101 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Para incluir todas as variveis na nossa fcha devemos clicar em >>.
Finalmente clicamos em Save. s vezes, por algum motivo, esse comando
no funciona, isso tem ocorrido principalmente em computadores que esto
interligados por rede (sistema de Network). Quando isso acontece no
podemos criar a fcha por esse mtodo. Esse problema no tem ocorrido com
a verso atual do programa. Mas, na impossibilidade de criar uma, podemos
trabalhar com um arquivo mesmo sem fcha.
Observando frequncias de variveis (comando Frequencies)
Figura 5.4. Janela do comando Frequencies destacando os compartimentos Frequency of e Stratify by.
Fonte: Epi Info

.
Na seco Statistics do Analysis, com o comando Frequencies, que o
segundo comando, podemos observar a frequncia de distribuio das variveis
de tipo texto. Na realidade poderamos ver a frequncia das respostas de todas
as variveis, mas as variveis numricas contnuas so pouco apropriadas para
isso. Como elas so contnuas, a maioria dos valores vai ser nica. Valores como
12 e 12,01 sero caracterizados como valores distintos e frequncias computadas
distintamente. Assim, frequncias so instrumentos de anlise descritiva para
as variveis de tipo texto (tambm chamadas categricas). No exerccio, vamos
calcular as frequncias das variveis: ESTADOCIV e COR. Na janela do Frequencies
(fgura 5.4), observamos dois compartimentos importantes. No compartimento do
Frequency of (1) procuramos as variveis cujas frequncias queremos calcular e
no compartimento Stratify by (2) podemos selecionar a(s) variveis que desejamos
estratifcar. Inicialmente, vamos calcular somente as frequncias das variveis,
no estratifcando. E, depois, calcularemos as frequncias de maneira estratifcada
102
ngelo Jos Gonalves Bs
para o gnero. Estratifcar signifca calcular as frequncias, da varivel a ser
observada, para cada valor da varivel a ser estratifcada. Assim nosso resultado
trar distribuio da frequncia para cada valor de GENERO.
Estrutura da Janela de Resultado (OUTPUT) do Epi Info

Observamos na fgura 5.5 a janela Output com os resultados do


comando Frequencies.
Figura 5.5. Janela de resultados do Analysis do Epi Info

destacando o
caminho e nome do arquivo e a tabela criada pelo comando Frequencies.
Fonte: Epi Info

, arquivo Avaliacao.mdb.
O Epi Info

salva os resultados em um arquivo. Observamos que, na


barra mais superiormente colocada (normalmente de colorao azul) existe o
caminho (ou endereo) e nome do arquivo, que ser, por defnio, OUTNN.
htm, onde NN sero nmeros sequenciais conforme o nmero de arquivos
103 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


existentes no nosso diretrio de trabalho. A extenso .htm denomina o formato
do arquivo gerado. No caso um arquivo com formato de pgina de Internet.
A janela Output informa o comando solicitado e depois a tabela. A tabela
do comando Frequencies dispe os valores da varivel na primeira coluna,
em ordem alfabtica. A segunda coluna dispe as frequncias e as prximas
mostram a percentagem de cada categoria e a percentagem acumulativa. Na
ltima coluna, o programa cria um tipo de grfco de barra que expressa a
distribuio das frequncias. Finalmente calcula um intervalo de confana.
Comprimindo o Arquivo de Dados
importante destacar que, assim como no MS-ACCESS, o banco de
dados do Epi Info

pode ser comprimido para salvar espao. Isso no prejudica


em nada o arquivo e nos ajuda, principalmente, quando estamos trabalhando
em um disquete ou em um disco rgido com falta de espao ou ainda desejamos
transportar o arquivo. Algumas vezes podemos corrigir problemas no nosso
banco de dados atravs desse programa. As verses anteriores do Epi Info


(verso 1 e 2) possuam dois programas para compactar o banco de dados: um
executado a partir do menu File do Enter data (Entrar dados), onde tnhamos a
opo Compress database (Compactar banco de dados); e a opo Compact &
Repair MDB Utility... (Compactar e Reparar MDB) do programa Visualize data
(Visualizar dados) que fca no menu Utilities (Ferramentas) da tela principal do
Epi Info

. O primeiro programa, tambm chamado simplesmente de Compact, s


vezes no funcionava, o que fazia desaparecer o arquivo compactado, nesse caso
era prefervel utilizar o segundo programa (Database Compact Utility). A verso
3.2 possui somente um programa de compactao, justamente o Compact que
parece funcionar adequadamente. Esse programa pode ser executado tanto pelo
Enter data (Entrar dados) quanto pelo Visualize data, ou ainda no menu Utilities
(Ferramentas) que possui a nova opo Compact. Vamos ver como funciona
e tambm como evitar maiores problemas ao usar esse programa. A partir do
programa Visualize data (Visualizar dados), da tela principal do Epi Info

. No
menu File do programa, escolhe-se a opo Compact & Repair MDB Utility...
(Compactar e Reparar MDB). Onde aparecer a janela exposta na fgura 5.6.
104
ngelo Jos Gonalves Bs
Figura 5.6. Janela do comando Compact destacando os compartimentos de
denominao dos arquivos a compactar e compactado.
Fonte: Epi Info

.
Ao lado do primeiro compartimento temos o cone (1) que clicamos
para escolher o arquivo que desejamos. No compartimento abaixo (2)
escolhemos primeiro o mesmo arquivo e clicamos Abrir, depois, na tela
do Compact, alteramos o nome, por exemplo, adicionando uma letra,
conforme a seta ilustrada na fgura 5.6. importante trocarmos o nome,
pois se o programa no funcionar direito, poderemos perder os nossos
dados para sempre!
Aps isso podemos clicar em OK. O programa, ento, mostra uma caixa
informando que o processo foi executado. Antes de sair do programa, devemos
confrmar se o novo arquivo foi realmente criado, clicando em um dos cones de
seleo, para ver se o arquivo aparece na tela. Aps verifcar isso, podemos sair
do programa clicando em Exit. Assim podemos deletar o arquivo antigo, aps
termos certeza de que o novo pode ser utilizado sem problemas.
105 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Importe o banco de dados Apoe4.REC em verso EPI 6, que se
encontra no folder Exerccio do site www.pucrs.br\igg\epiinfo,
utilizando o programa Analyze Data. Crie e defna as variveis:
OBESIDADE, DISLIPIDEMIA, HIPERTENSAO, usando o
programa classifcacao que est no arquivo Avaliacao.mdb.
2. Salve o arquivo como Apoe4.MDB tabela Grupo1 (sem espao).
3. Crie uma fcha para o projeto, utilizando o Makeview.
4. Calcule as frequncias de HIPERTENSAO, DISLIPIDEMIA e
OBESIDADE.
5. Comprima o arquivo como Apoe.mdb.
Obs.: Como vamos utilizar esse arquivo nos prximos captulos,
preste ateno onde o mesmo ser salvo.
Captulo 6
ADICIONANDO DADOS EPIDEMIOLGICOS
AO EPI MAP
Vimos, anteriormente, como criar um mapa usando o Epi Map. Naquele
momento criamos um mapa baseado nos dados originalmente fornecidos.
Vamos ver um exemplo de como adicionar dados novos ou que nos interessem.
Como obter dados sobre sade do Brasil (www.datasus.gov.br)
O Ministrio da Sade do Brasil mantm um site onde esto acessveis
vrios dados sobre o pas. Esse site chamado DATASUS. Nele podemos
encontrar vrios dados, no s demogrfcos, mas socioeconmicos, e,
evidentemente, de sade, como mortalidade e morbidade. Mortalidade
se refere s mortes que ocorreram em determinado perodo, enquanto
morbidade refere-se ao nmero de pessoas com determinada doena em
um determinado momento (prevalncia) ou o nmero de casos novos
que ocorreram em um perodo de tempo (incidncia). Normalmente,
mortalidade e morbidade so expressas em taxas, onde temos o nmero
de pessoas com a caracterstica, dividido pelo nmero total de pessoas.
No DATASUS podemos obter o nmero de mortes por determinada doena
tanto no nvel de pas, como um todo, por Unidades da Federao ou por
cidades. Faixas etrias e gnero so outras variveis disponveis para
cruzamento. Tambm est acessvel a populao estimada ou recenseada
com todas as variveis anteriores disponveis, exceto causa morte, desde
o ano de 1980. Assim, para calcularmos a taxa de mortalidade especfca
para determinada doena devemos baixar tanto o nmero de mortes quanto
a populao do ano ou anos desejados. Algumas taxas de morbidade e
mortalidade so acessveis diretamente no site do DATASUS, dispensando
ento o clculo mencionado. Entretanto, nem sempre teremos disponvel a
taxa da doena e cruzamento desejado. Por isso veremos como obter tanto
o nmero de mortes quanto a populao, importando para o Epi Info

onde
calcularemos as taxas de mortalidade e, fnalmente, transportaremos os
dados para o Epi Map onde criaremos um mapa desses valores.
107 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Modifcando a linguagem do sistema do computador para
importarmos dados do DATASUS (Control Panel)
Antes de abrirmos o navegador (browser), devemos modifcar ou
confrmar se a linguagem do sistema do computador o portugus. Para tanto,
devemos clicar no boto Iniciar (Start), que o mais inferiormente colocado
no nosso computador, esquerda. Temos a opo Painel de Controle (Control
Panel), conforme a fgura 6.1.
Figura 6.1. Detalhe da tela principal do ambiente Windows demonstrando o caminho
para a localizao do comando Painel de Controle Control Panel.
Fonte: Windows 7.
Ao abrirmos o Painel de Controle, devemos procurar a opo Relgio
Idioma e Regio que levar opo Regio e Idioma, que um globo com um
relgio na frente (fgura 6.2).
108
ngelo Jos Gonalves Bs
Figura 6.2 Painel de Controle mostrando o cone da opo Regio e Idioma.
Fonte: Windows 7.
Ao clicarmos duas vezes no cone, aparecer uma janela onde escolheremos
o formato de uma das lnguas portuguesas, que pode ser tanto a padro quanto a
brasileira (fgura 6.3). O computador talvez pergunte se queremos reinici-lo. Se
isso acontecer, devemos fechar os programas abertos e salvar os documentos que
estamos usando, se no quisermos perder o trabalho at ento realizado. Note que
a linguagem portuguesa pode atrapalhar clculos de variveis com casas decimais,
realizados pelo Epi Info

. Por isso, devemos modifcar a linguagem para o ingls


quando quisermos, por exemplo, calcular mdias de ndice de massa corporal
(ICM), que normalmente defnido com duas casas decimais.
109 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 6.3 Janela da Regio e Idioma com o formato para Portugus (Brasil) selecionado.
Fonte: Windows 7.
Visitando o site do DATASUS
O endereo do site do DATASUS : www.datasus.gov.br.
110
ngelo Jos Gonalves Bs
No menu da esquerda temos vrias opes, a que escolheremos
ser Informaes de Sade. Para o nosso exerccio, vamos utilizar,
inicialmente, os dados de mortalidade. Para tanto, devemos clicar em
Estatsticas vitais. Isso abre vrias opes, entre elas a opo Mortalidade
Geral. Ao clicarmos em cima dessas palavras, aparecer um mapa do
Brasil como na fgura.
Os Links superiores se referem a tabulaes em mbito nacional.
Podemos selecionar dados de um estado clicando no mesmo, tanto no mapa
quanto no nome na aba que se abre ao clicarmos na caixa de seleo. Vamos
selecionar Brasil por Regio e Unidade da Federao. Isso nos levar
pgina de construo da nossa tabela.
111 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Construindo uma tabela de mortalidade no DATASUS
Figura 6.3. Detalhe da pgina de tabulao dos dados de mortalidade do site do DATASUS.
Fonte: http://tabnet.datasus.gov.br/cgi/deftohtm.exe?sim/cnv/obtuf.def).
A pgina mostra trs janelas superiores horizontalmente dispostas
e 16 outras janelas verticalmente dispostas. Nas primeiras (fgura 6.3)
determinamos quais valores queremos nas linhas e na coluna da tabela
que desejamos. Nesse caso, escolheremos Ano do bito para linha e Sexo
para Coluna. Na janela chamada Contedo, temos duas opes: bitos por
residncia e bitos por ocorrncia. s vezes uma pessoa est viajando ou
hospitalizada em um Estado da Federao, que no o que ela reside, mas
acaba falecendo nesse Estado; nesse caso, o bito por residncia ser diferente
do bito por ocorrncia. Na maioria das vezes, o bito por residncia ser
utilizado. O bito por ocorrncia ser importante quando temos uma causa
aguda de morte por atropelamento. Como em idosos a maioria dos bitos
por doenas crnicas, no importa muito onde a pessoa morreu porque,
provavelmente, ela desenvolveu a doena no Estado de residncia. Assim,
manteremos a opo bitos p/Residncia nessa janela. Na prxima janela,
Perodos disponveis, vamos escolher todos os anos disponveis. Podemos
selecionar um ou mais regies ou Estados nas primeiras janelas e as causas de
bito. Desde 2010, o site disponibiliza somente a partir de 1996, desde quando
os bitos so classifcados utilizando o CID 10.
112
ngelo Jos Gonalves Bs
Figura 6.4. Detalhe da pgina de tabulao dos dados de mortalidade do site do DATASUS, continuao.
Fonte: http://tabnet.datasus.gov.br/cgi/deftohtm.exe?sim/cnv/obtuf.def, ltima visita em abril, 2011.
Nas prximas janelas, observadas na fgura 6.4, selecionamos alguns
valores, como local, causa morte, faixa etria e sexo. Existem quatro janelas para
selecionarmos uma causa morte. Na janela Captulo CID-10 podemos selecionar
os captulos da Classifcao Internacional das Doenas (CID). Podemos escolher
um tipo de bito especfco usando uma das duas janelas seguintes, obedecendo
ao mesmo critrio, conforme o ano de bito desejado. Como desejamos o nmero
de diabetes em 2000, devemos escolher essa doena na janela Causa CID-
BR-10. Observe que as outras janelas correspondentes causa de morte devem
estar na primeira opo: Todas as categorias. Nem todas as causas de morte
esto disponveis. Podemos ainda selecionar somente uma faixa etria ou sexo,
se desejssemos. Aps selecionar Unid. Federao na linha, Sexo na coluna e
Diabetes mellitus na Causa CID-BR-10, podemos clicar no boto Mostra no
fnal da pgina. Aps algum tempo, dependendo do congestionamento da Internet,
obteremos a tabela com as informaes desejadas. A tabela precedida de uma
descrio de todas as selees realizadas. Devemos confrmar se todos os nossos
critrios, e somente eles, esto mencionados. Confrmando que estamos com a
tabela desejada, podemos clicar no Link: Copia como CSV, que signifca Comma
Separated Variables. Na realidade, o programa separa as variveis com um ponto
e vrgula (;) e no com vrgula como a abreviao sugere. Ao clicarmos no Link,
113 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


provavelmente abrir uma janela perguntando se desejamos salvar ou abrir o
arquivo. Para facilitar nossa vida, vamos abrir o arquivo. s vezes, o programa
abre automaticamente o arquivo sem nos perguntar. Alguns navegadores
(browsers) necessitam que escolhamos o programa a ser utilizado, esse ser o
Excel. Ao abrir o arquivo, automaticamente inicia o programa Excel, mostrando
as colunas da tabela dispostas em colunas separadas na planilha, conforme fgura.
Com o arquivo aberto no Excel, devemos transformar o arquivo para poder ser
importado pelo Epi Info

, conforme vimos no captulo 5. Se as colunas no esto


dispostas conforme a fgura porque a linguagem do sistema do computador no
foi alterada para o portugus, conforme anteriormente mencionada. Nesse caso
devemos salvar como arquivo tipo texto e extenso .txt, para depois abrirmos
novamente com o Excel formato tipo texto, opo campo delimitado, clicar em
prximo, delimitador ponto e vrgula (;), concluir.
Preparando o Arquivo do Excel para ser Importado pelo Epi Info
Figura 6.5. Detalhe da tela do Excel mostrando a disposio original
dos dados criados pela pgina Mortalidade do DATASUS.
Fonte: Microsoft Excel, arquivo importado do DATASUS.
Para importar o arquivo usando o Epi Info

, a primeira linha da
planilha deve conter somente o nome das variveis. Devemos, ento, excluir
as primeiras linhas da planilha que possuem as descries da tabela. Para
fazer isso podemos selecionar as linhas clicando com o mouse no nmero
que denomina a linha. Com as linhas que desejamos excluir selecionadas,
114
ngelo Jos Gonalves Bs
podemos pressionar as teclas Ctrl (menos) ou clicarmos no menu Editar
(Edit), opo Excluir (Delete). Aparecer uma janela pequena perguntando
o que se deseja excluir, escolhemos linha inteira e, depois, OK. No caso
do comando Ctrl , no necessitaremos confrmar, se selecionarmos a
linha corretamente. Nossa planilha ter, ento, o ttulo (rtulo) das colunas
na primeira linha e os demais valores nas outras linhas. Temos, muito
frequentemente, uma coluna com o sexo ignorado. Essa informao no nos
importante e podemos ou no exclu-la. Para tanto repetimos, mais ou
menos, o mesmo procedimento anterior: selecionamos a coluna clicando
na letra que a denomina e pressionamos Ctrl . No mapa fornecido pelo
site do Epi Info

, as Unidades da Federao esto escritas sem acento. Se


quisermos utilizar esse mapa, devemos tirar todos os acentos.
Figura 6.6. Detalhe da tela do Excel mostrando o nome da planilha j corrigido.
Fonte: Microsoft Excel.
Aps retirar todos os acentos das Unidades da Federao, temos
mais algumas etapas importantes. Notamos, na parte inferior do Excel, que
o nome da planilha est com o nome do arquivo que contm um conjunto de
letras e nmeros sem sentido. Esse nome foi denominado pelo DATASUS,
mas no nos ajuda a identifcar o contedo, por isso devemos modifc-
lo. Clicando duas vezes, selecionamos o nome, podemos modifc-lo para
obitos (sem acento) conforme a fgura 6.6. As ltimas alteraes que
devemos fazer so modifcar os rtulos das colunas, entre outros motivos,
para podermos, depois, nos lembrar do que elas signifcam. Como estamos
trabalhando com bitos, podemos acrescentar Ob aos rtulos Masc, Fem
e Total fcando: ObMasc, ObFem, ObTotal, por exemplo. Note que
importante no termos espaos nos nomes das colunas, pois elas tornar-se-
o nomes de variveis no Epi Info

. Devemos, tambm, modifcar o nome


da primeira coluna que denomina as Unidades de Federao tirando o ponto
que est no meio, passando, assim a se chamar: UnidFederao. Note que
no necessitamos transformar os nomes das varivels para maisculas, pois
o Epi Info

no faz essa distino.


115 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Salvando arquivo em formado Excel
Finalmente, podemos salvar o arquivo, no menu Arquivo (fle), clicar
em Salvar como (Save as). Na janela colocaremos como nome, por exemplo:
bitos Diabete BR 2000. Devemos modifcar o formato do arquivo para Pasta
de trabalho do Excel, conforme fgura 6.7.
Figura 6.7. Detalhe dos compartimentos de denominao e alterao do tipo de arquivo da janela de
salvamento do Excel.
Fonte: Microsoft Excel.
No se esquea de salvar o arquivo no diretrio de trabalho. Observe
que o nome do arquivo pode ter espao e acento, mas o nome da planilha no.
Obtendo dados da populao
Como vimos, necessitamos do nmero da populao brasileira
para cada Estado, de ambos os sexos e ano em que temos os bitos. Para
tanto devemos retornar janela Informaes de Sade, retornando trs
pginas. As informaes sobre a populao esto na sesso Informaes
demogrfcas e socioeconmicas. Existem dois Links para a populao,
escolhemos o primeiro, clicando no mesmo, Populao residente, que tem
informaes desde 1980. A janela que se abre ao clicarmos no Link muito
parecida com a janela do bito, com o mesmo mapa e opes. Clicando em
Regio e Unidade da Federao, abrimos uma janela, tambm semelhante
janela em que construmos a tabela dos bitos, tendo no seu contedo
apenas a populao residente. Devemos selecionar os mesmos valores
para linha (Unidade da Federao) e coluna (Sexo); observe que devemos
selecionar tambm o mesmo ano (2000) nos Perodos disponveis. No
precisamos fazer mais nenhuma seleo, pois estamos trabalhando com
toda a populao. Clicando, ento, no boto Mostra, criamos a tabela que
deve ter mais ou menos o mesmo formato da tabela anterior, s que com
valores maiores. Clicando no Link copia como CSV, selecionamos a opo
de abrir o arquivo, que nos retorna ao Excel com as colunas bem defnidas.
Novamente devemos excluir as linhas de descrio da tabela, deixando
somente os rtulos das colunas. Devemos tambm retirar os acentos das
Unidades da Federao. Sugere-se modifcar tambm o nome dos rtulos
116
ngelo Jos Gonalves Bs
para PopMasc, PopFem e PopTotal, para no confundirmos com os dados
do bito. O rtulo Unid.Federao deve ser mudado para UnidFederao,
sem o ponto no meio. Mudamos tambm o nome da planilha para
Populao. E, fnalmente, salvamos com o nome Populao BR 2000, no
esquecendo de modifcar o formato do arquivo para Pasta de trabalho do
Excel. recomendvel salvar no mesmo diretrio que o arquivo do bito.
Feito isso, fechamos o Excel e abrimos o Epi Info

.
Juntando dois arquivos com variveis diferentes
(comando Relate Relacionar)
Vimos que, quando temos dois arquivos com as mesmas variveis,
podemos junt-los com o comando Merge (Juntar). No comando Merge
(Juntar) somente os dados das variveis comuns so juntados. Quando temos
dois arquivos com variveis diferentes e queremos juntar essas variveis em
um mesmo arquivo, usamos o comando Relate (Relacionar).
O comando Relate (Relacionar) muito semelhante ao do Merge
(Juntar), primeiro devemos abrir o arquivo que receber as variveis novas.
No caso vamos abrir o arquivo bitos Diabete BR 2000.xls, usando o
comando Read (Abrir ou Ler), sem esquecer que o arquivo est em formato
Excel e que temos que selecionar a planilha. Confrmando que a primeira linha
possui o nome das variveis, clicamos OK e observamos que o nosso arquivo
possui 28 observaes: 26 Estados, Distrito Federal e Total. Imediatamente
clicamos em Relate (Relacionar). Observamos que a janela tambm muito
semelhante do Merge (Juntar). Trocando o Data Format (Formato do banco
de dados) para Excel 8.0, selecionamos o arquivo Populao BR 2000.xls.
Selecionando a planilha Populacao, devemos construir a chave de ligao
dos dois arquivos atravs do Build Key (Construir chave). Escolhemos em
ambos os arquivos a varivel UnidFederao. Nosso comando deve fcar
mais ou menos conforme a fgura 6.7.
117 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 6.7. Janela do comando Relate do Analysis.
Fonte: Epi Info

.
Ao clicarmos OK, o programa nos pergunta sobre um Link permanente
dos arquivos. Como iremos salvar o arquivo em seguida, simplesmente clicamos
OK, sem acrescentar nenhum nome. Completada essa etapa, poderemos salvar
o nosso projeto como bitos BR 2000, tabela Diabetes, usando o comando
Write (Salvar), no esquecendo de selecionar a opo Replace (Substituir).
Devemos agora defnir as variveis que contero as taxas: TxMasc, TxFem,
TxTotal, por exemplo. Devemos usar o comando Defne (Defnir), evidentemente.
Calculando taxas de mortalidade
As taxas de mortalidade so normalmente calculadas para cada mil,
10 mil ou at 100 mil habitantes. Esses valores variam conforme a raridade
da doena: quando temos uma doena com mortalidade baixa, menos de
uma morte para 10 mil habitantes, usaremos o valor mortes por 100 mil para
denominar a taxa. O nosso caso uma doena bastante comum, temos mais
de 35 mil mortes no ano, para uma populao brasileira de 170 milhes,
poderemos usar a denominao de mortes por 10 mil habitantes. Usando o
Assign, teremos nosso comando, demonstrado na fgura 6.8.
118
ngelo Jos Gonalves Bs
Figura 6.8. Janela do comando Assign exemplifcando a frmula para o clculo da taxa de mortalidade.
Fonte: Epi Info

.
Devemos fazer o mesmo para TxFem e TxTotal.
Salvamos novamente o nosso projeto com o mesmo nome, no
esquecendo de selecionar Replace (Substituir).
Adicionando dados ao Epi Map
Vimos como importar informaes de sade do Datasus para o Epi
Info

. Apesar de existir um comando Map no programa Analysis do Epi Info

,
esse comando muitas vezes no funciona. Por isso, recomendvel abrir o
mapa atravs do Epi Map. Abrindo o programa e com o Layer (Camada) j
contendo o mapa do Brasil (BR.shp), clicamos no boto Add data (Adicionar
dados). Abrimos, ento, o projeto bitos BR 2000.mdb, que contm os dados
que desejamos. Aps pensar um pouco, o programa abre uma janela onde
escolheremos as variveis que tm os valores que vo juntar os arquivos, no
caso o nome das Unidades da Federao (primeira janela em ingls: ADMIN_
NAME e na segunda janela em portugus: UnidFederao), assim como o
nome das variveis que sero adicionadas, conforme a fgura 6.9.
119 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 6.9. Janela de seleo dos campos de relacionamento e variveis do comando Add data do Epi Map.
Fonte: Epi Info

.
O programa automaticamente seleciona as primeiras variveis de tipo
texto, em ordem alfabtica. Casualmente so justamente as variveis que
desejamos juntar. Caso as variveis que contm os nomes dos Estados no
estejam selecionadas, devemos corrigir isso, selecionando o nome correto.
A seguir o programa informa valores das duas variveis que no
encontraram nomes semelhantes (fgura 6.10). No caso, temos quatro zonas
de litgio que existem entre os Estados da Paraba e Piau, e entre o Estado
do Amazonas e do Par. No arquivo que criamos temos o total das taxas de
mortalidade que tambm no encontra semelhante no mapa.
Figura 6.10. Janela de aviso dos campos que no encontraram correspondentes nos dois
arquivos, mapa e banco de dados novo.
Fonte: Epi Info

.
120
ngelo Jos Gonalves Bs
Como esses valores no atrapalham nosso resultado, simplesmente
os ignoramos. importante observar, entretanto, se existem Estados que
no encontraram correspondentes nos dois arquivos. Isso pode ocorrer se,
por exemplo, um Estado possui acento, como o da Paraba, cujo acento nem
sempre bem visvel. Se ocorrer uma incompatibilidade de nomenclatura
entre Estados, eles aparecero em ambas as janelas. Nesse caso deveremos
encerrar o programa e alterar o nome do arquivo criado por ns, adequando
o nome do(s) Estado(s) com problema. Independente disso, clicamos
em Continue para fechar a janela. Se no tivermos nenhum problema,
observamos o mapa com a primeira varivel do arquivo (ObFem), j com
a distribuio por faixas (Choropleth) criada. Podemos salvar todo mapa
ou cada um dos mapas.
121 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Obtenha dados sobre mortalidade geral e populao das Regies
do Brasil para o ano de 2000. Coloque as Regies na linha e
sexo na coluna.
2. Prepare os arquivos para serem importados para o Epi Info

e
retire a palavra Regio antes dos nomes das regies.
3. Troque o nome das colunas para obitomasc, obitofem e obitotot,
no arquivo dos bitos e para popmasc, popfem e poptotal no
arquivo da populao.
4. Modifque os nomes das planilhas para obitos e populacao (sem
acento) e salve como pasta do Excel como bito Regio BR
2000 e Populao Regio BR2000 respectivamente
5. Importe o arquivo dos bitos para o Epi Info

e depois relacione
(juntar pelo Relate) com a populao.
6. Calcule a taxa de mortalidade para cada sexo e total.
7. Salve o projeto como bitos BR 2000 e tabela RegiaoGeral.
8. Abra o mapa Regies.map, criado no primeiro captulo.
9. Adicione dados a partir do projeto bitos Br tabela RegiaoGeral.
10. Faa o mapa Choropleth da Mortalidade Total.
Captulo 7
CRIANDO GRFICOS COM O COMANDO
GRAPH
Finalmente chegamos ao comando to esperado de criao de grfcos
pelo Epi Info

. Existem muitos tipos de grfcos, por isso vamos ver como


criamos alguns deles. Primeiro vamos ter uma viso geral sobre a janela do
comando observando a fgura 7.1.
Figura 7.1. Janela do comando Graph do Analysis destacando os compartimentos principais.
Fonte: Epi Info

.
No compartimento Graph Type (1) escolhemos o tipo de grfco
que desejamos, que automaticamente nos d a opo de grfco tipo
barra; colocamos depois um ttulo que opcional (2). Logo abaixo do
compartimento do tipo de grfco, existe a opo de criarmos grfcos
123 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


tridimensionais. Mais importante colocarmos a varivel que desejamos
no eixo do X (3) e, depois, escolhemos que valor vamos colocar no eixo do
Y (4). Podemos determinar algumas funes grfcas incluindo uma outra
varivel no item (5), mas esse comando modifcar-se- conforme o tipo de
grfco que desejamos. Existem vrias caractersticas de edio dos grfcos,
algumas comuns outras especfcas de determinado tipo de grfco. Assim,
no primeiro tipo de grfco, descreveremos as caractersticas tanto comuns
quanto prprias desse tipo, ressaltando quando a mesma prpria do tipo em
questo. Na sequncia, descreveremos somente as caractersticas prprias
de cada grfco ou as nuanas particulares de cada tipo de grfco.
Grfco tipo Barra (-): O grfco tipo barra o primeiro que aparece
quando iniciamos o comando Graph. Ele muito til para descrever
variveis categricas, como, por exemplo, a nossa j clssica varivel
OBESIDADE do arquivo Apoe. Primeiro deveremos abrir o arquivo
utilizado no captulo 4: Apoe e verifcar se realmente temos a varivel que
desejamos. No se esquea de modifcar o projeto se o arquivo no estiver
ativo. Caso no exista essa varivel, devemos abrir o arquivo Apoe.mdb
que est no folder Dados do site www.pucrs.br\igg\epiinfo. Aps lermos
o projeto e j com o comando Graphs aberto, selecionamos a varivel
OBESIDADE como Main Variable (x). Note que o tipo de grfco que
aparece na janela Graph type justamente o Bar. Automaticamente temos
no eixo do Y a opo Count que nos dar o nmero total de indivduos em
cada grupo de obesidade. Sem selecionar outra opo, clicando em OK
temos o grfco, como na fgura 7.2, praticamente pronto.
124
ngelo Jos Gonalves Bs
Figura 7.2. Janela de edio do comando Graph do Analysis.
Fonte: Epi Info

, arquivo Apoe.mdb.
Inicialmente, o Epi Info

coloca o grfco em uma janela que preenche


toda a tela do computador (fgura 7.2). Nessa tela, e somente nela, poderemos
alterar o formato do grfco, por isso to importante.
Alteraes comuns nos grfcos do Epi Info

Ainda com o grfco na janela de edio podemos clicar no boto


direita do Mouse e obteremos as seguintes opes (fgura 7.3):
1. Viewing Style: alterna para monocromo e monocromo
com smbolo (no caso do Bar no tem smbolo).
2. Font Size: trs nveis para todo o grfco: Large,
Medium & Small.
3. Numeric Precision: defne o nmero de casas decimais
que vai aparecer nos eixos.
125 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 7.3. Janela das opes de edio do comando Graph do Analysis com as opes de plotagem abertas.
Fonte: Epi Info

.
4. Plotting Method: podemos alterar o tipo de grfco
se nos arrependermos ou quisermos testar outras formas de
visualizao (fgura 7.3.), os grfcos de linha (Line), ponto
(Point), rea (Area) e Spline podem ser criados diretamente
selecionando a opo tipo de grfco no comando Graph;
veremos alguma descrio de cada um mais adiante.
5. Data Shadows: defnimos se queremos colocar uma
sombra ou dar um formato tridimensional s barras.
6. Grid Lines: d a opo de colocarmos linhas
horizontais, verticais ou ambas no grfco.
7. Grid in Front: quando optamos por ter linhas
horizontais ou verticais no grfco; podemos mostrar as linhas
na frente do grfco ao selecionarmos essa opo.
126
ngelo Jos Gonalves Bs
8. Graph and/or Table: oferece a opo de incluirmos
uma tabela junto com o grfco ou s a tabela, no caso aparecer
o nmero de indivduos em cada nvel de obesidade com a
preciso decimal defnida pelo Numeric Precision.
9. What to Table: defne se mostra todos os resultados ou
somente os que aparecem no grfco (posteriormente veremos
que podemos selecionar quais grupos mostrar).
10. Point Label Orientation: opo para colocarmos
os rtulos do eixo do X na posio horizontal, vertical ou
inclinada (Slanted).
Figura 7.4. Janela do Customization dialog do Graph.
Fonte: Epi Info

.
11. Customization dialog: a opo mais importante e pode
ser aberta tambm se clicarmos com o boto da esquerda do mouse
duas vezes sobre o grfco. Na janela, visualizada na fgura 7.4,
temos quase todas as opes anteriores e outras novas. No item
General (1), podemos defnir um ttulo e subttulo, alm das
opes anteriormente vistas (Viewing Style, Font Size, Numeric
Precision, Grid Lines, Display Graph and/or Table e Subsets to
127 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Table). O item Plot (2) semelhante ao Plotting Method. Subsets
(3) utilizado para selecionar uma varivel, quando fazemos um
grfco com mais do que uma varivel no X. Points (4) muito
importante nesse tipo de grfco, pois poderemos selecionar quais
grupos mostrar ou no. Axis (5) pouco til no grfco tipo barra.
Font (6), nesse podemos escolher fontes separadas para ttulo,
subttulo, rtulos e tabela.
Figura 7.5. Janela da opo Color do Customization dialog.
Fonte: Epi Info

.
Color (7) (fgura 7.5) modifca somente as cores dos textos (Desk
Foreground), fundo atrs do grfco (Desk Background), cor da sombra do
grfco (Shadow Color, que no inclui a sombra das barras), cor das linhas
dentro do grfco (Graph Foreground), cor do fundo do grfco (Graph
Background) e as cores das tabelas (Table Foreground e Table Background)
quando as mesmas existirem. Finalmente, no item Style (8), podemos
modifcar a cor das barras, quando no caso estamos trabalhando com o tipo
Bar, e algumas opes que nos sero teis para outros grfcos como tipo
de pontos e tipo de linhas. Essa opo particularmente til quando temos
duas variveis categricas num mesmo grfco. Vamos ver como funciona
128
ngelo Jos Gonalves Bs
colocando GENERO junto com a varivel OBESIDADE um pouco mais
adiante, quando estivermos criando um outro grfco.
Figura 7.6. Janela do Export Dialog do Graph destacando o formato e local de exportao do grfco
em edio.
Fonte: Epi Info

.
12. Export Dialog: opo para exportar o grfco em
diversos formatos (1) e no nome que desejarmos (2). Primeiro
devemos escolher a opo formato de exportao. No nosso
caso, se exportarmos como Metafle, o arquivo ocupar
somente 4Kb, se exportarmos como BMP ocupar 2.602
Kb, enquanto exportando como JPG ocupa 64 Kb. Metafle
nem sempre facilmente visualizvel por programas. Por
exemplo, o programa Paint no consegue abrir. J o JPG
o que, depois do BMP, pode ser visualizado e editado por
um nmero razovel de programas. Depois de escolhermos
o formato, devemos decidir se queremos colocar o grfco
na memria imediata do computador (ClipBoard), salvar em
arquivo (File) ou ainda imprimir diretamente mandando para
a impressora (Printer). Caso quisermos salvar em arquivo
devemos, aps escolher essa opo, clicar em Browse para
defnirmos o nome do arquivo e onde desejamos salvar.
Finalmente clicamos em Export.
129 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Modifcando os rtulos
Os rtulos ou textos que aparecem no grfco podem ser modifcados
simplesmente clicando em cima deles. Isso far aparecer uma caixa de
edio. No caso podemos clicar no rtulo do eixo Y que se chama Count
e modifc-lo para Nmero de pessoas (podemos usar acento espao e
qualquer outro smbolo especial).
Como exemplo, vamos editar o grfco da OBESIDADE selecionando
somente os normais, sobrepesos e obesos na opo Plot, colocando depois o
eixo do X iniciando no Zero (escala), na opo Axies, mudamos a cor do
fundo e da sombra para branco e fnalmente a cor das barras para verde. Aps
modifcarmos o rtulo do eixo Y para Nmero de pessoas, salvaremos o
grfco como tipo Metafle e nome obesidade.
Devemos fechar o grfco para podermos criar outro, pois o programa
no permite duas janelas de edio de grfco abertas. Ao fecharmos o grfco,
observamos que o mesmo passa a aparecer na janela do Output (Resultado).
Notamos tambm que, mesmo clicando vrias vezes em cima do grfco, a
janela de edio no aparecer. importante mais uma vez ressaltar que,
depois de fechada a janela de edio no poderemos mais alterar o grfco.
Podemos, sim, clicando com o boto da direita do mouse, salvar o grfco,
mas com menos opes de formato.
Figura 7.7. Exemplo de grfco tipo barra com duas variveis selecionadas.
Fonte: Epi Info

, arquivo Apoe.mdb.
130
ngelo Jos Gonalves Bs
1. Grfco tipo Bar com duas variveis categricas (tipo
texto): podemos colocar mais do que uma varivel categrica,
tipo texto, como Main Variable (eixo X), mas isso far com
que se crie uma barra para cada diferente valor das variveis.
Assim, se colocarmos as variveis OBESIDADE e GENERO
juntas, aparecer um grfco mais ou menos como na fgura
7.7. A linha de comando : GRAPH OBESIDADE GENERO
GRAPHTYPE =Bar Observamos que todas as colunas tm a
mesma cor, tendo tanto a varivel GENERO quanto a varivel
OBESIDADE a mesma cor. Se quisermos, podemos modifcar a
cor das barras, mas todas se mantero iguais. Grfcos separados
de cada varivel talvez fcaria melhor.
Figura 7.8. Exemplo de grfco tipo barra utilizando a opo Bar for each value of.
Fonte: Epi Info

, arquivo Apoe.mdb.
Outra maneira, talvez mais interessante, de colocarmos duas variveis
categricas num mesmo grfco utilizando a opo Bar for each value of que
a opo nmero (5) da janela de criao de grfcos. A linha de comando muito
semelhante anterior, mas aparece um asterisco entre OBESIDADE e GENERO:
GRAPH OBESIDADE * GENERO GRAPHTYPE= Bar. O grfco aparece
com quatro sequncias de duas barras com cores diferentes, uma para cada valor
131 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


de gnero, conforme o rtulo observado na parte de cima do grfco na fgura
7.8. Esse grfco nos proporciona observar a distribuio do gnero em cada
nvel de obesidade. Podemos observar que, no grupo estudado, existem mais
mulheres magras e mais homens normais e com sobrepeso e que o nmero de
obesos igual em ambos os gneros no nosso banco de dados. A interpretao,
no entanto, um pouco complicada, pois temos mais homens na amostra que
mulheres. Melhor seria se tivssemos escolhido a opo Show value of (4) na
janela principal do Graph, Count %, mas fca como lembrana aqui.
2. Grfco tipo Bar para descrever a mdia de
variveis numricas entre grupos: podemos utilizar o grfco
tipo barra para observar o comportamento de uma varivel
numrica em cada nvel de uma varivel categrica. No caso,
podemos observar o comportamento da idade para cada nvel
de obesidade. Para tanto, colocamos OBESIDADE como
Main variable (1), na janela Weight Variable (2) colocamos
IDADE e fnalmente devemos escolher que valor de IDADE
queremos colocar no grfco, na opo Show value of (3).
Podemos escolher entre colocar a soma de todas as idades
(Sum), a mdia (Average), o valor mximo (Maximum)
ou o valor mnimo (Minimum) das idades, para cada um
dos valores de OBESIDADE. No caso, faz mais sentido
colocarmos a mdia. O recorte da nossa janela fcaria com o
formato exemplifcado na fgura 7.9.
Figura 7.9. Detalhe da janela do Graph com comandos para a criao de barras com mdia de IDADE para
cada valor de OBESIDADE.
Fonte: Epi Info

.
132
ngelo Jos Gonalves Bs
O grfco teria quatro barras, uma para cada valor de OBESIDADE,
mas com tamanhos (eixo Y) relacionados mdia das idades em cada
um dos grupos de obesidade. Mais uma vez o Epi Info

inicia a escala do
valor da varivel Y prximo ao melhor valor da amostra. Isto faz com que
observemos uma diferena bastante grande nos valores de IDADE, estando,
no caso, os magros com uma barra muito menor que os outros nveis de
OBESIDADE. Se prestarmos ateno, o valor mdio de idade dos magros est
em torno de 47 anos enquanto o valor dos com sobrepeso no chega a 54 anos.
Assim, a diferena entre o grupo mais velho e o mais jovem menor que sete
anos. Ao corrigirmos a escala iniciando no zero, observamos, conforme a
fgura 7.10, que as barras no so to diferentes assim.
Figura 7.10. Grfco das mdias de IDADE para cada valor de OBESIDADE aps a correo da escala do
eixo vertical.
Fonte: Epi Info

, arquivo Apoe.mdb.
3. Grfco Rotate Bar: o mesmo grfco anterior s que
com barras horizontais.
4. Grfco tipo Histograma (Histogram): um grfco
de barra usado para as variveis numricas como IDADE, IMC
etc. Cada barra construda com intervalos fxos, que devemos
determinar usando a opo Interval a partir de um determinado
valor (1st Value). Se no colocarmos nenhum valor na opo de
133 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


intervalo, o programa criar um grfco usando cada valor unitrio
da varivel, ou seja, um histograma com inmeras barras. Como
exerccio em classe usaremos a varivel idade. Podemos usar, na
realidade, qualquer valor como intervalo, mas faz mais sentido
colocarmos intervalos de dez, para termos uma barra para cada
dcada de idade. tambm recomendvel estabelecermos qual
ser o primeiro valor do histograma (1st Value), do contrrio o
grfco iniciar a partir do primeiro valor que pode ser no inteiro.
No caso, o primeiro valor da varivel idade 17,2 anos. Se no
colocarmos nenhum valor inicial isto afetar todos os intervalos,
criando, assim, os intervalos 17,2, 27,2, 37,2 e assim por diante.
Para evitar isto, colocaremos um valor redondo: 10. O recorte da
janela de comando fcar, ento, como na fgura 7.11.
Figura 7.11. Detalhe da janela do Graph mostrando as opes
do tipo Histogram.
Fonte: Epi Info

.
134
ngelo Jos Gonalves Bs
O histograma aparece como um grfco de barras onde temos no eixo X
os valores dos intervalos e no eixo Y o nmero de pessoas correspondentes a
cada intervalo. Quando temos uma varivel numrica, espera-se que tenhamos
um formato semelhante ao de um sino, com um nmero reduzido de pessoas
nos intervalos extremos (mnimos e mximos) e um nmero mais concentrado
de pessoas ao redor da mdia. O grfco do histograma da idade desta nossa
amostra apresenta mais ou menos essa caracterstica (fgura 7.12).
Figura 7.12. Exemplo de grfco tipo histograma.
Fonte: Epi Info

, arquivo Apoe.mdb.
5. Grfcos tipo Spline e Points: so grfcos semelhantes
ao grfco de barra que produzem respectivamente grfco de
linhas arredondadas conectando os valores ou somente pontos.
Ao contrrio do tipo barra, o comando s aceita variveis
numricas. No caso s funcionariam se tivssemos valores
numricos para as variveis categricas. Como os grfcos
podem ser criados a partir do tipo barra, recomenda-se criar
primeiro esse tipo de grfco e edit-lo para Spline ou pontos,
conforme o desejado.
135 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


6. Grfco tipo Pizza ou Torta (Pie): propicia uma viso
da distribuio proporcional dos valores de uma varivel
categrica ou numrica no contnua. Como exerccio,
utilizaremos agora a varivel CIGARRO, simplesmente
selecionando o tipo de grfco Pie e colocando a varivel
CIGARRO como Main Variable(s). Ao clicarmos OK vemos
o grfco. A janela de confguraes deste tipo de grfco
apresenta algumas particularidades observadas nas fguras
7.13 e 7.14.
Figura 7.13. Janela de confguraes do grfco tipo Pizza Pie.
Fonte: Epi Info

.
Na opo Data Label Type (1), destacada na fgura 7.13, podemos
mostrar valores percentuais ou os valores absolutos. No caso dos valores
percentuais podemos modifcar o nmero de casas decimais atravs do
comando Numeric Precision. Group Percentages (2). Podemos agrupar
valores pequenos (=< 5%). Podemos destacar uma fatia. Para tanto devemos
clicar duas vezes no rtulo prximo da mesma. Por exemplo, para destacar a
fatia atual, clicamos duas vezes na palavra atual ou no nmero 17%.
136
ngelo Jos Gonalves Bs
Na opo Style podemos modifcar a cor de cada uma das fatias. Nosso
grfco poderia fcar como na fgura 7.14.
Figura 7.14. Exemplo de grfco tipo pizza, destacando a fatia atual.
Fonte: Epi Info

, arquivo Apoe.mdb.
7. Grfco tipo rea (Area): semelhante ao grfco de
barras produzindo uma rea abaixo de uma linha que une os
pontos. Este grfco pode ser convertido em grfco de barra,
linha ou ponto.
Figura 7.15. Exemplo de grfco tipo Pareto.
Fonte: Epi Info

, arquivo Apoe.mdb.
137 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


8. Grfco tipo Pareto: um grfco de barras com a
percentagem cumulativa dos valores em uma linha. As barras
so dispostas em ordem decrescente de valor. Por exemplo, o
grfco Pareto da varivel CIGARRO fcaria como na fgura
7.16. Observe que esse grfco tem, na margem vertical direita,
a escala percentual da linha.
9. Grfco XY (Scatter XY): constri grfcos de disperso
XY e desenha uma linha de regresso. Necessitamos, assim, de
duas variveis numricas, por exemplo, COLESTEROL e IDADE.
A primeira varivel a ser colocada a que vai aparecer no eixo
horizontal (X), a seguinte aparecer no eixo vertical (Y). Pode-
se colocar mais uma varivel no eixo Z que seria um terceiro
eixo entre os outros. Abordaremos algumas caractersticas da
interpretao deste tipo de grfco na sesso de Anlise de Dados,
mais adiante neste livro. O grfco da disperso do COLESTEROL
e da IDADE fcaria como na fgura 7.16.
Figura 7.16. Exemplo de grfco tipo Scatter XY.
Fonte: Epi Info

, arquivo Apoe.mdb.
10. Grfco de barra com mais de um nvel (Stacked bar):
Vimos que podemos criar grfcos de barra com mais de uma
138
ngelo Jos Gonalves Bs
varivel. Usando a opo Bar for each value of, teremos mais do
que uma barra para cada valor varivel principal. O tamanho de
cada barra corresponde ao nmero de indivduos em cada nvel
das duas variveis. Podemos, entretanto, dividir cada barra da
varivel principal conforme o nmero de pessoas pertencentes
ao nvel da segunda varivel. Assim teremos barras com mais
de uma cor, cada cor estaria relacionada com o nvel da segunda
varivel. Seria como tivssemos barras, uma em cima da outra,
conforme o nmero de nveis que a segunda varivel possua. O
comando do grfco tipo Stacked bar semelhante ao comando
barra. Uma principal vantagem deste tipo de barra que, na
opo Plot do Customization dialog podemos selecionar barras
percentuais tornando todas as barras iguais e podendo visualizar
as diferenas de distribuio percentual com mais facilidade do
que com os valores absolutos. As duas verses, com valores
absolutos e percentuais das barras de obesidade para valores de
gnero fcariam como nas fguras 7.17 e 7.18 respectivamente.
Figura 7.17. Exemplo de grfco tipo Stacked bar para valores absolutos.
Fonte: Epi Info

, arquivo Apoe.mdb.
139 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 7.18. Exemplo de grfco tipo Stacked bar para valores percentuais.
Fonte: Epi Info

, arquivo Apoe.mdb.
11. Grfco em formato de vela (Box-Whisker): quando
queremos mostrar o comportamento de uma varivel numrica
em diferentes grupos, nem sempre s a mdia o sufciente.
Alguma informao sobre o grau de disperso da amostra
ao redor dessa mdia importante. Para isto existe o grfco
tipo vela (Box-Whisker) onde podemos ilustrar esse grau de
disperso. Quando escolhemos esse tipo de grfco no comando
Graph do Epi Info

, a opo Main variable(s) se torna Analize


Variables. Ao contrrio do grfco tipo barra, devemos colocar
nossa varivel numrica na primeira opo (1), neste caso
escolheremos a varivel COLESTEROL como varivel a ser
analisada e a varivel GENERO para grupo (2). Uma terceira
opo necessria, pois devemos informar ao comando que
tipo de grfco(3) queremos: mdia com 1 e 2 desvios padro
(Mean-1SD-2SD), mediana com 25 e 10 % (Median -25%-10%)
ou mediana com 25 e 5% (Median-25%-5%). Como queremos a
mdia e desvios padro, escolheremos a primeira opo. Nosso
comando fcaria como na fgura 7.19.
140
ngelo Jos Gonalves Bs
Figura 7.19. Detalhe da janela do Graph com os comandos para a criao de grfco tipo Box-Whisker.
Fonte: Epi Info

.
O grfco, por sua vez, aparece como uma barra futuante com dois
traos verticais e um ponto central. O ponto central representa justamente a
mdia, a barra futuante, representa um desvio padro superior e inferior e os
traos dois desvios. Observamos, no grfco da fgura 7.20, que os homens
apresentam mdia superior, mas um desvio padro maior que as mulheres.
Figura 7.20. Exemplo de grfco tipo Box-Whisker.
Fonte: Epi Info

, arquivo Apoe.mdb.
141 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


12. Grfco de mximos e mnimos (Hi-Low Graph): serve
para ilustrar o comportamento de duas variveis, contendo uma os
valores mximos e a outra os mnimos da varivel grupo. Poderia
ser usado, por exemplo, para ilustrar o comportamento da presso
sistlica e diastlica nos dois gneros, conforme a fgura 7.21.
Figura 7.21. Exemplo de grfco tipo Hi-Low.
Fonte: Epi Info

, arquivo Apoe.mdb.
13. Histograma com mais de um nvel (Stacked
Histogram): assim como temos um grfco de barras com
mais de um nvel e o histograma que cria barras para variveis
numricas, podemos tambm criar histogramas com mais de um
nvel utilizando o grfco tipo Stacked Histogram. O comando
similar aos dois. Depois de selecionar a varivel numrica, o
intervalo e o valor inicial, devemos selecionar a varivel grupo.
Por exemplo, se colocarmos a idade, para cada 20 anos, tendo
o valor inicial de 20, agrupando por gnero, teremos o grfco
da fgura 7.22.
142
ngelo Jos Gonalves Bs
Figura 7.22. Exemplo de grfco tipo Stacked Histogram.
Fonte: Epi Info

, arquivo Apoe.mdb.
14. Criando pirmides (Pyramid Graph): o grfco tipo
pirmide na realidade um grfco tipo barra horizontal que tem
duas sries, uma a direita outra a esquerda. Este grfco utilizado
para criar as famosas pirmides populacionais. O comando exige
que a varivel principal (Main variable) seja numrica, mas
no d opes de se criar intervalos. Assim, se criarmos uma
varivel chamada DCADA onde teremos as idades divididas em
intervalos de 10, poderemos criar um grfco tipo pirmide para
cada valor de GENERO como a fgura 7.23.
Figura 7.23. Exemplo de grfco tipo Pyramid.
Fonte: Epi Info

, arquivo Apoe.mdb.
143 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
1. Abra (ler) o arquivo Apoe*, tabela Grupo1, na Anlise (no
esquea de mudar o projeto) e faa os seguintes grfcos:
a. Barra para cada GENERO para mdias de IDADE.
b. Pizza (torta) da varivel OBESIDADE, destacando o grupo
obeso.
c. Grfco Barra descrevendo a distribuio percentual do nvel
de OBESIDADE para cada valor de GENERO.
* Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo, caso no tenha salvado o projeto em
captulo anterior.
Captulo 8
ANALISANDO DADOS, UMA INTRODUO
Valemo-nos dos clculos e testes estatsticos para descrever e
interpretar os dados provenientes de um levantamento ou pesquisa. Mdia,
desvio padro, variana, mediana, valores mximos e mnimos, entre outros,
so clculos e valores muito utilizados na descrio de dados (estatstica
descritiva). Os testes estatsticos, como a regresso linear, anlise de variana,
so instrumentos utilizados para testar ou comprovar hipteses fundamentadas
no objetivo da pesquisa e observadas durante a anlise descritiva dos dados.
Tanto a estatstica descritiva quanto os testes estatsticos tm, como fm, a
interpretao dos dados colhidos durante a pesquisa, que objetiva chegarmos
s concluses inicialmente pretendidas.
Importncia da anlise descritiva
Toda a anlise de dados deve comear pela anlise descritiva de todas
as variveis que pretendemos usar. Observando o resultado dessas anlises
podemos identifcar possveis problemas com os dados como nmeros que o
autor chama de incompatveis com a vida ou categorias no defnidas. Por
mais que se tenha cuidado na introduo dos dados sempre devemos esperar que
alguma inconsistncia possa ter passado desapercebida. A anlise descritiva
tambm pode nos orientar na anlise dos dados apontando diferenas entre
grupos em variveis que possam comprometer nossos resultados. No exemplo
que descreveremos a seguir teremos dois grupos de tratamento que devem ser
uniformes em vrios aspectos, por exemplo, gnero e idade.
A anlise descritiva geralmente faz parte do que chamamos de tabela 1,
onde descrevemos todas as variveis que iremos usar na nossa anlise. Frequncia
das variveis categricas e mdias das variveis numricas entre diferentes grupos
como, por exemplo, gnero ou raa nos ajuda a antecipar os resultados ou a
necessidade de uma anlise especfca como veremos no decorrer do livro.
O que hiptese nula
A hiptese que testamos estatisticamente chamada de hiptese nula.
Exemplifcando, vamos testar a efcincia de uma medicao. Dividiremos
os pacientes em dois grupos, um usando medicao, grupo Tratamento, outro
145 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


grupo placebo (grupo Controle). Nossa varivel resposta (ou dependente)
ser mortalidade. Esperamos que exista algum efeito benfco da
medicao, ou seja, que o grupo Tratamento tenha uma mortalidade menor
que o grupo Controle, ou seja, mortalidade do grupo Controle (mcontrole)
maior que a mortalidade do grupo Tratamento (mtratamento). Em outras
palavras, mcontrole menos mtratamento seja maior que zero (mcontrole-
mtratamento>0). (Revise com calma!)
Se a medicao no tiver nenhum efeito, a mortalidade do grupo
controle ser igual mortalidade do grupo tratamento, ou seja, mcontrole
menos mtratamento ser igual a zero. Chamamos essa hiptese de hiptese
nula, porque tentaremos provar que ela falsa, no jargo estatstico,
tentaremos rejeitar a hiptese nula. Se conseguirmos rejeitar a hiptese nula,
conseguiremos provar que a medicao tem efeito sobre a mortalidade, pois
mtratamento diferente da mcontrole, chamamos esta segunda hiptese de
hiptese alternativa.
Por que testamos a hiptese nula?
Se ns acreditarmos que a medicao realmente tem efeito sobre
a mortalidade, por que no testar que a diferena maior que zero? A
justifcativa para isso que existem infnitos valores maiores que zero. Se
testssemos que a diferena da mortalidade fosse 4 e no consegussemos
provar isso, teramos que testar vrios outros valores. Testando a hiptese nula,
conseguimos concluir se h ou no diferena e, se usarmos o teste adequado,
conseguimos provar que a mortalidade do grupo sem medicao maior que
a do grupo com medicao. Por outro lado, impossvel provar uma hiptese,
conseguimos rejeitar uma hiptese. Comparamos grosseiramente com o teste
de paternidade, antes da era do teste do DNA. Conseguimos comprovar quem
no o pai (rejeitar a paternidade). Quem no conseguir provar que no o
pai assume a paternidade (no conseguiu rejeitar a paternidade). Este exemplo
s valido se no utilizarmos os testes de DNA, pois o pai ter metade dos
genes do flho, sempre.
A maioria dos testes estatsticos tem o objetivo de rejeitar a hiptese
nula. Entretanto, se no conseguirmos rejeitar a hiptese nula no signifca que
realmente no existe diferena entre os dois grupos estudados. O no rejeitar
a hiptese nula signifca to somente que os resultados so consistentes com a
hiptese nula. Podemos comparar novamente com o caso da paternidade, quem
no conseguiu provar que no pai pode, na realidade, no ser o pai da criana.
146
ngelo Jos Gonalves Bs
Tipos de erros relacionados com as hipteses
importante lembrar que sempre trabalharemos com uma
amostragem de uma populao, tentando, ao observar essa pequena
amostragem, concluir dados sobre toda uma populao. Por isto, nunca
poderemos estar totalmente certos da verdade, pois assumimos sempre
algumas incertezas sobre a nossa amostragem.
Infelizmente, a verdade uma incgnita que tentamos desvendar. Ao
testarmos uma hiptese, poderemos assumir dois tipos de erros: rejeitar a
hiptese nula quando na realidade ela verdadeira e concluir que a medicao
efcaz quando na realidade no tem nenhum efeito. Esse erro chamado
de Erro Tipo I (ou alfa). Podemos, inversamente, no rejeitar a hiptese e
concluir que a medicao no tem efeito quando na realidade ela efcaz. (
importante lembrar que a realidade nossa principal incgnita!) Esse erro
chamado de Erro Tipo II (ou beta).
No podemos eliminar o risco de cometermos algum desses erros, mas,
sim, diminuir a probabilidade de que eles ocorram. A probabilidade de cometermos
o Erro Tipo alfa, ou seja, rejeitarmos a hiptese nula quando na realidade ela
falsa, conhecido como o nvel de signifcncia de um teste estatstico.
Quando lermos que um resultado de um teste foi signifcativo a um nvel de 0,05
signifca que a probabilidade de estarmos errados ao rejeitarmos a hiptese nula (e
concluir que a hiptese alternativa erroneamente verdadeira) de 0,05, ou seja
5%. Podemos tambm dizer que alfa a possibilidade de determinado resultado
ter sido somente determinado pelo acaso. Alguns autores consideram um alfa
entre 0,1 e 0,05 como indicativo de uma diferena estatstica. Um alfa menor que
0,01 normalmente considerado e descrito em artigos como uma diferena muito
signifcativa. Existe uma tendncia contempornea de considerar o erro alfa de
0,05 de signifcncia baixa, mas isso no uma unanimidade.
A maioria dos artigos d muita importncia ao erro tipo I e muitas
vezes se esquece de abordar o erro tipo II, que igualmente importante. Como
vimos, o nvel de signifcncia usualmente aceito para um teste estatstico
de 0,05. O erro tipo II passa a ser um problema quando, evidentemente, no
conseguimos rejeitar a hiptese nula dentro de um nvel aceitvel. Quanto
maior for a diferena entre a mortalidade dos dois grupos, menor ser a
probabilidade de cometermos um erro tipo II (tambm chamado de erro beta),
o nvel de poder normalmente aceito para um teste estatstico de 0,20. O erro
tipo beta est diretamente relacionado com a variana da nossa amostragem
(variana = (desvio padro)). Quanto maior a variabilidade dos dois grupos,
147 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


menor ser a probabilidade de comprovarmos uma diferena entre dois grupos
(a diferena entre os grupos dever ser maior para podermos rejeitar a hiptese
nula). Para calcular a variana utilizamos a seguinte frmula:
S(x)
(x x)
n
=

1
Em linguagem humana: variana igual ao somatrio do quadrado das
diferenas entre cada valor de x e a mdia (quanto mais prximos da mdia os
valores de cada pessoa, menor ser essa diferena, consequentemente menor
ser a variana), dividido pelo nmero da amostragem, menos um. Quanto maior
o nmero de pessoas na nossa amostragem, menor ser nossa variana. Assim
podemos diminuir a probabilidade de termos um erro tipo beta aumentando o
nmero de participantes de nossa pesquisa. A capacidade de uma amostragem
rejeitar a hiptese nula chamada de Poder Estatstico. Assim o erro tipo
beta muito utilizado para calcular o nmero (N) amostral, ou seja, o nmero
antecipado de pessoas ou participantes em uma pesquisa necessrio para se
observar signifcncia estatstica em uma diferena entre grupos.
Usando o Programa StatCalc para calcular o N Amostral
O programa StatCalc, criado em 1993, usado para clculos estatsticos
rpidos. Basicamente possui trs componentes: Tabelas 2xN, clculo no N
amostral e o Qui-quadrado para tendncia (fgura 8.1).
Figura 8.1. Janela inicial do StatCalc.
Fonte: Epi Info

.
148
ngelo Jos Gonalves Bs
Sample Size & Power: calcula o nmero amostral necessrio para se
conduzir uma pesquisa, baseado em propores.

Figura 8.2. Janela do StatCalc mostrando as opes do Sample size & power.
Fonte: Epi Info

.
O delineamento das pesquisas determinar o tipo de clculo a ser
realizado. Quando desejamos obter uma amostra representativa de uma
populao para saber a prevalncia de determinada caracterstica usamos o
Population survey.
Exemplo: vamos supor que queremos estudar o nmero de fumantes
entre estudantes de uma universidade. Sabendo que o nmero de fumantes em
uma populao normalmente de 30%, e encontramos em um estudo piloto
que 45% dos estudantes fumam, queremos saber quantas pessoas devemos
estudar para confrmarmos essa hiptese. O nmero total de estudantes 10
mil. Assim colocaremos os dados como mostra a fgura 8.3.
149 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 8.3. Janela de defnio dos parmetros para o clculo amostra de uma pesquisa populacional
pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Pressionando o F4 obteremos o resultado, ilustrado na fgura 8.4.
Figura 8.4. Janela com os resultados do clculo amostral de uma pesquisa populacional pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Neste caso, o N amostral calculado sobre o intervalo de confana
(Confdence level). O intervalo de confana calculado como (1 erro alfa)
e, assim, devemos usar o intervalo de 95%. O programa oferece, assim, vrios
nveis de Intervalo de confana, para o nvel de 95% necessitamos entrevistar
36 pessoas aleatoriamente.
150
ngelo Jos Gonalves Bs
Exerccio :
Calcule o tamanho de amostra para uma pesquisa de populao de
700,000 pessoas para uma doena em que esperada uma prevalncia que seja
10%, mas o pior resultado que se espera poderia ser tanto quanto 20%. D os
valores por um nvel de confana de 95%.
N amostral para Estudo de Coorte ou Estudo Transversal
Estudo de Coorte um estudo onde acompanhamos um grupo de
pessoas com caractersticas especiais. Estudo Transversal um estudo onde
temos dados coletados somente uma vez e comparamos a prevalncia de
determinada doena ou caracterstica em pessoas com determinado fator.
Para calcular o N amostral de um Estudo de Coorte ou de um Estudo
Transversal, necessitamos ter uma ideia da proporo de pessoas no grupo
exposto ao fator e no grupo no exposto. Signifca, proporo de pessoas
que tm determinado fator como, por exemplo, o nmero de pessoas que
fumam ou tm desnutrio, a proporo esperada de doentes no grupo no
exposto e uma das trs alternativas: o risco relativo, a razo de chance ou
a proporo esperada de doentes no grupo exposto. Como exemplo vamos
calcular o tamanho de amostra de estudo Transversal (cross-sectional) para
uma pesquisa sobre bronquite crnica e tabagismo, onde sabemos, atravs da
reviso da literatura, que a proporo de tabagismo na populao 30%, entre
os no fumantes a frequncia da bronquite 5% e entre os fumantes 15%.
Explicando, temos que a proporo de expostos ao tabagismo 30%, ou seja,
70 no fumantes para 30 fumantes. Antes devemos confrmar o intervalo de
confana e o poder estatstico que queremos (95% e 80% respectivamente).
Finalmente, o programa pede a razo de chance (odds ratio), risco relativo ou
a proporo de doentes entre os expostos.
151 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 8.5. Janela de defnio dos parmetros para o clculo amostral de uma pesquisa tipo Estudo de
Coorte ou Transversal pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Como temos somente esse ltimo valor, entramos 15% na ltima
linha, conforme a fgura 8.5. Clicando em F4 temos os resultados:
Figura 8.6. Janela de resultados do clculo amostral de um Estudo de Coorte ou Transversal pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
152
ngelo Jos Gonalves Bs
O resultado parece um pouco complicado, mas calcula valores para
outros nveis de IC e Poder. O que nos interessa est na primeira linha de
nmeros. Temos o nmero de no expostos que seria 247 e de expostos
106, com o total de 353. Igualmente, podemos modifcar os valores tanto da
proporo de no expostos/expostos, e a proporo de doentes nos expostos.
E devemos recalcul-los clicando F4.
N amostral para estudo de caso controle
Figura 8.7. Janela de defnio dos parmetros para o clculo amostral de uma pesquisa tipo Caso Controle
pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Para clculo do N amostral de um estudo de caso controle, as
informaes necessrias so quase as mesmas do Estudo de Coorte ou
Transversal. A nica diferena que no temos o risco relativo, somente a
razo de chance e a percentagem de expostos entre os doentes. O resultado
tambm ser parecido.
153 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 8.8. Janela de resultados do clculo amostral de uma pesquisa Caso Controle pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Captulo 9
CONSTRUINDO E INTERPRETANDO TABELAS
Diferentes testes estatsticos so usados dependendo do tipo de
varivel que dispomos. Como vimos, as variveis podem ser numricas ou
categricas. As variveis numricas podem ser contnuas ou no. Exemplos
de variveis contnuas seriam a presso arterial, o colesterol e o peso. Um
exemplo de varivel no contnua seria o nmero de mortes de um hospital.
De maneira geral podemos dizer que a anlise dos dados vai ser baseada
nas caractersticas da varivel dependente e das variveis independentes. A
varivel dependente assim chamada, pois a varivel que desejamos observar
a relao ou efeito das outras sobre elas. Dizemos que a varivel dependente vai
depender das outras, que so chamadas independentes. Por exemplo, dizemos
que o nmero de mortes estar na dependncia do tratamento. No caso a varivel
dependente vai ser o nmero de mortes e a varivel independente o tratamento.
Assim defnindo podemos sintetizar a abordagem de anlise de dados
conforme a tabela 9.1.
Tabela 9.1 Sistematizao da anlise dos dados conforme as caractersticas das variveis dependente
e independente.
Varivel
dependente
Varivel
independente
Teste Interpretao
Categrica Categrica Qui-quadrado Relao
Numrica Categrica t Student ou ANOVA Comparao
Numrica Numrica
Regresso linear ou
correlao
Correlao
Categrica
dicotmica
Numrica Regresso logstca Associao
Calculando o c (qui-quadrado) para variveis categricas
O qui-quadrado (identifcado pela letra grega qui - c ao quadrado),
o teste estatstico utilizado para determinar se a distribuio de uma tabela
teria ocorrido por chance (hiptese nula) ou no (hiptese alternativa). O c
155 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


utilizado para estudar a relao entre duas variveis categricas ou variveis
numricas transformadas em categricas, por exemplo, faixas etrias. Por isto
o teste estatstico calculado pelo comando Tables do Epi Info

.
Temos como exemplo hipottico a frequncia do uso de culos entre
homens e mulheres. Estudamos 100 pessoas, 50 homens e 50 mulheres, deste
grupo teramos igualmente 50 pessoas usando e 50 pessoas no usando culos
conforme a tabela 9.2.
Tabela 9.2. Distribuio do nmero de pessoas que usa ou no culos entre homens e mulheres.
Usa culos No usa Total
Homens 30 (60%) 20 (40%) 50 (50%)
Mulheres 20 (40%) 30 (60%) 50 (50%)
Total 50 (50%) 50(50%) 100
Fonte: dados fctcios.
Observamos que o nmero de homens usando culos foi de 30/50 =
60%, enquanto essa frequncia nas mulheres foi de 20/50 = 40%. Notamos
assim que os homens usam proporcionalmente mais culos que as mulheres.
Se o gnero no tivesse relao nenhuma com o uso de culos, 50% dos
homens e 50% das mulheres usariam culos. Assim, na interpretao de
uma tabela procuramos sempre comparar o percentual dos totais (fora
da tabela) com os percentuais observados. Os percentuais fora da tabela
(totais) so os percentuais ESPERADOS, e os percentuais dentro da tabela
so os percentuais OBSERVADOS. Se os percentuais observados forem
diferentes que os esperados, mais do que a chance dizemos que existe uma
relao signifcativa entre as variveis, no caso gnero e uso de culos. O
teste do c nada mais que a o somatrio dos quadrados das diferenas
entre os valores observados e esperados, divididos pelos valores esperados
como veremos a diante. Felizmente, na maioria das vezes os programas
fazem todo esse clculo para ns, mas veremos como feito s para
matar nossa curiosidade. Para calcular os valores esperados multiplicamos
a percentagem dos valores totais das linhas. No caso teramos 50% de
homens vezes 50 usando culos, assim o esperado seria termos 25 homens
usando culos. Se no tivermos os valores percentuais podemos usar as
frmulas a partir da tabela:
156
ngelo Jos Gonalves Bs
Classicamente denominamos a tabela 2x2 com quatro letras a, b, c, e d:
Usa culos No usa Total
Homens a b a+b=50
Mulheres c d c+d=50
Total a+c=50 b+d=50 a+b+c+d=100
Os valores esperados de a seria o total da linha (a+b) vezes o total
da coluna (a+c) dividido pelo total geral (a+b+c+d), ou seja, 50x50/100=25.
Usando o mesmo princpio, todas as frmulas seriam:
Assim, a tabela esperada se a distribuio ocorresse ao acaso seria:
Usa culos No usa Total
Homens Ea=25 Eb=25 50
Mulheres Ec=25 Ed=25 50
Total 50 50 100
Notamos que na segunda tabela (tabela esperada) 25/50=50% dos
homens usam culos, o mesmo esperado para as mulheres. A principal
caracterstica dessa tabela o fato de ser homognea, ou seja, que a
distribuio nas casas obedece distribuio dos subtotais. Finalmente,
poderemos calcular o qui-quadrado, que a soma dos resultados obtidos pela
diviso do quadrado das diferenas entre o observado e o esperado de cada
clula pelo esperado de cada clula:
; ;
;
157 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


O valor crtico (p < 0,05) do qui-quadrado para uma tabela 2x2 (1
grau de liberdade
1
) 3,84. Poderemos buscar em uma tabela de distribuio
do qui-quadrado e observaremos que, para 1 grau de liberdade, qui-quadrado
= 4,0 temos p <0,0455. Conclumos que, com a chance de 4,6% de estarmos
enganados, existe diferena estatstica no uso de culos entre homens e mulheres.
Importante dizer que o qui-quadrado observa a distribuio na tabela como um
todo. No podemos, com o resultado do qui-quadrado, dizer que os homens
usam signifcativamente mais culos que as mulheres. Mas podemos dizer que
a proporo de homens usando culos foi maior que a de mulheres e que o qui-
quadrado foi signifcativo. Poderemos calcular o qui-quadrado para tabelas nxn
(3x2, 4x2, 4x4 etc.), utilizando o mesmo clculo realizado.
Utilizando o StatCalc para calcular o Qui-Quadrado
O programa Tables 2xN calcula o qui-quadrado de tabelas de distribuio
sendo a varivel da coluna com dois nveis. Como o Epi Info

foi originalmente
criado pensando em uma anlise de dados epidemiolgicos, essa varivel da
coluna chamada de Disease (doena) possuindo os nveis positivo (com
doena) e negativo (sem doena), como pode ser observado na fgura 9.1. A
outra varivel chamada de exposio que aceita dois ou mais nveis.
Figura 9.1 Janela de defnio dos valores da tabela a ser avaliada pelo StatCalc.
Fonte: Epi Info

.
1
A tabela 2x2 tem um grau de liberdade, pois, sabendo os totais, necessitamos saber somente o valor de uma
casa, para podermos calcular as outras. Grau de liberdade um parmetro estatstico utilizado para calcular
o valor crtico do teste que utilizamos, nesse caso o qui-quadrado.
158
ngelo Jos Gonalves Bs
O StatCalc tambm no aceita o comando do Mouse, para navegar
nele devemos apertar o Enter () e os comandos de funo que fcam na parte
de cima do teclado. A sequncia de entrada dos nmeros tambm no muda.
Comea no canto esquerdo depois na clula da direita para retornar a esquerda
j na clula em baixo e fnalmente na clula da direita.
Vamos digitar a seguinte tabela:
Falecidos Sobreviventes Total
Tratamento 40 232 272
Controle 35 93 128
Total 75 325 400
Devemos colocar primeiro o 40, que corresponde ao nmero de
falecidos (com doena) e em tratamento (exposto). Apertamos o Enter e
depois 232, sobreviventes em tratamento e Enter novamente. Logo a seguir
colocamos 35 e Enter, e fnalmente digitamos 325. Quando terminamos a
tabela devemos apertar o Enter duas vezes ou F4, se seguirmos digitando
nmeros logo aps cada Enter, uma nova linha aparecer. Aps apertarmos
dois Enter seguidos os resultados da anlise da tabela aparecero, segundo
a fgura 9.2. No caso estamos trabalhando com uma tabela 2x2, assim
os resultados da Razo de Chance (Odds ratio) e do Risco Relativo com
seus respectivos intervalos de confana aparecero. Discutiremos esses
resultados quando estivermos falando sobre a avaliao do risco, no dcimo
primeiro captulo deste livro.
159 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 9.2. Janela com resultados da anlise da tabela pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Nota-se uma das caractersticas do Epi Info

de colocar uma seta


ressaltando que o teste de signifcncia positivo. Para nova anlise aperta-se
a funo F2, se quisermos imprimir F5, se quisermos terminar F10.
160
ngelo Jos Gonalves Bs
Exerccio:
1. Calcule o Qui-Quadrado para a tabela seguinte:
Diabticos No diabticos
Fumantes 39 59
Ex-Fumantes 54 62
Nunca Fumantes 28 45
Construindo tabelas usando o Analysis Data do Epi Info

:
comando Tables
O comando Tables o terceiro comando da seco Statistics e fornece
alguns resultados estatsticos. Como se trata de tabelas teremos assim duas
variveis categricas. Como vimos o teste estatstico para testar a relao
entre duas variveis categricas o Qui-Quadrado. O Qui-quadrado nada
mais faz que determinar se existe um balano das casas na tabela observada
ao comparar essa tabela a uma tabela aleatria, chamada de tabela esperada.
Se a tabela observada tiver uma distribuio nas casas diferente das esperadas
dizemos que uma varivel est relacionada com a outra, pois produz uma
distribuio no aleatria. Vamos ver um exemplo, usando o banco de dados
Avaliacao.mdb e as variveis: ESTADOCIV e GENERO.
Na janela do comando temos dois compartimentos importantes
observados na fgura 9.3.
Figura 9.3. Janela do comando Tables do Analysis mostrando os compartimentos de
defnio das variveis da tabela.
Fonte: Epi Info

.
161 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Os valores vo fcar na vertical no compartimento chamado Exposure
Variable (1) e na horizontal no compartimento Outcome Variable (2). O
motivo pelo qual esses compartimentos so chamados dessa forma devido
ao fato do Epi Info

ter sido projetado para o trabalho com levantamentos


epidemiolgicos. No nosso caso no nos interessaria muito qual a varivel
colocar como varivel expositiva, mas como o sexo que defne qual estado
civil, na nossa hiptese este faz mais sentido ser colocado ali. Os testes
estatsticos so fornecidos automaticamente sem necessitarmos de qualquer
confgurao manual. Aps selecionadas as variveis podemos clicar OK.
No Analysis Output, observamos a tabela, na fgura 9.4, com algumas
anlises estatsticas que vamos interpretar. Primeiro observamos como
o programa dispe os resultados. Dentro de cada casa da tabela temos a
frequncia, embaixo temos a percentagem na linha e a percentagem da coluna.
No nosso caso observamos que 13 mulheres (37%) so casadas contra 22
(71%) dos homens, j a proporo de mulheres vivas bem maior que de
vivos, 40% contra 6,5% respectivamente(1). Esse achado corrobora com a
nossa hiptese. Abaixo da tabela temos os resultados da anlise estatstica. O
qui-quadrado foi 11,2 com um p = 0,0104, sendo signifcativo.
Figura 9.4. Janela do resultado do comando Tables destacando alguns resultados.
Fonte: Epi Info

, arquivo Avaliacao.mdb.
162
ngelo Jos Gonalves Bs
2. Usando o banco de dados Apoe*, tabela Grupo1, construa e
interprete as tabelas:
a. SEXO X OBESIDADE.
b. SEXO X HIPERTENSAO.
c. SEXO X DISLIPIDEMIA.
*Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo.
Captulo 10
CALCULANDO E COMPARANDO MDIAS
Comparando duas mdias pelo teste t de Student
O teste t de Student utilizado para comparar mdias de dois
grupos; necessita que a varivel a ser medida (dependente) seja contnua e,
evidentemente, a varivel a ser comparada (independente ou varivel resposta)
seja dicotmica (categrica com somente dois nveis). O teste utilizado para
resolver a seguinte hiptese nula: Ho : 1- 2= 0 (mdia do grupo 1 menos a
mdia do grupo 2 igual a zero, ou seja, no h diferena entre as mdias dos
dois grupos), com duas possveis hipteses alternativas: Ha : 1- 20 teste
de duas caudas (as duas mdias so diferentes) ou Ha : 1- 2>0 teste de uma
cauda (uma mdia de 1 maior que a mdia de 2). Assume dois diferentes
grupos, que podero ser de tamanhos diferentes.
Para calcular o t no pareado utilizamos a seguinte frmula:
Observamos na frmula que, quanto maior a diferena entre as mdias,
maior vai ser o t. No denominador existem dois fatores que podem infuenciar:
o somatrio das diferenas entre os diversos valores de x de um grupo com a
mdia do mesmo, isto determina que se a varincia dos grupos for pequena,
menor vai ser o denominador, portanto maior o valor do t; por ltimo,
devemos comentar que o nmero de observaes infuencia inversamente
o denominador da equao. Por isto, quanto maior a diferena das mdias,
menor a variabilidade dos grupos e, principalmente, maior o nmero de
observaes, maior sero as chances de encontrarmos um t signifcativamente
grande. Quanto maior o t maior seria a diferena entre os dois grupos e,
consequentemente, menor o erro alfa. O erro alfa estaria relacionado rea
comum existente entre os dois grupos.
( ) ( )

+
+

=

2 1 2 1
2
2 2
2
1 1
2 1
1 1
2 n n n n
X X X X
X X
t
164
ngelo Jos Gonalves Bs
Comparando duas ou mais mdias
Supomos que estamos testando o efeito de trs tratamentos diferentes
para hipertenso. Um grupo recebeu diurtico outro betabloqueador e outro
bloqueadores do clcio. Se usarmos o t de Student para comparar as trs
mdias, obteremos trs valores diferentes de p (erro tipo I ou alfa). Assumindo
um alfa de 0,05, teremos que a probabilidade de no estarmos errados ao
rejeitar a hiptese nula para cada um dos testes de 95%. Entretanto, a
probabilidade de no estarmos errados ao rejeitar a hiptese nula, em nenhum
dos testes, ser o produto das trs possibilidades, ou seja: 0,95 x 0,95 x 0,95
= 0,86. A probabilidade de no cometermos o erro tipo I em nenhuma das trs
comparaes possveis , ento, 0.86. Em outras palavras, a probabilidade
de ocorrer um erro tipo I nas trs comparaes ser de 0,14. Por isso,
a probabilidade de no ocorrer um erro tipo I, rejeitarmos a hiptese nula
quando na realidade ela for verdadeira, nessa trplice comparao ser maior
que a desejada de 0,05. Quanto maior o nmero de comparaes, maior ser a
possibilidade de ocorrer um erro tipo I.
Entendendo a Anlise de Variana
A tcnica apropriada para analisar variveis contnuas quando
desejamos comparar dois ou mais grupos (varivel categrica) a Anlise de
Varincia, tambm conhecida como ANOVA.
Os princpios envolvidos na Anlise de Varincia so os mesmos que
o t-teste. Dentro da hiptese nula, deveremos ter a seguinte situao: existe
uma grande populao e, se tivermos diversas amostras de um tamanho
determinado dessa populao, teremos vrias mdias, que devem variar,
aleatoriamente, entorno da mdia global de toda a populao. Se as amostras
variarem em torno da mdia total, mais do que o esperado pela chance, talvez
tenhamos algum fator, alm da chance, infuenciando essa alterao. Talvez
as amostras colhidas no sejam da mesma populao. Poderemos, assim,
rejeitando a hiptese nula de que todas as mdias so iguais, concluir que as
mdias diferem entre si mais do que o esperado pela chance.
A ANOVA calcula o F estatstico usando uma frmula menos complicada,
mas mais trabalhosa que a do clculo do t de Student. Tentaremos explicar um
pouco, mas no se preocupe se no conseguir entender o todo. Essencialmente,
queremos observar se a variabilidade dos valores entre os grupos (externa)
maior do que a variabilidade dos valores dentro de cada grupo (interna). As
variabilidades so calculadas pela soma dos valores dos grupos e as somas
165 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


dos quadrados desses valores (no ingls SS sum of square). Inicialmente,
calculamos o que se chama de soma dos quadrados total (SS total) e soma dos
quadrados externa (SS externa), usando as seguintes frmulas:
A SS total , assim, calculada pela soma dos quadrados dos valores dos
grupos menos o que poderemos chamar de mdia dos quadrados: o quadrado
da soma dos valores dos grupos dividido pelo nmero total de observaes.
A SS externa, que representa a variabilidade entre os grupos, calculada pela
soma das razes entre os quadrados das somas dos valores de cada grupo e
seu correspondente nmero de observaes, menos a mdia dos quadrados.
A soma dos quadrados interna (SS interna), que corresponde variabilidade
dentro dos grupos, ser calculada, assim pela diferena entre o SS total e o SS
externo. Finalmente, dividimos tanto a SS interna quanto a SS externa pelos
seus correspondentes graus de liberdade. Os graus de liberdade interna so
calculados pelo nmero de grupos menos 1, enquanto os graus de liberdade
externa so o nmero total de observaes de todos os grupos menos o nmero
total de grupos. Veremos mais adiante um exemplo prtico. O valor do F ser
ento o resultado da diviso da mdia externa pela interna. O F compara assim
as duas variabilidades entre os grupos e dentro dos grupos. Quanto maior a
mdia externa em relao mdia interna, maior ser o valor de F. Valores
da distribuio do F aparecem em vrias tabelas, e se o valor obtido da nossa
anlise for maior que o valor crtico tabelado, podemos rejeitar a hiptese
nula. O F assume os dois tipos de graus de liberdades vistos anteriormente: um
fornecido pela varincia entregrupos e outro pela varincia interna dos grupos.
O primeiro grau de liberdade calculado pelo nmero de grupos comparados,
chamado de k, subtrado de 1 (k-1). O grau de liberdade correspondente
varincia interna igual a N-k, onde N o nmero total de resultados (se
tivermos trs experimentos realizados em 100 pessoas teremos 300-3=297
graus de liberdade). Teremos a oportunidade de observar na prtica como
esses valores so obtidos pela ANOVA e como o F calculado.
( ) ( ) ( )
SS total SS externa
SS interna = SS total - SS externa
onde soma dos quadrados dos valores de todos os grupos
x = soma dos valores de todos os grupos
n = numero de observaoes em todos os grupos
= =

x
x
n
x
n
x
n
x
2
2 2 2
2

~
166
ngelo Jos Gonalves Bs
Confgurando o computador para realizar clculos estatsticos
Figura 10.1. Janela de seleo da lngua do sistema do computador.
Fonte: Windows 7.
Na maioria das vezes nossos computadores esto confgurados para
utilizar a lngua portuguesa. A lngua portuguesa utiliza vrgula no lugar de
ponto decimal. A maioria das verses de Windows faz com que o Epi Info


se atrapalhe ao fazer clculos usando vrgula como marcador decimal. Isso
faz com que variveis com valores decimais como peso ou altura tenham
suas mdias alteradas. Esse problema tambm poder afetar outros clculos
estatsticos. Por isso, devemos alterar as Opes Regionais (Regional Options)
na janela de Painel de Controle do Windows. Para tanto devemos abrir o Meu
computador e localizar a pasta Painel de Controle, abrir Opes Regionais e
alter-las escolhendo uma das tantas lnguas inglesas, observadas na fgura
10.1. Em alguns computadores isso no necessrio, como no Windows 2000,
por exemplo. Recomenda-se testar o Epi Info

antes.
167 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Calculando e comparando mdias usando o Epi Info

:
comando Means
Podemos calcular mdias e comparar as mesmas usando testes
estatsticos atravs do quinto comando do Statistics chamado Means.
Normalmente, testes estatsticos so usados para verifcar se as diferenas
das mdias de dois ou mais grupos poderiam ter ocorrido ao acaso (Hiptese
nula). Vimos que o teste t de Student usado para comparar duas mdias
e, quando temos mais que duas mdias, utilizamos a ANOVA (Anlise de
Varincia). Na realidade ambos os testes se equivalem, porque a ANOVA
tambm serve para testar diferenas entre as mdias de dois grupos. Por
isso o Epi Info

calcula tambm a ANOVA. No exerccio vamos calcular a


mdia do peso para cada sexo usando o banco de dados Avaliacao. Na janela
ilustrada na fgura 10.2 temos como Means of a varivel IDADE, e como
Cross-tabulate by Value of a varivel GENERO.
Figura 10.2. Janela do comando Means do Analysis.
Fonte: Epi Info

.
Temos que alterar um pouco a confgurao, por isso vamos clicar
em Settings.
168
ngelo Jos Gonalves Bs
Figura 10.3. Janela da opo Settings do Analysis destacando as opes Show Percents e
Show Tables in Output.
Fonte: Epi Info

.
A janela do Settings do comando Means (fgura 10.3) muito semelhante
aos outros comandos do Epi Info

. Vemos na fgura as confguraes automticas


deste comando. O Epi Info

, utilizando uma nica confgurao, no permite


confguraes personalizadas para cada tipo de comando. Existem assim algumas
confguraes que no nos ajudam para o comando Means, so os casos das
opes Show Percents e Show Tables in Output (1). Esta ltima opo cria uma
tabela com todos os valores da varivel, o que no nos interessa. Ento vamos
desselecionar essas opes. No existe diferena entre as opes de estatstica
intermediria e avanada. Clicamos OK para fechar essa janela e retornar janela
do Means e OK novamente para executar o comando. Essa confgurao no
salva automaticamente e devemos repeti-la toda vez que quisermos fazer uma
tabela. Podemos, todavia, alterar essa confgurao no ltimo comando do Epi
Info: Options Set. Devemos resselecionar essas opes para fazer tabelas.
O resultado do comando Means nos fornece vrios clculos que so
muito importantes. Na fgura 10.4 observamos que todos os resultados no
cabem em uma s tela.
169 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 10.4. Janela com resultados do comando Means do Analysis.
Fonte: Epi Info

, arquivo Avaliacao.mdb.
Descrevendo de cima para baixo os resultados, temos uma anlise
descritiva dos resultados para cada valor da varivel independente (no caso
gnero). Temos uma linha para o gnero feminino e outra para o masculino.
Inicialmente, o programa fornece o nmero de observaes, depois o somatrio
das idades, que no nos interessa muito, e, fnalmente, a mdia, varincia e o
desvio padro. importante, inicialmente, determinar se o nmero total das
observaes, nmero de pessoas no gnero masculino mais o nmero de pessoas
no gnero feminino, igual ao total de observaes no banco de dados. Isso
importante para verifcar se o programa est calculando adequadamente as mdias
com os valores no inteiros, quando estamos usando a linguagem portuguesa no
sistema, ao contrrio do orientado anteriormente. No caso temos o nmero total
de 66 pessoas que corresponde ao nmero total de pessoas no banco de dados.
Entretanto, a varivel IDADE no se presta para observar se a linguagem afeta os
clculos, por que s temos valores inteiros (anos). Observando as mdias, vemos
que no existe muita diferena nas idades entre os dois gneros, sendo as mulheres
170
ngelo Jos Gonalves Bs
um pouco mais idosas. Depois devemos observar as varincias, no caso, temos
uma varincia maior para as mulheres. Gostaria de destacar a importncia do
segundo grupo de anlise que justamente os valores mnimos e mximos. Eles
nos ajudam a observar se existem observaes com valores colocados errados.
Por exemplo, se tivssemos um valor mnimo de 5 poderamos pensar que, para
uma pessoa adulta, como todas as pessoas dessa amostra, esse valor no correto.
Assim observando, deveremos tentar corrigi-lo e repetir a anlise.
Depois dessa anlise descritiva, iniciam-se os resultados da ANOVA e
do teste t, que, no nosso exerccio, no foram signifcativas. O Epi Info

chama
a mdia externa de MS Between e a interna de MS Within. O F estatstico
calculado ento dividindo a mdia das somas entre os grupos (MS Between) e
a mdia das somas dentro dos grupos (MS Within) (135,9363/153,3334=0,89).
importante observarmos a similaridade da ANOVA e o t de Student quanto
aos resultados. Apesar de terem um clculo diferente chegam a resultados
idnticos, pois se elevarmos o t de Student ao quadrado chegaremos ao mesmo
valor do F calculado pela ANOVA (0,9416^2=0.8866).
O teste mais importante quando estamos trabalhando com o teste t
de Student e a ANOVA se as varincias so homogneas ou no. Assim,
o Epi Info

fornece o teste de Bartlett, mostrado na fgura 10.5, que testa


a probabilidade das varincias serem heterogneas ou no iguais. No nosso
caso, foi signifcativo, observando existir diferenas nas varincias dos dois
gneros. Como a varincia dos dois gneros no homognea, o resultado da
ANOVA e do t de Student no vlido. Devemos usar um teste no paramtrico
como o teste Kruskal-Wallis que fornecido pelo programa. No exerccio,
esse teste no foi signifcativo, confrmando que no existem diferenas entre
as idades dos homens e mulheres no grupo estudado.
Figura 10.5. Janela com a continuao dos resultados do comando Means do Analysis.
Fonte: Epi Info

, arquivo Avaliacao.mdb.
171 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Comparando mdias entre mais de trs grupos
Num novo exerccio, vamos comparar as mdias de idade entre os
grupos de tabagismo. Ao invs de colar a fgura vou selecionar o resultado e
col-lo no texto:
MEANS IDADE tabagismo PERCENTS=(-) TABLES=(-)
Descriptive Statistics for Each Value of Crosstab Variable
Obs Total Mean Variance Std Dev
Atual 19 921.0000 48.4737 68.3743 8.2689
Exfumante 14 838.0000 59.8571 76.4396 8.7430
Nunca 33 1763.0000 53.4242 208.7519 14.4482
Minimum 25% Median 75% Maximum Mode
Atual 34.0000 43.0000 50.0000 54.0000 65.0000 50.0000
Exfumante 46.0000 53.0000 59.5000 67.0000 70.0000 67.0000
Nunca 34.0000 40.0000 48.0000 68.0000 83.0000 75.0000
ANOVA, a Parametric Test for Inequality of Population Means
(For normally distributed data only)
Variaton SS df MS F statstc
Between 1044.7610 2 522.3805 3.6959
Within 8904.5117 63 141.3415
Total 9949.2727 65
P-value =0.0304
Bartletts Test for Inequality of Population Variances
Bartlets chi square= 8.3767 df=2 P value=0.0152
A small p-value (e.g., less than 0.05) suggests that the variances are
not homogeneous and that the ANOVA may not be appropriate.
172
ngelo Jos Gonalves Bs
Mann-Whitney/Wilcoxon Two-Sample Test (Kruskal-Wallis test for two groups)
Kruskal-Wallis H (equivalent to Chi square) = 7.0843
Degrees of freedom = 2
P value = 0.0290
Vemos que os fumantes atuais so mais jovens que os outros dois
grupos. Vemos tambm que o grupo dos nunca fumantes apresenta uma maior
varincia que os outros. O teste de Batlett foi signifcativo, orientando para
no se usar o resultado da ANOVA, assim usaremos, novamente, o teste de
Kruskal-Wallis, que foi signifcativo.
Testes de multicomparao (teste de Bonferroni)
Quando calculamos a ANOVA para mais de dois grupos e chegamos
a um teste signifcativo, nos deparamos com o seguinte dilema: sabemos que
existem diferenas entre os grupos, pelo menos um grupo diferente dos
demais, mas ser que todos so diferentes entre si? Temos, no nosso exemplo,
que a idade dos atuais fumantes a menor de todas, assim ela, com certeza,
signifcativamente menor que a idade dos ex-fumantes, que a maior. Mas
como saber se a idade dos atuais fumantes signifcativamente menor que os
nunca fumantes e se os nunca fumantes so signifcativamente mais jovens
que os ex-fumantes? Para resolver este dilema existem os chamados testes
de multicomparao. Existem vrios, mas o Epi Info

no fornece nenhum.
Um teste que podemos realizar o teste de Bonferroni que ajusta o p crtico
ao nmero de comparaes. Assim, usando o mesmo motivo de o porqu
da necessidade da ANOVA quando temos mais de dois grupos. Quando
temos trs grupos precisamos fazer trs comparaes: A com B; B com C e
A com C. Se usarmos o limite de p de 0,05 temos (0,95x0,95x0,95= 0.86),
se dividirmos 0,05 por 3 chegamos a um p de 0,01666, calculando o p total
nas trs comparaes temos (0.983x0.983x0.983=0.95). Assim, conseguimos
ajustar o p para mltipla comparao, dividindo o mesmo pelo nmero de
comparaes necessrias para comparar todos os grupos. Podemos utilizar
essa estratgia quando temos uma ANOVA signifcativa.
173 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
Usando o banco de dados Apoe*, tabela Grupo1, observar quais as
variveis numricas (COLESTEROL, PAS, PAD, IMC, IDADE) tm suas
mdias signifcativamente diferentes entre APOE4 sim e no.
*Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo.
Captulo 11
ESTUDANDO VARIVEIS NUMRICAS COM A
REGRESSO LINEAR
Testando a relao entre variveis numricas contnuas
Quando desejamos estudar o comportamento de duas variveis
numricas devemos, inicialmente, construir grfcos de disperso XY (Scatter
XY). Para observar algumas das caractersticas dos testes utilizados para testar
a relao das variveis numricas vamos construir dois grfcos ALTURA x
IMC e PESOATUAL x IMC.
Para tanto vamos utilizar o arquivo Avaliacao.mdb, no esquecendo
de trocar o projeto se o mesmo no estiver ativo.
Para fazer o grfco de disperso XY, usa-se o comando Graph na
seco Statistics. Escolhendo a opo Scatter XY, colocamos primeiro a
varivel X (ALTURA); depois a varivel Y (IMC). Como resultado teremos o
grfco da fgura 11.1.
Figura 11.1 Grfco da distribuio do IMC (ndice de Massa Corporal) em funo da ALTURA
criado pelo comando Graph.
Fonte: Epi Info

.
175 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Observamos que o Epi Info

fornece automaticamente uma linha


retilnea e pontos, que correspondem a cada uma das observaes do banco
de dados. Essa reta a chamada Linha de Regresso que procura ilustrar, ou
descrever, a relao entre as duas variveis. Vamos ver, em seguida, como ela
calculada. Notamos que essa linha descendente, mais ou menos metade
das observaes est acima e a outra, logicamente, est abaixo dessa linha.
Vemos tambm que existe uma certa disperso ao redor dessa linha, algumas
observaes esto prximas e outras mais afastadas. Vamos fazer o mesmo
grfco para IMC e PESOATUAL, simplesmente fechando a janela do grfco
e trocando, no Program Editor a palavra altura por pesoatual (no importa
se for maiscula ou minscula) e clicamos no boto Run This Command, que
o ltimo direita no menu da janela do Program Editor.
Figura 11.2. Distribuio do IMC (ndice de Massa Corporal) em funo do PESOATUAL criado pelo
comando Graph.
Fonte: Epi Info

.
Observamos o novo grfco na fgura 11.2 que apresenta algumas
caractersticas semelhantes e outras diferentes. Igualmente ao grfco anterior
este grfco tambm apresenta uma reta com mais ou menos metade da
amostra acima e outra metade abaixo da reta. Observamos, entretanto, que a
reta apresenta-se ascendente e as observaes mais prximas da reta (menos
disperso). Existem, assim, dois importantes fatores a observar quando
176
ngelo Jos Gonalves Bs
analisamos a associao entre duas variveis numricas: o grau de disperso
das observaes e a anlise da reta. O grau de disperso medido pelo
Coefciente de Correlao e seu valor independe de qual varivel dependente
ou independente; ela independe tambm do tipo de unidade utilizada para
medir as variveis (kg ou libras, metros ou polegadas, por exemplo).
Entendendo o Coefciente de Correlao
Duas variveis contnuas podem estar correlacionadas uma com
a outra. Por exemplo, pessoas mais altas tendem a serem mais pesadas.
O Coefciente de Correlao (tambm chamado de r) uma medida da
associao entre duas variveis contnuas. O r pode variar de 0 a 1. Se for
zero, signifca que as duas variveis no tm nenhuma correlao. Se o r =
1, signifca que existe perfeita correlao, ou seja, uma varivel pode predizer
outra. O coefciente de correlao est relacionado com o grau de disperso de
duas variveis. Quanto mais prximas forem as observaes em torno de uma
reta imaginria (linha de regresso), maior vai ser o r.
A frmula para o clculo do r a seguinte:
Elevando ao quadrado teremos o r.
Observamos que poderamos muito bem trocar a posio do X e do Y
na frmula sem alterar o seu resultado, corroborando com o que foi explicado.
Entendendo a Regresso Linear
Para representarmos grafcamente a associao entre duas variveis,
utilizamos a Regresso Linear, que poder ser simples, se utilizarmos
apenas uma varivel dependente (resposta) e uma varivel independente
(fator). A Regresso Linear mltipla utiliza tambm uma varivel resposta,
que dever ser contnua, e dois ou mais fatores, que podero ser contnuos
ou no. Iniciaremos com a Regresso simples. Ilustraremos essa relao
pelo grfco abaixo, com cinco diferentes pessoas, A, B, C, D e E com seus
pesos e alturas.
r
n XY X Y
n X X n Y Y
=




( ) ( )( )
( ) ( )
177 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 11.3. Distribuio de cinco pessoas conforme seu peso e altura.
Fonte: dados fctcios.
Observamos que seria possvel traar uma linha entre os resultados.
Anteriormente, estudamos como podemos descrever uma linha no grfco.
Chamvamos de Equao de Primeiro Grau da Reta. A frmula da equao de
primeiro grau era, basicamente, y=a+bx; onde a era o ponto de interseco da
reta no eixo y, ou seja, quando x=0; j o b era o ngulo da reta. A regresso
linear calcula esses parmetros da equao. Vejamos no grfco da fgura 11.4.
Figura 11.4. Distribuio de cinco pessoas conforme seu peso e altura e a regresso
linear dessa distribuio, destacando o coefciente de regresso.
Fonte: dados fctcios.
178
ngelo Jos Gonalves Bs
A frmula da linha seria peso = -2,85 +Altura*0.41. Intercept o a
(ponto de interseco) que corresponde ao valor do peso se a altura fosse igual
a zero (-2,85), usando os resultados da Regresso. A altura multiplicada por
b que tambm chamado de coefciente de regresso e corresponde ao valor
alterado no peso quando a altura sobe uma unidade de medida, no caso, uma
pessoa com um centmetro a mais teria 0,41 quilos a mais que a outra. O valor
de a um tanto imprprio, pois nos diz pouca coisa a respeito dos dados que
temos, pois jamais vamos encontrar algum com altura zero, enquanto o b tem
um valor expressivo, pois nos indica um valor preditivo de variao. Poderemos,
com os valores de a e b, predizer o quanto pesaria uma pessoa de 170 cm:
Peso= a + b x altura, ou seja -2,85 + 0,41x170 = 66,85 (quase 67) quilos.
Em termos estatsticos temos duas hipteses nulas: que o Intercepto
(a) igual a zero e que o Coefciente de Regresso (b) igual a zero. Se o
Coefciente de Regresso fosse igual a zero, teramos uma linha paralela ao
eixo do X. Nesse caso, para qualquer valor de altura, o peso seria igual ao
Intercepto, provando assim que a altura no afetaria o peso.
Vamos ver, no nosso exemplo, como o Epi Info

calcula esses
parmetros. Primeiro vamos calcular a Regresso para Y=IMC e X=ALTURA.
Na seco Advanced Statistics clicamos em Linear Regression e obtemos a
janela da fgura 11.5.
Figura 11.5. Janela do comando Linear Regression do Analysis destacando os compartimentos mais importantes.
Fonte: Epi Info

.
179 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


No primeiro compartimento (1) selecionamos o que o Epi Info

chama
de Outcome Variable (Varivel de Sada), que poderamos chamar de Varivel
Resposta, mas usualmente chamamos de Varivel Dependente. No caso
especfco a varivel Y da nossa equao, no nosso exemplo ser o IMC. No
compartimento Other Variables (2) seriam as Variveis Independentes, como
podemos notar pode ser mais do que uma. No nosso caso ser ALTURA. Mais
tarde usaremos mais do que uma varivel independente, mas por enquanto
vamos ver como o programa nos mostra os resultados:
Linear Regression
Variable Coefcient Std Error F-test P-Value
ALTURA -0.177 0.055 10.4070 0.001992
CONSTANT 56.365 8.849 40.5705 0.000000
Observamos os coefcientes dos parmetros da Regresso:
ALTURA=-0,177, com seu teste estatstico (F) e signifcncia (p=0,001992),
e o que o Epi Info

chama de CONSTANT, que o Intercepto, no caso 56,365,


igualmente com seu teste estatstico e signifcncia.
Observamos que o coefciente para ALTURA negativo, que concorda
com o grfco que mostra uma linha descendente e signifcativo. Raramente o
Intercepto no ser signifcativo, mas, de qualquer forma, ele no importante
para ns, pois no nos interessa saber o IMC de uma pessoa que no tem
altura. A interpretao do coefciente da altura muito importante: na nossa
amostra, pessoas com um centmetro a mais de altura so, em mdia, 0,177
kg/m IMC menor.
Nossa equao fcaria assim: IMC = 56,365 Altura * 0,177
Vimos no grfco que existia uma disperso muito grande das observaes.
Essa disperso medida pelo Coefciente de Correlao, a seguir:
Correlaton Coefcient: r^2= 0.14
Observamos que altura explicaria somente 14% da variabilidade do IMC.
Vamos ver o outro exemplo, IMC=PESOATUAL, bastando alterar o
comando na janela Program Editor e clicar em Run This Command. Teremos
as seguintes respostas:
180
ngelo Jos Gonalves Bs
Variable Coefcient Std Error F-test p-Value
pesoatual 0.277 0.034 65.3074 0.000000
CONSTANT 7.988 2.492 10.2784 0.002115
Correlaton Coefcient: r^2= 0.51
A equao para o clculo do IMC seria: IMC= 7,988 + Pesoatual * 0,277
Observamos que, corroborando com o grfco que fzemos
anteriormente, o coefciente de regresso para o peso positivo e com
valor absoluto maior que para a altura. Para cada diferena de um quilo h
uma diferena de 0,277 kg/m no IMC. Vemos tambm que o coefciente
de correlao tambm maior, pois existe menos disperso entre as duas
variveis. O peso explicaria mais de 50% da variabilidade do IMC.
O principal motivo para o peso ter uma maior correlao que a altura no
IMC est relacionado frmula utilizada para o clculo desse. Na frmula do
IMC, o peso colocado diretamente, enquanto a altura elevada ao quadrado. A
elevao ao quadrado faz com que a altura tenha assim uma menor correlao.
Usando variveis categricas na Regresso Linear
Vimos que, por defnio, a Regresso Linear serve para observar a relao
entre duas variveis numricas. Entretanto, podemos introduzir no modelo uma
varivel categrica, por exemplo, a varivel GENERO. Neste caso, gostaramos
de descobrir se a linha de regresso IMC=PESOATUAL igual ou diferente nos
dois gneros. Acrescentamos, assim, uma nova hiptese nula, de que o coefciente
para o gnero = 0. Se o coefciente para o gnero for zero, o gnero no altera
essa relao. Vamos colocar a varivel GENERO no nosso comando: REGRESS
IMC= PESOATUAL GENERO. Observamos os resultados:
Variable Coefcient Std Error F-test P-Value
pesoatual 0.284 0.029 96.5528 0.000000
genero (Masculino/Feminino) -3.500 0.667 27.5633 0.000002
CONSTANT 9.173 2.107 18.9616 0.000051
Correlaton Coefcient: r^2= 0.66
A equao para essa anlise seria: IMC= 9,173+Pesoatual*0,284+
Gnero*-3,500
181 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Como a varivel gEnero tem dois nveis, o programa j fornece
a interpretao: Masculino/Feminino, ou seja, masculino em relao ao
feminino. O programa determina, automaticamente, um valor numrico para
cada valor de genero, sendo o masculino 1 e feminino zero, ou referencial.
No caso, o coefciente de gEnero fornece a diferena que existe nos homens
em relao s mulheres. Se fossemos calcular o IMC das mulheres ns
utilizaramos somente a frmula:
IMC= 9,173 + PESOATUAL*0,284
A frmula para os homens seria:
IMC= (9,173-3,5) + PESOATUAL*0,284
Observamos que a nica diferena no Intercepto e essa diferena foi
signifcativa. O coefciente CONSTANT na nossa regresso se refere ento
ao intercepto das mulheres, sendo o coefciente GENERO a diferena entre
homens e mulheres no Intercepto (9173 para mulheres e 5,673 para homens).
Nesta equao, homens e mulheres alterariam da mesma forma seus IMC,
em funo do peso. Notamos que o valor do coefciente Pesoatual no alterou
muito com a introduo desse fator, ao contrrio do coefciente intercepto,
que alterou de 7,988 para 9,173. No grfco teramos: homens e mulheres com
linhas paralelas, sendo a dos homens, 3,5 kg/m, inferiormente colocada.
Vamos fazer esse grfco para entender a equao gerada pela Regresso
Linear. Calcularemos, usando a equao como seriam os valores de IMC preditivos
para homens e mulheres. Primeiro devemos defnir uma varivel nova, chamaremos
de IMCC. Usaremos o comando If, para calcular diferentemente os valores de
IMCC para cada um dos gneros. No primeiro compartimento do comando If
colocaremos genero=feminino e no compartimento Then atribuiremos a
frmula para o gnero feminino: assign IMCC= 9,173+0,284*pesoatual, no
compartimento else colocamos a frmula para o masculino assign IMCC= 5.673
+ 0,284*pesoatual. Conforme a fgura 11.6.
182
ngelo Jos Gonalves Bs
Figura 11.6. Comando IF do Analysis ilustrando a atribuio frmulas distintas para
cada valor de GENERO no clculo do IMC.
Fonte: Epi Info

.
Finalmente podemos construir o grfco PESOATUAL X IMCC
usando a opo Series para cada valor de Genero, observado na fgura 11.7.
Figura 11.7. Distribuio do IMC calculado para cada valor de GENERO em funo do PESOATUAL.
Fonte: Epi Info

, arquivo Avaliacao.mdb.
20.0
22.5
25.0
27.5
30.0
32.5
35.0
45 50 55 60 65 70 75 80 85 90 95
i
m
c
c
PESOATUAL
Feminino Masculino
183 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Vemos que, utilizando o resultado da regresso para calcular o IMC,
teramos duas retas paralelas com 3,5 unidades de IMC de diferena. Mas vamos
criar o grfco PESOATUAL X IMC para cada valor de gnero e observar se as
duas retas so realmente paralelas. O grfco apresenta-se na fgura 11.8.
Figura 11.8. Distribuio do IMC medido para cada valor de GENERO em funo do PESOATUAL.
Fonte: Epi Info

, arquivo Avaliacao.mdb.
Observamos que os homens, em tringulo no grfco, fcam, em sua
maioria, inferiormente colocados. Mas as duas curvas no so, aparentemente,
paralelas. O grfco mostra que a linha das mulheres tem um ngulo maior
que a dos homens, levando a acreditar que um aumento no peso das mulheres
est relacionado a um aumento maior no IMC do que aconteceria nos homens.
Como medir ou verifcar se isso signifcativo ou no? Usamos um artifcio
chamado de interao. Nossa frmula fcar: IMC= peso genero peso*genero,
onde teremos mais um coefciente para medir a diferena no efeito do peso
sobre o IMC nos diferentes gneros. No comando da Regresso Linear, para
criar uma interao, devemos selecionar as variveis desejadas colocando-
as na lista de variveis do modelo. Depois devemos marc-las clicando em
cada uma delas conforme a fgura 11.9 (1). A barra que fca entre a janela de
seleo das variveis e as variveis selecionadas muda de nome, para Make
Interaction (2); clicando nessa barra a frmula da interao passa para a janela
de interao, fcando a janela fnal semelhante observada na fgura 11.10.
20.0
22.5
25.0
27.5
30.0
32.5
35.0
45 50 55 60 65 70 75 80 85 90 95
i
m
c
PESOATUAL
Feminino Masculino
184
ngelo Jos Gonalves Bs
Figura 11.9. Detalhe do comando Linear Regression mostrando como criar uma interao entre
duas variveis.
Fonte: Epi Info

.
Figura 11.10. Janela do commando Linear Regression mostrando os comandos para a criao de uma
regresso linear com interao entre GENERO e PESOATUAL.
Fonte: Epi Info

.
185 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Vejamos nosso resultado.
Variable Coefcient Std Error F-test P-Value
Pesoatual 0.319 0.038 69.4905 0.000000
genero (Masculino/Feminino) 2.310 4.195 0.3034 0.583791
pesoatual * genero (Masculino/
Feminino)
-0.081 0.058 1.9675 0.165780
CONSTANT 6.632 2.766 5.7477 0.019587
Correlaton Coefcient: r^2=0.67
A equao fca assim: IMC= 6,632+pesoatual*0,319+genero*2,
310+pesoatual*genero*-0,081, onde genero ser igual a 1 para os homens
e Zero para mulheres. Notamos primeiro que o coefciente genero mudou
para positivo, mostrando que a linha dos homens inicia maior, mas no
signifcativamente maior que zero, pois p maior que 0,05; homens e
mulheres iniciam em pontos no signifcativamente diferentes. O coefciente
da interao peso*gnero tambm no foi signifcativo. Continuamos tendo
duas frmulas para o clculo do IMC, uma para cada valor de gnero:
Para as mulheres ser simplesmente: IMC= 6,632+ pesoatual*0,319.
Para os homens passa para IMC=(6,632+2,310)+ Pesoatual (0,319-0,081).
Os coefcientes CONSTANT e pesoatual se referem ento s mulheres
e os coefcientes genero e pesoatual*genero s diferenas entre os homens e
as mulheres. Entretanto, no nosso exemplo, a interao no foi signifcativa.
Na nossa interpretao fnal, o grfco demonstrou linhas no paralelas, mas a
diferena dos ngulos entre homens e mulheres no foi signifcativa. Quando
uma interao no signifcativa, ela no necessita aparecer nos resultados,
ento podemos, sim, somente citar que ela no foi signifcativa.
Notamos tambm que, na equao com interao, o coefciente genero
no foi signifcativo, pois a interao roubou a signifcncia. Por isto, no nosso
caso especfco, a interao deve ser removida do nosso modelo fnal. Exceto
se quisermos mostrar essa diferena e divulgarmos que no signifcativa.
Novamente, um resultado no signifcativo pode ser importante e no signifca que
no exista diferena no comportamento do peso em relao IMC entre homens e
mulheres, pois estamos tratando de uma amostragem. Quem sabe numa amostra
diferente ou maior o coefciente Peso* genero seja signifcativo.
186
ngelo Jos Gonalves Bs
Exerccio:
Utilizando o projeto Apoe*, tabela Grupo1, calcular a regresso linear de:
IMC, COLESTEROL, PAD, PAS e TEMPO como variveis
dependentes e as variveis IDADE e APOE4 como variveis independentes;
utilizando a interao IDADE*APOE4, e descrever o resultado.
1. IMC = IDADE APOE4 IDADE*APOE4.
2. COLESTEROL = IDADE APOE4 IDADE*APOE4.
3. PAS = IDADE APOE4 IDADE*APOE4.
4. PAD = IDADE APOE4 IDADE*APOE4.
5. Tempo = Idade Apoe4 Idade*Apoe4.
*Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo.
Captulo 12
ENTENDENDO A REGRESSO LOGSTICA E
AS MEDIDAS DE RISCO
Compreendendo as medidas de risco
As medidas de risco so utilizadas para avaliar a relao existente entre
um fator de risco e um evento. Existem trs formas de se avaliar esta relao:
1. Escolher duas amostras, uma com (caso) e outra sem o
evento (controle), e estudar a prevalncia do fator.
2. Escolher uma amostra aleatria de uma populao e
observar a prevalncia do evento e dos fatores.
3. Estudar um grupo de pessoas com ou sem o fator e
observar quantos vo desenvolver o evento desejado.
O primeiro mtodo, chamado caso-controle, particularmente til
quando temos um evento (doena) raro, pois teramos que ter uma amostra da
populao muito grande para podermos pegar ao acaso um nmero expressivo
de casos. Por exemplo, se a prevalncia de determinada doena um caso para
mil habitantes, teremos que observar pelo menos 5 mil pessoas escolhidas
aleatoriamente para termos alguma chance de conseguir cinco casos. Observa-
se que estudos caso-controle so mais rentveis que os levantamentos
populacionais ou transversais, que so o segundo mtodo de avaliao do risco.
O estudo de coorte, o terceiro mtodo, observa a incidncia de novos
casos durante um perodo de tempo. O delineamento no somente baseado
na hiptese que as pessoas com fator de risco vo ter maior incidncia do
evento, mas tambm avalia a funo do tempo. A outra hiptese dos estudos de
segmento que os indivduos com fator de risco vo ter maior probabilidade de
desenvolver determinado evento antes do que o grupo livre do fator de risco.
o caso da mortalidade, pois todas as pessoas vo morrer, mas as que tiverem
fatores de risco a probabilidade de morrer mais cedo ser maior.
Os instrumentos de avaliao do risco podem concluir que determinado
fator no tem relao com o evento. Isto ocorre quando a proporo de
eventos igual nos dos grupos, com e sem fator. Assim, possvel concluir
188
ngelo Jos Gonalves Bs
que possui relao de risco, quando se prova que a presena do fator eleva o
nmero de casos, ou, ainda, que o fator pode ser protetor, quando se observa,
proporcionalmente, menos eventos no grupo com fator.
Como estamos trabalhando com proporo, seria o primeiro caso se
tivermos 50% de casos com fator e 50% de casos sem fator. Essa proporo
de casos e no casos seria 50/50 =1. Se tivermos mais casos com fator,
teremos um nmero maior que 1 e, inversamente, se tivermos menos casos
com fator, teremos um nmero menor que 1. Neste ltimo caso, onde menos
gente teria o evento, nos levaria a crer que o fator protetor. Vimos que
o nmero 1 o divisor de guas: mais que 1 signifcaria fator de risco,
menos que 1 fator protetor.
Toda a amostra nos induz a um erro, pois tentamos, atravs de um
nmero reduzido, estimar a verdade. Para sabermos se o clculo do risco
signifcativo necessitamos calcular o intervalo de confana de 95%. Dentro
deste intervalo estaria o risco real. Para que o risco seja signifcativo,
ambos os valores, limite superior ou limite inferior do intervalo, devem ser
ou menores ou maiores que 1. Em outras palavras, o intervalo no deve
conter o valor 1.
Dependendo do desenho da nossa pesquisa poderemos usar dois tipos
de medidas de risco: o Risco Relativo e a Razo de Chance.
Calculando o Risco Relativo
Para sabermos se determinada exposio fator de risco para a doena,
calculamos o Risco Relativo. O clculo do Risco Relativo muito simples,
pois dividimos a proporo de doentes expostos pela proporo de doentes
no expostos.
Exemplo: Considerando uma populao de 100.000 habitantes e a
distribuio da mesma em uma tabela 2x2 sobre o fato de ter ou no uma
determinada doena e/ou um determinado fator de risco:
Doena
Total
Sim No
Exposto a= 300 b=9.700 a+b= 10.000
No exposto c=700 d=89.300 c+d= 90.000
Total a+c=1.000 b+d=99.000 a+b+c+d=100.000
189 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


incidncia em expostos= a/(a+b) => 300/10.000=0,03
incidncia em no expostos=c/(c+d) => 700/90.000=0,00784
RR= 0,03/0,00784 = 3,939
Signifca: o risco de uma pessoa exposta ter a doena 3,94 vezes o
risco da no exposta, ou 2,94 vezes maior. No caso temos um estudo transversal.
O Risco Relativo, por ser um simples clculo de chances maiores
em determinado grupo comparado com outro, pode nos levar a falsas
interpretaes quando um terceiro fator desconhecido esteja afetando
ambos. Algum pesquisador desavisado poder associar cncer de pele
e catarata. No entanto, ambos esto associados exposio ao sol sem
proteo. A retirada de um fator de risco deve afetar o aparecimento do
outro, o que no vai ocorrer com a cirurgia de catarata e o cncer de pele.
O uso de creme protetor solar para evitar o cncer de pele no vai afetar o
aparecimento de catarata.
Calculando a Razo de Chance
Outro clculo utilizado a Razo de Chance (Odds Ratio), que
seria o clculo de o quanto a chance de ter a doena com exposio seria
maior que o sem exposio ao fator. Para isso usamos a frmula: nmero de
expostos doentes x no expostos no doentes, divididos pelos expostos no
doentes e no expostos doentes.
No exemplo: Razo de Chance = axd/bc = 300x89.300/700x9.700 = 3.946
Caractersticas do Risco Relativo (RR) e da Razo de Chance
(RC)
1. Quanto mais rara for a doena, mais RR=RC.
2. Se RR for igual a 1, ento RC sempre ser igual a 1.
3. Se RR for maior que 1, ento RC sempre ser maior que 1.
4. Igualmente, se RR for menor que 1, ento RC sempre
ser menor que 1.
5. Se trocarmos o fator de risco pelo efeito, a razo de
chance no muda, mas o valor do risco relativo altera.
190
ngelo Jos Gonalves Bs
Calculando o Risco usando o Epi Info

A maneira mais fcil de calcular o risco quando temos j a tabela com


os valores dos casos e eventos utilizar o programa tables 2xn do StatCalc.
Como vimos no captulo 9, o StatCalc fca no menu utilities. Vamos calcular o
exemplo anterior criando uma tabela 2x2.
Escolhemos assim a opo tables 2x2 e surge a tabela para colocarmos
os dados sempre apertando a tecla Enter. Na sequncia colocamos 300, 9700,
700, 89300. Clicando Enter duas vezes teremos o resultado na fgura 12.1.
Figura 12.1. Resultado da anlise da tabela do exemplo 1 pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Vimos que os valores so muito grandes, pois representam um
estudo transversal populacional; existem tambm mais sadios que doentes,
pois a prevalncia da doena de 1/100. Como vimos anteriormente,
estudos populacionais so muito difceis, principalmente quando
trabalhamos com doenas raras. Assim nos valemos de estudos de caso-
controle, onde sabemos de antemo quem doente e sadio. Geralmente,
a proporo de doentes ser maior que o da populao total e podemos
escolher a mesma quantidade de casos e controles ou um pouco mais
controles que casos. No estudo de caso-controle, devemos escolher os
casos e controles sem controlarmos, nesse momento, quem exposto ou
no. Assim, se escolhermos uma amostra menor, a proporo de expostos
191 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


e no expostos dever ser representativa, ou seja, parecida com o que
acontece na populao.
Vamos ver qual das medidas de risco seria mais adequada para o
clculo do risco em estudo de caso-controle. No exemplo acima, teramos um
estudo de caso-controle onde observamos apenas metade dos casos (500) e
1.000 controles (1/99), obedecendo s propores do fator de risco teremos:
Doentes Controles Total
Exposto 300/2=150 9.700/99=98 248
No exposto 700/2=350 89.300/99=902 1.252
Total 500 1.000 1.500
Usando o StatCalc para calcular os riscos teremos o resultado na
fgura 12.2.
Figura 12.2. Resultado da anlise da tabela do exemplo 2 pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Observamos que, como a proporo do fator de risco em ambos os
grupos, doentes e controles, o mesmo do estudo transversal, o resultado
do clculo do risco deveria ser o mesmo. Entretanto, o Risco Relativo
calculado no caso-controle bem diferente do calculado no estudo
transversal. J na Razo de Chance, os resultados de ambos os estudos
192
ngelo Jos Gonalves Bs
so muito semelhantes, comprovando que a Razo de Chance pode ser
utilizada nos dois desenhos.
Se trocarmos a posio do fator, pelo evento, teremos o resultado
conforme a fgura 12.3.
Figura 12.3. Resultado da anlise da transposio da tabela do exemplo 2 pelo StatCalc.
Fonte: Epi Info

, dados fctcios.
Novamente, o resultado do clculo da Razo de Chance mantm-se e
o resultado do Risco Relativo se altera.
Usando a Regresso Logstica
Utilizamos a regresso logstica para calcular a Razo de Chance
de uma pesquisa cujo desenho seja caso-controle com mais de um fator de
risco. Como vimos, a regresso tenta descrever a relao de duas ou mais
variveis em uma frmula. No caso do estudo do risco teremos nossa varivel
dependente categrica com dois nicos valores possveis: ter ou no ter o
evento. Esse evento pode ser um evento adverso ou favorvel: morte ou
ganhar na loteria, infelizmente a Razo de Chance do primeiro maior que
a do segundo. Quando montamos um estudo sobre o risco de um evento,
devemos, inicialmente, caracterizar ou descrever claramente que critrios
sero utilizados para caracterizar o evento. A frmula da regresso logstica :

bx
e RC
=
193 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


onde e o logaritmo natural e b o coefciente do fator ou varivel x. Vamos ver
como ele calculado no Epi Info

.
No nosso banco de dados (Apoe), temos, como evento, o
episdio coronariano, caracterizado como angina, infarto ou alteraes
no eletrocardiograma, que sugerem alteraes isqumicas das artrias
coronarianas. Sabemos que essas alteraes esto relacionadas Aterosclerose
das artrias e que possui muitos fatores de risco e muitos deles esto
relacionados entre si. Por exemplo, sabemos que a idade um fator de risco,
quanto maior a idade maior a chance de desenvolver um evento coronariano.
Para calcular esse risco podemos utilizar a Regresso Logstica.
Neste nico caso, o Epi Info

EXIGE que a varivel resposta ou dependente


(Outcome) seja Sim/No (Yes/No). Para sabermos se a varivel EVENTO, do
banco de dados Apoe e que possui as informaes sobre o nosso caso, uma
varivel com formato Yes/No, no basta olharmos no list. Fazendo um list
dessa varivel, notamos que ela seus valores so todos 1 ou 0 (fgura 12.4).
Figura 12.4. Detalhe do resultado do comando List mostrando os
valores originais da varivel EVENTO.
Fonte: Epi Info

, arquivo Apoe.mdb.
Entretanto, quando usamos o comando Display, que nos mostra as
caractersticas das variveis do projeto em uso, observamos, na fgura 12.5,
que a varivel , na realidade, uma varivel tipo texto, provavelmente porque
o arquivo havia sido importado do Excel.
194
ngelo Jos Gonalves Bs
Figura 12.5. Resultado do comando Display destacando as caractersticas originais da varivel EVENTO.
Fonte: Epi Info

, arquivo Apoe.mdb.
Devemos, ento, transformar a varivel EVENTO em varivel tipo
Yes/No. O que parece fcil exige alguns cuidados, pois no basta usar o
Recode da varivel com os valores Yes e No. Existem as siglas especiais
que o Epi Info

utiliza: (-) para no e (+) para sim. Teremos nosso comando


conforme a fgura 12.6.
Figura 12.6. Janela do comando Recode mostrando os cdigos para
a transformao da varivel EVENTO em varivel tipo Yes/No.
Fonte: Epi Info

.
195 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Agora poderemos usar a Regresso Logstica. No menu Advanced
Statistics, escolhemos Logistic Regression. Colocando como Outcome
Variable, EVENTO e como Other Variables, IDADE, conforme a fgura 12.7.
Figura 12.7. Janela do comando Logistic Regression.
Fonte: Epi Info

.
Como resultado, teremos a fgura 12.8.
Figura 12.8. Janela do resultado do comando Logistic Regression.
Fonte: Epi Info

, arquivo Apoe.mdb.
196
ngelo Jos Gonalves Bs
O resultado fornece todas as informaes de que precisamos. O
coefciente para idade 0,0389 que, aplicando a frmula RC=e
0,0389
, temos
justamente o valor dado para a razo de chance, ou seja, 1,0396. Na interpretao,
uma pessoa com um ano a mais tem um risco de 1,0389 vezes o risco de ter
evento, ou 3,9% a mais de ter o evento. O intervalo de confana de 95% vai de
1,0254 a 1,0541, como no inclui o 1, ento a razo de chance signifcativa.
Figura 12.9. Janela da calculadora do Windows destacado os comandos para o clculo do logaritmo
natural de um nmero.
Fonte: Windows 7.
Importante: uma pessoa 10 anos mais velha no ter uma razo de
chance de 10,396 (1,0396x10) mas de e
(10x0.0389)
, ou seja 1,4755. Para calcular
isso podemos usar a calculadora do Windows.
No boto iniciar do Windows temos a opo programas, acessrios,
calculadora (calculator). No menu Exibir (View) da calculadora (fgura12.9)
selecionamos Cientfca. Primeiro temos que colocar o valor do coefciente j
multiplicado por 10: 0.389 (1). Selecionamos a opo Inv(invertido)(2) depois
clicamos em ln (logaritmo natural) (3). E, assim, temos o resultado (1,4755).
Se quisermos que o Epi Info

descreva automaticamente essa Razo


de Chance, com intervalos de 10 anos entre as idades, basta criar uma varivel
nova atribuindo a idade dividida por 10. Igualmente, outras variveis podem
ser manipuladas dessa forma como colesterol, presso arterial etc.
197 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Vamos rapidamente criar idade10, colesterol10, PAS10 e PAD10:
antes temos que defnir essas variveis, usando o comando Defne. Podemos
usar o dilogo da esquerda ou, simplesmente, na janela do Command Program
digitar os comandos:
Defne Idade10;
Defne colesterol10;
Defne PAS10,
Defne PAD10.
A seguir atribuiremos os valores correspondentes s variveis criadas,
usando o comando Assign:
Assign Idade10=idade/10;
Assign colesterol10=colesterol/10;
Assign PAS10=PAS/10 e, fnalmente,
Assign PAD10=PAD/10.
Usando Regresso Logstica com mltiplas variveis
A Regresso Logstica, diferentemente da Razo de Chance calculada
para uma tabela 2x2 vista acima, pode ser usada para avaliar o impacto de duas
ou mais variveis independentes sobre a varivel resposta. Algumas variveis
independentes podem infuenciar outras no advento que se est estudando.
Assim sempre interessante a comparao entre os resultados da anlise da
regresso simples onde cada uma das variveis independentes analisada
separadamente e a anlise mltipla onde todas as variveis so includas. Uma
utilizao muito feliz da regresso logstica multivariada foi usada por Bs
e Bs em um artigo recente, publicado na Revista de Sade Pblica (vol. 38
n 1, 2004) no qual se observou o efeito de algumas variveis independentes
sobre local de atendimento mdico. Para tanto foi analisado o banco de dados
da Pesquisa Idosos do Rio Grande do Sul, suas condies de vida, realizada
pelo Conselho Estadual do Idoso com a colaborao de vrias Universidades do
Estado. Esse estudo entrevistou 7.280 idosos, no institucionalizados, em 1995.
A anlise buscou entender que fatores proporcionariam o idoso a utilizar a rede
privada de atendimento e a rede pblica. No questionrio original foi perguntado
ao idoso qual o tipo de atendimento conseguido na ltima vez em que buscou
198
ngelo Jos Gonalves Bs
um atendimento mdico. A varivel dependente ento foi defnida como Yes =
rede privada, No = rede pblica. O principal objetivo da regresso foi estimar
como cada varivel dependente (chamada no artigo de varivel explicativa)
afeta a chance (pelo clculo da Razo de Chance) do idoso ter utilizado a rede
privada de atendimento. As variveis independentes foram: gnero, idade (em
anos), escolaridade (nmero de anos de estudo), renda individual (em salrios
mnimos), renda familiar (tambm em salrios mnimos), tamanho da famlia,
participao na renda (percentagem) e autoavaliao da sade.
O artigo descreve muito apropriadamente as caractersticas da
anlise, por isso reproduziremos aqui alguns trechos. Recomendamos a
leitura do texto original.
Trs modelos diferentes foram apresentados:
o modelo completo (multivariado), que inclui todas
as variveis explicativas; o modelo sem renda, que
exclui as variveis relacionadas renda: individual,
familiar e participao na renda da famlia; e o modelo
com variveis individuais, onde cada fator explicativo
foi analisado individualmente. Esse ltimo modelo
simplesmente uma sequncia de anlises bivariadas,
em que a relao entre cada varivel explicativa e
a varivel dependente analisada isoladamente. A
comparao entre os resultados dos trs modelos
permite uma anlise mais detalhada e rigorosa de como
cada varivel independente infuencia a escolha do local
de atendimento. Por exemplo, se o coefciente para uma
determinada varivel apresenta valores distintos entre o
modelo completo e o sem renda, o impacto desta varivel
infuenciado pelo nvel de renda. Se o valor for maior
no modelo sem renda do que no completo, a infuncia
da varivel explicada, parcialmente, pela renda. No
caso extremo em que o valor zero no modelo completo,
mas signifcativo no sem renda, toda a infuncia dessa
varivel seria explicada pela renda. A interpretao
invertida, se o valor do coefciente for menor no modelo
sem renda do que no completo. Usando o caso extremo
de novo, se o valor signifcativo no modelo completo,
mas zero no modelo sem renda, toda a infuncia da
renda seria explicada por essa varivel.
Na interpretao dos resultados, as razes
de chance com valores acima de 1,0 indicam que a
presena ou o maior valor do fator explicativo aumentam
199 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


as chances do idoso ter utilizado a rede privada de
atendimento. Valores abaixo de 1,0 indicam que a
presena ou o maior valor do fator explicativo diminuem
essas chances. Como a alternativa fundamental rede
privada a rede pblica de atendimento, os resultados
podem ter a direo invertida e aplicados rede pblica.
Apresentamos na tabela 12.1, a seguir, o resultado mais importante
do artigo.
Tabela 12.1. Razes de Chance, dos modelos de regresso logstica completo, sem renda e com variveis
individuais na predio da escolha da rede privada de atendimento. *p<0,05; **p<0,01.
Varivel
Modelo
completo
Modelo sem
renda
Variveis
Individuais
Gnero: feminino 1,1571* 1,1284* 1,0749
Idade 1,0266** 1,0267** 1,0213**
Escolaridade 1,0429** 1,1360** 1,1369**
Renda individual 1,0707* ----- 1,2132**
Renda familiar 1,2019** ----- 1,2411**
Tamanho da famlia 0,8520** 0,9720 0,9499**
Partcipao na renda 0,9968 ----- 0,9990
Sade 1,0266 1,1147** 1,2117**
Fonte: Revista de Sade Pblica, vol. 38, n. 1, 2004, reproduzido com permisso.
Estudando os resultados do modelo completo, observa-se que as
variveis seguintes foram signifcativas no uso da rede privada de atendimento:
1. idosas tm 15% mais chances que os idosos;
2. com o aumento na idade em um ano, as chances
aumentam em 2,7%;
3. com o aumento na escolaridade em um ano, as chances
aumentam em 4%;
4. com o aumento na renda individual em um salrio
mnimo, as chances aumentam em 7%;
200
ngelo Jos Gonalves Bs
5. com o aumento na renda familiar em um salrio
mnimo, as chances aumentam em 20%;
6. com uma pessoa a mais na famlia, as chances
diminuem em 15%.
Por outro lado, a participao na renda familiar e a avaliao pessoal
sobre a sade no foram signifcativas.
Comparando os resultados do modelo completo com o modelo sem
renda, observa-se que, em quase todas as variveis, o valor das razes de
chance alterado em maior ou menor grau indicando que a renda afeta como
estas variveis infuenciam a escolha do local de atendimento. Destaca-se que,
no modelo sem renda, a avaliao pessoal da sade se tornou signifcativa,
enquanto o tamanho da famlia teve uma reduo no seu nvel de signifcncia.
Resultados semelhantes so observados na comparao entre os outros
modelos e o uso individual de cada varivel explicativa.
Os resultados do trabalho mostram que, medida que a sua renda
aumenta, o idoso tende a escolher a rede privada de atendimento. A renda
familiar teve um impacto muito mais expressivo de que a renda individual do
idoso. Com um aumento na renda familiar em um salrio mnimo, as chances de
o idoso utilizar a rede privada aumentam em 20%. Com um aumento idntico
na renda individual, as chances aumentam em apenas 7%. Por outro lado,
o idoso retm um certo grau de independncia sobre o uso de seus recursos
fnanceiros individuais, j que a razo de chance para a renda individual foi
signifcativa e maior que um.
201 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
Utilizando o projeto Apoe* tabela Grupo1, calcular a Razo de Chance
da presena de evento usando os seguintes modelos:
1. Evento = Idade10.
2. Evento = Colesterol10.
3. Evento = PAS10.
4. Evento = PAD10.
5. Evento = Idade10 + Colesterol10 + PAS10 + PAD10.
Comente sobre a Razo de Chance de cada varivel no modelo simples
e no modelo complexo.
*Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo.
Captulo 13
USANDO CURVAS DE KAPLAN-MEIER E
REGRESSO DE DANO DE COX NA ANLISE
DE SOBREVIDA
Introduo anlise de sobrevida
A anlise de sobrevida pode ser realizada quando temos um
acompanhamento de um grupo. Dentro do desenho estatstico, esse grupo
chamado de grupo coorte, por isso tambm chamado de Estudo de Coorte.
Quando desejamos estudar um evento usando um Estudo de Coorte, devemos
ter um momento inicial onde todos os seus integrantes estejam livres do evento
ou que tenham a mesma caracterstica. Podemos estudar o aparecimento de
doena aguda coronariana ou o reaparecimento da mesma. No primeiro caso
devemos excluir pessoas que tenham j de antemo a doena coronariana. No
segundo caso, podemos estudar pessoas que tiveram Infarto Agudo do Miocrdio
e estudar quem ir desenvolver um segundo. Faz mais sentido, nesse caso,
termos todos os integrantes desse acompanhamento com histria confrmada
de infarto prvio. De qualquer forma, temos um momento no qual se inicia o
acompanhamento. Nesse momento, vrios dados podem e devem ser colhidos.
Esses dados devem ser fatores que potencialmente vo afetar o aparecimento do
evento, sejam fatores de risco ou de proteo. Temos assim o ponto inicial. No
necessariamente todas as pessoas que fazem parte do grupo de coorte devem
iniciar no mesmo momento, mas todas devem ter o mesmo tipo de avaliao,
seguindo os mesmos critrios de diagnstico do evento a ser estudado.
Entendendo as curvas de Kaplan-Meier
So curvas usadas para estimar a probabilidade de sobrevida a
um evento por unidade de tempo. So usadas para desenvolver curvas
de sobrevida quando nem todos os tempos de sobrevida so conhecidos.
Explicando, temos um grupo de coorte que ser acompanhado para
o evento morte. Nem todas as pessoas morrero durante o tempo de
observao, pois s podemos acompanhar essas pessoas durante certo
tempo. Igualmente, podemos perder o seguimento de algumas pessoas
203 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


durante o acompanhamento, por desistncia, mudana de endereo ou
outra forma de contato. Assim teremos trs grupos: um grupo que vai
morrer durante o acompanhamento, esse grupo saberemos assim o tempo
de acompanhamento antes do falecimento; teremos um grupo que vai ainda
estar vivo e outro grupo que vamos perder o acompanhamento. Nesses dois
ltimos grupos no sabemos, com certeza, quando eles falecero, mas temos
uma data mnima de sobrevivncia, na qual, at essa data, todos estavam
vivos, esses dois casos so chamados de grupos censurados. Na realidade,
como, dependendo do desenho do nosso estudo, indivduos podem iniciar
o acompanhamento em diferentes perodos, teremos diferentes tempos de
acompanhamento antes do evento. Se uma pessoa no desenvolveu um
evento, mesmo que no seja bito, at determinada idade ou perodo, no
signifca que ela no desenvolver o evento, por isso lgico chamar este
caso de caso censurado. No clculo da probabilidade de sobrevida, cada
vez que ocorre um evento, no caso morte, a probabilidade de sobrevida
ajustada para os participantes ainda ativos naquele perodo. Entendemos
por perodo o tempo de acompanhamento, independente de quando cada
participante iniciou. Assim, se ao iniciarmos o nosso acompanhamento
tnhamos 120 pessoas e durante a primeira morte se deu aos 2 meses de
acompanhamento, mas nesse momento tnhamos somente 110 ativos,
incluindo os mortos, temos uma probabilidade de sobrevida de 108/110=
0,98 ou 98%. Assim a curva de Kaplan-Meier formada por degraus
formados cada vez que um evento ocorre. Essas curvas de sobrevida ou
sobrevivncia podem ser criadas para diferentes grupos, mas usando
somente uma varivel independente que defna os mesmos. Vamos ver no
nosso exemplo usando o mesmo banco de dados da Regresso Logstica.
Criando curvas de Kaplan-Meier no Epi Info

Para abrir a janela dos comandos da Anlise de Kaplan-Meier clicamos


no comando correspondente na seco Advanced Analysis. Usaremos o banco
de dados Apoe
2
, tabela Grupo1 neste exemplo. Os comandos para fazer as
curvas de Kaplan-Meier esto na fgura 13.1.
2
Poder usar o banco de dados homnimo que se encontra no folder Dados do CD-ROM que acompanha
este livro.
204
ngelo Jos Gonalves Bs
Figura 13.1. Janela do comando Kaplan-Meier Survival.
Fonte: Epi Info

.
A Censored Variable (1) justamente a varivel que contm
informaes sobre o evento, no nosso caso chama-se EVENTO. O valor para
o caso no censurado (Value for Uncensored (2)) o valor atribudo ao evento
positivo, no caso Yes. A Time Variable (3) a varivel que informa o tempo
decorrente entre o incio do acompanhamento e o evento, para os casos de
evento positivo ou do tempo decorrente entre o incio do acompanhamento
e o ltimo perodo no qual o participante estava ativo. Essa varivel , no
exerccio, TEMPO. No nosso caso especfco, como estamos interessados
somente em evento cardaco, a pessoa pode ter falecido de outra causa,
desistido do trabalho, sumido ou ainda estar ativo. Todos esses casos sero
enquadrados como censurados e tero a varivel EVENTO igual a No.
Para que o resultado da curva seja correto devemos informar a unidade de
medida de tempo utilizada por essa varivel no item: Time Units (4), no
nosso caso estamos tratando de anos. Podemos criar uma curva nica ou para
dois ou mais grupos escolhendo a varivel no item Group Variable (5), no
nosso caso escolheremos a varivel APOE4. Finalmente podemos escolher
o tipo de curva que queremos no item Graph Type (6), na quase totalidade
escolheremos Survival Probability, que automaticamente aparecer mesmo se
no a selecionamos. Clicando OK teremos nosso resultado:
205 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 13.2. Grfco do resultado do comando Kaplan-Meier Survival.
Fonte: Epi Info

, arquivo Apoe.mdb.
Observamos que cada valor de APOE4 apresenta-se em curva distinta
com a curva APOE4=No ou grupo sem o alelo 4 da Apoe apresentam uma curva
superiormente colocada e que, ao contrrio, a curva do grupo com APOE4
inferior. Isso signifca que o grupo APOE4 apresenta uma probabilidade de
sobrevida menor que o grupo sem o alelo 4. Podemos analisar essas curvas
de duas maneiras: usando o parmetro probabilidade de sobrevida ou o tempo
de sobrevida. Normalmente se descreve o tempo de 50% de sobrevida, no
nosso caso no somente o grupo de APOE4 tem valor para a sobrevida de
50%, assim podemos usar uma sobrevida de 70%. Na interpretao teremos
uma sobrevida de 70% do Grupo com APOE4 de 32 anos e do grupo sem
o alelo de 35 anos. Na outra interpretao teremos uma sobrevida de 84%
para os com APOE4 e de 88% para os sem. O Epi Info

oferece dois tipos de


anlise estatstica para as curvas Kaplan-Meier: o Log-Rank, que um teste
que compara os valores observados com os esperados, e o teste Wilcoxon,
que um teste no paramtrico e que assume uma mortalidade constante, e
til para comparar dois tratamentos. No nosso caso ambos os testes foram
206
ngelo Jos Gonalves Bs
signifcativos, confrmando que as curvas so diferentes estatisticamente.
Infelizmente o programa no nos deixa editar o grfco, mas podemos salv-lo
clicando no boto da direita do Mouse.
Usando a Regresso Proporcional de Dano de Cox
A Regresso Proporcional de Dano de Cox, ou chamada de Regresso
de Cox, usada para calcular uma estimativa do Risco Relativo, chamado de
Razo de Dano (Hazard Ratio). Podemos calcular o risco de vrios fatores
e testar a infuncia dos mesmos no desenvolvimento de um evento. O
comando, visto na fgura 13.3, muito semelhante ao das Curvas de Kaplan-
Meier, mas possui a opo Other Variables. Igualmente, usaremos o banco
de dados Apoe, tabela Grupo1.
Figura 13.3. Janela do comando Cox Proportional Hazards.
Fonte: Epi Info

.
O resultado do modelo de Cox no s fornece a curva de probabilidade
de sobrevivncia como tambm a razo de dano que interpretada da mesma
forma que o Risco Relativo e, logicamente, fornece o Intervalo de Confana
para podermos interpretar os resultados. No resultado da regresso, usando
somente o sexo como varivel, teramos:
207 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Figura 13.4. Resultado da anlise estatstica realizada pelo comando Cox Proportional Hazards.
Fonte: Epi Info

, arquivo Apoe.mdb.
Interpretando os dados observados veramos que a razo de dano dos
homens, em relao s mulheres, seria de 0,8445, no signifcativa, pois o
intervalo de confana varia de 0,5185 e 1,3755. A regresso de Dano de Cox
uma regresso que tem componentes paramtricos e no paramtricos. A
razo de dano um resultado paramtrico, pois estabelece um parmetro a
partir dos dados. O modelo como um todo analisado no parametricamente
pela Razo de Verossimilhana, em ingls: Likelihood Ratio. No caso, ambos
critrios no so signifcativos. Por no ser signifcativo, o modelo do Epi
Info

no forneceu a curva de sobrevida.


Entendendo a noo de proporcionalidade
Uma noo muito importante que devemos salientar a da
proporcionalidade. A regresso de Cox chamada proporcional, pois assume
que o risco cresce proporcionalmente conforme a varivel risco, corroborando
com a noo de ser um teste paramtrico. Assim, uma pessoa com nvel de risco
mais elevado ter um risco proporcionalmente maior. Muitas vezes h variveis
que no respeitam essa proporcionalidade, uma dessas variveis a idade sobre
alguns eventos. A mortalidade no cresce proporcionalmente com a idade, mas,
208
ngelo Jos Gonalves Bs
sim, exponencialmente. Assim, para evitarmos problemas de interpretao
devemos usar a varivel idade categorizada. Essa varivel tambm um forte
preditor de evento coronariano, to forte que poder afetar a interpretao.
Neste caso devemos estratifcar nossa anlise por faixa etria. Quanto
maiores os grupos etrios (10 ou 20 anos de intervalo), menor ser o nmero de
interpretaes. Vamos criar uma varivel chamada DUODECADA, colocando
um valor para cada 20 anos conforme os comandos:
DEFINE Duodecada
RECODE idade TO Duodecada
60 - HIVALUE = 60
40 - 60 = 40
LOVALUE - 40 = 20
END
Adicionando a varivel DUODECADA, APOE4 e SEXO do modelo
e escolhendo a varivel DUODECADA como varivel grupo, teremos os
resultados observados na fgura 13.5.
Figura 13.5. Resultado da anlise estatstica realizada pelo comando Cox Proportional Hazards
utilizando a varivel DUODECADA.
Fonte: Epi Info

, arquivo Apoe.mdb.
Observamos que, comparando com a DUODCADA menor que 40
anos (DUODECADA = 20), as demais possuem razes de dano muito maiores.
209 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Note o aumento desproporcional das faixas etrias mais elevadas. Enquanto
a DUODECADA 40 possui uma razo de dano 3,3 x a razo do grupo jovem,
para a DUODECADA 60 ou mais esse valor 49 x.
Observamos na fgura abaixo que as curvas produzidas pela Regresso
de Cox produz uma probabilidade de sobrevida da DUODECADA 40 maior que
a DUODECADA 60 refetindo que as pessoas que iniciam o acompanhamento
entre 40 e 59 anos tm uma probabilidade de se manter livres de doena por
mais tempo que pessoas com 60 ou mais anos. Infelizmente o grupo jovem
(DUODECADA 20) apresenta uma curva menor, o que no verdade.
Aparentemente o programa posiciona erradamente os valores da varivel
grupo e, infelizmente, no nos d a opo de corrigi-lo.
Figura 13.6. Grfco criado pelo comando Cox Proportional Hazards para cada valor de DUODECADA.
Fonte: Epi Info

, arquivo Apoe.mdb.
Usando as curvas de Kaplan-Meier, entretanto, podemos observar, na
fgura 13.7, um comportamento mais coerente com os resultados.
210
ngelo Jos Gonalves Bs
Figura 13.7. Grfco criado pelo comando Kaplan-Meier Survival para cada valor de DUODECADA.
Fonte: Epi Info

, arquivo Apoe.mdb.
Confrmando haver algum problema na confgurao do grfco no
programa do Cox do Epi Info

, esperamos que esse problema seja corrigido


em verses futuras.
211 EPI INFO

SEM MISTRIOS: UM MANUAL PRTICO


Exerccio:
Usando o mesmo banco de dados (Apoe*), calcule as razes de dano
dos seguintes modelos:
a. EVENTO (TEMPO) = APOE4.
b. EVENTO (TEMPO) = APOE4 COLESTEROL10 (ou a
varivel DISLIPIDEMIA).
c. EVENTO (TEMPO) = APOE4 PAS10 (ou a varivel
HIPERTENSAO).
d. EVENTO (TEMPO) = APOE4 COLESTEROL10 (ou
DISLIPIDEMIA) PAS10 (ou HIPERTENSAO) SEXO
DUODECADA.
Comente a respeito do efeito da introduo das outras variveis sobre
os valores da razo de dano da varivel APOE4.
*Poder usar o banco de dados homnimo que se encontra no folder
Dados do site www.pucrs.br\igg\epiinfo.

Você também pode gostar