Escolar Documentos
Profissional Documentos
Cultura Documentos
ESPAO ABERTO
Questes comuns sobre Epidemiologia, Estatstica e Informtica
Referncia: PEREIRA, J. C. R.; PAES, A. T.; OKANO, V. Espao aberto: Questes comuns sobre epidemiologia, estatstica
e informtica Revista do IDPC, So Paulo, v. 7, p. 12-17, 2000
6
Ms
10
A prevalncia da doena seria 80% (8 doentes entre 10 casos), e a incidncia seria de 70% (7
tornaram-se doentes entre 10 casos). Neste universo de espao e tempo, poder-se-ia ter cortes
especficos para medidas especficas. Num corte de espao, sendo os 5 primeiros casos mulheres e
os 5 ltimos homens, poder-se-ia dizer, por exemplo, que a prevalncia igual em ambos os sexos
(4 doentes entre 5 casos cada) embora a incidncia seja maior entre homens (4 homens tornaram-se
doentes entre 5 casos e 3 mulheres tornaram-se doentes entre 5 casos). Num corte de tempo, poderse-ia, por exemplo, examinar o ms 3 e concluir que a prevalncia de doena 20% (casos 2 e 7
esto doentes entre os 10 casos) e que a incidncia 10% (caso 2 torna-se doente no ms 3).
Numa abstrao terica de regularidade de ocorrncia de doena (sempre a mesma incidncia numa
dada unidade de tempo e sempre mesma durao), prevalncia e incidncia obedecem uma relao
regulada apenas pelo tempo de durao da doena:
PREVALNCIA = INCIDNCIA x DURAO DA DOENA
No exemplo, como a premissa de regularidade de ocorrncia rompida (a incidncia no a mesma
a cada ms, a unidade de tempo) esta relao no se aplica (a prevalncia de 80% no igual a
incidncia (70%) vezes a durao da doena um ms). No entanto, numa amostra grande esperase que as variaes de entrada e sada de observaes, bem como de variaes de durao de
doena, tendam a anular-se fazendo valer a relao entre as duas medidas de ocorrncia de doena.
Note-se que estas medidas esto envolvendo uma razo entre EVENTOS / EXPOSTOS NUM
DADO PERODO (um dado ms, todos os meses juntos), sendo evento ESTAR DOENTE ou
TORNAR-SE DOENTE. Esta razo pode ser modificada para incorporao de variaes de tempo
assumindo a forma EVENTOS / EXPOSTOS-TEMPO, vg. doentes/ pessoas-ano. Nesta situao,
no se fixa uma data de incio e fim para a observao, mas contam-se os eventos registrados
durante a observao de um dado nmero de pessoas por perodos variveis de tempo. Esta forma
de medir ocorrncia de doena chamada DENSIDADE DE INCIDNCIA ou FORA DE
MORBIDADE e muito til em estudos que acompanham grupos de pessoas durante um perodo
em que sua composio sofre alteraes naturais de entrada e sada de indivduos.
A partir dos conceitos bsicos de prevalncia e incidncia, o pesquisador pode ter vrias alternativas
para definio de numerador e denominador da razo que mede a ocorrncia de doena. Deve, no
entanto, estar alerta que para inferir a freqncia de ocorrncia de uma doena na populao a partir
de uma amostra estudada, ele deve considerar correes desta medida para a sensibilidade e
especificidade do seu instrumento de medida (questionrio, resultado laboratorial, etc.). Para obter
esta correo, ele deve aplicar a seguinte frmula:
Freqncia na populao =
Risco relativo e odds ratio so medidas de associao entre variveis que comparam ocorrncias de
eventos. O risco relativo mede quantas vezes a freqncia relativa de um evento maior numa e
noutra situao. O odds ratio mede quantas vezes o odds de um evento maior numa e noutra
situao.
Portanto, para entender risco relativo e odds ratio h que se entender primeiro as medidas de
ocorrncia de eventos que cada um considera. Freqncia relativa a razo entre o nmero de
eventos observados e o total de observaes realizadas, vg. se da observao de 50 pessoas
encontra-se 10 eventos, sua freqncia relativa 10 em 50, ou 1 em 5, ou 20% (20 em 100). Odds
a razo entre nmero de eventos observados e o nmero de eventos no observados (os sim contra
os no), vg. no exemplo o odds seria 10 contra 40, ou 1 contra 4 no se aplica a reduo base
100 para designao da medida como porcentagem. Odds uma palavra inglesa para designar
chances a favor versus contra e usada na forma original por falta de um equivalente aceitvel em
portugus. Ainda em ingls, ambas as medidas so chamadas de rate, uma razo que descreve ritmo
de ocorrncia: x eventos a cada n observaes, x eventos positivos a cada y eventos negativos. A
relao de quantas vezes uma medida maior que outra chamada ratio em portugus, tanto rate
quanto ratio so traduzidas por razo com algum sacrifcio de contedo semntico.
Ambas as medidas de risco (risco relativo e odds ratio) so razes (ratios) de razes (rates) para
expressar quantas vezes uma medida de ocorrncia (rate) maior numa situao, vg. A, quando
comparada com outra, vg. B. O pesquisador usa uma ou outra medida na dependncia de como
realiza sua observaes. Se sua observao feita com uma populao definida ou com uma
amostra representativa desta populao, ele tem denominadores que permitem clculo de
freqncias relativas: percentual de eventos na situao A e percentual na situao B basta que ele
conte na sua populao ou amostra o nmero de situaes A e B.
Se, no entanto, o pesquisador faz sua observao examinado a ocorrncia de eventos num
determinado nmero de indivduos que dispe para estudo, alguns na situao A e outros na
situao B, ele no tem denominadores para o percentual de eventos em A ou B. Suponha-se que
ele observe x eventos entre os indivduos da situao A e x entre os indivduos da situao B: ele
no consegue calcular o percentual de x ou x porque ele no tem os totais para a situao A ou B,
ele s tem alguns indivduos A e alguns indivduos de B que lhe estavam disponveis. Nesta
circunstncia ele s pode calcular x contra no x e x contra no x. Portanto, ao invs de comparar
as freqncias relativas ele vai comparar os odds, em outras palavras ao invs de calcular o risco
relativo ele vai calcular o odds ratio.
Para uma populao em steady-state (nmero de pessoas que entram compensa o nmero de
pessoas que saem) a medida de odds ratio eqivale medida de risco relativo. Ambas as medidas
so usadas para inferncias de causa e efeito e servem a propsitos de investigao de etiologia ou
histria natural de doena. Para medir o eventual impacto que o controle de uma causa de doena
pode ter sobre sua ocorrncia, o pesquisador dever recorrer a outra medida, o risco atribuvel.
Dois eventos se dizem associados quando suas ocorrncias variam concomitantemente, sugerindo
dependncia entre eles. Por exemplo, o trovo e o relmpago so eventos associados, sempre que
um est presente espera-se pela presena do outro.
Para estabelecer-se uma associao verifica-se se as variaes de ocorrncia dos eventos estudados
no pode ser atribuda ao simples acaso. Como nem sempre trovo e relmpago aparecem juntos,
resta uma pergunta se o nmero de vezes em que se associam no pode ser aleatria. Para responder
a esta questo busca-se comparar o que se espera (probabilidade) de ocorrncias combinadas por
fora do acaso contra o que se tem de evidncias de ocorrncias combinadas (o que se observa).
Para analisar a associao entre trovo e relmpago, poder-se-ia registrar suas ocorrncias numa
tabela de contingncia como a seguinte:
Trovo
Presente
Ausente
Total
Presente
A
C
a+c
Relmpago
Ausente
b
d
b+d
Total
a+b
c+d
a+b+c+d
A correlao uma medida especfica de associao que permite refinar a informao sobre a
associao, quantificando-a. Este refinamento s ser possvel se houver refinamento das medidas
relativas aos eventos: para alm de categorias nominais h que haver alguma relao de intensidade
ou ordem nas medidas. Em outras palavras os eventos devem poder ser medidos por variveis
quantitativas, ou pelo menos qualitativas ordinais, que permitam examinar a relao entre elas por
uma reta de regresso.
A correlao medida por um coeficiente. O coeficiente de correlao (de Pearson), normalmente
designado r, calculado de forma semelhante ao Qui-quadrado, comparando-se valores esperados
a observados. A diferena que o valor esperado considerado para o clculo do coeficiente de
correlao derivado no de probabilidades de ocorrncia, mas de projees de uma reta de
regresso. As razo entre as variaes conjuntas dos dois eventos pela suas variaes individuais
(product-moment) resulta no valor 1 se as covariaes so perfeitamente idnticas s variaes
individuais, estabelecendo-se ento uma correlao perfeita: qualquer que seja a medida de um
evento posso predizer a medida do outro. Quando as variaes de medidas entre os dois eventos
ocorrerem em sentido contrrio (quando um aumenta, o outro diminui), sendo as variaes
conjuntas equivalentes s variaes individuais, o coeficiente ainda ter valor 1, porm com sinal
negativo. Da, o coeficiente de correlao pode variar entre valores de 1 a 1, os dois polos de
correlao perfeita negativa e positiva, passando pelo valor zero, que significa nenhuma correlao
entre os eventos.
A correlao , portanto, uma medida de associao que expressa sua intensidade, de nula (0) a
mxima (1,1). No se deve confundir o valor de r com o valor de p: uma vez obtido um coeficiente
de correlao, o pesquisador pode se perguntar se aquele valor confivel, se no seria outro se ele
refizesse suas observaes. Para responder a esta inquietao, o pesquisador pode fazer um teste de
hiptese para verificar se o valor que obteve no poderia ser zero, ou seja, relativo a associao
nula. este teste de hiptese que gera um valor de p que normalmente aparece associado ao valor
de r. Este valor de p, se significante, apenas informa que o valor calculado para r confivel, se no
poderia ser igual a zero: errado vista de, vg. um r = 0.20 com um p de 0,01, concluir que os
eventos sejam correlacionados o valor de r informa que a correlao muito pobre (0,2 est muito
longe de 1 ou 1) e o valor de p, por ser significante, informa que este resultado confivel.
Antes de falarmos em poder de teste necessrio introduzir alguns conceitos sobre testes de
hipteses. Sob o ponto de vista cientfico, as hipteses podem ser entendidas como questes
desejamos contestar. Por exemplo, em um estudo com o objetivo de investigar a associao entre
diabetes e doena cardiovascular, a hiptese nula poderia ser: no existe associao entre diabetes
e doena cardiovascular ou, em outras palavras, a prevalncia de doena cardiovascular
semelhante entre diabticos e no diabticos. A hiptese alternativa aquela que ser considerada
como aceitvel, caso a hiptese nula seja rejeitada. No exemplo dado, a hiptese alternativa poderia
ser: a prevalncia de doena cardiovascular maior entre diabticos.
Formuladas as hipteses, o pesquisador cria uma regra de deciso baseada no nvel
descritivo obtido (valor de p). Qualquer que seja a deciso tomada, sempre existem erros. A deciso
de rejeitar a hiptese nula quando ela verdadeira chamada de erro do tipo I. A probabilidade de
cometer esse erro chamada de nvel de significncia e usualmente representada pela letra grega
alfa (). J a deciso de aceitar a hiptese nula quando ela falsa denominada erro do tipo II e
representado por .
A capacidade de um teste identificar diferenas ou associaes que realmente existem, ou
seja, de rejeitar H0 quando ela realmente falsa, denominada poder do teste e definida como 1 .
Tabela: Erros possveis associados ao teste de hiptese
DECISO
DO TESTE
No rejeitar H0 (aceitar Ha)
Rejeitar H0
SITUAO REAL
H0 verdadeira
H0 falsa
Deciso correta
Erro do tipo I
Erro do tipo II
Deciso correta (poder)
No exemplo da diabetes, o erro do tipo I seria afirmar que a prevalncia de doena maior
entre os diabticos quando na realidade ela igual dos no diabticos. O erro do tipo II seria
afirmar que as prevalncias so iguais quando na verdade a dos diabticos maior. J o poder do
teste seria concluir corretamente que a prevalncia entre os diabticos maior.
NO. Esta confuso existe uma vez que muito comum o uso da palavra significncia para
expressar o resultado de um teste baseado no valor de p. Por exemplo, quando um valor de p
significativo, o pesquisador tende a dizer que o resultado tem significncia estatstica e isto faz
com que ele chame erroneamente o valor de p de nvel de significncia.
Para melhor entender melhor as diferenas entre nvel de significncia e valor de p, voltemos
s definies. Em um teste estatstico de hipteses, sempre existe uma hiptese a ser contestada que
a chamada hiptese nula. O nvel de significncia corresponde ao erro associado rejeio
hiptese nula, conhecido como erro do tipo I (rejeitar a hiptese nula quando esta for verdadeira).
Geralmente expresso pela letra grega e os valores usualmente adotados so 5%, 1% e 0,1%.
10
Portanto, o nvel de significncia um valor fixado previamente pelo pesquisador e sua magnitude
vai depender do risco que o pesquisador deseja assumir ao tomar uma deciso incorreta.
Considerando que os pesquisadores ao rejeitarem a hiptese nula costumam dizer que existe
significncia estatstica poderamos definir o valor de p como a probabilidade mnima de erro
ao concluir que existe significncia estatstica ou seja, o menor nvel de significncia () que
pode ser assumido para se rejeitar H0. Este valor calculado com base nos dados observados e o
pesquisador deve decidir se o valor de p produzido pequeno o suficiente para afirmar com
segurana que o resultado estatisticamente significante.
A tomada de deciso consiste em avaliar se o erro calculado est dentro de uma margem de
erro tolervel e sempre baseada na comparao entre os dois valores: o valor de p e o nvel de
significncia. Se o valor do p for menor que o nvel de significncia () deve-se concluir que o
resultado significante pois o erro est dentro do limite fixado. Por outro lado, se o valor de p for
superior significa que o menor erro que podemos estar cometendo ainda maior do que o erro
mximo permitido, o que nos levaria a concluir que o resultado no significante pois o risco de
uma concluso errada estaria acima do que se deseja assumir. Segue abaixo um esquema que
resume a regra de deciso descrita.
p-value < rejeito H0
diferena
p-value
--------------|---------------------|---------------------|-----------resultado
estatisticamente
resultado
no significante
significante
11
casos para serem estudados. Isto no significa que o clculo de tamanho de amostra seja
dispensvel. O que desejamos salientar aqui que ele deve ser utilizado como planejamento, isto ,
como parte de um estudo bem delineado. Vale ressaltar tambm que os vcios de seleo ou de
informao no sero prevenidos por qualquer definio de tamanho de amostra, mas sim por um
plano amostral cuidadoso.
Para o planejamento do tamanho da amostra o investigador precisa estabelecer algumas
definies como:
tipo de estudo que pretende realizar (ex: estudo de prevalncia, ensaio clnico, coorte,
caso-controle)
o tipo de medida que deve utilizar (ex: medidas contnuas, categorizadas, prevalncia,
incidncia)
o tipo de anlise (ex:. diferenas entre mdias, diferena entre propores, clculo de
risco)
a margem de erro que pode assumir para o estudo (ex. o nvel de significncia e o poder
do teste estatstico que pretende aplicar).
12
amostra para alguns dos desenhos de pesquisa mdica/biolgica mais freqentes, alm de oferecer
textos de apoio para compreenso de cada item envolvido no clculo e referncias bibliogrficas.
Os vrus de computador so pequenos programas que executam tarefas sem que o usurio
tenha solicitado. Por exemplo, um vrus pode ser programado para apagar arquivos do computador
sem o conhecimento do usurio. Inicialmente os vrus se anexavam somente aos arquivos de
programas (arquivos com extenso .EXE e .COM) ou ento no setor de inicializao do disco rgido
ou do disco flexvel (setor de boot do disco). Com o aparecimento de editores de texto e leitores de
e-mails que permitem o uso de linguagem de programao (macros), surgiu um novo tipo de vrus
que contamina arquivos de documentos, planilhas eletrnicas e e-mails. O caso mais recente o
vrus ILOVEYOU que foi amplamente noticiado pela mdia.
Um vrus de computador no aparece sozinho. Sua propagao semelhante aos vrus
biolgicos, ou seja, necessrio haver troca de informao entre um computador saudvel e outro
que esteja contaminado. A troca de informao pode ser feita por meio de mensagens eletrnicas ou
disquetes com arquivos. Um vrus somente contaminar o computador se abrirmos estes arquivos.
possvel ter arquivos com vrus sem que o mesmo contamine o computador, isto , podemos ter um
arquivo do Word infectado por vrus, mas se no abrirmos o arquivo no existir contaminao.
No existe antivrus totalmente eficiente, algumas REGRAS BSICAS podem ajudar a proteger o
computador contra esses programas mal intencionados.
1- Nunca execute programas ou abra arquivos que no foram solicitados, o fato do e-mail vir
de um amigo no garantia de que ele redigiu a mensagem ou ento que o arquivo esteja
livre de qualquer cdigo estranho. Atualmente a maior forma de disseminao de vrus so
os documentos e cartes animados que so anexados aos e-mails. Ser criterioso na leitura
dos anexos em mensagens muito importante para no ter o equipamento comprometido por
vrus.
13
2- Pense antes de abrir qualquer link que veio em um e-mail. Existem sites mal intencionados
que querem descobrir informaes privadas no seu computador. Recuse os links de
mensagens de propagandas no solicitadas.
3- Desabilite o boot pelo disquete. Ao ligar seu computador, verifique que no existe disquete
no driver de disco flexvel. O boot acidental por disquete pode contaminar seu computador
com vrus.
4- Tenha sempre um antivrus instalado e atualizado no computador. Muitos fabricantes de
antivrus lanam definies de vrus a cada 15 dias ou menos. Um antivrus de ltima verso
no serve para nada se definio de vrus estiver desatualizada, para que ele seja eficiente
necessrio atualiz-lo constantemente.
5- Mantenha seus programas atualizados. Os fabricantes dos programas freqentemente
publicam
atualizaes
dos
seus
http://officeupdate.microsoft.com/brasil
tem
produtos,
por
exemplo,
vrias
informaes
sobre
site
atualizaes
14
1
2
3
A
nome
Jos Pedro
...
B
sexo
0
...
C
idade
26
...
D
peso
80
...
E
Altura
1,68
...
F
fumante
1
...
Deve-se evitar o uso de palavras no preenchimento das clulas do banco de dados pois o
computador interpreta de forma distinta letras maisculas e minsculas, por exemplo, Sim e sim so
duas palavras distintas para o computador embora tenham o mesmo significado. Para facilitar a
anlise dos dados e eliminar erros de digitao prefervel que se use cdigos para indicar o valor
de uma varivel. No exemplo acima podemos usar 0 = masculino e 1 = feminino, 0 = no e 1 = sim.
Como podemos ter um grande nmero de variveis e cdigos, interessante manter uma lista com
uma descrio das variveis e seus respectivos cdigos usados no banco de dados. Esta lista
tambm conhecida como code book, segue abaixo um exemplo:
Varivel
Descrio
Tipo de medida
0 = no fumante
TABAG
Tabagismo
1 = ex fumante
2 = fumante atual
PESO
Peso do paciente em kg
quantitativa
15
Uma confuso muito freqente o uso do Word para se manter uma base de dados.
Geralmente os dados so dispostos na forma de colunas dentro de um texto. Os dados desta forma
no so facilmente transportados para pacotes estatsticos como o SPSS.
Nos casos em que h a necessidade de checar a consistncia dos dados no momento da
entrada (digitao), comum o uso de programas desenvolvidos em Acccess ou alguma linguagem
de programao de alto nvel como o Visual Basic ou C. Exceto nesses casos especiais, o Excel
bastante satisfatrio para se criar uma base de dados.
A internet tem a filosofia de manter informaes distribudas pela rede. O grande problema
encontrar estas informaes nos milhes de sites que existem. Para facilitar a busca, existem sites
que foram desenvolvidos com o propsito de serem listas amarelas da internet. Existem vrios sites
de busca onde colocamos uma palavra chave e o site lista as pginas que possam conter alguma
informao relacionada palavra. Alguns sites de busca so:
http://www.cade.com.br
http://www.radaruol.com.br
http://www.tay.com.br
http://www.altavista.com.br
Se o interesse da busca for por algum artigo cientfico, o melhor lugar para se procurar no
site da empresa que publica a revista, por exemplo, o JAMA (Journal of the American Medical
Association) pode ser acessado pelo site http://jama.ama-assn.org . Em alguns sites necessrio que
o leitor faa uma assinatura para ter acesso ao texto na ntegra; outros oferecem o texto
gratuitamente, o usurio somente precisa preencher um cadastro. Este o caso do American Heart
Journal
(http://www.medscape.com/mosby/AmHeartJ/public/journal.AmHeartJ.html).
Se
16
criar um cadastro institucional no site da revista para que a biblioteca possa obter o artigo na
ntegra.
O Lee (Laboratrio de Epidemiologia e Estatstica IDPC: http://www.lee.dante.br) oferece
o acesso a vrios textos completos publicado pela Elsevier, Academic Press e High Wire Press. Este
servio oferecido pela FAPESP aos centros de pesquisa do estado de So Paulo. O acesso a esta
biblioteca virtual somente permitida atravs da rede do Lee ou por uma instituio cadastrada no
Probe (Programa Biblioteca Eletrnica).
Em geral os textos completos so oferecidos no formato eletrnico PDF que exige que o
usurio tenha o programa Acrobat Reader para a sua leitura. O Acrobat Reader pode ser obtido
gratuitamente no site http://www.adobe.com.