Escolar Documentos
Profissional Documentos
Cultura Documentos
com o EpiInfo
PARTE 1
A metodologia bsica de investigao
Investigao e Estatstica
com o EpiInfo
Investigao e Estatstica
com o EpiInfo
cardiolgicas. Sucede no entanto que os pases onde h mais telemveis so tambm os mais
ricos e, devido sobre-alimentao, tm com maior frequncia doenas cardacas. Assim, h
aqui uma terceira varivel escondida, que pode provocar uma associao estatisticamente
significativa mas totalmente espria. Esta terceira varivel denomina-se de confundimento
porque produz um vis de confundimento.
Outro exemplo dum vis de confundimento em investigao o que aconteceu num
estudo efectuado h alguns anos, sobre os efeitos de deixar de fumar. Verificou-se ento que a
maioria dos fumadores que largavam o mau hbito, morriam mais frequentemente no primeiro
ano que os que continuavam a fumar. A concluso lgica seria que qualquer fumador deveria
manter o seu hbito ... Sucede que, infelizmente, muito dos fumadores que deixam de fumar,
fazem-no porque j se sentem doentes, o que aumenta a probabilidade de morrerem no ano
seguinte, enquanto os outros ainda se sentem saudveis e em muitos casos ainda o esto...
O que se passou neste estudo que no se controlou o efeito de uma varivel de
confundimento fundamental: o fumador j estava doente ou no, quando deixou de fumar? Estas
questes tm a ver fundamentalmente com o desenho do estudo e no com a Estatstica.
Assim, para iniciar um trabalho de investigao necessrio seguir vrias regras para
evitar escorregadelas. A primeira regra de ouro que antes de avanar para o trabalho de campo
fundamental sempre elaborar um protocolo que nos guie no futuro. Para isto teremos que
seguir uma sequncia de passos que nos pouparo muitos problemas e dissabores...
A sequncia que vou expor pode ser parcialmente modificada, nomeadamente as fases
posteriores podero obrigar a reconsiderar as fases iniciais, mas genericamente sempre a
sequncia a utilizar.
Investigao e Estatstica
com o EpiInfo
Por outro lado, um outro bice importante em estudos com muitos objectivos que
podero ser necessrios desenhos diferentes de estudo e amostras com dimenses diferentes para
os diferentes objectivos, o que complica muito a sua conduo.
b) Qual a investigabilidade do problema?
necessrio verificar se existem tabus ou outros obstculos culturais ou polticos que
impossibilitem a investigao. Existem ainda questes ticas relativamente possibilidade de
colher alguns dados privados. Alguns estudos experimentais como por exemplo, os ensaios
teraputicos, tm tambm de seguir normas ticas muito estritas, atendendo perigosidade para a
sade dos indivduos que neles participam.
c) pertinente gastar recursos para tentar conseguir respostas a tais perguntas?
evidente que devemos ter imediatamente o pragmatismo necessrio para identificar as
perguntas que esto muito para alm das nossas possibilidades e recursos. Por outro lado, h aqui
tambm uma questo tica. Mesmo que hajam recursos para investigar um problema, caso este
seja menos pertinente que outros problemas existentes, no ser tico gastar os recursos nesta
investigao, pois isto ir anular a oportunidade de investigar o assunto realmente pertinente. Isto
uma considerao tica importante quando se tem dinheiro para investigar um assunto
particular...
d) O que que j se sabe ou foi publicado sobre o assunto?
Trata-se de fazer o enquadramento terico ou definio conceptual do problema, ou seja,
definir o que se sabe de universal sobre o assunto. Repare que aqui necessrio fazer uma
reviso bibliogrfica sobre o tema, onde poderemos descobrir que outros j encontraram resposta
para algumas das nossas perguntas. Na reviso bibliogrfica poderemos tambm encontrar ideias
novas sobre como conduzir o nosso estudo (Anexo 1- A reviso bibliogrfica).
Esta definio conceptual do problema permite tambm identificar as variveis que
deveremos controlar para no confundirem as nossas concluses.
e) Quais so as hipteses a comprovar?
A enunciao de hipteses s poder acontecer se ns tivermos j uma descrio das
caractersticas do problema. Por exemplo, se estiver descrito que a frequncia de uma
Investigao e Estatstica
com o EpiInfo
determinada doena diferente em duas populaes, poderemos formular a hiptese de que essa
diferena est associada a uma diferena de um determinado factor de risco entre as duas
populaes.
Quando falamos em hipteses estamos a falar de perguntas sobre a relao entre
variveis, para as quais ns vamos tentar encontrar respostas concretas, atravs da observao
planeada dos factos (no caso anterior, a pergunta poderia ser formulada da seguinte forma: est a
varivel "doena" associada varivel "factor de risco"?)
Repare-se que as hipteses so apenas fundamentais em estudos analticos ou
experimentais. Um estudo descritivo no necessita de hipteses: basta-lhe descrever as
caractersticas do fenmeno.
Investigao e Estatstica
com o EpiInfo
dia. Ou seja, h que definir agora a escala de medio: por exemplo, vamos contar o nmero de
cigarros por dia, ou apenas criamos dois grupos - fumadores/no fumadores?
Sumariamente, tendo em conta a escala de medio, poderemos classificar as variveis da
seguinte forma:
1- Variveis qualitativas nominais, cujos valores no tem uma relao de ordem entre
eles, por ex., o "Sexo" e "Raa". Para este tipo de variveis, poder-se- fazer o estudo das
propores e aplicar-se o Qui-quadrado.
2- Variveis qualitativas ordinais, cujos valores no so mtricos mas incluem relaes de
ordem. o caso da varivel "Peso" medida em 3 nveis (pouco pesados, pesados, muito
pesados). Para este tipo de variveis poder-se- fazer tudo quanto possvel fazer-se para as
variveis nominais, mas tambm adicionalmente possvel estudar as medianas, quartis, modas,
e aplicar o Kruskal-Wallis, a regresso logstica e outros testes no paramtricos.
3- Variveis quantitativas, cujos valores so medidos numa escala mtrica, como por ex.,
a "Idade", ou o "Peso" medido em gramas. Para este tipo de variveis poder-se- fazer tudo
quanto possvel fazer-se para as variveis nominais e ordinais, mas tambm adicionalmente
possvel estudar as mdias, desvios-padro, e aplicar o ANOVA, a correlao e regresso linear,
etc.
Assim, fundamental planearmos que tipo de variveis queremos ter, para sabermos de
antemo quais as provas estatsticas que poderemos aplicar. evidente que as variveis
quantitativas so melhores que as meramente ordinais, e estas so melhores que as nominais,
porque incluem mais informao e so susceptveis de lhes serem aplicadas provas estatsticas
mais potentes.
c) Como vamos proceder medio da varivel?
No caso da varivel peso, ser numa balana? Ser sempre na mesma balana? Faremos 2
ou 3 pesagens e confiaremos na mdia? Ser sem roupa ou com roupa? Confiaremos apenas no
peso que o prprio nos refere? Colhemos o dado da ficha clnica? No caso da varivel "Fumar",
ser atravs de um questionrio, ou atravs de anlise saliva, etc.? E quem que vai colher os
dados - o prprio investigador ou outros indivduos? Se for com um questionrio, como que as
perguntas esto dispostas e em que condies vai ser aplicado o questionrio?
Investigao e Estatstica
com o EpiInfo
V.
Exposio
V.
resultado
V. interferentes
Suponhamos que vamos fazer um estudo em que uma hiptese : o "tempo prvio de
consumo de cannabis" est associado ao "tempo de consumo de herona". Neste caso, o "tempo
de consumo de cannabis" ser uma varivel de exposio e o "tempo de consumo de herona" a
varivel resultado. As variveis interferentes podero ser a idade e o sexo, o nvel educacional,
social, etc. Ou seja, em muitos casos, h variveis que podem interferir e alterar a relao entre
outras duas. possvel que um determinado subgrupo etrio ou apenas um sexo tenha uma
associao positiva entre a varivel de exposio e a do resultado, enquanto o outro subgrupo
tem uma associao negativa! Este um dos problemas mais complexos da investigao, que
vicia frequentemente as concluses e que s se resolve cabalmente com a implementao de um
desenho de estudo experimental.
Investigao e Estatstica
com o EpiInfo
Apesar de tudo, nos outros estudos possvel controlar razoavelmente o efeito das
variveis interferentes atravs da anlise estratificada (uma anlise independente para cada
estrato da varivel interferente, verificando seguidamente se h alterao dos resultados de um
estrato para outro) e outras tcnicas mais sofisticadas que o EpiInfo disponibiliza (Anexo 2 Controlo das variveis interferentes).
Investigao e Estatstica
com o EpiInfo
Investigao e Estatstica
com o EpiInfo
10
Investigao e Estatstica
com o EpiInfo
11
Investigao e Estatstica
com o EpiInfo
introduzir os dados no compensa os benefcios da sua utilizao. Neste caso, bastar utilizar
uma mquina calculadora!
Finalmente, tendo em conta as hipteses do estudo e a escala de medio das variveis,
decida quais sero os testes estatsticos a aplicar.
A anlise dos dados, depois de colhidos, genericamente efectuada segundo 4 fases:
1- Verificar e corrigir os erros de preenchimento que sempre se cometem na introduo
dos dados (para isto conveniente ver a base de dados em matriz, ou seja, listando
todos os valores de uma ou mais variveis numa tabela; no EpiInfo um bom mtodo
ser clicar em LIST na seco ANALYSIS e seleccionar "update" para fazer as
correces).
Os erros na colheita e transcrio dos dados para as fichas e o computador traduzemse em vieses de informao.
2- Efectuar a anlise univariada: cada varivel estudada isoladamente e de forma
descritiva (frequncias, medianas, mdias, etc.).
3- Efectuar a anlise bivariada: estuda-se a possibilidade de existir algum tipo de relao
entre uma varivel de exposio e uma varivel resposta (Qui-quadrado, Kruskall-Wallis,
ANOVA, etc.).
4- Efectuar a anlise multivariada: estuda-se o efeito das variveis interferentes na
relao entre as variveis de exposio e as de resultado (anlise estratificada, emparelhamento
das amostras, regresso linear ou logstica multivariada, etc.).
12
Investigao e Estatstica
com o EpiInfo
cometem erros e tm limitaes, pelo que se o nosso os no cometeu, ser muito de desconfiar, a
no ser que tenhamos sido orientados por alguma entidade divina.
Na hora de interpretar os resultados, poderemos classificar todas as possibilidades de erro
da seguinte forma:
1- Os erros aleatrios relacionados com o processo de seleco aleatria de
amostragem e que as provas estatsticas medem quando nos informam da
probabilidade de os nossos resultados representarem o que sucede realmente na
populao. Para diminuir estes erros ser necessrio aumentar a dimenso da amostra
at um limite razovel, de acordo com os nossos recursos. No Anexo 3 explica-se
uma forma fcil de calcular a dimenso da amostra, tendo em conta o mximo erro
aleatrio admissvel.
2- Os erros sistemticos ou vieses que podero ser classificados da seguinte forma:
Vieses de seleco.
Tm a ver com o facto de seleccionarmos uma amostra atravs de um mtodo
que no garante a sua representatividade:
a) vieses de admisso, p.ex., quando a nossa amostra seleccionada a partir
de uma populao especial, no representativa da realidade. o caso se
fizermos um estudo baseado na populao de toxicodependentes que vo
aos servios de sade: evidentemente as concluses tiradas de um estudo
como este no podem ser generalizadas para todos os toxicodependentes,
por no incluirem aqueles que no vo aos servios de sade. Relacionado
com esta problemtica est caracterizado o chamado vis de Berkson, que
tem a ver com o facto de quando se estuda uma populao de doentes de
um servio de urgncia hospitalar, encontram-se frequentemente
associaes estatsticas entre doenas que no se encontram associadas,
nem na populao em geral, nem patogenicamente (p.ex., gota e bronquite,
atendendo serem ambas doenas com o denominador comum de
implicarem contactos frequentes com os servios de urgncia).
13
Investigao e Estatstica
com o EpiInfo
Vieses de informao.
Tm a ver com os erros de classificao dos elementos da amostra, erros na
medio das variveis, ou na codificao e recolha da informao. Geralmente
classificam-se segundo dois tipos:
a) vieses do observador (ou de classificao)
14
Investigao e Estatstica
com o EpiInfo
b) vieses de resposta: o caso de um questionrio que por ser mal feito poder
induzir a maioria dos elementos da amostra a responderem num determinado
sentido...
Estes erros podero ser minorados se houver rigor humano e tcnico, utilizando
instrumentos de medio mais vlidos, etc.
Vieses de confundimento.
Falmos j que importa em estudos analticos classificar as nossas
variveis em trs categorias: variveis de exposio, de resposta e interferentes.
H dois tipos de variveis interferentes: as de confundimento e as
modificadoras de efeito.
O confundimento pode surgir quando uma varivel interferente, neste caso
denominada de confundimento, distorce ficticiamente a associao entre a
varivel de exposio e de resposta, alterando-lhe a fora ou mesmo o sentido.
Um exemplo muito prtico quando o investigador quer saber se h
associao entre o estado civil e o cancro. Possivelmente, encontrar-se- uma
associao positiva entre o facto de se estar casado e ter cancro, pelo que se
poderia tirar a concluso errada que o casamento constitui um risco cancergeno!
A verdade que existe aqui uma varivel de confundimento - a idade - que
distorce a associao! Efectivamente, a idade (v. de confundimento) est
associada tanto ao estado civil (v. de exposio), porque os casados tendem a ser
mais velhos, como ao cancro (v. resposta) porque os doentes de cancro tambm
tendem a ser mais velhos.
Em todos os casos de confundimento necessrio que a v. de
confundimento esteja associada tanto exposio como resposta. Outra forma
de dizer a mesma coisa referir que alm de a v. de confundimento estar
associada resposta, necessrio tambm que os diversos grupos classificados
segundo a v. de exposio (no exemplo atrs apontado: dois grupos casados/solteiros) estarem desajustados quanto v. de confundimento
(efectivamente, a proporo de velhos era diferente entre os casados e solteiros).
Repare-se que isto significa que, de alguma maneira, um confundimento um erro
15
Investigao e Estatstica
com o EpiInfo
16
Investigao e Estatstica
com o EpiInfo
7 - Comentrios finais
importante escrever o protocolo no computador pois ser seguramente necessrio fazer
muitas modificaes e correces at a forma final! Por outro lado, muito do que se escreve para
o protocolo poder ser utilizado para o relatrio ou artigo a publicar, especialmente para os
captulos de introduo e mtodos.
Faa sempre ainda um cronograma com as suas actividades. mais uma forma de autodisciplina que nos ajuda a levar a bom termo o nosso processo de investigao.
O rigor no cumprimento dos passos do protocolo muito importante mas evidente que
no h estudos perfeitos que nos possam revelar a "Verdade". Assim, depois da elaborao do
protocolo, resta-nos segui-lo com o rigor possvel mas, tambm, com a conscincia das
imperfeies do mesmo. A paixo pela perfeio no nos deve bloquear e, sobre este assunto,
algum disse que em investigao, assim como no amor, uma exagerada concentrao na
tcnica, levar provavelmente impotncia...
17
Investigao e Estatstica
com o EpiInfo
Atendendo aos erros que todos os estudos incluem, as concluses tm de ser geralmente
cuidadosas e prudentes.
PARTE 2
Noes de estatstica
18
Investigao e Estatstica
com o EpiInfo
Noes de Estatstica
1. A Estatstica descritiva.
Quando queremos investigar, o primeiro objectivo descrever o fenmeno. Por isso, a
primeira fase de tratamento dos dados a anlise univariada, atravs da verificao das
frequncias e o clculo das medidas de localizao central e de disperso para cada varivel
isoladamente.
Geralmente, no se calculam mais que as seguintes medidas:
as frequncias absolutas (nmeros absolutos de cada valor) e as frequncias relativas
(as propores em percentagens ou permilagens, etc.).
a mdia e desvio-padro
a mediana e desvio-quartil
a moda.
No entanto, as medidas atrs referidas no podero ser calculadas para qualquer tipo de
varivel. Tudo depende da escala de valores de cada varivel, pelo que aqui ser importante fazer
um pequeno parntesis para classificarmos as variveis quanto sua escala. Compreender esta
classificao de importncia crucial para utilizarmos de forma adequada a estatstica.
Sumariamente, poderemos classificar as variveis da seguinte forma:
19
Investigao e Estatstica
com o EpiInfo
3- Variveis quantitativas, cujos valores so medidos numa escala mtrica, como por ex.,
a "Idade", ou o "Peso" medido em gramas.
Para este tipo de variveis poder-se- fazer tudo quanto possvel fazer-se para as variveis nominais e
ordinais, mas tambm adicionalmente possvel estudar as mdias e desvios-padro (Comando MEANS no
EpiInfo).
"Experincia":
Nome
Joo
Maria
Manuel
Lus
Ana
Data de Nascimento
13-12-1973
10-07-1961
20-11-1980
11-05-1950
15-08-1985
Data Actual
15-12-2000
15-12-2000
15-12-2000
15-12-2000
15-12-2000
Peso
60
55
80
75
50
Sexo
homem
mulher
homem
homem
mulher
Com esta base de dados criada ser mais fcil compreender as provas estatsticas.
1.1.
20
Investigao e Estatstica
com o EpiInfo
destas variveis no tem sequer uma relao de ordem. Repare-se que por vezes codificam-se as
variveis com nmeros para introduo no computador, o que torna possvel pedir erradamente
mdias para variveis nominais, embora tais resultados, evidentemente, no tenham significado
nenhum!
No caso de variveis ordinais ou quantitativas, claro que tambm possvel calcular as
frequncias. Por exemplo, suponhamos que sabemos o Peso medido em Kg de 1000 pessoas.
Ser possvel calcular as frequncias de quem tem 40 Kg, 41 Kg, 42 Kg, ..., etc., mas atendendo
ao elevado nmero de pessoas, ser prefervel agrup-las em grupos com o mesmo intervalo, por
exemplo, grupo A (40-45 Kg), grupo B (46-49 Kg), etc., de forma a calcular as frequncias para
cada grupo.
Convm que o intervalo de amplitude dos diferentes grupos seja sempre o mesmo, caso
contrrio, os resultados podero confundir-nos, pois tenderemos a comparar grupos que no so
comparveis! 1
1.2.
Para alm das frequncias absolutas e relativas j referidas, existem outras medidas
geralmente calculadas para variveis ordinais ou quantitativas, tal como se encontra no Quadro
seguinte:
Escala da varivel
Ordinal ou Quantitativa
Quantitativa
Qualquer escala
Medidas de disperso
Amplitude interquartil / Desvio
Mdia
Moda
interquartil
Varincia / Desvio-padro
-
A Mdia aritmtica assim como o Desvio-padro que lhe est associado, so conceitos
que geralmente oferecem poucas dvidas. So calculados apenas em variveis com a escala
quantitativa. Por exemplo, no tem significado calcular a mdia para o Sexo (varivel nominal)
ou para o Peso medido em escala ordinal.
1
Apesar de tudo, existe a possibilidade de comparar graficamente classes de diferentes amplitudes atravs dos
histogramas que, so grficos em que a rea das colunas representam o nmero de indivduos (ao invs da altura das
colunas). No entanto, apesar deste tipo de grficos ser muito falado nos cursos de estatstica, raramente se vm em
artigos ...
21
Investigao e Estatstica
com o EpiInfo
22
Investigao e Estatstica
com o EpiInfo
referir apenas a que apresenta o menor valor ou seja, dir que 20 anos o valor mais frequente.
Por isto, se nos interessa referir a Moda, convm verificar se no h outro valor to frequente na
nossa amostra. Para isto basta executar o comando FREQUENCIES, que nos d as frequncias
de todos os valores.
Qual a diferena de interpretao entre a Mediana e a Mdia?
Em primeiro lugar a Mediana pode ser utilizada tanto em variveis quantitativas como em
variveis qualitativas ordinais, enquanto a Mdia s pode ser utilizada em variveis
quantitativas.
Em segundo lugar, no caso das variveis quantitativas, embora a Mdia seja um valor
mais fcil de entender, tem o defeito de nos induzir em erro se a nossa amostra tiver valores
muito extremos. Por exemplo, na distribuio de idades da nossa amostra a Mdia de 30,2 e a
Mediana de 27. Imagine que o indivduo mais velho tinha no 50 anos de idade mas sim 100
anos. Isto faria com que a Mdia saltasse para 40,2, ou seja, seria superior a quase todos os
valores individuais, mas a Mediana continuaria a ser 27. Se olharmos para todos os 5 valores
individuais da nossa amostra, verificamos que o nmero 27 melhor representante da
distribuio global da idade na nossa amostra que o errneo nmero 40,2.
Assim, no caso das variveis quantitativas, quando o valor da Mediana muito diferente
da Mdia, aconselhvel considerar sempre a Mediana como valor de referncia mais
importante.
Alm das medidas de localizao central (mdia, mediana, moda) existem as medidas de
disperso que nos do a ideia da variao dos dados.
Quando se calcula a mdia dever-se- sempre calcular o desvio-padro, apresentando-se a
sua frmula apenas para ficar-se com uma ideia do que representa:
Desvio-padro =
( Xi Mdia )
em que
Xi = Cada valor individual
N = Nmero de todos os valores
Ou seja, para calcular o Desvio-padro necessrio primeiro calcular a Mdia e depois
calcular todas as diferenas entre cada valor individual e a mdia. um erro dizer que o desviopadro a mdia de todas as diferenas, mas podemos senti-lo como algo aproximado.
23
Investigao e Estatstica
com o EpiInfo
Por vezes, queremos comparar duas variveis quantitativas quanto ao seu grau de
disperso, por exemplo, o Peso (em Kg) e a Idade (em Anos). Esta comparao no poder ser
feita comparando simplesmente os Desvios-padro respectivos, porque estes esto expressos em
unidades de medida diferentes, i.e., no se pode comparar a disperso de Kg com a de Anos! No
entanto, possvel fazer esta comparao em termos relativos, se calcularmos o coeficiente de
variao, da seguinte forma:
Coeficiente de variao =
Desvio padro
X 100%
Mdia
convencionando alguns autores que um coeficiente variao maior que 10% significa que
a disperso forte.
Nas variveis ordinais, como no possvel calcular mdias ou desvios-padro, para
avaliar o grau de disperso, poder-se- calcular a Amplitude interquartil e o Desvio-quartil.
A Amplitude interquartil simplesmente a diferena entre o 3 e o 1 Quartil, ou seja, no
exemplo anterior, 39-20= 19. Repare-se que nesta Amplitude inter-quartil situam-se os 50%
centrais dos valores.
O Desvio interquartil sempre metade da Amplitude interquartil, ou seja, 19/2=9,5.
Tambm possvel, calcular a o coeficiente de variao quartil da seguinte forma:
Amplitude int erquartil
2. A Estatstica Dedutiva
Para alm da simples descrio dos dados que temos, a Estatstica pretende ajudar-nos a
inferir at que ponto os nossos resultados podero ser representativos da populao que est por
trs da nossa amostra.
Ou seja, suponhamos que retiramos de forma aleatria uma amostra de 100 doentes de
um ficheiro clnico com 1000 doentes. Aps verificarmos que na nossa amostra temos 10% de
mulheres, poderemos perguntar-nos at que ponto, na populao, tambm existe 10% de
mulheres.
24
Investigao e Estatstica
com o EpiInfo
25
Investigao e Estatstica
com o EpiInfo
26
Investigao e Estatstica
com o EpiInfo
Novamente, segundo os Estatsticos, a interpretao dever ser feita com uma pequena nuance: um Intervalo de
confiana de 95% significar que se seleccionarmos um nmero infinito de amostras sempre da mesma forma
aleatria, em 95% delas, estaro incluidos os valores "verdadeiros" no intervalo de confiana resultante.
27
Investigao e Estatstica
com o EpiInfo
Homem
Varivel
de Mulher
Total
exposio (Sexo)
Total
3
2
5
Tambm na seco STATCALC possvel construir tabelas mas, neste caso, directamente
do teclado, e no a partir de uma base de dados j existente.
Seja como for, face aos dados da tabela exemplificada em cima, pode-se perguntar se o
grupo de "Adultos" diferente do grupo de "Jovens" quanto ao sexo.
Vamos supor que na verdade no existe uma diferena entre os dois grupos quanto ao
sexo na populao de onde vem esta amostra. Novamente, mesmo que seja esta a verdade,
tambm possvel que quando colhemos uma amostra o resultado possa apresentar uma diferena
por questes ligadas ao acaso.
claro que quanto maior for a dimenso da amostra, mais fcil ser identificar diferenas
verdadeiras entre os dois grupos. Tambm, quanto maior for a diferena no gnero sexual entre
os dois grupos, mais provvel ser a existncia desta diferena verdadeira entre os dois grupos.
O Qui-quadrado mede a probabilidade de as diferenas encontradas nos dois grupos da
nossa amostra serem devidas ao acaso, partindo do pressuposto que, na verdade, no h
diferenas entre os dois grupos na populao donde provm. Se a probabilidade for alta
28
Investigao e Estatstica
com o EpiInfo
1 (no fuma)
Doenas cardacas
(Varivel resultado)
Sim
No
(casos)
(controlos)
5
85
29
Investigao e Estatstica
com o EpiInfo
Varivel
de 2
(1-15
exposio
cigarros/dia)
(Consumo de 3
(>15
tabaco)
cigarros/dia)
54
41
Neste caso, temos uma varivel de exposio ordenada e uma varivel resultado
dicotmica. Se, fizermos o Qui-quadrado obteremos o seguinte resultado: p=0,0629 .
Este resultado diz-nos que no h diferenas estatisticamente significativas (para um
nvel de significncia convencionado de 0,05) entre os doentes e no doentes quanto ao seu
consumo de tabaco, mas no tem em conta o efeito crescente da varivel exposio.
Se entrarmos em conta com este efeito, no s tornamos mais potente o teste como
poderemos verificar existir uma relao linear entre as duas variveis. o que faz a Prova da
tendncia linear do Qui-quadrado cujo p, neste caso, igual a 0,0206. Ou seja, h uma relao
linear estatisticamente significativa entre o nvel de consumo de tabaco e a existncia de doena
cardaca.
Esta Prova da tendncia linear s poder ser aplicada quando a varivel resposta seja
dicotmica e a varivel exposio seja quantitativa ou ordinal (varivel de categorias ordenadas
em trs ou mais nveis).
Tambm s poder ser aplicada depois de verificarmos que no h valores esperados nas
clulas inferiores a 5. Isto no automaticamente verificado pelo EpiInfo enquanto se faz a
prova da tendncia linear: ter-se- sempre que aplicar o Qui-quadrado convencional na seco
STATCALC, da forma j referida.
2.3.- Provas para verificar a associao entre uma varivel qualitativa e uma
varivel quantitativa - o t de Student / ANOVA e o U de Mann-Whitney / KruskalWallis.
Agora execute o comando MEANS da varivel Idade segundo o Sexo ("crosstabulated by
value of ...").
Alm das Mdias, Desvios-padro, Medianas, Quartis, etc. das idades para os dois sexos,
aqui temos ainda os resultados dos tpicos testes de homogeneidade nos quais a pergunta
"haver diferenas entre os dois grupos (masculino/feminino) quanto idade?".
30
Investigao e Estatstica
com o EpiInfo
3- A fora da associao.
J referimos que existe duas dimenses quando estudamos uma associao entre
variveis: uma em que a Estatstica nos diz at que ponto o que vemos na nossa amostra poder
ser o que existe na populao, ou seja, at que ponto estatisticamente significativo; outra em
31
Investigao e Estatstica
com o EpiInfo
que procuramos verificar at que ponto os nossos resultados implicam associaes fortes entre
variveis, calculadas atravs de simples subtraces (Diferena de Riscos ou Risco Atribuvel)
ou quocientes (Risco Relativo, Odds Ratio, etc). possvel haver uma associao forte nos
resultados da nossa amostra que, no entanto, no sendo estatisticamente significativos, tm
pouco interesse porque no temos garantias de existirem na populao real. Por outro lado, tal
como j referimos, possvel haver uma associao estatisticamente significativa mas que, por
ser to fraca, no tem importncia nenhuma.
Vamos agora falar de duas importantes medidas da fora da associao - o Risco Relativo
e o Odds Ratio.
Estas medidas s podero ser calculadas em tipos particulares de estudos de observao
analtica - os estudos de coorte e de caso-controlo.
32
Investigao e Estatstica
com o EpiInfo
SIM
NO
TOTAL
(Consumos
injectveis?)
Diferena Absoluta ou Risco Atribuvel (RA)=Inc. C. nos expostos - Inc. C. nos no expostos =20%5%=15%
Diferena relativa ou Fraco Etiolgica do Risco (FER)= RA/Inc. C. nos expostos= 15/20=75%
Risco Relativo (RR) = Inc. C. nos expostos / Inc. C. nos no expostos =20/5=4
Com estes dados, poderemos calcular o risco absoluto de morrer quando se injecta a
droga (A/A+B=20%) e o risco absoluto de morrer sem este comportamento (C/C+D=5%). A
medio da fora da associao entre as duas variveis poder ser calculada ou atravs da
diferena (20%-5%=15%) ou do quociente entre estes dois riscos (20/5=4). A Diferena de
Riscos frequentemente denominada como Risco Atribuvel (RA) e o quociente entre os dois
riscos corresponde ao denominado Risco Relativo (RR).
33
Investigao e Estatstica
com o EpiInfo
34
Investigao e Estatstica
com o EpiInfo
SIM
A (200)
C (50)
35
Investigao e Estatstica
com o EpiInfo
Exposio no
incio do
perodo em
estudo
TOTAL
A+C (250)
B+D (1750)
A+C+B+D
(2000)
(Consumos
injectveis?)
Repare-se que esta tabela igual anterior mas os clculos efectuados anteriormente no
tm significado epidemiolgico e so incorrectos. Efectivamente, no poderemos calcular os
riscos absolutos porque no sabemos qual a populao exposta que deu origem a todos os
bitos. Consequentemente, tambm no poderemos calcular o RA e o RR. No entanto,
demonstra-se que, quando o efeito raro (neste caso, os bitos) possvel estimar
aproximadamente o RR num estudo de caso-controlo, dando-lhe neste caso a denominao de
Odds Ratio (OR), da seguinte forma:
OR
A/C
200 / 50
4,75
B / D 800 / 950
O Odds Ratio (OR), que poder traduzir-se como "razo de possibilidades", uma
aproximao estimada do RR, pelo que s tem interesse em estudos onde este no poder ser
calculado, nomeadamente nos estudos de caso-controlo.
O OR e o seu intervalo de confiana interpretam-se da mesma forma que para o RR,
sendo tambm calculados automaticamente pelo EpiInfo (neste caso, o intervalo de confiana de
95% 3,4-6,7 sendo este resultado tambm estatisticamente significativo porque no inclui o
"1").
Bibliografia
Abramson, J.H. Survey methods in community medicine - an introduccion to epidemiological
and evaluative studies. 2 ed. New York: Churchill Livingstone, 1979.
Dean, A.G.; et al. Epi Info 2000, a database and statistics program for public health
professionals for use on Windows 95, 98, NT, and 2000 computers. Atlanta (USA): Centers
for Disease Control and Prevention, 2000.
36
Investigao e Estatstica
com o EpiInfo
Burt.
Data
Analysis
With
Epi
Info.
37