Você está na página 1de 5

1

Interpretao de alguns resultados em estudos epidemiolgicos: p-valor e intervalo de confiana para medidas de associao*
Os estudos epidemiolgicos, freqentemente, apresentam resultados que avaliam a associao entre variveis independentes (ou fatores de exposio) e uma varivel dependente (ou desfecho), em geral controlando para possveis variveis de confuso (por exemplo, idade, sexo, entre outras, dependendo do desfecho estudado). As medidas de associao (risco relativo, odds ratio, razo de prevalncia, etc) dependem do tipo de estudo realizado. Para os estudos individuados, mais comuns na literatura da rea da sade, essas medidas podem ser assim apresentadas, conforme descrevem Almeida Filho e Rouquayrol (1999):
Tipo de estudo Coorte Caso-controle Transversal Medida de associao Risco Relativo Odds Ratio (ou, em portugus, Razo dos Produtos Cruzados) Razo de Prevalncias, embora se veja muito na literatura o uso do Odds Ratio

A construo preliminar dessas medidas de associao tem como base uma tabela 2 x 2 (duas categorias para a varivel independente e duas categorias para a varivel dependente). Por exemplo, como varivel independente, o hbito de fumar seria categorizado em sim e no (ou presente e ausente). O desfecho (por exemplo, uma doena) tambm seria categorizado em sim e no (ou doente e no doente). A tabela 1, abaixo, exemplifica como essas medidas de associao so construdas. Tabela 1 Anlise da associao entre um determinado fator (varivel independente) e um desfecho (varivel dependente) segundo os diferentes tipos de delineamento de pesquisa. DOENA FATOR Sim (AVC) Presente (FUMO) Ausente (FUMO) Total a (1500) c (700) a + c (2200) No (AVC) b (8500) d (9300) b + d (17800) a + b (10.000) c + d (10.000) N (20.000) Total

Risco Relativo: (a/a+b) / (c/c+d) Odds Ratio: a x d / b x c Razo de Prevalncia: (a/a+b) / (c/c+d)

Como se pode observar pelas frmulas do rodap da Tabela 1, a forma de calcular o Risco Relativo e a Razo de Prevalncia idntica, porm os eventos so bem diferentes. Enquanto o risco relativo trabalha com incidncia (casos novos da doena que ainda ocorrero no tempo), a razo de prevalncia trabalha com os casos existentes no presente (prevalentes), sendo, portanto, mais sujeitos a vieses (tais como os vieses decorrentes de se trabalhar apenas com os casos sobreviventes). Para entendermos o significado do famoso valor de p e do intervalo de confiana de uma medida de associao tomaremos, como exemplo, o caso do risco relativo (RR), pois a interpretao nos demais casos (odds ratio e razo de prevalncia) semelhante.
Texto elaborado por Selma Maffei de Andrade e Darli Antnio Soares, do Departamento de Sade Coletiva/UEL, para o mdulo PIN-2 (Prticas de Interao Ensino-Servios-Comunidade) dos cursos de Enfermagem e Medicina, em maro de 2005 (revisado em fev. 2006).
*

Retomando a frmula de calcular o Risco Relativo (RR), descrita no rodap da Tabela 1, observamos que essa medida (RR) nada mais do que a diviso da taxa de incidncia da doena entre os expostos ao fator pela taxa de incidncia da doena entre os no expostos ao fator de interesse. Exemplificando: imaginem (hipoteticamente) um estudo que observou, prospectivamente, 10.000 pessoas que fumaram durante vrios anos (expostas ao fator tabagismo) e mais 10.000 pessoas que no fumaram durante esses anos (no expostas ao mesmo fator tabagismo) e, posteriormente, fossem observadas as incidncias de acidente vascular cerebral (AVC) entre esses dois grupos de pessoas, sendo verificados 1500 casos de AVC no primeiro grupo (expostos ao fator) e 700 casos de AVC entre os no expostos. Portanto, calcularamos a incidncia entre os expostos da seguinte forma, conforme clculo da taxa de incidncia da doena: Casos novos da doena entre expostos Coeficiente de incidncia entre expostos = Nmero de Expostos ao fator Colocando os nmeros nesta frmula, portanto, teramos 1500 (casos novos de AVC expostos ao tabagismo) divididos por 10.000 tabagistas, com um resultado de 0,15 (coeficiente ou taxa de incidncia do AVC entre tabagistas), lembrando que a taxa de incidncia estima o risco absoluto da doena ou agravo na populao especfica. Se preferirmos trabalhar com nmero inteiros, poderamos multiplicar esse valor (0,15) por 103, por exemplo, o que resultaria em um coeficiente de incidncia de 150 por 1.000 pessoas. Notem que o valor numrico o mesmo, ou seja, 0,15 a mesma coisa que 1,5 em cada dez pessoas ou 15 por cem pessoas ou 150 para cada mil pessoas ou 1500 para 10.000 pessoas, e assim por diante... O importante, neste caso, trabalhar com a mesma unidade quando calculamos as incidncias entre expostos e no expostos. Supondo, ento, que trabalharemos com a taxa de incidncia de AVC de 0,15 por 10.000 tabagistas, calculamos, agora, a taxa de incidncia de AVC entre no tabagistas (risco dos no tabagistas desenvolverem AVC), isto , 700 casos novos de AVC entre no tabagistas divididos por 10.000 pessoas no tabagistas, resultando em uma taxa de incidncia de 0,07. Temos, agora, os riscos absolutos de AVC para essas duas populaes (0,15 para tabagistas e 0,07 para no tabagistas). O risco relativo a simples diviso de um pelo outro: 0,15 dividido por 0,07 = 2,14. E a interpretao desse RR = 2,14? Nada mais do que, no estudo especfico, o risco que as pessoas tabagistas tm de desenvolver AVC 2,14 vezes o risco de pessoas que no fumam (ou um pouco mais do que o dobro)! Embora este estudo seja hipottico, melhor no fumar, certo? (vide outros exemplos dos malefcios do fumo, agora verdadeiros, na literatura!). Caso as taxas de incidncia entre fumantes e no fumantes fossem, em outra situao, idnticas (por exemplo, 0,15), o Risco Relativo seria calculado dividindo-se 0,15 por 0,15, cujo resultado seria igual a 1. Portanto, quando o RR igual a 1, no h diferena de incidncia da doena entre expostos ao fator e no expostos. No seria timo, para os fumantes, se o RR desse sempre 1 na anlise dos mais diferentes desfechos? Em geral, no entanto, em estudos epidemiolgicos desse tipo, alm do valor do RR, so tambm apresentadas mais duas informaes: o valor de p (ou p-valor) e o intervalo de confiana de 95% (I.C. 95%). Qual a interpretao? No entraremos aqui em detalhes relativos ao planejamento do estudo (tamanho da amostra necessrio para detectar uma associao entre fator e desfecho, variveis de confuso), nem em cuidados com outros x 10n

potenciais de vieses (perdas seletivas de seguimento, medio dos fatores e desfechos, e outros). Para isso, sugerimos consultar obras como a de Medronho (2002), a de Jekel et al. (1999), a de Fletcher et al. (1996), entre outras. O pesquisador, ao realizar um estudo para verificar associao entre variveis, em geral trabalha com amostras de um universo de pessoas. Extrapolar os resultados encontrados na amostra para a populao da qual essa amostra foi extrada um processo conhecido como inferncia estatstica. Para tanto, a amostra tem que ser representativa da populao da qual extrada, garantindo o que se conhece como validade externa, ou seja, os resultados encontrados no estudo feito com amostras so generalizveis para a populao geral? Por exemplo, em um estudo caso-controle, os casos selecionados devem ser representativos das pessoas que tm a doena de interesse, assim como os controles devem representar adequadamente as pessoas que no tm a doena em questo. Um exemplo mais comum de amostragem a realizada em pesquisas de opinio, dada a impossibilidade de se entrevistar todo o universo. Em pocas de eleies, muito comum a imprensa divulgar resultados de pesquisa de inteno de voto, indicando os provveis vencedores. Nessas ocasies, tambm comum que os jornalistas refiram que alguns candidatos esto tecnicamente empatados, embora um tenha obtido maior percentual de inteno de votos do que o outro candidato. So os famosos dois (ou mais) pontos percentuais para cima ou para baixo. Se um candidato tem 32,8% de inteno de voto e outro tem 31%, mas a proporo de votos pode variar dois pontos percentuais para cima ou para baixo, pode ser que o primeiro candidato tenha de 30,8% a 34,8% de inteno de voto, enquanto o segundo candidato pode ter de 30% a 33%. H, portanto, alguns percentuais nessas duas faixas que se empatam. Por isso, no possvel afirmar que o candidato que obteve 32,8% de inteno de votos possivelmente ganhar a eleio (na realidade, o primeiro candidato pode ter 30,8% dos votos e o segundo 31%, por exemplo). A interpretao do Intervalo de Confiana de 95% (IC 95%) no muito diferente da feita quando se analisam os resultados de uma pesquisa eleitoral. Por exemplo, se pesquisarmos uma determinada caracterstica em uma populao e verificarmos que a prevalncia da caracterstica de 20 por 10.000 habitantes, com intervalo de confiana de 95% variando entre 18 e 22 por 10.000 habitantes, podemos dizer que temos 95% de confiana, uma confiana considerada razovel, de que a verdadeira prevalncia na populao est contida nesse intervalo (entre 18 e 22 por 100.000 habitantes). Se quisermos comparar essa prevalncia (e seu respectivo IC 95%) com a prevalncia observada em outra comunidade, somente poderemos dizer que a prevalncia diferente (mais alta ou mais baixa) se o IC 95% da prevalncia observada nessa outra comunidade no contiver nenhum valor entre 18 e 22 por 10.000 habitantes (caso contrrio, teramos empate tcnico!). A Figura 1, extrada de um trabalho de pesquisa (Andrade et al., 2006), exemplifica graficamente essa questo. Nesse trabalho, os 399 municpios do Paran foram agrupados em clusters segundo condies de vida (taxa de alfabetizao, saneamento, renda, etc.), sendo o cluster 1 o de piores condies de vida e o cluster 5 o de melhores condies (os clusters 2, 3 e 4 so intermedirios, com crescente melhora das condies de vida). Como se pode observar, o cluster 1, de piores condies de vida, apresenta a maior taxa de mortalidade infantil ps-neonatal (cerca de 8,7 conforme o grfico). No entanto, est tecnicamente empatado com os clusters 2, 3 e 4, pois os IC 95% se sobrepem em alguns valores. O nico cluster de municpios que apresenta uma taxa de mortalidade infantil ps-neonatal que no empata com as taxas dos demais clusters o cluster de melhores

condies de vida (o cluster 5), pois o intervalo de confiana de 95% no se sobrepe aos intervalos das demais taxas.
10,0

9,5

9,0

= Taxa = Intervalo de Confiana 95%

Taxa de mortalidade ps-neonatal

8,5

8,0

7,5

7,0

6,5

6,0

5,5

3
Clusters

Figura 1 Taxas de mortalidade infantil ps-neonatal (28 dias a 1 ano) por 1000 nascidos vivos e respectivos intervalos de confiana de 95% (IC 95%) no Paran (1997-2001) segundo clusters de municpios classificados de acordo com condies de vida (1=pior; 5=melhor). Portanto, pela anlise da Figura 1, poderamos dizer que a taxa de mortalidade infantil ps-neonatal significativamente menor no cluster de municpios com melhores condies de vida (o cluster 5) em comparao aos demais. S lembrando: a mortalidade infantil ps-neonatal aquela que ocorre entre os 28 dias de vida at um ano de idade e est bastante relacionada s condies de vida e ao acesso aos servios de sade. Voltando ao caso do risco relativo, lembram-se que, quando o RR = 1, no h diferena nas incidncias da doena entre expostos e no expostos ao fator? Pois , a anlise do IC 95% tambm leva em conta esse famoso 1. Quando o IC 95% no passa pelo 1, podemos dizer que houve significncia estatstica na associao entre fator e desfecho. Valores superiores a 1 indicam que o fator fator de risco e valores inferiores a 1 indicam que a exposio fator de proteo. Assim, um RR de 3, com IC 95% variando entre 1,8 e 4,2 indicaria que a exposio favorece a ocorrncia do desfecho, com 95% de confiana de que o verdadeiro RR estaria contido nesse intervalo de 1,84,2. Um RR de 0,5, com IC 95% de 0,2 a 0,8 indicaria que a exposio protege contra a ocorrncia do desfecho (ou seja, se o risco relativo dos expostos em comparao aos no expostos de 0,5, isso significa que os expostos tm metade da chance dos no expostos de desenvolver o desfecho). Para facilitar a anlise, quando o RR < 1, poderia ser feito um clculo inverso, relacionando os no expostos aos expostos. Esse clculo feito da seguinte forma: 1 / RR. No caso acima, 1 / 0,5 = 2, ou seja, os no expostos teriam o dobro (2 vezes) o risco de desenvolver o desfecho em comparao aos expostos. O valor de p (ou p-valor), por outro lado, uma estatstica sntese da anlise que foi feita, por meio de um teste estatstico apropriado (por exemplo, qui-quadrado, teste de Fisher, teste t de Student, etc.), para avaliar a associao (ou correlao) entre variveis ou diferenas entre grupos. Comumente, na rea da sade, um p < 0,05 (ou 5%) indica que houve significncia estatstica na associao analisada.

O p-valor significa a probabilidade de se estar errado quando aceitamos a hiptese de associao entre variveis ou de diferenas entre grupos. Um valor menor do que 5% de probabilidade de erro considerado aceitvel pela grande maioria dos pesquisadores da rea. Explicando um pouco o processo anterior chegada a esse valor de p: ao iniciar um estudo de associao, o pesquisador ou pesquisadora, alm do processo de planejamento do tamanho necessrio da amostra e dos instrumentos de coleta de dados, estabelece hipteses quanto relao entre variveis. Um primeiro passo estabelecer a hiptese nula (H-zero H0) e a hiptese alternativa (H1 ou HA). Por exemplo: H0 = no h associao entre .... (fator) e .... (desfecho) H1 = h associao entre .... (fator) e .... (desfecho) A seguir, definido um nvel alfa, ou seja, um nvel mximo aceitvel de erro caso a hiptese nula seja rejeitada (e esteja correta) e a hiptese alternativa seja aceita. Em outras palavras, quanto nos permitimos errar ao aceitarmos a hiptese de associao entre variveis se esta associao no for real, mas devida ao acaso? Em geral, este nvel alfa definido em 5% (por isso, considera-se estatisticamente significativo o resultado com p < 0,05). Ao concluir a coleta de dados, o pesquisador ou pesquisadora tabular os dados e, aps aplicao de um teste estatstico apropriado, verificar uma tabela-padro de valores de p do teste estatstico usado para comparar com o valor-p encontrado no estudo e identificar se houve ou no significncia estatstica (para ser significante, esse valor encontrado na tabela-padro teria que ser menor do 0,05). Uma desvantagem do p-valor em relao ao IC 95% que o p-valor no informa o grau da associao entre as variveis em estudo, mas apenas se houve ou no significncia estatstica. J o risco relativo, quando mais distante de 1, revela que maior a fora dessa associao. Portanto, o IC 95% tem a vantagem de informar tambm a fora dessa associao, assim como a preciso do estudo (quanto mais estreito um intervalo de confiana, mais preciso o estudo). Por exemplo, um RR de 10 revela que o risco dos expostos 10 vezes maior do que o risco dos no expostos. No entanto, se o IC 95% varia de 1,1 a 19,8 poderamos considerar que no houve muita preciso nesse estudo, pois o verdadeiro valor do RR poderia ser de apenas 1,1! J um outro RR de 3, mas com IC 95% variando entre 2,5 e 3,5, por exemplo, indicaria maior preciso, dado o intervalo mais estreito. A preciso de um estudo depende da amostra (mais homognea ou no) e de seu tamanho, mas isso assunto para uma outra ocasio... Referncias
Almeida Filho N, Rouquayrol, Z. Anlise de dados epidemiolgicos. In: Rouquayrol, Z.; Almeida Filho, N. (Org). Epidemiologia & Sade. 5. ed. Rio de Janeiro: MEDSI; 1999. Andrade SM, Soares DA, Matsuo T, Souza RKT, Mathias TAF, Iwakura MLH, Zequim MA. Condies de vida e mortalidade infantil no estado do Paran, Brasil, 1997-2001. Cad. Sade Pblica 2006; 22(1):181-9. Fletcher RH, Fletcher SW, Wagner EH. Epidemiologia clnica: elementos essenciais. 3a ed. Porto Alegre: Artes Mdicas; 1996. Jekel JF, Elmore JG, Katz DL. Epidemiologia, bioestatstica e medicina preventiva (trad. Ricardo Savaris). Porto Alegre: Artes Mdicas; 1999. Medronho RA (org). Epidemiologia. Rio de Janeiro: Atheneu; 2002.

Você também pode gostar