Você está na página 1de 494

Descomplicando

MBE
uma abordagem
prática da
EDICINA
ASEADA em
VIDÊNCIAS






2a Edição editora
Revista e Ampliada
2a Ediçõo
Revista e Atualizada
Henrique de Paula Bedaque
Elaine Lira Medeiros Bezerra
(orgs.)

editora

Natal, 2021
editora

©2021. Henrique de Paula Bedaque e Elaine Lira Medeiros Bezerra (orgs.). Reservam-se os direitos e responsa-
bilidades do conteúdo desta edição aos autores. A reprodução de pequenos trechos desta publicação pode
ser realizada por qualquer meio, sem a prévia autorização dos autores, desde que citada a fonte. A violação dos
direitos do autor (Lei n. 9610/1998) é crime estabelecido pelo artigo 184 do Código Penal.

Editora Rejane Andréa Matias A. Bay

Conselho Editorial Francisco Fransualdo de Azevedo


Celso Donizete Locatel
Evaneide Maria de Melo
Márcia da Silva
Alessandra Cardozo de Freitas
Márcio Adriano de Azevedo
José Evangelista Fagundes
Helder Alexandre Medeiros de Macedo
Júlio César Rosa de Araújo
Samuel Lima
Silvano Pereira de Araújo
Dilma Felizardo

Revisores científicos Dyego Leandro Bezerra de Souza


Elaine Lira Medeiros Bezerra
Ferdinand Gilbert Saraiva da Silva Maia
Ítalo Medeiros de Azevedo
Marília de Almeida Cardoso

Projeto Gráfico e Caule de Papiro


Diagramação

Divisão de Serviços Técnicos


Catalogação da publicação na Fonte.
Bibliotecária/Documentarista:
Carla Beatriz Marques Felipe CRB-15/380

D448

Descomplicando MBE: uma abordagem prática da medicina Baseada em evidências / Henrique


de Paula Bedaque e Elaine Lira Medeiros Bezerra (Organizadores). — Natal: Editora Caule
de Papiro, 2021.

492 p. : il.

ISBN 978-65-86643-37-4 - (LIVRO VIRTUAL)

1. Medicina 2. Saúde. I. Bezerra, / Bedaque, Henrique de Paula (Org.). II. Elaine Lira Medeiros.
(Org.).

RN CDU 616

Caule de Papiro gráfica e editora


Rua Serra do Mel, 7989, Cidade Satélite
Pitimbu | 59.068-170 | Natal/RN | Brasil
Telefone: 84 3218 4626
www.cauledepapiro.com.br
SUMÁRIO
P R E FÁC IO, 11

A P R E SE N TAÇÃO, 13

MÓDULO 1
C A P ÍT U LO 1 – F U N DA M E N TOS D O
P E NSA M E N TO C I E N T ÍF ICO, 17
Henrique de Paula Bedaque
Maria Paula Ribeiro Dantas Bezerra
C A P ÍT U LO 2 – P E RGU N TA S C L ÍN IC A S, 27
Augusto de Galvão e Brito Medeiros
Ferdinand Saraiva Maia
Frederico Batah El-Feghaly
Luis Henrique Silveira Rocha Barbosa

MÓDULO 2
C A P ÍT U LO 3 – E ST U D OS E P I DE M IOLÓGICOS –
CONC E I TOS GE R A I S, 43
Adrian Lucca Guimarães Caldeira
Dyego Leandro Bezerra de Souza
Henrique de Paula Bedaque
Thomas Diniz Papa
C A P ÍT U LO 4 – E ST U D OS ECOLÓGICOS, 57
Dyego Leandro Bezerra de Souza
Géssika Lanzillo de Almeida Nunes
Henrique de Paula Bedaque
Yasmin de Medeiros Carvalho
C A P ÍT U LO 5 – SÉR I E S T E M P OR A I S, 67
Dyego Leandro Bezerra de Souza
Henrique de Paula Bedaque
Thomas Diniz Papa
C A P ÍT U LO 6 – E ST U D OS SECC IONA I S, 77
Dyego Leandro Bezerra de Souza
Henrique de Paula Bedaque
Luiz Cândido da Silva Júnior
CA PÍT U LO 7 – EST U DO
QUALI TAT IVO EM SAÚDE , 85
Adrian Lucca Guimarães Caldeira
Dyego Leandro Bezerra de Souza
Henrique de Paula Bedaque
C A P ÍT U LO 8 – E ST U D O DE CO ORT E , 95
Ferdinand Gilbert Saraiva da Silva Maia
Henrique de Paula Bedaque
Melissa Yolanda Soares Melo
C A P ÍT U LO 9 – C A S O -CON T ROLE , 111
Cinthia Maria Cibelle de Lima Souza
Ferdinand Gilbert Saraiva da Silva Maia
Luiz Cândido da Silva Júnior
C A P ÍT U LO 10 – E NSA IO C L ÍN ICO, 117
Letícia Goes da Silva Henrique de Paula Bedaque
Maria Paula Ribeiro Dantas Bezerra
Marília de Almeida Cardoso
C A P ÍT U LO 11 – R E V I SÃO SI ST E M ÁT IC A , 133
Géssika Lanzillo de Almeida Nunes Henrique de Paula Bedaque
Isadora Soares Lopes
Marília de Almeida Cardoso
C A P ÍT U LO 12 – M E TA NÁL I SE , 149
Alana Dantas de Melo
Beatriz Aguiar da Silva Carvalho
Henrique de Paula Bedaque
Isadora Soares Lopes
Marília de Almeida Cardoso
C A PÍT U LO 13 – H I E R A RQU I A DA S EV I DÊNC I A S, 165
Ferdinand Gilbert Saraiva da Silva Maia
Letícia Goes da Silva
Luis Henrique Silveira Rocha Barbosa
Pedro Henrique Almeida Fraiman
C A P ÍT U LO 14 – DI R E T R I Z E S, 173
Ferdinand Gilbert Saraiva da Silva Maia
Frederico Galvani Harckbart Carvalho
Henrique de Paula Bedaque
Yasmin de Medeiros Carvalho
C ÁP I T U LO 15 – E ST U D OS DE NÃO -
I N F E R IOR I DA DE , 181
Ana Karenina Carvalho de Souza
Henrique de Paula Bedaque
Iana Fernanda de Medeiros Cabral
Juliana Soares Pimenta
C A P ÍT U LO 16 – E ST U D OS DE M U N D O R E A L , 197
Breno C. C. Simas
Clause Willdys Medeiros Dantas
Henrique de Paula Bedaque
Maria Tamyres de Carvalho Freitas

MÓDULO 3
C A P ÍT U LO 17 – A NÁL I SE S E STAT ÍST IC A S, 211
Beatriz Aguiar da Silva Carvalho
Henrique de Paula Bedaque
Ítalo Medeiros de Azevedo

MÓDULO 4
C A P ÍT U LO 18 – SE NSI BI DA DE
E E SP EC I F IC I DA DE , 273
Ítalo Medeiros de Azevedo
João Victor de Sousa Cabral
Ugor Tomaz Fernandes
C A P ÍT U LO 19 – VA LOR P R E DI T I VO, 283
João Victor de Sousa Cabral
Melissa Yolanda Soares Melo
Ítalo Medeiros de Azevedo
C A P ÍT U LO 20 – AC U R ÁC I A , 301
Henrique de Paula Bedaque
Ítalo Medeiros de Azevedo
Luiz Cândido da Silva Júnior
C A P ÍT U LO 21 – C U RVA RO C , 309
Ítalo Medeiros de Azevedo
Pedro Henrique Almenida Fraiman
Ugor Tomaz Fernandes
C A P ÍT U LO 22 – C AUSA L I DA DE , 315
Ferdinand Gilbert Saraiva da Silva Maia
Frederico Galvani Harckbart Carvalho
Henrique de Paula Bedaque
C A P ÍT U LO 23 – E STAT I ST IC A A P L IC A DA
A E ST U D OS P ROGNÓST ICOS, 325
Breno C C Simas
Clause Willdys Medeiros Dantas
Ferdinand Saraiva Maia
Juliana Soares Pimenta
Maria Paula Ribeiro Dantas Bezerra
C A P ÍT U LO 24 – SC R E E N I NG E
OV E R DI AGNOSI S, 345
Breno C C Simas
Ferdinand Saraiva Maia
C A P ÍT U LO 25 – O A RT IG O C I E N T ÍF ICO, 361
Beatriz Aguiar da Silva Carvalho
Elaine Lira Medeiros Bezerra
Henrique de Paula Bedaque
C A P ÍT U LO 26 – COMO P E S QU I SA R
E M BA SE S DE E V I DÊNC I A S?, 399
Cinthia Maria Cibelle de Lima Souza
Elaine Lira Medeiros Bezerra
Frederico Batah El-Feghaly
Pedro Henrique Almeida Fraiman
C A P ÍT U LO 27 – COMO A NA L I SA R
U M A RT IG O C I E N T ÍF ICO?, 411
Ana Karenina Carvalho de Souza
Henrique de Paula Bedaque
Isadora Soares Lopes
Maria Tamyres de Carvalho Freitas
C A P ÍT U LO 28 – E R ROS E V I E SE S, 455
Augusto de Galvão e Brito Medeiros
Henrique de Paula Bedaque
Isadora Soares Lopes
Maria Paula Ribeiro Dantas Bezerra

SOBR E OS QU E CON T R I BU I R A M
COM E STA P U BL IC AÇÃO, 487
PREFÁCIO

Eduardo Lapa
Cofounder do Cardiopapers
Doutor e mestre pela Universidade Federal de Pernambuco-UFPE

N
o início do século 15, menos de 10% da popu-
lação sabia ler. Além disso, o acesso a livros
era bem limitado, já que todos os materiais
eram produzidos à mão, o que tornava um livro um item de
luxo. Com a inovação da prensa de Gutenberg, o preço de
livros e de outros materiais impressos caiu rapidamente. O
conhecimento foi disseminado como nunca. Contudo, mesmo
após mais de 500 anos, uma grande parte da população sabe
ler letras e palavras, mas não sabe interpretar adequadamente
as informações contidas no texto.
O que isso tem a ver com medicina? Tudo. Se formos
avaliar como era a disseminação de informação médica até
poucas décadas atrás, a dificuldade para se ter acesso a um
artigo médico era enorme. Lembro que, nas décadas de 90 e
mesmo de 2000, vi meus pais pedindo artigos médicos em
inglês por meio de cartas que demoravam semanas para

11
chegar ao destinatário. Muitas vezes, transcorriam meses
entre o pedido inicial do artigo e a pessoa de fato estar com
o material em mãos para leitura.
Com a evolução da internet e das redes sociais, o que
vemos, atualmente, é exatamente o contrário. Uma avalan-
che de artigos científicos inunda os grupos de aplicativos,
e-mails e feeds. Contudo, a facilidade de acesso a artigos
não eliminou um problema importante: a maioria dos pro-
fissionais de saúde simplesmente não recebeu o treinamento
para interpretar um artigo científico da forma adequada. De
pouco adianta a pessoa ler abstract, introdução, materiais e
métodos e outras sessões de um artigo se, ao final da leitura,
ela não consegue avaliar aquela informação de forma crítica
e embasada. Como a maioria dos profissionais de saúde
carecem dessa formação, terminam se tornando dependentes
de terceiros para saber se aquele determinado artigo tem
potencial de mudar a prática clínica de fato.
Como mudar isso? A educação é o caminho. Nos
últimos anos, temos visto várias fontes digitais e analógi-
cas surgindo para facilitar o ensino da tão falada medicina
baseada em evidências, fontes como o atual livro, que almeja
traduzir, de forma didática, informações que muitos podem
considerar pouco convidativas, como conceitos estatísticos.
Parabenizo os autores (acadêmicos de medicina e professores
da Universidade Federal do Rio Grande do Norte – UFRN)
pela iniciativa e espero que o livro ajude os estudantes e
profissionais de saúde na jornada de interpretação de estudos
científicos.

12
APRESENTAÇÃO

E
ste manual foi construído com o propósito de
ser um meio de consulta prática para sistema-
tizar a leitura de artigos científicos, compreen-
dendo suas divisões e orientando a retirada de informações
essenciais. Ao mesmo tempo, objetiva proporcionar um
maior aprendizado e reflexão sobre a ciência envolvida nos
artigos científicos e sua importância no meio acadêmico e
profissional.
Sobre o grupo idealizador do livro:
O Programa de Educação Tutorial do curso de Medicina
da Universidade Federal do Rio Grande do Norte (UFRN),
Campus Natal – PET Medicina UFRN – é um grupo formado
por estudantes de medicina orientados por uma docente,
médica. O grupo promove diversas atividades de ensino,
pesquisa e extensão universitária com o intuito de atuar como
um agente ativo no processo de formação acadêmica dos
estudantes da graduação e de promover atividades educativas
para a população em geral. Mais informações sobre o PET
Medicina UFRN podem ser acessadas pelo site petmedufrn.
webnode.com.

13
Todos os exemplos e números apresentados neste
manual são fictícios ou meramente ilustrativos, sem apre-
sentar qualquer relevância científica; todos os gráficos e
tabelas são criações autorais dos autores deste manual.

14
MÓDULO 1
FUNDAMENTOS DO
PENSAMENTO
CIENTÍFICO

1 Henrique de Paula Bedaque


Maria Paula Ribeiro Dantas Bezerra

UM COMEÇO

N
ão objetivamos entrar no mérito da história do
pensamento científico, discutir como filósofos
saíram das crendices e das mitologias e cons-
truíram uma metodologia para a criação de conhecimento
de forma sistemática. Vamos ser práticos! Da mesma forma
que um texto jurídico tem uma linguagem apropriada para
pessoas da área do direito e que um prontuário médico só
será completamente entendido por profissionais da saúde,
um artigo científico é um texto escrito de cientistas para
cientistas.
Assim, se queremos entender a linguagem do artigo
que estamos lendo temos que, de certa forma, virar cientistas

17
e pensar como eles. É exatamente por isso que esse capí-
tulo se tornará tão importante: ao fim dele você será capaz
de entender por que somos céticos, por que falamos tanto
na hipótese NULA quando aquela que “muda vidas” é a
alternativa.
Vamos lá.

POR QUE UM CIENTISTA É CÉTICO?

Acreditamos que a melhor forma de entender a impor-


tância do ceticismo, da dúvida para um pensamento científico
é por meio de alguns exemplos:
Imagine um homem das cavernas que encontrou o fogo pela
primeira vez, ele irá se perguntar: É melhor ficar onde estou?
Ou ficar perto do fogo? Se ele for pessimista vai preferir ficar
onde ele está e nunca saberá os benefícios que o fogo poderá
trazer a sua vida. Se ele for otimista e correr para cima do fogo
poderá se queimar e irá entender que fogo “sempre” é perigoso,
fugindo dele e, novamente, nunca saberá os benefícios que o
fogo poderia trazer a sua vida.
Por outro lado, se ele for cético ele irá pensar:
Opção 1: Posso morrer.
Opção 0: Não irei morrer.
Assim, o cético pensa: Se eu posso morrer, como
posso descobrir o que é essa entidade (o fogo) sem
que eu corra risco sobra a minha vida?
Me aproximando lentamente.

18 DESCOMPLICANDO MBE
Ao se aproximar cada vez de forma mais lenta o cético percebe
que quanto mais próximo, mais quente fica a sua mão.
Vocês notaram o que essa história nos pode mostrar?
Ser cético não significa deixar de aproveitar, descobrir ou
inventar. Significa que iremos “descobrir” algo da maneira
mais segura e confiável possível. Indo adiante, um cientista
vai além de apenas descobrir, ele quer aplicar o seu conhe-
cimento. Vamos continuar a história:
O homem da caverna pensa: Se minha mão ficou bem quente
quando estive perto do fogo, será que a mesma coisa ocorre
quando coloco um pedaço de animal?
Opção 1: O pedaço ficará quente.
Opção 0: Nada irá ocorrer.
Diante dessa dúvida, o cético coloca um pequeno
pedaço de carne próxima ao fogo e espera. Após
alguns minutos ele percebe que o pedaço de carne
também estava quente.
• Em primeiro lugar, por que o homem não colocou
toda a sua carne próxima ao fogo? Pois um cientista
é cético! Ele não aposta todas as suas cartas de uma
só vez. Um cientista está preparado para o fracasso,
para hipótese nula, está preparado para recomeçar.
• O segundo ponto é, por que ele teve dúvida se a carne
também ficaria quente? Por que ciência não é intuição,
não é suposição. Ciência é ser cético, é ter dúvida e só
acreditar na hipótese alternativa após ela ser testada.
Ser cético é ter dúvidas que podem ser testadas, mas
ao testá-las, não iremos acreditar na ideia (hipótese nova ou

Fundamentos do pensamento 19
alternativa) iremos sempre tentar refutar o que é a verdade
atual. Como assim?
Imagine que vivemos num mundo branco e preto (tudo só
pode ter essas cores). Um cético olha uma parede (que é
branca) e pergunta: Qual a cor dessa parede?
Ele olha para a roupa dele, que é sabidamente preta, e compara
com a parede. Assim, constrói duas hipóteses:
Essa cor não é preta (H0).
Essa cor é preta (H1).
Ao comparar com a parede ele percebe que a cor não é parecida
com a de sua roupa, logo e conclui:
Essa cor não é preta (H0).
Por fim, como o mundo que ele vive só tem duas cores ele
conclui: Se tudo que não é preto tem que ser branco, a cor
dessa parede é branca.
Algumas dúvidas podem ficar. Afinal por que o H0 é
“essa cor não é preta” e o H1 é “essa cor é preta”? Isso ocorre
pois o cético só tem uma roupa preta como instrumento
de comparação! Entenda: esse instrumento é como uma
ferramenta de pesquisa, análise estatística, limitações de
medição! Se ele só consegue comparar com o preto só há
uma pergunta que ele pode fazer:
A cor dessa parede é preta?
Diante dessa pergunta, fica mais fácil notar quais as
possibilidades de hipóteses:
H1: A hipótese de ter a cor da possível comparação
(preto).

20 DESCOMPLICANDO MBE
H0: A hipótese nula seria a nulidade da H1! Mostrando
que a H1 está errada.
Além disso, é importante que você note que em nenhum
momento o cético acreditou que a parede era preta. O que
ocorreu é que como o instrumento de medição/comparação
dele era o preto, não lhe restou outra opção a usar o preto
como comparador para caracterizar a cor da parede!
Vamos longe! Ao testar uma droga nova, devemos
comparar seu uso, preferencialmente ao uso de placebo. Isso
não quer dizer que acreditamos no placebo – ou na droga
nova. Quer dizer que, para saber se a ela funciona, eu preciso
de um instrumento de avaliação – e comparação – do qual
eu disponha no momento!
O que fica após essa conversa franca: O pensamento
científico não toma partido, não pressupoe resultados. Ele
cria mecanismos, dentro de sua limitação, para afastar ou
não a hipótese nula!

COMO ENTENDER O “P” NO


PENSAMENTO CIENTÍFICO

Umas das grandes vantagens de entender o básico do


pensamento científico se revela na melhor interpretação do
conceito do famoso “p” em estatística. De forma simplista o
“p” seria a probabilidade da hipótese nula (H0) ser a verdade!
Pronto! Acabou.
Vamos aprofundar um pouco com um exemplo:
Imagine que fizemos um estudo de Coorte comparando o
hábito de comer laranja e sua associação com câncer de

Fundamentos do pensamento 21
pulmão, o hábito de de fumar e sua associação com câncer
de pulmão.
Vamos fazer a primeira pergunta: Comer laranja está asso-
ciado com câncer de pulmão?
H0: Não está associado.
H1: Está associado.
O resultado estatístico dá: p=0.60. O que isso significa? Que
há 60% de chance da hipótese H0 ser a verdade! Isso mesmo,
sempre que falamos o valor p é com referência a hipótese H0
(que é responsável pelo acaso, pela NÃO associação nesse
caso).
Vamos lá, você certamente concorda que se em 60%
dos casos comer laranja não está associado com câncer de
pulmão é muito mais provável que comer laranja realmente
não esteja associado. Lembrando que se estivermos buscando
uma relação de causa e efeito temos que avaliar outros pontos
além da relação estatística (para entender melhor os conceitos
de causa e efeito, consulte nosso capítulo de causalidade).
Então fica a dúvida: A partir de qual probabilidade de
a H0 ser verdade eu começo a acreditar que a verdade é a H1?
É agora que nasce o número 5% (o famoso p<0,05 visto
nos artigos). Saiba que esse número foi escolhido de forma
arbitrária, em uma convenção. Convencionou-se que se hou-
vesse menos de 5% de chance da hipótese nula ser correta,
a rejeitaríamos e aceitaríamos a hipótese alternativa como
verdadeira. Vamos ver o próximo exemplo para entender
melhor:

22 DESCOMPLICANDO MBE
Fizemos um estudo de Coorte comparando comer laranja
e sua associação com câncer de pulmão e de fumar e sua
associação com câncer de pulmão.
Vamos fazer a segunda pergunta: fumar está associado com
câncer de pulmão?
H0: Não está associado.
H1: Está associado.
O resultado estatístico dá: p=0.01. O que isso significa? Que
há 1% de chance da hipótese H0 ser a verdade! Isso mesmo,
sempre que falamos o valor p é com referência a hipótese
H0 (que é responsável pelo acaso, pela NÃO associação
nesse caso).
Vamos lá, se só em 1% dos casos a H0 se torna ver-
dade, é muito mais provável que a hipótese verdadeira seja
a H1 (onde há associação entre fumar e câncer de pulmão).
Seguindo a convenção do p<0,05 estaríamos procurando
uma probabilidade de H0 menor que 5%. Como 1% (achado
da pesquisa) é menor que 5% temos que, por convenção, a
hipótese escolhida é a H1!
Gostaria de reforçar! O p valor é uma probabilidade da
H0 (hipótese nula) ser a verdade. Lembra da parede não ser
preta? Então, quando temos que o p=0.01 (ou 1% de chance
de H0) refutamos a hipótese H0, logo, só sobra a hipótese H1!
Novamente, o cientista não fez a pesquisa pensando na
hipótese alternativa, pois ele é cético! O cético tenta sempre
descartar a hipótese NULA! Refutando a nula é que podemos
chegar na alternativa.

Fundamentos do pensamento 23
A partir de agora certamente você irá ver cada p de
uma forma diferente!

CABEÇA PENSANTE

Logo, partindo da premissa de que a H0 é a VERDADE qual seria


a probabilidade desse resultado H0 ocorrer no estudo? Isso é
o p valor.

Por fim, é importante ressaltar que este capítulo tem


um intuito de iniciar sua compreensão sobre pensamento
científico. Existem vários detalhes que vão sendo conquis-
tados ao longo da prática da leitura de MBE, por exemplo,
devemos ter em mente que um p<0.001 não obrigatoriamente
significa que a associação é mais forte que um p=0,01 (essa
interpretação não está correta!), para isso devemos avaliar
outros pontos.
Além disso, é bom relembrar que a escolha do p de 0,05
como ponto de corte foi uma ato arbitrário! E exatamente por
isso que na atualidade vem ganhando cada vez mais força
o uso do intervalo de confiança (ver capítulo de estatística)
como melhor ferramenta de comparação e análise estatística.

CONCLUSÃO

O presente capítulo trouxe um pouco do pensamento


científico para o leitor, que agora entende que ser cético
significa descartar a hipótese nula com as ferramentas dis-
poníveis e só depois analisar um possível efeito da hipótese
alternativa! No final, entendemos que o p é um valor que tenta
quantificar a probabilidade da hipótese H0 ser verdade. Isso

24 DESCOMPLICANDO MBE
é importante pois o cético questiona a nulidade, questiona
o acaso. Caso ele refute a nulidade é que ele poderá chegar
na possibilidade da H1 ser a verdade!

REFERÊNCIAS BIBLIOGRÁFICAS

ANDRADE, Maria Margarida. Como preparar trabalhos para cursos


de pósgraduação: noções práticas. 5. ed. São Paulo, SP: Atlas. 2002. •
LAKATOS, Eva Maria. Fundamentos de Metodologia Científica. 5 ed.
São Paulo, SP: Atlas. 2003.

SEVERINO, Antônio Joaquim. Metodologia do trabalho científico. 21


ed. São Paulo, SP: Cortez. 2000.

Fonseca Marina Assis, Oliveira Bernardo Jefferson de. Variações


sobre a “cultura científica” em quatro autores brasileiros. Hist. cienc.
saude-Manguinhos [Internet]. 2015 June [cited 2020 May 09] ; 22( 2
): 445-460. Available from: http://www.scielo.br/scielo.php?script=sci_
arttext&pid=S0104-59702015000200009&lng=en. Epub Mar 27, 2015.
https://doi.org/10.1590/S0104-59702015005000011.

Ferreira Juliana Carvalho, Patino Cecilia Maria. What does the p


value really mean?. J. bras. pneumol. [Internet]. 2015 Oct [cited 2020
May 09] ; 41( 5 ): 485-485. Available from: http://www.scielo.br/scielo.
php?script=sci_arttext&pid=S1806-37132015000500485&lng=en. http://
dx.doi.org/10.1590/S1806-37132015000000215

Fundamentos do pensamento 25
PERGUNTAS
CLÍNICAS

2 Augusto de Galvão e Brito Medeiros


Ferdinand Saraiva Maia
Frederico Batah El-Feghaly
Luis Henrique Silveira Rocha Barbosa

CONCEITUAÇÃOԝ

N
a prática clínica, o constante contato do médico
com os pacientes e suas diversas apresenta-
ções leva à formulação de questionamentos
relativos a quais decisões clínicas devem ser tomadas: as
Perguntas Clínicas.
Durante o processo de assistência e diante do apa-
recimento de problemas, torna-se frequente o surgimento
de perguntas e inquietações científicas. Para termos uma
ideia, o médico, em seu atendimento cotidiano a pacientes,
formula, aproximadamente, uma nova pergunta clínica a
cada 02 pacientes que atende (0,57 por paciente, mais pre-
cisamente). Quando há o empenho em se buscar a resposta

27
para essas perguntas, em torno de 80% das vezes a resposta é
obtida na literatura médica. Isso se torna fundamentalmente
importante, pois esse procedimento é essencial na definição
de intervenções e na melhoria do cuidado.
Mas que tipo de perguntas são essas? Ao se deparar
com um Problema de Caso, algumas delas são instantâneas
no raciocínio:
• “De que forma consigo fazer o diagnóstico para essa
provável doença?”
• “Como se dá a evolução natural desta patologia?”
• “Qual intervenção terapêutica deve ser minha escolha
nesse caso?”
• “Minha intervenção pode trazer malefícios?”
A partir disso, essas perguntas foram sistematizadas
em categorias que explicitam o seu principal objetivo de
pesquisa.
Figura 1 – Perguntas Clínicas

28 DESCOMPLICANDO MBE
A busca de suas respostas envolve a literatura médica
clássica e as novas evidências científicas. Enquanto o livro-
-texto é capaz de ofertar a descrição panorâmica de uma
determinada condição, a Formulação de uma Pergunta
Clínica parte de um ponto específico e tem como objetivo
tentar elucidar um determinado aspecto da mesma condição.
Ou seja, são formas distintas de se promover a obtenção de
conhecimento, mas certamente complementares.
Entretanto, a busca de uma resposta enfrenta algumas
barreiras: o tempo necessário para a formulação e a obtenção
de fontes de conhecimento; a abundância das informações; a
complexidade do caso clínico; a dificuldade operacional na
formulação de uma pergunta funcional. O esforço individual
e o interesse médico se mostram essenciais na aplicação
dessa metodologia.
Portanto, o processo de suscitar raciocínios, formu-
lar Perguntas Clínicas e buscar suas respostas, em bases
científicas, demanda esforço profissional e reflete uma
habilidade necessária para a prática médica baseada em
evidências: uma competência fundamental para exercer a
medicina e se manter atualizado. O aprendizado extraído a
partir dessas perguntas é continuamente construído através
da busca científica atualizada e direcionado para o que se
pretende aprender. Possibilita-se, a partir disso, a obtenção
de informações científicas essenciais à assistência médica e
à construção de um aprendizado constante.

Perguntas Clínicas 29
TIPOS DE PERGUNTAS CLÍNICAS E OS
RESPECTIVOS DESENHOS DE ESTUDOԝ

P E RGU N TA D I AG N ÓS T I C A

A pergunta clínica direcionada ao diagnóstico tem


como base primordial o seguinte questionamento: “Qual
a forma mais acurada de identificar o problema de um
paciente?”. Um estudo diagnóstico deve incluir pacientes
com suspeita clínica de determinada condição, submetidos
a um teste índice (o método que está sendo estudado) e a
um método referência de maior acurácia (um outro teste
já empregado ou o seguimento clínico de longo prazo). O
método referência, que deve ser amplamente aceito no meio
clínico, indicará quais indivíduos de fato têm a doença e irá
funcionar como o “padrão-ouro”.
De maneira mais sintética: o objetivo dos estudos de
acurácia é identificar se aquele teste diagnóstico é bom o
suficiente para ajudar o médico a identificar o diagnóstico
daquele paciente.
Diante da situação supracitada, habitualmente o Estudo
de Acurácia (um tipo de Estudo Transversal) é o mais uti-
lizado nesse caso.

P E RGU N TA PRO G N ÓS T IC A

Estabelecer um prognóstico consiste em prever a


ocorrência de um desfecho no futuro – analisar a probabi-
lidade de um paciente saudável adoecer ou de um paciente
doente apresentar uma complicação, por exemplo. Diante

30 DESCOMPLICANDO MBE
dessa perspectiva, é necessário avaliar: amostra de pacientes
de uma população de interesse com e sem uma exposição
específica, que estejam em estágios comuns da doença (de
preferência no início da evolução); seguimento por um perí-
odo de tempo adequado. Portanto, estudos que respondem a
perguntas prognósticas necessariamente devem ter desenho
longitudinal.
Dessa forma, o Estudo de Coorte – idealmente con-
duzido de forma prospectiva – se apresenta como o melhor
desenho de estudo (no aspecto de maior precisão e menor
ocorrência de erros sistemáticos) para chegar a resultados
específicos e mais rigorosos. Em situações de doenças ou
exposições raras, o desenho de caso-controle pode ser uti-
lizado, com limitações inerentes. Estudos seccionais não
estabelecem relação temporal e podem no máximo ser uti-
lizados para levantar hipóteses que serão investigadas em
estudos longitudinais.

P E RGU N TA T E R A P ÊU T IC A

Para formular esse tipo de pergunta clínica, faz-se


necessário estruturá-la em partes, a fim de englobar todos
os fatores relacionados ao tratamento. Partindo desse racio-
cínio, vale salientar os seguintes pontos: qual a população
de interesse; qual a intervenção a ser implementada (grupo
intervenção); qual será o grupo com o qual a intervenção será
comparada (grupo controle, por exemplo, placebo ou outro
tratamento previamente estabelecido); e qual desfecho será
utilizado para avaliar a eficácia do tratamento.
Ademais, para minimizar o risco de viés, são impor-
tantes: randomização (para manter as características dos

Perguntas Clínicas 31
grupos equilibradas); seguimento adequado (para diminuir
o risco de perda seletiva de pacientes que tiveram desfechos
negativos); cegamento (se possível) dos pacientes e dos pes-
quisadores (estudo duplo-cego), para diminuir o efeito das
expectativas em relação ao tratamento sobre o desfecho
estudado; e representação de todos os dados obtidos.
Baseando-se no que foi exposto, o desenho de estudo
ideal para que possamos responder de maneira fidedigna
essa pergunta clínica é o Ensaio Clínico Randomizado
(“Randomized Clinical Trial”, RCT) – que contempla as carac-
terísticas descritas acima.

P E RGU N TA DE DA N O

No âmbito clínico de formulação de um estudo para


pesquisa do “dano” (ou etiologia), o direcionamento con-
siste em uma análise dos eventos adversos relacionados
com uma intervenção ou exposição específica (por exemplo,
relação entre o tabagismo crônico e o câncer de pulmão).
Para alcançar precisão na resposta a essa pergunta clínica, é
válido comparar determinadas exposições de um grupo de
pacientes doentes com um outro grupo no qual a doença não
está presente, além de ajustar estatisticamente os resultados
obtidos, por exemplo, às variáveis de confusão.
Diante do exposto, convém apresentar que o Caso-
Controle, o Ensaio Clínico Controlado e o Estudo de Coorte
são desenhos de estudos adequados para a pergunta clí-
nica direcionada ao dano/etiologia. Tal qual nas pergun-
tas sobre terapêutica, aqui o desenho ideal também será
o Ensaio Clínico Randomizado. No entanto, os Ensaios
Clínicos Randomizados têm número de pacientes e tempo

32 DESCOMPLICANDO MBE
de seguimento limitados, e eventos adversos clinicamente
relevantes, mas pouco frequentes, podem não ser visíveis.
Dessa forma, estudos observacionais, sobretudo de base
populacional, podem – pela viabilidade de abranger um
maior número de participantes – identificar danos que não
conseguimos identificar com precisão nos ensaios clínicos.

ESTRATÉGIA PICOԝ

A prática médica baseada em evidências exige que


os médicos sejam capazes de elaborar Perguntas Clínicas
de forma eficiente, em busca de respostas para a tomada
de decisões. Para isso, estratégias podem ser usadas com
o objetivo de transformar questionamentos cotidianos dos
profissionais em perguntas clínicas objetivas. Entre tais
métodos, o acrônimo PICO (em inglês) é um modelo larga-
mente difundido na literatura. Tal modelo corresponde a uma
maneira de elaborar perguntas em que variáveis essenciais
à busca de suas respostas são identificadas. As variáveis
de uma pergunta devem ser suscitadas para os seguintes
aspectos (não necessariamente todos serão contemplados):
P - Population/Problem (População/Problema)
I - Intervention (Intervenção)
C - Comparison (Comparação)
O - Outcome (Desfecho)
Uma vez identificada a pergunta clínica, o médico é
capaz de conduzir uma investigação eficiente na busca de
evidências, seja consultando bases de dados (ex. PUBMED,
CENTRAL, SCIELO), seja elaborando e conduzindo estudos

Perguntas Clínicas 33
científicos - quando os questionamentos ainda não houverem
sido respondidos.
Como exemplo do uso rotineiro dessa estratégia,
temos a seguinte situação: na consulta de um paciente com
doença coronariana, o médico responsável questiona-se o
quanto a sinvastatina beneficia um coronariopata em reduzir
sua chance de vir a óbito. Com essa indagação, ao utilizar
o acrônimo PICO, o profissional é estimulado a elaborar
uma pergunta clínica mais objetiva, capaz de identificar os
seguintes fatores:
P - Doença arterial coronariana (População/Problema)
I - Sinvastatina (Intervenção)
C - Placebo (Comparação)
O - Mortalidade (Desfecho)
Nessa etapa, o profissional é levado a uma pergunta
terapêutica mais eficiente, apresentada de forma mais clara:
o uso de sinvastatina na doença arterial coronariana reduz
mortalidade comparado a placebo? Com os componentes
identificados, o médico, então, torna-se capaz de buscar
trabalhos científicos que contenham, nesse caso, as pala-
vras-chave (ou MeSH: Medical Subject Headings) e sinônimos
de “doença arterial coronariana”, “sinvastatina”, “placebo”
e “mortalidade” nos mecanismos de busca das bases de
artigos científicos.
Tratando-se de uma pergunta sobre os efeitos de uma
intervenção, os estudos, cujos desenhos melhor respondem
o exemplo citado, são os ensaios clínicos randomizados (ou
ainda os estudos que compilam o resultado dos ensaios, como

34 DESCOMPLICANDO MBE
as metanálises). Nesse caso específico da sinvastatina, um
importante ensaio clínico encontrado é o 4S (the Scandinavian
Simvastatin Survival Study), que investigou os efeitos da sin-
vastatina, comparado a placebo, sobre a mortalidade de 4.444
pacientes, demonstrando uma redução de 30% de óbitos.
Outras informações também podem ser muito rele-
vantes na construção de uma pergunta para pesquisa nas
bases de dados, como, o tempo de seguimento (de curto ou
longo prazo), o cenário (por exemplo, na atenção primária
ou no hospital ou em instituições de longa permanência)
e o tipo de estudo (ensaio clínico randomizado ou coorte
ou caso-controle, por exemplo, de acordo com o tipo de
pergunta). Em algumas situações, pode ser desejável guiar
sua estratégia de busca pelo acrônimo PICO-TS, em que T
representa o tempo de seguimento (timing) e S o cenário
(setting). Também pode ser válido determinar já na estraté-
gia de busca os tipos de estudos a serem pesquisados, por
exemplo, buscar apenas ensaios clínicos randomizados para
uma questão de terapia.
Em outras situações, também pode ser desejável omitir
algum dos itens do acrônimo na busca em bases de dados. Ao
realizar uma metanálise sobre alguma terapia, por exemplo,
pode ser interessante não incluir o desfecho na sintaxe de
busca, pois desfechos relevantes para a sua pesquisa podem
não ser relatados como primários (e, portanto, não farão parte
dos descritores), mas podem estar relatados no corpo do texto
ou nos anexos e serem “encontrados” após a análise detalhada
dos artigos (“busca de alta sensibilidade”). Da mesma forma,
pode não ser interessante definir um comparador especí-
fico se o objetivo é avaliar como a intervenção estudada se

Perguntas Clínicas 35
relaciona com vários outros tratamentos. O acrônimo PICO
é uma estratégia para facilitar a construção da pergunta e
a pesquisa na base de dados, mas deve ser utilizado com
adaptações para facilitar que se alcance o objetivo e não de
forma excessivamente rígida.
No quadro abaixo, são apresentados exemplos de como
diferentes tipos de pergunta, através do acrônimo PICO,
podem identificar variáveis e estudos que trazem respostas
úteis à prática clínica do profissional de saúde:

Quadro 1 – PICO: estratégia de elaboração de perguntas

TIPO DE ESTUDO
QUESTIONAMENTO PICO
PERGUNTA IDENTIFICADO

P - População Role of alcohol


(population) and tobacco in
I -ԝ Tabagismo the aetiolog y
T a b a g i s m o
(tobacco) of head and
aumenta a incidên-
Dano C - Não fuman- n e ck ca n ce r:
cia de câncer oral na
tes a case-control
população geral?
(non-smoker) study in the
O - Câncer oral Doubs region of
(oral cancer) France

Diagnostic accu-
racy of C-reac-
tive protein and
P - Pneumonia
p r o cal cit o n i n
(pneumonia)
in suspected
I - Procalcito-
A procalcitonina é communi-
nina
um exame acurado Diag- ty-acquired
(procalcitonin)
para o diagnóstico nóstica pneumonia
C - TC de tórax
de pneumonia? adults visiting
(CT scan)
emergency
O - Acurácia
department and
(accuracy)
having a system-
atic thoracic CT
scan

36 DESCOMPLICANDO MBE
P - Diabetes
mellitus tipo 2
(diabetes)
No DM2, qual o I - Empagliflo-
Empagliflozin,
efeito da empagli- zina
Cardiovascular
flozina em relação Terapêu- (empagliflo-
Outcomes, and
ao placebo na tica zin)
Mortality in Type
redução de morta- C - Placebo
2 Diabetes
lidade? (placebo)
O - Mor tali-
dade
(mortality)

P - Médicos
(physician)
Comparison of
I - Fatores de
Cardiovascu-
risco
lar Risk Factors
Quais fatores de (risk factor)
and Outcomes
risco aumentam a C - Popula-
A m o n g
morte cardiovas- Prog- ção geral
Practicing
cular de médicos nóstica (general
Physicians vs
comparado à population)
the General
população geral?ԝ O - Mor te
Population in
cardiovascu-
Ontario, Can-
lar
ada
(cardiovas-
cular death)

CONCLUSÃOԝ

Perguntas Clínicas são oportunidades para aprendizado


adequado e melhoria da prática médica. A busca de respostas
às perguntas levantadas permite identificar evidências de
alta qualidade – ou a sua ausência, e, consequentemente, a
necessidade de conduzir pesquisa clínica para encontrar
a resposta – no contexto da tomada de decisões durante a
assistência aos pacientes. Dentre as barreiras para a adoção
desse hábito por profissionais de saúde, o tempo corresponde
ao principal fator limitante, embora diversos mecanismos

Perguntas Clínicas 37
tecnológicos venham adaptando-se em prol de uma pesquisa
mais rápida e precisa.
Durante o processo de elaboração de Perguntas
Clínicas, a natureza dos questionamentos direciona os
profissionais ao tipo de estudo que melhor atende às suas
demandas. Nesse sentido, tais perguntas são agrupadas em
quatro grande categorias (dano, diagnóstico, terapêutica e
prognóstico), de modo que cada categoria suscita determi-
nado(s) desenho(s) de estudo mais adequado(s).
Por fim, a elaboração de Perguntas Clínicas, particular-
mente de questões que envolvem pacientes ou situações com-
plexas, pode ser facilitada através de modelos de elaboração. O
acrônimo PICO (population/problem, intervention, comparison,
outcome) é uma estratégia simples para visualizar questões
e identificar palavras-chave para a navegação em bases de
dados, otimizando a busca por evidências da literatura.

REFERÊNCIAS BIBLIOGRÁFICAS

Del Fiol, G.; Workman, E.; Gorman, P. N. Clinical Questions Raised


by Clinicians at the Point of Care. Jama Internal Medicine, 2014.
JAMA.

Cook, D. A.; Sorensen, K. J.; Wilkinson, J. M.; Berger, M. A. Barriers


and Decisions When Answering Clinical Questions at the Point of
Care. Jama Internal Medicine, 2013. JAMA.

Rodrigues, DS; Viegas Dias, C.; Heleno B. Como responder a dúvidas


clínicas. Revista Portuguesa de Medicina Geral e Familiar, vol.35,
no.2, Lisboa, abr. 2019. SciELO.

38 DESCOMPLICANDO MBE
John Geddes, MD. Asking structured and focused clinical questions:
essential first step of evidence-based practice. Evidence-Based
Mental Health, maio 1999. EBMH.

Randomised trial of cholesterol lowering in 4444 patients with


coronary heart disease: the Scandinavian Simvastatin Survival
Study (4S). Lancet. 1994;344(8934):1383-1389.

Andre. K; Schraub, S; Mercier, M; Bontemps, P. Role of alcohol and


tobacco in the aetiology of head and neck cancer: a case-control
study in the Doubs region of France. Eur J Cancer B Oral Oncol. 1995
Sep;31B(5):301-9. doi: 10.1016/0964-1955(95)00041-0.

Le Bel, J; Hausfater, P; Chenevier-Gobeaux, C; Blanc, FX; Benjoar, M;


Ficko, C; Ray, P; Choquet, C; Duval, X; Claessens, YE; ESCAPED study
group. Diagnostic accuracy of C-reactive protein and procalcitonin
in suspected community-acquired pneumonia adults visiting
emergency department and having a systematic thoracic CT scan.
Crit Care. 2015 Oct 16;19:366. doi: 10.1186/s13054-015-1083-6.

Zinman B, Wanner C, Lachin JM, et al. Empagliflozin,


Cardiovascular Outcomes, and Mortality in Type 2 Diabetes. N
Engl J Med. 2015;373(22):2117-2128. doi:10.1056/NEJMoa1504720

Ko DT, Chu A, Austin PC, et al. Comparison of Cardiovascular


Risk Factors and Outcomes Among Practicing Physicians
vs the General Population in Ontario, Canada. JAMA Netw
Open. 2019;2(11):e1915983. Published 2019 Nov 1. doi:10.1001/
jamanetworkopen.2019.15983

Perguntas Clínicas 39
MÓDULO 2
ESTUDOS
EPIDEMIOLÓGICOS –
CONCEITOS GERAIS

3 Adrian Lucca Guimarães Caldeira


Dyego Leandro Bezerra de Souza
Henrique de Paula Bedaque
Thomas Diniz Papa

F
alar sobre Medicina Baseada em Evidências
envolve muito mais do que o conhecimento clí-
nico de um profissional da saúde: a medicina
contemporânea tende a se apoiar, em grande parte, sobre
estudos epidemiológicos. Isso ocorre por que a Epidemiologia
serve de base para a interpretação de pesquisas e, conse-
quentemente, é a base da MBE. Trocando em miúdos, estudos
atualizados contribuem ativamente com o entendimento do
processo saúde-doença.
A Epidemiologia é o ramo das ciências da saúde que
estuda a ocorrência, a distribuição e os fatores determinantes
dos eventos relacionados com a saúde em uma população,
segundo Medronho. A partir de um conceito tão amplo, é
necessário entender que até o adoecimento, ou a perda do
bem-estar pleno (como a Organização

43
ESTUDOS EPIDEMIOLÓGICOS
– CONCEITOS GERAIS

Mundial da Saúde (OMS) prefere entender o conceito


de saúde) há um processo que aqui chamaremos processo
saúde-doença. As enfermidades cursam uma história natural,
desde os fatores que as predispõem ou causam até o seu
estabelecimento completo no organismo. Como ilustrado na
figura 1, esse curso natural é determinado por uma suscep-
tibilidade, determinada por fatores ambientais, mas também
por fatores inerentes ao organismo do indivíduo, e passa
por um período em que a patologia está instalada e o corpo
sofre injúrias, e depois por um desfecho, sendo infinitas as
possibilidades para essa última fase.

Figura 1 – Processo saúde-doença

44 DESCOMPLICANDO MBE
A fim de esquematizar e melhor compreender o que
acontece no decorrer do processo saúde-doença, foram desen-
volvidos diversos tipos e desenhos de estudo epidemiológico,
cada qual com sua finalidade particular, com peculiaridades
que permitem melhor compreensão de algum aspecto ou
de alguma população e com objetivos distintos. Usar um
estudo apropriadamente é um dos requisitos básicos para
alcançar um bom nível de “acurácia” na hora de apresentar
um estudo, ou seja, a pergunta do estudo e a hipótese que ele
se propõe a esmiuçar são determinantes para o seu desenho.
De maneira geral, os estudos são descritivos, quando
se destinam a descrever o que acontece a uma determinada
população para que o processo saúde-doença se estabeleça,
ou analíticos, quando além da descrição é estabelecida uma
análise do processo naquele determinado momento e feitas
associações entre a susceptibilidade e uma condição de saúde.
Os estudos de desenho descritivo são determinantes
para analisar a distribuição de alguma enfermidade ou deter-
minar o que leva àquela enfermidade naquela situação e a
criar uma hipótese acerca disso, considerando variáveis e
dados pré-existentes (em bancos de dados) ou novos, ou seja,
podem evidenciar os fatores que influenciam a incidência e
a prevalência daquela patologia.
Já os analíticos são estudos que compreendem um
maior aprofundamento na questão em estudo, visto que
correlações entre variáveis devem ser estabelecidas. Por
conceito, os tipos de estudo se complementam. Os quatro
tipos principais de estudos analíticos, como veremos a seguir,
são o seccional, o ecológico, o caso-controle e o coorte. Neste
capítulo, abordaremos conceitos gerais dos principais tipos
de estudos epidemiológicos. Uma classificação rápida ajudará

Estudos epidemiológicos – conceitos gerais 45


na compreensão de informações básicas sobre o desenho a
ser estudado. Como pode ser visto na figura 2, os estudos
podem ser classificados de algumas formas, dentre elas de
acordo com a população estudada, em individuado (cada
indivíduo é importante como objeto de estudo) ou agregado
(grupos inteiros são analisados).

Tabela 1 – Classificação dos estudos epidemiológicos

CARÁCTER DE POPULAÇÃO AGREGADO INDIVIDUADO

Papel do pesquisador Observacional De intervenção


Análise temporal Transversal Longitudinal

No individuado, cada voluntário passa pelo exame do


estudo, seja ele um questionário, uma entrevista, ou outro.
Exemplificando, é como se em uma avaliação teórica de uma
disciplina da universidade alguém fizesse a prova sozinho
e sem consulta (individuado), mas outra prova da mesma
disciplina fosse em grupo (agregado): na primeira vai ser
testado o indivíduo, mas na segunda talvez uma pessoa não
saiba tão bem determinada questão, no entanto alguém do
grupo saiba e acabe por conquistar a nota para todos. De acordo
com o papel do pesquisador, ele pode ainda ser observacio-
nal (figura 2), quando o pesquisador apenas analisa o que
acontece, tentando não influenciar em nada o processo, ou
de intervenção, quando o pesquisador intervém a fim de
perceber o que muda no processo após a intervenção.

46 DESCOMPLICANDO MBE
Figura 2 – Estudo Observacional e Estudo de Intervenção

Ou ainda, de acordo com a análise temporal, pode-se


classificar em transversal, quando apenas um “recorte” de
tempo é estudado, ou seja, não há acompanhamento temporal
da população estudada, ou longitudinal, para os estudos
em que a população é analisada diversas vezes no decorrer
de um determinado período, essa análise pode ser feita em
vários momentos do passado (Retrospectivo) ou no futuro
(Prospectivo). Na figura 3 vemos um esquema representativo.

Figura 3 – Estudo transversal (acima)


e longitudinal (abaixo)

Estudos epidemiológicos – conceitos gerais 47


ESTUDOS SECCIONAIS

Conhecidos também como estudos transversais, inqué-


ritos ou estudos de prevalência, os estudos seccionais são
“cortes” transversais do processo saúde-doença em uma
determinada população a partir da análise individuada
do estado de saúde de um determinado número de pessoas.
Prevalência é uma parcela de uma determinada população
que apresenta um agravo a saúde em certo período de tempo.
Como são individuados, cada pessoa terá importância epide-
miológica forte na conclusão, e cada uma deve ser entrevis-
tada ou responder a um questionário, se esse for o método
adotado. Por ser observacional, os pesquisadores devem ser
treinados para evitar influenciar as respostas dos “objetos
de estudo”: até mesmo o tom de voz pode influenciar em
uma resposta a um questionário.
O número de pessoas estudadas deve ser representativo
da população estudada, como em todo estudo epidemiológico,
portanto o conhecimento de bioestatística de pelo menos um
dos membros da equipe de pesquisadores é imprescindível.
Deve ficar claro o fato de que desse tipo de estudo podem
participar tanto pessoas doentes quanto saudáveis, até por
que elas são escolhidas por amostragem.
O objetivo principal desse tipo de estudo é ver como se
distribuem condições de saúde ou doenças em determinada
população, procurando atentar para quais fatores estão asso-
ciados à condição estudada (sexo, idade e etnia, por exemplo). A
partir dessa observação, é possível levantar hipóteses corre-
lacionando fatores inerentes à condição em estudo. Esse tipo
de estudo não permite saber se a doença determinou alguma
condição ou se o contrário aconteceu, até por que apenas uma

48 DESCOMPLICANDO MBE
vez acontece a observação. Para esclarecer em termos mais
práticos, não é possível estabelecer uma relação de causa
e efeito: a partir de um estudo seccional não seria possível
determinar se o tabagismo aumenta as chances de câncer
de pulmão ou se o câncer de pulmão induz ao tabagismo
(um exemplo rude, de fato).
É interessante atentar para a curiosidade de que esses
estudos geralmente acabam por auxiliar bastante a gestão
em saúde, contribuindo para novas medidas e políticas de
educação e prevenção, até por serem de baixo custo quando
comparados a outros.

ESTUDOS ECOLÓGICOS

Esse tipo de estudo lembra o estudo transversal no seu


cerne, mas é possível identificar logo de cara uma grande
diferença: como seu nome sugere, ele serve para analisar
populações ou grupos populacionais bem delimitados como
um todo a partir de áreas também bem estabelecidas. Por
exemplo, pode ser correlacionada uma doença na infância
com o nível de pobreza a que estão submetidas as crianças
do grupo estudado como um todo. As peculiaridades de cada
indivíduo são dispensadas, isto é, os dados analisados serão
os que correspondem àquela população e são expressas em
medidas agregadas que resumem uma condição, como por
exemplo a taxa de incidência ou taxa de mortalidade.
Parece confuso dissociar assim o indivíduo do grupo
em que ele está inserido ou como isso seria possível em um
estudo, mas pensemos juntos: uma criança pode estar em
condição de rua e por isso ter maior predisposição a deter-
minada doença, mas isso não implica dizer que as crianças

Estudos epidemiológicos – conceitos gerais 49


de determinada cidade, como um agregado, corram esses
mesmos riscos, ou seja, os fatores que influenciam as condições
da maioria passam a assumir papel de maior relevância.
A principal peculiaridade desse estudo acabam por
trazer também seu principal problema, o chamado viés
ecológico. Uma associação entre grupos não necessariamente
implica um reflexo fidedigno do que aconteceria individual-
mente, como exemplificado no parágrafo anterior. Ademais,
ele é fortemente apropriado para avaliar como as medidas já
tomadas estão surtindo efeito na população (se os indicadores
populacionais melhoram, o objetivo está sendo cumprido).
De custo também considerado baixo, esse tipo de
estudo pode refletir corretamente uma associação causal ou
não, pois são úteis para gerar hipóteses, e acaba por utilizar
muitos dados de bancos epidemiológicos.

ESTUDOS DE CASO-CONTROLE

O objetivo principal do estudo caso-controle é ana-


lisar como está se desenvolvendo o processo saúde-doença
naquele grupo de pessoas que compartilha uma característica
em comum, chamada fator de risco.
No caso do estudo de caso-controle, são analisados dois
recortes populacionais, um com a doença estudada (grupo
de casos) e outro com pessoas saudáveis, denominado grupo
controle. De caráter retrospectivo, a pesquisa busca mensurar
fatores que podem ter influenciado no desenvolvimento da
doença e também possam estar ou não presentes no grupo
controle, especialmente fatores de risco.

50 DESCOMPLICANDO MBE
Evidentemente mais elaborado que os dois tipos de
estudo apresentados anteriormente, alguns cuidados extras
precisam ter atenção redobrada: a determinação dos grupos
deve ser bem feita, especialmente por causa do grupo de
casos; os indivíduos-controle devem ser adequadamente
definidos para que suas características não destoem muito
das características dos indivíduos-caso; o estudo pode ser
pareado ou não (se for, três variáveis como sexo, idade e
condição socioeconômica, por exemplo, devem ser equiva-
lentes nos dois grupos).
Dentre suas vantagens, esse tipo de estudo permite
resultados rápidos, análise mais acurada acerca dos fatores
de risco para determinada condição patológica e até sobre
etiologia e, mais importante, podem ser acompanhadas doen-
ças raras, visto que os indivíduos já estão doentes e vão ser
comparados com outros que não estão. Aí também jaz uma
das maiores possibilidades de viés desse tipo de estudo: ele
pode ser prejudicado por falhas de memória dos pacientes ou
por erros nos prontuários, já que todos os eventos estudados
já terão acontecido do momento da análise.

ESTUDOS DE COORTE

O estudo de coorte é um estudo que se inicia a partir


da determinação de um grupo com um determinado fator de
risco para uma doença e de outro que não apresenta tal fator.
Daí em diante, eles são acompanhados para que se possa
estudar as diferenças e possíveis semelhanças no seguimento
do processo saúde-doença nessa população, ou seja, é um
tipo de estudo que analisa a incidência das doenças (número
de casos novos de determinado patologia em um período
determinado de tempo). Evidentemente, é muito importante

Estudos epidemiológicos – conceitos gerais 51


para determinar como se dá o processo, e é muito longo,
podendo chegar a décadas de análise; de tempos em tempos
estes mesmos grupos são analisados para que se apure o
que mudou desde a última checagem e se o fator de risco
está determinando algum padrão na população.
O termo coorte vem do latim cohorte, o qual era uti-
lizado para chamar legiões com padrões uniformizados
no antigo Império Romano. A correlação é feita por que
procura-se determinar grupos populacionais homogêneos.
Este estudo é bastante custoso e demanda um grupo
especializado de pesquisadores a fim de realizar entrevistas,
telefonemas e análise de questionários de tempos em tempos.
Apesar de produzir associações das mais variadas e ser
especialmente dinâmico (consequentemente de alto poder
analítico), as perdas de voluntários podem ser um problema
e doenças mais raras não são facilmente estudadas nesse
desenho, já que as pessoas desenvolvem a doença ao longo
de estudo e é impossível determinar se isso ao menos irá
acontecer de fato.

ENSAIOS CLÍNICOS

Os ensaios clínicos são estudo intervencionais que


analisam o indivíduo a partir de uma mudança em seu curso
de vida natural aplicada pelo pesquisador, que pode ser
desde um medicamento até um hábito de vida como correr
rotineiramente. Também são divididos dois ou mais grupos,
sendo um controle e são analisados todos a fim de estabelecer
se aquela intervenção surtiu algum efeito mensurável.
Também prospectivos, os ensaios clínicos enfrentam
dificuldades extras com os aspectos éticos para sua realização.

52 DESCOMPLICANDO MBE
Podem adotar diversas peculiaridades, como serem rando-
mizados ou não, ou ainda cegos ou não, mas constituem a
principal forma de analisar os resultados de uma intervenção,
ao passo em que costumam apresentar interessante validade
externa (capacidade de generalização para outras realidades
e populações). Podem sofrer com desistências (perdas de
seguimento de voluntários) ao longo de seu curso, e são caros.

REVISÃO SISTEMÁTICA

A revisão sistemática é um tipo de estudo que tem o


intuito de ser uma forma de responder a uma pergunta espe-
cífica utilizando a literatura tida como a mais disponível no
momento, que tem maior grau de evidência. Com isso, esses
trabalhos geram novas perguntas e têm grau de evidência
aumentado.
As revisões sistemáticas podem ser feitas com ou sem
metanálise. Para que seja feita assim, no mínimo dois estudos
da revisão devem ter desenhos semelhantes e desfechos que
trilhem os mesmos caminhos.

METANÁLISE

A matanálise é um tipo de análise quantitativa utili-


zado para fortalecer a Medicina Baseada em Evidências com
o objetivo de tentar chegar a uma conclusão única a partir
de vários estudos sobre determinado tema.
Diversos métodos de análise estatística são utilizados
para que seja confirmada ou não a homogeneidade entre
os dados e possa ser mensurado um “indicador de efeito”.
Em termos práticos, uma determinada conduta geralmente

Estudos epidemiológicos – conceitos gerais 53


passa a fazer parte das diretrizes após uma metanálise,
especialmente para o caso de ensaios clínicos.
Vale salientar que nem todos os estudos acerca de uma
determinada doença podem entrar em uma metanálise, pois
a partir de critérios de elegibilidade são escolhidos os que
são considerados ideais para cada objetivo de estudo.

ESTUDOS QUALITATIVOS

Os estudos qualitativos constituem um universo à


parte na Epidemiologia, já que a partir deles as opiniões,
sentimentos e emoções passaram a ser mais valorizadas como
evidência científica. Inclusive, eles sofrem maior resistência
por parte da categoria médica, já tão acostumada a análises
estatísticas puras e dados mais numéricos.
Diversas técnicas e desenhos podem ser utilizados
para chegar a um resultado apropriado, desde entrevistas
a grupos focais, mas o objetivo desse primeiro capítulo não
é explorar ao máximo nenhum tipo de estudo.
Um aluno de graduação, para o seu trabalho de con-
clusão de curso pode optar por não analisar os efeitos de
um medicamento na terapêutica de uma doença no hospital
universitário de sua instituição, ou ainda a prevalência de
uma síndrome nas gestantes da maternidade-escola, mas
querer analisar como uma metodologia ativa de ensino,
como a OSCE (do inglês, Exame Estruturado de Habilidades
Clínicas), é percebida pelos seus colegas de curso, e se eles
sentem que ela constitui a melhor maneira de absorver aquele
aprendizado. É a percepção virando evidência para a melhoria

54 DESCOMPLICANDO MBE
na qualidade da Educação Médica, área em que esse tipo de
estudo é muito utilizado, aliás.

CONCLUSÃO

Esse capítulo introdutório tem como objetivo apresen-


tar ideias gerais sobre os mais relevantes tipos de estudos
epidemiológicos utilizados para a Medicina Baseada em
Evidências. Não se preocupe caso algo tenha ficado ainda
“obscuro”, os capítulos a seguir se propõem a analisar mais
detalhadamente as nuances de cada um, para a compreensão
mais acurada dessa área tão importante da Epidemiologia
e da Medicina.

REFERÊNCIAS

CORREIA, R. R. Conceitos Básicos em Epidemiologia e Bioestatística.


1. ed. Fortaleza: sem editora, 2008. 30 p. Disponível em: <http://www.
epidemio.ufc.br/files/ConceitosBasicosemEpidemiologiaeBioestatistica.
pdf>. Acesso em: 30 de Jun. 2017.

DIB, R, E. et al. Guia Prático de Medicina Baseada em Evidências. 1.


ed. São Paulo: Cultura Acadêmica, 2014. 118 p.

LIMA-COSTA, M. F.; BARRETO, S. M. Tipos de estudos epidemio-


lógicos: conceitos básicos e aplicações na área do envelhecimento.
Epidemiologia e serviços de saúde, Brasília, v. 12, n. 4, p. 189-201,
2003.

MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p.

MATHIAS, L, A. Epidemiologia. 1ª edição. Jaboticabal: sem edi-


tora, 2014. 127. Disponível em: <http://www.fcav.unesp.br/Home/

Estudos epidemiológicos – conceitos gerais 55


departamentos/medicinaveterinaria/LUISANTONIOMATHIAS/apos-
tila-epidemiologia.pdf> Acesso em: 30 de jun. 2017.

MEDRONHO RA, CARVALHO DM, BLOCH KV, LUIZ RR,


WERNECK GL, organizadores. Epidemiologia. São Paulo: Atheneu;
2009.

56 DESCOMPLICANDO MBE
ESTUDOS
ECOLÓGICOS

4 Dyego Leandro Bezerra de Souza


Géssika Lanzillo de Almeida Nunes
Henrique de Paula Bedaque
Yasmin de Medeiros Carvalho

O QUE SÃO?

D
iferentemente do que o nome pode sugerir,
estudos ecológicos não dizem respeito a análi-
ses sobre impactos ou danos ambientais, e sim
a agregados de indivíduos de determinada área geográfica, a
exemplo de grupos de pessoas com determinada característica
em comum (renda, etnia, etc.) ou que viveram no mesmo
tempo (dias, semanas, meses ou anos).
Assim, são estudos que procuram definir como o
contexto social e ambiental interfere na saúde de grupos
populacionais para gerar hipóteses etiológicas sobre deter-
minada doença. Como frequentemente utilizam combinações
de bases de dados referentes a populações, por conseguinte,

57
costumam ser mais baratos e mais rápidos que estudos a
nível individual de análise.

PARA QUE SERVEM?

Os estudos ecológicos são úteis quando se quer estudar


grandes populações e comparar dados sobre diferentes áreas
(por exemplo, hábitos de vida, incidência de doenças e taxa
de mortalidade entre diferentes países) de modo a estudar e
entender os aspectos daquelas localidades que produzem
as divergências entre elas.
Além disso, estudos individuados são utilizados
quando há necessidade de analisar muitas pessoas e com-
parar muitas áreas, em razão da dificuldade de coleta de
dados e do alto custo. Assim, os estudos ecológicos são
uma alternativa viável por utilizarem dados secundários e,
principalmente, por compararem diferentes bases de dados
a partir de sistemas de informação, de modo a facilitar o
estudo de determinantes do processo saúde-doença.

COMO SE ESTRUTURA?

Para entender os elementos de um Estudo Ecológico


é necessário saber que a sua arquitetura se baseia em (1) os
tipos de variáveis utilizadas, (2) os níveis de análise e (3) os
níveis de inferência:
1. Tipos de variáveis: diferente de estudos individuais
que obtém dados de indivíduos (idade, gênero, escola-
ridade, etc.), esses expressam propriedades de grupos
ou áreas (densidade demográfica, poluição, taxa de

58 DESCOMPLICANDO MBE
mortalidade, etc.). Dessa maneira, as variáveis podem
ser classificadas em três tipos:
• Medidas agregadas: são construídas a partir de obser-
vações de indivíduos dentro de cada grupo, mas
calculadas como médias ou proporções, de modo a
caracterizar aquele grupo, e não o indivíduo. Exemplo:
a quantidade de pessoas que foram a óbito por dengue
é um número que depende do nível individual, mas ele
não tem significado se não for feita a proporção com
todas as pessoas que adoeceram por dengue. Logo, o
dado relevante para o estudo ecológico será a taxa de
mortalidade por dengue na região estudada.
• Medidas ambientais: características físicas do local
onde os membros do grupo vivem que, assim como as
medidas agregadas, também têm análogos em nível
individual. Exemplo: horas de exposição à luz solar –
as pessoas se expõem de maneiras diferentes ao sol,
assim, esses dados variam entre os membros do grupo.
Contudo, podem ser criados grupos comparativos, com
diferentes contextos, passando a ser a variável de inte-
resse para um estudo ecológico.
• Medidas globais: características que representam
todos os membros do grupo, para as quais não exis-
tem observações em nível individual. Por exemplo:
para obter a densidade demográfica de certa região
não é necessária nenhuma característica individual
daqueles que vivem na localidade, pois é uma taxa que
depende de toda a população e do tamanho da área.
Ainda, para a análise do modelo do sistema de saúde,
por exemplo, também não é necessário saber nenhum

Estudos Ecológicos 59
dado pessoal dos moradores da área. Desse modo,
densidade demográfica e modelo do sistema de saúde
são medidas globais, em razão de não dependerem de
dados individuais.
2. Níveis de análise: para melhorar o entendimento, é
preciso relembrar como é a análise de um estudo de base
individual, para qual é dado um valor a cada uma das
variáveis, de modo a formar uma tabela ao final da
coleta. Então, nesse caso é possível conhecer: dentre os
que adoeceram, os que foram ou não expostos ao fator de
risco, assim como dentre os que não adoeceram aqueles
que foram ou não expostos, como ilustra a tabela 1:

Tabela 1 – Tabela de contingência

FATOR EM DOENÇA (Y)


ESTUDO (X) CASO NÃO-CASO TOTAL

Exposto a b E1
Não-exposto c d E2
Total M1 M0 n

Já nos estudos ecológicos, não se conhece a informação


sobre a exposição e o efeito dentro de cada unidade de análise,
isto é, a variável independente passa a ser a proporção de
indivíduos expostos dentro de cada grupo (a+b/N) e a variá-
vel dependente é o risco de doença na população estudada
(a+c/N). Ou seja, as variáveis são proporções ou taxas, não
números, e não é possível caracterizar isoladamente para
cada indivíduo as condições de caso/não caso e exposto/não
exposto, como ilustra a tabela 2:

60 DESCOMPLICANDO MBE
Tabela 2 – Tabela de contingência

FATOR EM DOENÇA (Y)


ESTUDO (X) CASO NÃO-CASO TOTAL

Exposto ? ? E1
Não-exposto ? ? E2
Total M1 M0 n

1. Níveis de inferência: os estudos ecológicos produzem


inferências sobre efeitos de exposições ou intervenções
nos riscos individuais de adoecer ou morrer. Assim,
se o nível de inferência não corresponde ao nível de
análise, o estudo é vulnerável a viés, devido à impos-
sibilidade de gerar inferências individuais a partir
do nível agregado. A esse problema dá-se o nome de
falácia ecológica, resultado de uma inferência causal
errada a nível individual baseada numa conclusão de
nível agregado, já que não se conhece a informação
individual sobre a distribuição conjunta da exposição
e doença.
Para facilitar: digamos que um suposto estudo analisou
a associação entre renda média e número de recém nascidos
(RNs) com microcefalia pós exposição intrauterina ao zika
vírus entre cidades. Nas análises chegou-se à proporção de
que quanto maior a renda local, maior o número de RNs com
microcefalia. Desse modo, poderia se admitir que quanto
maior a renda da mãe (indivíduo), maior o risco do seu bebê
nascer com microcefalia. Contudo, em análise de dados
individual, o maior número de bebês com microcefalia estava
associado às grávidas de menor renda, mesmo em cidades
com renda maior, porque estão mais expostas ao vírus. Ou

Estudos Ecológicos 61
seja, não se pode fazer uma inferência causal individual a
partir de um grupo, pois não se sabe como os dados estão
distribuídos dentro desse grupo.

QUAIS SÃO OS TIPOS DE


DESENHOS DE ESTUDO?

Os estudos ecológicos podem ser classificados de


duas maneiras diferentes: em relação a (1) mensuração de
exposição ou (2) métodos de agrupamento. A partir de então,
há subdivisões: no referente à exposição os estudos podem
ser exploratórios ou analíticos, enquanto no referente ao
agrupamento podem ser desenhos de múltiplos grupos,
desenhos de séries temporais ou desenhos mistos. O esquema
1 ilustra melhor essa divisão:

Esquema 1 – Apresentação esquemática

Mas o que quer dizer cada uma dessas classificações?


Quer dizer que os estudos ecológicos podem ter diferentes
objetivos, como comparar diferentes lugares num mesmo
período de tempo ou comparar um mesmo lugar em tempos

62 DESCOMPLICANDO MBE
diferentes, por exemplo. Aqui, organizaremos as classificações
a partir dos métodos de agrupamento e, dentro de cada um,
diremos como funciona a mensuração da exposição, ou seja,
quando é exploratório ou quando é analítico. Veja:

1. DESE N HO DE MÚLT I PLOS GRU POS:

a. Estudo Exploratório: são comparadas diferentes áreas


num mesmo período de tempo, no intuito de estabelecer
padrões que possam indicar etiologias de doenças ou
agravos de saúde. Por exemplo, é possível analisar se
determinada doença tem etiologia de origem ambiental
(depende da área) ou genética (depende dapopulação),
fazendo a comparação entre diferentes áreas (duas ou
mais).
A análise pode ser feita por meio de mapeamento
(facilita a visualização de padrões) ou por simples comparação
entre medidas. O mapeamento pode trazer dois problemas:
áreas muito pequenas têm grande variabilidade na taxa de
uma doença e, desse modo, traz valores extremos (muito
altos ou muito baixos) de mortalidade e morbidade; além
disso, ocorre um fenômeno chamado “autocorrelação espa-
cial”, isto é, áreas vizinhas tendem a ter taxas aproximadas,
enquanto áreas distantes não, pois os fatores de risco tendem
a se concentrar no espaço.
b. Estudo Analítico: esse é o tipo de estudo ecológico mais
comum e analisa a associação entre o nível de exposição
a determinado fator de risco e o estabelecimento de doença
entre grupos distintos. Por exemplo, seria possível realizar
uma associação entre o nível de exposição solar e a taxa

Estudos Ecológicos 63
de incidência de câncer de pele em diferentes cidades
brasileiras para observar qual seria essa relação.

2. DESE N HO DE SÉR I ES T E M POR A IS:

a. Estudo Exploratório: em uma população com uma


área geográfica definida, observa e analisa a evolução de
uma doença ou agravo de saúde ao longo do tempo. Assim,
através desse tipo de estudo, pode-se tentar prever o
futuro de determinada doença ou avaliar a eficácia de
uma intervenção. Por exemplo, suponha um estudo que
analisa a incidência dos casos de infecção por HIV no
Rio Grande do Norte ao longo de 10 anos e, sabe-se que
no quinto ano do estudo houve uma intensificação na
campanha para prevenção de doenças sexualmente
transmissíveis.
Assim, observando os números de novos casos da
doença ao longo dos anos, é possível saber se aquela inter-
venção foi eficaz e, ainda, os seus efeitos ao longo dos anos.
Então, a partir do comportamento da doença na população
ao longo dos anos, tem-se uma perspectiva de como serão
os próximos anos.
b. Estudos Analíticos: analisa, em um grupo específico, a
associação entre as mudanças ao longo do tempo no nível
de uma exposição e a taxa de determinada doença ou agravo.
Por exemplo, um suposto estudo analisaria, ao longo dos
anos, na população da cidade de Natal, as mudanças
no comportamento da população quanto ao uso de
protetor solar e associaria à taxa de câncer de pele ao
longo de um determinado tempo.

64 DESCOMPLICANDO MBE
Há dois problemas nesse tipo de estudo: o primeiro é
quando mudam critérios diagnósticos de uma doença ao
longo dos anos, o que pode alterar os dados do estudo no
período; e o segundo é quando o estudo analisa uma doença
com um grande período de latência entre a exposição ao
fator de risco e a detecção da doença, pois pode dificultar a
associação entre ambos.
Agora é fácil perceber que os estudos de múltiplos
grupos envolvem mais de um grupo no mesmo período de
tempo, enquanto os estudos de séries temporais envolvem um
grupo apenas, mas em um longo período de tempo. Ainda,
os estudos exploratórios analisam números absolutos de
doença, enquanto os estudos analíticos estabelecem sempre
uma associação entre certa exposição e uma doença. Agora
podemos entender melhor o desenho misto, que mescla os
dois anteriores:
3. Desenho misto: esse tipo de desenho faz a observação
de mais de um grupo e ainda analisa a evolução ao
longo do tempo, ou seja, tem características tanto do
estudo de múltiplos grupos quanto do estudo de séries
temporais. Logo:
a. Estudo exploratório: compara, entre diferentes grupos, a evo-
lução temporal da taxa de determinada doença. Por exemplo,
com esse estudo é possível analisar comparativamente
o comportamento da incidência do HIV em Natal e
Mossoró ao longo dos anos, estabelecendo comparações
que permitam entender a evolução da doença nas duas
cidades, de modo a analisar intervenções ou prever o
comportamento futuro dessa doença.

Estudos Ecológicos 65
b. Estudo analítico: faz uma análise, entre diferentes grupos,
da associação entre as mudanças no nível de exposição e
as taxas de uma doença, ao longo do tempo. Por exemplo,
um suposto estudo compara entre Natal e Mossoró as
mudanças no uso de protetor solar e a taxa do câncer
de pele, ao longo dos anos.

CONCLUSÃO

Dessa maneira, os Estudos Ecológicos são importantes


para analisar dados referentes a coletividades, bem como
comparar diferentes grupos populacionais, diferentemente
dos estudos a nível individual. Porém, ao escolher esse tipo
de estudo é essencial ficar atento à falácia ecológica, já que
associações observadas entre agregados não necessariamente
podem ser extrapoladas a nível individual.

REFERÊNCIAS

MEDRONHO R. A, CARVALHO D. M, BLOCH K. V, LUIZ R. R,

WERNECK G. L, organizadores. Epidemiologia. São Paulo: Atheneu;


2009. 685 p.

FLETCHER, R. H.; FLETCHER, S. W. Epidemiologia clínica: elemen-


tos essenciais. 4. ed. Porto Alegre: Artmed, 2006. 281 p.

LIMA-COSTA, M. F.; BARRETO, S. M. Tipos de estudos epidemio-


lógicos: conceitos básicos e aplicações na área do envelhecimento.
Epidemiologia e serviços de saúde, Brasília, v. 12, n. 4, p. 189-201, 2003

66 DESCOMPLICANDO MBE
SÉRIES TEMPORAIS

5 Dyego Leandro Bezerra de Souza


Henrique de Paula Bedaque
Thomas Diniz Papa

A
s séries temporais são estudos observacionais
e longitudinais que tentam avaliar a tendên-
cia de algum evento conforme o passar do
tempo, em dias, meses, anos ou qualquer outra medida de
tempo. Com ele, podemos ver facilmente se um evento está
aumentando, diminuindo ou permanecendo estável quanto
à sua frequência, em uma dada população. Além disso,
conseguimos avaliar outras características, como periodi-
cidade, momentos de picos/vales, velocidade de variação,
entre outras.
Uma informação importante é que os dados utilizados
para fazer esse tipo de estudo geralmente são secundários,
isto é, não são coletados individualmente pelo pesquisador.
A equipe do estudo consegue as informações relevantes
em bases de dados e, portanto, não sabe informações mais

67
profundas sobre eles, como a maneira de obtenção, detalhes
da população, vieses, etc.
Como exemplo de base de dados, podemos citar, com
muito orgulho, o DATASUS, uma base de dados do sistema
único de saúde brasileiro. Nela, há informações de TODOS
os municípios brasileiros em diversas áreas de saúde: mor-
talidade, morbidade, natalidade, aspectos socioeconômicos e
muitos outros. Infelizmente, também há muita subnotificação
(um dos problemas dos dados secundários), mas, ainda
assim, é uma ótima ferramenta para estudar as realidades,
avaliar intervenções, programas e fazer pesquisas. Além
disso, qualquer pessoa do mundo pode ter acesso as suas
informações, basta que acesse seu endereço eletrônico.
Feita essa breve explicação, perceba algo interessante:
as séries temporais são observacionais, longitudinais, usam
dados secundários, não têm informações sobre os indivíduos,
mas, sim, sobre os grupos (agregado). Que outro estudo tem
características parecidas? Você lembra? O estudo ecológico!
Isso mesmo! As séries temporais podem ser comparadas a
estudos ecológicos longitudinais, em que os agregados não
são geográficos, mas temporais. São blocos de dias, meses,
anos.

DESENHO DO ESTUDO

Quanto ao desenho da série temporal, ela pode ser


exploratória ou analítica. No primeiro caso, o autor busca,
como o nome sugere, explorar algum campo desconhecido,
a fim de encontrar informações gerais sobre, por exemplo,
determinada doença, como número de casos por ano, evo-
lução histórica, presença de periodicidade, entre outras. No

68 DESCOMPLICANDO MBE
segundo caso, o autor tenta encontrar correlação (daremos
mais explicações em Metodologias de análise) de duas séries já
conhecidas. Por exemplo, uma série temporal analítica pode-
ria correlacionar a taxa de gestantes que realizam pré-natal
com a taxa de mortalidade infantil, num mesmo espaço
geográfico. Assim, podemos entender se quando uma maior
taxa de mulheres grávidas realizam o pré-natal, reduz-se a
mortalidade infantil, ou não.

TIPOS DE VARIAÇÃO

De acordo com a grandeza de tempo e a variável uti-


lizada, podemos ter diferentes tendências. Vejamos alguns
exemplos.
a) Variação estacional (sazonal) → É um tipo de variação
no qual as flutuações periódicas na ocorrência da enfer-
midade estão relacionadas com uma estação ou uma
época do ano em particular. Como exemplo, podemos
citar a incidência da dengue, a qual é maior em meses
de chuva e menor em meses de seca. Essa informação é
importante para evitar que se pense que um aumento
de incidência de alguma doença signifique necessaria-
mente uma epidemia ou surto.
Na verdade, pode ser simplesmente o esperado, de
acordo com a variação estacional daquela doença.
b) Variação cíclica → É uma tendência que se repete num
período certo, mas que ultrapassa um ano. Geralmente
acontece com doenças que induzem imunidade prolon-
gada, como era com a varíola. Primeiramente, tem-se
um surto que mata algumas pessoas e induz imunidade

Séries temporais 69
duradoura nas que permanecem vivas. Com isso, só
haverá outro surto quando houverem pessoas não
imunizadas suscetíveis ao agente. Portanto, isso levará
alguns anos. Algo semelhante ocorre com a raiva em
raposas na Grã-Bretanha. Nesse caso, a doença, com
elevada letalidade, provoca o óbito dos indivíduos
infectados, reduzindo a densidade de hospedeiros
susceptíveis e consequentemente acarretando redução
na ocorrência da enfermidade. Com a renovação da
população em aproximadamente 4 anos e o surgimento
de uma nova geração, volta a aumentar a densidade de
hospedeiros susceptíveis, propiciando, novamente, con-
dições para o aumento na ocorrência da enfermidade.
c) Variação secular → As tendências de longo prazo, como
também são chamadas, são quase, por si só, indicadores
de saúde de uma população. Portanto, podem ser muito
úteis para gestão de saúde em uma localidade. Vejamos
um exemplo. Suponha que você seja o Secretário de
saúde de uma pequena cidade e estudou a prevalência
de obesidade numa série temporal de 10 anos no seu
município. O gráfico resultante foi o mostrado abaixo:

70 DESCOMPLICANDO MBE
Figura 1 – Gráfico ilustrativo de obesidade pelo tempo

Rapidamente, você percebe que a obesidade tem aumen-


tado muito entre a sua população. Assim, com essa informação
em mãos, você pode agora planejar medidas que diminuam
esse ritmo e até mesmo o façam regredir. De fato, é uma
excelente ferramenta de gestão pública.
Num contexto de Medicina Baseada em Evidências, as
séries temporais não tem muita credibilidade do ponto de vista
individual, semelhantemente aos estudos ecológicos, pois
dados em grupo não podem ser generalizados para o indi-
víduo. Se fizéssemos isso, estaríamos cometendo a falácia
ecológica. No entanto, ela tem o poder, sim, de avaliar se
medidas de saúde pública são eficazes ou não. Vejamos outro
exemplo. Na mesma cidade anterior, você detecta altos níveis de
catapora e dengue. Então, como gestor de saúde, mobiliza
a cidade numa campanha de vacinação contra catapora e
decide apostar numa nova vacina contra dengue. Suponha
que a campanha começou em 2017, e analise o gráfico abaixo.

Séries temporais 71
Figura 2 – Gráfico ilustrativo da incidência de
Catapora e Dengue pelo tempo em anos

Ao fim de quatro anos de vacinação, você se depara


com esse gráfico, o qual denota boa eficácia quanto à catapora,
porém, inutilidade da nova vacina contra a dengue. Estes
dados, sem dúvida, são muito úteis não apenas para você,
mas para outros gestores que passam por situações seme-
lhantes. Entretanto, quanto à individualidade do paciente,
de nada serve.

72 DESCOMPLICANDO MBE
Figura 3 – Gráfico ilustrativo de obesidade pelo tempo

METODOLOGIA DE ANÁLISE

Ao observar uma série temporal, nosso objetivo é


sempre tentar encontrar alguma tendência, periodicidade
ou mudança e, a partir disso, formular hipóteses que tentem
explicar os achados. Porém, como sempre em epidemiologia,
lutamos contra o velho inimigo chamado viés, e aqui não é
diferente. Ao analisar uma série, precisamos lembrar que
algo que chame a nossa atenção pode ser nada mais do que
obra do acaso. E, se não soubermos identificar isso, podemos
confundir todo o estudo e produzir resultados falsos. Por
essa razão, veremos agora metodologias de análise que
podem nos ajudar a interpretar melhor os dados de uma
série temporal.
a) Desenho à mão livre → Este método nada mais é do
que simplesmente observar o caminho dos pontos num
gráfico e perceber os eventos que já descrevemos. É o
método mais simples, porém mais falho. É possível ser

Séries temporais 73
usado em análises “óbvias”, em que os números são
gritantes. Porém, não é recomendado para analisar
tendências mais sutis.
b) Cálculo das médias móveis → Pensando em diminuir os
efeitos do acaso, podemos usar esse método. Ele consiste
em analisar não os dados de cada unidade de tempo,
mas médias aritméticas de algumas unidades juntas.
Por exemplo, no gráfico acima, faríamos a média por
biênio e analisaríamos o gráfico todo a cada 2 anos,
em vez de a cada ano. Como já dito, isso diminui as
variações devido ao acaso, mas, nos impede de saber o
primeiro e último dado da série e há de se considerar
também que a média é afetada por valores extremos,
que podem se originar a partir do acaso.
c) Análise de regressão → Sem dúvida alguma, este é o
método mais acurado para analisar as relações entre
o tempo e a enfermidade. A análise de regressão é um
método estatístico para a investigação de relações
entre duas ou mais variáveis. Por meio da análise de
regressão, obtém-se a linha de regressão e o coeficiente
de regressão. O coeficiente de regressão determina a
inclinação da linha. Esse coeficiente pode ser positivo,
negativo ou zero. Quando ele é igual a zero, não há rela-
ção entre as duas variáveis, ou seja, entre a ocorrência
da enfermidade e o transcorrer do tempo. Quando ele é
positivo, há relação direta entre as duas variáveis, ou
seja, conforme passou o tempo, aumentou a ocorrência
da enfermidade. Já um coeficiente de regressão negativo
indica que há relação inversa entre as duas variáreis,
isto é, conforme o tempo passou, a ocorrência da doença

74 DESCOMPLICANDO MBE
diminuiu. Com essa ferramenta, conseguimos acessar
o cerne da fidelidade estatística, onde há pouco espaço
para subjetividades ou erros de acaso: o universo dos
números.

CONCLUSÃO

VA N TAGE NS

a) São estudos relativamente fáceis, rápidos e baratos


de fazer, pois os dados coletados são secundários.
Portanto, não se gasta tempo e dinheiro treinando
pessoas, indo a campo, calibrando os instrumentos,
entre outras etapas.
b) Conseguem avaliar bem o efeito de alguma exposição
em grandes áreas geográficas, por serem agre-
gados. Por essa razão, são, como já discutimos,
grandes aliados dos gestores públicos.

L I M I TAÇÕES

a) Dificuldade de confiar nas informações disponíveis,


pois não há garantia de que os dados foram coletados
de maneira fiel.
b) Incapacidade de tomar conclusões a respeito do indiví-
duo; permite apenas conclusões em agregados popu-
lacionais (lembrar da falácia ecológica).
c) Dados de séries históricas analíticas representam níveis
de exposição média da população, ou seja, não é pos-
sível saber o quanto a população em questão, de fato,

Séries temporais 75
se expôs ao evento que queremos avaliar. Portanto, os
valores não são reais, são apenas médias. Isso, por si
só, diminui a validade interna do estudo.

REFERÊNCIAS

MATHIAS, L, A. Epidemiologia. 1ª edição. Jaboticabal: sem editora,


2014. 127. Disponível em: <http://www.fcav.unesp.br/Home/departa-
mentos/medicinaveterinaria/LUISANTONIOMATHIAS/apostila-epi-
demiologia.pdf> Acesso em: 20 de julho. 2017.

MEDRONHO, R. A. Estudos Ecológicos. In: MEDRONHO, R. A. (Org.).


Epidemiologia. São Paulo: Atheneu, 2009. p. 265 – 274.
ESTUDOS
SECCIONAIS

6 Dyego Leandro Bezerra de Souza


Henrique de Paula Bedaque
Luiz Cândido da Silva Júnior

O QUE SÃO?

E
studos seccionais, também identificados como
estudos transversais ou de prevalência, podem
ser definidos como levantamentos epidemio-
lógicos realizados em uma amostra representativa de uma
população em um período temporal definido, que pode ser
um único momento ou um curto intervalo de tempo, de
maneira que as informações obtidas acerca de um problema
clínico específico representam o estado clínico daquela popu-
lação no instante em que a pesquisa aconteceu e, portanto,
não há período de seguimento dessa amostra.

77
Nos estudos seccionais, uma amostra da população
definida para a pesquisa é submetida a uma investigação
sobre as distribuições das variáveis que se quer analisar
dentro da população, sendo designadas variáveis preditoras
e de desfecho de acordo com a razoabilidade biológica e
com base em informações de outros estudos. Por exemplo,
numa relação entre a exposição solar e o desenvolvimento
de um melanoma (tumor maligno com origem nos melanó-
citos), é mais razoável considerar o hábito de se expor ao sol
como sendo a variável preditora (variável independente) e
o desenvolvimento do melanoma como desfecho (variável
dependente).
Dessa forma, o desenho da pesquisa seccional é muito
útil para descrever variáveis e seus padrões de distribuição
em uma dada região num determinado período. Logo, através
desse tipo de estudo se pode obter, por exemplo, informações
sobre os hábitos e a saúde da população estudada.
Os estudos seccionais também permitem realizar
associações, nas quais a relação de causa-efeito é apenas
hipotética. Quando se pretende gerar uma relação causa-
-efeito mais robusta, ensaios clínicos e estudos de coorte
representam uma melhor escolha em comparação com os
estudos transversais. Todavia, é importante ressaltar, as
hipóteses acerca de uma provável relação do tipo causa-efeito
entre variáveis geradas a partir de inquéritos não devem ser
menosprezada, pois elas podem ser o ponto de partida para a
realização de trabalhos mais específicos que possam testá-las.

78 DESCOMPLICANDO MBE
METODOLOGIA

A realização de um estudo de caraterística seccional


pressupõe basicamente a coleta de informações em um único
momento (ou em um curto espaço temporal, mas sem período
de seguimento naquela amostra) acerca de um problema clí-
nico específico. Para isso, é comum a realização de entrevistas
ou inquéritos através da aplicação de questionários em uma
amostra populacional e o uso de um banco de dados como,
por exemplo, o DATASUS ou ainda os prontuários médicos
de um hospital.
Quando comparados com outros desenhos de estudos,
ainda que possua limitações e esteja destacadamente sujeito
ao viés de medição, pois dependem rigorosamente da qua-
lidade do relato e, portanto, da memória do entrevistado e
da valorização subjetiva que este atribui à informação, os
inquéritos oferecem uma linha de trabalho extremamente útil
para ações de vigilância e criação ou adequação de políticas
em saúde, por exemplo. Ademais, essa vantagem se deve
muito em virtude da simplicidade do delineamento, do
menor custo para a execução do trabalho e da agilidade na
coleta e divulgação dos dados.
Todavia, é importante ressaltar que a elaboração do
projeto, a escolha do melhor questionário para a pesquisa, o
cálculo do tamanho da amostra para que ela seja considerada
representativa da população em estudo, o treinamento dos
pesquisadores que levantarão as informações, o período
em que ocorrerá a coletas de dados e os custos envolvidos
são fatores que devem ser cuidadosamente planejados e
avaliados pelos responsáveis envolvidos no trabalho sob

Estudos Seccionais 79
pena de produzir um resultado com inúmeros vieses que
poderão até mesmo invalidá-lo.

PRINCIPAIS APLICAÇÕES

Estudos seccionais são excelentes para estimar a pre-


valência de uma determinada situação clínica inserida em
uma população. Isso porque tal desenho de estudo produz
informações epidemiológicas locais no momento da execução
da pesquisa, ou seja, o trabalho só consegue coletar dados
sobre quem já desenvolveu o problema e não avalia quem
o desenvolverá ou não. Em outras palavras, é como se fosse
retirada uma fotografia da situação epidemiológica daquela
região.
Vejamos um exemplo de como pode ser realizado um
estudo através do delineamento seccional:
Publicado em 2015, Iser e colaboradores estimaram a
prevalência de diabetes autorreferido (a despeito do possível
viés de medida gerado com esse tipo de medida e que é algo
discutido pelo próprio artigo original) no Brasil e descreveram
suas principais características sociodemográficas. Para isso,
foi conduzido um estudo descritivo com dados da Pesquisa
Nacional de Saúde - inquérito domiciliar realizado no Brasil
em 2013, pela Fundação Instituto Brasileiro de Geografia e
Estatística (IBGE) em parceria com o Ministério da Saúde
(MS) e a Fundação Instituto Oswaldo Cruz (Fiocruz). No
referido inquérito, utilizou-se amostragem por conglomerado
e as entrevistas foram feitas entre agosto de 2013 e fevereiro
de 2014. A partir disso, foi estimado o número absoluto de
pessoas com diabetes na população brasileira mediante a

80 DESCOMPLICANDO MBE
expansão dos dados amostrais na mesma faixa etária e área
geográfica.
Os resultados revelaram que a prevalência da doença
reportada na população brasileira foi de 6,2%, maior nas
mulheres (7,0%) do que nos homens (5,4%), e entre os mora-
dores da área urbana (6,5%) do que da área rural (4,6%);
estimou-se um total de aproximadamente 9 milhões de
pessoas com diabetes no país, cerca de 3,5 milhões delas
com 65 anos ou mais de idade.
A partir dessas informações, conclui-se que o diabetes
é uma doença muito prevalente em nosso meio, sobretudo
entre mulheres, idosos e na área urbana. Tais resultados
podem ajudar na elaboração de um plano de ação contra a
doença, no qual poderá ser proposto medidas de prevenção
e controle mais específicas e que abranja a população como
um todo.

IMPORTÂNCIA DOS ESTUDOS SECCIONAIS

Mesmo que os estudos seccionais não estejam no topo


da hierarquia de evidências clínicas e, portanto, não figu-
rem entre as primeiras escolhas para a prática da medicina
baseada em evidências, como eles podem contribuir para a
prática clínica do dia a dia do médico?
Conhecendo os resultados do trabalho citado ante-
riormente, por exemplo, o médico que estiver diante de uma
mulher ou um idoso, principalmente se residirem em área
urbana, poderá, de acordo com os critérios clínicos, suspeitar
de um provável caso de diabetes, optar pela melhor conduta

Estudos Seccionais 81
para fazer o diagnóstico e, se confirmada a hipótese, propor
o melhor tratamento para seu paciente.
Ademais, como já adiantado em seções anteriores, os
dados obtidos pela pesquisa com delineamento transversal
são extremamente valiosos para o planejamento de políticas
destinadas a saúde pública, em que recursos financeiros e
humanos poderão ser alocados de forma precisa no combate
a situações clínicas específicas, reduzindo, portanto, o tempo
para se atingir desfechos favoráveis e gastos desnecessários.

CONCLUSÃO

Embora os estudos seccionais pareçam, inicialmente,


pouco úteis à medicina baseada em evidências, eles repre-
sentam uma excelente fonte de informação para o médico em
sua prática clínica na medida em que ele (o médico), de posse
da atual situação epidemiológica do local em que desenvolve
sua atividade, pode estimar a probabilidade de o paciente
que o procura ter uma determinada doença e decidir quais
as melhores condutas a serem aplicadas.

REFERÊNCIAS

GREENHALGH, T. Como ler artigos científicos: fundamentos da


medicina baseada em evidências. 3. ed. Porto Alegre: Artmed, 2010.
255 p. ISBN: 9788536313450.

HULLEY, S. B. et al. Delineando a pesquisa clínica: uma abor-


dagem epidemiológica. 3. ed. Porto Alegre, RS: Artmed, 2008.
384 p. (Biblioteca Artmed. Epidemiologia/ Saúde Pública) ISBN:
9788536313610.

82 DESCOMPLICANDO MBE
ISER, B. P. M. et al.. Prevalência de diabetes autorreferido no
Brasil: resultados da Pesquisa Nacional de Saúde 2013. Epidemiol.
Serv. Saúde, Brasília, v. 24, n. 2, p. 305-314, jun. 2015. Disponível
em: <http://scielo.iec.pa.gov.br/scielo.php?script=sci_arttext&pi-
d=S1679-49742015000200013&lng=pt&nrm=iso>.

LIMA-COSTA, M. F.; BARRETO, S. M.. Tipos de estudos epidemio-


lógicos: conceitos básicos e aplicações na área do envelhecimento.
Epidemiol. Serv. Saúde, Brasília, v. 12, n. 4, p. 189-201, dez. 2003.
Disponível em: <http://scielo.iec.pa.gov.br/scielo.php?script=sci_arttex-
t&pid=S1679-49742003000400003&lng=pt&nrm=iso>.

PAOLUCCI EL DIB, R.. Como praticar a medicina baseada em evidên-


cias. Jornal Vascular Brasileiro, v. 6, 2007. ISSN 1677-5449. Disponível
em: <http://www.redalyc.org/articulo.oa?id=245016532001>.

SILVA, E. J. C. da; LLERENA JR., J. C.; CARDOSO, M. H. C. de A..


Estudo seccional descritivo de crianças com deficiência auditiva aten-
didas no Instituto Nacional de Educação de Surdos, Rio de Janeiro,
Brasil. Cad. Saúde Pública, Rio de Janeiro, v. 23, n. 3, p. 627-636, Mar.
2007. Disponível em: <http://www.scielosp.org/scielo.php?script=sci_
arttext&pid=S0102-311X2007000300021&lng=en&nrm=iso>.

Estudos Seccionais 83
ESTUDOS
QUALITATIVOS
EM SAÚDE

7 Adrian Lucca Guimarães Caldeira


Dyego Leandro Bezerra de Souza
Henrique de Paula Bedaque

O QUE SÃO?

O
s estudos qualitativos em saúde já se colocam
em posição consolidada nas pesquisas na área
da saúde, principalmente, na saúde coletiva.
E isso ocorreu pela percepção dos pesquisadores de que
com esse tipo de abordagem seria possível explorar melhor
os sujeitos de pesquisa e identificar de forma mais clara as
intervenções que devem ser feitas.
Entretanto, mesmo já sendo uma metodologia fácil de
encontrar em revistas da área da saúde, ainda encontramos
certa resistência em sua utilização, principalmente, pela
área médica que, acostumada com as análises estatísticas
do estudo quantitativo, encontra as barreiras do esforço

85
compreensivo e de intersubjetividade dos profissionais,
além de destacarem a menor reprodutibilidade e poder de
generalização desse estudo.
Mesmo com essa resistência encontrada, vemos um
crescimento na produção de estudos qualitativos, por todas
as áreas profissionais da saúde, e isso ocorre sem o objetivo
de competição com o quantitativo, mas com o poder de
complementar o desenvolvimento da ciência, pois o uso
de metodologias diferentes leva a novas possibilidades de
compreensão do objeto de estudo.

QUALITATIVO VS QUANTITATIVO

Esses dois grandes grupos de metodologias de estudo,


não são mutuamente exclusivos, de modo a ser relativamente
comum o uso de estudos quali-quantitativos. Entretanto, é
importante perceber que cada um tem um nicho de atuação
em que é capaz de fornecer os melhores resultados, possibi-
litando a melhor conclusão e divulgação do conhecimento,
o que deve ser o maior objetivo de qualquer pesquisa.
Vejamos como é fácil separar de maneira simplificada
esses dois nichos:
Uma indústria farmacêutica desenvolveu um remédio
para tratar a dor de cabeça e precisa comparar o seu efeito
com um concorrente e com o placebo para saber se o seu
fármaco é tão eficaz ou mais que o concorrente e o placebo.
Para este caso devemos fazer um estudo quantitativo onde a
intervenção é o uso do fármaco que pode ter dois resultados:
melhorou a cefaleia ou não. Perceba que a análise é objetiva,
pois é necessário saber se houve ou não melhora da dor de

86 DESCOMPLICANDO MBE
cabeça e é para esses tipos de estudos com possibilidades
de resposta bem objetivas que os desenhos quantitativos se
moldam melhor.
De modo simplificado, perceba que o estudo quantita-
tivo estuda fenômenos mais objetivos (resposta terapêutica),
enquanto o qualitativo estuda fenômenos mais subjetivos
(percepção sobre a resposta terapêutica) e com leque maior
de possibilidades.
Desse modo, é importante destacar que cada uma
dessas metodologias tem características que abarcam melhor
cada tipo de objetivo da pesquisa. A escolha de qual meto-
dologia usar só ocorre após uma clara definição do objeto
de estudo e do objetivo desse estudo.
Por fim, a ciência, que não para de crescer, vem
demandando a cada dia metodologias mais completas e
bem estruturadas para chegar aos seus objetivos de modo
que é cada vez mais comum o uso de pesquisas que mesclem
o qualitativo e o quantitativo.

O ESTUDO QUALITATIVO

O estudo qualitativo se insere na possibilidade de


estudar as expressões humanas presentes nas relações, nos
sujeitos e nas representações. Isto é, sua metodologia tem
facilidade em explorar as consequências da intervenção, pois
sua coleta de dados é, normalmente, aberta a receber todas as
informações que lhe forem dadas e não apenas enunciados
pré-definidos. O qualitativo não limita as informações no
objeto do estudo na fase da coleta, mas sim na fase da análise

Estudos qualitativos em saúde 87


dos dados o que se torna um diferencial em sua metodologia
em seus resultados.
Na área da saúde, se destaca o estudo de casos que utili-
zam estratégias qualitativas para mapear, analisar o contexto
e as percepções de uma determinada situação, intervenção
ou fenômeno o qual se deseja estudar. O desenho do estudo
possibilita a evidência de relações causais entre intervenções
e situações da vida real. Em suma, o estudo qualitativo coleta
as percepções do objeto do estudo de forma ampla e analisa
todos esses dados para chegar a seus resultados e conclusões.
Para a coleta dos dados são principalmente utilizados os
questionários abertos e a entrevista, que pode ser individual
ou em grupos focais (o que possibilita uma análise crítica
coletiva sobre a intervenção), e o número de questionários/
entrevistas não obrigatoriamente utiliza o conhecido “n” que
necessita de análise estatística, pois uma das técnicas bem
consolidadas se baseia na amostra por saturação de dados.
Após a coleta dos dados é o momento de escolher como
se dará a sua análise. Iremos destacar dois tipos: A análise
do conteúdo, onde a atenção é voltada para o conteúdo
expresso nas entrevistas, suas repetições e os significados
das expressões; e a análise do do discurso, em que um tripé
se torna o articulador no conhecimento, sendo os três itens,
o materialismo histórico, a linguística e a teoria do discurso,
assim, se destaca a compreensão do contexto na qual se
produziu as expressões e não tanto a expressão propriamente
dita.
A utilização dessas análises é o grande pilar que sus-
tenta o desenvolvimento dos resultados e das conclusões
das pesquisas qualitativas, sendo a ela exigida um grande

88 DESCOMPLICANDO MBE
rigor metodológico para se obter grande sustentação ao
conhecimento desenvolvido.

AMOSTRA POR SATURAÇÃO

Um ponto muito importante para entender o funcio-


namento dos estudos qualitativos é saber que a quantidade
de entrevistas/ questionários não é definidora de bons resul-
tados, e isso se mostra especialmente claro quando se tem
em mente o conceito de amostra por saturação.
Em uma entrevista recebemos diversas informações
diferentes, como no exemplo acima, diversas competências
são citadas, mas chega um momento, após um número X de
entrevistas que o pesquisador percebe que as competências
estão se repetindo e que não está ocorrendo o aparecimento de
competência inéditas: é neste momento que temos a saturação
dos dados coletados.
Perceba que pela resposta do entrevistado ser, iminen-
temente, subjetiva, há uma grande dedicação do pesquisador
em categorizar essas respostas em competências possíveis
para que ao longo de várias entrevistas seja possível ele
perceber essa repetição. Além disso, quanto maior o número
de pesquisadores realizando a coleta dos dados mais difícil
fica a percepção da saturação desses dados, dai a grande
importância de uma dedicação especial ao nivelamento das
pessoas que foram coletar os dados.
Por fim, perceba que pela técnica da “amostra por
saturação” o que se busca é esgotar as possibilidades de
competências adquiridas, independentemente do número de

Estudos qualitativos em saúde 89


entrevistados que sejam necessários para se obter esses dados,
por isso a quantidade não é definidora de bons resultados.

ANÁLISE DO CONTEÚDO

A análise do conteúdo, como o próprio nome sugere,


estuda o conteúdo expresso pelos entrevistados, a palavra, a
semântica da palavra, o processo de produção da mensagem
e as variáveis psicológicas e sociais. Para o uso desse tipo
de análise temos Bardin como referência em ensino do
como fazer.
Nesse contexto, diante das transcrições das entrevistas,
o pesquisador deve ler e encontrar categorizações, por exem-
plo, competências que se repetem por vários entrevistados, e
iniciar o processo de recorte desses fragmentos de expressões
para a formação de eixos temáticos de discussão. Esse é um
processo demorado, que exige um real estudo do conteúdo
das entrevistas e do entendimento sobre a expressão dos
entrevistados no contexto em que foram ditos.
Após a categorização é o momento de discutir sobre
esses eixos, no qual esses fragmentos irão conversar entre si,
com o pesquisador e com a fundamentação teórica encon-
trada sobre o assunto estudado. Assim, neste momento temos
a formação da análise crítica sobre o objetivo do estudo,
pois essa conversa possibilita levar em discussão o que foi
expresso pelo entrevistado, com a teoria existente e sobre
a mediação do pesquisador, possibilitando a formação do
conhecimento.

90 DESCOMPLICANDO MBE
ANÁLISE DO DISCURSO

Na análise do discurso, o foco não se limita ao conteúdo


das expressões, pois os olhos do pesquisador não se dedicam
apenas ao que foi dito, mas por que aquilo foi dito. Assim,
nessa análise, procura-se entender o contexto na qual aquilo
foi dito, as condições históricas e sociais que levam àquela
expressão ou mesmo ao silêncio do entrevistado. Para o uso
desse tipo de análise o pensador Bakhtin tem uma grande
impacto sobre como se pensar na formação do discurso do
indivíduo, não apenas como ele mesmo, mas como parte de
um meio e fruto de suas interações.
Nesse contexto, na análise do discurso o significado, a
semântica do que foi anunciado, não é o único ponto obser-
vado, pois com ele vem a busca por entender quais foram
os fatores que levaram o entrevistado a dizer isso/aquilo,
quais seriam as suas vivências que o levaram a informar que
desenvolveu tal competência no lugar de outra competência.
Desse modo, para se tentar obter essas informações há grande
necessidade de se estudar a formação do “eu”, a formação do
discurso, as interações e o pensar.
Por fim, esse tipo de análise acaba sendo mais utilizado
em pesquisas de áreas das ciências humanas pela maior
confluência da teoria e do estudo constante das relações, do
contexto, mas o seu uso em pesquisas na área da saúde tem
sua importância e pode fornecer informações diferenciadas
para a elucidação de problemáticas.

Estudos qualitativos em saúde 91


CONCLUSÃO

Os estudos qualitativos já são uma realidade na área


da saúde e a sua utilização só tende a aumentar ao longo
das décadas e de sua maior difusão pera área médica. As
novas possibilidades de obter dados são o grande diferencial
desse estudo que se mostra com uma grande flexibilidade
de atuação, e de possibilidades.
Um destaque especial ao uso desse tipo de estudo em
caráter exploratório é de grande benefício para a ciência, pois
já que esse estudo possibilita receber a resposta completa, de
forma subjetiva, deixando a expressão do entrevistado livre,
temos que para um estudo exploratório essa metodologia se
encaixa muito bem. Por exemplo, se o objetivo é explorar a
percepção de um paciente com câncer sobre o seu processo
saúde-doença, um estudo qualitativo possibilita entender
de forma mais completa do que um quantitativo.
Por fim, os estudos qualitativos em saúde são de gran-
des possibilidades e não se limitam ao que foi exposto neste
texto, por isso, a recomendação é sempre buscar entender
bem os seus objetivos para então escolher e se aprofundar em
sua metodologia, seja ela qualitativa, quantitativa ou mista.

92 DESCOMPLICANDO MBE
Figura 1 – Esquema simplificado para
andamento de uma pesquisa qualitativa

REFERÊNCIAS

BARDIN, L. Análise de conteúdo. 1. ed. Lisboa: Editora 70, 1997. 280 p.

COSTA, L. R. Ideologia e divulgação científica: uma análise


bakhtiniana do discurso da revista Ciência Hoje. Bakhtiniana:
Revista de Estudos do Discurso, v. 11, p. 33-51, 2016. ISSN
2176-4573. Disponível em: <http://www.scielo.br/scielo.
php?script=sci_arttext&pid=S2176-45732016000200033&nrm=iso>.

FONTANELLA, B. J. B. et al. Amostragem em pesquisas qua-


litativas: proposta de procedimentos para constatar saturação
teórica. Cadernos de Saúde Pública, v. 27, p. 388-394, 2011.
ISSN 0102-311X. Disponível em: <http://www.scielo.br/scielo.
php?script=sci_arttext&pid=S0102-311X2011000200020&nrm=iso>.

MINAYO, M. C. D. S. O Desafio do conhecimento: Pesquisa


Qualitativa em Saúde. 13. ed. São Paulo: Huritec, 2013.

Estudos qualitativos em saúde 93


TAQUETTE, S. R.; MINAYO, M. C. D. S. Características de
estudos qualitativos conduzidos por médicos: revisão da lite-
ratura. Ciência & Saúde Coletiva, v. 20, p. 2423-2430, 2015.
ISSN 1413-8123. Disponível em: <http://www.scielo.br/scielo.
php?script=sci_arttext&pid=S1413-81232015000802423&nrm=iso>.

TAQUETTE, S. R; MINAYO, M. C. S. Ensino-Aprendizagem da


Metodologia de Pesquisa Qualitativa em Medicina. Rev. bras. educ.
med., Rio de Janeiro, v. 39, n. 1, p. 60-67, Mar. 2015.

94 DESCOMPLICANDO MBE
ESTUDOS DE
COORTE

8 Ferdinand Gilbert Saraiva da Silva Maia


Henrique de Paula Bedaque
Melissa Yolanda Soares Melo

O QUE SÃO?

O
s estudos de coorte são bastante utilizados na
pesquisa biomédica e podem ser úteis para
responder a diversas questões, a depender
das características dos indivíduos acompanhados e dos
desfechos estudados.
Além disso, na classificação hierárquica dos estudos
epidemiológicos em relação aos seus níveis de evidência, os
coortes se encontram em um patamar privilegiado compara-
tivamente a outros estudos observacionais, sendo precedidos
apenas pelas revisões sistemáticas, com e sem metanálises;
e pelos ensaios clínicos randomizados. Sabendo que os
níveis de evidência contribuem para orientar as diversas

95
recomendações clínicas, é importante saber que um estudo
de coorte bem feito pode, sim, guiar condutas e nos ajudar
a tomar decisões na nossa prática clínica.
Assim, antes mesmo de aprofundarmos o nosso
aprendizado sobre o estudo de coorte, é interessante que
já tenhamos em mente a sua grande importância para a
Medicina Baseada em Evidências.

MAS AFINAL, O QUE É UM


“ESTUDO DE COORTE”?

O termo coorte, em estatística, é usado para definir


um conjunto de pessoas que compartilha de algum atributo.
Deste modo, o estudo de coorte pode ser entendido como
a observação, ao longo do tempo, de um grupo de pessoas,
que possuem características comuns e não apresentam o
desfecho de interesse, mas estão sob o risco de apresentá-lo.
O estudo se inicia com a seleção da população a ser
acompanhada e a confirmação de que nenhum dos indi-
víduos da coorte apresenta o desfecho, ou seja, todos são
saudáveis em relação ao desfecho (que não necessariamente
é uma doença, por exemplo, pode ser morte) em questão.
Posteriormente, faz-se a divisão da população em dois ou
mais grandes grupos, separando as pessoas expostas ao
fator em estudo, das não-expostas. Realiza-se, então, o segui-
mento de todos os indivíduos selecionados, com avaliações
sequenciais por determinado período de tempo ou até que
haja a ocorrência do evento esperado.
Para que se possa avaliar, com segurança, a interfe-
rência dos fatores de exposição no desfecho, o tempo de

96 DESCOMPLICANDO MBE
seguimento (follow-up) deve ser determinado no início da
pesquisa, de acordo com os conhecimentos pré-existentes
sobre a história natural da doença de interesse. Quando se
deseja estudar agravos ou patologias de rápida indução e
evolução, como no caso de doenças infecciosas agudas, o
tempo de acompanhamento da coorte pode variar de dias
a meses. No entanto, para doenças de caráter crônico, com
progressão mais arrastada, os indivíduos devem ser acom-
panhados por anos ou décadas.
É válido destacar que essa duração tão prolongada,
apesar de tornar a pesquisa mais fidedigna em relação ao
que se deseja estudar, aumenta consideravelmente os custos,
dificulta a reprodutibilidade do estudo e o torna susceptí-
vel a perdas de seguimento quando não se consegue mais
acompanhar os participantes no decorrer do tempo, por
abandono, recusas ou mudança de endereço e a entradas
complementares de novos indivíduos.
Ao longo do seguimento ou ao final do estudo, os pes-
quisadores analisam os dados obtidos a partir da observação
da coorte e registram a incidência desfechos nos dois grupos,
ou seja, a quantidade de novos desfechos tanto nas pessoas
expostas quanto nas não expostas aos potenciais fatores de
risco. Com isso, comparam as incidências nos dois grupos
e conseguem determinar se existe ou não associação entre
exposição e desfecho e, caso exista, qual é essa associação.
Trata-se, assim, de um estudo analítico, individuado,
observacional e longitudinal.

Estudos de coorte 97
VAMOS RELEMBRAR ESSES CONCEITOS?

Diz-se que um estudo é analítico quando tem por


objetivo investigar, não apenas descrever, as associações entre
a presença de determinada característica ou exposição (fator
de risco) e a ocorrência de algum evento (normalmente uma
doença ou agravo). É individuado, pois, como o nome sugere,
identifica e registra as variáveis de interesse para cada pessoa
do grupo, tornando possível distinguir os indivíduos que
continuaram sadios ou adoeceram, dentre os expostos e os
não expostos ao fator de risco. Como não há interferência do
pesquisador nos participantes ou manipulação das variáveis
de estudo, ele é chamado de observacional e, por acompanhar
os indivíduos ao longo do tempo, é considerado longitudinal.
Em relação ao caráter temporal, os estudos de coorte
podem ser caracterizados como prospectivos (concorrentes ou
clássicos) ou como retrospectivos (não concorrentes ou histó-
ricos). O estudo é dito prospectivo quando a sua idealização
ocorre antes da ocorrência da exposição e do desfecho; em
outras palavras, nesse tipo de estudo a coorte é selecionada
no presente e avaliada ao passar do tempo, no futuro. Nos
estudos retrospectivos, por sua vez, o pesquisador trabalha
com informações sobre eventos que já ocorreram no passado,
ou seja, no início do estudo, a exposição, a passagem do
tempo e o desfecho já aconteceram.
Por exemplo, se um investigador deseja avaliar a inci-
dência de otite média aguda em crianças que apresentaram
episódio prévio de infecção de vias aéreas superiores (IVAS),
pode iniciar o estudo neste momento, de forma prospectiva,
e assim irá acompanhar crianças expostas ao fator de risco

98 DESCOMPLICANDO MBE
(IVAS recente) e não expostas (sem relato de episódio prévio
de IVAS), por um período pré-determinado de tempo ou até
que haja o aparecimento de otite média.
Outra possibilidade para a condução do estudo é o
levantamento dessas informações a partir de um banco de
dados, em uma análise retrospectiva. Para isso, o investigador
pode selecionar todas as crianças diagnosticadas com otite
média aguda e identificar aquelas que apresentaram episódio
anterior de IVAS, ou seja, aquelas que estiveram expostas
ao fator de risco.

Figura 1 – Diferenças no delineamento dos estudos


de coorte prospectivos e retrospectivos

É importante ressaltar que nos dois desenhos de estudo,


os participantes caminham na mesma direção, partindo da
exposição até o desenvolvimento da doença. A variável que
os difere é a posição do investigador em relação a coleta de
dados, que podem já existir previamente ou serem produ-
zidos ao longo da pesquisa (figura 1).

Estudos de coorte 99
Os estudos retrospectivos compartilham as vantagens
dos prospectivos em relação a possibilidade de estudar fatores
de risco, com o adendo de serem mais baratos e possuírem
menor duração. Entretanto, como trabalham com dados
pré-existentes, estão sujeitos a vieses de informação, pela falta
ou dificuldade de leitura dos dados; e tem um menor controle
sobre possíveis variáveis de confusão, ou seja, outros fatores
relacionados à exposição que podem interferir no desfecho.

APLICABILIDADE, VANTAGENS
E DESVANTAGENS

Independentemente do tipo de delineamento escolhido,


os estudos de coorte possuem diversas aplicações na medi-
cina. São amplamente utilizados para estudar incidência,
história natural e prognóstico das doenças, permitindo a
investigação de fatores de risco e proteção, com a garantia de
que a exposição sempre precederá, temporalmente, a ocor-
rência do desfecho. Essa relação temporal bem estabelecida
é uma grande vantagem desse tipo de delineamento, pois
atua como evidência para afirmar que o fator de risco pode
ser, realmente, uma das causas da doença.
Outra vantagem é a capacidade de estudar múltiplos
desfechos em uma única coorte, desde que se assegure que
os participantes são livres, inicialmente, de cada um dos
desfechos de interesse.
Um dos grandes exemplos de estudo de coorte, e
possivelmente o mais consagrado, é o Framinghan Heart
Study. Conduzido pela Boston University em parceria com
o National Heart, Lung and Blood Institute, o estudo vem
sendo desenvolvido ao longo de mais de 60 anos, a partir

100 DESCOMPLICANDO MBE


do seguimento de uma coorte montada em 1948, composta
por moradores da cidade de Framinghan, em Massachusetts
(EUA). Com o objetivo de estudar características pessoais
e fatores ambientais que contribuem para a incidência de
doenças cardiovasculares, os pesquisadores recrutaram,
inicialmente, cerca de 5200 participantes, incluindo homens
e mulheres, com idade entre 30 e 60 anos, comprovadamente
saudáveis do ponto de vista cardiovascular. Essa população
foi acompanhada através de avaliações físicas e entrevistas
a cada dois ou quatro anos e, nas décadas seguintes, seus
filhos e netos também passaram a ser avaliados.
O seguimento dessa coorte tão extensa e por tempo
tão prolongado possibilitou a produção de milhares de
publicações e nos permitiu conhecer diversos fatores de
risco associados às doenças cardiovasculares, incluindo
tabagismo, diabetes, sedentarismo, hipertensão arterial,
dislipidemia e obesidade. O estudo foi o pioneiro dentre
os grandes coortes; está, atualmente, na terceira geração de
pesquisadores e permanece gerando evidências importantes
para a nossa prática clínica.
Os estudos de coorte podem ser utilizados, ainda, para
avaliar, a longo prazo, o resultado de intervenções terapêu-
ticas ou preventivas. Nesse sentido, são capazes de fornecer
informações sobre benefícios, riscos e efeitos colaterais de
medicações, apresentando resultados que não puderam ser
obtidos a partir de ensaios clínicos randomizados: o coorte
abre a possibilidade de avaliar pessoas que normalmente
são excluídas dos ECR, como aquelas que apresentam insu-
ficiência renal ou hepática grave, por exemplo.

Estudos de coorte 101


Os coortes prospectivos também são bastante úteis para
o estudo de doenças potencialmente fatais, considerando
que a análise retrospectiva dessas patologias dependeria de
relatos de familiares, prontuários e outros processos clínicos,
dados indiretos que prejudicariam a fidelidade e a precisão
das informações.
Além das dificuldades logísticas já comentadas (alto
custo, longa duração e perda de seguimento), o estudo de
coorte possui algumas outras limitações importantes. A
necessidade de comprovar que todos os participantes são
saudáveis para o desfecho no início do estudo, pode deman-
dar a realização de testes com alto nível de sensibilidade e
especificidade, capazes de excluir, com certeza, a presença da
doença em todos os indivíduos. Adicionalmente, os estudos
de coorte não tem um bom desenho para estudar doenças
raras pois, nessas situações, haveria necessidade de acompa-
nhar um número muito extenso de pessoas, por um período
de tempo exaustivamente prolongado para que, talvez, se
pudesse obter alguma conclusão.
Assim, quando se deseja estudar doenças com baixas
taxas de incidência e prevalência, a alternativa mais prática
geralmente é optar por um estudo de caso-controle, que tam-
bém avalia fatores de risco, mas caminha na direção oposta
do coorte: inicia com o desfecho e parte para a exposição.
De forma simplificada, no caso-controle, selecionam-se
pessoas já diagnosticadas com a doença (casos) e pessoas com
características similares, mas que não são doentes (controle).
A exposição ou não aos potenciais fatores de risco é inves-
tigada para todos e comparada entre os dois grupos, para
permitir a elaboração das medidas de associação. Costumam

102 DESCOMPLICANDO MBE


ser estudos mais baratos, mais curtos e práticos dos que os
coortes, porém, proporcionam menor nível de evidências.
Ainda é válido ressaltar que, por serem estudos
observacionais, em que não há controle das variáveis pelos
pesquisadores, os estudos de coorte estão sujeitos a alguns
vieses sistemáticos, sendo um dos principais o viés de con-
fundimento. Por exemplo, quando se estuda a associação
entre a incidência de trombose venosa profunda em mulheres
e a prática de atividade física, o uso de anticoncepcional
hormonal oral pode atuar como variável de confusão. Se as
mulheres sedentárias usarem mais anticoncepcional do que
as praticantes de atividade física e, ao mesmo tempo, apre-
sentarem maior incidência de TVP, então, a possível relação
encontrada entre menor prática de exercícios e trombose
pode se dever, na verdade, a maior frequência de uso de
anticoncepcional (que nesse caso, funciona como variável
de confusão).
A tabela abaixo sumariza as principais características
dos estudos de coorte (tabela 1).

Tabela 1 – Principais vantagens e


desvantagens de um estudo de coorte

VANTAGENS DESVANTAGENS

Investiga fatores de
risco com a certeza de Alto custo e duração
que a exposição prece- muito prolongada.
dendo o desfecho.
Melhor método para estu-
dar incidência e história Difícil de reproduzir.
natural das doenças.

Estudos de coorte 103


Permite o estudo de Suscetível a vieses
doenças fatais. de confusão.
Dificuldade em manter a
Permite o estudo de
uniformidade da coorte
múltiplos desfechos em
(perdas de seguimento,
uma única coorte.
entradas complementares).
Permite o planejamento
Limitado no estudo
prévio e detalhado do
de doenças raras.
estudo antes de seu início.

MEDIDAS DE ASSOCIAÇÃO: RISCO RELATIVO

Os estudos longitudinais, em geral, nos ajudam a pre-


dizer risco ou chance de alguém saudável, mas suscetível,
vir a apresentar uma doença quando exposto a determinados
fatores. Como indicadores de probabilidade, utilizamos as
medidas de incidência, prevalência, bem como o cálculo
de coeficientes mais específicos (medidas de associação), a
depender do desenho do estudo.
As medidas de associação ou de efeito são calculadas
através de razões, que correlacionam medidas de frequência
e nos auxiliam a compreender a força da relação estatística
entre uma variável independente (desfecho) e as variáveis
dependentes em estudo (fatores de risco ou proteção). Em
outras palavras, são grandezas que determinam se existe
associação entre exposição e doença, e qual é a natureza mais
provável dessa associação. Nos estudos de coorte, a principal
medida é o Risco Relativo (RR) e, para compreendê-lo,
precisamos reforçar alguns conceitos.
A tabela abaixo (Tabela 2), conhecida como tabela 2x2,
é utilizada para expressar os dados do estudo e possibilita

104 DESCOMPLICANDO MBE


a verificação das medidas de associação entre as variáveis.
A partir de agora, use-a como apoio para o entendimento
dos próximos parágrafos.

Tabela 2 – Resultados de um estudo de


coorte expressos em uma tabela 2x2

EXPOSIÇÃO INCIDÊNCIA DA DOENÇA

Desenvol- Não desen-


veram a volveram Total
doença a doença
Expostos a b a+b
Não-ex-
c d c+d
postos
a+b+c
Total a+c b+d
+d=N

Como já sabemos, a incidência – número de casos novos


da doença ou agravo de interesse surgidos na população,
em determinado período de tempo – é umas das informa-
ções mais importantes obtidas através do estudo de coorte.
Conhecendo-a, podemos determinar a incidência cumulativa
da doença entre expostos [IE = ] e entre não expostos [INE = c
] e, assim, comparar o risco de desenvolvimento da doença
nos diferentes grupos, a partir do cálculo do risco relativo.
Também conhecido como razão de riscos, o risco rela-
tivo nos auxilia a responder a seguinte pergunta: quantas
vezes maior é a probabilidade de os indivíduos expostos
desenvolverem a doença em relação aos indivíduos não
expostos? Para solucionar essa questão, calculamos a razão
entre as incidências cumulativas das pessoas expostas e a
das não expostas, a partir da seguinte fórmula:

Estudos de coorte 105


O valor do risco relativo nos dirá se existe, de fato, asso-
ciação entre fator de exposição e desfecho, e o que este fator
representa para a doença: risco ou proteção. Interpretamos
o risco relativo da seguinte forma:
• Se RR = 1: não existe associação entre o fator de
exposição e o desfecho, pois não houve diferença nas
incidências cumulativas entre indivíduos expostos e
não expostos. Em outras palavras, a exposição não
interferiu na ocorrência da doença.
• Se RR > 1: existe a possibilidade de o fator ser de risco,
visto que a exposição aumentou a incidência da doença.
• Se RR < 1: existe a possibilidade de o fator ser de prote-
ção, já que a exposição reduziu a incidência da doença.
Para nos ajudar a confirmar se o fator identificado é
realmente de risco ou proteção, utilizamos o intervalo de
confiança (IC) padrão de 95%: estimativa que nos diz os
possíveis valores de RR que, apesar de diferentes entre si,
são verdadeiros para aquela situação. De forma simplificada,
o IC nos diz que, se repetirmos o mesmo estudo por cem
vezes, em noventa e cinco vezes (95%), o valor verdadeiro
estará dentro de um intervalo determinado e, quanto mais
estreito esse intervalo, maior a precisão.
Por exemplo, se eu encontrei um RR de 10 em certo
estudo um intervalo de confiança (IC 95%) de (6 – 14), saberei
que na prática, para aquele mesmo fator e doença, poderei
encontrar um risco variável de 6 até 14. Ainda nessa situação,

106 DESCOMPLICANDO MBE


percebemos que o intervalo que representa a variação de
risco (6-14) está compreendido acima de 1, ou seja, o valor
de RR = 1, que nos informaria que não existe associação
entre fator e desfecho, não está incluído no intervalo. Essa
informação nos dá segurança para inferir que o fator em
estudo é realmente um fator de risco.
Em resumo, para que um intervalo de confiança
confirme o RR como um fator de risco, deve ter seu limite
inferior acima de 1, de modo que todos os valores possíveis
para o risco sejam superiores a 1 e esta unidade não esteja
inserida no intervalo. De forma semelhante, um RR será
confirmado como fator de proteção quando o limite inferior
de seu IC estiver abaixo de 1 (todos os valores possíveis serão
inferiores a 1).
Além do risco relativo, também há a possibilidade
de calcular o Risco Atribuível ao fator ou apenas Risco
atribuível (RA), medida representada pela diferença entre
as incidências cumulativas de expostos e não expostos (RA =
IE – INE), que nos indica qual é o risco adicional de desenvolver
a doença em decorrência da exposição ao fator de estudo.

CABEÇA PENSANTE

Suponhamos que uma equipe de investigadores decidiu estudar a asso-


ciação entre exposiço ao tabagismo e câncer de ovário. Para
isso, formaram uma coorte com 1400 mulheres, inicialmente
saudáveis; aplicaram um questionário para avaliar o hábito de
fumar para todas as participantes e, com isso, as dividiram em dois
grandes grupos: mulheres expostas e não expostas ao tabagismo.
Após o seguimento das coortes ao longo do tempo, encontraram os
dados mostrados na tabela abaixo:

Estudos de coorte 107


Tabela 3 – Incidência de câncer de ovário de
acordo com a exposição ao tabagismo

TABAGISMO CÂNCER DE OVÁRIO

Sim Não Total


Sim 120 480 600
Não 40 760 800
Total 160 1240 1400

Com essas informações podemos calcular as incidên-


cias cumulativas de câncer de ovário para cada grupo, o
risco relativo do desenvolvimento de câncer em decorrência
da exposição ao tabagismo, bem como, o risco adicional
atribuível a este fator. Vamos calcular juntos?

Sabemos que o risco relativo (RR) é obtido através


da razão entre as incidências de expostos e não expostos.
Assim, temos que:
Com um RR = 4, concluímos que, nesse estudo, o taba-
gismo foi confirmado como fator de risco para a ocorrência
de câncer de ovário e que mulheres fumantes tem 4 vezes
mais chance de desenvolver o câncer do que mulheres não
fumantes.
Se desejarmos saber o risco adicional de câncer de ová-
rio em decorrência exclusivamente do tabagismo, podemos

108 DESCOMPLICANDO MBE


calcular o risco atribuível (RA), através da diferença entre
as incidências cumulativas já calculadas. Logo:

Ou seja, nesse exemplo, de 20 casos de câncer de ovário


que ocorrerão para cada 100 mulheres expostas ao tabagismo,
15 casos ocorrerão por causa do cigarro.
Existem, ainda, outras medidas de associação que
podem nos auxiliar a compreender as relações entre exposição
e doença e predizer risco. No entanto, compreendendo os
conceitos de incidência, risco relativo e risco atribuível você
já será capaz de interpretar criticamente grande parte das
evidências obtidas nos estudos de coorte.

CONCLUSÃO

Os estudos de coorte são estudos analíticos, observa-


cionais e longitudinais que nos permitem estudar incidência,
história natural e prognóstico de doenças; investigar fatores
de risco ou proteção associados às mais diversas patologias e,
com isso, estabelecer recomendações e direcionar condutas.
Diversas informações podem ser obtidas a partir dos
coortes, incluindo o cálculo de medidas de associação que nos
auxiliam a entender e predizer risco. Lembre-se do coeficiente
de risco relativo como uma importante ferramenta para a
avaliação das relações entre fatores de exposição e doença.
A partir de agora, comece a olhar os estudos de coorte
com mais cuidado, utilize-os em sua prática, mantenha seu
olhar crítico e sua mente curiosa!

Estudos de coorte 109


REFERÊNCIAS

CORREIA, R. R. Conceitos Básicos em Epidemiologia e Bioestatística.


1ª edição. Fortaleza: sem editora, 2008. 30 p. Disponível em: <http://www.
epidemio.ufc.br/files/ConceitosBasicosemEpidemiologiaeBioestatistica.
pdf>. Acesso em: 30 de Jun. 2017.

DE OLIVEIRA, M. A. P.; PARENTE, R. C. M. Estudos de coorte e de


caso-controle na era da medicina baseada em evidência. Brazilian
Journal of Videoendoscopic Surgery, Rio do Janeiro, v. 3, n. 3, p.
115-25, 2010.

DIB, R, E. et al. Guia Prático de Medicina Baseada em Evidências. 1ª


edição. São Paulo: Cultura Acadêmica, 2014. 118 p.

LIMA-COSTA, M. F.; BARRETO, S. M. Tipos de estudos epidemio-


lógicos: conceitos básicos e aplicações na área do envelhecimento.
Epidemiologia e serviços de saúde, Brasília, v. 12, n. 4, p. 189-201, 2003.

LOTUFO, P. O escore de risco de Framingham para doenças cardio-


vasculares. Revista de Medicina, v. 87, n. 4, p. 232, 2008.

SUZUMURA, E. A. et al. Como avaliar criticamente estudos de coorte


em terapia intensiva. Rev bras ter Intensiva, São Paulo, v. 20, n. 1, p.
93-8, 2008.

110 DESCOMPLICANDO MBE


CASO-CONTROLE

9 Cinthia Maria Cibelle de Lima Souza


Ferdinand Gilbert Saraiva da Silva Maia
Luiz Cândido da Silva Júnior

É
um estudo longitudinal retrospectivo que parte
de casos já diagnosticados da doença em foco
e, ao mesmo tempo, seleciona outro grupo de
indivíduos que não apresentam aquele agravo. Dessa forma,
a comparação desses grupos em relação a determinadas
variáveis busca obter fatores que possam ser imputados como
causais, ou seja, presentes nas histórias dos casos mas não
nas histórias dos controles. Nos estudos de caso-controle a
pergunta está no passado, sendo, portanto, chamados de
retrospectivos. Assim, podemos dizer que são os estudos
que perguntam: o que aconteceu?
A figura 1 ilustra que, primeiramente, são recruta-
dos os sujeitos do estudo após diagnóstico de uma doença
(quadrados) e os controles sem a doença (diamantes). Após,
é feita uma retrospectiva e comparação dos grupos para

111
descobrir a presença (áreas sombreadas) ou ausência (áreas
não sombreadas) de características predisponentes ou de
fatores de risco.

Figura 1 – Caracterização dos estudos caso-controle

Além disso, esse estudo utiliza de entrevistas pessoais


ou consulta a registros como prontuários, questionários,
entrevistas e exames laboratoriais. Algumas variáveis pre-
sentes ou ausentes em ambos os grupos jamais poderão
ser dadas como uma das causas prováveis da doença; con-
trariamente, a associação de um fator a um dos grupos é
forte evidência a favor de uma inferência causal.
Inicialmente, a execução do estudo exige a escolha dos
dois grupos a serem comparados. Nesse contexto, a seleção

112 DESCOMPLICANDO MBE


dos grupos deve levar em conta sua representatividade
em relação ao total, e deve haver uniformidade no critério
adotado como meio de seleção. Além disso, para definir
estes grupos, deve-se especificar bem a doença em questão,
a fim de garantir com segurança que todos os indivíduos do
grupo caso tenham o determinado agravo.
Em adição, é importante perceber que há uma prefe-
rência por casos novos da doença escolhida, pois isso evita
vieses, já que nos casos mais crônicos, de longa duração, estão
sujeitos a diversas interferências durante o tempo. Assim,
torna-se cada vez mais difícil diferenciar se o fator estava
presente antes ou depois do início da doença. Ademais, ao
estudar os sobreviventes do agravo, o resultado poderia
ser uma associação negativa artificial entre o fator a ser
estudado e a doença.
O próprio nome do estudo nos ajuda a entender como
ele é formado, temos o grupo caso (com a doença escolhida)
e o controle (sem a doença), além disso, ambos os grupos
devem pertencer à mesma população, para que se possa
comparar os dois no que diz respeito à presença ou ausência
de determinado fator, frequência e seu grau de exposição,
pois isso significa que os dois grupos estão sob o efeito de
fatores muito semelhantes.
Para aumentar o grau de semelhança entre os casos e os
controles, pode-se utilizar um recurso chamado pareamento,
o qual pretende reduzir a possibilidade de que outros fatores
atrapalhem a associação entre a exposição e o desfecho,
denominado confundimento. Assim, esse viés ocorre quando
um outro fator, que não a exposição de interesse, distorce
a associação entre a exposição e o desfecho, limitando a

Caso-controle 113
inferência de que a exposição causa a doença. Por fim, um
exemplo de pareamento seria, então, escolher primeiro um
indivíduo com um agravo e, em seguida, identificar um
controle que não tem este agravo, mas que tem a mesma
idade e sexo do referido caso.
O estudo de caso-controle não permite produzir medi-
das de incidência específica de doenças nem calcular risco
atribuível, porque não utiliza denominadores populacionais.
Permite, somente, estimar uma medida de associação tipo
proporcionalidade, denominada “odds ratio” ou razão de
chances, principal medida de risco em um estudo caso-con-
trole, que tem a propriedade de aproximar-se do risco relativo
no caso de doenças de baixa incidência na população. Se
existir associação entre a exposição e a doença, espera-se que
a odds da exposição entre casos seja maior que a observada
entre controles.
Além disso, os dados desse tipo de estudo devem ser
analisados com muita cautela. Por estarem no passado, podem
ser inadequados pois dependem, muitas vezes, da memória
dos informantes, gerando distorções como a memorização
seletiva do evento supostamente causal. Assim, o viés de
memória ocorre quando os casos e os controles lembram-se
do seu status de exposição de forma diferente (ou diferencial).
Logo, a melhor solução para minimizar o viés de memó-
ria em estudos caso-controle é a utilização de dados que foram
colhidos de forma sistemática, antes do desenvolvimento da
doença (p.ex. prontuários organizados e completos, usados
em um sistema de saúde eficiente).
Ademais, uma outra desvantagem se dá pois, na maio-
ria das pesquisas, somente os casos mais novos devem ser

114 DESCOMPLICANDO MBE


incluídos na investigação, o que pode dificultar a obtenção
do número de participantes desejado. Como os casos não são
escolhidos aleatoriamente, pode haver prejuízo no número
de participantes. Além disso, a escolha dos controles tam-
bém é artificial, e pode introduzir variáveis de confusão e,
assim, reduzir a qualidade do estudo. Por exemplo, se meus
“casos” são câncer de pulmão e eu escolho como “controles”
pacientes com outros tipos de neoplasia, eu posso subestimar
o impacto do tabagismo como fator de risco. A definição do
grupo controle é um passo crítico na condução deste tipo de
estudo e pode, facilmente, levar a conclusões inadequadas.
Porém, trata-se de um estudo de fácil execução, de
baixo custo e que fornece resultados rapidamente. Além
disso, esse tipo de pesquisa necessita de pouco tempo para
ser desenvolvida, uma vez que a seleção de participantes é
feita após o surgimento da doença.
É, também, bastante aplicável a doenças raras
de baixa incidência, situação na qual é possível reunir
todos os indivíduos doentes de uma determinada área
geográfica. Se essa seleção for padronizada e os controles
forem provenientes de amostras representativas da mesma
população de origem dos casos, é possível produzir um
estudo de boa qualidade metodológica, capazes de sugerir
relações causais importantes.
Além disso, estudos de caso-controle dispensam um
grande número de participantes e o acompanhamento destes.
Este fato, por fim, permite a análise de muitos fatores de
risco ou hipóteses etiológicas simultaneamente. Assim, é
um estudo prático para ser reproduzido.

Caso-controle 115
CONCLUSÃO

Pesquisas do tipo caso-controle são, portanto, estudos


longitudinais retrospectivos capazes de estimar uma medida
de associação tipo proporcionalidade, bastante adequados
para agravos raros e de baixa incidência. Além disso, são
facilmente executáveis, fornecem resultados rapidamente e
demandam pequenos recursos para sua realização. Por fim,
se bem executado, seguindo as orientações anteriormente
descritas, é possível obter um estudo caso-controle de boa
reprodutibilidade.

REFERÊNCIAS

CORREIA, R. R. Conceitos Básicos em Epidemiologia e Bioestatística.


1ª edição. Fortaleza: sem editora, 2008. 30 p. Disponível em: <http://www.
epidemio.ufc.br/files/ConceitosBasicosemEpidemiologiaeBioestatistica.
pdf>. Acesso em: 30 de Jun. 2017.

DE OLIVEIRA, M. A. P.; PARENTE, R. C. M. Estudos de coorte e de


caso-controle na era da medicina baseada em evidência. Brazilian
Journal of Videoendoscopic Surgery, Rio do Janeiro, v. 3, n. 3, p.
115-25, 2010.

LIMA-COSTA, M. F.; BARRETO, S. M. Tipos de estudos epidemio-


lógicos: conceitos básicos e aplicações na área do envelhecimento.
Epidemiologia e Serviços de Saúde, Brasília, v. 12, n. 4, p. 189-201, 2003.

MATHIAS, L, A. Epidemiologia. 1ª edição. Jaboticabal: sem editora,


2014.

127. Disponível em: http://www.fcav.unesp.br/Home/departamentos/


medicinaveterinaria/LUISANTONIOMATHIAS/apostila-epidemiolo-
gia.pdf Acesso em: 30 de jun. 2017.

116 DESCOMPLICANDO MBE


ENSAIO CLÍNICO

10 Letícia Goes da Silvaԝ


Henrique de Paula Bedaqueԝ
Maria Paula Ribeiro Dantas Bezerra
Marília de Almeida Cardoso

O QUE É?

O
ensaio clínico (EC) é um tipo de pesquisa
conduzida em pacientes ou voluntários
sadios, com o intuito de demonstrar a melhor
opção terapêutica ou preventiva para o indivíduo, dispo-
nibilizando, por meio de protocolos detalhadamente dese-
nhados, tratamentos e/ou procedimentos mais modernos.
Resumidamente, é um estudo que avalia o impacto de
determinada intervenção em um determinado grupo de
pacientes. Este estudo responde a perguntas como eficácia,
efetividade, eficiência e segurança de determinado tratamento
terapêutico ou preventivo (por exemplo, testar um medi-
camento com uma molécula recém descoberta ou durante
a confecção de uma nova vacina). Apresenta arquitetura
prospectiva de seguimento (follow-up). Os bons ensaios

117
clínicos randomizados (ECR) estão no topo da hierarquia
das evidências.
Um dos primeiros EC publicados foi realizado em 1747
por Lind, um médico da Marinha Real Britânica. Este estudo
separou em grupos indivíduos acometidos por escorbuto e
tratou-os com sidra, óleo de vitríolo (ácido sulfúrico), vinagre,
água marinha, laranjas, limões e mostarda. O resultado desse
estudo foi a recuperação mais rápida dos grupos tratados
com as frutas cítricas. No entanto, mesmo com a demons-
tração e benefício evidente, a marinha britânica demorou
aproximadamente 50 anos para incorporar o suco de limão
aos suprimentos que eram ofertados aos marinheiros.

ÉTICA E CONFLITOS DE INTERESSE

Outro aspecto importante é o fato dos ensaios clínicos


serem alvos constante de debates éticos. A pesquisa com
seres humanos é uma prática recente e por isso, até o início
do século XX, pouco se discutia sobre a ética dessa prática
incipiente. Segundo a ética da publicação científica, os resul-
tados obtidos devem ser publicados, sejam eles positivos ou
negativos, principalmente os ensaios clínicos por envolverem
seres humanos.
Um caso polêmico foi o da pesquisadora Nancy
Olivieri que revelou dados negativos acerca do medicamento
Deferiprone, que ela mesma estava estudando, contrariando
os interesses e as instruções do laboratório patrocinador e
de sua própria universidade.
Quando se fala de ética na pesquisa intervencionista
com seres humanos, não podemos deixar de mencionar os

118 DESCOMPLICANDO MBE


experimentos atualmente considerados imorais da inocu-
lação do vírus da hepatite em crianças com retardo mental
internadas na Escola Estatal de Willowbrook e da injeção
de células cancerígenas em pacientes gravemente doentes
hospitalizados no Hospital Judeu para Doenças Crônicas
de Brooklyn. Por esses e outros motivos, tais como a rápida
evolução desses estudos, tornou-se necessária uma vigilância
e controle por meio de órgãos reguladores.
No Brasil, os estudos devem passar pelos CEPs (Comitês
de Ética em Pesquisa) e serem aprovados pela ANVISA,
que avalia os aspectos sanitários e autoriza importação
de medicamentos e/ou equipamentos quando necessário.
Além disso, os multicêntricos (realizados em vários centros)
devem passar também pela CONEP (Comissão Nacional de
Ética em Pesquisa). Atualmente, o documento internacional
que discute a ética dos ensaios clínicos é a Declaração de
Helsinque, 1964, revista em Tóquio em 1975. Entre os docu-
mentos nacionais de relevância estão o Código de Ética
Médica e as Normas de Pesquisa envolvendo seres Humanos
do Conselho Nacional de Saúde.
Em resumo, deve-se garantir que os participantes rece-
bam o melhor tratamento disponível e a intervenção a ser
testada deve ser de eficácia pelo menos igual ao tratamento
disponível e utilizado. É importante também que, para a
realização de um EC, seja realizado um protocolo detalhado
e claro, contendo,por exemplo, motivos que culminem na
interrupção do estudo antes do planejado (quando é percebida
uma diferença grande e significativa entre os dois grupos),
os critérios de aplicação da intervenção, como será feito o
acompanhamento dos dois grupos ao longo do estudo, além

Ensaio clínico 119


de um termo de consentimento livre e esclarecido (TCLE)
previamente aprovado pelo CEP.
Além dos aspectos éticos envolvidos nesse tipo de
estudo, um tema bastante pertinente quando falamos de
EC diz respeito aos conflitos de interesse, definidos como
um choque entre interesses pessoais e obrigações essenciais
de um indivíduo que exerce um cargo de confiança, de
acordo com o dicionário Houaiss. Dessa forma, podemos
entendê-lo como um conjunto de condições que tornam o
julgamento profissional relativo a um interesse primário
ou secundário, como o bem estar do paciente ou a validade
de uma pesquisa, influenciado Inapropriadamente por um
interesse secundário, como ganho financeiro, por exemplo.
Na pesquisa clínica existe um grande potencial para o
conflito de interesse (estudos longos e de alto custo financeiro)
que podem, muitas vezes, não ficar claro até mesmo para
os pesquisadores. Dessa forma, muitos ensaios clínicos são
patrocinados e custeados pela indústria farmacêutica que
detém a patente de um medicamento. É importante ressaltar
que a empresa patrocinadora só pode iniciar os estudos em
humanos quando a autoridade sanitária (FDA nos Estados
Unidos, a EMEA na Europa e a ANVISA no Brasil) se satisfaz
com a análise cautelosa dos protocolos do projeto de pesquisa,
que demonstram não haver dados que impliquem em risco
inaceitável para os pacientes.
É fundamental que os autores e revisores declarem em
uma sessão específica de sua publicação se existem conflitos
de interesse e quais são eles.

120 DESCOMPLICANDO MBE


FASES PARA REALIZAÇÃO DE
UM ENSAIO CLÍNICO

Existem várias fases para a realização de um ensaio


clínico. Vamos entender melhor cada uma delas:
Em primeiro lugar, é feita uma fase pré-clínica. Ela
consiste na descoberta de uma nova molécula (ou seleção
de uma molécula já existente) e realização de testes in vitro.
Também é comum que sejam feitos testes em animais para
verificar se a molécula é suficientemente segura para ser
testada em humanos.
Caso a substância passe pela fase anterior e seja con-
siderada segura, iniciam-se as fases clínicas, subdivididas
em quatro.
A fase I é realizada em um um pequeno número de
pacientes (aproximadamente 20 a 80 indivíduos). São geral-
mente indivíduos saudáveis e na maior parte das vezes não há
grupo controle. São feitos testes de tolerância dos organismos
à droga, para que sejam avaliados os efeitos adversos. O
objetivo é verificar a segurança e não a eficácia da substância.
Deve-se procurar estabelecer uma dose aceitável, que pode
ser obtida submetendo os participantes à doses escalonadas
crescentes da droga. É também nesta fase que são realizados
estudos de metabolismo e biodisponibilidade do fármaco.
A fase II também envolve um pequeno número de
indivíduos, geralmente que apresentam a mesma patologia
que está sendo estudada. Aqui, o objetivo é analisar a relação
dose-efeito da droga testada, além de avaliar a eficácia e
investigar possíveis efeitos colaterais. É constituída aproxi-
madamente por 100 a 200 pacientes.

Ensaio clínico 121


A fase III constitui uma avaliação em larga escala
do tratamento e objetiva confirmar a eficácia e monitorar
os principais efeitos colaterais comuns nos pacientes que
utilizam a terapêutica. Durante essa fase, o medicamento
em estudo deve ser administrado em uma população de
pacientes semelhante àquela a que se destina o produto
durante sua comercialização.
Após a fase III são realizadas novas revisões dos acha-
dos das fases pré-clínica e clínica e então o produto pode
ser comercializado.
A fase IV é definida pela comercialização e vigilância
(post-marketing surveillance) do produto. Deve-se avaliar, a
médio e longo prazo, a ocorrência de efeitos colaterais não
relatados previamente. É comum que quando a droga é usada
em um grande número de pessoas ocorram efeitos adversos
novos, não foram observados nas fases anteriores, e que
podem fazer com que a droga seja até retirada do mercado.
Exemplo: Isso aconteceu com a talidomida, fármaco
prescrito no início da década de 60 para alívio das náuseas
em gestantes. O medicamento foi retirado do mercado após
alguns anos da sua comercialização devido ao seu efeito
teratogênico.

122 DESCOMPLICANDO MBE


Figura 1 – Demonstração esquemática das fases clínicas

COMO FUNCIONA?

Vamos tratar aqui do desenho dos ensaios clínicos de


fases 2 ou 3, que são os que mais comumente o profissional
da saúde precisará ler e interpretar. Em primeiro lugar, o
investigador determina que tipo de população vai participar
do estudo. Para isso, existem os critérios de inclusão. Se é
um estudo para avaliar uma droga anti-hipertensiva, por
exemplo, é razoável que um dos critérios de inclusão seja
o paciente possuir Hipertensão Arterial Sistêmica. Além
disso, normalmente se determina a idade como um critério
de inclusão: o pesquisador pode determinar que só pacientes
de 18 a 65 anos (por exemplo) sejam incluídos no seu estudo.
Ademais, é comum que também exista a determinação
dos critérios de exclusão. No exemplo citado, temos que
pacientes com HAS e Idade entre 18 e 65 anos seriam incluídos
no estudo da droga anti-hipertensiva. Entretanto, se a droga
em questão fosse nefrotóxica, já é esperado que cause dano a

Ensaio clínico 123


pacientes com doença renal, então possuir doença renal pode
ser um critério de exclusão. Assim, um paciente de 40 anos
com HAS e doença renal crônica seria excluído do estudo.
É importante entender que critérios de inclusão e
exclusão não são opostos. Pacientes menores de 18 anos ou
que não possuem HAS não são excluídos do estudo, eles
simplesmente não são incluídos! Critério de exclusão é algo
aplicado em pacientes que já entrariam no estudo pelos
critérios de inclusão, mas serão excluídos por algum motivo.
Também é essencial analisar se esses critérios fazem
sentido com o que é proposto. Não é interessante que os
critérios de inclusão sejam muito restritos, pois diminui
bastante o tamanho da amostra. Muitos critérios de exclusão
também devem nos deixar desconfiados: se é uma droga
nefrotóxica, aceitamos que sejam retirados os pacientes que
possuem doença renal. Mas se o estudo resolver colocar
vários outros critérios de exclusão como doença hepática,
doença cardiovascular, diabetes, outras comorbidades… É
possível que o estudo esteja pegando só pacientes menos
graves, e assim ficaria “fácil” demonstrar a eficácia da droga.
Uma vez definida a população do estudo, os partici-
pantes são divididos em no mínimo dois grupos: um grupo
teste/intervenção, o qual vai receber a intervenção ou droga
a ser testada e o grupo controle, que receberá a terapêutica
considerada padrão, ou seja, de eficácia comprovada por
outros estudos preexistentes, ou um placebo, quando inexiste
uma terapêutica considerada eficiente ou consagrada. O
placebo, por sua vez, é uma substância de aparência, forma
e administração semelhante à medicação que está sendo
avaliada, porém não contém o princípio ativo da mesma.

124 DESCOMPLICANDO MBE


O ideal é que a divisão de quem vai para qual grupo
seja feita não por escolha do pesquisador, mas por rando-
mização. Essa randomização consiste em uma espécie de
sorteio: uma parte dos pacientes irá para o grupo intervenção
(aqueles que receberão a droga testada) e outra parte para
o grupo controle (receberão placebo). E qual a importância
da randomização?
A randomização garante que outras características dos
pacientes serão “embaralhadas” em quesitos que poderiam
influenciar (idade, comorbidades, gravidade da doença,
centros em que foram tratados). Dessa forma, os dois grupos
se tornam bem semelhantes, e o único fator que muda entre
eles é o fato de um tomar a droga e outro não. Assim, se um
grupo melhorar mais que o outro, é mais fácil atribuir essa
melhora ao uso da droga.
Depois da definição dos grupos, tanto o grupo placebo
quanto o grupo intervenção são acompanhados por um
período de tempo (o período de follow up). Durante esse tempo,
é analisado o que aconteceu com cada um desses pacientes,
e a quantidade de desfechos que ocorreu em cada grupo,
para que seja possível comparar os dois grupos e chegar a
uma conclusão.
Desfecho é justamente a variável que queremos analisar
para avaliar o impacto de uma intervenção ou exposição na
saúde de uma população. Exemplos de desfechos muito usa-
dos são mortalidade e melhora clínica. O desfecho primário
é a variável mais importante para responder a pergunta da
pesquisa. Desfechos secundários são desfechos adicionais
monitorados para auxiliar a interpretação dos resultados do
desfecho primário.

Ensaio clínico 125


Idealmente, o desfecho primário de um ensaio clínico
deve ser um desfecho muito relevante para o paciente. No
exemplo que estamos usando de um estudo para uma droga
anti-hipertensiva, avaliar mortalidade como desfecho primá-
rio seria pertinente, pois nosso principal objetivo ao tratar
a hipertensão de um paciente é evitar que ele morra por
complicações dessa hipertensão. Um desfecho secundário
poderia ser, por exemplo, a presença de infarto agudo do
miocárdio. Assim, para avaliar a eficácia do anti-hipertensivo,
podemos contabilizar quantas pessoas morreram do grupo
intervenção (quantas pessoas apresentaram o desfecho no
grupo teste) X quantas pessoas morreram do grupo controle
(quantas pessoas apresentaram o desfecho no grupo controle).
Dessa forma, é feita uma comparação estatística para ver se
houve diferença.
Veja essa tabela para entender melhor o que encontrar
em cada parte de um ensaio clínico!
Aqui o autor discorre sobre a impor-
tância do tema, as evidências ou tra-
Introdução tamentos prévios que existem para
aquela doença, de que forma esse novo
tratamento poderia ser benéfico.
Local do artigo onde está o desenho do
estudo. É importante que sejam descritos
os critérios de inclusão e exclusão, quantos
participantes fizeram parte da pesquisa, se
Metodologia
houve e de que forma foi realizada a randomi-
zação, quais desfechos foram avaliados, como
foi aplicada a intervenção, detalhamento
sobre a coleta e análise estatística dos dados.ԝ

126 DESCOMPLICANDO MBE


Nessa seção, devem estar presentes uma
análise das características de base de
cada grupo, os resultados daԝ análise dos
Resultados
desfechos do grupo tratamento e grupo
controle, além de resultados de possí-
veis efeitos colaterais apresentados.
Na discussão, o autor interpreta os resultados
encontrados e comenta sobre seu possível
impacto na conduta médica, levando em
Discussão
consideração riscos e benefícios e evidências
anteriores. Além disso, devem ser discutidas
limitações do estudo e potenciais vieses.
Uma breve conclusão em relação ao que
foi encontrado no artigo: O tratamento
Conclusão
se mostrou benéfico e deve ser adotado?
Ressalvas? Efeitos colaterais importantes?

ANALISANDO UM ENSAIO CLÍNICO

Agora você já sabe o que é um ensaio clínico, as ques-


tões éticas envolvidas, como ele funciona, quais as fases para
sua realização. Mas sua análise não pode parar por aqui! Será
que você pode confiar na informação advinda de qualquer
ensaio clínico?
Muitas vezes existem falhas na metodologia dos estu-
dos que fazem com que sejam encontradas conclusões que
não são verdadeiras, os chamados Vieses. Além disso, o
estudo pode ter encontrado uma associação simplesmente
por acaso, os chamados erros aleatórios. Caso isso aconteça,
você pode ser levado a acreditar que uma droga funciona
quando ela é, na verdade, deletéria para os seus pacientes!
Existem ferramentas que podem ser muito úteis para
analisar a qualidade de um Ensaio Clínico, como por exemplo,
o checklist CONSORT. São ferramentas criadas para que o

Ensaio clínico 127


leitor tenha um guia em mãos ao ler o artigo, e vá analisando
se o artigo apresentou cada ponto daquele checklist.
Para aprender a analisar criticamente um Ensaio
Clínico e não cair nessas “armadilhas” sugerimos que leia
os capítulos de “Como analisar um Artigo Científico” e
“Erros e viéses”.

VANTAGENS E LIMITAÇÕES

Dentre as principais vantagens dos EC, destacam-se:


A alta credibilidade dos resultados quando realizados com
uma metodologia adequada; A semelhança entre os grupos
teste e controle (quando randomizados), evitando viés de
confusão; Segurança de que o tratamento é aplicado antes
do aparecimento do efeito.
Já as principais limitações incluem: impossibilidade
ética de ser aplicado em certas situações (por exemplo no
estudo do efeito das viroses na gravidez sobre recém nasci-
dos); possibilidade de desistência de alguns pacientes durante
tratamento (levando a perda de follow up, e consequentemente,
de poder estatístico); o fato de alguns participantes estarem
deixando de receber um tratamento altamente benéfico;
dificuldade de obter conclusões seguras se o tempo necessário
para os efeitos é grande após a conclusão do tratamento;
necessidade de uma estrutura administrativa e técnica de
porte razoável: maior custo, tempo para planejamento e
realização do estudo; podem não ser generalizáveis (validade
externa).
A validade externa diz respeito ao fato dos resultados
serem válidos para grupos de pacientes diferentes dos que

128 DESCOMPLICANDO MBE


participaram da pesquisa. Por exemplo, se um estudo avaliou
o uso de uma medicação para dislipidemia em vários pacien-
tes diabéticos, mas não hipertensos, não temos a garantia
de que o fármaco irá funcionar da mesma forma quando o
paciente tiver hipertensão.

CONCLUSÃO

Por ser um desenho de estudo de alto grau de evi-


dência, o Ensaio Clínico é um forte indutor de mudança
de conduta na prática clínica. Por isso, é importante que o
profissional de saúde conheça esse tipo de estudo e aprenda
a analisar criticamente esses artigos, evitando que estudos
mal elaborados afetem o tratamento de pacientes. Além
disso, é imprescindível que ao dispor de uma boa evidência,
o profissional avalie sua aplicabilidade. Por mais que uma
droga tenha se provado altamente benéfica em um estudo,
é necessário avaliar o perfil do paciente, as expectativas
dele e dos familiares, os custos (monetários ou não) daquela
conduta e compreender o processo de tomada de decisão
compartilhada e com base em incertezas.
Vale ressaltar também a importância da publicação
dos resultados, sejam eles positivos ou negativos, tendo em
vista que as intervenções são aplicadas em vidas humanas e
esses resultados asseguram danos evitáveis e/ou benefícios
evidentes de novas intervenções terapêuticas ou preventivas.

Ensaio clínico 129


REFERÊNCIAS

BERWANGER, O. et al. Os dez mandamentos do ensaio clínico ran-


domizado-princípios para avaliação crítica da literatura médica. Rev.
bras. hipertens, São Paulo, v. 13, n. 1, p. 65-70, 2006.

CASTRO, R. C. F., Registros de ensaios clínicos e as consequências


para as publicações científicas. Planejamento e condução de estudos
clínicos de alta evidência científica, Capítulo IV. Medicina (Ribeirão
Preto) 2009;42(1): 31-5.

DAINESI, S. M., GOLDBAUM, M. Pesquisa clínica como estratégia de


desenvolvimento em saúde. São Paulo: Elsevier, 2012.

DIB, R, E. et al. Guia Prático de Medicina Baseada em Evidências. 1ª


edição. São Paulo: Cultura Acadêmica, 2014. 118 p.

ESCOSTEGUY, C. C., Tópicos Metodológicos e Estatísticos em Ensaios


Clínicos Controlados Randomizados. Arq Bras Cardiol .volume 72, (nº
2), 1999. Rio de Janeiro.

HARDMAN J. G, LIMBIRD L. E, GILMAN AG. GOODMAN &

GILMAN’S. The Pharmacological basis of therapeutics. Québec:


McGraw-Hill; 2001.

HIGGINS, J. P. T., GREEN, S. (Ed.). Cochrane handbook for systematic


review of interventions. Version 5.1.0 [updated March 2011]. Oxford:
The Cochrane Collaboration, 2011.

HOUAISS, ANTÔNIO. Dicionário Houaiss da Língua Portuguesa.


Rio de. Janeiro, Ed. Objetiva, 2001.

KOTTOW, M. História da ética em pesquisa com seres humanos.


RECIIS – R. Eletr. de Com. Inf. Inov. Saúde. Rio de Janeiro, v. 2, Sup.1,
p. Sup.7- Sup. 18, Dez., 2008

130 DESCOMPLICANDO MBE


KRUGMAN S, GILES JP, HAMMOND J. Infectious hepatitis: evidence
for two distinctive clinical, epidemiological, and immunological types
of infection. JAMA. 1967; 200(5): 365-73.

LANGER, E. Human experimentation: New York verdict affirms


patient’s rights. Science. 1966; 151(3711): 663-6.

LIMA, J. S., REZA, D. L., TEIXEIRA, S., COSTA, C. Pesquisa clínica:

fundamentos, aspectos éticos e perspectivas. Artigo de revisão.


Revista da SOCERJ - Out/Nov/Dez 2003. Vol 16, n. 4.

MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p.

MATHIAS, L, A. Epidemiologia. 1. ed. Jaboticabal: sem editora, 2014.


127. Disponível em: <http://www.fcav.unesp.br/Home/departamentos/
medicinaveterinaria/LUISANTONIOMATHIAS/apostila-epidemiolo-
gia.pdf> Acesso em: 30 de jun. 2017.

MORRONE, F. B., ZUCCHETTI, C. Perfil da pesquisa clínica no Brasil.


Artigo de revisão. Rev HCPA. 2012; 32(3).

SCHAFER, A. Biomedical conflicts of interest: a defense of the seques-


tration thesis – learning from the cases of Nancy Olivieri and David
Healy. J Med Ethics. 2004; 30:8-24.

THOMPSON, D. F. Understanding financial conflicts of interest. N


Engl J Med. 1993; 329:573-6.

FERREIRA, Juliana Carvalho; PATINO, Cecilia Maria. Types of


outcomes in clinical research. Jornal Brasileiro de Pneumologia,
[s.l.], v. 43, n. 1, p. 5-5, fev. 2017. FapUNIFESP (SciELO). http://dx.doi.
org/10.1590/s1806-37562017000000021.

Ensaio clínico 131


REVISÃO
SISTEMÁTICA

11 Géssika Lanzillo de Almeida Nunesԝ


Henrique de Paula Bedaqueԝ
Isadora Soares Lopes
Marília de Almeida Cardoso

O QUE É?

A
Revisão Sistemática (RS) é considerada uma
evidência secundária pois está baseada na
análise de estudos primários sobre um deter-
minado tema de pesquisa. Ou seja, a revisão sistemática é a
análise de uma seleção de trabalhos (relevantes) já publicados
sobre um tema com o intuito de responder uma pergunta
de pesquisa bem definida, identificando, analisando e sin-
tetizando as evidências disponíveis. É por isso que a RS é a
principal fonte para a construção das diretrizes utilizadas
na medicina.
Esse tipo de revisão obedece normas rígidas na sua
elaboração com o objetivo de reduzir a possibilidade de viés
e garantir sua reprodutibilidade.

133
Uma das primeiras RS de que se tem registro foi ela-
borada em 1753 para reunir as diretrizes sobre a prevenção e
o tratamento do escorbuto, uma doença muito prevalente na
época. É claro que a metodologia sofreu alterações durante
esse período, mas consolidou-se no fim da década de 80 com
algumas publicações significativas e no início da década de
90 com a criação da Colaboração Cochrane, no Reino Unido.
A Colaboração Cochrane é uma organização sem fins
lucrativos que foi criada para atender à demanda médica por
revisões sistemáticas e ensaios clínicos randomizados. Os
resultados das RS elaboradas pelo grupo Cochrane ficam
disponíveis online, na Biblioteca Cochrane, e são frequen-
temente utilizados.

QUAIS SÃO OS TIPOS?

A RS é um tipo de Revisão de Literatura, porém o termo


Revisão de Literatura frequentemente é utilizado para se
referir à Revisão Narrativa, que é um outro tipo de Revisão
de Literatura. Ficou confuso? Vamos detalhar melhor.
Existem 3 tipos de Revisão de Literatura no meio aca-
dêmico, são elas: Revisão Sistemática, Revisão Narrativa
(RN) e Revisão Integrativa (RI). A Revisão Narrativa é fre-
quentemente chamada de Revisão de Literatura, porém ela
é apenas um dos tipos. Esses três tipos se diferenciam pelo
método de elaboração.

134 DESCOMPLICANDO MBE


Figura 01 – Tipos de Revisão de Literatura

A RN não utiliza critérios estabelecidos e sistemáticos


na busca dos trabalhos que serão utilizados e também não
há uma estratégia de busca pré definida. A sua elaboração
está sujeita à subjetividade do autor. Esse tipo de revisão é
bastante utilizado em fundamentações teóricas de artigos,
teses e trabalhos de conclusão de curso. Como você pode
perceber, trata-se de uma revisão com muitas possibilidades
de viés.
Já a RI é utilizada quando se quer comparar e combinar
estudos de vários tipos diferentes (como estudos observa-
cionais e de intervenção). Ela tem um caráter mais amplo do
que a RS porque permite a análise combinada de dados da
literatura empírica e teórica mantendo o rigor da metodologia
da RS.
Por outro lado, a RS é uma investigação científica:
testa hipóteses, levanta dados, sintetiza resultados e avalia
criticamente a metodologia que foi utilizada na elaboração
dos trabalhos. Ela busca responder uma pergunta de pesquisa
claramente formulada e utiliza métodos rigorosos na busca
e seleção dos estudos primários. Apesar de haver vários

REVISÃO SISTEMÁTICA 135


tipos de estudos primários, os mais utilizados na RS são
os Ensaios Clínicos Randomizados (ECR). Entre os outros
tipos de estudos usados, estão os estudos observacionais
comparativos de fatores de risco e prognóstico e os de acurácia
diagnóstica. Dessa forma, a RS depende da qualidade de
suas fontes primárias.
Dentro da RS podemos ter a Metanálise, que é a soma
estatística dos resultados dos estudos analisados. Dessa
forma, uma Revisão Sistemática que contemple a soma esta-
tística dos resultados é uma Metanálise, contudo, nem toda
Revisão Sistemática terá uma Metanálise. Você pode estudar
mais profundamente a Metanálise no capítulo deste livro
que foi destinado a ela.

COMO SE FAZ?

O Ministério da Saúde disponibiliza manuais com as


diretrizes para elaboração de RS de acordo com o tipo de
estudo que se quer analisar, entre eles os estudos de acu-
rácia diagnóstica, os estudos observacionais comparativos
sobre fatores de risco e prognóstico e os ECRs. É importante
consultar os manuais com as diretrizes quando se deseja
elaborar uma RS.
Contudo, de forma mais geral, existem alguns passos
fundamentais para a elaboração de uma RS de qualidade,
resumidos nesta tabela e discutidos a seguir:

136 DESCOMPLICANDO MBE


Tabela 1 – Etapas da elaboração de
uma Revisão Sistemática

1. Elaboração da pergunta de pesquisa: Uma boa pergunta


de pesquisa contempla alguns componentes que estão
relacionados no acrônimo PICOS. A população (P) que
está sendo analisada; a intervenção ou o medicamento
(I) que está sendo analisado; se houver alguma compa-
ração (C) com outra intervenção, outro medicamento
(ou até mesmo placebo), deve constar na pergunta; o
desfecho (O, do inglês outcome) ou o resultado que você
espera (Ex: é mais efetivo? É menos efetivo?); por fim,
o tipo de estudo (S, do inglês study type) também deve

REVISÃO SISTEMÁTICA 137


constar na pergunta. Exemplo: “O uso de anticoncep-
cional em mulheres entre 15 e 40 anos aumenta o risco
de eventos trombóticos? Uma Revisão Sistemática de
Ensaios Clínicos Randomizados”.
Neste exemplo de pergunta nós contemplamos a
população (mulheres entre 15 e 40 anos), a intervenção ou
medicamento (neste caso, o medicamento anticoncepcional),
o desfecho (aumento do risco de eventos trombóticos) e o
tipo de estudo realizado (Revisão Sistemática) compilando
dados de ensaios clínicos.
Nós falamos mais detalhadamente sobre a elaboração
da pergunta de pesquisa porque ela é fundamental para
determinar a qualidade do estudo. Por isso, seja especial-
mente cuidadoso na hora de elaborar a sua pergunta, a qual
representa o objetivo da realização do seu estudo. Quando
estiver lendo uma revisão sistemática, a pergunta de pesquisa
que o estudo se propõe a responder deve estar descrita na
introdução do artigo.
2. Busca por revisões prévias na literatura: essa é uma
das etapas preliminares na elaboração de uma RS e
é importante sempre procurar por outras Revisões
Sistemáticas com o mesmo tema e se assegurar de que
a sua pergunta de pesquisa ainda não foi estudada.
Para isso você pode utilizar as plataformas de pesquisa
disponíveis. As Universidades disponibilizam algumas
plataformas para os alunos, e é importante você se
informar sobre os meios acessíveis para a sua busca.
A Biblioteca Cochrane, a Biblioteca Virtual em Saúde
e o Center for Reviews and Dissemination (CRD) são
as principais plataformas que devem ser buscadas.

138 DESCOMPLICANDO MBE


3. Elaboração do Protocolo de Revisão: este protocolo é um
documento que descreve a metodologia que será utili-
zada. Ele deve contemplar os critérios de elegibilidade,
as bases de dados que serão pesquisadas, as estratégias
de busca que serão aplicadas, o processo de seleção
dos artigos (tempo de publicação da pesquisa, quais
serão as línguas dos artigos pesquisados, entre outros)
e extração dos dados, o plano de análises estatísticas,
desfechos e análise de sensibilidade de interesse. A
Colaboração Cochrane disponibiliza um modelo de
protocolo no seu software de gerenciamento de revisões
(Review Manager), disponível no site da organização.
4. Busca de potenciais estudos elegíveis: devem ser uti-
lizadas bases de dados eletrônicas e bases de dados
bibliográficas. A busca deve ser completa, objetiva e
reprodutível. Deve-se especificar o período que está
sendo contemplado pela busca.
As principais bases de dados eletrônicas para estudos
de ECR são: CENTRAL (The Cochrane Central Register of
Controlled Trials The Cochrane Library), MEDLINE (Medical
Literature Analysis and Retrieval System Online/ PubMed),
EMBASE (Elsevier) e LILACS (Literatura Científica e Técnica
da América Latina e Caribe / BVS – Biblioteca Virtual em
Saúde).
A busca por estudos não publicados é mais difícil,
porém há algumas ferramentas que podem auxiliar, como o
site Clinical Trials e o Registro Brasileiro de Ensaios Clínicos.
É importante pesquisar e monitorar esses trabalhos, pois eles
podem ser finalizados e publicados durante a elaboração da
revisão e acabarem sendo excluídos da análise.

REVISÃO SISTEMÁTICA 139


Também é necessário elaborar uma boa estratégia de
busca em cada base e registrá-la na metodologia, assim como
as datas de acesso. Existem estratégias de busca validadas
encontradas no Handbook da Cochrane (disponível no site
da Organização).
5. Avaliação da elegibilidade dos estudos: Inicialmente,
faz-se uma triagem através da leitura dos títulos e
dos resumos dos artigos encontrados na busca. Nessa
triagem, são descartados os estudos que fogem aos
critérios de elegibilidade e os estudos que aparecem
em mais de uma base de dados. Essa etapa deve ser
realizada por dois revisores de forma independente e
depois é feita uma comparação entre as seleções feitas
por cada um. Caso haja discordância, se um dos dois
revisores consideraram o artigo elegível, ele é passado
para a fase seguinte.
Na fase seguinte, todos os estudos que passaram na
triagem inicial são lidos de forma mais detalhada (leitura
completa), novamente por dois revisores de forma indepen-
dente. Nesta fase, são estabelecidos os critérios de inclusão
através de uma ficha clínica padronizada. Os casos de discor-
dância entre os revisores são resolvidos através de consenso
ou de um terceiro revisor.
Ao final deste processo, os artigos que passaram pela
segunda fase serão os que irão compor a Revisão Sistemática.
As revisões sistemáticas costumam incluir no corpo do texto
um diagrama para representar o processo de seleção dos
artigos, como exemplificado na figura abaixo.

140 DESCOMPLICANDO MBE


Figura 2 - Fluxo de seleção dos artigos

6. Avaliação da qualidade dos estudos: esta é uma etapa


importante na elaboração de uma Revisão Sistemática
e consiste na análise da qualidade metodológica dos
estudos incluídos. Essa análise procura avaliar o risco
de alguns principais vieses em cada estudo de forma
individual e, de preferência, deve ser também reali-
zado pelos dois pesquisadores. Ao final dessa análise
crítica, os estudos são classificados como baixo, alto
ou incerto risco de viés em um determinado domínio,
e esta informação é geralmente apresentada em uma
tabela.
Existem alguns instrumentos que podem ser usados
para essa análise independente de cada estudo e ajudam a
tornar esse processo mais objetivo. Um exemplo deles é o
Cochrane Risk of Bias Tool, uma ferramenta da colaboração
Cochrane para analisar risco de vieses em Ensaios Clínicos
Randomizados. Essa ferramenta inclui uma análise da qua-
lidade metodológica em vários domínios, como a qualidade

REVISÃO SISTEMÁTICA 141


do processo de randomização, o cegamento dos participantes
e/ou da equipe médica, o cegamento dos avaliadores do
desfecho, o método usado para avaliar os desfechos, dados
incompletos de desfechos, apresentação seletiva dos desfechos
e desvios em relação à análise pré-especificada dos dados.
Essa ferramenta está disponível online e sua forma de utili-
zação é descrita no Handbook da Colaboração Cochrane. É
interessante que tais instrumentos sempre sejam usados na
avaliação da qualidade metodológica dos estudos, de modo
a tornar a avaliação para o risco de viés semelhante em cada
um deles e menos subjetiva.
7. Extração de dados: É feita também por dois revisores de
forma independente e as discordâncias são resolvidas
por consenso ou por um terceiro revisor. Nesta etapa
também é elaborada uma ficha clínica constando
os dados que deverão ser coletados dos estudos.
É importante que os revisores estejam treinados e
nivelados para que não haja muitas divergências na
coleta. Após a extração dos dados relevantes, eles são
organizados em tabelas e analisados.
8. Síntese e análise dos dados: Nesta etapa, são feitas
tabelas com as características de base dos estudos
relevantes e um organograma de fluxo e seleção dos
artigos. Também deve-se determinar os parâmetros
estatísticos utilizados e, caso a revisão permita uma
metanálise, é preciso determinar as fontes de hetero-
geneidade presentes. Existe uma série de modelos e
métodos para organizar e analisar esses dados, além
de programas para cálculo de metanálise. O melhor

142 DESCOMPLICANDO MBE


método/modelo será escolhido de acordo com o tipo
de variável que se quer analisar.
9. Redação e publicação: Inclui a elaboração escrita da
Revisão respeitando as diretrizes estabelecidas e a
publicação. Além da extração, síntese e análise dos
dados e da metanálise (quando houver), uma parte
importante da redação é a discussão e a conclusão do
estudo, as quais devem ser estruturadas (o Handbook
da Cochrane possui alguns tópicos que ajudam nessa
estruturação) e devem:
• Contemplar as considerações e implicações da revisão
para a prática clínica;
• Sumarizar os principais achados e possíveis pendências
que o estudo não tenha conseguido cumprir;
• Observar a abrangência e a aplicabilidade do estudo,
bem como a qualidade da evidência gerada pela revi-
são, possíveis vieses na elaboração e concordâncias e
discordâncias com outros estudos e revisões sobre o
mesmo tema.
A respeito dos itens essenciais que devem constar no
texto de uma Revisão Sistemática, existem algumas ferramen-
tas disponíveis que auxiliam autores a elaborar a redação,
revisores e editores de jornais a avaliarem a qualidade do
texto, e também nos ajudam, leitores críticos e interessados,
a avaliar o conteúdo presente na RS.
Nesse contexto, um exemplo desse tipo de ferramenta
é o PRISMA Checklist. Trata-se de um checklist com 27 itens
que contém dados a serem apresentados no corpo do texto
de uma revisão sistemática e metanálise e inclui critérios

REVISÃO SISTEMÁTICA 143


a serem avaliados no título, resumo, introdução, métodos,
resultados, discussão e financiamento. Os dados presentes no
checklist também podem servir como uma orientação inicial
para avaliação das etapas de elaboração de uma RS. Como
exemplo, um dos dos itens presentes na seção de “Métodos”
do checklist diz respeito aos critérios de inclusão escolhidos,
avaliando se estes especificam as características desejadas
no desenho do estudo e características externas, como anos
de publicação, idioma, entre outros.
Por fim, sabemos que é importante estar atento em
todo o decorrer da elaboração de uma RS e procurar pelos
principais erros metodológicos que levam a distorções no
resultado da pesquisa. Dentre eles, é importante citar a
heterogeneidade, que limita a comparação entre os estudos,
pois a utilização de estudos com metodologias muito distintas
impossibilita, muitas vezes, uma metanálise real e efetiva.
A heterogeneidade pode ser calculada estatisticamente e
pode servir como indicador de qualidade da RS. Outro
erro sistemático que devemos estar atentos é o do viés de
publicação, que, em linhas gerais, define uma preferência
editorial por publicar estudos com resultados positivos. Nesse
contexto, podemos citar como exemplo um laboratório que
está financiando um estudo sobre um medicamento X e os
testes não apresentaram o resultado desejado. O laboratório,
então, decide não publicar o estudo e o mesmo, portanto,
não constará na busca. Dessa forma, o resultado da RS não
contemplará todos os possíveis dados pesquisados. O que
temos, então, é um viés decorrente do fato de serem mais
publicados resultados positivos, favoráveis à hipótese testada,
do que resultados negativos.

144 DESCOMPLICANDO MBE


O conhecimento dos vieses é importante não apenas
na construção, mas também na análise da qualidade de uma
Revisão Sistemática. Um pouco mais sobre esses vieses está
descrito nos capítulos deste livro de Metanálise e de Erros
e Vieses.

QUE CONCLUSÕES ELA PODE ME DAR?

A RS permite solucionar controvérsias entre estudos


com estimativas divergentes; aumenta o poder estatístico
quando os estudos são inconclusivos; permite a generaliza-
ção de dados, aumentando a validade externa dos estudos;
identifica a necessidade de estudos maiores e definitivos
quando a sua metanálise é inconclusiva; responde perguntas
que não são abordadas pelos estudos individualmente por
permitir uma integração e análise combinada de dados
de estudos diferentes. Ela também permite uma análise
melhor de subgrupos e diminui o intervalo de confiança
possibilitando uma estimativa mais precisa sobre o efeito
de um tratamento (quando analisa ensaios clínicos).
Por fim, a Revisão Sistemática é uma ferramenta
poderosa no mundo da Medicina Baseada em Evidências
(MBE). Sua construção demanda muita organização, res-
ponsabilidade e ética e é por isso que a sua metodologia
precisa ser tão rígida, para garantir a qualidade e a veracidade
das informações que estão sendo difundidas e influenciam
diretamente a prática médica.
A Revisão Sistemática com ou sem Metanálise é fre-
quentemente apontada como o topo da hierarquia de evidências,
sendo assim o mais alto nível de evidência para solucionar
alguma pergunta clínica. No entanto, para considerarmos

REVISÃO SISTEMÁTICA 145


válida a resposta apresentada por uma RS, esta deve apre-
sentar uma metodologia rigorosamente adequada, seguindo
os protocolos citados neste capítulo, além de fazer a devida
análise dos principais vieses a que está sujeita uma RS. É
necessário que nós leitores, quando diante de uma Revisão
Sistemática, estejamos também atentos para a qualidade
desse estudo.
É importante analisar também que a qualidade da
informação de uma RS depende da qualidade dos estudos
nela incluídos. Uma RS de ensaios clínicos de baixa qualidade
metodológica e alto risco de viés não nos permite obter con-
clusões definitivas a respeito da intervenção em estudo. No
entanto, tais pesquisas guardam sua importância em expor
a necessidade da realização de bons estudos naquele tópico,
identificando uma necessidade em desenvolver evidências
de boa qualidade.

CONCLUSÃO

A Revisão Sistemática é, por fim, uma ferramenta fun-


damental para o exercício da Medicina Baseada em Evidências
e é essencial que o profissional da saúde saiba como acontece
a sua produção e como avaliar a sua metodologia, a fim de
ser capaz de pautar suas condutas em produções científicas
de qualidade.
É claro que este capítulo não esmiuçou o universo vasto
da Revisão Sistemática, mas é esperado que tenha cumprido
a missão de apresentar ao leitor os pontos principais do
tópico em questão, despertando seu interesse e contemplando
possíveis dúvidas.

146 DESCOMPLICANDO MBE


REFERÊNCIAS

BRASIL. Ministério da Saúde. Diretrizes Metodológicas: elaboração


de revisão sistemática e metanálise de ensaios clínicos randomiza-
dos. 1ª edição. Brasília: Editora do Ministério da Saúde, 2012. 92 p.

BRASIL. Ministério da Saúde. Diretrizes Metodológicas: elaboração


de revisão sistemática e metanálise de estudos de acurácia diagnós-
tica. 1ª edição. Brasília: Editora do Ministério da Saúde, 2014. 118 p.

BRASIL. Ministério da Saúde. Diretrizes Metodológicas: elaboração


de revisão sistemática e metanálise de estudos observacionais
comparativos sobre fatores de risco e prognóstico. 1ª edição. Brasília:
Editora do Ministério da Saúde, 2014. 134 p.

GALVÃO, Taís Freire; PEREIRA, Mauricio Gomes. Revisões siste-


máticas da literatura: passos para sua elaboração. Epidemiologia
e Serviços de Saúde, [s.l.], v. 23, n. 1, p.183-184, mar. 2014. Instituto
Evandro Chagas. http://dx.doi.org/10.5123/s1679-49742014000100018.

PEREIRA, Mauricio Gomes; GALVÃO, Taís Freire. Heterogeneidade


e viés de publicação em revisões sistemáticas. Epidemiologia e
Serviços de Saúde, [s.l.], v. 23, n. 4, p.775-778, dez. 2014. Instituto
Evandro Chagas. http://dx.doi.org/10.5123/s1679-49742014000400021

Moher D, Liberati A, Tetzlaff J, Altman DG, The PRISMA Group


(2009). Preferred Reporting Items for Systematic Reviews and
Meta-Analyses: The PRISMA Statement. PLoS Med 6(7): e1000097.
doi:10.1371/journal.pmed1000097

Sterne JAC, Savović J, Page MJ, Elbers RG, Blencowe NS, Boutron I,
Cates CJ, Cheng H-Y, Corbett MS, Eldridge SM, Hernán MA, Hopewell
S, Hróbjartsson A, Junqueira DR, Jüni P, Kirkham JJ, Lasserson T, Li T,
McAleenan A, Reeves BC, Shepperd S, Shrier I, Stewart LA, Tilling K,

REVISÃO SISTEMÁTICA 147


White IR, Whiting PF, Higgins JPT. RoB 2: a revised tool for assessing
risk of bias in randomised trials. BMJ 2019; 366: l4898.

Sampaio RF; Mancini MC; Estudos de Revisão Sistemática: um guia


para síntese criteriosa de evidência científica; Rev. bras. fisioter., São
Carlos, v. 11, n. 1, p. 83-89, jan./fev. 2007

148 DESCOMPLICANDO MBE


METANÁLISE

12 Alana Dantas de Meloԝ


Beatriz Aguiar da Silva Carvalhoԝ
Henrique de Paula Bedaque
Isadora Soares Lopes
Marília de Almeida Cardoso
O QUE É?

A
metanálise consiste em uma abordagem quan-
titativa na qual é realizada a combinação de
resultados de vários estudos independentes
sobre um tema específico. Seu objetivo é integrar resultados
de modo a estabelecer uma conclusão sobre determinada
pergunta que as revisões sistemáticas escolhidas propõem-se
a responder. Nesse sentido, é realizada a escolha dos estudos,
bem como a análise dos critérios de inclusão e exclusão. Após
isso, os dados são combinados, utilizando-se de técnicas
estatísticas a fim de gerar um estimador quantitativo do
tamanho do efeito e testa-se sua homogeneidade.
Um dos grandes diferenciais da metanálise diz respeito
ao fato de permitir o aumento do espaço amostral – para

149
tanto, é necessário garantir a homogeneidade entre os aspectos
clínicos e metodológicos dos estudos selecionados. Assim,
esses textos são reunidos para análise mediante uma triagem
que leva em consideração determinados aspectos – utiliza-se,
nesse processo, o acrônimo PICO: Pacientes, Intervenção,
Comparação, Outcomes (desfechos). Logo, é possível reunir
artigos a partir de sua pergunta de pesquisa e fazer uma
síntese estatística do conjunto de seus resultados, permitindo
obter uma conclusão sobre essa pergunta.
Existem vários tipos de métodos que podem ser utili-
zados para o cálculo de medidas de efeito em metanálises,
sendo definidos, geralmente, pelo tipo de variável e pela
heterogeneidade entre os estudos. O efeito fixo se origina da
presunção de que há um efeito único entre os estudos, pois
eles são homogêneos. O efeito aleatório, por sua vez, parte
do princípio de que os estudos são heterogêneos: há mais
de um efeito entre eles. No caso de variáveis dicotômicas,
situação em que se calculam os efeitos por Risco Relativo
(RR) e Razão de Chances (OR, do inglês Odds ratio), podem
ser usados como efeito fixo os métodos de Mantel-Haenszel,
Peto ou da variância geral; por outro lado, quando há efeito
aleatório, pode-se utilizar o método DerSimonian-Laird.

CABEÇA PENSANTE:

Quando não há diversidade importante entre os estudos (baixa


heterogeneidade), podem-se aplicar os modelos de efeitos fixos.
Porém, é preferível usar os modelos de efeitos aleatórios quando
a heterogeneidade entre os estudos for importante.

150 DESCOMPLICANDO MBE


Já para variáveis contínuas, o tamanho do efeito pode
ser calculado pela diferença média ponderada (se os estudos
apresentarem resultados em mesma escala) ou pela diferença
média padronizada (se os estudos apresentam resultados em
escalas diferentes). Nesse sentido, pode ser usado o efeito
fixo ou aleatório para a combinação dos efeitos individuais
no âmbito de variáveis contínuas.
Um outro ponto importante é a representação gráfica
das metanálises, geralmente feita por forest plots, os quais
permitem reunir todas as informações dos estudos avaliados
(especialmente ensaios clínicos controlados e randomizados)
e, assim, ser realizada a análise estatística pretendida. Este
tipo de representação gráfica permite apresentar visual-
mente a significância matemática de achados como Odds
Ratio (resultado de regressões logísticas) ou Risco Relativo
(resultado da construção de tabelas de contingência).
O forest plot é composto pelos seguintes elementos
(Figura 1):

Figura 1 – Apresentação gráfica de uma metanálise

METANÁLISE 151
• Título: evidencia a característica que está sendo estu-
dada e a comparação dos atributos dessa característica;
• Coluna à esquerda: apresenta os diferentes estudos
encontrados na literatura pesquisada que buscavam
identificar o risco de determinada característica;
• Coluna à direita: apresenta os valores estatísticos
de cada estudo, tornando possível a comparação de
estudos com características semelhantes e resultados
distintos;
• Reta horizontal principal (abscissa): apresenta de
maneira crescente os riscos relativos comparativos.
Dependendo do risco relativo obtido em cada estudo,
a caixa representando esse risco estará mais à direita
ou mais à esquerda do gráfico;
• Reta vertical (reta vertical principal): normalmente
está centralizada no forest plot e representa o risco
relativo 1. Ou seja, é a linha que representa nulidade;
• Caixas: representam, ao mesmo tempo, os riscos
relativos de cada estudo (deslocamento horizontal
no gráfico) como também a importância estatística
de cada estudo (tamanho da caixa). Quanto mais à
esquerda a caixa situa-se no gráfico, maior a redução
do risco relativo do estudo. Além disso, quanto maior
é a caixa, maior a importância do estudo (número de
indivíduos estudados) e, portanto, maior o impacto
que esse estudo terá na metanálise;
• Linhas horizontais: estão sempre juntas às caixas
e representam a largura do intervalo de confiança.
Ou seja, quanto maior for o intervalo de confiança

152 DESCOMPLICANDO MBE


(distância entre os limites inferior e superior) maior
será a linha que acompanha as caixas. Se a linha que
representa o intervalo de confiança cruzar a reta ver-
tical principal (risco relativo 1), não haverá valor P
significativo;
• Losango: representa o resultado final da metanálise
(medida sumária). Resultado da computação ponderal
da análise global de todos os estudos representados
no forest plot. Quanto maior a caixa que representa o
estudo, maior impacto este estudo terá sobre o losango
resultante da metanálise.
Ao analisar uma metanálise, é importante atentar
para a heterogeneidade. Como esse tipo de estudo permite
simular a repetição de experimentos, utilizando estudos já
existentes na literatura, ao realizar esse processo avalia-se a
heterogeneidade entre esses artigos observando se os estudos
são metodologicamente semelhantes (homogêneos) ou dife-
rentes (heterogêneos). Nesse caso, quando há congruência
entre eles, pode-se inferir que os resultados não decorreram
do acaso. A saber, já é esperado encontrar algumas diferenças
entre os estudos, mesmo que por efeito aleatório (acaso).
Os testes estatísticos são de grande importância na análise
da heterogeneidade, pois eles nos permitem determinar
se aquelas diferenças encontradas são maiores do que o
esperado pelo acaso.
De uma forma geral, essas diferenças podem decor-
rer de aspectos metodológicos do estudo (como desenho
do estudo, randomização, cegamento, entre outros) e daí
determinamos como heterogeneidade metodológica; ou ocor-
rem devido a características clínicas (como os participantes

METANÁLISE 153
envolvidos, o tipo de intervenção, o desfecho utilizado) e
está descrita como heterogeneidade clínica.
A primeira análise de heterogeneidade pode partir de
uma observação visual subjetiva do forest plot, avaliando se
as medidas de associação entre os estudos são semelhantes
ou se os intervalos de confiança são superponíveis. Essa
estimativa visual não é suficiente, e daí lançamos mão dos
dados estatísticos. Um dos mais utilizados é o teste de qui-
-quadrado para avaliar a significância da variabilidade entre
os estudos. Ele parte do pressuposto que não há diferença
entre os estudos (hipótese nula) e o valor de P encontrado
evidencia se a heterogeneidade é ou não estatisticamente
significativa. Assim, quando P < 0,05, rejeita-se a hipótese
nula e considera-se que as diferenças encontradas são maiores
que o efeito aleatório.

CABEÇA PENSANTE

Quando o valor de P < 0,05 no teste Qui-quadrado, temos uma


metanálise com heterogeneidade significativa, e isso fragiliza os
resultados encontrados. Mas quando P > 0,05, essa heteroge-
neidade é aceitável e temos mais confiança nos resultados.

Porém, muitos autores consideram que a heteroge-


neidade está presente de qualquer forma, de modo que o
ideal seria testar sua magnitude e não a sua presença ou não.
Assim, o principal teste para esse efeito é a estatística I2,
que indica o percentual da variação do resultado entre os
estudos que ultrapassa o efeito do acaso – e decorre, por-
tanto, de diferenças reais entre eles (que são denominadas
de discordâncias verdadeiras).

154 DESCOMPLICANDO MBE


É válido destacar que quanto maior o tamanho amostral
dos estudos, mais fácil será detectar heterogeneidade, pois,
por serem estudos mais precisos, o efeito do acaso se reduz e
eventuais diferenças tendem a ser mais aparentes. O valor de
I2 varia de 0 a 100%. Idealmente, devemos compilar estudos
homogêneos entre si, então procuramos que esse valor seja
o menor possível. Uma forma de interpretá-lo está descrita
na tabela 01 abaixo.

Tabela 1 – Os valores da estatística I2

I2 Interpretação

Considera que não há diferenças


0%
além do esperado pelo acaso
< 40% Heterogeneidade aceitável
40 - 60% Heterogeneidade substancial (desconfortável)
Heterogeneidade inaceitávelԝ
> 60%
(a compilação torna-se problemática)

Contudo, o que fazer quando estamos diante de uma


revisão sistemática com estudos heterogêneos? Sabemos
que quanto maior a heterogeneidade, mais questionável é o
resultado de sua compilação e precisamos, portanto, entender
quais as causas dessas discordâncias. Em primeiro lugar, elas
se devem a características metodológicas do estudo? Isto é, estudos
de melhor qualidade apresentam um resultado diferente
dos estudos de maior risco de vieses? Ou essas diferenças
estão relacionadas às características clínicas, como diferentes
populações, intervenções distintas, desfechos avaliados?
Com essas considerações em mente, uma das formas
de lidar com a heterogeneidade é agrupando os estudos e

METANÁLISE 155
realizando análises de sensibilidade, as quais se utilizam de uma
nova forma de análise dos dados e observam se os resultados
encontrados previamente serão modificados. Um exemplo
disso é agrupar os estudos de acordo com sua qualidade
metodológica: aqueles de boa qualidade e baixo risco de
viés vs. estudos de qualidade duvidosa. Daí, se os resultados
apresentados forem mais homogêneos, os autores podem:
a) Excluir os estudos que são fonte de heterogeneidade;
b) Apresentam os resultados encontrados como análises
de subgrupo.
Uma outra forma de realizar análises de sensibilidade
é agrupar os estudos de acordo com as diferenças no design
do estudo, como separá-los pela dose usada da medicação em
análise ou pelos diferentes estratos populacionais observados
(estudos que avaliam população diabética vs. estudos com
população não diabética).
As análises de sensibilidade podem ser entendidas
como análises de subgrupo dos estudos e a decisão de como
reagrupar esses estudos depende da interpretação do autor
da metanálise. O ideal é que elas estejam definidas a priori
no protocolo do estudo, e a decisão de quais análises rea-
lizar é uma tarefa cognitiva do autor - que deve investigar
e pressupor quais as possíveis características heterogêneas
que poderiam alterar o resultado da metanálise. Por outro
lado, existem formas menos subjetivas de realizar esse pro-
cesso: na meta-regressão, as covariáveis são plotadas num
modelo estatístico para avaliar o seu impacto nos resultados.
A meta-regressão é um outro método de realizar análises de
sensibilidade que permite avaliar a influência de covariáveis
do estudo no resultado observado.

156 DESCOMPLICANDO MBE


Em paralelo, vimos que a regressão linear ou regressão
múltipla é usada em estudos primários para avaliar a associa-
ção de covariáveis com o desfecho observado. Nesse contexto,
a meta-regressão é uma aplicação dessa análise estatística
considerando as diversas características do estudo (como
cegamento, randomização, entre outras) e o peso que ele
exerce no resultado final. Essa influência no resultado é
a variável desfecho da análise, enquanto as covariáveis são
também chamadas de potenciais modificadores de efeito. A
meta-regressão permite avaliar o efeito de variáveis contínuas
e categóricas, e o coeficiente de regressão obtido indica o
quanto esses modificadores de efeito alteram o desfecho
(efeito da intervenção). A saber, essa é uma técnica que deve
ser pensada quando temos pelo menos dez estudos na análise e
ela também permite investigar o efeito de múltiplas variáveis
simultâneas - mas nesse caso só é recomendada se houver
mais de 10 estudos para cada variável pensada.
Ainda sobre a interpretação dos resultados de uma
metanálise, é imprescindível observar a estimativa sumária
(resultante da compilação dos diferentes trabalhos), a qual
é simbolizada pelo diamante (losango) no forest plot. A
estimativa sumária é a medida que resulta da compilação
entre os estudos, podendo ser compreendida como uma
média ponderada. Nessa perspectiva, quanto mais preciso
for o estudo, maior o peso que ele apresentará no resultado
da metanálise. Dessa forma, estudos maiores (com estreitos
intervalos de confiança) tendem a apresentar mais influência
no resultado final do que estudos pequenos. A estimativa
pontual do resultado de cada estudo é representado por um
quadrado e seu tamanho representa o peso que cada estudo
possui na estimativa sumária.

METANÁLISE 157
É importante destacar ainda que o intervalo de
confiança da medida sumária (o diamante do gráfico) é
sempre mais estreito do que o intervalo de confiança
dos trabalhos individuais. Por isso é mais provável que a
significância estatística seja alcançada ao serem compilados
os resultados dos estudos, pois os intervalos de confiança
tornam-se mais estreitos. Sobre o diamante, o comprimento
dele representa o intervalo de confiança, enquanto a medida
pontual é representada pelo centro do diamante.
Um exemplo de metanálise foi realizado a partir da
revisão sistemática dos ensaios clínicos randomizados que
compararam cirurgia de revascularização miocárdica versus
intervenção coronária percutânea (“angioplastia”) – Figura 2.
A metanálise (compilação estatística dos dados) evidenciou
que a cirurgia é superior à angioplastia no que diz respeito
à prevenção de morte, infarto e controle de sintomas.

Figura 2 – Apresentação de uma metanálise


comparando o desfecho mortalidade com duas
intervenções diferentes (cirurgia e angioplastia)

158 DESCOMPLICANDO MBE


Ao analisar o estudo, percebe-se que I2 é nulo, logo
os estudos não apresentam heterogeneidade quanto ao
impacto dos tipos de tratamentos no desfecho – não há
discordância real entre os estudos, portanto, as diferenças
observadas são provenientes do acaso. Pelo forest plot,
observa-se que dois estudos apontam a cirurgia como
melhor escolha de tratamento; já os outros dois estudos
evidenciam resultados semelhantes entre os dois tratamen-
tos. Contudo, é válido ressaltar que estes referidos estudos
apresentam grandes intervalos de confiança (imprecisos),
podendo a discordância por eles apresentada ser oriunda
do acaso. Logo, é válido inferir que a análise da totalidade
das evidências reforça o conceito de que pacientes ope-
rados apresentam menor mortalidade do que pacientes
submetidos à angioplastia.
Assim como foi discutido no capítulo de Revisão
Sistemática, um outro viés importante neste tipo de estudo
e que deve ser bem analisado é o viés de publicação. De certa
forma, ele é apresentado como uma tendência dos resultados
publicados estarem sistematicamente distintos da realidade
e isso ocorre por algumas razões: a) predileção editorial
em publicar resultados positivos; b) decisão dos próprios
autores ou financiadores em não publicarem resultados sem
significância estatística. Logo, considera-se que estudos de
resultados favoráveis são mais prováveis de serem publi-
cados, e, além disso, de serem publicados em inglês (o que
abre margem para viés de linguagem). Os estudos menores
estão mais sujeitos a esse tipo de viés, pois grandes estudos
geralmente são publicados independente do seu resultado.

METANÁLISE 159
Nessa situação, uma forma de avaliar a presença desse
tipo de viés é através do gráfico de funil, do inglês funnel plot.
Nesse gráfico, o eixo horizontal indica o efeito da intervenção
estimado, é algum dado derivado da medida de associação do
estudo (risco relativo, odds ratio…); enquanto o eixo vertical é
indicativo da precisão do estudo (geralmente uma medida do
erro padrão), a qual tem relação com o tamanho amostral. A
linha pontilhada no gráfico representa o verdadeiro efeito da
intervenção, é a medida sumária encontrada pela metanálise.
Como se sabe, estudos maiores apresentam maior precisão
nos resultados, e eles aparecem na parte superior do gráfico;
enquanto estudos menores e, portanto, menos precisos, estão
distribuídos na porção inferior. Ademais, devemos considerar
que estudos menores possuem menor poder estatístico e
estão mais sujeitos a erros aleatórios, logo, é de se esperar
que seus resultados sejam mais variados.
O que se espera observar no gráfico de funil é a simetria
(figura 3a), sobretudo na porção inferior do gráfico, onde os
estudos menos precisos apresentam maior variabilidade nos
resultados. No entanto, devido ao viés de publicação pode-
mos observar uma assimetria no gráfico, com um ausência
de estudos na porção inferior (figura 3b). Nesse último caso,
a medida sumária da metanálise superestima o efeito.

160 DESCOMPLICANDO MBE


Figura 3 - Exemplos de gráficos de funil que
indicam baixo risco de viés de publicação
(a), ou alto risco desse viés (b).

Além da análise visual, os dados observados nesse


gráfico podem ser avaliados estatisticamente através do teste
de Egger ou do teste de Begg, os quais procuram determinar
se essa distribuição dos estudos é decorrente do acaso ou não.
A sensibilidade desses testes é maior quanto mais estudos
estiverem incluídos na análise e não são sugeridos quando
há menos de 10 estudos. Quando P < 0,05, há forte sugestão
do viés de publicação.
Por fim, mesmo sem a análise gráfica ou os dados esta-
tísticos, podemos suspeitar do viés de publicação quando as
estratégias de busca não foram suficientemente abrangentes
e quando há somente estudos pequenos, especialmente com
investimento de indústrias farmacêuticas.

CONCLUSÃO

A metanálise apresenta, portanto, a vantagem de


resumir e condensar os resultados de vários estudos em
um indicador de efeito. Esse tipo de texto representa uma
importante ferramenta da Medicina Baseada em Evidências,

METANÁLISE 161
principalmente quando não há ensaios clínicos de tamanho
suficiente para provar a eficácia terapêutica de um método.
Nesse contexto, é comum utilizar metanálises de
ensaios clínicos pequenos ou médios com o intuito de res-
ponder questões, podendo haver certa equivalência com o
poder estatístico de grandes ensaios clínicos. Contudo, é
imprescindível ressaltar que, embora as metanálises sejam
de grande valor científico, a qualidade de sua conclusão
depende da qualidade metodológica dos estudos individuais
utilizados.

REFERÊNCIAS

BAENA, C. P. Revisão sistemática e metanálise: padrão ouro de


evidência? Rev. Med. UFPR 1(2):71-74. Abr/Jun 2014.

CORREIA, L. C. Meta-Realidade: revascularização cirúrgica é melhor


do que percutânea. Blog de Medicina Baseada em Evidências.
Disponível em: < http://medicinabaseadaemeviden cias.blogspot.com.
br/2014/03/metarealidade-revascularizacao.html>. Acesso em: 03 ago
2017.

MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p. 441-2.

RODRIGUES, C. L.; ZIEGELMANN, P. K. Metanálise: um guia


prático. Rev HCPA, 30 (4), p. 436-47, 2010.

SANTOS, E. J. F.; CUNHA, M. Interpretação crítica dos resulta-


dos estatísticos de uma meta-análise: estratégias metodológicas.
Millenium, 44, p. 85-98, jan.-jun. 2013.

162 DESCOMPLICANDO MBE


PEREIRA, M. G.; GALVÃO, T. F. Heterogeneidade e viés de publi-
cação em revisões sistemáticas. Epidemiol. Serv. Saúde, Brasília,
23(4):775-778, out-dez 2014

Higgins JPT, Thomas J, Chandler J, Cumpston M, Li T, Page MJ,


Welch VA (editors). Cochrane Handbook for Systematic Reviews
of Interventions version 6.0 (updated July 2019). Cochrane, 2019.
Chapter 10, Meta-analyses Available from www.training.cochrane.
org/handbook.

Sterne Jonathan A C, Egger Matthias, Smith George Davey.


Investigating and dealing with publication and other biases in
meta-analysis. BMJ 2001; 323 :101

SILVA, André Ferreira Azeredo da et al. Viés de Publicação.


Disponível em: https://www.htanalyze.com/metanalise/vies-de-publi-
cacao/. Acesso em: 25 maio 2020.

METANÁLISE 163
HIERARQUIA DAS
EVIDÊNCIAS

13 Ferdinand Gilbert Saraiva da Silva Maia


Letícia Goes da Silva
Luis Henrique Silveira Rocha Barbosa
Pedro Henrique Almeida Fraiman

O
desenvolvimento da era digital foi acompa-
nhado pelo surgimento de novos meios de
informação que possibilitaram, gradualmente,
uma rápida disseminação científica de descobertas e estudos,
nas mais vastas áreas das ciências. Diante disso, o leitor de
evidências se encontra, cada vez mais, em uma posição de
confrontamento entre a evidência científica publicada e o
seu grau de impacto, em sua prática profissional.
O cenário da emergente era digital gera novas inquie-
tações no meio científico, levando a novos questionamentos
basais: uma notícia publicada numa revista Caras tem a
mesma relevância que uma revista publicada no New England
Journal of Medicine (NEJM)? Ou, até mesmo, um Ensaio
Clínico Randomizado publicado no Journal of American
Medical Association (JAMA) tem a mesma importância de

165
um Estudo Transversal publicado no NEJM – ambas duas
revistas de alto fator de impacto?
Mas afinal, o que é Fator de Impacto?
A conceituação do Fator de Impacto (FI) surge para
esclarecer alguns dos questionamentos suscitados neste capí-
tulo. O seu conceito permeia uma medida de avaliação das
revistas científicas, o qual é mensurado com base no número
de citações recebidas por outros periódicos, levando em conta,
também, sua periodicidade. Um maior FI indicaria que a
publicação está numa revista mais conceituada, com maior
abrangência, que provavelmente passou por uma comissão
editorial de alta qualidade e que por isso só tem bons estudos,
entretanto, como toda classificação, há suas falhas.
Na linha de raciocínio do Fator de Impacto, foi desen-
volvido um sistema brasileiro (QUALIS) para a avaliação
de periódicos de programas de pós-graduação, o qual leva
em conta critérios específicos e gerais para a classificação
dessas produções intelectuais em níveis de qualidade decres-
cente: A1, A2, B1, B2, B3, B4, B5, C. Esses fatores de avaliação
possibilitam a construção paulatina e individual de uma
classificação de hierarquia de influência e evidência.
A produção de conhecimentos científicos passa por
uma criteriosa e metodológica linha de produção, a qual possui
diversas variações, dependendo do tipo e da origem do
conhecimento a ser obtido. Essa linha de produção se refere ao
desenho do estudo e como suas diversas variações levam a
diversas finalidades distintas: obtenção de hipóteses clínicas,
comprovação da eficácia de uma droga, a causalidade de
um fator no desenvolvimento de uma doença, o impacto de
uma medida em uma população de estudo e tantas outras.

166 DESCOMPLICANDO MBE


Devido isso, frequentemente, nos deparamos com a
clássica imagem, que também está presente neste capítulo,
logo abaixo, de uma pirâmide que sobrepõe os vários tipos
de estudos e expõe uma hierarquia existente entre eles.
A mensagem oculta por trás desta pirâmide é a seguinte:
quanto mais ao topo da pirâmide, menor a chance de vieses
(erros sistemáticos) nestes estudos. No que diz respeito a
isso, cada um desses modelos de estudo representa uma
finalidade de resultado e, portanto, as suas próprias limita-
ções, dependendo do quê se busca e para que se busca. Nesse
contexto, torna-se necessário saber até onde se torna viável
utilizar, praticamente, cada um desses modelos, levando em
consideração o grau de confiança metodológica apresentado,
didaticamente, na pirâmide do nível de evidências.

Figura 1 – Pirâmide do nível de evidências. RS ECR:


Revisão Sistemática de ensaios clínicos randomizados

HIERARQUIA DAS EVIDÊNCIAS 167


No topo desta clássica pirâmide, temos as Revisões
Sistemáticas, com ou sem metanálises, de Ensaios Clínicos
Randomizados. Como vemos, esta é uma fonte secundá-
ria de dados capaz de agregar, de maneira sistematizada,
informações de vários estudos e trazer uma informação de
consenso. No entanto, mais atentamente analisando, surge o
questionamento: “e caso os estudos selecionados na revisão e
metanálise representem apenas uma determinada realidade?
Ou pior, sejam de baixa qualidade? Não seria então uma
evidência de baixo nível?”. Se essa pergunta permeia sua
mente ao ver essa pirâmide, você está se colocando bem
posicionado no meio da Medicina Baseada em Evidências!
Justamente, é preciso considerar não apenas o tipo e desenho
de um estudo para considerar sua qualidade como fonte de
informação, mas também uma leitura cuidadosa e criteriosa
para inseri-lo em sua prática clínica.
A problemática da avaliação arbitrária de revisões
sistemáticas e meta-análises foi atenuada a partir da criação
de diretrizes para a qualidade desses relatos: o PRISMA
(Principais Itens para Relatar Revisões Sistemáticas e Meta-análises)
e o Cochrane Risk of Bias Tool. Enquanto o PRISMA se revela
como uma ferramenta útil para avaliar e direcionar a quali-
dade das revisões sistemáticas e das meta-análises, o Cochrane
Risk of Bias Tool é responsável por avaliar, individualmente, a
qualidade dos resultados dos ensaios clínicos que irão compor
essas revisões e meta-análises. Na vida real, esta é uma cilada
comum que nos deparamos ao pormos de frente dois estudos
diferentes e sermos interpelados sobre a qualidade de um
estudo por ele ser um Ensaio Clínico Randomizado Duplo-Cego,
esta sendo uma condição sine qua non para a qualidade.

168 DESCOMPLICANDO MBE


Entretanto, ocorre que não podemos negar como,
realmente, a pirâmide é um excelente recurso didático,
pois representa justamente a ideia da redução de viéses
ao avançarmos para seu topo, seja com a randomização,
seja com a individualização com o tipo de estudo ou com o
cegamento dos pesquisadores, e isso realmente faz com que,
progressivamente, a força da evidência seja aumentada.
Atualmente, o recurso didático se encontra em constante
mutação, visando reproduzir as mudanças dos próprios
estudos, e novos modelos de pirâmide já se encontram dis-
poníveis, inclusive retirando a revisão sistemática do topo
e a colocando como fator que perpassa todos os níveis da
hierarquia da evidência.
No estudo da Hierarquia das Evidências e de seu
impacto na obtenção da informação científica, além dos
pontos acima citados, outro ponto importante a ser consi-
derado nesta análise é o fator de impacto de uma publica-
ção. Revistas de maior fator de impacto, em geral, possuem
processos mais rigorosos de revisão e seleção dos artigos
a serem publicados, mas, nem mesmo esse rigor seletivo é
isento de falhas, visto a possibilidade de ocorrência da prática
inadequada que chamamos de citações cruzadas (em inglês,
citation stacking) entre periódicos, elevando artificialmente
e desonestamente esse índice. Existem artigos de qualidade
muito baixa no New England Journal of Medicine, a principal
revista médica mundial, e artigos semelhantes de altíssima
qualidade em revistas de menor expressão, o que nos deixa
a ideia de que a racionalidade e a análise crítica, de você
leitor, devem ser aliadas na interpretação e utilização da
hierarquia comentada neste capítulo.

HIERARQUIA DAS EVIDÊNCIAS 169


A aquisição do conhecimento acerca dessa temática
permite, gradualmente, analisar mais criteriosamente o
papel de diversas fontes científicas na construção da prática
profissional e sua qualidade metodológica. Analisar a eficácia
de uma droga terapêutica através de uma Série de Casos e de
um Teste Experimental in Vitro se torna totalmente diferente de
atestar essa eficácia através de um Ensaio Clínico Randomizado,
o qual confere maior força e qualidade de evidência devido o
seu desenho de estudo com técnicas que evitam o surgimento
de erros sistemáticos.

CONCLUSÃO

A mensagem fundamental que deve ser fixada ao


final da leitura deste capítulo e, por fim, do livro é que não
adianta meramente classificar uma evidência como de boa
qualidade analisando isoladamente e exclusivamente o fator
de impacto da revista e o tipo de estudo a ser analisado: os
níveis de evidência não produzem recomendações clínicas,
mas a escolha de uma evidência até chegar na prática clínica
merece uma análise pormenorizada e individualizada.

REFERÊNCIAS

GUYATT. G. H, OXMAN. A. D, KUNZ. R, FALCK-YTTER. Y, VIST. G.


E, et al. Going from evidence to recommendations. BMJ. 2008 May
10;336(7652):1049-51.

HOWICK, J. The Philosophy of Evidence-Based Medicine. Oxford:


Wiley- Blackwell; 2011.

LACCHETTI. C, IOANNIDIS. J. P, GUYATT. G. Surprising results of


randomized, controlled trials. In: Guyatt G, Rennie D, editors. The

170 DESCOMPLICANDO MBE


Users’ Guides to the Medical Literature: A Manual for Evidence-
Based Clinical Practice. Chicago, IL: AMA Publications; 2002.

PACKER. M. Are Meta-analyses a Form of Medical Fake News?


Circulation 2017; 136:2097-2099.

MURAD, M. H.; ASI, N.; ALSAWAS, M.; ALAHDAB, F. New evidence


pyramid. BMJ. 2016.

OLIVEIRA, D. A. L. Práticas clínicas baseadas em evidências. Módulo


pedagógico. UNASUS/UNIFESP. 2010.

HIERARQUIA DAS EVIDÊNCIAS 171


DIRETRIZES

14 Ferdinand Gilbert Saraiva da Silva Maia


Frederico Galvani Harckbart Carvalho
Henrique de Paula Bedaque
Yasmin de Medeiros Carvalho

O QUE SÃO?

N
o dia a dia do médico, diversas escolhas pre-
cisam ser realizadas: desde o tratamento
medicamentoso adequado para uma simples
faringite, até a difícil decisão de iniciar cuidados paliativos
em um paciente com câncer em estágio avançado. Para isso,
o profissional precisa ter uma base sólida de conhecimento
prévio que seja pautada em evidências científicas, garantindo
que a decisão tomada seja aquela com maior probabilidade
de haver sucesso no cuidado.
Um guideline (diretriz, na língua portuguesa) pode
ser definido como “norma, indicação ou instrução que serve
orientação”. No âmbito da medicina, corresponde a um
documento produzido a partir dos resultados de diversas

173
pesquisas científicas e análise de uma banca de especialistas,
que visa orientar condutas da prática médica. Tais pesquisas
são selecionadas dentre muitas outras, buscando-se apenas
aquelas que tenham uma maior confiabilidade e sejam mais
atualizadas, para que assim se construa uma diretriz com-
patível com o conhecimento científico do tempo em que ela
é escrita. Vale ressaltar que esses protocolos são renovados
periodicamente, para que haja a inclusão, retificação ou
exclusão de determinadas orientações, com a finalidade de
acompanhar as atualizações da ciência.
As diretrizes têm um amplo campo de atuação, havendo
a possibilidade de abordarem como tema uma determinada
patologia, uma certa área de atuação ou um procedimento,
seja ele clínico ou cirúrgico. As publicações da Sociedade
Brasileira de Cardiologia demonstram muito bem esse fato:
em 2014, lançou a Diretriz de Doença Coronária Estável
(uma patologia) e a II Diretriz de Ressonância Magnética e
Tomografia Computadorizada Cardiovascular (exames de
imagem). Exemplo complementar é a Diretriz em Cardiologia
do Esporte e do Exercício (uma área de atuação), lançada em
2013. Portanto, são muitos – porém não todos – os campos da
medicina cuja prática encontra Suporte nos mais variados
guidelines, tendo o médico muitas vezes um grande auxílio
em seu trabalho devido a eles.
São geralmente compostas por: classificação dos níveis
de evidência e graus de recomendação utilizados na diretriz
(explicado mais à frente), revisão sobre o tema, considerações
epidemiológicas, abordagem sobre critérios diagnósticos,
condutas recomendadas para cada caso, instruções para a
realização de um procedimento, entre outros.

174 DESCOMPLICANDO MBE


PRODUÇÃO

As diretrizes não possuem uma única fonte de produ-


ção e não respeitam a um modelo fixo, podendo ter diferentes
aparências e formas de abordagem do assunto, a depender
das preferências dos autores. Dentre as instituições respon-
sáveis por redigi-las, algumas ganham destaque no contexto
nacional: o Conselho Federal de Medicina, o Ministério da
Saúde, as sociedades médicas brasileiras (que dizem respeito
às especialidades e campos de atuação) e a Associação Médica
Brasileira.
No que diz respeito à produção estrangeira de gui-
delines, existem outras instituições nacionais de cada país
que assumem essa responsabilidade. Assim, acabam sendo
produzidas diferentes diretrizes sobre um mesmo assunto
e em alguns pontos elas são discordantes em suas recomen-
dações para o manejo do paciente, nos critérios diagnósticos
e nas instruções para a realização de determinado procedi-
mento. Isso acontece porque existe uma série de diferenças
entre os países que influenciam em tais orientações, como:
as características biológicas da população, sua cultura e
costumes, a estrutura e condições do sistema de saúde, a
situação financeira do Estado e, em especial, a epidemiologia
das patologias.
Devido a essa série de variáveis, os médicos, geral-
mente, utilizam as diretrizes nacionais para embasar a sua
prática. Entretanto, o uso de guidelines estrangeiros não é raro
e pode ser muito útil ao profissional, especialmente quando
esses encontram-se mais atualizados do que os do país de
origem. Vale ressaltar que também existem organizações

Diretrizes 175
mundiais que produzem diretrizes médicas, fazendo com que
elas sejam utilizadas até mesmo em diferentes continentes.
Nesse contexto, ganha destaque a Organização Mundial de
Saúde (OMS), que enfoca as doenças mais comuns em países
de terceiro mundo e de populações negligenciadas.

NÍVEIS DE EVIDÊNCIA E GRAUS


DE RECOMENDAÇÃO

Em muitas diretrizes, há, no início, uma breve abor-


dagem sobre os diferentes níveis de evidência e graus de
recomendação que as informações do corpo do texto podem
ter. Essas classificações servem para determinar o nível de
confiabilidade daquilo que a diretriz orienta e a forma de
classificar varia para cada uma, fazendo-se necessárias essas
considerações.
Primeiramente, vale destacar a diferença entre esses
dois atributos. Enquanto o grau de recomendação diz respeito
à concordância (ou discordância) de opiniões dentro da
bancada avaliadora do guideline, o nível de evidência diz
respeito à qualidade dos estudos nos quais tais especialistas
pautaram suas opiniões. Sendo assim, são duas variáveis
que, sozinhas, não seriam tão relevantes.

CABEÇA PENSANTE

Se determinada afirmação de uma diretriz tem alto grau de reco-


mendação, porém baixo nível de evidência, significa que apesar de
grande parte dos especialistas concordarem com o que foi afirmado,
eles basearam-se em estudos de pouca confiabilidade, como um relato
de caso. Talvez, se fossem feitos ensaios clínicos sobre o mesmo

176 DESCOMPLICANDO MBE


objeto de pesquisa, aquela parte da diretriz passaria a não ser mais
tida como verdade. Já uma afirmação com nível de evidência A e
grau III de recomendação indica que os estudos científicos utilizados
como base têm grande qualidade e os seus resultados constatam o
contrário do que se afirmou.

Vejamos a seguir as tabelas que classificam as duas


variáveis:

Tabela 1 – Demonstração dos níveis de evidência

NÍVEIS DE EVIDÊNCIA

Múltiplos ensaios clínicos con-


A
trolados, randomizados.
Um único estudo clínico controlado aleatori-
B zado, estudos clínicos não randomizados ou
estudos observacionais bem desenhados
C Série ou relatos de casos

Tabela 2 – Demonstração dos graus de recomendação

GRAUS DE RECOMENDAÇÃO

I Existe consenso a favor da indicação


IIa Existe divergência, mas a maioria aprova
IIb Existe divergência e divisão de opiniões
III Não se recomenda

RESPALDO JURÍDICO

O médico de hoje em dia passa por muitas dificuldades


no que diz respeito ao enfrentamento de processos judiciais.

Diretrizes 177
Uma estatística recente apontou que entre 2010 e 2014 o
Superior Tribunal de Justiça (STJ) viu o número de processos
por erro médico aumentar em 140% no Brasil. Sendo assim,
o profissional precisa estar o mais capacitado possível e
munido de justificativas sólidas para suas condutas.
Nesse contexto, os guidelines assumem um papel muito
importante. Isso porque, através de seu notável embasamento
científico, permite que o médico tenha uma fonte segura de
informação. Além disso, garante que, mesmo se a primeira
conduta tomada não for a mais adequada e trouxer danos ao
paciente, ela possui uma motivação coerente. As diretrizes
por si só já têm um valor muito alto como evidências a serem
apresentadas numa audiência judicial, dando crédito às
atitudes médicas.

CONCLUSÃO

As diretrizes são extremamente importantes no sentido


de padronizar a prática médica utilizando-se de evidências
científicas atualizadas. Assim, buscam garantir a melhor
assistência possível aos pacientes, com maiores chances de
haver sucesso no processo terapêutico. Apesar disso, vale
ressaltar que o médico não deve se sentir “engessado” pelas
diretrizes, mas sim tomá-las como um guia.
A medicina é uma área que requer raciocínio e estudo
constante de seus profissionais, tendo eles a liberdade para
realizar as condutas que julguem mais adequadas para
seus pacientes individuais. A experiência clínica também
é relevante para as decisões a serem tomadas, além de, nas
diretrizes, não constarem sempre as evidências mais atuais

178 DESCOMPLICANDO MBE


ou que digam respeito a todos os tipos possíveis de pacientes
a serem consultados pelo médico.

REFERÊNCIAS

DIRETRIZ, em Dicionário Priberam da Língua Portuguesa [em


linha], 2008-2017. Disponível em: <http://www.priberam.pt/dlpo/dire-
triz>. Acesso em: 21 jul. 2016.

ROTHBARTH, R. Indenizações por erro médico - uma epidemia


previsível. Blog Academia Médica. Disponível em: <https://academia-
medica.com.br/ indenizacoes-por-erro-medico-uma-epidemia-previsi-
vel/>. Acesso em: 26 de julho de 2016.

SOCIEDADE BRASILEIRA DE CARDIOLOGIA. Consensos /


Diretrizes. Disponível em: <http://publicacoes.cardiol.br/2014/diretri-
zes.asp>. Acesso em: 25 jul. 2016.

SOCIEDADE BRASILEIRA DE DIABETES. Diretrizes da Sociedade


Brasileira de Diabetes. Disponível em: <http://www.diabetes.org.br/
sbdonline/images/docs/DIRETRIZES-SBD-2015-2016.pdf>. Acesso em:
26 jul. 2016.

SPOSITO, A. C. et al. IV Diretriz Brasileira sobre Dislipidemias e


Prevenção da Aterosclerose. Disponível em: <http://www.scielo.br/
scielo. php?script=sci_arttext&pid=S0066-782X2007000700002>. Acesso
em: 8 ago. 2017.

Diretrizes 179
ESTUDOS DE NÃO
INFERIORIDADE

15 Ana Karenina Carvalho de Souza


Iana Fernanda de Medeitos Cabral
Juliana Soares Pimenta
Henrique de Paula Bedaque

O QUE É?

E
studos de não-inferioridade consistem em um
tipo específico de Ensaio Clínico destinado a
estabelecer se um novo tratamento não é inferior
a um tratamento padrão, para isso considerando uma margem
de tolerância previamente fixada, denominada margem de
não inferioridade.
Assim, tais estudos são aplicáveis quando a nova pro-
posta terapêutica não precisa ser melhor que a tradicional
para que haja substituição de uma pela outra. Isso ocorre,
basicamente, quando a nova proposta traz vantagem prá-
tica, por exemplo, o tratamento é menos doloroso ou possui
facilidades posológicas.

181
Nesses estudos, a hipótese nula (H0) é a de que o
tratamento em investigação é inferior ao controle por uma
diferença maior ou igual à margem de não inferioridade.
A hipótese alternativa (H1) é a de que a diferença entre
tratamentos não ultrapassa a margem de não inferioridade
pré-estabelecida na pesquisa.

CABEÇA PENSANTE

Se um novo tratamento não é inferior ao padrão, o novo pode ser


substituído sem prejuízo ao paciente.

Tendo isso em vista, cabe o adendo de que não inferioridade não


é sinônimo de equivalência. A não inferioridade aceita uma piora
na eficácia, desde que haja alguma vantagem interessante exibida
pelo novo tratamento. Busca-se demonstrar que o tratamento
proposto não é suficientemente inferior para anular seu incremento
na prática clínica.

Também é relevante fazer um contraponto com os Ensaios Clínicos


de superioridade. Esses ensaios representam o modelo tradicional,
sendo aplicáveis tanto para a eficácia comparativa (tratamento
padrão versus tratamento novo) quanto para eficácia (tratamento
versus placebo). Dessa forma, tais estudos objetivam definir se o
tratamento em investigação é superior ao agente comparativo. A
superioridade, por si, justifica uma alteração na conduta.

Em contrapartida, os estudos de não inferioridade não buscam tal


demonstração de superioridade. Seu propósito é expor que uma nova
conduta, mesmo não sendo mais eficaz que a terapêutica padrão,
pode ser preferida em função de possuir outras vantagens. Buscando
consolidar a compreensão acerca dos estudos supramencionados,
a figura 1 expõe um breve resumo gráfico a respeito de tais.

182 DESCOMPLICANDO MBE


Figura 1 – esquema ilustrativo dos Ensaios
Clínicos de não-inferioridade e superioridade.

Ainda nesse contexto, é importante ressaltar que, nas


etapas de planejamento, análise e interpretação de estudos
desse tipo, alguns fatores precisam ser cautelosamente con-
siderados, a fim de assegurar a validade:
1. Escolha da margem de não inferioridade: a margem
nunca deve ultrapassar o razoável. Nunca deve ocorrer

ESTUDOS DE NÃO INFERIORIDADE 183


perda de mais de 50% de eficácia do tradicional em
relação ao controle (de preferência, bem menos que
isso). É importante lembrar que tal margem é pre-
viamente definida pelo autor, portanto, o leitor deve
sempre estar atento para o caso de o autor estar sendo
flexível demais quanto a esse limite.
2. Número de indivíduos necessários ao estudo: deve obe-
decer a cálculos estatísticos prévios, sendo importantes
para validade da análise, interpretação e planejamento
de recursos.
3. Seleção da amostra: a amostra deve ter semelhança
demográfica e clínica com a que serviu de base para
a definição da margem de não inferioridade.
4. Sensibilidade do ensaio: o estudo precisa ser concebido
de forma a distinguir claramente terapias eficazes e
ineficazes.
5. Análise de dados: selecionar métodos analíticos consi-
derados não-tendenciosos.

APLICABILIDADE

Como tratado no tópico anterior, eventualmente uma


conduta pode ser adotada não levando em consideração
apenas o fato de um tratamento ser mais eficaz que outro,
mas também ponderando outros possíveis incrementos
fornecidos por um novo tratamento: maior praticidade, menor
agressividade, redução de efeitos adversos ou até mesmo
diferença de custo. Sendo assim, estudos de não inferioridade
podem elucidar esse tipo de questão.

184 DESCOMPLICANDO MBE


Um exemplo característico de ensaio clínico de não
inferioridade é o estudo RE-LY, o qual compara a Warfarina,
ao novo anticoagulante oral Dabigatrana. Desde 1955, a
Warfarina vem sendo utilizada para controlar distúrbios
trombóticos, todavia o objetivo principal dessa terapia
também constitui seu maior desafio: manter os níveis de
anticoagulação ideais para prevenção de eventos tromboem-
bólicos sem elevar o risco de hemorragias. Para controlar essa
situação, o paciente precisa ser constantemente monitorado,
por meio de exames laboratoriais para aferição do Tempo
de Protrombina (TP) e o International Normalized Ratio (INR).
Os novos anticoagulantes orais, por sua vez, são um grupo
heterogêneo de drogas que possuem como ponto central a
promoção da anticoagulação, tendo uma dose fixa e ausência
de necessidade de monitorização por exames laboratoriais.
O ensaio clínico em questão comparou duas doses de
Dabigatrana (110 e 150 mg) com a Warfarina em pacientes
portadores de fibrilação atrial. As conclusões alcançadas
foram:
1. Dose de 110mg: vinculada a taxas de acidente vascular
cerebral (AVC) e embolia sistêmica não inferiores àque-
las associadas à Warfarina e menores taxas de grandes
hemorragias do que aquelas associadas à Warfarina.
2. Dose de 150mg: vinculada a taxas de acidente vascular
cerebral (AVC) e embolia sistêmica menores do que
as associadas à Warfarina e taxas não inferiores às da
Warfarina quanto a grandes hemorragias.
Esse estudo foi responsável pela aprovação da comer-
cialização da Dabigatrana em alguns países, inclusive no
Brasil. Isso demonstra, de forma prática, que em certas

ESTUDOS DE NÃO INFERIORIDADE 185


situações as vantagens exibidas por um novo fármaco podem
suplantar o déficit de eficácia que ele venha a trazer: no
estudo a Dabigatrana pode ser, em certas doses, menos eficaz
ao ser comparada à Warfarina, porém, sua posologia fixa
e ausência de necessidade de monitoramento laboratorial
ganham mais relevância que esse primeiro fato.

CABEÇA PENSANTE

Perceba que o resultado de um estudo de não inferioridade não é


uma definição de conduta, mas uma oportunidade de utilizar novas
terapias. Abre-se espaço para a reflexão crítica sobre as vantagens
e desvantagens de escolher uma terapia ou outra como conduta.

TESTES DE HIPÓTESE DE
NÃO-INFERIORIDADE

Abordando mais a fundo a questão da hipótese de


não-inferioridade, a hipótese nula (H0), nesse tipo de estudo,
afirma que o desfecho primário para o tratamento experi-
mental é pior do que para o tratamento controle por uma
diferença maior ou igual a uma margem pré-especificada,
e a rejeição de tal hipótese em um nível pré-especificado de
significância estatística é usada para apoiar uma conclusão
de não inferioridade. Por sua vez, a hipótese alternativa
(H1) afirma que a diferença entre tratamentos é menor do
que a margem.
Em outros termos, a H0 versa sobre o tratamento novo
ser inferior (muito pior) à conduta tradicional, já a H1 afirma
que a nova droga não é muito pior do que a droga controle.
Caso p < 0.05, rejeita-se a hipótese nula (H0) e é apoiada a

186 DESCOMPLICANDO MBE


hipótese alternativa (H1) de que o tratamento novo é não
inferior.
Nesse sentido, é importante mencionar que o valor de
“p” recebe nos estudos de não inferioridade a interpretação
contrária da recebida nos estudos de superioridade, tendo
em vista que a significância estatística no caso demonstra
ausência de diferença notável, diferentemente dos estudos
de superioridade, nos quais p < 0.05 indica diferença.

CABEÇA PENSANTE

Parece complexo, mas não é, pois no estudo de não inferioridade não


se quer que a nova conduta seja diferente do controle, pois isso
significaria ser pior. O que se quer é que sejam semelhantes de
forma não inferior, sendo para isso o valor de p estatisticamente
significativo.

MARGEM DE NÃO-INFERIORIDADE

Agora é o momento de entender o significado de mar-


gem de não inferioridade (M), conceito extremamente impor-
tante na análise do tipo de estudo em foco neste capítulo,
sendo um aspecto crítico da hipótese de não inferioridade.
De forma prática, M quantifica a máxima perda de eficácia
clinicamente aceitável para que o tratamento experimental
possa ser declarado não-inferior ao controle. A margem
aceitável não deve ultrapassar a razoabilidade, não devendo
haver perda de mais de 50% de eficácia do tradicional.
Estatisticamente, utiliza-se o intervalo de confiança
(IC) para definir o valor de M: como referência, com base

ESTUDOS DE NÃO INFERIORIDADE 187


no ensaio clínico que comparou o controle ao placebo, com
efeito estatisticamente significante a favor do controle, usa-se
o limite inferior do intervalo de confiança da medida de
associação obtida, de modo a representar o mínimo efeito
clinicamente relevante que se espera para redução de des-
fecho. O valor de M deve ser menor (de preferência 50%)
do que esse limite inferior obtido de dados históricos que
comparam o tratamento controle ao placebo. Assim, essa
margem não pode ser maior do que o menor tamanho de
efeito para o tratamento tradicional que seria esperado em
um ensaio em comparação ao placebo.
A partir daí, tem-se que o limite superior do IC do
Risco Relativo (RR) do tratamento experimental não deve
ultrapassar 50% do limite inferior mencionado anteriormente,
ou seja, o limite superior do intervalo de confiança do RR
não deve ultrapassar a perda de eficácia pré-determinada
como tolerada. Deve-se então verificar se isso foi realizado
pelo autor, além de avaliar de forma crítica se a análise de
eficácia está clinicamente adequada. Analisando esse valor
em relação ao estudo de não inferioridade, se o IC para os
resultados excluir a margem pré-especificada, conclui-se que
o tratamento experimental é não inferior ao controle ativo.
Inferioridade do tratamento testado é demonstrado se o IC
exclui o 1 e o efeito favorece o controle ativo.
Para exemplificar essa margem de não inferioridade,
suponha-se que seja tolerada uma perda de 20% da eficácia,
ou seja, o limite superior do intervalo de confiança do risco
relativo não deve ultrapassar 1.2. Imaginem: RR = 1.1 (95%
IC = 1.03 – 1.19), não ultrapassando o valor de 1.2, sendo

188 DESCOMPLICANDO MBE


considerado não inferior. Tenha-se, como exemplo, o gráfico
a seguir:

Figura 2 – entendendo a margem de não


inferioridade e os potenciais desfechos a
partir do intervalo do risco relativo

Simplificando essa discussão, o tratamento experi-


mental pode ter resultado melhor, aparentemente igual ou
até pior do que o controle para ser tido como não inferior.
Para aceitar essa piora, deve-se estar dentro da margem de
não inferioridade.
No caso do estudo RE-LY, já mencionado neste capítulo,
a margem foi de 1.46, ou seja, tolera-se que a Dabigatrana seja
até 46% pior do que a Warfarina, atentando-se para o fato de
que se refere ao limite superior do IC e não à medida pontual
de risco. Como lição, então, tem-se que não inferioridade
significa que não é suficientemente inferior para anular a
vantagem prática no novo tratamento; a análise da margem
não pode ser somente estatística, deve levar em conta o quão
vantajoso é o tratamento alternativo.

ESTUDOS DE NÃO INFERIORIDADE 189


É importante mencionar que a margem pode ser deri-
vada de diversos métodos estatísticos, para além da aborda-
gem de margem fixa supracitada; o método de síntese, por
exemplo, torna-se responsável pela variabilidade do efeito do
tratamento do controle ativo na determinação da margem.
A mensagem a ser deixada, portanto, é a de que, como um
pilar dos estudos de não inferioridade, a margem deve ser
entendida em sua construção e interpretada devidamente
como condizente ou não para o cenário clínico em questão,
para então ser avaliada sob a ótica dos resultados, sendo o
estudo bem sucedido ao descartar com confiança suficiente
a partir da margem pré-estabelecida a possibilidade de o
tratamento testado ter desempenho pior do que o controle
ativo.

INTENTION TO TREAT X PER PROTOCOL

Nos capítulos passados, vimos que ao observar um


ensaio clínico devemos considerar dois tipos de análise de
dados:
1. Por intenção de tratar (intention-to-treat): o efeito terapêu-
tico é estimado com base em todos os pacientes que
entraram no estudo, mesmo os que não prosseguiram
ou não aderiram ao tratamento por alguma razão.
2. Conforme o protocolo (per protocol analysis): a análise
baseia-se na exclusão de pacientes que não atenderam
aos critérios estabelecidos no protocolo do estudo ou
não receberam a atribuição aleatória.
Nesse sentido, é sabido que os estudos de superioridade
primam pela análise da intenção de tratar, porque - além

190 DESCOMPLICANDO MBE


de ser uma opção que mantém a aleatoriedade dos grupos
estabelecidos - é quase inevitável não haver descontinuidade
do tratamento por determinados pacientes, perda de segui-
mento ou outras violações de protocolo inicial das pesquisas.
Sendo assim, a intenção de tratar é a melhor opção de análise
em relação à superioridade.
Os Ensaios Clínicos Randomizados de não-inferio-
ridade, porém, caminham na contramão dessa lógica. Isso
porque essa escolha pode produzir um viés confundidor para
as conclusões da pesquisa, de modo a rejeitar erroneamente
a hipótese nula. Como?
Por exemplo, ao comparar o fármaco convencional “x” com o
novo “y”, se muitos pacientes fossem randomizados para o primeiro
(x) tratamento e fizessem o segundo (Y), ou vice-versa, isso tenderia
a estreitar a frequência e diferença entre os tratamentos nos dois
grupos, abrindo precedente para falsa impressão de não inferioridade
do “y”. Ou seja, “crossover” demais pode tender a igualar
os grupos, e , nesse caso, o princípio por intenção de tratar
estaria propenso a descartar a hipótese nula indevidamente,
propiciando a positividade do estudo de não-inferioridade.
Por conseguinte, é válido salientar a importância da
análise por protocolo, pois, nesse tipo de estudo, restringir
os integrantes dos grupos que efetivamente utilizaram a
intervenção não se configura como um viés que favorece a
não-inferioridade, ao contrário, pode apontar para a hipótese
nula. Isto é, nos estudos de não-inferioridade quem preserva
a hipótese nula é a análise per protocol.
Sob esse prisma, de maneira geral, tem sido defendido
atualmente que a premissa de não-inferioridade para um
tratamento teste só poderá ser aceita se a análise por intenção

ESTUDOS DE NÃO INFERIORIDADE 191


de tratar e por protocolo consolidarem essa conclusão. Então,
reconhecendo a importância própria de cada uma das aná-
lises, recomenda-se que sejam ponderadas em conjunto, a
fim de corroborar a consistência dos resultados.

COMPARAÇÃO A PLACEBO VS
ESTUDOS HEAD-TO-HEAD

Em exposições passadas também vimos que ao obser-


var um ensaio clínico devemos considerar dois tipos de
análise de dados:
Chegando até aqui, você já aprendeu que a metodologia
de não-inferioridade, por si só, objetiva testar se uma conduta
“não é muito pior” do que a convencional.
Baseando-se nesse intuito, suponha que você estivesse
na posição de um cientista e deseja testar uma nova alterna-
tiva medicamentosa. Para alcançar o êxito nesta finalidade,
você acha que esse teste deve ser realizado a partir de uma
comparação com o placebo ou com a droga usual? Pense: se
o seu objetivo fosse provar que o novo tratamento é benéfico
a ponto de substituir o tradicional, não faria muito sentido
centrar a pesquisa em uma comparação com placebo.
Ainda sobre esse exemplo hipotético, você poderia
encontrar potenciais vantagens posológicas ou de eventos
adversos da nova droga, mas esses princípios farmacológicos
não seriam suficientes para que ela fosse preferida frente à
droga convencional, porque tais achados não comprovariam
a eficácia de uma em relação a outra. Conclusão: ser melhor
que o placebo não garante ser não inferior ao tratamento

192 DESCOMPLICANDO MBE


padrão, e logo não garante que devemos prescrevê-lo no
mundo real.
Dessa forma, ao traduzir o placebo como um grupo
controle para avaliar os prejuízos das drogas testadas, com-
pará-lo com um nova droga aponta para a história natural
de estudo de superioridade, e não de não-inferioridade, até
porque superá-lo não justificaria a preferência por certo
tratamento. Além disso, o leitor há de convir que “ganhar” do
placebo poderia ser muito fácil e contribuiria para o processo
de positivar a hipótese alternativa. Logo, ao tratar de não
inferioridade, é preferível realizar um estudo que contemple
conduta alternativa versus uma conduta tradicional.
Todavia, há exceções na literatura relativas a esse racio-
cínio. Estudos como o LEADER trial pretenderam demonstrar
não-inferioridade da novidade (no caso, a do antidiabético
Liraglutida) em relação ao placebo. A razão disso é que esse
medicamento reduz glicemia e ainda provoca certa perda
de peso, então, para que fosse adotado precisaria provar
segurança cardiovascular. Portanto, apesar de a intenção
inicial ter sido mostrar não-inferioridade, o estudo apontou
uma incidência de eventos de 13% com o uso de Liraglutida,
comparada a 14.9% no grupo placebo, espelhando o benefício
cardiovascular do antidiabético.
Acrescenta-se ainda à análise feita a importância do
olhar crítico a respeito da validade das evidências e da cautela
ao avaliar caso a caso. Os conceitos aprendidos por você
neste capítulo podem ser distorcidos pela forma como se
desenha a hipótese, podendo não estar voltada para sua real
utilidade, mas sim para a probabilidade em se conseguir um

ESTUDOS DE NÃO INFERIORIDADE 193


resultado positivo quanto ao estabelecimento de um novo
tratamento. Fique esperto!

CONCLUSÃO

Em suma, a mensagem principal que você precisa fixar


é: os achados de não inferioridade não representam seme-
lhança exata entre determinados tratamentos, mas podem
mostrar que um tipo é bem mais conveniente comparado
ao outro. Nesse sentido, um novo medicamento pode ser
inferior ao tradicional dentro de uma pequena margem e
ainda assim representar maior vantagem prática, a ponto
de valer a pena abdicar de parte dos efeitos positivos que
seriam alcançados com a conduta convencional.

REFERÊNCIAS

CONNOLLY, Stuart J.; EZEKOWITZ, Michael D.; YUSUF, Salim;


EIKELBOOM, John; OLDGREN, Jonas; PAREKH, Amit; POGUE,
Janice; REILLY, Paul A.; THEMELES, Ellison; VARRONE, Jeanne.
Dabigatran versus Warfarin in Patients with Atrial Fibrillation.
New England Journal Of Medicine, [s.l.], v. 361, n. 12, p. 1139-1151, 17
set. 2009. Massachusetts Medical Society. http://dx.doi.org/10.1056/
nejmoa0905561.

CONITEC. CoaguChek® XS no monitoramento do INR em


pacientes recebendo tratamento com varfarina. Brasilia: Diário
Oficial da União, 2012. Disponível em: <http://conitec.gov.br/images/
Incorporados/CoaguChek-final.pdf>. Acesso em: 10 jun. 2019.

DURÃES, André Rodrigues. Novos anticoagulantes


orais (NOACS): comparativo das drogas disponíveis
no Brasil. 2018. Disponível em: <https://pebmed.com.br/

194 DESCOMPLICANDO MBE


novos-anticoagulantes-orais-noacs-comparativo-das-drogas-disponi-
veis-no-brasil/>. Acesso em: 10 jun. 2019.

GISMONDI, Ronaldo. Podemos confiar nos novos anticoagulantes?


2016. Disponível em: <https://pebmed.com.br/podemos-confiar-nos-
-novos-anticoagulantes/>. Acesso em: 08 jun. 2019.

MARSO, S.P. et al. Liraglutide and cardiovascular outcomes in type 2


diabetes. N Engl J Med. DOI: 10.1056/NEJMoa1603827.

MAURI, Laura; D’AGOSTINO, Ralph B. Challenges in the Design


and Interpretation of Noninferiority Trials. New England Journal
Of Medicine, [s.l.], v. 377, n. 14, p.1357-1367, 5 out. 2017. Massachusetts
Medical Society. http://dx.doi.org/10.1056/nejmra1510063.

PINTO, Valdair Ferreira. Estudos clínicos de não-inferioridade:


Fundamentos e controvérsias. Jornal Vascular Brasileiro, São Paulo, v.
9, n. 3, p.145-151, jun. 2010.

ESTUDOS DE NÃO INFERIORIDADE 195


ESTUDOS DE
MUNDO REAL

16 Breno C C Simas
Clause Willdys Medeiros Dantas
Henrique de Paula Bedaque
Maria Tamyres de Carvalho Freitas

O QUE É?

O
s Estudos de Mundo Real (EMRs) são estudos
epidemiológicos que testam o benefício de
uma conduta terapêutica em condições mais
próximas da vida real – abrangem populações maiores e
com características mais amplas. São estudos primários
que se propõem a avaliar o efeito de condutas terapêuticas
em circunstâncias mais próximas da prática clínica do que
aquelas dos ensaios clínicos randomizados (ECRs).
Dessa forma, os EMRs possibilitam a avaliação de efeti-
vidade, enquanto os ECRs avaliam eficácia. A diferença entre
essas duas características se dá pelo fato de que enquanto
a eficácia diz respeito ao efeito intrínseco do tratamento, a

197
efetividade nos mostra qual o benefício que a intervenção
oferece em circunstâncias rotineiras.

CABEÇA PENSANTE 01

Precisamos entender bem a diferença entre os conceitos de eficácia


e efetividade. Eficácia representa o efeito do tratamento, melhor
avaliada pelos ensaios clínicos. Efetividade corresponde interação
entre o efeito do tratamento e variáveis do mundo real – como
adesão e regularidade do tratamento – e é melhor avaliada nos
estudos de mundo real.

Enquanto nos ECRs o acesso e uso da medicação, as


características dos pacientes, o seguimento e o controle de
variáveis de confusão estão presentes para garantir que
os dois grupos se tornem semelhantes, nos EMRs isso não
ocorre. Portanto, EMRs podem ser descritos como estudos
pragmáticos, uma vez que são realizados com populações
heterogêneas, em circunstâncias mais próximas da prática do
que as populações rigorosamente selecionadas e controladas
dos ECRs.
Este desenho de estudo é caracterizado por um controle
menos rigoroso dos pacientes quando comparado aos ensaios
clínicos de fase III e tem caráter observacional. Por isso, seus
resultados estão mais susceptíveis a erros sistemáticos e
devem ser interpretados de forma cuidadosa. Vale a pena
conferir o capítulo de vieses para entender melhor sobre
essas desvantagens.
Vários desenhos de estudo podem cumprir o propó-
sito de avaliar a performance de uma conduta terapêutica
no mundo real. Entre eles, utilizamos mais comumente as

198 DESCOMPLICANDO MBE


coortes. Com muita frequência, observamos estudos de coorte
feitos através de registros ou bases de dados de sistemas ou
planos de saúde, que facilitam a obtenção longitudinal de
dados pelos investigadores. Estudos de caso-controle também
podem dar informações sobre a performance no mundo
real da intervenção que desejamos testar, porém, são mais
limitados por não haver garantia de que há relação causal
entre exposição e desfecho.
Apesar de alguns ECRs possuírem características
pragmáticas – quando seu desenho permite que decisões
clínicas distintas sejam tomadas para pacientes dentro de
um mesmo grupo – ainda há um nível de controle devido à
randomização. Exemplos memoráveis de ECRs com carac-
terísticas pragmáticas são aqueles que avaliam testes de
screening na população assintomática e avaliam seu impacto
em desfechos clínicos: aqui, a alocação é feita de acordo
com a estratégia para rastreio mas a conduta subsequente
ao resultado do teste diagnóstico é definida sob discrição
do médico assistente.
Os estudos pragmáticos diferem dos ECRs especial-
mente porque o julgamento clínico do médico prescritor
torna-se um fator importante na definição da conduta tera-
pêutica. Além disso, outras variáveis tais como acesso e
adesão impactam no resultado, diferente dos ECRs onde
essas variáveis são controladas e consequentemente não
refletem a realidade.
Em resumo, EMRs são estudos observacionais – mais
frequentemente coortes – que testam o efeito de condutas
terapêuticas em populações abrangentes sem controle de

ESTUDOS DE MUNDO REAL 199


variáveis que podem influenciar o efeito da intervenção no
mundo real.

QUAL A IMPORTÂNCIA?

Os estudos de mundo real têm maior relevância


para testar a efetividade de determinada intervenção,
enquanto os ensaios clínicos randomizados avaliam eficácia.
Primeiramente, é necessário voltar aos conceitos de eficácia
e efetividade, para que as diferenças entre os estudos fiquem
mais claras.
Na prática, como isso funciona? Quando se fala em
ECRs (especialmente até a fase III), é necessário entender
que este tipo de estudo está sendo controlado da forma
mais precisa possível. Isso porque esses estudos se propõem
a avaliar como o paciente responde à intervenção. Dessa
forma, é feito um grande esforço para garantir que fatores
além da intervenção que poderiam influenciar o desfecho
se mantenham constantes. Veja o exemplo:
Ao testar um novo medicamento em ECRs, a dose, os horários,
o número de visitas de seguimento e a frequência, que são
variáveis importantes nesses estudos, são controladas pelo
pesquisador a fim de que não ocorram erros que alterem o
resultado final do estudo.
Controlar possíveis vieses nos ECRs, também, é de
fundamental importância para estabelecer a validade interna
do mesmo. A validade interna se refere a replicabilidade
dos resultados dentro das mesmas condições na população,
sendo necessário garantir que não ocorram erros sistemáti-
cos. Manter a validade interna é essencial para comprovar

200 DESCOMPLICANDO MBE


a eficácia, pois é garantido que naquela população, sob
ambiente controlado a eficácia deve ser a mesma.

CABEÇA PENSANTE 02

Validade interna diz respeito veracidade de um estudo. Se o estudo


tem metodologia adequada, baixo risco de erros sistemáticos e
aleatórios, quer dizer que tem boa validade interna. Já a validade
externa diz respeito possibilidade de extrapolar os resultados
observados no meu estudo para outras populações, e depende das
características da população estudada (se for um grupo muito
específico talvez não seja apropriado aplicar a evidência em uma
parcela muito mais ampla da população).

Entretanto, frequentemente a nossa capacidade de


extrapolar os dados de um ensaio clínico para populações
mais amplas é limitada. Isso se deve ao fato de que seus
participantes são muito semelhantes entre si, o que limita
a validade externa da evidência. Assim, torna-se arriscado
extrapolar aquilo que foi observado no ambiente controlado
para as situações no mundo real em que nosso paciente não
corresponde à população do ensaio clínico. Nesse momento
os EMRs se tornam interessantes.
Retomando o exemplo dado anteriormente, no mundo
real é provável que, ao prescrever um medicamento, parte
das pessoas esqueçam o horário de administração, errem a
dose, ou façam uso dele em frequências inadequadas. Assim,
a eficácia que foi observada nos ECRs, ao controlar variáveis
do estudo que poderiam causar confusão, não é garantida.
Torna-se necessário avaliar a efetividade da conduta tera-
pêutica cuja eficácia já foi demonstrada para determinar se

ESTUDOS DE MUNDO REAL 201


mesmo sem o ambiente controlado o medicamento ainda
mostra bom desempenho e cumpre seu objetivo.
A vantagem dos EMRs é que como a efetividade é
avaliada em uma população maior e em uma situação real
(quando comparado com um ECR), é possível extrapolar os
resultados para outras populações de forma mais segura.
Isso ocorre porque se a eficácia já é conhecida e mesmo com
a interferência de variáveis do mundo real é possível obter
um resultado que demonstra efetividade em uma população
ampla, podemos atribuir boa validade externa à conduta que
estamos considerando aplicar. Exemplo:
Várias medicações para diabetes são testadas em ensaios
clínicos multicêntricos, mas só incluem pacientes de muito
alto risco, com doença cardiovascular já estabelecida, para
demonstrar eficácia. Temos boa validade interna, mas para
aplicar em pacientes de risco menor não temos boa validade
externa. Logo, pode ser feito um EMR utilizando uma base de
dados para avaliar se o benefício é mantido em uma população
mais ampla. Se o benefício for mantido, temos um indicador
de que essa conduta também pode ser benéfica em pacientes
de risco intermediário ou baixo.
Outra vantagem dos EMRs é a possibilidade de estudar
participantes que não foram “selecionados a dedo”. ECRs
geralmente recrutam populações com características que
atendam inúmeros critérios de elegibilidade. Se nos ECRs é
preciso preservar esses critérios para assegurar uma inter-
pretação mais clara, nos EMRs temos a possibilidade de
obter uma população mais heterogênea.
Dessa forma, através de EMRs podemos extrapolar uma
conduta benéfica de forma mais adequada para grupos mais

202 DESCOMPLICANDO MBE


amplos de pacientes. Além disso, permitir uma população
mais abrangente facilita o uso de dados secundários coletados
retrospectivamente, o que torna a pesquisa menos onerosa
e mais rápida.
Outra importante aplicação dos EMRs consiste em ana-
lisar efeitos adversos. Frequentemente, ECRs têm amostragem
e tempo de seguimento suficientes para comparar os grupos
em relação ao desfecho primário. Porém, eventos adversos
potencialmente sérios ocorrem com menor frequência e
podem não estar presentes em quantidade suficiente nos
ECRs para que se chegue a conclusões confiáveis em relação
aos potenciais riscos. Bases de dados muitas vezes possibi-
litam acesso a toda a população potencialmente exposta à
intervenção que pode estar associada ao evento adverso que
se deseja avaliar.
Os EMRs também não possuem um desenho de estudo
específico, diferente do ECRs, o pesquisador deve escolher
qual (ou quais) tipo de estudo é o mais adequado para res-
ponder à sua pergunta de pesquisa, permitindo uma maior
flexibilidade no momento de desenvolver um estudo, de
acordo com as limitações, custos e benefícios.

QUAIS AS LIMITAÇÕES?

Nos estudos de mundo real, como a população não é


submetida ao processo de randomização, há susceptibilidade
a viés de confusão pois as características dos grupos de
pacientes expostos e não-expostos à intervenção não serão
necessariamente equilibradas. Por exemplo, em situações
onde o fato do paciente receber a conduta indicar uma melhor
assistência a saúde, um efeito benéfico observado pode não

ESTUDOS DE MUNDO REAL 203


ser necessariamente decorrente da conduta avaliada, e sim
desses fatores de confusão.
Outro exemplo disso é quando há “confundimento
por indicação”, em que a indicação do tratamento depende
do prognóstico do paciente, de forma que pacientes de pior
prognóstico tendem a receber mais ou menos o tratamento e
esse desequilíbrio influencia o resultado. Técnicas de ajuste
estatístico, embora atenuem fatores de confusão, não são
garantia de que os resultados não sejam decorrentes de
confusão residual ou fatores não contabilizados no ajuste.
Um exemplo de confundimento por indicação seria quando
eu seleciono na minha coorte pacientes com doença renal
crônica, e alguns não recebem um tratamento porque estão
em hemodiálise (que marca pior prognóstico). Ao comparar
os resultados, um aparente benefício pode se dever ao pior
prognóstico dos pacientes em hemodiálise, e não ao tratamento
em si.
Uma estratégia frequentemente utilizada para lidar com
fatores de confusão em estudos observacionais é a utilização
de escores de propensão. Através de técnicas estatísticas, o
escore de propensão pode ser derivado e então utilizado de
maneira a parear pacientes com características semelhan-
tes para tentar “forçar” os grupos de pacientes expostos e
não-expostos a se tornarem semelhantes. No entanto, isso é
feito às custas da exclusão de pacientes que não podem ser
pareados. Outra estratégia que utiliza escores de propensão
é a ponderação pelo inverso da probabilidade, que atribui
peso maior na análise a pacientes cujas características são
menos frequentes.

204 DESCOMPLICANDO MBE


Por isso, é importante termos em mente que o real
valor da avaliação da efetividade se dá após termos testado a
conduta em um ECR, em ambiente controlado e sem fatores
de confusão. Então, depois de provar que a nossa conduta é
eficaz, utilizamos os EMRs para confirmar se a eficácia no
ambiente controlado se traduz em efetividade no mundo
real. Isso corresponde às diferentes fases de implementação
de uma conduta na prática clínica: primeiro temos ensaios
clínicos de fase I a III, seguidos pela fase IV, em que avaliamos
o fármaco já em comercialização.
É essencial compreender que há uma ordem certa
para incorporar as evidências. Primeiro precisamos definir
que uma droga é eficaz, estabelecer causalidade entre trata-
mento e melhores desfechos clínicos. Depois testamos se a
droga funciona no mundo real. Não é apropriado incorporar
condutas sem evidências robustas de ECRs simplesmente
porque observamos um aparente benefício em EMRs, pois
como todo estudo observacional, eles estão repletos de fatores
de confusão.
Além disso, nesse tipo de estudo não há possibilidade
de cegamento dos provedores de saúde ou dos pacientes em
relação aos tratamentos oferecidos, de forma que fatores de
confusão podem favorecer o grupo exposto ao tratamento
avaliado. Da mesma forma dos ECRs sem cegamento, aqui há
possibilidade de viés quando analisamos desfechos subjeti-
vos, gerados pelo médico ou susceptíveis a erros de aferição.
Outros possíveis problemas decorrem da utilização
de registros e bases de dados em estudos retrospectivos.
Aqui há algumas possíveis limitações inerentes a estudos
retrospectivos: dados omissos podem prejudicar a análise

ESTUDOS DE MUNDO REAL 205


dos resultados e não estão sob controle dos investigadores;
a forma como os relatos e registros é feita não é necessaria-
mente uniforme.
Os dados omissos, ou missing data, são muito comuns
em estudos que utilizam coleta de dados longitudinal, estu-
dos retrospectivos e até mesmo em ensaios clínicos. A forma
mais comum de lidar com essa perda de informações é a
exclusão dos participantes com variáveis ausentes, o que
pode diminuir o tamanho da amostra, reduzindo o poder do
estudo e aumentando o risco de vieses. No entanto, existem
outras abordagens possíveis, tais como a imputação dos
dados faltantes, que consiste na dedução dos dados que
faltam para inclusão de toda a população do estudo. Essas
técnicas empenham-se em tornar os resultados do estudo
possíveis de serem interpretados como se todos os valores
estivessem presentes.
A imputação única consiste no preenchimento dos
dados que faltam com a média ou mediana dos outros valores
coletados ou mesmo com valores aleatórios. Essa técnica
falha por não se apropriar da incerteza dos dados (já que
não são reais), introduzir vieses e alterar resultados. Já a
imputação múltipla, leva em consideração a incerteza dos
dados “criados” pelos pesquisadores, se mostrando uma
técnica que apresenta resultados mais rigorosos.
É importante compreender que nenhuma das técnicas
para lidar com missing data é livre de falhas, e que toda
imputação em última instância se dá por atribuirmos um
determinado valor a um dado desconhecido. A observação
mais interessante é a de consistência: se observamos o mesmo
resultado independente do método utilizado para manejar

206 DESCOMPLICANDO MBE


missing data, isso fala a favor de robustez do resultado do
estudo e aumenta minha confiabilidade.
Há um outro viés que é característico desse tipo de
estudo, que é o “viés da imortalidade”. Nele, após o início
de uma determinada conduta, é definido um intervalo de
tempo em que não será contabilizado desfecho mesmo que a
intervenção tenha sido aplicada ao paciente – pois a medica-
ção ainda não estaria exercendo seu efeito plenamente. Essa
prática pode superestimar o benefício de uma intervenção,
pois os pacientes que a recebem passam um período sem
que nenhum desfecho seja contabilizado.
Um exemplo prático do viés de imortalidade ocorre em estudos
de mundo real para tratamento de asma. Neles, são avaliados
esquemas de tratamento com corticosteroide inalatório e o
desfecho primário é óbito ou hospitalização por exacerba-
ção asmática. Nesses estudos, após iniciar o tratamento
com corticosteroide inalatório, os pacientes passam 90 dias
sem contabilizar desfecho para o grupo de intervenção caso
venham a óbito ou tenham nova exacerbação. Dessa forma,
acabamos por superestimar o benefício do tratamento.

CONCLUSÃO

Os estudos de mundo real são, portanto, imprescindí-


veis para avaliar a efetividade das intervenções anteriormente
atestadas por ensaios clínicos, ampliando sua validade externa
ao abranger uma população maior e mais diversificada.
No entanto, apesar de sua relevante função, seus
resultados devem ser avaliados de forma criteriosa pelo
profissional da saúde que o lê, devido a sua susceptibilidade

ESTUDOS DE MUNDO REAL 207


a vieses de confusão, principalmente se não forem aplicadas
as ferramentas metodológicas devidas.

REFERÊNCIAS

Harari S. Randomised controlled trials and real-life studies: two answers for
one question. Eur Respir Rev 2018;27:180080.

Newgard CD, Lewis RJ. Missing Data. JAMA 2015;314:940–1.

Roche N, Reddel HK, Agusti A, Bateman ED, Krishnan JA, Martin RJ,
Papi A, Postma D, Thomas M, Brusselle G, Israel E, Rand C, Chisholm
A, Price D. Integrating real-life studies in the global therapeutic research
framework. Lancet Respir Med 2013;1:e29–30.

Thomas L, Li F, Pencina M. Using Propensity Score Methods to


Create Target Populations in Observational Clinical Research. JAMA
2020;323:466–7.

Saturni S, Bellini F, Braido F, Paggiaro P, Sanduzzi A, Scichilone N,


Santus PA, Morandi L, Papi A. Randomized controlled trials and real
life studies. Approaches and methodologies: a clinical point of view. Pulm
Pharmacol Ther 2014;27:129–38.

208 DESCOMPLICANDO MBE


MÓDULO 3
ANÁLISES
ESTATÍSTICAS

17 Beatriz Aguiar da Silva Carvalho


Henrique de Paula Bedaque
Ítalo Medeiros de Azevedo

DISTRIBUIÇÃO NORMAL O QUE É?

A
distribuição é o espalhamento das variáveis
por um gráfico cartesiano (com eixo X e eixo
Y) cujos tipos e formas podem ser vários.
Uma das formas muito utilizada na bioestatística é a
DISTRIBUIÇÃO NORMAL.
Por exemplo:

211
Figura 1 – Distribuição de dados em um
gráfico de frequência por altura

No gráfico acima, coletamos a altura dos alunos de


uma sala de aula e colocamos em um gráfico de altura das
pessoas (eixo x) pelo número de pessoas (eixo y). Dessa forma,
percebemos que existem poucas pessoas muito baixas e a
maioria é mais alta. Se nós tentássemos representar esses
pontos através de uma curva, formaríamos algo semelhante
à imagem abaixo.

212 DESCOMPLICANDO MBE


Figura 2 – Distribuição de dados de variável
número de pessoas por altura com
delimitação da curva representante

Essa curva deve ser o centro de nossas atenções, pois


é reconhecendo um tipo específico de forma que poderemos
dar o diagnóstico de “Curva Normal” (Distribuição Normal).
Para isso, precisamos saber que a normalidade requer sem-
pre poucas pessoas nos extremos e muitas no meio. Vamos
observar o exemplo abaixo:

Análises Estatísticas 213


Figura 3 – Outra distribuição de variável número
de pessoas pela suas respectivas alturas

Na imagem acima, vemos mais uma vez uma distri-


buição da altura das pessoas (eixo x) pelo número de pessoas
com tal altura (eixo y). Dessa vez, entretanto, perceba que
há poucos casos de pessoas muito baixas e muito altas, pois
a maioria das pessoas tem uma altura intermediária. Ao
desenhar a curva que representa essa NORMALIDADE,
observamos:

214 DESCOMPLICANDO MBE


Figura 4 – Demonstração da curva sobre a distribuição
de frequência por altura de indivíduos analisados

Acima, vemos uma curva que tende a normalidade:


uma forma alta no centro e baixa nas extremidades, tendendo
à simetria. Essa imagem representa uma Distribuição Normal
(Curva Normal) ou melhor, uma apresentação NORMAL dos
dados coletados. Observemos uma representação padrão de
Curva Normal abaixo.

Análises Estatísticas 215


Figura 5 – Representação esquemática
de uma distribuição normal

CABEÇA PENSANTE

Vamos lembrar da época da escola! Sempre havia aqueles poucos


alunos que tiravam 9-10 em todas as provas, sempre havia outros
poucos alunos que sempre tiravam notas vermelhas. Entretanto,
a grande maioria da turma tirava notas médias, entre 7-8 e,
isso, além de ser normal, representa uma DISTRIBUIÇÃO NORMAL!

Para finalizar, veremos alguns exemplos de curvas


NÃO NORMAIS:

216 DESCOMPLICANDO MBE


Figura 6 – Várias representações esquemáticas
de distribuições não normais

PARA QUE SERVE?

A Distribuição é uma forma de representação de dados


em um gráfico, que pode ser do tipo anormal ou normal. A
grande importância da normalidade é seu auxílio na realiza-
ção de várias análises estatísticas, visto que uma Distribuição
Normal tem dados mais previsíveis e, por isso, podemos
entender melhor o que as variáveis estão nos dizendo.
Além disso, existe mais um aspecto importante do
reconhecimento do tipo de curva (NORMAL ou ANORMAL):
a escolha de qual análise descritiva (Média ou Mediana) é a
mais fiel à realidade (a que deve ser usada). Vamos entender
o porquê:

Análises Estatísticas 217


Figura 7 – Demonstração esquemática de
uma distribuição normal com marcação
da média, moda e mediana

Na imagem acima, observamos uma Distribuição


Normal da altura das pessoas (eixo x) pelo número de pessoas
com essa altura (eixo y). Perceba que, se há um número igual
de pessoas baixas e altas, tanto a Média como a Mediana
estarão no mesmo lugar. Dessa forma, a altura que representa
de forma mais fiel a “altura média” das pessoas pode ser
tanto a Média como a Mediana.
MÉDIA: É resultante da soma do total de termos
(variáveis) coletadas dividido pelo número de termos.
MEDIANA: É caracterizado pelo valor que consegue
dividir uma sequência ordenada (do maior para menor) de
termos ou variáveis pela metade, isto é, metade dos termos
ficará antes da mediana e a outra metade após na sequência
ordenada.
Vejamos agora uma distribuição ANORMAL:

218 DESCOMPLICANDO MBE


Figura 8 – Representação de uma distribuição
anormal com marcação de mediana e média

Se imaginarmos que, naquela mesma sala, chegaram


alguns jogadores de basquete muito altos, haverá um deslo-
camento da Média (soma da alturas dividido pelo número
de pessoas) para cima, enquanto a Mediana permanece
no mesmo lugar (na realidade desloca apenas um pouco).
Então, preste atenção ao gráfico e pense: qual dessas medidas
representa, de forma mais fiel, a altura que a maioria das
pessoas tem? SIM, é a Mediana.
Vamos reforçar: a Média é uma medida descritiva
muito conhecida, mas que tem o problema de ser muito
influenciada pelos extremos, enquanto a Mediana não é
influenciada pelos extremos – sendo um melhor indicador
da realidade da população estudada em uma situação de
DISTRIBUIÇÃO ANORMAL.

Análises Estatísticas 219


CABEÇA PENSANTE

Imagine que calculamos o Produto Interno Bruto (PIB) por habi-


tantes de uma favela e deu 1400 reais por pessoa. Imaginemos,
também, que Bill Gates resolve se mudar para morar nessa favela.
Isso fará com que o PIB por habitantes passe para 2 milhões de
reais por pessoa, já que o PIB por habitantes é calculado pela
Média de todas as rendas dividida pelo número de habitantes.
Pense agora: qual valor descreve melhor o salário que a maioria
das pessoas da favela ganha? Não é a Média de 2 milhões, mas
sim, os 1400 reais (Mediana).

Fixe o conceito com a imagem abaixo:

Figura 9 – Apresentação resumida de uma


distribuição normal e outra anormal

Agora que já entendemos um pouco sobre as distribui-


ções vamos compreender algumas análises e transformar os
números em informações!

220 DESCOMPLICANDO MBE


TESTE DE QUI-QUADRADO O QUE É?

É um teste usado para avaliar se há associação entre


duas variáveis qualitativas, isto é, esse teste vai informar se
uma variável X se relaciona com uma variável Y – mas, para
isso, X e Y devem ser qualitativas (sexo, sim ou não, etc.) e,
normalmente, com duas possibilidades (homem ou mulher;
morto ou vivo; fuma ou não fuma).

PARA QUE SERVE?

Um exemplo para melhor entender: “será que fumar


está relacionado com ter câncer de pulmão?”. Perceba que
fumar e câncer são duas variáveis qualitativas que tem apenas
duas opções (fumante ou não fumante e com câncer ou sem
câncer); assim, podemos usar do teste Qui² para avaliar se o
ato de fumar influencia ou não o fato das pessoas terem – ou
não – câncer de pulmão.
ATENÇÃO: o Qui² não informa intensidade de associação
(quantas vezes mais risco/chance um fumante tem de ter câncer
de pulmão). Ele apenas afirma se há ou não associação (relação)
entre as variáveis.
Vamos lembrar da pergunta que fizemos ao teste Qui²:
“Fumar se relaciona (está associado) com ter câncer de pul-
mão?”. Para esta pergunta há duas possíveis respostas: Sim
ou Não. Vejamos o esquema abaixo:

Análises Estatísticas 221


Figura 10 – Representação esquemática da
pergunta do Qui² com suas possíveis respostas

Vamos reforçar o que vemos no esquema acima: para


que a resposta da pergunta seja SIM, a Hipótese H1 (também
chamada de hipótese alternativa) é a vencedora do Qui², e
isso só ocorre quando o valor de p < 0,05 no teste. Por outro
lado, para que a resposta seja NÃO, A Hipótese H0 (também
chamada de hipótese nula) é a vencedora do Qui² e isso só
ocorre quando o valor de p > 0,05 no teste.

CABEÇA PENSANTE

O p-valor é um conceito que apesar de ser muito difundido e


utilizado ainda gera muitas confusões em sua conceituação. Na
realidade ele indica a probabilidade de obter uma resposta igual ou
mais extrema que a hipótese nula, perceba que ela não caracteriza
nada sobre a hipótese alternativa, por isso o p-valor está apenas
relacionado ao descarte ou não da possibilidade da hipótese nula
como a verdadeira. Para fins educativos iremos trazer uma forma
simplificada e prática de uso do p-valor para a interpretação.

222 DESCOMPLICANDO MBE


Adicionando alguns números para melhor compreender:

Figura 11 – Representação esquemática


da distribuição dos dados

Na tabela acima idealizamos a descrição numérica de


pessoas que fumam e tiveram câncer de pulmão (647), que
fumam e não tiveram câncer de pulmão (622), pessoas que
não fumam e tiveram câncer de pulmão (12) e de pessoas
que não fumam e não tiveram câncer de pulmão (27).
Vamos agora fazer o teste de Qui² e entender o resultado:

PE A R SON C H I -SQU A R E -> SIGN I FIC ÂNC I A = 0,000

Com o resultado fica fácil notar que o valor de p é


0,000! E esse número é menor que 0,05! Agora, vamos lembrar
que para a H1 ser a vencedora o p deve ser menor 0,05 (p <
0,05), assim, o teste de Qui² nos informa: a hipótese H1 é a
vencedora.
Além disso, vale lembrar também: a H1 é a resposta
“SIM” para a pergunta “fumar está associado a ter câncer

Análises Estatísticas 223


de pulmão?”. Logo, a resposta para essa pergunta é: Sim,
fumar está associado a ter câncer de pulmão.
Vamos sistematizar:
Fumar está associado a ter câncer de pulmão? Sim! Se H1
for a vencedora (p<0.05)
Não! Se H0 for a vencedora (p>0.05)
Agora, generalizando:
A variável X está associada a variável Y? Sim! Se H1 for
a vencedora (p<0.05) Não! Se H0 for a vencedora (p>0.05)

CABEÇA PENSANTE

O fato do resultado do Qui² ter sido 0,000 não quer dizer que
o p = 0! Na realidade, o computador só irá mostrar o número de
casas decimais que for pedido – no exemplo, 3 casas decimais –
assim, se fossem 5 casas decimais, o p seria 0,00003 cujo
valor é diferente de 0 (zero).

CABEÇA PENSANTE

Existe muito mais por traz do Qui²! No exemplo mostrado acima, todos
os quatro valores (aqueles dentro do quadrado) são maiores que
10 e, por isso, escolhemos o valor indicado pela seta (Pearson
Qui-Square). Entretanto, se houvesse algum valor menor que 10,
teríamos que usar o Fisher’s Exact Test. Não se preocupe, nos artigos o
autor já faz a escolha do tipo de teste correto para as condições
específicas da análise. Assim, caberá ao leitor se dedicar na
interpretação do valor estatístico encontrado.

224 DESCOMPLICANDO MBE


RISCO X CHANCES

O QUE É?

A estatística nos fornece uma grande quantidade de


informações interessantes para nosso uso, dentre elas, pode-
mos citar as análises de “risco” e de “chance” – facilmente
confundidas, como se carregassem a mesma informação.
Entretanto, esses dois conceitos tem suas peculiaridades,
que devem estar bem claras para todos os leitores de dados
e artigos.
Vamos agora construir o conceito de risco e de chance
para que, em seus capítulos específicos, possamos criar as
perguntas e respostas estatísticas.

CONSTRUINDO UM MODELO

Para entender melhor a distinção entre esses conceitos,


vamos construir uma tabela que exemplifique as diversas
utilidades dessas análises:

Análises Estatísticas 225


Figura 12 – Representação esquemática
de uma tabela de contingência

É importante notar: a imagem acima traz as mesmas


informações utilizadas no teste de Qui² quando mostramos
um exemplo da associação entre o tabagismo e o câncer de
pulmão. Reveja o exemplo abaixo:

Figura 13 – Repete-se a representação da distribuição


dos dados dentro do esquema já citado

226 DESCOMPLICANDO MBE


Dessa forma, o que construímos foi um modelo sistema-
tizado que poderá abranger um variado número de pesquisas.
Entenderemos que o D (desfecho) pode estar presente (D+)
ou ausente (D-) tanto para as pessoas expostas (E+), quanto
para os que não sofreram a exposição estudada (E-).
Qual seria, assim, o “risco” das pessoas expostas (E+)
desenvolverem o desfecho estudado (D+)?

CABEÇA PENSANTE

Vamos lembrar um pouco de probabilidade: quando jogamos uma


moeda qualquer, sabemos que a probabilidade de cair “cara” é de
50%, assim como a probabilidade de cair “coroa”. Ou seja, o risco
de dar cara é de ½ = 0,5. Como chegamos a isso?

Figura 14 – Fórmula do cálculo de risco

Agora que lembramos como calculamos a probabili-


dade (risco) de algo ocorrer, vamos sistematizar pela nossa
tabela:

Análises Estatísticas 227


Figura 15 – Resumo dos cálculos de risco

Logo, temos que o risco das pessoas expostas (E+) terem


o desfecho (D+) será o resultado da razão de “a” sobre a soma
de todos os expostos (a+b). Dessas análises de risco podemos
ainda construir o famoso Risco Relativo (RR), que informa
o quão impactante é a exposição para a ocorrência de algum
desfecho.
O cálculo do risco relativo é muito simples e será
demonstrado abaixo:

228 DESCOMPLICANDO MBE


Figura 16 – Demonstração do cálculo de risco relativo

Para a construção do risco relativo fazemos uma razão


entre o risco dos expostos (E+) terem o desfecho (D+) e o risco
dos não expostos (E-) terem o desfecho (D+). Assim, esse
resultado será capaz de fornecer mais informações sobre a
exposição. Iremos comentar e interpretar o Risco Relativo
nos próximos capítulos.
Agora que já entendemos a construção do risco (pro-
babilidade) de um evento ocorrer, vamos estudar um pouco
sobre as “chances” de algum evento ocorrer.

CABEÇA PENSANTE 07

Um dos pontos principais deste capítulo é informar que “risco” e


“chance” não são a mesma coisa.

Análises Estatísticas 229


A chance de que algum evento ocorra depende de
dois pontos:
A) da probabilidade dos expostos (E+) terem o desfecho
(D+)
B) da probabilidade dos expostos (E+) NÃO terem o
desfecho (D+)
Assim, o cálculo e a conclusão trazida pela “chance”
acaba se diferindo do “risco”. Vamos sistematizar:

Figura 17 – Fórmula para cálculo de


chance de ocorrer um desfecho

Além disso, da mesma forma que calculamos a chance


de ocorrer desfecho (D+) nos indivíduos que foram expostos
(E+), também, podemos calcular a chance de ocorrer desfecho
(D+) nos NÃO exposto (E-), veja:

230 DESCOMPLICANDO MBE


Figura 18 – Fórmula para cálculo de uma
chance de não ocorrer um desfecho

Por fim, agora que já sabemos calcular uma “chance”,


podemos definir também a razão de chances (odds ratio),
muito utilizada em artigos: Para isso, iremos dividir as duas
chances construídas:
A) Chance de desfecho (D+) no grupo exposto (E+)
B) Chance de desfecho (D+) no grupo NÃO exposto
(E-) Vejamos na imagem:

Análises Estatísticas 231


Figura 19 – Fórmula de cálculo de
razão de chances (Odds ratio)

Por fim, você pode concluir que “risco” e “chance”


são duas análises estatísticas que não tem o mesmo sig-
nificado – comprovado pelas fórmulas distintas – e seus
derivados “Risco Relativo” e “Odds Ratio” não fornecem a
mesma informação, mas querem analisar o efeito (associativo
ou causal) de uma exposição para um determinado desfecho.
Após a visualização sistematizada das diferenças entre
“risco” e “chance” vamos exemplificar:
Imaginemos que você está com um dado de 6 lados e deseja
saber qual o risco (probabilidade) de jogar o dado e aparecer
o número “1”:

232 DESCOMPLICANDO MBE


Figura 20 – Cálculo do risco de aparecer um
“1” ao jogar um dado de seis lados

CABEÇA PENSANTE

Explicando o cálculo: o que queremos analisar é o risco do evento


“aparecer o número 1” acontecer, por isso, calculamos a pro-
babilidade – o numerador é o número de casos favoráveis (há
apenas um número 1 em um dado) e o denominador é o número
de casos possíveis (há seis lados em um dado). Assim, teremos
como resultado 1/6 ou – transformando em porcentagem – 16%
de risco de cair o número 01 ao jogar um dado.

Qual seria, agora, a chance do evento “aparecer o número 1” ocorrer?

Lembre que, para avaliar a chance, o numerador será a probabilidade de ocorrer


o desfecho e, o denominador, a probabilidade de não ocorrer o desfecho.

Análises Estatísticas 233


Figura 21 – Cálculo da chance de aparecer
um “1” ao jogar um dado de seis lados

CABEÇA PENSANTE

Um ponto que pode ser difícil de compreender é a obtenção do


denominador, mas vamos tentar explicá-lo melhor: quando queremos
saber a probabilidade de NÃO ocorrer um determinado desfecho,
há duas opções: (1) calcular a probabilidade de ocorrer o desfecho e
depois subtrair de 1 (como mostra a figura acima) ou (2) lembrando
que se o desfecho favorável só ocorre uma vez, os desfavoráveis
(não 1) ocorrem 5 vezes, logo, a probabilidade de NÃO ocorrer o ”1”
seria 5/6, sendo 6 o total de casos possíveis ao jogar um dado.

Após o exemplo acima fica evidente que o risco de


aparecer “1” em um dado (16%) é diferente das chances de
aparecer “1” em um dado (20%). Esse é o ponto principal deste
capítulo. Adiante, iremos comentar um pouco mais sobre a

234 DESCOMPLICANDO MBE


interpretação da razão de riscos (Relative Risk – RR) e da razão
de chances (Odds Ratio – OR).

TESTE DE ODDS RATIO

O QUE É?

CABEÇA PENSANTE

Ao lidar com desfechos raros (por exemplo, doenças raras) iremos


notar que os valores de RR e de OR se aproximam, isto é, podemos
considerá-los iguais.

É conhecido como razão de chances, isto é, ele vai infor-


mar quantas vezes há mais – ou menos – chances de um evento
ocorrer em um grupo do que em outro. Em outras palavras,
ele vai poder dizer quantas vezes um fumante tem mais
chances de ter CA de pulmão do que um não fumante. Desse
modo, o Odds Ratio (OR) diz a “INTENSIDADE” de uma
relação entre duas variáveis.

CABEÇA PENSANTE

Vamos recordar que o teste de Qui² informa se há ou não associação


entre duas variáveis, enquanto o OR vai nos dizer quantas vezes
a chance é maior ou menor nessa relação!

Análises Estatísticas 235


PARA QUE SERVE?

Já ficou fácil compreender que o Odds Ratio vai nos


informar quantas vezes mais/menos chances – quantos por
cento mais/menos chances – existem de algo ocorrer em um
grupo em comparação com outro. Logo, todo Odds Ratio está
comparando duas coisas (variáveis, grupos, populações,
medicações, etc.) e, por isso, é essencial ler o artigo estudado
com cuidado para saber quais são esses dois grupos.
A habilidade de interpretar o resultado do Odds Ratio
envolve, também, outros fatores. Vamos ver abaixo, então,
como seria representado o Odds Ratio naquele exemplo dos
fumantes e câncer de pulmão (capítulo de Qui²).

14,043 (95% C I , 3,325-59,301)

Essa grande expressão deve ser analisada


por partes: primeiro o conteúdo dentro dos
parênteses (1° passo) e, só depois, o valor do OR
propriamente dito (2° passo).

1º PA SSO: (95% C I , 3,325-59,301)

Esses valores indicam que o teste foi realizado utili-


zando um padrão de Intervalo de Confiança (CI) de 95%
e, para esse intervalo de confiança, os valores extremos
mínimo e máximo são de 3,325 à 59,301. Vamos desenhar
para melhor compreender:

236 DESCOMPLICANDO MBE


Figura 22 – Representação esquemática
de um intervalo de confiança

Nesse gráfico, representamos através da linha azul


todo o intervalo de confiança do Odds Ratio. Mas o que isso
significa? O verdadeiro valor do OR pode estar entre 3,325 e
59,301, mas há maior chance de estar em 14,043! E será esse
14,043 que você irá utilizar para transformar o número em
informação.
Então, se eu só utilizarei o 14,043, por que é preciso
analisar o intervalo de confiança? Isso é essencial, pois se
esse intervalo passar pelo número 1 há uma possibilidade
de neutralidade da relação – isto é, se o intervalo passar
pelo 1 há iguais chances de ocorrer o desfecho em ambos
os grupos (expostos e não expostos).

Análises Estatísticas 237


CABEÇA PENSANTE
O Odds Ratio é muito fácil de entender quando se percebe que ele
é uma multiplicação! Imagine que você tem 10 reais e eu digo
que vou multiplicar tudo que você tem por 2 (Odds Ratio), agora
você terá 20 reais (um aumento de 100% – dobrou o valor).

Imagine, em outra situação, que você tem 10 reais e eu digo


que vou multiplicar tudo que você tem por 1 (Odds Ratio). Agora,
você terá os mesmos 10 reais, nada mudou! É por isso que se,
em algum momento do intervalo de confiança, o valor passar pelo
1 (por exemplo, 02 (95% CI 0,9-6,0)), não há diferença entre
as chances de ambos os grupos.

Gostaríamos de definir o “efeito tanto faz” que será usado neste


livro de forma didática para melhor compreender algumas situações
estatísticas. O efeito “tanto faz” informa que não há vantagens
em usar a medicação ou placebo, em usar a terapia A ou terapia
B, em fazer a conduta A ou conduta B. Dessa forma, o efeito
representa que não houve diferença estatisticamente significativa
entre as opções estudadas.

Vamos pensar em clínica? Imagine que quero avaliar a chance de um


remédio “A” ser melhor do que “não fazer nada” para dor de cabeça e
o resultado (Odds Ratio) é 30.03 (95% CI 0,80

– 40,08). Por mais que o Odds Ratio seja um valor diferente


de 1, o intervalo de confiança passa pelo 1, e isso informa que,
em algum momento, o OR pode ser 1 e, quando ele for 1, tanto
faz usar o remédio ou não. Logo, se passar pelo 1 pense: “tanto
faz um ou outro”.

238 DESCOMPLICANDO MBE


Vamos ver a imagem para sistematizar esse aprendizado:

Figura 23 – Representação esquemática de dois


intervalos de confiança, sendo o que passa pelo
um o responsável pelo efeito “tanto faz”

Como podemos ver na imagem acima, se algum inter-


valo de confiança passar pelo 1, a relação poderá ser de igual
“intensidade”para ambos os grupos, o que faz com que todo
o Odds Ratio não tenha mais significância! Logo, quando o
intervalo passar pelo 1 teremos o “efeito tanto faz”!
Organizando, então, as ideias: sempre que nos depa-
rarmos com a expressão do Odds Ratio, o primeiro passo será
avaliar o que está dentro dos parênteses! Você irá avaliar se
esse valor tem significância ou não, assim, caso ele tenha
significância (não passe pelo 1) iremos iniciar a interpretação
do primeiro valor da expressão do OR.

Análises Estatísticas 239


2º PA SSO: 14,043

Para saber o que esse valor indica precisamos lem-


brar qual a pergunta que fizemos cuja resposta é o valor
do OR. Vejamos novamente aquele quadrado para facilitar
o entendimento.

Figura 24 – Representação esquemática da


ordem dos valores usados para interpretação

Olhe a imagem acima para melhor entender a per-


gunta cuja resposta é o Odds Ratio, no caso do fumo e câncer
de pulmão: “quantas vezes um fumante tem mais/menos
chance de ter câncer de pulmão em comparação com um
não fumante?”
Vamos generalizar:
“Quantas vezes um __1°__ tem mais OU menos chances de
ter __(desfecho da pesquisa)__ em comparação com __2°__ ?”

240 DESCOMPLICANDO MBE


Ou
“Quantas vezes um __grupo caso__ tem mais OU menos
chances de ter __(desfecho da pesquisa)__ em comparação
com __grupo controle__ ?”
Dessa forma, sabendo a pergunta e a resposta numérica
(14,043) fica fácil organizar essa resposta de modo mais
informativo, veja!
Quantas vezes um fumante tem de chance de ter câncer de
pulmão em comparação com um não fumante?
Resposta: Um fumante tem 14,043 mais chances de ter
câncer de pulmão do que um não fumante.
Fica mais fácil compreender essa informação se trans-
formarmos em porcentagem, já que estamos mais familiari-
zados com seu uso. Nesse caso, a transformação é simples
basta subtrair em 1 unidade o número obtido no Odds Ratio
e, após, multiplicar por 100. Segue o exemplo:
Resposta em % = (14,043 - 1) x 100
Resposta em % = 13,043 x 100
Resposta em % = 1304 %
Vamos generalizar para todos os casos:
Resposta em % = (odds ratio - 1) x 100
Dessa forma, podemos dizer que um fumante tem
1304% mais chances de ter câncer de pulmão do que um não
fumante. É a mesma resposta, só que agora no lugar do valor
do OR (14,043) utilizamos a % para melhor compreensão.

Análises Estatísticas 241


Vamos ver como interpretar os casos de Odds Ratio
menor que 1!
A representação numérica do OR deve se encaixar em
três categorias, vejamos abaixo:
Odds Ratio > 1: representa que há mais chances do desfecho
para o grupo caso (em nosso exemplo o grupo caso foi o de
fumantes).
Odds Ratio < 1: representa que há menos chances do desfecho
para o grupo caso.
Odds Ratio = 1: representa que há chances iguais do desfecho
para ambos os grupos.

CABEÇA PENSANTE

Faz sentido querer uma menor chance de desfecho para o grupo


caso? Sim! Imagine que você está estudando os efeitos de uma droga
que diminui a pressão arterial de pessoas com hipertensão arterial
sistêmica e tem como desfecho a mortalidade por qualquer causa.
Nesse caso, seu grupo caso é composto pelas pessoas que usam
essa medicação e o desfecho é algo não desejado, assim, o ideal
seria que uma droga eficiente conseguisse diminuir a mortalidade
(desfecho)! E isso ocorre quando o Odds Ratio é menor que 1!

Agora vamos imaginar que, para o caso descrito no


comentário “cabeça pensante 15”, o valor do OR foi de 0,8
(95% CI 0,6 - 0,9). Agora, vamos construir a pergunta para
nosso Odds Ratio: quantas vezes o grupo caso (uso da droga
anti-hipertensiva) tem mais (ou) menos chances de ter o des-
fecho (morte) em comparação com o grupo controle?

242 DESCOMPLICANDO MBE


“Quantas vezes um __grupo caso__ tem mais (ou) menos
chances de ter __(desfecho da pesquisa)__ em comparação
com __grupo controle__ ?”
Sabemos que: o grupo caso é o que usa droga anti-hi-
pertensiva, o desfecho é a mortalidade por qualquer causa e
o grupo controle é a população que não usou a droga. Além
disso, ao notar que o Odds Ratio é menor que 1 podemos
escolher a expressão “menos” para a nossa pergunta. Que
ficará assim:
Quantas vezes __o grupo que usou o anti-hipertensivo__
tem menos chances de ter __morte__ em comparação com
__ o grupo que não usou a droga__ ?”
Agora que construímos a pergunta fica fácil utilizar
o OR para responder de forma informativa!
Quantas vezes o grupo que usou o anti-hipertensivo teve
menos chances de morrer em comparação com o grupo que
não usou a droga?
Resposta: Quem usou o anti-hipertensivo teve 0,8 vezes
menos chances de morrer que o grupo que não usou a droga.
Nesses casos em que o Odds Ratio é menor que 1 a trans-
formação para porcentagem facilita muito a compreensão,
vejamos o porquê:
Resposta em % = (Odds Ratio - 1) x 100
Resposta em % = (0,8 -1) x 100
Resposta em % = - 0,2 x 100 Resposta em % = - 20%

Análises Estatísticas 243


Nesse caso, o sinal de menos (negativo) está apenas
informando que devemos escolher o “menos” para a nossa
resposta. Logo, a resposta é:
Quantas vezes o grupo que usou o anti-hipertensivo teve
menos chances de morrer em comparação com o grupo que
não usou a droga?
Resposta: Quem usou o anti-hipertensivo teve 20% menos
chances de morrer que o grupo que não usou a droga.
Percebeu que fica muito mais fácil entender em forma
de porcentagem?

CABEÇA PENSANTE 16

Não podemos esquecer que, nesse exemplo do anti-hipertensivo,


o intervalo de confiança estava entre 0.6 – 0.9, isto é, ele
não passa pelo 1!

CABEÇA PENSANTE 17

Sempre siga os seguintes passos para a correta interpretação


de um Odds Ratio:

1) Checar o intervalo de confiança (não pode passar pelo 1)


2) Fazer a pergunta do Odds Ratio
3) Transformar o valor do Odds Ratio em porcentagem
4) Construir a resposta do Odds Ratio

244 DESCOMPLICANDO MBE


CABEÇA PENSANTE 18

É muito comum a simplificação de Odds Ratio por simplesmente OR.

Pronto! Agora você já é capaz de interpretar o básico


de Odds Ratio!

TESTE DE RISCO RELATIVO

O QUE É?

É conhecido como razão de risco (RR), isto é, ele vai


informar quantas vezes há mais – ou menos – risco de um
evento ocorrer em um grupo do que em outro. Em outras
palavras, ele vai dizer quantas vezes um fumante tem mais
risco de ter CA de pulmão do que um não fumante. Desse
modo, o Risco relativo vai dar a “INTENSIDADE” de uma
relação entre duas variáveis.
Vamos recordar: o teste de Qui² diz se há ou não relação
entre duas variáveis, enquanto o RR vai nos dizer quantas
vezes o risco é maior ou menor nessa relação!

CABEÇA PENSANTE 19

É importante explicar que o cálculo do Risco Relativo não está


sempre disponível! Só é possível aplicá-lo quando, em uma pesquisa,
iniciamos a coleta dos dados com os pacientes expostos e não expostos
e fazemos o seguimento desses pacientes até a ocorrência dos desfechos.
Assim, em qualquer outra situação teríamos que calcular o Odds
Ratio.

Análises Estatísticas 245


CABEÇA PENSANTE

Por exemplo, se eu faço um estudo com 100 fumantes (exposição)


e 100 não fumantes (exposição) e faço o seguimento até a
ocorrência do câncer de pulmão (desfecho), eu poderei calcular o
risco relativo. Entretanto, se eu seleciono 500 pacientes com
câncer de pulmão e só depois verifico quantos fumavam e quantos
não fumavam, não poderei calcular o RR – mas ainda poderei
usar o Odds Ratio.

PARA QUE SERVE?

Já ficou fácil perceber que o RR vai informar dados


sobre quantas vezes mais/menos risco (probabilidade) –
quantos por cento mais/menos risco – existe de algo ocorrer
em um grupo em comparação com outro. Logo, todo Risco
Relativo está comparando duas coisas (variáveis, grupos,
populações, medicações) e, por isso, é essencial ler o artigo
estudado com cuidado para saber quais são esses dois grupos.
Entretanto, de forma semelhante à OR, a habilidade de
interpretar o resultado do Risco Relativo já começa por ele ser
representado por uma expressão que informa várias coisas,
que já foram comentadas no capítulo de Odds Ratio. Vamos,
então, ver como seria aplicado o conceito de RR naquele
exemplo dos fumantes e câncer de pulmão (capítulo de Qui²).
8,567 (95% C I, 4,925-9,357)

246 DESCOMPLICANDO MBE


CABEÇA PENSANTE

Lembrando que para o cálculo do RR estamos considerando que


partimos de pacientes com a exposição (tabagismo) e só depois
encontramos os desfechos (após o seguimento dos pacientes).

Essa grande expressão deve ser analisada por partes:


primeiro o conteúdo dentro dos parênteses (1° passo) e, só
depois, o valor do RR propriamente dito (2° passo).
Como já vimos no capítulo anterior, o ponto princi-
pal ao avaliar o intervalo de confiança é identificar se esse
intervalo passa ou não pelo 1. Se o intervalo de confiança
passar pelo 1, será um caso de “efeito tanto faz”, no qual a
exposição pode aumentar ou diminuir o risco de desfecho.

1º PA SSO: (95% C I, 4,925-9,357)

Ao analisar nosso intervalo de confiança (CI) per-


cebemos que ele não passa pelo 1, logo, há significância e
poderemos partir para o segundo passo da transformação
do número do RR em informação.

CABEÇA PENSANTE 22

Caso tenha dificuldade em entender sobre o intervalo de confiança


(CI) sugerimos a leitura do subcapítulo anterior sobre Odds Ratio.

Análises Estatísticas 247


2º PA SSO: 8,567

No segundo passo iremos utilizar o primeiro valor


fornecido pela expressão do Risco Relativo como ferramenta
de nossa interpretação da resposta: 8,567!
Para saber o que esse valor indica precisamos lem-
brar qual a pergunta que fizemos cuja resposta é o valor
do RR. Vejamos novamente aquele quadrado para facilitar
o entendimento.

Figura 25 – Novamente uma representação esquemática


para facilitar a compreensão da resposta generalizada

Observe a imagem acima para melhor entender a


pergunta cuja resposta é o Risco Relativo, naquele caso do
fumo e câncer de pulmão: “quantas vezes um fumante tem
mais/menos risco de ter câncer de pulmão em comparação
com um não fumante?”
Vamos generalizar:

248 DESCOMPLICANDO MBE


“Quantas vezes um __1°__ tem mais OU menos risco de
ter __(desfecho da pesquisa)__ em comparação com __2°__ ?”
Ou
“Quantas vezes um __grupo caso__ tem mais OU menos
risco de ter __(desfecho da pesquisa)__ em comparação com
__grupo controle__ ?”
Dessa forma – sabendo a pergunta e a resposta (8,567) –
fica fácil organizar a resposta de modo mais informativo, veja!
Quantas vezes um fumante tem de risco de ter câncer de
pulmão em comparação com um não fumante?
Resposta: Um fumante tem 8,567 mais risco de ter câncer
de pulmão do que um não fumante.
Fica mais fácil compreender essa informação se a
transformarmos em porcentagem, já que estamos mais
familiarizados com seu uso. Nesse caso, a transformação
é simples: basta subtrair 1 unidade do número obtido no
Risco Relativo e, após, multiplicar por 100, segue o exemplo:
Resposta em % = (8,567 - 1) x 100
Resposta em % = 7,567 x 100
Resposta em % = 756,7 %
Vamos generalizar para todos os casos:

Resposta em % = (risco relativo - 1) x 100


Dessa forma, podemos dizer: fumante tem 765,7% mais
risco de ter câncer de pulmão do que um não fumante. É a
mesma resposta, só que agora, no lugar do valor do Risco
Relativo (8,567) utilizamos a % para melhor compreensão.

Análises Estatísticas 249


Vamos ver como interpretar os casos de Risco Relativo
menor que 1!
A representação numérica do RR deve se encaixar em
três categorias, vejamos abaixo:
Risco Relativo > 1: representa que há maior risco (probabi-
lidade) do desfecho para o grupo caso (em nosso exemplo o
grupo caso foi o de fumantes).
Risco Relativo < 1: representa que há menor risco (probabi-
lidade) do desfecho para o grupo caso.
Risco Relativo = 1: Representa que há riscos iguais de desfecho
para ambos os grupos.
Vamos imaginar um estudo fictício para compreender
melhor um RR menor que 1:

CABEÇA PENSANTE

Em um estudo, foram selecionados pacientes com alto risco car-


diovascular e separados em dois grupos: um deles usaria ácido
acetilsalicílico (AAS) em baixa dose, diariamente (exposição);
enquanto o outro usaria placebo. Nesse estudo foi feito, então,
um follow-up desses pacientes em busca do desfecho infarto.

Note que – para esse desenho de estudo – partimos


das exposições para, então, encontrarmos os desfechos. Esse
é um requisito para o cálculo do Risco Relativo.
No caso descrito acima, o valor do RR foi de 0,6 (95%
CI 0,3 – 0,8). Vamos construir a pergunta para nosso Risco
Relativo: quantas vezes o grupo caso (uso da droga AAS)

250 DESCOMPLICANDO MBE


tem mais ou menos risco de ter o desfecho (infarto) em
comparação com o grupo controle? Observe.
“Quantas vezes um __grupo caso__ tem mais ou menos
risco de ter __(desfecho da pesquisa)__ em comparação
com __grupo controle__ ?”
Sabemos que: o grupo caso é o que usa droga AAS,
o desfecho é a ocorrência de infarto e o grupo controle é a
população que usou o placebo. Além disso, ao notar que o
risco relativo é menor que 1, podemos escolher a expressão
“menos” para a nossa pergunta. Veja:
“Quantas vezes __as pessoas que tomaram o AAS__ tem
menor risco de ter __infarto__ em comparação com __o
grupo placebo__ ?”
Agora que construímos a pergunta fica fácil utilizar o
Risco Relativo para responder de forma informativa!
Quantas vezes as pessoas que tomaram AAS tiveram menor
risco de infarto em comparação com o grupo placebo?
Resposta: Quem usou o AAS teve 0,6 menos risco de infarto
que o grupo placebo.
Nesses casos – em que o RR é menor que 1 – utilizar
a transformação para porcentagem facilita muito a compre-
ensão, vejamos o porquê:
Resposta em % = (risco relativo - 1) x 100
Resposta em % = (0,6 -1) x 100
Resposta em % = - 0,4 x 100 Resposta em % = - 40%

Análises Estatísticas 251


No exemplo, o sinal de menos (negativo) está apenas
informando que devemos escolher o “menos” para a nossa
resposta. Logo, a resposta é:
Quantas vezes as pessoas que tomaram AAS tiveram menor
risco de infarto em comparação com o grupo placebo?
Resposta: Quem usou o AAS teve risco 40% menor de ter
infarto do que o grupo placebo.
Percebeu que fica muito mais fácil entender em forma
de porcentagem?

CABEÇA PENSANTE

Não podemos esquecer que, nesse exemplo do AAS, o intervalo de


confiança estava entre 0,3 – 0,8, isto é, ele não passa pelo 1!

CABEÇA PENSANTE

Sempre siga os seguintes passos para a correta interpretação


do Risco Relativo:

1) Checar o intervalo de confiança (não pode passar pelo 1)


2) Fazer a pergunta do Risco Relativo
3) Transformar o valor do Risco Relativo em porcentagem
4) Construir a resposta do Risco Relativo

252 DESCOMPLICANDO MBE


CABEÇA PENSANTE

Você já deve ter notado a grande semelhante do Risco Relativo com


o Odds Ratio; entretanto, não esqueça que há diferenças conceituais
entre eles! Relembre essas diferenças no capítulo Risco x Chances.

TESTE T DE STUDENT O QUE É?

É um teste muito utilizado na bioestatística cujo obje-


tivo é comparar a média de dois grupos e informar se esses
dois grupos são iguais ou diferentes. É importante notar
que esses grupos podem ser de uma mesma população –
por exemplo, para um estudo antes e depois de alguma
intervenção – ou de duas populações distintas – como no
exemplo dos grupos fumante e não fumante.

PARA QUE SERVE?

A grande utilidade do teste é informar se dois grupos


são semelhantes ou diferentes entre si de forma significativa.
Mas por que isso seria importante?
Vamos imaginar aquele mesmo estudo do tabagismo
com relação ao câncer de pulmão. Nesse estudo, temos dois
grupos: fumantes e não fumantes; porém, não existe apenas
o tabagismo como fator de risco para desenvolver câncer de
pulmão e isso pode acabar confundindo os dados. Vejamos:
Imagine que temos 100 fumantes e 100 não fumantes,
mas que, do grupo de fumantes, 80 deles fumam há mais de
30 anos e, do grupo de não fumantes, apenas 10 possuíam
esse tempo de tabagismo. Assim, o fator de risco (tempo

Análises Estatísticas 253


de tabagismo) está desproporcional entre os dois grupos e
poderia ser um confundidor para toda a pesquisa.
Dessa forma, o Teste t de Student vai nos informar se
esses dois grupos são significativamente semelhantes na
questão de tempo de tabagismo, ou são diferentes (como
mostrado no exemplo acima).

CABEÇA PENSANTE

É fácil perceber “só no olho” que o exemplo acima mostra grandes


diferenças entre ambos os grupos; porém, imagine trabalhar com
milhares de pessoas e dezenas de possíveis fatores de risco!
É nesse momento que o Teste t de Student facilita muito a
interpretação.

Além dessa utilidade podemos exemplificar outra bem


importante: a do antes e depois. Imaginemos um estudo de
uma “dieta do pão de queijo” no qual escolhemos o peso de
100 pessoas e, após 02 meses seguindo essa dieta, as pesamos
novamente. Certamente, algumas irão emagrecer, outras
engordar e outras estarão com o mesmo peso. Entretanto,
a pergunta é: existe diferença estatisticamente significativa
entre a média do peso das pessoas antes e depois da dieta?
Nesse contexto, o Teste t de Student é excelente para
responder esse tipo de pergunta – comparando um antes
e depois. Vamos exemplificar e interpretar um resultado:

254 DESCOMPLICANDO MBE


CABEÇA PENSANTE

O mecanismo por detrás do Teste t é fazer duas distribuições


(vistas no capítulo de Distribuição Normal) e sobrepor as duas,
avaliando quão parecidas são essas duas áreas sobre a curva. É
dessa sobreposição que sai o resultado do Teste t de Student.

Voltemos à dieta do pão de queijo:


O peso médio das pessoas antes da dieta foi de 76,9
Kg, enquanto o peso depois de 2 meses de dieta foi de 78,5
Kg. Aparentemente, percebemos que as pessoas engorda-
ram! Mas será que essa diferença de peso é estatisticamente
significativa para podermos dizer que o grupo antes é mais
leve que o grupo depois da dieta?
Só o Teste t será capaz de nos dar essa informação!

P = 0,84

Acima está o valor do Teste t para nosso exemplo, mas


de nada adianta se não soubermos a pergunta para o Teste t
e como responder essa pergunta. Vamos iniciar o raciocínio
construindo a pergunta:
O que nós queremos saber é se há diferença estatistica-
mente significativa entre o peso do grupo antes e depois da
“dieta do pão de queijo”. Logo, podemos formular a pergunta:
“Existe diferença estatisticamente significativa entre o peso
médio do grupo antes da dieta com o mesmo grupo 2 meses
depois?”
Vamos generalizar:
Existe diferença estatisticamente significativa da __ carac-

Análises Estatísticas 255


terística avaliada__ entre __ grupo antes__ com o __grupo
depois__ ?
Agora que formulamos a pergunta devemos perceber
que há duas possibilidades de resposta: “sim, existe diferença”
ou “não, não há diferença entre os dois grupos”.

Figura 26 – Resumo da pergunta e das


possíveis respostas estatísticas

Vamos reforçar o que vemos no esquema acima: para a


resposta da nossa pergunta ser SIM, a Hipótese H1 (também
chamada de Hipótese Alternativa) deve ser a vencedora do
Teste t e isso só ocorre quando o valor de p < 0,05 no teste.
Para que a resposta seja NÃO, por outro lado, a Hipótese H0
(também chamada de Hipótese Nula) deve ser a vencedora
do Teste t e isso só ocorre quando temos um p > 0,05 no teste.
Desse modo, as respostas seriam:
H0 vencedora: Não, não existe diferença estatisticamente
significativa entre os dois grupos.
H1 vencedora: Sim, existe diferença estatisticamente signi-
ficativa entre os dois grupos.

256 DESCOMPLICANDO MBE


Agora que já temos a pergunta e as possíveis respostas
vamos voltar ao resultado do Teste T! Seu valor p foi igual
a 0,84
– um valor maior que 0,05. Logo, se p > 0,05, a Hipótese
H0 é a vencedora! E a resposta para nossa pergunta será:

Não, não existe diferença estatisticamente significativa entre


os dois grupos.
O que essa resposta significa? Quando não há diferença
entre os dois grupos, nós podemos concluir que esse aumento
de 2,7 Kg não foi significativo para uma extrapolação (para
uso populacional) e, assim, o uso da “dieta do pão de queijo”
não interferiu no peso dos participantes. Enfim, concluímos
que essa dieta nem engorda e nem emagrece!

CABEÇA PENSANTE

Lembra de quando o OR passa pelo 1? A vitória da H0 pode ser


interpretada de forma semelhante ao “efeito tanto faz”, porque
vemos que tanto faz não fazer nada ou fazer a “dieta do pão de
queijo”, que seu peso estará igual.

CABEÇA PENSANTE

É importante notar que, em alguns momentos, H1 vencer é o dese-


jado, mas, em outros, H0 vencer é preferível. Tudo vai depender
da sua pergunta estatística! Por isso a grande importância de
sempre fazer a pergunta e pensar nas respostas.

Por fim, agora você já é capaz de interpretar o resultado


de um Teste t de student!

Análises Estatísticas 257


ANOVA O QUE É?

A análise de ANOVA é semelhante ao Teste t de Student


com a diferença de possibilitar a comparação de 3 ou mais
grupos, ao mesmo tempo.

PARA QUE SERVE?

Após a compreensão sobre o Teste t é nítido que sempre


são dois os grupos analisados: seja um grupo caso e um
grupo controle, seja um antes e um depois. Entretanto, se
for preciso estudar mais de dois grupos, não será possível
utilizar o Teste t; então, partiremos para a ANOVA.
Vejamos exemplos de possíveis análises do Teste
ANOVA:
Um estudo sobre a “dieta do pão de queijo” quer avaliar o
peso dos participantes antes da dieta, depois de 2 meses e
depois de 6 meses de dieta.
Um estudo quer avaliar o efeito de uma medicação para dor
de cabeça em um grupo placebo, outro com dose padrão do
remédio e o terceiro com a dose dobrada do remédio.
Perceba que o Teste ANOVA amplia as possibilidades
do Teste t de Student! Na realidade, a ANOVA funciona
executando vários Testes t de Student ao mesmo tempo
Além disso, ambos são tão parecidos que as perguntas
e respostas são as mesmas. Por isso, quando for avaliar uma
ANOVA basta reler o guia sobre Teste t que você será capaz
de interpretar sem dificuldades.

258 DESCOMPLICANDO MBE


CABEÇA PENSANTE

Normalmente, a ANOVA já vem “digerida” nos artigos de modo que


o autor já coloca a interpretação em forma de Teste t, o que facilita
ainda mais a interpretação.

CORRELAÇÃO O QUE É?

A Correlação é uma análise estatística que busca saber


se duas variáveis quantitativas se correlacionam uma com
a outra!
Você lembra que o Qui² dizia se fumar se relaciona
com ter ou não câncer de pulmão? Perceba que todas as
variáveis são qualitativas; porém, na Correlação, as variáveis
são quantitativas! Esse é o grande ponto que precisamos
aprender no conceito da Correlação.
Desse modo, se quero avaliar variáveis, por exemplo,
tempo, peso, altura e dose devemos usar a correlação, pois
é ela que consegue analisar dados quantitativos.

PARA QUE SERVE?

CABEÇA PENSANTE

Imagine que, em uma sala, há 20 alunos e que o professor ficou curioso


em saber se os alunos que ficavam até o fim da prova – utilizando
todos os minutos disponíveis – tiravam notas mais altas do que
aqueles primeiros a sair da prova. Como ele poderia resolver essa dúvida?
Isso mesmo, com o estudo da Correlação!

Análises Estatísticas 259


Já entendemos qual a função do estudo da Correlação
entre duas variáveis, mas para compreender melhor qual
pergunta estatística ela responde, e como interpretar a res-
posta, vamos a um exemplo:

Figura 27 – Representação de uma tabela


para preenchimento de dados

Na imagem acima, vemos a tabela que o professor


montou com o propósito de coletar os dados para a sua análise
de Correlação. Desse modo, ele escolheu a variável “tempo
em minutos que o aluno ficou fazendo a prova” e a variável
“nota do aluno”.
Após a coleta completa, o professor foi capaz de criar
a distribuição correspondente aos seus achados e uma reta
que tenta descrever essa Correlação entre “tempo na prova”

260 DESCOMPLICANDO MBE


e “nota”. Antes de construirmos a pergunta da Correlação,
observe a imagem abaixo e se atente para o ângulo formado.

Figura 28 – Distribuição das variáveis nota


do aluno pelo tempo de prova

Análises Estatísticas 261


Figura 29 – Distribuição das notas dos alunos pelo tempo

Note o ângulo formado entre a reta que caracteriza a


distribuição e a base.
É importante notar que, quanto maior esse ângulo,
maior é a Correlação entre as duas variáveis. Isso ocorre, por-
que, quando a reta tem um ângulo muito grande, precisa-se
“andar” pouco x (tempo em minutos) para “andar” muito y
(nota). Como assim?

262 DESCOMPLICANDO MBE


Figura 30 – Distribuição das notas pelo tempo de prova

Note as diferentes possíveis apresentações de retas.


Perceba que, utilizando como referência a reta preta, com 50
minutos de prova a nota é de aproximadamente 7 pontos. Por
outro lado, se utilizarmos como referência a reta vermelha –
com um ângulo maior que a reta preta – notamos que com
50 minutos de prova a nota seria 10 para os alunos. Assim,
quanto maior o ângulo da reta da Correlação em um gráfico,
mais forte é a relação entre as duas variáveis envolvidas.
Agora, vejamos a reta em azul: ela está formando um
ângulo negativo, por que isso ocorre? Perceba que, para cada
minuto a mais na prova, a nota do aluno está diminuindo!
Logo, fica fácil notar que um ângulo negativo representa que,
quanto mais tempo se fica na prova, menor é a nota.
Vamos sistematizar:

Análises Estatísticas 263


Ângulo positivo: as duas variáveis são diretamente
proporcionais.
Ângulo negativo: as duas variáveis são inversamente
proporcionais.
Está na hora de construir a pergunta da correlação! Na
Correlação, não temos uma pergunta cuja resposta é SIM ou
NÃO, pois, aqui, queremos entender quão forte é a interação
de uma variável com a outra. Ou seja, queremos saber se o
tempo na prova influencia muito ou pouco na nota do aluno!
Quão forte é a influencia do __tempo gasto na prova__
na __nota do aluno__ ?
Vamos sistematizar:
Quão forte é a influência da __variável 1__ na __variável
2__ ?
Após entender como funciona a pergunta da Correlação,
vamos estudar as possíveis respostas e, para isso, uma tabela
irá facilitar nosso entendimento:

Tabela 1 – Simplificação para uma possível


abordagem compreensiva dos valores da
correlação com sua interpretação

VALOR DA CORRELAÇÃO INTERPRETAÇÃO

0.00 até 0.19 Correlação bem fraca


0.20 até 0.39 Correlação fraca
0.40 até 0.69 Correlação moderada
0.70 até 0.89 Correlação forte
0.90 até 1.00 Correlação muito forte

264 DESCOMPLICANDO MBE


Essa tabela irá servir de guia para a construção da
resposta de nossas perguntas que envolvem a Correlação.
Através dos dados obtidos pelo professor, chegamos ao
resultado da Correlação:

COR R EL AÇÃO DE PE A R SON = + 0,596

Inicialmente, vemos o sinal de + (positivo) indicando


que essa relação é diretamente proporcional – isto é, quanto
maior o tempo maior a nota! Após essa análise, procuremos
na tabela a interpretação do número 0,596 e vemos que cor-
responde a uma “Correlação moderada”.
Vamos construir a resposta para nossa questão:
Quão forte é a influência do tempo gasto na prova na nota
do aluno?
O tempo gasto na prova influencia positivamente na nota
do aluno de forma moderada.
Vamos sistematizar a resposta:
A __variável 1__ influencia (+ ou – da Correlação) na
__variável 2__ de forma (resultado da tabela).
Por fim, podemos deixar a interpretação ainda mais
fácil assim:
As pessoas que ficam mais tempo fazendo a prova são influen-
ciadas positivamente de forma moderada nas notas da prova.

Análises Estatísticas 265


CABEÇA PENSANTE

Quando a Correlação é muito fraca, podemos dizer que a influência


é tão pequena que chega a ser desprezível! O caso mais simples
de entender seria a reta de ângulo 0°, pois ela diz que – inde-
pendentemente do tempo que passe na prova – a nota sempre
será a mesma.

CABEÇA PENSANTE

Extrapole esse exemplo para outras coisas, como peso da pessoa


e quantos quilogramas de comida ela ingere por dia, assim, você
irá notar as grandes possibilidades da correlação.

Isso mesmo! Agora você já é capaz de interpretar bem


as análises de Correlação.

REGRESSÃO

O QUE É?

Já entendemos que a Correlação busca analisar a


correlação de uma variável com a outra, mas ela não diz
exatamente em quantas unidades uma variável altera a outra
variável. Essa quantificação fica sobre responsabilidade da
análise de Regressão.

266 DESCOMPLICANDO MBE


CABEÇA PENSANTE

A Regressão é um grande universo da bioestatística, por sua


variedade de faces e possibilidades; mas vamos tentar compre-
endê-la de forma simples.

PARA QUE SERVE?

Pela Correlação chegamos a conclusão de que ficar


mais tempo fazendo a prova aumenta as chances de tirar
uma nota maior. Todavia, sabendo essa informação, outra
aparece de forma mais curiosa! Quantos minutos exatamente
eu preciso ficar a mais na prova para aumentar minha nota
em 1 ponto?
A beleza da regressão está em dar esse valor!
Na realidade, a pergunta da Regressão está voltada para
a unidade da variável. Assim, vamos formular a pergunta
geral da Regressão:
Aumentando uma unidade da variável (tempo em
minutos) quanto eu aumento na variável nota do aluno?
Vamos sistematizar:
Aumentando em uma unidade a __variável 1__ quanto eu
aumento a __variável 02__?

Análises Estatísticas 267


CABEÇA PENSANTE

Note que a variável “tempo em minutos” está em minutos, logo,


um aumento de uma unidade irá representar um aumento de 1
minuto. Seguindo essa lógica, se a variável fosse quilogramas de
comida, o aumento unitário seria 1 Kg de alimento.

Após compreender a pergunta vamos colocar os dados


na análise de Regressão e ver o resultado:

B = 0,086

O número resultante da Regressão não tem muito


segredo, sendo suficiente para a compreensão da resposta.
Vamos lá:
O aumento de 1 minuto no tempo que o aluno fica na prova
aumenta em quanto a nota dele?
Resposta: Para cada minuto a mais que o aluno fica na prova,
ele aumenta sua nota em 0,086 pontos.
Essa resposta já é compreensível, mas vamos fazer uma
regra de três para saber quantos minutos seriam necessários
para aumentar a nota em 1 ponto!

268 DESCOMPLICANDO MBE


Figura 31 – Regra de três demonstrada

Assim, podemos concluir que, a cada 12 minutos (11,62


para ser preciso) que você passa na sala realizando a prova,
sua nota aumenta em 1 ponto!

CABEÇA PENSANTE

Imagine as possibilidades da Regressão, como saber quanto de dose


pode ser aumentada para melhores resultados ou outras perguntas!

CABEÇA PENSANTE

Existe muito mais por trás da Regressão, mas as informações acima


mostradas tem o intuito de permitir uma melhor compreensão e
não de ensinar a execução de uma Regressão.

CABEÇA PENSANTE

A melhor forma de fixar esses conhecimentos é lendo artigos


científicos e desenvolvendo as perguntas e respostas das análises
lá informadas, pratique!

Análises Estatísticas 269


Parabéns! Você já consegue interpretar o básico da
Regressão.

REFERÊNCIAS

BHATT D. L, STONE G. W, MAHAFFE K. W, GIBSON C. M, et al.


CHAMPION PHOENIX Investigators. (2013). Effect of platelet inhi-
bition with cangrelor during PCI on ischemic events. N Engl J Med.
Apr 4;368(14):1303-13.

FLETCHER, R; FLETCHER, S; WAGNER, E. H. Epidemiologia


Clínica: elementos essenciais. 2 ed. Porto Alegre: Artes Médicas,
1996.

HICKS, Tim. A beginner´s guide to interpreting odds ratios, con-


fidence intervals and p-values, 2013. Disponível em: <http://www.
students4bestevidence.net/a-beginners-guide-to-interpreting-odds-ra-
tios-confidence-intervals-and-p-values-the-nuts-and-bolts-20-minute-
tutorial/>. Acesso em: 13 de abril de 2017.

LOPES, Bernardo et al . Bioestatísticas: conceitos fundamentais e apli-


cações práticas. Rev. bras. oftalmol., Rio de Janeiro, v. 73, n. 1, p. 16-22,
Feb. 2014 . Available from <http://www.scielo.br/scielo.php?script=sci_
arttext&pid=S0034-72802014000100016&lng=en&nrm=iso>. access on
13 Apr. 2017. http://dx.doi.org/10.5935/0034-7280.20140004.

PAES, Ângela Tavares. Itens essenciais em bioestatística. Arq.


Bras. Cardiol., São Paulo, v. 71, n. 4, p. 575-580, Oct. 1998. Available
from <http://www.scielo.br/scielo.php?script=sci_arttext&-
pi-d=S0066-782X1998001000003&lng=en&nrm=iso>. access on Apr.
2017. http://dx.doi.org/10.1590/S0066-782X1998001000003.

270 DESCOMPLICANDO MBE


MÓDULO 4
SENSIBILIDADE E
ESPECIFICIDADE

18 Ítalo Medeiros de Azevedo


João Victor de Sousa Cabral
Ugor Tomaz Fernandes

C
om o desenvolvimento, a prática médica tende
a agregar cada vez mais exames novos para
subsidiar o diagnóstico final. Com isso, surge
uma miríade de ferramentas disponíveis para serem uti-
lizadas e a necessidade de saber escolher qual a melhor
combinação de testes a serem requeridos para alcançar o
objetivo pretendido. É nessa conjuntura que se torna essencial
para um bom profissional o conhecimento dos potenciais e
limitações do instrumento de pesquisa codificado em alguns
conceitos, como sensibilidade, especificidade, acurácia, razão
de verossimilhança, valor preditivo, entre outros que serão
abordados nos demais capítulos.
Antes de começarmos a falar do tema propriamente
dito, é preciso falar sobre os conceitos de resultados falso-
-positivos e falso-negativos. Não existe um teste que não
tenha uma margem de erro. Logo, é possível que o teste

273
acuse doença em uma pessoa sadia. Quando esse erro ocorre,
dizemos que se trata de um resultado falso-positivo. Seguindo
o mesmo raciocínio, pode ocorrer de determinando testes
em um indivíduo doente não acusar qualquer anormalidade,
sendo denominado um resultado falso-negativo.
Pode-se visualizar melhor informações abaixo na
Tabela 1. Nessa tabela, dividimos os pacientes em estudo
sob 2 colunas (baseando-se em seu estado de saúde real,
geralmente) e, ao mesmo tempo, em 2 linhas (baseando-se no
estado visto pelo teste que se deseja analisar). Ao se cruzar
esses dados, obtemos os falso-positivos e falso-negativos
explicados acima.

Tabela 1 – Contingência de sensibilidade e especificidade

TESTE REFERÊNCIA

Doentes Sadios
A B
Positivo (Verdadeiro- (Falso-po-
Teste em -positivo) sitivo)
análise C D
Negativo (Falso-ne- (Verdadeiro-
gativo) -negativo)

Tabela 1: Aqui, vemos uma tabela clássica utilizada


para explicar melhor os conceitos de sensibilidade e espe-
cificidade. Vê-se que é preciso sempre de dois testes: um
teste de referência, que servirá como base para classificar
os indivíduos em doentes ou sadios; e o teste do qual se
pretende obter os valores de sensibilidade e especificidade.
Assim, temos quatro quadros possíveis indicados pelas
letras. “A” representa os indivíduos doentes que o teste acusou

274 DESCOMPLICANDO MBE


doença, realmente , ou seja, os verdadeiro-positivos. Em “B”
temos pessoas sadias que foram acusadas de doentes pelo
teste, os falso-positivos.“C” mostra os indivíduos doentes
nos quais o teste falhou em detectar a doença, que seriam
os falso-negativos. Por fim, em “D” vemos os indivíduos
sadios em que o teste também os mostrou como sadios, isto
é, os verdadeiro-negativos.
Chegando ao assunto principal desse capítulo, podemos
definir sensibilidade como a capacidade de determinada ferra-
menta para identificar indivíduos doentes. Matematicamente,
considerando um teste laboratorial qualquer, esse conceito
é representado por:

Assim, observa-se que quanto maior o número de


indivíduos doentes com resultado negativo (falso-negativos),
menor será a sensibilidade. Em outras palavras, podemos
dizer que quanto maior a sensibilidade, menor o número
de falso-negativos.
Por outro lado, especificidade é a capacidade da fer-
ramenta de detectar indivíduos sadios. Representa-se da
seguinte forma:

Fazendo a mesma análise que para a fórmula anterior,


vê-se que quanto maior o número de indivíduos sadios com
resultado positivo (falso-positivos), menor a especificidade.
Logo, quanto maior a especificidade, menor o número de
falso-positivos.

Sensibilidade e Especificidade 275


Em suma, podemos sintetizar a representação matemá-
tica desses conceitos por meio da Tabela 1, sendo sensibilidade
A/ (A+C) e especificidade D/(C+B). Perceba que a ideia é estabe-
lecer, dentre os pacientes sabidamente doentes ou sadios, uma
proporção entre os resultados corretos do teste com o total.
É importante lembrar que sempre se deve comparar
o teste do qual se quer extrair essas variáveis com o dado
obtido do teste de referência para o diagnóstico de deter-
minada doença, comumente chamado de teste padrão-ouro
por possuir a mais elevada sensibilidade e especificidade,
chegando o mais próximo do teste ideal. Por exemplo, quando
se quer definir a sensibilidade e especificidade da radiografia
de tórax para diagnóstico de câncer de pulmão, é necessário
comparar esse exame com a biópsia pulmonar, que é o teste
padrão-ouro para essa doença.
O teste ideal teria 100% de sensibilidade e 100% de espe-
cificidade, implicando em apenas duas possibilidades: todos
os doentes teriam resultado positivo e todos os sadios teriam
resultado negativo. Contudo, os testes reais não possuem
100% de especificidade, nem de sensibilidade. Inclusive, em
alguns testes, principalmente os sorológicos, a sensibilidade
e a especificidade são inversamente proporcionais entre si.
Nessas situações, a curva ROC (receiver operating characteris-
tics) é usada para definir o melhor ponto de corte com base
nessas duas variáveis (esse tema será abordado com maior
profundidade nos próximos capítulos).
Em um sentido mais prático, quando o resultado de um
exame de alta sensibilidade é negativo, muito provavelmente
o indivíduo de fato não está doente. Por exemplo, em um teste
hipotético para malária com 90% de sensibilidade e 40% de

276 DESCOMPLICANDO MBE


especificidade, a cada 100 indivíduos testados, apenas 10%
dentre os doentes terão resultado negativo, mas 60% dentre
os sadios terão resultado positivo.
Assim, esse tipo de exame é importante para triagens,
porque diminui as chances de falso-negativos, apesar de
poder haver muitos falso-positivos. Ou seja, dificilmente
um paciente doente teria resultado negativo.

Tabela 2 – Contingência de um teste


diagnóstico para Malária

TESTE PADRÃO-OURO PARA MALÁRIA

Doentes Sadios
90 60
Positivo (Verdadeiro- (Falso-po-
Teste hipo- -positivo) sitivo)
tético para
malária 10 40
Negativo (Falso-ne- (Verdadeiro-
gativo) -negativo)

Tabela 2: Baseando-se na Tabela 1 para ilustrar nosso


exemplo, cria-se essa tabela. Observe a elevada quantidade
de falso-positivo, que indica o risco de um paciente saudável
ser taxado de doente, justificando porque não se deve prio-
rizar esse tipo de exame para confirmação diagnóstica. No
entanto, a quantidade de falso-negativo é muito reduzida,
sendo muito difícil uma pessoa doente não ser detectada,
sendo, por isso, um bom método para triagens.
Além da triagem, é interessante usar testes com essas
características quando o paciente pode ser muito prejudicado
caso não haja o diagnóstico. Por exemplo, ao menor indício
na prática clínica de encefalite herpética deve ser iniciado

Sensibilidade e Especificidade 277


o tratamento com Aciclovir, mesmo que a evidência para
confirmar a doença seja baixa, pois a morbimortalidade
associada com a postergação ou ausência do tratamento é
alta. Veja a Tabela 2 para um maior esclarecimento desse
exemplo.
Já a positividade em um exame de alta especificidade
aponta para um muito provável diagnóstico verdadeiramente
positivo. Dessa forma, a cada 100 pacientes submetidos a um
teste hipotético para febre amarela com 50% de sensibilidade e
95% de especificidade, 50% dos doentes serão falso-negativos
e 5% dos sadios serão falso-positivos. Portanto, trata-se de
um tipo de exame que pode indicar muitos pacientes doentes
como negativos, mas quando há um resultado positivo é
muito provável que o paciente realmente esteja doente.
Para melhor entendimento desse exemplo, veja a Tabela 3.

Tabela 3 – Contingência de um teste


diagnóstico para Febre Amarela

TESTE PADRÃO-OURO PARA FEBRE AMARELA

Doentes Sadios
90 5
Teste Positivo (Verdadeiro- (Falso-po-
hipotético -positivo) sitivo)
para febre 90 95
amarela Negativo (Falso-ne- (Verdadeiro-
gativo) -negativo)

Tabela 3: Vemos aqui outra sistematização baseada na


Tabela 1.
Observe que a quantidade de falso-negativo foi bastante
elevada, logo, esse não seria um bom teste para triagem

278 DESCOMPLICANDO MBE


(diagnósticos “passariam” sem serem vistos com maior
atenção). Veja também que a quantidade de falso-positivo
já é bastante pequena, isto é, dificilmente esse teste acusaria
uma pessoa sadia de ser doente, por isso é um bom método
para confirmar diagnósticos. Faça o exercício de calcular a
sensibilidade e especificidade de acordo com essa tabela.
Torna-se útil, então, para confirmar o diagnóstico em
pessoas que já foram triadas por outro exame muito sensível
ou por outros métodos (seja clínico, laboratorial ou radio-
lógico), pois dificilmente um paciente sadio teria resultado
positivo. Por exemplo, uma das maneiras para o diagnosticar
HIV consiste em um imunoensaio de 4ª geração que deve
ser confirmado por um teste molecular. Caso a ordem seja
invertida e se realize primeiro o teste molecular, haveria
muitos resultados falsos-negativos, pois se trata de um teste
menos sensível.
Por esse motivo muitas doenças são diagnosticadas
em duas etapas, havendo primeiro um teste de triagem
(alta sensibilidade) seguido de um teste confirmatório (alta
especificidade), devendo ser seguida essa ordem para reduzir
a probabilidade de uma pessoa doente não ser detectada
durante a investigação. Por exemplo, para o diagnóstico de
hiperaldosteronismo primário, primeiro se opta por fazer
a relação entre concentração de aldosterona plasmática e a
atividade de renina plasmática para triar pacientes. Caso
seja indicativo dessa doença, confirma-se o diagnóstico pelo
teste da sobrecarga com sódio.
É importante lembrar que sensibilidade e especifici-
dade são características próprias do teste em análise, sendo
independente de outras variáveis, como da prevalência da

Sensibilidade e Especificidade 279


doença, mas podem variar dependendo da extensão e/ou
gravidade dessa. Por exemplo, em um exame de imagem
da tireoide, quanto maior for o nódulo tireoidiano, maior a
chance de ele ser detectado.
Outra consideração a ser feita reside no fato de que
a obtenção dos valores de sensibilidade e especificidade
ocorrem mediante pesquisas epidemiológicas e extrapoladas
para a prática clínica. Por conseguinte, é assumido que a
população atendida pelo serviço de saúde é semelhante
à população investigada na pesquisa. Esse fato deve ser
compreendido especialmente quando não se têm estudos
a respeito de determinado exame na população atendida,
visto que pode haver heterogeneidade nas duas amostras
populacionais que alterem a precisão do exame.
Por fim, podemos praticar o que aprendemos com outro
exemplo. Supondo que estamos atendendo um paciente com
suspeita de trombose venosa profunda (TVP) e precisamos
confirmar o diagnóstico. Nesse caso, a princípio, podemos
pensar em 3 exames: medição do D-dímero, ultrassonografia
e venografia contrastada. O primeiro passo seria fazer uma
triagem com um exame de alta sensibilidade, nesse caso, a
medição do D-dímero. Assim, caso seja negativo, podemos
excluir a TVP e investigar outras doenças. Todavia, se der
positivo, ainda precisamos confirmar o diagnóstico pela
possibilidade elevada de ser um falso-positivo. Para con-
firmação, é necessário um exame muito específico, sendo o
melhor exame a venografia contrastada, mas entramos aqui
em outro problema: se trata de um exame muito invasivo
e arriscado. Portanto, como a ultrassonografia também é

280 DESCOMPLICANDO MBE


bastante específica, opta-se por esse exame. Caso positivo,
confirma-se TVP e caso negativo, exclui-se.
É importante salientar que, mesmo existindo testes
altamente específicos e sensíveis, o olhar clínico não deve
ser menosprezado. Dessa forma, no mesmo caso acima
relatado, caso chegasse um teste D-dímero positivo e uma
ultrassonografia negativa, se houver forte indício clínico,
ainda não se pode afastar completamente a hipótese. Afinal
de contas, não é impossível um teste muito específico gerar
um resultado falso-negativo.

CONCLUSÃO

Muito mais que apenas um conhecimento teórico


utilizado em pesquisa, os conceitos de sensibilidade e espe-
cificidade estão presentes no cotidiano da prática clínica.
Dessa forma, é imprescindível que sejam exercitados cons-
tantemente para que se tenha excelência tanto na indicação
de exames, evitando custos desnecessários, por exemplo,
como na interpretação adequada do resultado obtido.

REFERÊNCIAS

EL DIB, R (Org.). Guia prático de medicina baseada em evidências.


São Paulo: Cultura acadêmica, 2014. 118 p.

GUIMARÃES, M.C.S. Exames de laboratório: sensibilidade, especifi-


cidade, valor preditivo positivo. Revista da Sociedade Brasileira de
Medicina Tropical, v. 18, n. 2, p. 117-120, Abr/Jun. 1985.

MINISTÉRIO DA SAÚDE. Manual técnico para diagnóstico de


infecção pelo HIV. 3ed. Brasília, 2016.

Sensibilidade e Especificidade 281


SOUZA, W.V. et al. Microcefalia no Estado de Pernambuco, Brasil:
características epidemiológicas e avaliação da acurácia diagnóstica
dos pontos de corte adotados para notificação de caso. Cadernos de
saúde pública, v. 32, n. 4, p. 1-8, Abr. 2016.

WILBUR, J; SHIAN, B. Diagnosis of Deep Venous Thrombosis and


Pulmonary Embolism. American Family Physician, v. 86, n. 10, p.
913919, Nov. 2012.

282 DESCOMPLICANDO MBE


VALOR PREDITIVO

19 João Victor de Sousa Cabral


Melissa Yolanda Soares Melo
Ítalo Medeiros de Azevedo

A
ntes de iniciar a leitura deste capítulo, tenha
certeza de que compreendeu bem os conceitos
de sensibilidade, especificidade e acurácia. Só
assim ficará mais fácil a compreensão sobre o significado e
a importância do valor preditivo. Caso necessário, retorne
aos capítulos anteriores para consolidar esse aprendizado.
Entender o conceito de valor preditivo é importante
para sabermos a utilidade dos métodos diagnósticos na
prática clínica. No nosso exercício profissional, partindo
de um quadro clínico, elaboramos nossas hipóteses diag-
nósticas e pensamos nos exames que devem ser solicitados
para confirmar ou afastar nossas suspeitas. Nesse contexto,
nosso objetivo, ao final da leitura deste capítulo, é fazer com
que você seja capaz de saber quando solicitar determinado
exame e como interpretar o que um resultado positivo ou

283
negativo significa a depender do paciente e da forma como
ele se apresenta.

Figura 1 – Representa uma tabela 2x2 para um estudo de


validação de testes diagnósticos ou de rastreamento

CONCEITOS

Diante dos métodos diagnósticos, precisamos ques-


tionar se tal método é acurado, preciso e, por sua vez, se é
útil clinicamente.
Para ser acurado, um teste deve ter a capacidade de
influenciar corretamente nosso pensamento com relação
à presença ou à ausência da doença. Isto é, acurácia é a
capacidade do método de acertar o diagnóstico, podendo
ser entendida como um conjunto composto por sensibilidade
e especificidade. De forma estatística, é o percentual de
resultados corretos do teste – (a + d / (a + b + c + d)) – de modo
que, quanto melhor a acurácia, maior a influência desse teste
na probabilidade de o indivíduo ter a doença.

284 DESCOMPLICANDO MBE


Já que a acurácia avalia a proporção de todos os testes
corretos (verdadeiros positivos e verdadeiros negativos) sobre
todos os resultados obtidos, esse valor percentual não é útil,
pois representa apenas uma mistura de testes positivos e
negativos. Com isso, a melhor maneira de analisar a acurácia
e, portanto, determinar se um método é acurado, seria por
meio da razão de probabilidade (RP). Também chamada
de razão de verossimilhança (likelihood ratio), a RP é um
parâmetro que combina sensibilidade e especificidade para
calcular a probabilidade de doença após um teste positivo
ou negativo.
A razão de probabilidade positiva (RP positiva) é
definida por: Sensibilidade/(1 – Especificidade) e representa
o quanto um método de resultado positivo aumenta a chance
de um indivíduo ser doente. Quanto mais alto este número,
maior a probabilidade e melhor o teste. Temos como parâ-
metros os seguintes valores:
• RP positiva > 10: acurácia ótima; grande influência na
probabilidade;
• RP positiva 5 - 10: acurácia moderada; moderada influ-
ência na probabilidade;
• RP positiva 2 - 5: acurácia pequena; pequena influência
na probabilidade;
• RP positiva 1 - 2: acurácia nula; mínima ou nenhuma
influência na probabilidade.
Por outro lado, a razão de probabilidade negativa (RP
negativa) é definida por: (1 – Sensibilidade)/Especificidade e,
assim, representa o quanto um método de resultado negativo
aumenta a chance de um indivíduo ser saudável. Quanto

Valor Preditivo 285


menor, ou seja, mais próximo ao zero, menor a probabili-
dade de doença se o teste for negativo. Temos como parâmetro
os seguintes valores:
• RP negativa < 0,1: acurácia ótima; grande influência
na probabilidade;
• RP negativa 0,1 - 0,2: acurácia moderada; moderada
influência na probabilidade;
• RP negativa 0,2 - 0,5: acurácia pequena; pequena influ-
ência na probabilidade;
• RP negativa 0,5 - 1,0: acurácia nula; mínima ou
nenhuma influência na probabilidade.
Dando seguimento, vamos introduzir o conceito de
valor preditivo (positivo e negativo). Valor preditivo é a pro-
babilidade pós-teste. Isto é, conhecendo-se a probabilidade
pré-teste (quadro clínico) de uma pessoa apresentar certa
doença, dependendo do resultado do exame (se positivo ou
negativo), conhecemos a probabilidade pós-teste de ela ter
essa doença.
O valor preditivo positivo responde à seguinte per-
gunta: se o teste for positivo, qual a probabilidade de o
indivíduo ser realmente doente? Em termos matemáticos,
representa o número de doentes dentre os testes positivos
sobre o número de todos os testes positivos, em que VPP =
(a / ( a + b)). Ou seja, é a probabilidade pós-teste.
Por sua vez, o valor preditivo negativo responde à
seguinte pergunta: se o teste for negativo, qual a probabi-
lidade de o indivíduo ser realmente saudável? Em termos
matemáticos, representa o número de saudáveis dentre os

286 DESCOMPLICANDO MBE


testes negativos, dividido pelo número total de testes nega-
tivos, ou seja, é o complemento da probabilidade pós-teste
de doença, sendo representado por VPN = (d / ( c + d )). Por
exemplo, caso o resultado negativo de um exame altere a
probabilidade pré-teste de a pessoa possuir a doença para
30% (probabilidade pós-teste), o valor preditivo negativo
será 70%, uma vez que VPN é igual a 100 – probabilidade
pós-teste (VPP), visto que VPN significa a chance da pessoa
não ter a doença (ser realmente saudável).
Observe que valor preditivo não é uma propriedade
do teste, mas sim do paciente submetido a determinado
exame. Dessa forma, o VP varia de acordo com a prevalência
da doença, até porque muda a probabilidade pré-teste. Por
outro lado, sensibilidade e especificidade são propriedades
intrínsecas do método diagnóstico, que não dependem da
prevalência da doença, mas, podem variar dependendo da
extensão e/ou gravidade desta. Por exemplo, em um exame de
imagem da tireoide, quanto maior for o nódulo tireoidiano,
maior a chance de ele ser detectado.
Neste momento, você deve estar se perguntando como
surge o conhecimento sobre a acurácia de um método diag-
nóstico. Pois bem, é proveniente de evidências científicas
também! Metodologicamente, consiste na realização do
método em estudo com a posterior checagem se este método
foi capaz de detectar os doentes (sensibilidade) e detectar
os saudáveis (especificidade). Deste modo, é fundamental
saber quem é realmente doente ou saudável para avaliar
se o método faz essa distinção corretamente e, para isso,
os pacientes realizam também outro exame, chamado de
padrão-ouro, teoricamente melhor do que o exame que está
sendo avaliado.

Valor Preditivo 287


Em relação ao conceito de precisão, para saber se um
método é preciso, é importante observar o intervalo de con-
fiança das estimativas da sensibilidade e especificidade. Por
exemplo, um novo método pode ter especificidade de 80% e,
no entanto, apresentar um intervalo de confiança que varia
de 55% a 92%. Ou seja, não possui uma estimativa precisa.
Quanto maior a amostra (N) de um estudo, mais preciso
ele tenderá a ser e menor será o seu intervalo de confiança.
Bom, já entendemos então o que seria um método
acurado e preciso, falta responder a última pergunta: qual
a utilidade clínica?
Primeiro, o exame deve ser capaz de influenciar o
nosso pensamento em relação à probabilidade de doença.
Se pensarmos que a medicina é probabilística, assim como
os métodos diagnósticos, ficará mais fácil saber quando um
teste será ou não útil; isto é, será que esse método é capaz
de mudar o que estamos pensando a respeito do paciente?
Ainda assim não podemos dizer se um método é ou não útil.
Segundo, temos que avaliar o benefício proveniente
da realização do método diagnóstico, tendo em mente que
a cascata de intervenções decorrente do resultado (positivo
ou negativo) do exame deve reduzir o risco do paciente.
Lembre-se, além de não trazer benefício ao paciente, corremos
o risco de causar-lhe malefício.

CÁLCULO DO VALOR PREDITIVO

Ótimo, agora já sabemos como avaliar se um método é


acurado, preciso e útil. Mas como calcular o valor preditivo
do teste?

288 DESCOMPLICANDO MBE


Figura 2 – Nomograma de Fagan

Já adiantamos acima algumas fórmulas para calculá-lo,


mas seria necessário montar a tabela 2x2 (figura 1) para
conhecer os valores numéricos de a, b, c e d. Entretanto, para
conhecer esses valores você teria que buscá-los no estudo que
validou o teste diagnóstico/rastreamento de interesse, o que
não seria nada prático (por outro lado, valeria a pena para
avaliar a precisão do método, está lembrado?). Dessa forma,
uma alternativa para este cálculo é conhecer a probabilidade

Valor Preditivo 289


pré-teste do paciente em apresentar determinada doença.
A partir desse valor, aplicando a razão de probabilidade
positiva ou negativa (dependendo se o resultado do exame
foi positivo ou negativo), chega-se ao valor preditivo. Para
isso, você tem a opção de utilizar o nomograma de Fagan
(figura 2).
Por exemplo, digamos que a probabilidade pré-teste
de um paciente apresentar tromboembolia pulmonar
(TEP) é de 30%. Você decide submeter esse paciente a uma
angiotomografia (sensibilidade 83% e especificidade 96%),
sabendo que esse exame tem uma razão de probabilidade
positiva de aproximadamente 20 (0,83/(1-0,96)) e uma razão
de probabilidade negativa de aproximadamente 0,18 ((1 -
0,83)/0,96). Pelo nomograma de Fagan, isso significa que, caso
a angiotomografia (angioTC) tenha um resultado positivo,
teremos um valor preditivo positivo de 90% (probabilidade
pós-teste). Por outro lado, caso a angiotomografia tenha um
resultado negativo, teremos um valor preditivo positivo de
aproximadamente 7% (e valor preditivo negativo de 93%).
Veja a figura 3.

290 DESCOMPLICANDO MBE


Figura 3 – Nomograma de Fagan exemplificado

No caso exemplificado, estamos diante de uma situação


em que temos que decidir com prontidão se iremos anticoa-
gular ou não o paciente. Ora, temos inicialmente um paciente
com 30% de chance de apresentar tromboembolia pulmonar
(probabilidade pré-teste), mas essa probabilidade não indica
muita segurança para a tomada de decisão terapêutica. É uma
probabilidade intermediária. Pensando assim, solicitamos
um exame que irá influenciar no pensamento em relação à
probabilidade de doença, que no caso, foi a angiotomografia.
O resultado desse exame trará algum benefício ao paciente?

Valor Preditivo 291


Claro! Como vimos, caso o resultado seja positivo, há uma
probabilidade pós-teste de 90% de ser TEP.
Veja bem, o mesmo paciente que se apresentou à emer-
gência com sinais e sintomas que levaram a uma possibili-
dade pré-teste de 30% para TEP, após a realização do exame
e demonstração de um resultado positivo para a doença,
possui uma chance de 90% de realmente ter TEP. Com essa
chance, sim temos segurança para instituir uma terapêutica
adequada para o paciente. Pensaríamos da mesma forma
para um resultado negativo, reduzindo a chance de ser TEP
de 30% para 7%, o que nos faria buscar outras hipóteses
diagnósticas para o caso.

PROBABILIDADE PRÉ-TESTE

Agora você deve estar se perguntando como descobrir


a probabilidade pré-teste para determinada doença, certo?
A probabilidade pré-teste é definida como a probabilidade
de um paciente ter a doença antes que o resultado do teste
diagnóstico seja conhecido. Ela é especialmente útil para
interpretar os resultados de um teste diagnóstico; selecionar
um ou mais testes diagnósticos; definir o início ou não da
terapia (sem exames adicionais ou enquanto aguarda novos
testes) e decidir se vale a pena testar.
A forma mais básica de estimarmos a probabilidade
pré-teste de uma doença é chamando a probabilidade (P) de
prevalência geral de uma doença, a qual pode ser calculada
como a proporção de pacientes com a doença, dentre todos os
pacientes que apresentam os sintomas, tanto os com a doença
quanto os sem. Para isto, usamos a seguinte equação: P (D+)
= D+ / (D+ + D-), em que D+ indica o número de pacientes

292 DESCOMPLICANDO MBE


com a doença, D indica o número de pacientes sem a doença
e P(D+) a probabilidade da doença.
Por exemplo, pesquisadores norte-americanos estu-
daram as doenças subjacentes encontradas em pacientes
adultos que procuraram o pronto-socorro com queixa de
cefaleia. O número total de participantes foi de 5198, dos
quais 3208 receberam o diagnóstico de enxaqueca. Então, a
estimativa da probabilidade de enxaqueca para esse estudo
é de aproximadamente 60% (3208/5198). Ou seja, na minha
prática, se eu atendo um paciente adulto na emergência com
queixa de cefaleia, já parto de uma probabilidade pré-teste
de 60% de que seja enxaqueca.
Há também outras duas formas de estimar a probabi-
lidade pré-teste: análise sequencial e análise multivariada.
Segundo o Teorema de Bayes, se a probabilidade pré-teste
de uma determinada doença é conhecida e a sensibilidade e
especificidade de um teste também são conhecidos, então é
possível calcular a probabilidade pós-teste. Ainda, caso dois
testes sejam feitos em sequência, a probabilidade pós-teste (seja
ela positiva ou negativa) do primeiro, será a nova probabilidade
pré-teste do segundo exame e assim sucessivamente (análise
sequencial, figura 4). Fazendo isso, uma suposição importante
é aventada no uso incondicional do teorema de Bayes: que a
sensibilidade e a especificidade de um teste são as mesmas em
várias populações e que, para a análise sequencial, cada teste é
independente um do outro. Sendo mais claro, independência de
um teste em relação ao outro significa dizer que a sensibilidade
e a especificidade de um teste se mantêm as mesmas, inde-
pendente do resultado do outro teste ser positivo ou negativo.
Dessa forma, tenha em mente que essa análise sequencial não

Valor Preditivo 293


se torna adequada quanto mais exames sejam feitos, uma vez
que os erros serão cumulativos.
Por exemplo (para entender veja a figura 4), chega
um paciente ao pronto-socorro com queixa de tosse e você
parte de uma probabilidade pré-teste basal de que o paciente
tenha uma infecção respiratória. Você, então, pergunta se a
tosse é produtiva (teste 1), o que te dá uma probabilidade
positiva ou negativa a depender da resposta do paciente.
Digamos que a tosse seja produtiva e, assim, você já parte
de uma probabilidade pré-teste diferente (tosse e produtiva).
Pergunta, ainda, se o escarro é amarelado (teste 2) e, dessa
forma, modifica novamente a probabilidade pós-teste, uma
vez que, agora, são dois os fatores que interferem: tosse
produtiva + escarro amarelado.

Figura 4 – Representação esquemática


de testes diagnósticos em série

294 DESCOMPLICANDO MBE


No entanto, perceba que essa forma de análise talvez
não seja a ideal, visto que, quando temos múltiplas informa-
ções, temos que levar em conta que estas são independentes
uma da outra, mas que há a possibilidade de haver certa
redundância entre elas. Tomando este caso como exemplo,
percebemos que parte da informação de que o escarro é
amarelado é diminuída, uma vez que já sabemos que há
expectoração associada a tosse. Exemplificamos com relação
ao fluxo diagnóstico usando perguntas da anamnese, mas
esse raciocínio também é válido para exames.
Quando se têm muitas variáveis preditoras entra em
pauta a análise multivariada (modelos preditores), em que
uma variável será ajustada com relação a outra e somente o
valor específico daquela informação restará, uma vez que
serão retirados os valores agregados de outras informações
que podem causar interferência (ou seja, informações redun-
dantes). Isso é chamado de valor preditor independente.
Nesse contexto, o ajuste faz com que a importância de
cada variável diminua, mas contribui para que o efeito real
de cada uma seja mantido. Assim, a análise do impacto de
cada variável é feita em conjunto, não de forma sequencial,
e essa é a forma ideal de análise, caso existam múltiplas
variáveis. Entretanto, como na prática clínica não temos
modelos preditores para todas as doenças, acabamos tendo
que recorrer à análise sequencial.
Por exemplo, o escore de Wells – modelo preditor que
estratifica os pacientes pela probabilidade pré-teste de apre-
sentarem tromboembolia pulmonar – traz diversas variáveis
preditoras, cujo conjunto trará uma informação acerca da
probabilidade pré-teste daquele paciente apresentar TEP,

Valor Preditivo 295


o que interferirá na solicitação de exames apropriados e no
manejo terapêutico.

CONCLUSÃO

O que fazer com todas essas informações? Mude sua


prática clínica! Quer mesmo pedir um exame que tem razão
de probabilidade positiva de 2 e negativa de 0,8? Se o paciente
em questão tiver baixa probabilidade pré-teste, esse exame
te dará um valor preditivo positivo baixo (se positivo) e
negativo baixo também (se negativo). Que bem isso faria
ao paciente? Não utilize o jargão “por desencargo de cons-
ciência” na sua rotina.

Figura 5 – Resumo de fórmulas úteis

296 DESCOMPLICANDO MBE


REFERÊNCIAS

BENSEÑOR, I. M. Anamnese, exame clínico e exames complementares


como testes diagnósticos. Revista de Medicina, v. 92, n. 4, p. 236-241,
2013. ISSN 1679-9836.

CORREIA, L. C. L. Como analisar criticamente um artigo sobre


acurácia. Blog Medicina Baseada em Evidências. 2011. Disponível
em:<http://medicinabaseadaemevidencias.blogspot.com.br/>.

CORREIA, L. C. L. O paradigma do benefício de métodos diagnós-


ticos. Blog Medicina Baseada em Evidências. 2011. Disponível em:
<http:// medicinabaseadaemevidencias.blogspot.com.br/>.

CORREIA, L. C. L. O que é acurácia? Blog Medicina Baseada em


Evidências. 2011. Disponível em: <http://medicinabaseadaemeviden-
cias. blogspot.com.br/>.

CORREIA, L. C. L. Utilidade de métodos diagnósticos. Blog Medicina


Baseada em Evidências. 2011. Disponível em: <http://medicinabasea-
daemevidencias.blogspot.com.br/>.

CRONIN, P. Evidence-based radiology: step 3--critical appraisal of


diagnostic literature. Semin Roentgenol, v. 44, n. 3, p. 158-165, 2009.
Disponível em: <http://dx.doi.org/10.1053/j.ro.2009.03.016>.

FAGAN, T. J. Nomogram for Bayes theorem. New England Journal


of Medicine, 1975. Disponível em: <http://europepmc.org/abstract/
med/1143310>.

FLETCHER, R. H.; FLETCHER, S.; WAGNER, E. H. Epidemiologia


clínica: elementos essenciais. Série Médica, 1996. Disponível
em: <http://bases.bireme.br/cgi-bin/wxislind.exe/iah/
online/?IsisScript=iah/iah.xis\&src=google\&base=LILACS\
=p\&nextAction=lnk\&exprSearch=290708\&indexSearch=ID>.

Valor Preditivo 297


GOLDSTEIN, J. N. et al. Headache in United States emergency
departments: demographics, work-up and frequency of pathological
diagnoses. Cephalalgia, v. 26, n. 6, p. 684-690, 2006. Disponível em:
<http://dx.doi. org/10.1111/j.1468-2982.2006.01093.x >.

GREENHALGH, T. Como ler artigos científicos: fundamen-


tos da medicina baseada em evidências, 2015. Disponível
em: <http://bases.bireme.br/cgi-bin/wxislind.exe/iah/
online/?IsisScript=iah/iah.xis\&src=google\&base=LILACS\
=p\&nextAction=lnk\&exprSearch=766454\&indexSearch=ID>.

SIMON, D.; III, J. R. B. Sensitivity, specificity, and predictive value.


Clinical Methods: The history, physical, and Laboratory Examination.
3. ed. 1990. Disponível em: <https://www.ncbi.nlm.nih.gov/books/
NBK383/>.

SOARES, J. et al. Métodos diagnósticos: consulta rápida.


2009. Disponível em: <https://books.google.com.br/
ooks?hl=p=-t-BR\&lr=\&id=8yWA\8_n0TPwC\&oi=fnd\&pg=P4T\&dq-
+Soares,\%09JLMF+e+cols.+M\%C3\%A9todos+diag-
n\%C3\%B3sticos.+Consulta+r\%C3\%A1pida.+1\
%C2\%AA+edi\%C3\%A7\%C3\%A3o.+ARTMED,+
2002.\&ots=NiCIvlqB0q\&sig=QIGn-NYgKdThEn1ahF3bk5JVsi4>.

WEINTRAUB, W. S. et al. A sequential approach to the diagnosis of


coronary artery disease using multivariate analysis. American heart
journal, v. 109, n. 5, p. 999-1005, 1985. ISSN 0002-8703.

WELLS, P. S. et al. Excluding pulmonary embolism at the bedside


without diagnostic imaging: management of patients with suspected
pulmonary embolism presenting to the emergency department
by using a simple clinical model and d-dimer. Annals of internal
Medicine, 2001. Disponível em: <http://annals.org/aim/article/714645/

298 DESCOMPLICANDO MBE


excluding-pulmonary-embolism-bedside-without-diagnostic-imaging-
-management-patients-suspected>.

Valor Preditivo 299


O
conceito de acurácia pode ser compreendido de
forma simplista como a capacidade do método
diagnóstico acertar o diagnóstico. Entretanto,
para um entendimento mais crítico sobre essa conceituação,
por vezes esquecido nas discussões sobre escolha diagnóstica,
vamos iniciar nossa apresentação conhecendo a Exatidão e
a Precisão.
Nesse contexto, a forma mais prática de entender esses
dois conceitos é por meio de uma competição de arco e
flecha, na qual sabemos que o objetivo dos arqueiros (ponto
de referência ou acertar o diagnóstico) é atingir o centro do
ACURÁCIA

20 Henrique de Paula Bedaque


Ítalo Medeiros de Azevedo
Luiz Cândido da Silva Júnior

alvo. Assim, veremos a imagem abaixo representativa de 04


arqueiros e, logo após, iremos discutir cada vocábulo.

Figura 1 – Desenho esquemático de quatro


alvos após lançamento de cinco flechas

301
Observando o alvo do arqueiro 01 percebemos que
ele consegue acertar sempre muito próximo do ponto cen-
tral (exatidão) e que todas as flechas também estão muito
próximas (precisão), logo ele será o arqueiro mais acurado!
Ademais, vendo o arqueiro 02 percebemos que ele já não
consegue acertar suas flechas próximas ao ponto central
(pouco exato), mas elas continuam próximas umas das outras
(muito preciso).
Além disso, avaliando o arqueiro 03 percebemos que
ele consegue acertar as flechas muito próximas ao centro
(muito exato), porém tem dificuldade de fazer com que todas
elas atinjam exatamente o centro (pouca precisão). Por fim,
o pior arqueiro é o 04, que não consegue atingir o centro da
mira (pouca exatidão) e atinge pontos muito distintos entre
si (pouca precisão). Fica fácil perceber esses dois conceitos
atentando para a imagem.
Agora vamos nos atentar para uma outra representação
esquemática que também tenta explicar ambos os conceitos,
mas em forma de gráfico. Vejamos:

Figura 2 – Representação gráfica para compreensão


dos conceitos de exatidão e precisão

302 DESCOMPLICANDO MBE


A figura 2 nos fornece uma curva representando um
tipo de teste diagnóstico. Em sua base (precisão) podemos ter
muitas possibilidades (base larga) ou poucas possibilidades
(base curta), sendo o ideal uma base curta representando uma
baixa variabilidade de valores obtidos pelo teste e, conse-
quentemente, uma alta precisão. Lembremos dos arqueiros,
se as flechas estão distantes entre si seria o equivalente a
uma base larga de pouca precisão.
Além disso, para a exatidão temos que a distância do
centro da curva para o valor de referência (centro do alvo)
irá determinar a exatidão do teste, sendo preferível uma
curta distância, pois irá indicar que o resultado do teste
diagnóstico consegue informar o real valor, fornecendo
uma medida exata. Em analogia com os arqueiros seria o
equivalente a dizer que a distância da flecha ao centro do
alvo representa a distância da curva ao valor de referência.
Agora que entendemos esses dois conceitos fica muito
fácil interpretar de forma mais reflexiva a Acurácia, pois ela
pode ser representada pela fórmula:

ACU R ÁCI A = EX AT I DÃO + PR ECISÃO

Dessa forma, devemos compreender de maneira mais


ampla que a acurácia depende do sinergismo da exatidão
de um tipo de teste e da sua precisão.

CABEÇA PENSANTE

Vamos imaginar um teste com boa exatidão, porém com baixa


precisão. Vamos adotar como exemplo uma metodologia para avaliar a
dosagem de Lítio no corpo, muito importante para pacientes em tratamento

ACURÁCIA 303
para transtorno bipolar. Nessa situação, é importante saber que o lítio
tem uma faixa terapêutica muito estreita, assim, se ele ultrapassar os
limites dessa faixa poderá promover efeitos colaterais importantes.

Sendo assim, se pegarmos 05 amostras de sangue do mesmo


paciente teremos que todas estarão próximas ao valor real (centro
do alvo), entretanto elas estarão distantes umas das outras, com a
possibilidade de que algumas delas estejam fora da faixa terapêutica,
como na imagem abaixo:

Figura 3 – Representação gráfica dos valores de


05 testes iguais colhidos em tempos distintos

Sabemos, contudo, que ninguém colhe 05 amostras do


mesmo exame no mesmo momento, então suponhamos que
um paciente tenha coletado apenas 01 amostra e que por
“azar” (acaso) tenha sido logo a que passou da faixa terapêu-
tica (amostra 3). Assim, teremos uma inadequada mudança
posológica apenas pela baixa precisão do teste e não pela real
concentração do fármaco no sangue.
Entendeu a importância da precisão?

304 DESCOMPLICANDO MBE


Agora que já compreendemos um pouco mais da impor-
tância da precisão vamos nos posicionar de maneira mais
próxima da realidade, na qual não é habitual a solicitação
de várias repetições do mesmo teste, ou melhor, solicita-se
apenas 01 amostra dos exames. Nesse caso, não temos como
avaliar a precisão dentro da acurácia e, portanto, genera-
lizamos que a Acurácia é sinônimo de Exatidão. Logo, a
utilização do conceito amplo e completo de acurácia acaba
por ser mais empregado em pesquisas que buscam estudar
especificamente o teste, sua exatidão e sua precisão.
Entender a importância da exatidão já é mais fácil em
nossa experiência cotidiana, pois nos é lógico que se o valor
está longe do alvo (pouco exato) ele não irá representar bem
a realidade e, logo, não será muito acurado para uso clínico.
Compreendemos os ingredientes que compõem a acu-
rácia e agora iremos aprender de forma simplificada e rápida
como calcular se um teste é acurado ou não, utilizando, para
isso, o conceito de capacidade de acertar o diagnóstico.

ACURÁCIA 305
Figura 4 – Representação de uma tabela 2x2

Na imagem acima temos a representação dos resul-


tados de um novo teste diagnóstico em uma determinada
população. É importante perceber que de todas as pessoas
com a doença (D+) apenas “a” tem a doença e são positivas
no teste (verdadeiros positivos) e os demais doentes “c”
tiveram resultado negativo. Ademais, de todas as pessoas
sem a doença (D-) apenas “d” tiveram o resultado negativo
(verdadeiros negativos) enquanto que “b” não são doentes,
mas tiveram resultado positivo no teste.
Nesse contexto, se a acurácia objetiva saber “quantas
vezes o teste acertou”, isto é, qual a proporção de acertos
(verdadeiros positivos + verdadeiros negativos) dentro de
todo espaço amostral (população = a + b + c + d) podemos
calcular a acurácia pela seguinte fórmula:

306 DESCOMPLICANDO MBE


Figura 5 – Fórmula da acurácia

Além disso, para facilitar a compreensão podemos


transformar em percentagem multiplicando a equação por
100. Assim, quanto mais próximo de 100% maior é a acurácia
do teste e a confiança de que ele irá acertar (o real valor ou
real diagnóstico). Portanto, a utilização da acurácia de um
determinado teste auxilia em nossa decisão sobre qual exame
escolher no processo investigativo da doença de um paciente.

CONCLUSÃO

A acurácia é um conceito amplo que envolve uma


fundamentação teórica não muitas vezes prática para a clínica
diária, entretanto conhecer sua formação e as informações
que podem ser oferecidas podem se tornar importantes
ferramentas em uma discussão sobre MBE.

REFERÊNCIAS

GALERA MONICO, Joao Francisco et al. Acurácia e precisão: revendo


os conceitos de forma acurada. Boletim de Ciências Geodésicas, v. 15,
n. 3, 2009.

ZAROS, L. G.; MEDEIROS, H. R. Bioestatística. 2. ed. Natal: EDUFRN,


2011. 214 p. Disponível em: <http://sedis.ufrn.br/bibliotecadigital/site/
pdf/biologia/Bioestatistica_LIVRO_WEB.pdf>. Acesso em: 30 jun. 2017.

MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p. BS ISO 5725-1: “Accuracy (trueness and

ACURÁCIA 307
precision) of measurement methods and results - Part 1: General
principles and definitions.”, p. 1 (1994)

308 DESCOMPLICANDO MBE


CURVA ROC

21 Ítalo Medeiros de Azevedo


Pedro Henrique Almeida Fraiman
Ugor Tomaz Fernandes

A
s curvas ROC foram desenvolvidas nos anos
1950 como um produto de pesquisa para
analisar a interferência nos sinais de rádio,
monstrando a relação entre ruído e sinal. Após um tempo,
percebeu-se que elas poderiam ser recursos importantes
na representação de dados estatísticos em Medicina, auxi-
liando na decisão clínica, sendo utilizadas até hoje. A curva
ROC busca apresentar, no contexto da Medicina Baseada em
Evidências, a relação entre a sensibilidade e a especificidade
de determinado teste.
A ideia central reside na premissa que determinados
testes possuem um ponto de corte – frequentemente, deter-
minado arbitrariamente – acima e abaixo do qual haverá dife-
rentes desfechos – o que poderíamos chamar de “resultado

309
positivo” e “resultado negativo”, este que se relaciona com a
especificidade e aquele com a sensibilidade.

Figura 1 – Exemplo de curva ROC

Tal curva pode ser representada em um gráfico que


no eixo vertical está representada a Sensibilidade e no eixo
horizontal a 1 - Especificidade, conforme vemos na figura 1.
A ideia é mostrar que para qualquer ponto da curva
temos um valor correspondente para a sensibilidade e espe-
cificidade. E, enquanto progredimos numa determinada
direção, perdemos em outra – ou seja, enquanto aumentamos
a nossa sensibilidade diagnóstica, diminuímos a especifici-
dade, vice-versa.

310 DESCOMPLICANDO MBE


Figura 2 – Determinação de pontos de corte pdem
ser simplificados na análise da curva ROC

Uma situação que vislumbramos a utilidade disso


é na determinação de um ponto de corte para um exame
diagnóstico. Suponhamos que estamos desenvolvendo um
teste para rastreio do diagnóstico de Diabetes Mellitus, cada
ponto da nossa curva ROC é um valor de glicemia. Então,
observando a figura 2, percebemos que se determinado
valor correspondente da glicemia, digamos, 100 mg/dL,
referente à marcação laranja, estamos com uma sensibilidade
de 90% e uma especificidade de 60%; então, se utilizássemos
a marcação vermelha, uma suposta glicemia de 126 mg/dL,
modificaríamos a sensibilidade para 85% e uma especifici-
dade de 70%. Portanto, admitindo um ponto de corte como a

Curva ROC 311


partir de 126 mg/dL, aumentaríamos a especificidade do teste,
reduzindo a quantidade de falsos positivos, eventualmente
diagnosticados. Em geral, o ponto de corte está no ponto
extremo da curva, como veremos adiante, devido representar
a maior acurácia, ou seja, uma maior proporção de testes
corretos – verdadeiros positivos e negativos.
Quando analisamos uma Curva ROC, devemos estar
atentos à principal variável que ela busca traduzir: a acurácia
de um teste.
A análise da acurácia é simplificada pelo recurso
gráfico que é permitido pela curva. Com isso, uma nova
variável é trazida à tona: a área abaixo da curva [ROC],
conhecida pela sigla inglesa Area Under the Curve (AUC). A
utilização da AUC é possibilitada por lidarmos, neste caso,
com uma variável não paramétrica, Sendo a noção principal
a de que este valor a ser determinado pode variar entre 0.5
e 1.0. Logo, valores maiores de AUC traduzem uma maior
acurácia, portanto um teste organizado; enquanto valores
mais próximos de 0.5 refletem uma menor acurácia, sendo
um teste desorganizado.
Dispensando o formalismo matemático, posto que
a determinação da AUC, na maioria dos casos, envolveria
a utilização do cálculo integral, temos um recurso mais
próximo da realidade que se equivale ao conceito de AUC e
acurácia que tanto desejamos ao analisar uma curva ROC
no contexto da Medicina Baseada em Evidências.
Se traçarmos uma reta entre o ponto mais próximo
da curva e o ponto do gráfico (0;1) (Este ponto é o ponto em
que haveria a maior sensibilidade e a maior especificidade,
ambas 100%) e comparamos duas curvas, quanto menor o

312 DESCOMPLICANDO MBE


segmento traçado, maior será a acurácia permitida por aquele
teste. Além disso, a sensibilidade e a especificidade do teste
avaliado são justamente a correspondente a este ponto mais
próximo da curva. Intuitivamente podemos notar então
que, quanto mais próximo do aspecto retangular, maior a
acurácia; por outro lado, quanto mais próximo do aspecto
diagonal, menor a acurácia.

Figura 3 – Duas curvas ROC com diferentes


acurácias. Quanto mais próximo do formato
diagonal, menor a acurácia de um teste

Acima, na figura 3, vemos que a curva mais espessa,


de aspecto diagonal, possui uma distância maior até o ponto
(0;1), enquanto a curva menos espessa possui uma distância
menor. Logo, a curva menos espessa representa um teste de
maior acurácia.

Curva ROC 313


Algumas informações podem ser obtidas com a CURVA
ROC a qual não nos deteremos ao método de obtenção,
por não ser o foco deste capítulo de iniciação ao estudo de
Medicina Baseada em Evidências, porém indicamos o estudo
mais aprofundado sobre o assunto em outras referências:
sensibilidade do teste, especificidade do teste, tamanho da
amostra.

CONCLUSÃO

A curva ROC é um recurso amplo que está envolvido


na determinação de pontos de corte de testes diagnósticos,
além da possibilidade de comparação, fácil utilização visto a
possibilidade de inferir várias informações, principalmente,
relacionadas à acurácia, possivelmente, a principal infor-
mação obtida a partir da curva, apenas pela comparação
visual, dispensando muito do preciosismo matemático tão
comum na Estatística.

REFERÊNCIAS

Hajian-Tilaki K. Receiver Operating Characteristic (ROC) Curve


Analysis for Medical Diagnostic Test Evaluation. Caspian Journal of
Internal Medicine. 2013;4(2):627-635.

Park SH, Goo JM, Jo C-H. Receiver Operating Characteristic (ROC)


Curve: Practical Review for Radiologists. Korean Journal of
Radiology. 2004;5(1):11-18. doi:10.3348/kjr.2004.5.1.11.

314 DESCOMPLICANDO MBE


CAUSALIDADE

22 Ferdinand Gilbert Saraiva da Silva Maia


Frederico Galvani Harckbart Carvalho
Henrique de Paula Bedaque

V
imos nos capítulos anteriores diversas análises
estatísticas que tem como princípio encontrar
associações entre fatores, entretanto acaba por
ser um erro comum a interpretação de que ter uma boa
estatística é uma condição única para transformar uma
associação em um fator causal. Por isso, é importante esse
capítulo para desconstruir o costume de entender associação
(medido pela bioestatística) como igual a Causalidade.
Vejamos um exemplo para entendermos melhor:
Imaginemos que de um estudo comparando fumantes e não
fumantes com o risco de ter câncer de pulmão. Após as
análises adequadas chegou-se a uma valor de risco relativo

315
de 30, isto é, poderíamos dizer que um fumante tem 30 vezes
mais risco de ter câncer de pulmão do que um não fumante.
Entretanto, é essencial notar que apesar de termos uma
medida de associação forte (30 vezes mais risco) esse valor não
nos permite ainda afirmar com exatidão que “fumar causa
câncer de pulmão”, mas apenas que “fumar está fortemente
associado a câncer de pulmão”.
O intuito do exemplo é mostrar que necessitamos de
mais informações, além da estatística, para transformar um
conhecido fator de associação em um fator causal. Dessa
forma, para compreender melhor como chegar à conclusão
de causalidade voltaremos um pouco no passado para uma
das primeiras tentativas de transformação causal voltado
para a área da saúde.

POSTULADO DE HENLE KOCH

No século XIX criou-se um postulado que teve como


objetivo qualificar a causalidade, porém é importante notar
que naquela época ainda se pensava essencialmente no
modelo unicausal das doenças, isto é, existia um pensamento
primordialmente de doença aguda desencadeada por bactéria,
pouco ainda se discutia sobre doenças crônicas (Hipertensão,
lúpus e Diabetes).
Vejamos os critérios do Postulado para o organismo
patogênico:
1. O patógeno deve estar presente em 100% dos casos
da doença.

316 DESCOMPLICANDO MBE


2. O patógeno não deve ocorrer, seja de forma casual ou
patogênica, em qualquer outra doença.
3. Se o patógeno for isolado em cultura e inoculado em
susceptíveis ele deve induzir a doença.
Devemos ter em mente que ao cumprir esses critérios
temos um patógeno com um importante potencial causal da
doença, mas que o descumprimento de um ou mais desses
itens não excluí um patógeno como agente suficiente para o
desenvolvimento da comorbidade, o que acaba ocorrendo,
principalmente, em casos de doenças crônicas com vários
fatores desencadeantes e que nem sempre necessitam e pató-
genos para seu gatilho.
Nesse contexto, temos que o postulado de Henle Koch
foi um marco importante na tentativa de se caracterizar
fatores causais para doenças, mas que atualmente já não
preenche adequadamente essa necessidade para a grande
maioria das doenças conhecidas. Assim, novos estudiosos
foram complementando e criando novas ideias sobre métodos
de transformar um fator em causal.

MODELO DE ROTHMAN

Antes de descrever o critério mais famoso na tentativa


de transformação de uma associação em causalidade vamos
entender como se deu a mudança de perspectiva unicausal
para multivariada. Atualmente o Modelo de Rothman explica
bem esse pensamento. Para isso vamos dar conceito a três
tipos de causas:
Causa Suficiente: Conjunto de condições ou eventos
mínimos que inevitavelmente produzem ou iniciam a doença.

Causalidade 317
Causa componente: São as unidades causais contidas
dentro da causa suficiente.
Causa necessária: Quando a doença só ocorre na
presença dela. Logo, estará presente em todas as causas
suficientes.
Agora que temos esses três conceitos vamos atentar
para a imagem explicativa:

Figura 1 – Representações em pizza de causas


componentes, necessárias e suficientes

Observando a imagem percebemos que o círculo


(vamos chamar de pizza) representa a causa suficiente, e
que dentro dela temos variadas fatias de pizza de tamanhos
diferentes, cada uma representando uma causa componente,
porém vamos aprofundar informando que uma causa com-
ponente pode ser do tipo causa necessária. Vamos aprender
com exemplos:

318 DESCOMPLICANDO MBE


Figura 2 – Representação de causas para
o diagnóstico de pneumocistose

Fica fácil perceber, então, que os múltiplos fatores de


risco, sejam eles essenciais ou apenas coadjuvantes, estão
dentro da causa suficiente para a ocorrência da doença e,
dessa forma, é importante notar que não temos como informar
todas as fatias das pizzas de todas as doenças existentes, isto
é, não é possível conhecer a totalidade de causas componentes
de uma determinada doença.
Entretanto, conhecer todas as causas componentes
não é essencial para o intuito de evitar ou tratar a doença, já
que evitando uma causa componente não será mais possível
completar a causa suficiente! Veja bem: Se a causa suficiente
é a mínima necessária para que a doença ocorra ao tirar uma
fatia de pizza ela não estará mais completa, logo, a doença
não irá ocorrer.

CRITÉRIOS DE BRADFORD HILL

Agora que entendemos como funciona um dos pensa-


mentos aceitos sobre a multicausalidade das doenças vamos
focar nossa atenção nos critérios mais conhecido atualmente

Causalidade 319
na tentativa de transformar um fator associado (descoberto,
por exemplo, pela estatística) em um fator causal.
Critérios de Bradford Hill (1965):

Tabela 1 – Descrição dos critérios de Bradford Hill

FORÇA DA Quanto mais forte for a associação,


ASSOCIAÇÃO maiores são as chances dela ser causal
Várias pesquisas com acha-
CONSISTÊNCIA dos semelhantes aumentam
a chance dela ser causal
Se a presença da causa é necessária
ESPECIFICIDADE
para o aparecimento do efeito
TEMPORALIDADE Se o fator precede o desfecho
GRADIENTE Se o aumento da causa (hipotética)
BIOLÓGICO aumenta o efeito no desfecho
Se a relação que está estudando é
PLAUSIBILIDADE
plausível com o conhecimento atual
A interpretação causal não pode ser
COERÊNCIA
conflitante com o conhecimento atual
EVIDÊNCIA EXPE- Se há experiência que mostrem o
RIMENTAL aumento da frequência do efeito
Ao saber que um antiparasitário pode
dar náuseas podemos dizer que
ANALOGIA
por analogia outro antiparasitário
também pode causar náuseas

Vamos agora comentar um pouco de cada um desses


critérios:
1. Força da associação: esse item busca da estatística
uma forma de aumentar a chance de fator ser causal
quando a associação é forte, mas quando podemos
dizer que ela é forte? Podemos dizer que quanto mais

320 DESCOMPLICANDO MBE


distante do valor de nulidade mais forte será a asso-
ciação. Isso ocorre, pois se acredita que associações
fracas poderiam ser explicadas por vieses enquanto
associações fortes, mesmo que influenciadas por algum
viés, ainda seriam significativas. Assim, a presença
de uma associação estatística forte é um dos critério
para a causalidade.
2. Consistência: quando se realiza diversas pesquisas
sobre esse fator em diferentes populações e, ainda
assim, tem-se as mesmas indicações de que há uma
relação causal podemos dizer que há consistência
nessa relação.
3. Especificidade: quando uma causa específica é determi-
nante para sua ocorrência e sua retirada do organismo
significa a completa resolução da doença. Nesse item
temos um grande conflito decorrente de doenças crô-
nicas, como autoimune, que não existe um fator único
determinante, mas diversos. Nesse contexto, a presença
de especificidade é respalda a interpretação causal,
porém a sua ausência não exclui a possibilidade de
uma relação causal.
4. Temporalidade: a causa (hipotética) deve necessaria-
mente preceder a doença. Esse é o item obrigatório
que não pode ser abandonado em nenhuma análise
de causalidade.
5. Gradiente biológico: nesse item busca-se uma relação
gráfica com a dose-resposta, isto é, quanto maior a
exposição ao fator há uma maior chance ou maior
gravidade da doença e vice-versa. Vale informar que

Causalidade 321
esse efeito dose-resposta pode ocorrer complemente
por um viés.
6. Plausibilidade: seria plausível diante de todo o conhe-
cimento atual sobre o tema a proposta de fator causal?
Essa é a pergunta que deve ser respondida por esse
item, temos então que fazer uma revisão da literatura
sobre o que já foi estudado sobre esse fator e sobre
a doença. Um adendo seria que quando menos se
conhece sobre a doença (doenças raras) mais difícil
fica excluir a plausibilidade.
7. Coerência: esse critério é satisfeito quando não há
divergência entre o que é conhecido da história natural
da doença e da fisiopatologia dela com o que se está
sendo proposto.
8. Evidência experimental: nesse item busca-se encontrar
estudos que mostrem uma avaliação causal do fator
desejado, o que muitas vezes é difícil de ser realizado
por questões éticas.
9. Analogia: O uso de analogias pode facilitar a compre-
ensão da causalidade do fator. Por exemplo, se uma
droga anti-hipertensiva diminui desfechos cardiovas-
culares outra droga anti-hipertensiva da mesma classe,
por analogia, também deve diminuir esses desfechos.
Atualmente o uso dos critério de Bradford Hill ainda
são os mais didáticos para a compreensão de que a estatística
não é a condição mínima necessária para considerar um
fator como causal. Além disso, atualmente existem novas
metodologias mais complexas como no teste de causalidade
de Gringer sempre com o intuito de aprimorar a capacidade

322 DESCOMPLICANDO MBE


de transformação causal e de abranger itens ainda não com-
plemente explicados por Hill.

CONCLUSÃO

Por fim, o conhecimento bioestatístico associado a


compreensão do intuito de Hill ao descrever esses 09 critérios
é essencialmente suficiente para que o leitor consiga realizar
a sua reflexão sobre possíveis fatores causais, transformando
a evidência científica em evidência clínica aplicável.

REFERÊNCIAS

DE ARAÚJO, L. F. S. C.; DALGALARRONDO, P.; BANZATO, C. E. M.


On the notion of causality in medicine: addressing Austin Bradford
Hill and John L. Mackie. Archives of Clinical Psychiatry (São Paulo),
v. 41, n. 2, p. 56-61, 2014.

LUIZ, R. R., STRUCHINER, C. J. Inferência causal em epidemiologia:


o modelo de respostas potenciais [online]. Rio de Janeiro: Editora
FIOCRUZ, 2002. 112 p. Disponível em: <www.books.scielo.org>.
Acesso em: 04 Jul. 2017.

MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p.

Causalidade 323
ESTATÍSTICA
APLICADA
A ESTUDOS
PROGNÓSTICOS

23 Breno C C Simas
Clause Willdys Medeiros Dantas
Ferdinand Saraiva Maia
Juliana Soares Pimenta
Maria Paula Ribeiro Dantas Bezerra

A
identificação de fatores prognósticos (ou seja,
características do paciente e da doença que
guardam associação com algum desfecho
futuro de interesse) é importante, pois nos permite “prever”
a história natural daquela patologia. A criação de modelos
prognósticos, os quais analisam diversas variáveis para
estimar a probabilidade de um desfecho, também é muito
útil na prática médica.
Entretanto, é importante que a investigação prognóstica
seja realizada sob a luz da Medicina Baseada em Evidências,
para não acarretar conclusões e interpretações errôneas. Por
exemplo, como saber o quanto aquele fator ou modelo prog-
nóstico é acurado, ou seja, o quanto eu posso “confiar” nele
para indicar se meu paciente irá sofrer um evento adverso?

325
Como saber se os resultados de um estudo prognóstico
são válidos? Para entender isso, é necessário avaliar o tipo
de estudo que validou a influência daquele fator ou modelo
prognóstico, a análise estatística usada, a acurácia do modelo,
além de características da performance do teste, como o
índice de reclassificação líquida e a calibração. É justamente
esse conhecimento que você irá adquirir a partir de agora!

VARIÁVEL PREDITORA

Para prosseguir neste capítulo, é importante que o


leitor entenda, desde já, a seguinte afirmação: associação não
implica causalidade. Associações podem simplesmente mar-
car um paciente de maior risco para um determinado evento,
sem ser determinantes para sua ocorrência. Isso ocorre por
exemplo com o HDL-colesterol: ele pode ser utilizado para
predizer o risco de doença cardiovascular aterosclerótica, mas
não há dados até o momento sinalizando que sua modifica-
ção através de fármacos interfere na incidência de eventos
cardiovasculares.
Variáveis preditoras são características do paciente
através das quais é possível inferir sobre a sua evolução.
São utilizados para predizer risco de um desfecho futuro, e
por isso são marcadores de risco, mas não necessariamente
estão implicados em causa. Exemplifica-se o escore de cálcio
coronariano, que prediz risco de infarto agudo do miocárdio
(IAM) – isto é, um escore de cálcio alto aponta um maior risco
para esse evento. Todavia, não é o cálcio que leva ao IAM, é
a formação de placas ateroscleróticas. Assim, entendemos
porque o preditor consiste em um marcador de risco e não
em relação de causalidade. Todo fator causal realmente é

326 DESCOMPLICANDO MBE


um preditor, mas nem todo preditor é um fator causal. Dito
isto, avancemos!
Para entender melhor sobre como uma variável pre-
ditora ou marcador de risco pode ser considerado um fator
causal, sugerimos que leia o capítulo “Causalidade” do nosso
livro.

DESENHO DO ESTUDO

Nos estudos prognósticos, as variáveis preditoras são


características relacionadas a uma maior probabilidade de
um determinado evento. Podemos imaginar um grupo de
cientistas que resolveu investigar a associação entre taba-
gismo e desenvolvimento de câncer de pulmão. Hoje, já
conhecemos essa clássica associação e podemos imaginar
que o resultado do estudo será óbvio.
No entanto, na condução da investigação, variáveis de
confusão poderiam mediar uma eventual associação. Por
exemplo, pensemos na hipótese de o grupo de fumantes
também ser composto por uma maioria de sedentários.
Haveria a possibilidade de, na verdade, o sedentarismo
ter sido um fator desencadeante para o câncer, no lugar do
tabagismo? Qual desenho de estudo seria mais confiável
para estabelecer essa associação que estamos investigando?
É possível pensar que, teoricamente, o melhor seria
a realização de um ensaio clínico randomizado, de modo a
eliminar possíveis variáveis de confusão. Todavia, não seria
viável nem ético trabalhar com fornecimento de cigarro para
o grupo intervenção. Por outro lado, precisamos de dados
longitudinais, já que queremos avaliar se uma exposição

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 327


no presente prediz um evento no futuro. Logo, podemos
entender que os desenhos observacionais como a coorte
são ideais para estudos prognósticos, por possibilitarem a
melhor avaliação dos preditores e desfechos de interesse.
É importante retomar o conteúdo do nosso capítulo
acerca de estudos da coorte: consistem em estudos observa-
cionais, longitudinais, prospectivos ou retrospectivos, que
identificam a existência do preditor antes da ocorrência do
desfecho. A coorte observa indivíduos inicialmente livres de
desfecho, avalia suas características clínicas e laboratoriais
e os acompanha. Esse tipo de pesquisa parte do fator de
exposição, separando as pessoas em grupo exposto e não
exposto a determinado fator com potencial marcador de
risco para determinada doença e depois avalia e compara a
incidência do desfecho entre esses grupos.
Estudos caso-controle também podem ser úteis quando
queremos investigar situações infrequentes ou quando pre-
cisamos comparar grupos a partir do desfecho. Um exemplo
desse tipo de situação seria uma investigação para estabelecer
se o uso de seringas compartilhadas para uso de drogas
injetáveis é fator de risco para infecção por HIV. Partir de
um grupo de pessoas que compartilham ou não seringas
e que não tem HIV e avaliar a incidência da infecção pode
consumir muito tempo.
Alternativamente, seria possível entrevistar um grupo
de pessoas com infecção por HIV e avaliar essa exposição
no passado. Então, iríamos comparar a mesma exposição em
um grupo de pessoas sem a doença. Entre as limitações dos
estudos de caso-controle, podemos citar a não verificação de
incidência, o risco de viés de memória e a dependência da

328 DESCOMPLICANDO MBE


precisão de prontuários, fragilizando o potencial de inferência
desse tipo de desenho.
Outra possibilidade é o estudo seccional, que seleciona
uma amostra qualquer da população e avalia no momento
presente se há associação entre duas variáveis. Por exemplo,
em um estudo transversal, podemos perceber que muitos
pacientes que sofreram um Acidente Vascular Encefálico
(AVE) têm Fibrilação Atrial (FA). Será que a FA poderia acar-
retar o desenvolvimento de AVE? Estudos seccionais apenas
geram hipóteses, pois não há como estabelecer temporalidade.
Precisaríamos de estudos longitudinais para averiguar as
associações levantadas por esse tipo de desenho.
Logo, a preferência, em ordem decrescente, pelo dese-
nho do estudo é coorte, seguido de caso controle e, por último,
corte transversal. A partir da escolha do desenho adequado e
sabendo que o estudo observacional está sujeito às variáveis
de confusão, como atenuá-las e ajustá-las? Conheceremos
agora o conceito de análise multivariada.

ANÁLISE MULTIVARIADA

Raramente um estudo prognóstico encontrará uma


única variável preditora de risco. Na maioria das vezes, não
existe uma única característica que aumenta o risco de um
desfecho, porque o efeito da associação decorre do efeito
direto e indireto do marcador de risco. O efeito indireto
advém de outras variáveis que também podem influenciar
no desfecho. Por exemplo, idade e hipertensão arterial são
conhecidos fatores de risco para IAM. Mas se os idosos
geralmente podem ter a pressão arterial mais alta, seria por
isso que a idade representaria um fator de risco? Ou será

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 329


que ambos são, por si, preditores do desfecho? Portanto,
as variáveis precisam ser cuidadosamente selecionadas e
avaliadas por meio de técnicas estatísticas adequadas.
Nesse sentido, temos que considerar dois tipos de
análise: a univariada (às vezes descrita como bivariada) e a
multivariada. As técnicas de análise univariada (tais como
ANOVA) procuram averiguar o efeito total da variável para
o desfecho. Todavia, levando em consideração que vários
fatores podem influenciar ao mesmo tempo na ocorrência de
um evento, a análise univariada pode levar a interpretações
equivocadas.
Por sua vez, a análise multivariada consiste em uma
estratégia de análise estatística em que diversas variáveis
preditoras do desfecho tem sua associação avaliada ao mesmo
tempo, a fim de ajustar o efeito de cada uma em relação às
demais e identificar a real associação de cada uma delas.
Dessa forma, a análise multivariada irá identificar o efeito
direto de cada variável, que independe das demais. Assim, é
possível estabelecer quais variáveis são preditores indepen-
dentes do desfecho. Preditores independentes do desfecho
irão apresentar valor de p significativo para associação com
o desfecho na análise multivariada.
Ao estabelecer quais variáveis são preditores inde-
pendentes, a análise multivariada viabiliza a construção
de um modelo prognóstico. O escore de Framingham é
um bom exemplo desse tipo de modelo, sendo utilizado
para estratificar o risco global cardiovascular, mediante as
variáveis de sexo, idade, tabagismo, pressão arterial sistólica,
colesterol total, HDL e presença de diabetes. Todos esses
fatores apresentaram valor preditor independente na coorte

330 DESCOMPLICANDO MBE


de Framingham. Em suma, se queremos construir modelos
preditores, o uso da análise multivariada é essencial.

ACURÁCIA DE MODELOS
PROGNÓSTICOS/ESTATÍSTICA-C

Após estabelecer, através de análise multivariada,


que um fator prognóstico tem valor preditor independente,
sabemos que aquela variável tem efeito direto no prognóstico
daquele paciente, ou seja a associação existe. Mas além disso,
é importante estabelecer a acurácia do fator (ou modelo).
Acurácia é uma medida da capacidade discriminatória do
meu marcador ou modelo, ou seja, sua capacidade de separar
quem terá ou não aquele desfecho. E como fazer isso?
• Se estamos falando de um marcador dicotômico (que
só aceita respostas do tipo sim/não), deveremos ana-
lisar a sensibilidade, especificidade e as razões de
probabilidade.
• Por exemplo, ao saber que em um tipo específico de
câncer ter o marcador X denota maior probabilidade de
recidiva após tratamento (desfecho futuro), devemos
analisar a acurácia desse marcador através das suas
razões de probabilidade positiva (RP positiva) e nega-
tiva (RP negativa). Se o marcador X tem alta RP positiva,
ele é um marcador que, se positivo naquele paciente,
aumenta consideravelmente a chance de o indivíduo
ter câncer novamente. Já um marcador com baixa RP
negativa é um marcador que, quando negativo, nos
deixa mais “tranquilos” quanto à probabilidade do
câncer voltar naquele indivíduo.

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 331


• Obs! Para entender melhor esses conceitos, sugerimos
que leia o capítulo de valor preditivo desse livro.
• Se estamos falando de um marcador numérico ou de
um modelo prognóstico, analisaremos a acurácia ao
analisar a estatística C, que corresponde a área abaixo
da curva ROC (AUROC).
Temos um capítulo sobre curva ROC que pode te ajudar
a entender melhor, porém iremos retomar resumidamente:
a curva ROC busca analisar a relação entre sensibilidade e
especificidade de um determinado teste. Para cada ponto
da curva (que representa um diferente ponto de corte do
teste), encontramos valores diferentes de sensibilidade e
especificidade - isso é útil para determinar um ponto de corte
ideal para algum teste ou marcador. Porém, o que é mais
interessante para nossa análise de marcadores e modelos
prognósticos, é analisar a área abaixo da curva ROC (AUROC)
ou estatística C.
A estatística C ou AUROC corresponde a possibilidade
de, dados 2 indivíduos (um que vai desenvolver o desfecho
de interesse e outro não) o modelo ou marcador determinar
um maior risco para o primeiro e um menor risco para o
segundo. Ou seja, aqueles marcadores ou modelos prog-
nósticos que têm uma grande área abaixo da curva, teriam
maior probabilidade de discriminar quem é de alto e de
baixo risco. Essa área pode variar de 0,5 a 1, sendo 0,5 um
teste que não tem utilidade e 1 o teste ideal.

332 DESCOMPLICANDO MBE


CABEÇA PENSANTEԝ

Podemos entender o conceito da estatística C como “o quanto o


teste acerta”. Uma estatística-C de 1 indica um teste que acerta
100% do tempo, perfeito. Uma estatística-C de 0,5 indica
um teste que acerta 50% do tempo (acerta o mesmo que se
tentássemos adivinhar na sorte).

Nessa figura, temos exemplificado um modelo prog-


nóstico em vermelho que nada discrimina, pois tem a área
abaixo da curva ROC de 0,5. Já os modelos rosa e azul têm
diferentes capacidades de discriminação, tendo o primeiro
uma melhor capacidade de discriminação, pois nitidamente
tem uma maior área abaixo da curva.

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 333


Por exemplo, em um estudo que buscava determi-
nar a acurácia do escore CHA2DS2Vasc em predizer AVE,
infarto e morte em pacientes com insuficiência cardíaca, foi
encontrada uma estatística/AUROC de 0,67. Sendo assim,
qual a probabilidade de uma pessoa com insuficiência car-
díaca (IC) que vai ter algum desses desfechos no futuro
ter uma pontuação no escore Chads2Vasc maior do que a
de alguém com IC mas que não terá esses desfechos? 67%.
Esse valor mostra um grau de predição moderada. Modelos
prognósticos com AUROC superiores a 0.8 são considerados
de alta acurácia; modelos com AUROC entre 0.7 e 0.8, de boa
acurácia; enquanto modelos com AUROC entre 0.6 e 0.7 são
considerados de acurácia moderada.

VALOR INCREMENTAL DE NOVOS


MARCADORES A MODELOS
PROGNÓSTICOS PRÉ-EXISTENTES.ԝ

Já conseguimos entender como avaliar a acurácia de


um marcador prognóstico isoladamente ou de um modelo
prognóstico. Vamos agora discutir como analisar o valor
incremental de novos marcadores a modelos prognósticos
pré-existentes.
Imagine que foi descoberto um novo marcador de risco
para predição do risco de doença cardiovascular. Foram
feitos estudos de coorte de boa qualidade metodológica em
que se encontrou associação entre esse marcador de risco
e o desenvolvimento de doença cardiovascular, através de
análise multivariada, nos mostrando que aquele marcador
tem valor preditor independente para o desfecho. Porém
nós já temos um escore de risco muito bem validado para

334 DESCOMPLICANDO MBE


predição de doença cardiovascular - o escore de Framingham.
Agora, basta acrescentar o nosso novo marcador ao escore
de Framingham e teremos um novo escore ainda melhor,
certo? Não necessariamente!
Para avaliar se um novo marcador deve ser incorpo-
rado a um modelo preditor, não basta provar que ele tem
associação independente com o desfecho. Temos que analisar
se, ao acrescentar esse marcador no modelo, este se torna
mais acurado. E como analisar isso?
Primeiro, devemos avaliar o valor incremental do
marcador. Observamos a estatística-C (área abaixo da curva
ROC) do modelo preditor pré-existente (no exemplo, o escore
de Framingham) e comparamos com a estatística-C de um
novo modelo preditor formado da associação do Framingham
com o novo marcador em questão. Se houver um aumento de
pelo menos 0.05 na estatística-C significa que o novo marca-
dor agrega valor prognóstico, tem um bom valor incremental.
Ou seja, ele torna nosso modelo mais acurado, e deve ser
incorporado. Se o aumento for menor que 0,05, o acréscimo
dessa variável tornará esse modelo mais complexo, com
pouco ou nenhum benefício.
Exemplo: Foi demonstrado que disfunção erétil é um
preditor de risco independente do escore de Framingham
para risco cardiovascular. Entretanto, em um estudo que
avaliou o valor incremental dessa variável ao modelo, foi
notado um aumento de apenas 0,004 na estatística C (0.691
do escore de framingham X 0,0695 do escore Framingham +
disfunção erétil). Isso mostra que acrescentar essa variável
ao escore, traria pouco ou nenhum benefício.

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 335


Existe uma forma complementar de avaliar a inserção
de um marcador de um modelo prognóstico que depende
apenas do novo marcador: o índice de reclassificação líquida
(net reclassification index/NRI).
Por exemplo, ao associar o escore de cálcio coronário ao
escore de Framingham para refinar o prognóstico de nossos
pacientes, teremos reclassificações de alguns indivíduos:
pessoas que eram de risco intermediário agora podem ser
reclassificadas para risco mais alto se possuem esse marcador
ou para risco mais baixo, caso não possuam.
Em um estudo de coorte, avaliamos quantos indivíduos
que sofreram o desfecho foram reclassificados para mais alto
risco (se sim, isso conta como uma reclassificação correta), e
quantos que não tiveram foram reclassificados para menor
risco (também reclassificação correta). Por outro lado, aqueles
indivíduos que sofreram o desfecho mas tenham sido reclas-
sificados para mais baixo risco, ou os que não apresentaram
desfecho mas tiverem sido reclassificados para alto risco,
serão computados como reclassificações incorretas.
Para quantificar, foi criado o índice de reclassificação
líquida (NRI), que subtrai as reclassificações corretas das
incorretas. Em síntese, queremos saber se ao acrescentar
aquele marcador ao modelo fizemos o modelo acertar mais.
Se o saldo foi positivo, significa que houve mais reclassifi-
cações corretas, portanto, haveria benefício em acrescentar
aquele marcador ao modelo. No caso do escore de cálcio,
observamos um NRI de +0.25 (25%), que fala a favor da
incorporação do teste.

336 DESCOMPLICANDO MBE


NRI superiores a 0.6 devem ser considerados fortes;
NRI entre 0.2 e 0.6, moderados; e NRI inferiores a 0.2 devem
ser considerados como fracos.

INDIVÍDUOS QUE INDIVÍDUOS QUE


FORAM RECLAS- FORAM RECLAS-
SIFICADOS PARAԝ SIFICADOS PARA
MAIOR RISCO MENOR RISCO

Indivíduos que
Reclassifica- Reclassificação
APRESENTARAM
ção correta incorreta
DESFECHO
Indivíduos que
Reclassificação Reclassifica-
NÃO APRESENTA-
incorreta ção correta
RAM DESFECHO

NRI = RECLASSIFICAÇÕES CORRETAS


- RECLASSIFICAÇÕES INCORRETAS

C A L I BR AÇÃO

Como já vimos anteriormente, estudos prognósticos


têm por objetivo prever os eventos futuros associados a
determinados riscos. Para isso, o pesquisador precisa montar
o seu modelo prognóstico baseado em grupos populacionais
e nos fatores de risco que são determinantes para o desfecho
esperado. Para um modelo perfeitamente calibrado, ou seja,
que funciona perfeitamente, esperamos que ele acerte a
proporção entre risco e desfecho. Se, por exemplo, o risco
predito no modelo é de 87% para os que foram classificados
como “alto risco” esperamos que, de 100 pacientes que sejam
ditos “alto risco” pelo modelo, 87 apresentem o desfecho.

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 337


Mas imagine que ao montar seu modelo prognóstico e
avaliar sua curva ROC, você perceba que a população obser-
vada com o desfecho esperado obteve resultados diferentes
do que o modelo previu. Será que o modelo perde utilidade?
Nesse momento vamos falar de calibração e como ela pode
beneficiar o estudo e o pesquisador.
A calibração avalia a concordância entre a incidência
de eventos que foi esperada (E) e a que foi observada (O).
Sendo possível plotar esses resultados em uma curva com
a relação entre eventos esperados e observados (E/O), em
que o resultado ideal é um (1), pois mostra que o número de
casos esperados é igual ao dos observados. Se o resultado
é >1, indica que o modelo tende a superestimar o risco do
paciente, e um valor <1 sugere que o modelo subestima o risco.
É importante notar, que são diversos os fatores que
podem levar a uma discordância entre os resultados espe-
rados e observados, dependendo da população estudada
e outros fatores relevantes, como o tipo de tratamento, a
época da coleta da informação, o diagnóstico ou a incidên-
cia do desfecho. Estudos com populações muito grandes
são necessários para a validação estatística, mas quando
essa população é muito heterogênea, isso pode prejudicar
a calibração do estudo.
Isto pode ocorrer quando aplicamos um modelo em
várias populações e este apresenta resultados variáveis e
distantes da previsão, no entanto, quando temos a visão
global do estudo este se aproxima do que foi estimado, ou
seja, próximo ao 1. Isso ocorreu, por exemplo, no estudo de
coorte multicêntrico SAPS-3, que derivou um escore para
predição de mortalidade em pacientes críticos. Na coorte

338 DESCOMPLICANDO MBE


de validação, os óbitos observados eram mais frequentes
do que o esperado na América Latina, por exemplo. Nesses
casos, é preciso reavaliar as variáveis e eventualmente pro-
mover ajustes levando em consideração as características
que podem estar associadas a pior calibração em alguns
grupos populacionais.
É necessário também avaliar em que população o
estudo foi desenvolvido, porque nem sempre é possível
extrapolar o modelo para outra população. Um exemplo
que temos é o escore de Wells para diagnóstico de Trombose
Venosa Profunda (TVP) e que foi desenvolvido em pacientes
de ambulatório especializado. No entanto, na atenção primá-
ria a ferramenta não apresenta boa calibração, principalmente
em grupos de risco mais baixo.
A população total de uma amostra usada para derivar e
validar um modelo prognóstico pode ser muito heterogênea,
mas definir um modelo com boa acurácia. Esse é o caso no
exemplo que citamos acima, do estudo SAPS 3. Porém, a
calibração nesse estudo pode ser um problema: cada UTI
tem características distintas, causas de internação podem
variar, bem como o perfil dos pacientes. Como eu posso
avaliar se o teste é bem calibrado em toda essa população?
A alternativa mais utilizada é o teste de Hosmer-Lemeshow
(“goodness of fit”).
Esse teste avalia se a população geral do estudo se
encaixa na previsão feita pelo modelo através da estratificação
do risco. Sendo assim, é necessário separar a população
total em grupos. A quantidade de grupos é variável, mas
usualmente os pacientes são separados em 10 grupos (decis).
Em cada decil, os pacientes do estudo vão sendo incluídos

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 339


por ordem de risco (no primeiro decil os 10% de menor risco,
e assim sucessivamente até os 10% de maior risco no último
decil). Para cada decil, será comparada a taxa predita e a taxa
observada de eventos. Se não houver diferença significativa,
o teste de Hosmer-Lemeshow irá resultar em um p>0,05,
indicando que o teste é bem calibrado.

CABEÇA PENSANTE

Lembre do capítulo de estatística: a hipótese nula é de que não


há diferença. Logo, se o teste de Hosmer-Lemeshow tem p>0.05
é porque as taxas observada e predita não são diferentes, o que
é bom! Significa que o teste é calibrado

CONCLUSÃO

Estudos prognósticos são feitos para identificar vari-


áveis preditoras e construir modelos prognósticos, ambos
com o objetivo de tentar estimar a probabilidade de um
possível desfecho naquele paciente. Prever o futuro não é
fácil, mas as análises de acurácia nos sinalizam o quanto
essas previsões acertam.
Para realização de estudos de prognóstico, o desenho
ideal é o de coorte prospectiva, e é importante que a deter-
minação de marcadores de risco seja feita através de análise
multivariada.
Depois de identificadas as variáveis preditoras ou
construído o modelo prognóstico, é imprescindível avaliar a
acurácia através da análise das razões de probabilidade (em
uma variável dicotômica) ou da estatística C/AUROC (em

340 DESCOMPLICANDO MBE


uma variável numérica ou modelo prognóstico). Quando se
deseja acrescentar uma variável preditora a um modelo que
já existe, recorremos a análise do valor incremental daquela
variável e do índice de reclassificação líquida.
Para avaliar se o marcador ou modelo superestima
ou subestima a incidência do evento que pretende predizer,
devemos avaliar sua calibração. Fazemos essa avaliação
comparando a taxa de eventos predita pelo modelo e a obser-
vada no estudo em uma mesma população. Podemos dividir
a população em grupos de acordo com o risco predito de
eventos e aplicar o Teste de Hosmer-Lemeshow para avaliar
calibração.

REFERÊNCIAS

ARAUJO, Andre B.; HALL, Susan A.; GANZ, Peter; CHIU, Gretchen
R.; ROSEN, Raymond C.; KUPELIAN, Varant; TRAVISON, Thomas
G.; MCKINLAY, John B.. Does Erectile Dysfunction Contribute to
Cardiovascular Disease Risk Prediction Beyond the Framingham
Risk Score? Journal Of The American College Of Cardiology, [s.l.], v.
55, n. 4, p. 350-356, jan. 2010. Elsevier BV. http://dx.doi.org/10.1016/j.
jacc.2009.08.058.

BRAGA, Gabriel Pereira. Avaliação crítica de estudo prognóstico. In:


REGINA EL DIB (São Paulo) (org.). Guia de Medicina baseada em
evidências. São Paulo: Cultura Acadêmica, 2014. Cap. 7. p. 33-35.

E.RUDY, Thomas; BOSTON, John Robert; KUBINSKI, John A..


Multivariate analysis and repeated measurements: A primer. Journal
Of Critical Care. Pittsburgh, p. 30-41. mar. 1992. Disponível em:
https://doi.org/10.1016/0883-9441(92)90006-S. Acesso em: 23 fev. 2004.

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 341


Melgaard, L., Gorst-Rasmussen, A., Lane, D. A., Rasmussen, L. H.,
Larsen, T. B., & Lip, G. Y. H. (2015). Assessment of the CHA2DS2-VASc
Score in Predicting Ischemic Stroke, Thromboembolism, and Death in
Patients With Heart Failure With and Without Atrial Fibrillation. JAMA,
314(10), 1030. doi:10.1001/jama.2015.10725

MELGAARD, Line; GORST-RASMUSSEN, Anders; LANE, Deirdre


A.; RASMUSSEN, Lars Hvilsted; LARSEN, Torben Bjerregaard; LIP,
Gregory Y. H.. Assessment of the CHA2DS2-VASc Score in Predicting
Ischemic Stroke, Thromboembolism, and Death in Patients With Heart
Failure With and Without Atrial Fibrillation. Jama, [s.l.], v. 314, n. 10, p.
1030, 8 set. 2015. American Medical Association (AMA). http://dx.doi.
org/10.1001/jama.2015.10725.

MOONS, Karel Gm. Prognosis and prognostic research: what, why,


and how? The Bmj. Londres, p. 338. 23 fev. 2009. Disponível em:
https://doi.org/10.1136/bmj.b375. Acesso em: 23 fev. 2009.

MORENO, R. P. METNITZ, P. G. ALMEIDA, E. et al. SAPS 3--From


evaluation of the patient to evaluation of the intensive care unit.
Part 2: Development of a prognostic model for hospital mortality
at ICU admission [published correction appears in Intensive Care
Med. 2006 May;32(5):796]. Intensive Care Med. 2005;31(10):1345-1355.
doi:10.1007/s00134-005-2763-5. PubMed. https://pubmed.ncbi.nlm.nih.
gov/16132892/

OUDEGA, R. HOES, A. W. MOONS, K. G. The Wells rule does


not adequately rule out deep venous thrombosis in primary care
patients. Ann Intern Med. 2005;143:100-7. PubMed. https://www.ncbi.
nlm.nih.gov/pubmed/16027451

PENCINA, Michael J.; AGOSTINO, Ralph B. D’; AGOSTINO, Ralph B.


D’; VASAN, Ramachandran S.. Evaluating the added predictive ability
of a new marker: from area under the roc curve to reclassification

342 DESCOMPLICANDO MBE


and beyond. : From area under the ROC curve to reclassification and
beyond. Statistics In Medicine, [s.l.], v. 27, n. 2, p. 157-172, 2007. Wiley.
http://dx.doi.org/10.1002/sim.2929.

PENCINA, Michael J.; D’AGOSTINO, Ralph B.; PENCINA, Karol


M.; JANSSENS, A. Cecile J. W.; GREENLAND, Philip. Interpreting
Incremental Value of Markers Added to Risk Prediction Models.
American Journal Of Epidemiology, [s.l.], v. 176, n. 6, p. 473-481, 8 ago.
2012. Oxford University Press (OUP). http://dx.doi.org/10.1093/aje/
kws207.

PENCINA, Michael J.; D’AGOSTINO, Ralph B.. Evaluating


Discrimination of Risk Prediction Models. Jama, [s.l.], v. 314, n. 10, p.
1063, 8 set. 2015. American Medical Association (AMA). http://dx.doi.
org/10.1001/jama.2015.11082.

RILEY, Richard D. ENSOR, Joie. SNELL, Kym I. E. et al. External


validation of clinical prediction models using big datasets from
e-health records or IPD meta-analysis: opportunities and challenges
BMJ 2016; 353 :i3140. BMJ. https://www.bmj.com/content/353/bmj.i3140

SNELL, K.I. HUA, H. DEBRAY, T.P. et al. Multivariate meta-analysis


of individual participant data helped externally validate the perfor-
mance and implementation of a prediction model. J Clin Epidemiol.
2016; 69:40-50. doi:10.1016/j.jclinepi.2015.05.009. PubMed. https://pub-
med.ncbi.nlm.nih.gov/26142114/

ESTATÍSTICA APLICADA A ESTUDOS PROGNÓSTICOS 343


SCREENING E
OVERDIAGNOSIS

24 Breno C C Simas
Ferdinand Saraiva Maia

INTRODUÇÃO

V
emos em campanhas anuais e programas
governamentais a promoção de medidas que
possibilitam o diagnóstico precoce de diversas
doenças em indivíduos saudáveis: a alguns meses foram atri-
buídas cores que representam campanhas para diagnóstico
precoce de câncer (“outubro rosa” para o câncer de mama,
“novembro azul” para o câncer de próstata); pacientes recém-
-nascidos fazem testes de triagem neonatal para diagnóstico
precoce de doenças graves; indivíduos assintomáticos são
submetidos a testes de estresse para diagnóstico de doença
arterial coronariana.

345
Mas o que justifica recomendar um teste para diagnos-
ticar uma doença em quem nada sente? Neste capítulo iremos
discutir os aspectos centrais para a recomendação de testes de
rastreio e suas potenciais consequências – benefícios e danos.

O QUE É SCREENING?

Screening ou rastreamento é a realização de testes


diagnósticos para identificação de doenças em pessoas
assintomáticas. Estamos familiarizados com esse conceito
no contexto do screening de neoplasias – que faz parte do
“check-up” de muitos adultos saudáveis. No entanto, é impor-
tante perceber que práticas de screening são realizadas na
atualidade desde o nascimento. São exemplos os programas
de triagem neonatal, como a triagem metabólica e o teste
da oximetria (popularmente chamados respectivamente de
"teste do pezinho" e "teste do coraçãozinho"), etc.
Durante a avaliação clínica de pacientes assintomáticos,
realizamos testes para detectar fatores de risco: ao aferir
pressão arterial para detectar hipertensão, ou solicitar exames
para pesquisar hipercolesterolemia, também estamos reali-
zando screening. O rastreio de condições prevalentes através
de testes de baixo custo pode vir a beneficiar pacientes se
o tratamento para essas condições for eficaz. Ao detectar
fenilcetonúria em um recém-nascido, oferecemos tratamento
que pode salvar sua vida e reduzir substancialmente a mor-
bidade associada a essa condição.
Por outro lado, é importante considerar que testes
diagnósticos não são livres de riscos e danos não-intencio-
nais, e, ao indicá-los, devemos considerar os efeitos adversos
provocados pela indicação do teste e seus desdobramentos.

346 DESCOMPLICANDO MBE


A PERFORMANCE DE TESTES DIAGNÓSTICOS
EM INDIVÍDUOS ASSINTOMÁTICOS

As medidas de acurácia para testes diagnósticos –


sensibilidade, especificidade e razões de verossimilhança
– foram abordadas em capítulos específicos do Módulo 3. É
importante estudar esses capítulos para ter uma compreensão
mais aprofundada sobre as medidas de acurácia.
Brevemente, uma das limitações que deve ser conside-
rada ao indicar um teste de rastreio é a baixa probabilidade
pré-teste de doença. Ao aplicar um teste em indivíduos assin-
tomáticos, a probabilidade pré-teste da doença é equivalente à
prevalência da doença na parcela da população que compar-
tilha as características (gênero, idade, raça, etc) do indivíduo.
Lembrando dos conceitos de acurácia: em caso de teste
positivo, o valor preditivo positivo do teste será reflexo da
interação entre a probabilidade pré-teste de doença e a razão
de verossimilhança positiva.
Vamos tentar entender melhor essa discussão com
um exemplo: vamos imaginar uma paciente de 50 anos que
deseja iniciar screening para câncer de mama realizando
mamografia. Dados americanos do National Institute of
Health (https://seer.cancer.gov/archive/csr/1975_2015/) colo-
cam que, para faixa etária da paciente, a prevalência dessa
neoplasia é de 2,5% (nossa probabilidade pré-teste).
Um estudo avaliando a acurácia da mamografia para
diagnóstico de câncer de mama definiu sua sensibilidade
como 87% e sua especificidade como 98%. Dessa forma, uma
mamografia positiva iria nos deixar com um valor preditivo
de cerca de 52% (Figura 1).

SCREENING E OVERDIAGNOSIS 347


Figura 1 – Nomograma de Fagan: na linha da esquerda
temos a probabilidade pré-teste e na linha intermediária
a razão de verossimilhança (positiva em azul, negativa
em vermelho). Ao traçar uma reta da probabilidade
pré-teste passando pela razão de verossimilhança
positiva (em azul), chegamos no valor preditivo positivo
na linha da direita. A reta vermelha representa o
resultado que seria obtido caso o teste fosse negativo

348 DESCOMPLICANDO MBE


Veja que temos uma probabilidade de doença em
torno de 50%... Isso significa que o teste positivo não fecha
a questão, pode ter sido um falso positivo! De fato, uma
revisão sistemática publicada no JAMA avaliando os efeitos
do rastreio de câncer de mama sinaliza um risco individual
de 39,8% para uma mulher que faz rastreio a cada dois anos
receber um resultado falso positivo em 10 anos de rastreio.
Assim, devemos ter cautela ao interpretar o resultado
de testes de rastreio em pacientes assintomáticos, e em muitos
casos iremos precisar de testes confirmatórios, habitualmente
mais invasivos. Devemos também utilizar essas informações
para discutir com nossos pacientes o rendimento dos testes,
pois o resultado falso positivo de um teste pode ser danoso
para o paciente.

CABEÇA PENSANTE 1

Veja que um teste com razão de verossimilhança positiva de 34


é excelente! Não devemos interpretar esse resultado do valor
preditivo como reflexo do teste ser ruim… Pelo contrário! O teste
é muito bom! Acontece que como partimos de uma probabilidade
pré-teste baixa, é difícil fechar o diagnóstico ao positivar um
teste, ainda que ele seja bom.

COMO EU DETERMINO SE O SCREENING


PODE OFERECER BENEFÍCIO?

É possível que inicialmente nosso pensamento seja de


que se o resultado é verdadeiro positivo, nosso paciente irá
se beneficiar. Porém, não é tão simples assim… Atrelado a
todo teste diagnóstico existem riscos:

SCREENING E OVERDIAGNOSIS 349


Por isso, a demonstração de benefício de estratégias de
screening idealmente deve ser feita através da condução de
ensaios clínicos randomizados. Neles, parte da população será
submetida a screening, e parte irá manter a assistência usual.
A comparação de desfechos clínicos no longo prazo irá
definir se há benefício em realizar testes de rastreio. É impor-
tante considerar que, para que o rastreio seja recomendado,
deve ser observada redução de mortalidade – idealmente
mortalidade total, e não apenas mortalidade relacionada à
doença que o teste investiga.
Um bom exemplo disso vem do rastreio de Doença
Arterial Coronariana em indivíduos assintomáticos com
diagnóstico de Diabetes Mellitus. Uma série de estudos que
avaliaram se haveria benefício em diagnosticar coronariopatia
subclínica nessa população foi sumarizada em uma revisão
sistemática e metanálise envolvendo mais de 3000 pacientes.
Foram avaliados diferentes exames diagnósticos em cada
um desses estudos, e em todos eles – bem como na medida
sumária da metanálise – não houve diferença em termos
de mortalidade.

RESULTADOS VERDADEIRO-POSITIVOS
NO SCREENING NÃO GARANTEM
BENEFÍCIO AO MEU PACIENTE

Mesmo que eu vá submeter o meu paciente a um teste


que foi avaliado em ensaios clínicos randomizados e se
mostrou eficaz para redução de mortalidade total, pode ser
que os resultados não sejam aplicáveis ao meu paciente

350 DESCOMPLICANDO MBE


Vamos pensar no exemplo agora de um homem de
55 anos, saudável e assintomático que resolve se submeter
a screening para câncer colorretal através da realização de
colonoscopia. De fato, o rastreio de câncer colorretal é reco-
mendado com alto nível de evidência e está associado a um
ganho significativo de anos de vida, e é recomendado para
esta faixa etária.
Porém, se nosso paciente de 55 anos não for hígido,
e tiver doenças graves – Insuficiência Cardíaca em estágio
avançado ou Doença Renal em Estágio Final, em hemodiá-
lise – talvez não faça sentido submetê-lo a screening pois sua
expectativa de vida é curta, e provavelmente este paciente
não viverá tempo suficiente para se beneficiar do tratamento.
Pacientes assintomáticos muito idosos ou com expectativa de
vida limitada também podem não se beneficiar do rastreio,
pois há uma probabilidade razoável de nunca se tornarem
sintomáticos e morrerem por outras causas
A expectativa de vida deve ser considerada diante
de um resultado positivo, pois ainda que o screening possa
oferecer benefício em estudos prospectivos randomizados,
não há garantia de que nosso paciente seja contemplado.
Portanto, devemos considerar o benefício individual que
pode ser oferecido ao paciente através do tratamento para
então tomar a decisão de indicar o rastreio.

MAS O QUE É OVERDIAGNOSIS?

Overdiagnosis é a realização de um diagnóstico cor-


reto, porém desnecessário para o paciente. Um exemplo
ilustrativo vem de um Ensaio Clínico Randomizado que
avaliou a complementação de mamografia com uso de

SCREENING E OVERDIAGNOSIS 351


ressonância magnética em mulheres com mamas densas.
Esse estudo demonstrou que as mulheres que realizavam a
ressonância além da mamografia tinham menos neoplasias
diagnosticadas no intervalo entre a data do primeiro exame
e a data para o exame subsequente. Logo, podemos pensar
que ressonância é uma ideia interessante nessas pacientes.
(N Engl J Med 2019; 381:2091-2102)
Vamos entender melhor… As mulheres faziam a mamo-
grafia, o resultado era negativo para neoplasia, e então elas
entravam no estudo e realizavam uma Ressonância da Mama.
Na entrada, foi detectada uma neoplasia que a mamografia
deixou passar em 9.8 a cada 1000 mulheres do grupo da
ressonância. As mulheres foram então acompanhadas até a
próxima mamografia (ou por dois anos se não fossem realizar
outra mamografia), e foi avaliado o número de neoplasias
detectadas nesse intervalo ENTRE os rastreios.
Foram encontradas 5 neoplasias a cada 1000 mulheres
no grupo que não fez ressonância, e 2.5 neoplasias a cada
1000 no grupo que fez (2.5/1000 a mais em quem não fez
ressonância). Depois, na mamografia de rastreio subsequente,
foram encontradas 4.1 neoplasias a cada 1000 no grupo da
ressonância e 6.0 no grupo controle (1.9/1000 a mais em
quem não fez ressonância). Conclusão: acho mais câncer
na ressonância inicial e menos câncer no intervalo e na
mamografia subsequente.
Mas vamos fazer algumas contas: no grupo de interven-
ção eu detectei 9.8/1000 na ressonância, 2.5/1000 no intervalo
e 4.1/1000 na mamografia seguinte, isso dá um total de 16.4
neoplasias por mil. No grupo controle, eu detectei 5/1000 no
intervalo e 6.1/1000 na mamografia seguinte, isso dá 11.0. Ou

352 DESCOMPLICANDO MBE


seja, são 5.4/1000 neoplasias a mais no grupo da ressonância,
que foram detectadas no início do estudo!!!
E cadê essas neoplasias? Temos 5.4 neoplasias a mais
no grupo da ressonância que não apareceram no grupo
controle, mas como pode? Uma explicação plausível é que
esses tumores podem ter ido embora! A história natural de
algumas neoplasias é de regressão espontânea, então uma
possível explicação é de que essas neoplasias jamais seriam
detectadas.
Pensando nessas mulheres que foram diagnosticadas
com neoplasias que iriam regredir espontaneamente: elas
certamente não foram beneficiadas! Nunca teriam sintomas
nem tomariam conhecimento do câncer. Porém, em virtude
do diagnóstico, tiveram que se submeter ao tratamento cirúr-
gico, e eventualmente à quimioterapia e radioterapia, que
não são livres de efeitos adversos – dando origem ao conceito
de overtreatment, uma consequência do overdiagnosis em que
o paciente recebe um tratamento que não seria necessário.
E às vezes, não é que o tumor vá “sumir”. É que ele tem
um comportamento tão indolente que o paciente passaria o
resto da vida com ele sem nunca sentir nada. Mas nós não
sabemos quem são esses pacientes, e alguns que estariam
nessa situação serão prejudicados pelo rastreio. Estudos
de autópsia sinalizam que mais da metade dos homens
de 60 anos que morrem por causas diversas apresentavam
câncer de próstata. Provavelmente, a maioria deles iria ser
carregada como uma doença crônica indolente, e não como
uma neoplasia agressiva.

SCREENING E OVERDIAGNOSIS 353


CABEÇA PENSANTE

Veja que overdiagnosis se refere ao diagnóstico CORRETO, e não


ao falso positivo. Só que é um diagnóstico correto que não vai
ter nenhum valor para meu paciente. De forma análoga, temos o
conceito de overtreatment, que se refere ao tratamento “correto”
pela indicação, mas desnecessário.

AFINAL, QUANDO DEVO FAZER SCREENING?

Por fim, quando estamos diante de um paciente que


consideramos elegível para realização de rastreio, vamos
nos perguntar se vale a pena fazê-lo. Após considerar todos
os fatores que já citamos, precisamos sumarizar as evidên-
cias para cada tipo de screening e avaliar se, para o nosso
paciente em questão, o rastreio que estamos considerando
vai oferecer um benefício potencial maior do que o risco de
danos não-intencionais.
Temos várias fontes disponíveis que emitem posiciona-
mentos a respeito da possibilidade de screening, inclusive as
sociedades de especialistas de cada área, em suas diretrizes
de práticas clínicas.
Dentre as possíveis referências, vale a pena destacar
a U.S. Preventive Services Task Force (USPSTF), um painel
de especialistas em medicina preventiva e em Medicina
Baseada em Evidências que conduz revisões sistemáticas e
metanálises para definir o nível de evidência de diferentes
estratégias de screening. A partir dessas revisões, o grupo
emite recomendações acerca da realização ou não de rastreios

354 DESCOMPLICANDO MBE


de acordo com as características dos pacientes e dos resultados
dos estudos analisados.
A USPSTF utiliza um sistema para graduar as recomen-
dações de A a D: A e B indicam posicionamento favorável
à intervenção com diferentes níveis de evidência; C indica
um posicionamento de oferecer o procedimento dependendo
de circunstâncias individuais; D indica um posicionamento
contrário à realização do procedimento. Há também o grade
I, que indica que a evidência é insuficiente para emitir uma
recomendação.

CONCLUSÃO

Screening é a realização de testes em indivíduos assin-


tomáticos para detectar precocemente doenças que podem
levar a desfechos adversos. A decisão de oferecer screening
a um paciente deve ser orientada pela evidência científica,
idealmente de ensaios clínicos randomizados. Características
individuais, expectativa de vida e valores e preferências do
paciente devem orientar a decisão de oferecer tratamento.
A realização de testes de rastreio em pacientes assin-
tomáticos tem consequências: resultados falso-negativos
e alguns diagnósticos em excesso de doenças que jamais
iriam provocar sintomas. O segundo fenômeno é conhecido
como overdiagnosis e pode levar à aplicação de tratamentos
desnecessários – conceito de overtreatment. Esse risco deve
fazer parte da ponderação de riscos e benefícios.
Posicionamentos de entidades de especialistas, como
a U.S. Preventive Services Task Force podem (e devem) ser
utilizados para guiar a decisão clínica de oferecer e submeter

SCREENING E OVERDIAGNOSIS 355


um paciente elegível a um determinado procedimento de
rastreio.

REFERÊNCIAS

AUTIER, Philippe. Personalised and risk based cancer screening. Bmj,


[S.L.], p. 5558-5559, 2 out. 2019. BMJ. http://dx.doi.org/10.1136/bmj.l5558.

CARTER, J. L.; COLETTI, R. J.; HARRIS, R. P.. Quantifying and


monitoring overdiagnosis in cancer screening: a systematic review of
methods. Bmj, [S.L.], v. 350, n. 075, p. 7773-7791, 7 jan. 2015. BMJ. http://
dx.doi.org/10.1136/bmj.g7773.

ALBA, Ana Carolina; AGORITSAS, Thomas; WALSH, Michael;


HANNA, Steven; IORIO, Alfonso; DEVEREAUX, P. J.; MCGINN,
Thomas; GUYATT, Gordon. Discrimination and Calibration of Clinical
Prediction Models. Jama, [S.L.], v. 318, n. 14, p. 1377-1385, 10 out. 2017.
American Medical Association (AMA). http://dx.doi.org/10.1001/
jama.2017.12126.

ARMSTRONG, April W.; READ, Charlotte. Pathophysiology, Clinical


Presentation, and Treatment of Psoriasis. Jama, [S.L.], v. 323, n. 19, p.
1945-1961, 19 maio 2020. American Medical Association (AMA). http://
dx.doi.org/10.1001/jama.2020.4006.

HOFFMANN, Tammy C.; MAR, Chris del. Clinicians’ Expectations


of the Benefits and Harms of Treatments, Screening, and Tests.
Jama Internal Medicine, [S.L.], v. 177, n. 3, p. 407-420, 1 mar. 2017.
American Medical Association (AMA). http://dx.doi.org/10.1001/
jamainternmed.2016.8254.

ELMORE, Joann G.. Solving the Problem of Overdiagnosis. New


England Journal Of Medicine, [S.L.], v. 375, n. 15, p. 1483-1486, 13

356 DESCOMPLICANDO MBE


out. 2016. Massachusetts Medical Society. http://dx.doi.org/10.1056/
nejme1608683.

ROSENBAUM, Lisa. The Less-Is-More Crusade — Are We


Overmedicalizing or Oversimplifying? New England Journal Of
Medicine, [S.L.], v. 377, n. 24, p. 2392-2397, 14 dez. 2017. Massachusetts
Medical Society. http://dx.doi.org/10.1056/nejmms1713248.

EIJNSDIJK, Eveline A.M.; WEVER, Elisabeth M.; AUVINEN,


Anssi; HUGOSSON, Jonas; CIATTO, Stefano; NELEN, Vera;
KWIATKOWSKI, Maciej; VILLERS, Arnauld; PÁEZ, Alvaro; MOSS,
Sue M.. Quality-of-Life Effects of Prostate-Specific Antigen Screening.
New England Journal Of Medicine, [S.L.], v. 367, n. 7, p. 595-605, 16
ago. 2012. Massachusetts Medical Society. http://dx.doi.org/10.1056/
nejmoa1201637.

WELCH, H. Gilbert; PROROK, Philip C.; O’MALLEY, A. James;


KRAMER, Barnett S.. Breast-Cancer Tumor Size, Overdiagnosis, and
Mammography Screening Effectiveness. New England Journal Of
Medicine, [S.L.], v. 375, n. 15, p. 1438-1447, 13 out. 2016. Massachusetts
Medical Society. http://dx.doi.org/10.1056/nejmoa1600249.

WELCH, H. Gilbert; KRAMER, Barnett S.; BLACK, William C..


Epidemiologic Signatures in Cancer. New England Journal Of
Medicine, [S.L.], v. 381, n. 14, p. 1378-1386, 3 out. 2019. Massachusetts
Medical Society. http://dx.doi.org/10.1056/nejmsr1905447.

SCREENING E OVERDIAGNOSIS 357


MÓDULO 5
O ARTIGO
CIENTÍFICO

25 Beatriz Aguiar da Silva Carvalho


Elaine Lira Medeiros Bezerra
Henrique de Paula Bedaque

O QUE É ARTIGO CIENTÍFICO?

D
esde o início século XXI que os artigos cientí-
ficos ganharam destaque como importantes
ferramentas de disseminação de informação.
As descobertas científicas – seja da área da saúde ou não –
estão há muitos anos ao nosso redor e a disseminação dessas
informações são sempre alvo de grande discussão. Afinal,
de que adianta uma grande descoberta, se esta não puder
ser compartilhada?
O objetivo deste manual é capacitar o leitor para melhor
interpretar e analisar de forma crítica artigos científicos.
E, assim, criar uma maneira de sistematizar a leitura de
artigos, otimizando a busca de informações essenciais para

361
a compreensão e a identificação de fontes fidedignas para
estudo.
O artigo científico é uma síntese escrita dos resultados
obtidos por uma investigação sobre determinado tema cuja
divulgação para a população ocorre, geralmente, através
de publicações em periódicos especializados. O objetivo
principal é ser um meio rápido e resumido de divulgação,
apresentando o referencial teórico, a metodologia, discutindo
a implicância dos resultados e as principais dificuldades
encontradas no processo de investigação.
Nesse contexto, os artigos científicos se apresentam
como verdadeiros relatórios que buscam expor algum tipo de
descoberta a leitores interessados e, além disso, provar como
os autores conseguiram chegar a seus resultados. Qual é a
importância disso? Por que simplesmente não informamos
apenas os resultados? Por que temos que dedicar tanto tempo
para metodologia e discussão?
Nos artigos nada é arbitrário: a dedicação de pági-
nas para referencial teórico, metodologia e discussão torna
transparente e fiel a pesquisa realizada e, sobretudo, abre
precedente para que outros possam realizar trabalho seme-
lhante – replicabilidade – com o propósito de juntar forças e
aumentar a evidência sobre determinado assunto. Além disso,
na discussão compara-se os resultados com outras pesquisas,
contrárias ou a favor, o que colabora para a construção de
um ambiente mais reflexivo e crítico, algo essencial para a
formação de uma opinião nos dias atuais.

362 DESCOMPLICANDO MBE


CABEÇA PENSANTE 40

Por exemplo, quanto maior o número de pesquisas sobre um mesmo


medicamento maior fica sua evidência (importância científica),
pois melhores análises estatísticas são possíveis decorrentes de
melhores revisões sistemáticas e metanálises. Quanto maior o
número de pesquisas sobre um mesmo medicamento, mais seguras
são as informações que indicam ou contraindicam seu uso.

Um artigo científico não é simplesmente um ambiente


de resultados, mas um relato sucinto – mas completo – sobre
os processos para a realização de uma descoberta e uma
discussão sobre o próprio tema, com um ou mais pontos
de conclusão.

CABEÇA PENSANTE 41

É válido lembrar que uma conclusão pode ser inconclusiva! Isto é,


um artigo pode escrever em sua conclusão que seus dados foram
incapazes de fornecer evidência significativa sobre algo. Você
verá adiante que, na bioestatística, essa é uma possibilidade real
(chamamos de efeito “tanto faz”).

Atualmente, posicionados em um mundo altamente


globalizado e integrado com a internet os artigos científicos
ganharam ainda mais destaque por se mostrar com uma
velocidade de disseminação muito maior que livros e con-
gressos. Isso ocorre, pois uma pesquisa terminada em 2017
pode ser publicada semanas após seu término, enquanto
que para estar em um livro levará alguns anos.

O artigo Científico 363


O que vemos na atualidade, portanto, é o crescimento
da importância e do uso dos artigos científicos como ferra-
mentas de ensino-aprendizagem e, por isso, o desenvolvi-
mento de habilidades de leitura de artigos vem ganhando
força e relevância. A seguir, passaremos a discutir cada item
do artigo científico de forma individualizada, que consiste
em: Resumo, Introdução, Metodologia, Resultados, Discussão,
Conclusão, Referências e Apêndice.

RESUMO

Nessa etapa temos sim a importante tarefa de conden-


sar informações relevantes da pesquisa, pois será a “porta de
entrada” do leitor ao texto. Todavia, o resumo é, na verdade,
muito mais do que uma síntese: ele é a verdadeira propa-
ganda do artigo! Muito além de apenas informar em forma
de síntese o conteúdo do artigo, o resumo deve convencer
os leitores de que vale a pena dedicar tempo para a leitura
completa do texto produzido.
Assim, o foco do resumo não está em contar detalhes,
mas em mostrar que as descobertas desta pesquisa são rele-
vantes. É comum, então, que resultados estatísticos mais
importantes e/ou impactantes sejam escolhidos, bem como,
que a conclusão seja direta e efetiva na demonstração dos
desfechos.
Ademais, além do resumo ter um grande papel na
publicidade do artigo, não podemos esquecer sua caracte-
rística de organização metodológica, de modo a ser muito
importante que resumos respondam de forma organizada
e cronológica às seguintes perguntas:

364 DESCOMPLICANDO MBE


1. Por que essa pesquisa é importante?
2. Como essa pesquisa foi realizada?
3. O que foi encontrado com a pesquisa?
4. O que os resultados da pesquisa sugerem?
Essas perguntas podem ser respondidas em diferentes
tópicos os quais vão mudar a depender da revista ou base
de dados em que se procura. Por exemplo, a revista JAMA
(Journal of American Medical Association) responde ao segundo
questionamento utilizando três tópicos em seu resumo:
2) Como essa pesquisa foi realizada?
Design, setting and participants
Expousure
Main outcome and measures
Como outro exemplo, a revista NEJM (New England
Journal of Medicine) responde à mesma pergunta utilizando
apenas um tópico:
2) Como essa pesquisa foi realizada?
Methods

CABEÇA PENSANTE 42

Recomendamos a leitura de um resumo do JAMA e outro do NEJM


para perceber que há diferentes formas de transmitir uma mesma
informação. Às vezes, prefere-se dividir a informação em diferentes
tópicos para torná-la mais compreensível ou, então, cria-se um
único tópico, abordando-o de forma mais direta.

O artigo Científico 365


Se cada resumo tem suas peculiaridades como posso
sistematizar minha leitura? Quais são as informações que
não posso deixar de saber? A resposta das 4 perguntas
previamente apresentadas é justamente o essencial a ser
identificado após a leitura do resumo:
1) Por que essa pesquisa é importante?
O autor deve atrair a atenção dos leitores para a rele-
vância do artigo. Não é relevância da pesquisa propriamente
dita, e sim do tema que ela envolve. Por exemplo, se estamos
pesquisando uma medicação para tratar diabetes, essa per-
gunta não será respondida apenas citando a medicação – é
preciso abordar, nesse exemplo, a relevância do diabetes
para a saúde pública.
O foco aqui é na relevância do tema da pesquisa.
2) Como essa pesquisa foi realizada?
Devem ser fornecidas informações básicas sobre como a
pesquisa foi realizada: qual o tipo de estudo, a população alvo
e os desfechos escolhidos para serem avaliados. Certamente
nem todas as informações serão apresentadas, mas a leitura
completa da metodologia do artigo deve esclarecer em mais
detalhes.
3) O que foi encontrado com a pesquisa?
São expostas algumas descobertas da pesquisa, nor-
malmente acompanhadas de um pouco de bioestatística e
se limitando às informações mais pertinentes. Os resultados
não devem estar todos abordados no resumo, apenas aqueles
de grande relevância e impacto para o leitor, levando à busca
do texto completo para maior detalhamento.

366 DESCOMPLICANDO MBE


4) O que os resultados da pesquisa sugerem?
O resumo deve conter breves comentários, sem longas
discussões, sobre as conclusões que foram construídos pelos
autores após a realização da pesquisa e discussão com a
literatura atual, de forma direta.
Se na leitura de um resumo formos capazes de respon-
der às quatro perguntas, estaremos realizando uma leitura
breve, sucinta e objetiva das informações necessárias para
a compreensão e reflexão sobre a utilidade dessa pesquisa
para suas condutas, indicando a leitura completa desse artigo.

INTRODUÇÃO

Iniciamos agora a leitura da Introdução, a qual tem o


objetivo de preparar o leitor sobre o assunto que será abor-
dado ao longo do artigo. Isto é, na introdução, o autor irá te
fornecer informações sobre o tema de modo a proporcionar
um ambiente em que você perceba a importância do estudo.
Existem três perguntas norteadoras que irão facilitar
a nossa busca por informações essenciais:
1) Sobre o que estou falando?
2) Por que isso é importante?
3) O que pode mudar com isso?
Vamos comentar um pouco sobre cada pergunta para
melhor compreensão:
1) Sobre o que estou falando?
Para responder a essa pergunta o autor irá fornecer
informações sobre o tema, por exemplo: se é uma pesquisa

O artigo Científico 367


sobre Hipertensão Arterial Sistêmica (HAS) teremos algumas
informações sobre incidência, fatores de risco e complicações
do inadequado controle dessa doença. O interessante é notar
que essas informações não são oferecidas de forma aleatória,
mas muito bem escolhidas como uma forma de se tornar
argumento favorável a pergunta número 2.
2) Por que isso é importante?
A divisão das perguntas 1 e 2 é feita para melhor
compreensão, mas elas se tornam uma só: as informações
escolhidas e fornecidas sobre a temática do artigo se tornam
argumentos favoráveis à pesquisa. Por exemplo, ao falar do
grande número de pessoas com HAS temos um argumento
favorável a estudos que tentem melhorar a qualidade de vida
desses doentes crônicos ou para tratamento de complicações.
Dessa forma, as informações escolhidas tem uma ver-
dadeira função de valorizar a pesquisa, pois mostra a sua
importância e relevância para o tema específico.
3) O que pode mudar com isso?
Por fim, a última pergunta também está diretamente
ligada com as duas demais, pois vamos agora mostrar diante
da relevância mostrada do tema qual seriam os objetivos
da pesquisa e como seus resultados e conclusões poderiam
mudar condutas para esse público alvo da pesquisa. De
modo simples poderíamos compreender a estruturação da
introdução de outra forma:
A) Informar sobre o tema abordado
B) Informar a importância do tema
C) Informar a importância da pesquisa

368 DESCOMPLICANDO MBE


Assim, fica fácil perceber as etapas formadoras da
introdução e direcionar a sua leitura para a obtenção, de
forma mais direta, das informações nelas contidas.

CABEÇA PENSANTE 43

De forma semelhante ao resumo, a introdução também pode ter


uma grande variação de estilo e formato, mas continua tentando
responder a essas três perguntas-chave.

Após entender um pouco sobre a introdução, é válido


comentar um pouco sobre algumas tendências atuais na
construção desse tópico. Vamos lá!
Era muito comum a dedicação de até duas páginas para
uma introdução, o que tornava esse tópico muito completo,
contendo uma verdadeira revisão da literatura sobre o tema
abordado. Esse estilo de construção de introdução é muito
interessante, principalmente, quando estamos tratando de,
por exemplo, doenças raras, já que uma revisão da literatura é
muito proveitosa para relembrar ou se atualizar sobre o tema.
Entretanto, o que vemos atualmente é uma mudança
nesse estilo, isto é, a tendência atual é a de construção de
introduções menores que não vão fazer revisões da literatura,
mas, ainda sim, serão capazes de responder às três perguntas
norteadoras.

CABEÇA PENSANTE 44

Na realidade, o que encontramos é: menos “revisão da literatura”


e foco maior em responder às três perguntas norteadoras de
forma mais direta e objetiva.

O artigo Científico 369


Então, de acordo com essa nova tendência, o autor
tende a escolher referências mais consagradas e famosas para
serem citadas na introdução – lembrando da objetividade na
resposta das três perguntas – já que essas referências seriam
consideradas mais relevantes.

CABEÇA PENSANTE 45

Importante informar que essa tendência não é uma contraindicação


ao uso de revisões da literatura em introduções, mas sim, apenas
direciona seu uso a situações mais pertinentes, como no caso de
doenças raras.

Dessa forma, com o estudo sistemático focado nas três


perguntas norteadoras, acreditamos que a leitura de uma
introdução fica mais direcionada e objetiva.

METODOLOGIA – ESTUDO QUANTITATIVO

Enquanto que para muitos a metodologia é o cérebro


por detrás de toda a pesquisa, outros consideram que ela
também seria o sangue que carrega para todos os luga-
res informação e regulação. O importante é notar que a
metodologia tem uma relevância destacada em todo artigo
científico, na realidade, foi graças à sua construção que se foi
possível crescer a ciência, pois possibilitou a replicabilidade
e sistematizou a forma de se pensar e testar hipóteses.

370 DESCOMPLICANDO MBE


CABEÇA PENSANTE 46

Somos acostumados a pensar nos resultados como a coisa mais


importante; entretanto, imagine um resultado vindo de uma
metodologia muito fraca, cheia de erros: será que ele é mesmo
relevante para a ciência?

A metodologia é um grande universo de possibilida-


des e informações, mas que tem uma pergunta norteadora
principal e essencial para qualquer leitor:
Como a pesquisa foi realizada?
Iremos comentar várias características importantes e
presentes em metodologias bem escritas; porém, é importante
reforçar que uma compreensão completa da metodologia
envolve o estudo sobre os diferentes tipos de estudos: ecoló-
gico, coorte, caso-controle, revisão sistemática e metanálise.
Esse conhecimento prévio é importante, pois várias
características comuns a esses tipos de pesquisas acabam
não sendo informadas na metodologia, já que se espera um
conhecimento básico do leitor sobre alguns fundamentos.

CABEÇA PENSANTE 47

A metodologia é um dos pontos mais técnicos de um artigo cientí-


fico, sugerindo a necessidade da formação de conhecimentos prévios
sobre alguns temas e isso acaba por afastar muitos leitores da
metodologia, mas lembre da sua vital importância e valorize a
metodologia.

O artigo Científico 371


CABEÇA PENSANTE 48

Por mais técnica que uma metodologia seja, com a compreensão


de alguns fundamentos e uma leitura cuidadosa desse tópico,
você será capaz de obter todas as informações necessárias para
seguir a leitura.

Vamos, então comentar sobre alguns fundamentos


essenciais para a compreensão da metodologia:
1) População
2) Agrupamento
3) Cegamento dos dados
4) Desfecho
5) Estatística
Comentaremos um pouco de cada um desses
fundamentos:
1) População estudada
Compreender a população envolvida na pesquisa
científica é de grande importância, principalmente, quando
falamos de saúde e de condutas, pois, por exemplo, uma
medicação estudada e comprovadamente efetiva em pessoas
acima de 18 anos não deve ser usada no ambiente pediátrico,
a menos que novos estudos contemplem essa faixa etária.
Desse modo, entender, por exemplo, a idade das pessoas
estudadas já serve de guia para pensar: para quais pessoas
essa pesquisa tem validade? Além da idade existem várias

372 DESCOMPLICANDO MBE


outras características determinantes no processo de entender
para quem essa pesquisa se direciona.
Nesse contexto, no processo de seleção de uma popu-
lação a um determinado estudo temos dois pontos a serem
estudados:
a) Critérios de inclusão
b) Critérios de exclusão
Vamos comentar um pouco de cada um:
Critérios de inclusão
Nesses critérios há uma definição das características
da população que estará dentro do estudo, como a idade, o sexo,
o local de acometimento e o diagnóstico de alguma doença
pré-existente. É na posse desses critérios (características)
que a pesquisa irá chamar voluntários.
Critérios de exclusão
Fica muito mais fácil entender os critérios de exclusão
ao perceber que eles são aplicados após a seleção dos volun-
tários que estão dentro dos critérios de inclusão; isto é, após
ter toda a população do estudo eu posso precisar retirar
alguns, vejamos um exemplo:
Um estudo com uma droga anti-hipertensiva quer estudar
pessoas de ambos os sexos, acima de 30 anos, com HAS. Após
conseguir 500 voluntários eles pedem um teste de gravidez de
todas as mulheres (pois não se sabe dos potenciais malefícios
da droga na gestação) e excluem todas as voluntárias grávidas.
Perceba que os critérios de exclusão só foram utilizados após
a seleção da população, ou seja, só se aplicam na população
já incluída.

O artigo Científico 373


Figura 1 – Demonstração dos critérios
de inclusão e exclusão

A Figura 1 melhora a noção sobre as diferenças entre


os critérios de inclusão e de exclusão: os critérios de inclusão
vão selecionar os voluntários aptos a participar da pesquisa,
enquanto os de exclusão vão retirar alguns voluntários da
pesquisa. Assim, você irá compreender o perfil dos volun-
tários da pesquisa.

CABEÇA PENSANTE 49

Imagine uma pesquisa que mostra uma medicação de grande


potencial de baixar a pressão arterial e com poucos efeitos
colaterais! Seria ótimo e você certamente gostaria de prescrever
a todos, mas, por exemplo, se você lesse os critérios de exclusão
e visse que ser diabético era um deles, você não recomendaria
sua utilização nesse grupo de pessoas.

374 DESCOMPLICANDO MBE


CABEÇA PENSANTE 50

Entender os dois tipos de critérios é saber para quais populações


alvo essa pesquisa teria valor (clínico, terapêutico e diagnóstico)
e isso é essencial para sua conduta.

2) Agrupamento
Nesse ponto, a metodologia descreve como foi feito
o processo de agrupamento da população estudada, que
inicialmente pode ser do tipo “não agrupado” ou do tipo
“agrupado”.
Quando um modelo de pesquisa é “não agrupado”,
estudamos apenas um único grupo populacional. Por exem-
plo, se quisermos conhecer a incidência de uma doença na
população, há apenas um grupo estudado (aqueles com a
doença) sobre a população não estudada (que poderia ser a
população brasileira).
De modo contrário, em um modelo com agrupamentos,
a população estudada se divide em outros grupos – dois ou
mais. Um estilo de estudo que facilita a nossa compreensão
seria o Ensaio Clínico, pois nessa situação teremos nossa
população alvo dividida em um grupo INTERVENÇÃO (que
irá sofrer a intervenção, com uso da medicação) e outro grupo
CONTROLE (que não irá sofrer a intervenção, com o uso de
placebo ou de uma terapia padrão de reconhecida eficácia).

O artigo Científico 375


CABEÇA PENSANTE 51

É importante ressaltar que uma INTERVENÇÃO pode ser diferentes


modos, como com uma medicação nova, uma nova técnica cirúrgica,
uma associação de medicamentos, um procedimento não invasivo
e uma psicoterapa.

Figura 2 – Agrupamento dos grupos em


grupo intervenção e grupo controle

No exemplo acima tivemos um agrupamento em dois


grupos (intervenção e controle), porém, poderíamos fazer
vários outros grupos, como placebo, dose normal da medica-
ção e dose dobrada da medicação. Existe uma diversidade de
possibilidades de agrupamentos e entender como se procedeu
esse formato de grupos e quais as características de cada
grupo acabam por se tornar dados preciosos para a melhor
compreensão da metodologia.

376 DESCOMPLICANDO MBE


Figura 3 – Agrupamentos da população estudada em
grupo de intervenção 01, intervenção 02 e controle

Contudo, é importante notar que para estudar bem


essa variável desejada, como o efeito da dose no tratamento,
é necessário que outras variáveis e características das popu-
lações de todos os agrupamentos estejam significativamente
semelhantes. Como assim? Vamos ver um exemplo mais
didático:
Um estudo quer avaliar o tempo de gripe de crianças que
usaram uma medicação X em dose plena e em dose dobrada,
em comparação com o placebo. Para isso ocorrer de forma
certa precisamos que todas as características dessas popu-
lações sejam iguais (por exemplo: idade média, percentual
de pessoas com doença crônica, percentual de crianças com
algum tipo de imunodeficiência).
Se, por exemplo, o grupo placebo tiver 50% da sua população
de crianças com algum tipo de imunodeficiência, enquanto
os outros dois grupos tiverem apenas 2%, certamente, essa
pesquisa será tendenciosa – já que, teoricamente, pessoas
com imunodeficiência teriam mais tempo de doença.

O artigo Científico 377


Dessa forma, para o estudo ter maior validade precisamos
fazer agrupamentos que sejam parecidos entre si, isso quer
dizer que todos os grupos devem ter porcentagens semelhantes
de imunodeficientes. Pareando essas e outras características
as poucas variáveis que irão ser alteradas serão aquelas que eu
desejo conhecer e que, no caso, é o tempo de gripe.

CABEÇA PENSANTE 52

Ao longo de sua jornada nas leituras de artigos científicos você verá


diversas tabelas que irão comparar diferentes características dos
vários agrupamentos possíveis, mostrando de forma clara que esses
grupos são significativamente semelhantes e sobrando a variável
desejada para ser medida (analisada).

Figura 4 – Esquema mostrando a importância


da similaridade entre os grupos estudados

Na imagem acima, representamos a ideia de que os


três grupos devem ter características semelhantes para que
a única variável diferente seja a da intervenção. Assim,

378 DESCOMPLICANDO MBE


retiramos um grande número de possíveis erros e influências
não relacionadas ao estudo em questão.

CABEÇA PENSANTE 53

Para comprovar que esses grupos são significativamente seme-


lhantes nos utilizamos da bioestatística para comparação.

3) Cegamento dos dados


É de extrema importância termos estudos considera-
dos duplo-cegos para se evitar vieses importantes e já bem
estabelecidos.
Assim, consideramos um estudo duplo-cego quando
nem os voluntários e nem os avaliadores sabem quais pacien-
tes estão no grupo intervenção ou controle.
Vamos imaginar uma situação para cada um dos tipos.
Inicialmente, para voluntários não “cegos”:
Imagine que um voluntário sabe que está em um grupo placebo
para o tratamento com uma medicação nova para dor de
cabeça. Provavelmente, ele irá ter pensamentos negativos
sobre seu tratamento, enquanto outro voluntário, que esteja
sabidamente no grupo intervenção, mesmo que com uma droga
ineficaz, provavelmente terá pensamentos mais positivos.
Ter pensamentos positivos e negativos altera os resultados?
Imagine que, quando o avaliador perguntar: “quão forte é sua
dor de cabeça?”, provavelmente, o voluntário com pensamentos
negativos aumentará sua sensação de dor e o de pensamentos
positivos diminuirá sua sensação de dor.

O artigo Científico 379


Desse modo, há uma grande interferência nos resultados da
pesquisa, sem que haja ação propriamente dita da medicação.

CABEÇA PENSANTE 54

O ideal, então, é fazer com que ambos pensem iguais (ou ambos
positivamente ou ambos negativamente). Dar placebo e não informar
a qual grupo o voluntário pertence faz com que todos pensem que
são grupo intervenção e todos tenham pensamentos positivos,
assim, diminuímos esse viés.

Já vimos que “cegar” os voluntários é essencial, agora,


vamos perceber a vantagem de cegar os avaliadores também:
Imagine o mesmo caso comparando uma droga nova para
dor de cabeça. Entretanto, ambos os voluntários estão cegos
e, provavelmente, acreditam estar no grupo intervenção.
Nessa situação, a diferença está no avaliador que irá fazer
as perguntas, pois ele sabe quem é de cada grupo.
Seja um pesquisador que passou a vida tentando achar uma
medicação melhor, ou um avaliador técnico preparado, temos
sempre a tendência em esperar que drogas melhorem os
sintomas do paciente, isto é, tendemos a valorizar o grupo
intervenção.
A pergunta será igual para ambos os voluntários (“quão forte
foi sua dor?”), porém, a forma de o avaliador lidar com o
paciente – desde o acolhimento até a saída – provavelmente,
será diferenciada em cada caso e, com o tempo, esses sinais
não verbais e verbais levarão a suspeita do paciente o qual, na
dúvida, pensará estar no grupo placebo, trará pensamentos
negativos e, assim, irá interferir no resultado real da pesquisa.

380 DESCOMPLICANDO MBE


CABEÇA PENSANTE 55

Existe muito mais por detrás das vantagens do duplo-cego em


comparação com a ciência dos avaliadores, mas o exemplo acima
tem o intuito de mostrar sua importância.

Figura 5 – Cegamento dos grupos

Percebemos que o estudo duplo-cego tem grandes


vantagens por diminuir vários riscos de viéses, e é muito
frequente encontrar estudos duplo-cegos em periódicos
atualmente, mostrando a grande importância dessa simples
característica. Veremos exemplos de cegamento:
Em uma pesquisa deseja-se saber se há diferença entre tratar
uma otite média aguda com um determinado antibiótico
por 7 ou 14 dias. Dessa forma, ambos os grupos deverão
receber 14 dias de terapia (sendo um comprimido por dia,
receberiam 14 comprimidos de igual forma e cor) para que
não haja suspeita dos voluntários.
Além disso, enquanto no grupo 14 dias todos os comprimidos
terão a fórmula ativa do antibiótico, no grupo 7 dias apenas
os 7 primeiros comprimidos terão a medicação, enquanto os 7
seguintes serão formados de placebo (farinha, polivitamínicos).
Assim, garantimos que nenhum grupo deduza a qual faz
parte, mantendo o cegamento.
Por fim, por parte dos avaliadores ele não deverão ter qualquer
relação com a randomização dos voluntários pelos grupos.

O artigo Científico 381


4) Desfecho
Antes de informar novamente sobre a importância de
conhecer o desfecho, vamos entender o que seria desfecho! A
melhor forma de entender, certamente, será com um exemplo:
Temos uma pesquisa que quer avaliar uma insulina que
promete causar menos hipoglicemia em seus usuários do
que a insulina regular.
Vamos pensar assim: para saber se essa insulina causa menos
hipoglicemia que a regular teremos que criar dois grupos
(agrupamentos): um que usa a nova insulina e outro que usa
a regular. Agora qual será a variável que irei utilizar para
comparar ambos os grupos?
O número de episódios de hipoglicemia que cada grupo teve!
Essa variável (número de episódios de hipoglicemia) é o
que chamamos de desfecho primário.
Desse modo, podemos simplificar em dizer que o des-
fecho primário seria a variável principal da minha pesquisa,
isto é, aquela que irá responder o questionamento que gerou
a pesquisa. Cabe ao desfecho primário o dever de fornecer
as informações necessárias para os resultados.

Figura 6 – Representação ilustrada de


desfecho primário e secundário

382 DESCOMPLICANDO MBE


Como a imagem acima mostra, o desfecho primário está
no início do vagão do trem. Em outras palavras, o primeiro
vagão é o mais importante e está representando aquela variá-
vel buscada para responder o questionamento. Entretanto, ao
notar bem a imagem perceberemos que também há desfechos
chamados de secundários. Como seria isso?
Voltemos ao caso da insulina para entender o desfecho
secundário:
Ao avaliar o número de episódios de hipoglicemia nos dois
grupos, identificamos que ambos os grupos apresentaram
um número igual de episódios, o que vai contra a ideia de
que essa nova insulina seria mais segura que a outra.
Entretanto, quando avaliamos melhor a gravidade da hipogli-
cemia, notou-se que os pacientes que usaram a nova insulina
foram 4 vezes mais ao pronto-socorro que os da insulina
regular!
No exemplo apresentado acima, para o desfecho primá-
rio (número de episódios de hipoglicemia) houve uma igual-
dade entre ambas as insulinas. Contudo, avaliando outras
variáveis, como a gravidade do episódio (com necessidade
de pronto atendimento), percebemos que a nova insulina se
mostrou mais perigosa.
Quando falamos em desfecho secundário estamos
nos referindo a outras variáveis estudadas na pesquisa,
que não sejam o desfecho primário. Assim, poderíamos ter
diversos desfechos secundários, como: tempo de duração
da hipoglicemia, sensação de bem estar do paciente com a
insulina, ou mesmo, a melhora da hemoglobina glicada com
cada tipo de insulina.

O artigo Científico 383


CABEÇA PENSANTE 56

Saber que a expectativa de a nova insulina dar menos hipoglicemia


foi descartada é importante, mas o que poderia ser apenas uma
igualdade entre insulinas virou algo preocupante ao avaliamos o
desfecho secundário! Assim, vamos notar que ambos os tipos de
desfechos podem se complementar e ajudar ainda mais na reflexão
sobre essa evidência.

Agora que já conseguimos diferenciar os tipos de des-


fechos vamos comentar um pouco sobre sua importância!
Ao ler o desfecho primário de um artigo estamos enten-
dendo qual o centro dos olhares dos autores. O desfecho
primário é onde se fixa maior atenção e isso, normalmente,
diminui um pouco o risco de viés. Entretanto, os desfechos
secundários, muitas vezes, podem trazer informações mais
interessantes que o primário, como no exemplo acima.
Por fim, a metodologia é o local mais comumente usado
para se definir o desfecho primário, por isso, é essencial que
essa informação seja bem identificada.
5) Estatística
A possibilidade de trazer a estatística para pesquisas
na área da saúde trouxe um novo rumo para a construção de
condutas mais adequadas e com maiores chances de gerar
qualidade de vida aos usuários. Além disso, ela demanda
conhecimento técnico básico sobre conceitos e testes esta-
tísticos para que o leitor seja capaz de refletir e entender o
que os números nos informam.

384 DESCOMPLICANDO MBE


Dessa forma, conhecimentos sobre estatística descritiva
– média, moda, mediana e desvio padrão – e de analítica, com
testes de Qui², odds ratio, correlação e regressão, começam a
ser necessários para uma boa compreensão dos resultados.
Nesse contexto, os autores, normalmente, acabam por
transformar em texto as informações contidas nas análises
da bioestatística. Todavia, ter a capacidade de olhar direta-
mente os números pode ser um diferencial para a sua melhor
compreensão e argumentação crítica sobre os resultados do
artigo e sobre como ele interage com pesquisas semelhantes.
Além disso, o que comumente encontramos dentro da
metodologia é a descrição facilitada dos tipos de análises
estatísticas utilizadas, bem como, o reforço sobre o uso padrão
da significância de p<0,05 – um número que, por ser padrão,
deve sempre ser a escolha para qualquer pesquisa na área
da saúde. Ademais, não raramente, encontramos a descrição
do programa utilizado para a realização das análises.
Por fim, a medida que seus conhecimentos sobre bio-
estatística forem sendo aprimorados, a leitura das informa-
ções estatísticas irão se tornar atalhos para uma leitura dos
resultados de maneira mais rápida e compreensível.

CABEÇA PENSANTE 57

Vale a pena dedicar um pouco de estudo para entender de bioesta-


tística! Visto que no lugar de apenas ler e aceitar o que o autor
escreveu, você será capaz de construir sua própria informação
e, assim, pensar além.

O artigo Científico 385


METODOLOGIA – ESTUDO QUALITATIVO

O estudo qualitativo se insere na possibilidade de


estudar as expressões humanas presentes nas relações e nos
sujeitos. Isto é, sua metodologia tem facilidade em explorar
as consequências da intervenção, pois sua coleta de dados
é, normalmente, aberta a receber todas as informações que
lhe forem dadas e não apenas enunciados pré-definidos
(respostas objetivas). Dessa forma, o qualitativo não limita as
informações no objeto do estudo na fase da coleta, mas sim,
na fase da análise dos dados – o que se torna um diferencial
em sua metodologia e resultados.
Na área da saúde se destaca o estudo de casos que
utilizam estratégias qualitativas para mapear, analisar o
contexto e as percepções de uma determinada situação,
intervenção ou fenômeno. Possibilita a evidência de relações
causais entre intervenções e situações da vida real. Em suma,
o estudo qualitativo coleta as percepções do objeto do estudo
(tema a ser abordado) de forma ampla e analisa todos esses
dados para chegar a seus resultados e conclusões.
Para a coleta dos dados são principalmente utilizados os
questionários abertos e a entrevista, que pode ser individual
ou em grupos focais (o que possibilita uma analise crítica
coletiva sobre a intervenção). O número de questionários/
entrevistas não obrigatoriamente utiliza o conhecido “n”, que
necessita de análise estatística, pois uma das técnicas bem
consolidadas se baseia na amostra por saturação de dados
(mais esclarecimentos adiante).
A análise dos dados qualitativos pode ser realizada
de várias formas. Entretanto, iremos destacar dois tipos:

386 DESCOMPLICANDO MBE


(1) a análise do conteúdo, na qual a atenção é voltada para
o conteúdo expresso nas entrevistas, suas repetições e os
significados das expressões; e (2) a análise do discurso, que
usa um tripé para articular o conhecimento – materialismo
histórico, linguística e a teoria do discurso – assim, destaca-se
a compreensão do contexto no qual se produziu as expressões
e não tanto a expressão propriamente dita.
A utilização dessas análises são os grandes pilares que
sustentam o desenvolvimento dos resultados e das conclusões
das pesquisas qualitativas, sendo a elas exigidas um grande
rigor metodológico para se obter grande sustentação ao
conhecimento desenvolvido.

ANÁLISE DO CONTEÚDO

A análise do conteúdo, como o próprio nome sugere,


estuda o conteúdo expresso pelos entrevistados: estuda a
palavra, a semântica da palavra, o processo de produção da
mensagem e as variáveis psicológicas e sociais. Para o uso
desse tipo de análise utilizamos Bardin como referência em
ensino do “como fazer”.
Nesse contexto, diante das transcrições das entrevistas,
o pesquisador deve ler e encontrar categorizações – por
exemplo, competências que se repetem por vários entrevis-
tados – e iniciar o processo de recorte desses fragmentos de
expressões para a formação de eixos temáticos de discussão.
Esse é um processo demorado, que exige um real estudo do
conteúdo das entrevistas e do entendimento sobre a expressão
dos entrevistados no contexto em que foram ditos.

O artigo Científico 387


Após a categorização, é o momento de se discutir sobre
esses eixos, nos quais esses fragmentos irão conversar entre si,
com o pesquisador e com a fundamentação teórica encontrada
sobre o assunto estudado. Assim, neste momento temos a
formação da análise crítica sobre o objetivo do estudo, pois
essa conversa possibilita levar em discussão o que foi expresso
pelo entrevistado, com a teoria existente e sobre a mediação
do pesquisador, possibilitando a formação do conhecimento.

ANÁLISE DO DISCURSO

Na análise do discurso, o foco não se limita ao conteúdo


das expressões, pois os olhos do pesquisador não se dedicam
apenas ao que foi dito, mas por que aquilo foi dito. Assim,
nessa análise, busca-se entender o contexto no qual aquilo
foi dito, as condições históricas e sociais que levam aquela
expressão ou mesmo ao silêncio do entrevistado. Para o uso
desse tipo de análise, o pensador Bakhtin tem um grande
impacto sobre como se pensar na formação do discurso do
indivíduo: não apenas como ele mesmo, mas como parte de
um meio e fruto de suas interações.
Na análise do discurso, o significado, a semântica do
que foi anunciado não é o único ponto observado, pois com
ele vem a busca por entender quais foram os fatores que
levaram ao entrevistado a dizer isso/aquilo, quais seriam as
suas vivências que o levaram a informar que desenvolveu
tal competência no lugar de outra competência. Desse modo,
para se tentar obter essas informações há grande necessidade
de se estudar a formação do eu, a formação do discurso, as
interações e o pensar.

388 DESCOMPLICANDO MBE


Por fim, a análise qualitativa acaba sendo mais utilizada
em pesquisas de áreas das ciências humanas pela maior
confluência da teoria e do estudo constante das relações, do
contexto, mas o seu uso em pesquisas na área da saúde tem
seu nicho e pode fornecer informações diferenciadas para
a elucidação de problemáticas.

RESULTADOS

Nos resultados encontramos um verdadeiro estoque


de informações, pois ele é o tópico responsável por dispo-
nibilizar ao leitor as variáveis, as informações e os gráficos
que foram obtidos ao logo da pesquisa. Então, encontraremos
diferentes tabelas, gráficos e os números que representam
nosso desfecho primário.
Durante a leitura dos resultados não é esperado que o
autor dedique muito tempo para os comentários reflexivos
sobre o que os números e/ou informações estão indicando, já
que nos resultados temos a intenção de deixar mais “bruta”
a informação. Dessa forma, o leitor poderá, mesmo dentro
da leitura do artigo, começar a refletir, iniciar seu posicio-
namento e leva-lo para a discussão.
Alguns pontos são clássicos em resultados, vamos
falar de alguns deles!
Na metodologia, comentamos que é importante sempre
comparar agrupamentos para avaliar a semelhança entre
eles e, assim, diminuir o risco de viés. É exatamente nos
resultados o local mais apropriado para mostrar essa com-
paração. Normalmente, vemos tabelas comparando diversas

O artigo Científico 389


características de maneira absoluta e analítica, utilizando o
teste t de student para essa comparação.
Além disso, é nesse momento de comparação em
que se apresentam as várias características da população
estudada que, também, indicam para o leitor o perfil dos
pacientes avaliados. Entender sobre esse perfil é de grande
valia na hora de escolher uma conduta, porque conhecendo
as características de um estudo podemos “encaixar” (ou não)
nosso paciente na pesquisa e, assim, nortear nossas atitudes.
Por fim, outro ponto de destaque para os resultados se
baseia em mostrar de diferentes formas o desfecho primário.
Então, gráficos, tabelas e números são muito utilizados para
responder como o desfecho primário se comportou durante
o estudo.

CABEÇA PENSANTE 58

Dedique um tempo especial para observar como o desfecho primário


se comportou durante a pesquisa, utilize essa informação para
formular sua opinião e leva-la para a discussão.

DISCUSSÃO

A discussão é um dos momentos mais ricos de um


artigo, pois nela vemos a construção de resultados em infor-
mação e, além disso, trazemos – para ajudar ou confrontar
– os resultados de pesquisas já realizadas.

390 DESCOMPLICANDO MBE


Figura 7 – Tríade da discussão

Apresentada pelo esquema acima, a discussão é um


momento rico no qual os resultados advindos da pesquisa
em questão irão encontrar as condutas da clínica atual e os
resultados de pesquisas semelhantes para a obtenção de uma
conclusão. Teremos, dessa forma, um autor que mostrará
os seus resultados e suas compreensões sobre eles, mas que
também irá mostrar resultados divergentes e convergentes
que foram encontrados na literatura.

CABEÇA PENSANTE 59

Perceba que, enquanto na introdução podemos encontrar uma


revisão da literatura sobre o tema envolvido, na discussão vemos
uma revisão sobre os itens específicos da pesquisa.

Além disso, na discussão são normalmente citados


achados interessantes de desfechos secundários! Dessa forma,
podemos esperar novidades e direcionamentos não espera-
dos ao longo do artigo, pois informações não esperadas ou

O artigo Científico 391


complementares são apresentadas na discussão como forma
de aprofundar o conhecimento.
Por fim, um ponto que vem ganhando muito destaque
nas discussões de artigos científicos, isto é, uma tendência
atual, é a transparência sobre as fragilidades e os possíveis
viéses da pesquisa em si. Então, encontramos uma descri-
ção sobre várias possíveis falhas e como elas poderiam ter
influenciado em alguns resultados.
Diante do exposto, a leitura da discussão é um momento
de reflexão no qual suas opiniões construídas ao longo de
todo o artigo (principalmente durante os resultados) serão
refletidas e poderão ser acompanhadas pela formação da
conclusão do autor. O importante é ler com a mente aberta
e atentar sempre para “os dois lados da moeda”.

CONCLUSÃO

Chegamos ao momento mais objetivo de toda a cons-


trução do artigo científico. Na conclusão, levamos em con-
sideração todas as etapas anteriores como “alimento” para
a construção de uma ideia final.

392 DESCOMPLICANDO MBE


Figura 8 –Esquema de uma conclusão

De uma forma comparativa com a discussão, na con-


clusão, gasta-se o mínimo de palavras possíveis – muitas
vezes apenas um breve parágrafo é necessário – para se
orientar um achado científico. Enquanto, na discussão, muitos
parágrafos são escritos de forma relevante para o debate de
argumentos e análise de dados em busca de uma conclusão
simples e pequena.

CABEÇA PENSANTE 60

Poderíamos pensar como se a conclusão fosse a unidade de infor-


mação mais resumida de todas, ainda mais resumida que o “resumo”.

Ademais, na conclusão é importante citar que temos


uma ideia construída que é expressa de forma afirmativa e
sem a demonstração de toda uma bagagem metodológica e de
resultados. Ou seja, no breve espaço da conclusão, raramente
se coloca dados estatísticos ou as demais formas argumen-
tativas, pois o que se tem é um breve período sintetizando
a construção da discussão.

O artigo Científico 393


CABEÇA PENSANTE 61

Perceba que a discussão e a conclusão são tão interligadas que


muitos periódicos os colocam juntos, com o título de “Discussão
e Conclusão”. Nesses casos a conclusão, normalmente, está no
último parágrafo.

Desse modo, temos o fim do artigo contendo, com


poucas palavras, uma concentração das informações advindas
da pesquisa e escrita pela voz própria do autor.

REFERÊNCIAS

As referências bibliográficas representam a valorização


das pesquisas científicas. São um meio de proporcionar que
todo leitor seja capaz de se aprofundar no tema da mesma
maneira que o autor precisou para conhecer o tema abor-
dado e, assim, construir o artigo. Nesse contexto, se torna de
grande importância a utilização de artigos atuais, recentes
e de boa qualidade metodológica, pois se garante que esse
novo conhecimento estará sendo discutido com a informação
vigente atual.
Existe uma infinidade de formas de citação e registro de
referências em artigos científicos – como o ABNT (Associação
Brasileira de Normas Técnicas) e o Vancouver – que irão variar
a cada periódico. Entretanto, o que predomina atualmente
é a numeração no final de cada período indicando o artigo
que serviu de referência para aquela frase.

394 DESCOMPLICANDO MBE


Além disso, a tendência a se utilizar mais dessa técnica
da numeração facilita a identificação do artigo que o leitor
possa querer ler futuramente para melhor aprofundar seus
conhecimentos.

CABEÇA PENSANTE 62

Notar que existem referências de diferentes línguas (inglês,


espanhol, português) seria um indicativo que a revisão da literatura
feita pelos autores foi abrangente! E isso dá mais confiança de
que o autor pode levar para a discussão as melhores evidências
possíveis.

Diante do exposto, as referências bibliográficas se


mostram como um verdadeiro hiperlink de possibilidades
de avançar no conhecimento sobre a temática do artigo.
Além disso, caso haja divergência entre a sua opinião e a do
autor, elas são apenas mais um caminho para a obtenção de
mais informações, que poderão te levar a consolidação de
um posicionamento.

APÊNDICE

Esse tópico já é menos conhecido dos leitores em geral,


mas representa um grande avanço na transparência dos dados
e na complementação de informações. Vamos comentar um
pouco mais:
Um artigo científico tem um número limitado de pala-
vras e/ou páginas para poder ser publicado, de modo que
algumas informações (tabelas, gráficos, escalas e números)
acabam sendo excluídos da versão publicada. Dessa forma,

O artigo Científico 395


o apêndice é um documento “extra”, cedido pelo periódico
(normalmente on-line), no qual o leitor poderá ver uma
grande quantidade de dados não mostrados no artigo, e isso
fornece mais transparência para o processo da metodologia
e resultados.

CABEÇA PENSANTE 63

É comum o próprio autor, em qualquer momento de seu artigo,


comentar que mais dados sobre o tema estão disponíveis no
apêndice.

Além disso, esses dados a mais podem ajudar a compre-


ender mais sobre a pesquisa em si, como sobre “descobertas
secundárias” advindas, por exemplo, de dados de desfecho
secundário não comentados durante o artigo. O apêndice
é, dessa forma, um grande complemento de dados ainda a
serem explorados pelo leitor e com grandes possibilidades.
Por fim, em casos onde foram utilizados formulários ou
escalas, a disponibilização desses documentos colabora para
a compreensão da metodologia e proporciona um material
que possa ser utilizado por futuras pesquisas sobre o mesmo
tema.

CABEÇA PENSANTE 64

O apêndice normalmente não segue um padrão de organização, mas


é disposto em um conjunto de informações, em bloco.

396 DESCOMPLICANDO MBE


A recomendação é de que o apêndice seja sempre lido
e utilizado quando se deseja saber mais sobre o tema, ou
quando há uma dúvida sobre algum ponto do artigo.

REFERÊNCIAS

ECO, U. Como se Faz uma Tese - 14. ed. São Paulo: Editora
Perspectiva, 1996.

MINAYO, M. C. D. S. O desafio do conhecimento: Pesquisa qualita-


tiva em saúde. 13. ed. São Paulo: Hucitec, 2013.

TAQUETTE, S. R.; MINAYO, M. C. D. S. Características de


estudos qualitativos conduzidos por médicos: revisão da lite-
ratura. Ciência & Saúde Coletiva, v. 20, p. 2423-2430, 2015.
ISSN 1413-8123. Disponível em: <http://www.scielo.br/scielo.
php?script=sci_arttext&pid=S1413-81232015000802423&nrm=iso>.

TAQUETTE, Stella Regina; MINAYO, Maria Cecília de Souza. Ensino-


Aprendizagem da Metodologia de Pesquisa Qualitativa em Medicina.
Rev. bras. educ. med., Rio de Janeiro, v. 39, n. 1, p. 60-67, Mar. 2015.
Available from <http://www.scielo.br/scielo.php?script=sci_arttex-
t&pid=S0100-55022015000100060&lng=en&nrm=iso>. access on 17 May
2018. http://dx.doi.org/10.1590/1981-52712015v39n1e02112014.

FONTANELLA, B. J. B. et al. Amostragem em pesquisas qualitati-


vas: proposta de procedimentos para constatar saturação teórica.
Cadernos de Saúde Pública, v. 27, p. 388-394, 2011. ISSN 0102-311X.
Disponível em: <http://www.scielo.br/scielo. php?script=sci_arttex-
t&pid=S0102-311X2011000200020&nrm=iso>. BARDIN, L. Análise de
conteúdo. 1. ed. Lisboa: Editora 70, 1997. 280 p.

COSTA, L. R. Ideologia e divulgação científica: uma análise


bakhtiniana do discurso da revista Ciência Hoje. Bakhtiniana:

O artigo Científico 397


Revista de Estudos do Discurso, v. 11, p. 33-51, 2016. ISSN
2176-4573. Disponível em: <http://www.scielo.br/scielo.
php?script=sci_arttext&pid=S2176-45732016000200033&nrm=iso>.

DIB, R, E. et al. Guia Prático de Medicina Baseada em Evidências. 1ª


edição. São Paulo: Cultura Acadêmica, 2014. 118 p.

AQUINO, I, S. Como Ler Artigos Científicos. 2. ed. São Paulo:


Saraiva, 2010. 94 p.

BERWANGER, O. et al. Os dez mandamentos do ensaio clínico ran-


domizado-princípios para avaliação crítica da literatura médica. Rev.
bras. hipertens, São Paulo, v. 13, n. 1, p. 65-70, 2006.

DE OLIVEIRA, M. A. P.; PARENTE, R. C. M. Estudos de coorte e de


caso-controle na era da medicina baseada em evidência. Brazilian
Journal of Videoendoscopic Surgery, Rio do Janeiro, v. 3, n. 3, p.
115-25, 2010.

MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p.

VIEIRA, S. Bioestatística: tópicos avançados. 3. ed. Rio de Janeiro:


Elsevier, 2010. 278 p.

398 DESCOMPLICANDO MBE


COMO PESQUISAR
EM BASES DE
EVIDÊNCIAS?

26 Cinthia Maria Cibelle de Lima Souzaԝ


Elaine Lira Medeiros Bezerra
Frederico Batah El-Feghalyԝ
Pedro Henrique Almeida Fraiman

A
intenção deste capítulo é fornecer uma breve
introdução sobre como operar nas ferramentas
de pesquisa das principais bases de evidências
e otimizar a utilização dos recursos disponíveis.
A partir disso, antes de destrincharmos acerca dos
mecanismos e instrumentos destinados a uma procura mais
efetiva de publicações nas mais diversas bases de pesquisa,
faz-se válido analisar conceitos importantes, os quais interfe-
rem diretamente na qualidade da evidência a ser analisada:
fator de impacto e qualis.

FATOR DE IMPACTO (FI)

Consiste em uma medida de avaliação quali-quanti-


tativa de revistas científicas indexadas ao ISI (Institute for

399
Scientific Information) em determinado ano. O FI de uma
revista/periódico é proporcional ao número de leitores; sendo
assim, há uma relativa subestimação de estudos publicados
em revistas de áreas do conhecimento mais específicas.
Basicamente, esse parâmetro é analisado e definido
pela seguinte expressão de divisão matemática: (quantidade
de citações que os estudos publicados nos dois anos ante-
riores por uma revista receberam neste mesmo período) /
(número de estudos publicados nos dois anos anteriores ao
ano analisado).
Por exemplo: uma revista “X” teve 750 citações em
2018-2019 e, no total, publicou, em 2018-2019, 150 artigos.
Portanto, o FI da revista “X” em 2020 é = 750/150 = 5.
Para termos uma ideia prática de quais são os valo-
res do FI dos mais diversos periódicos que temos acesso,
convém citar os fatores de impacto da CA-A Cancer Journal
for Clinicians (o maior entre todas as revistas científicas - FI
= 223.679 - SCI Publication, 2019/2020) e o do NEJM - New
England Journal of Medicine - (a segunda revista com mais
citações entre os periódicos da medicina e a de maior rele-
vância no âmbito médico; FI = 70.67 - Journal Citation Reports,
2018, Web of Science Group, 2019, e SCI Publication, 2019/2020).
Além disso, como forma de curiosidade, a Brazilian Journal
of Microbiology é a revista brasileira com o maior fator de
impacto nacional e ocupa o 31650 lugar no ranking geral (FI
= 2.857 - SCI Publication, 2019/2020).

400 DESCOMPLICANDO MBE


QUALIS

O sistema Qualis é a metodologia criada no Brasil


para avaliação de jornais e periódicos, mantida pelo CAPES
(Coordenação de Aperfeiçoamento de Pessoal de Nível
Superior), que tenta fazer algo semelhante ao fator de impacto.
Entretanto, utiliza não apenas as citações das publicações
do periódico avaliado, mas várias outras variáveis, como
relevância, impacto, área de abordagem, âmbito de circulação
e sua relação com a pós-graduação. Ademais, a partir de uma
comissão específica por área, é finalizada a avaliação e, com
isso, promovida a estratificação das revistas (veículos de
divulgação). As categorias utilizadas para indicar qualidade,
são, em ordem decrescente: A (A1 e A2), B (B1 – B5) e C.

PRINCIPAIS BASES DE EVIDÊNCIAS

M EDL I N E , POPU L A R M E N T E , PU BM ED

H T T P://PU BM ED.COM

A base de dados organizada pelo NCBI - National Center


for Biotechnology Information - é, talvez, a principal base de
dados do mundo, sendo organizada desde 1879 e, atualmente,
possuindo artigos em 39 idiomas. A maior parte dos artigos
de qualidade, publicados em língua inglesa, está indexada
nesta base de dados, sendo, em geral, a mais importante e
robusta fonte de pesquisa de evidências.

COMO PESQUISAR EM BASES DE EVIDÊNCIAS 401


CABEÇA PENSANTE

Você sabia que “indexado” vem do latim index, e é uma expressão


comum quando falamos de base de dados? Significa, em linhas
gerais, estar registrado.

SC I ELO

H T T P://W W W.SC I ELO.BR

É a principal base de dados da América Latina, con-


tendo, principalmente, artigos de publicações originalmente
em português e espanhol. É um projeto desenvolvido pela
FAPESP - Fundação de Amparo à Pesquisa do Estado de São
Paulo - e pela BIREME - Latin American and Caribbean Center
on Health Sciences Information. A vantagem da Scielo é contar
com artigos no nosso idioma e ter publicações indexadas
que estejam, frequentemente, voltadas à nossa realidade de
prática clínica.

E M BA SE

H T T PS://W W W.ELSE V I ER .COM /SOLU T IONS/


E M BA SE -BIOM EDIC A L -R ESE A RC H

É uma base de dados paga, organizada por uma das


principais editoras do mercado, que conta com artigos não
indexados no PUBMED, geralmente, publicados em revistas
europeias. Abrange estudos, de cunho biomédico e farma-
cológico, desde a década de 1940, auxiliando bastante na
elaboração de revisões sistemáticas, por ampliar o espectro
da busca.

402 DESCOMPLICANDO MBE


BVS - BI BL IOT EC A V I RT U A L E M SAÚDE

H T T P://BVSA LU D.ORG

Ligada a OPAS - Organização Pan-Americana de Saúde -,


também integra algumas fontes de dados tradicionais - LILACS
(Literatura Latino-Americana e do Caribe em Ciências da
Saúde) e MEDLINE - integrando-as em uma única base de
pesquisa. É disponível em três idiomas: português, inglês e
espanhol.

G O O GL E SC HOL A R

H T T PS://SC HOL A R .G O O GL E .COM

Baseado no motor de buscas da internet, o Google


Scholar sistematiza não apenas uma única base de dados, mas
uma série delas, agregando as informações e possibilitando
um maior acesso de uma única vez, de maneira rápida e ágil.

PER IÓDICOS C A PES

W W W.PER IODICOS.C A PES.G OV.BR

Ligada ao órgão de fomento do Governo Federal do


Brasil, a ferramenta também agrega, semelhante ao Google
Scholar, uma série de bases de dados em uma única ferra-
menta de busca. O acesso completo é restrito a indivíduos
associados a algumas instituições de ensino superior do
Brasil.

COMO PESQUISAR EM BASES DE EVIDÊNCIAS 403


BI BL IOT EC A CO CHR A NE

H T T PS://W W W.CO C H R A N EL I BR A RY.COM /

Consiste em uma base de dados, estruturada como uma


BVS (Biblioteca Virtual em Saúde), que se destina à promoção
do acesso a evidências concatenadas aos impactos das inter-
venções em saúde, sendo uma das principais produções da
“Colaboração Cochrane”. Baseia-se, em relação aos tipos de
estudos publicados, principalmente, em revisões sistemáticas,
as quais possuem, atualmente, versões em inglês e espanhol,
além de alguns resumos de revisões em português.

COMO POSSO REFINAR MINHA PESQUISA?

Escolhida a base de dados ou a ferramenta de busca a


ser utilizada durante a pesquisa, algumas orientações podem
ser seguidas a fim de melhorar a qualidade da busca.

PA L AV R A S -C H AV E

Consistem, basicamente, em termos (formados por uma


ou mais palavras) que compõem um dos principais instru-
mentos de uma pesquisa científica, expondo a amplitude
do assunto abordado e os seus respectivos conceitos mais
relevantes associados. Ou seja, além de sintetizar de forma
objetiva o conteúdo do artigo em questão, tem a função de
agir como um guia para o leitor, orientando quais são os
conceitos de maior significância apresentados. Cabe destacar
que as palavras-chave estão presentes no resumo do artigo,
o que facilita para serem encontradas pelos leitores.

404 DESCOMPLICANDO MBE


DESCR I TOR ES DE A SSU N TO

Os artigos, quando indexados, são associados por meio


das suas palavras-chave a alguns termos que são deno-
minados, em conjunto, como descritores. Os descritores
sintetizam um assunto contido na publicação e auxiliam
tanto na organização da indexação quanto no momento da
pesquisa. Com isso, vale salientar, que, de forma sucinta, os
descritores são termos retirados de um vocabulário específico
e controlado, definido por uma determinada plataforma,
que expressam conceitos das mais diversas áreas da saúde.
A importância da formulação de descritores coerentes e
plausíveis, em relação ao estudo a ser indexado e à plataforma
utilizada, reside no seguinte aspecto: caso os descritores não
estejam de acordo com a nomenclatura específica, o artigo
pode acabar não sendo encontrado e, portanto, não é citado e
a informação nele contida, ao invés de contribuir de maneira
agregadora com o conhecimento científico, acaba se perdendo.
Para cada tópico, existem alguns descritores sugeridos
para o assunto. Esses descritores podem ser pesquisados em
plataformas específicas — sugerimos a plataforma brasileira
da Biblioteca Virtual de Saúde de Descritores em Ciências
da Saúde (http:// decs.bvs.br).

OPER A D OR ES BO OL E A NOS

Existem três operadores booleanos básicos que permi-


tem combinar os descritores de diferentes maneiras, filtrando
os resultados. São eles: AND, OR e AND NOT.

COMO PESQUISAR EM BASES DE EVIDÊNCIAS 405


AND

Esse operador booleano busca a intersecção entre os


dois descritores, ou seja, serão incluídas apenas publicações
que possuam os dois termos na sua descrição. Isso restringe
o espectro de busca.
Por exemplo, caso seja inserido DIABETES MELLITUS
AND HYPERTENSION, os resultados apresentados terão,
ao mesmo tempo, tanto o descritor “DIABETES MELLITUS”
quanto o descritor “HYPERTENSION”.

OR

Esse operador booleano busca a soma entre os dois


descritores, ou seja, serão incluídas todas as publicações
que possuam pelo menos um dos termos na sua descrição.
Isso amplia o espectro de busca. Retomando ao exemplo
anterior, caso seja inserido DIABETES MELLITUS OR
HYPERTENSION, os resultados apresentados terão pelo
menos o descritor “DIABETES MELLITUS” ou o descritor
“HYPERTENSION”, o que, certamente, amplia sobremaneira
os resultados obtidos na busca.

A N D NOT

Esse operador exclui um dos descritores, refinando


um pouco mais a busca. Isso é importante quando se deseja
eliminar, por exemplo, um tipo de informação que é muito fre-
quente, porém pouco importante naquela situação específica.
Baseado nos exemplos anteriores, caso seja inserido
DIABETES MELLITUS OR HYPERTENSION AND NOT

406 DESCOMPLICANDO MBE


OBESITY, serão identificados todas as publicações que
contenham pelo menos um dos descritores, “DIABETES
MELLITUS” ou “HYPERTENSION”, porém eliminando entre
esses artigos, aqueles que contenham o descritor “OBESITY”
em algum momento.

A INTERPRETAÇÃO É DA ÚLTIMA
PARA A PRIMEIRA PALAVRA

Ao inserir um comando é fundamental atentar que a


interpretação realizada pelo motor de busca é realizada da
esquerda para a direita (do buscador) ou da sua direita para
sua esquerda. Apesar de parecer óbvia inicialmente, essa
informação é frequentemente ignorada.
Se, por exemplo, desejamos buscar artigos sobre
“Tratamento e Diagnóstico na Doença de Parkinson”,
teremos que inserir TREATMENT OR DIAGNOSIS AND
PARKINSON, nesta exata ordem, pois o sistema irá refinar,
primeiramente, artigos sobre Parkinson para então buscar
artigos sobre Tratamento e Diagnóstico.
Caso seja inserido PARKINSON AND TREATMENT
OR DIAGNOSIS, será oferecida uma quantidade absurda-
mente maior — o que nesta situação é ruim — de artigos,
posto que estão procurando artigos que busquem sobre
diagnóstico e tratamento, em termos gerais, para então depois
refiná-los em Parkinson.
Portanto, de uma forma geral, podemos dizer que “a
ordem dos fatores altera o produto”.

COMO PESQUISAR EM BASES DE EVIDÊNCIAS 407


FILTROS

T E M POR A L

A maior parte das bases de evidências permite filtrar


por tempo de publicação. Isso é fundamental, principalmente,
quando lidamos com informações sobre decisões clínicas, as
quais, em geral, necessitam de informações mais atualizadas.

T I PO DE EST U D O

Associado a um operador booleano, em geral, AND


ou AND NOT, caso deseje restringir a algum tipo de estudo
na busca, sugerimos adicionar no comando de pesquisa essa
informação.
Por exemplo, podemos inserir “CLINICAL
RANDOMIZED TRIALS AND PARKINSON”, sendo assim
serão buscado apenas ensaios clínicos randomizados sobre
Parkinson.

I DIOM A

Apesar de algumas bases de dados conterem estudos


em apenas um idioma, naquelas multi-linguísticas, a seleção
dos idiomas pode ajudar no refino da busca. Afinal, um
artigo em japonês, caso você não saiba ler o idioma, não
será um grande auxílio na sua busca, muito menos na sua
decisão clínica.

408 DESCOMPLICANDO MBE


AU TOR

A importância de utilizar esse aspecto, como filtro da


pesquisa de evidências, resume-se ao fato de que determi-
nados temas possuem cientistas reconhecidos, os quais já
têm publicações consolidadas, que se tornaram referências
acerca de determinado conteúdo. Esse contexto traria uma
maior confiança ao leitor na dinâmica da sua procura por
artigos científicos.

R E V ISTA

Como já discutimos anteriormente, há condições que


buscam estratificar os periódicos de acordo com as citações
que suas publicações recebem, possibilitando uma avaliação
proporcional a sua visibilidade de acordo com essa análise
quali-quantitativa - entre elas, o Fator de Impacto (FI). Ou
seja, está pressuposto que: em uma revista que possui um
FI significativo, as publicações são citadas e usadas como
referência para o desenvolvimento de outros estudos, dei-
xando, com isso, o leitor mais confortável em direcionar sua
pesquisa para determinadas revistas.
Agora, temos “a faca e o queijo na mão”, tanto o conhe-
cimento sobre as bases de evidências quanto as informações
para utilizarmos as ferramentas de busca de maneira mais
eficiente. A disponibilidade de informações, como podemos
perceber, é gigantesca, sendo a qualidade do comando inse-
rido nas ferramentas de busca e a correta administração dos
filtros de pesquisa recursos essenciais para a obtenção de
evidências com qualidade aceitável.

COMO PESQUISAR EM BASES DE EVIDÊNCIAS 409


OBSERVAÇÕES IMPORTANTES

Todos os exemplos e números apresentados neste


manual são fictícios ou meramente ilustrativos, sem apre-
sentar qualquer relevância científica.
Todos os gráficos e tabelas são criações autorais dos
autores deste manual.

REFERÊNCIAS
[1] AQUINO, I, S. Como Ler Artigos Científicos. 2. ed. São Paulo:
Saraiva, 2010. 94 p.

[2] ECO, U. Como se Faz uma Tese - 14. ed. São Paulo: Editora
Perspectiva, 1996.

[3] MASSAD, E. et al. Métodos Quantitativos em Medicina. 1. ed.


Barueri: Manole, 2004. 561 p.

[4] DOS SANTOS, F.C.L.; MOLLICA, M.C.M.; GUEDES, V.L.S.


Coerência na representação temática de artigos científicos na área
de saúde pública. Perspectivas em Ciência da Informação, vol.24, no.3,
Belo Horizonte, July/Sept. 2019 . Epub Feb 10, 2020.

[5] JOURNAL IMPACT FACTOR REPORT. SCI Publication, 2020.


Disponível em: <https://www.scipublication.org/index.html>. Acesso
em: 16 jun. 2020.

410 DESCOMPLICANDO MBE


COMO ANALISAR UM
ARTIGO CIENTÍFICO?

27 Ana Karenina Carvalho de Souza


Henrique de Paula Bedaque
Isadora Soares Lopes
Maria Tamyres de Carvalho Freitas

INTRODUÇÃO

O
conceito da Medicina Baseada em Evidências
começou a aparecer em periódicos científi-
cos no começo da década de 1990, ainda que
ensaios clínicos e estudos metodologicamente estruturados
já fossem realizados há muitas décadas. O novo conceito se
referia a uma nova estratégia de comportamento dentro da
Medicina que primava pelo uso consciente e judicioso da
melhor evidência disponível na tomada de decisões clínicas
para o cuidado dos pacientes. Com o tempo, essa abordagem
foi incluindo novos olhares e percepções, até firmar o ideal
de um tripé essencial para todo bom médico: a experiência

411
clínica e o conhecimento de evidências científicas, aliado ao
reconhecimento das prioridades e preferências do paciente.

Figura 1 – As bases de uma boa prática clínica

Quase três décadas mais tarde, o conceito da MBE


prevalece e nutre, então, a necessidade de procurarmos
evidências de qualidade e de estarmos atualizados nos tópi-
cos que nos concerne na prática clínica. É uma habilidade
essencial ao profissional de saúde saber analisar evidências
científicas de forma crítica e responsável e, a partir disso,
formular suas próprias interpretações, adaptadas à realidade
clínica.
Esse capítulo tem como objetivo ajudar a desenvolver
uma análise sistematizada dos componentes de um artigo
científico, considerando os itens essenciais e obrigatórios.
De um modo geral, a estrutura básica de artigos na área
da saúde seguem um determinado padrão e, para certos
desenhos de estudo, podemos inclusive realizar a análise
com auxílio de checklists validados para este fim, como será
abordado para ensaios clínicos, estudos observacionais e
revisões sistemáticas.

412 DESCOMPLICANDO MBE


OS PRIMEIROS PASSOS PARA A
LEITURA DE UM ARTIGO CIENTÍFICO

A interpretação de um artigo científico começa antes


mesmo da sua leitura propriamente dita. Inicialmente, é
preciso considerar se estamos diante de uma evidência primária
(artigos que expõem resultados obtidos de uma pesquisa
realizada), como ensaios clínicos ou estudos observacionais;
ou uma evidência secundária (como revisões sistemáticas e
metanálises, que sumarizam conclusões de estudos publica-
dos). Isso porque, ainda que apresentem pontos em comum,
cada tipo de estudo apresenta um padrão bem determinado
para sua metodologia e análise. Assim, diante de qualquer
evidência, primária ou secundária, devemos fazer previa-
mente os seguintes questionamentos:
1. Qual a relevância desse estudo?
2. Existe alguma lógica na hipótese testada?
Uma pesquisa científica deve se propor a responder
alguma pergunta clínica que represente uma dúvida ou área
pouco explorada no campo científico, mas que abranja uma
esfera relevante de pesquisa. Em seguida, considerando um
estudo relevante, devemos analisar a probabilidade prévia
da hipótese ser verdadeira. Para isso, devemos considerar
não somente a lógica e a plausibilidade da hipótese testada,
como também os dados já existentes na literatura a respeito
dessa hipótese ou do campo científico que ela integra.
Vamos entender isso através de um exemplo:
Imaginemos um estudo que pretende avaliar o impacto em
mortalidade da cirurgia de revascularização miocárdica em

COMO ANALISAR UM ARTIGO CIENTÍFICO 413


pacientes com doença estável, comparado ao tratamento
clínico padrão.
Não é difícil perceber que essa é uma dúvida perti-
nente e relevante para a prática clínica: afinal, vale a pena
submeter indivíduos com pouco ou nenhum sintoma a um
procedimento, invasivo e de alto risco? Ou podemos apenas
manter tratamento padrão? Agora vamos avaliar um outro
exemplo fictício:
Um novo estudo pretende avaliar se não fazer a barba no mês
de novembro reduz a mortalidade por câncer de próstata.
De cara, você já percebe que essa é uma hipótese bem
improvável e facilmente concluímos que a sua probabilidade
de ser verdadeira é bem baixa.
Assim, em um primeiro momento, é importante que
analisemos a plausibilidade da hipótese a ser testada. Porém,
plausibilidade nem sempre se traduz em probabilidade. Isso por-
que estamos analisando sistemas biológicos complexos, nos
quais uma diversidade de fatores interfere numa associação
testada. Assim, na grande maioria das vezes encontramos
uma explicação plausível para a hipótese (como uma droga
que afeta uma determinada via X), mas nem sempre essa
modificação se traduz em resultados clínicos. Portanto,
precisamos analisar também os dados clínicos já existentes
no contexto da hipótese a ser testada.
Suponhamos então um estudo que procurou avaliar o efeito da
“dieta paleolítica” (rica em proteína e pobre em carboidratos)
na redução de risco cardiovascular de indivíduos adultos.
De uma forma geral, a maioria dos estudos na área da
nutrição não mostra nenhum tipo específico de dieta ou de

414 DESCOMPLICANDO MBE


alimento que apresenta impacto significativo na redução de
eventos cardiovasculares e, quando a diferença é significativa,
geralmente é de baixa magnitude. Logo, diante dos resultados
conhecidos no contexto da nutrição, podemos atribuir que essa
hipótese tem uma probabilidade baixa de ser verdadeira.
Portanto, o primeiro passo na leitura de um artigo
científico é avaliar a relevância do estudo e a probabilidade
prévia da hipótese ser comprovada através da sua plausi-
bilidade e de informações existentes na literatura. Nesta
situação, podemos definir mentalmente uma hipótese como
de baixa, moderada ou alta probabilidade.

Figura 2 – O raciocínio preliminar diante de uma evidência

Em seguida, o próximo passo na análise crítica de


uma evidência é avaliar a veracidade dos resultados que ela
nos traz. De forma simples, a análise de veracidade é nada
menos que esmiuçar a metodologia do artigo à procura de
potenciais vieses. Essa é a seção que requer mais atenção do
leitor, pois irá nos guiar sobre a qualidade daquele estudo e
a confiabilidade que teremos nos resultados. A metodologia
consiste no conjunto de procedimentos e regras básicas
adotados na produção do conhecimento científico. Em um
artigo, ela deve estar descrita de forma clara, permitindo ao

COMO ANALISAR UM ARTIGO CIENTÍFICO 415


leitor reconstruir o processo de elaboração e condução do
estudo. A saber, esse planejamento é construído e descrito
antes mesmo da realização do estudo, e cada etapa deve estar
pré-especificada em um protocolo (de preferência, contendo
uma justificativa para sua realização).

CABEÇA PENSANTEԝ

É importante que cada etapa da metodologia esteja pré-determinada


para reduzir o risco de vieses.

Um estudo que definimos como alto risco de viés nos


faz ter menor confiabilidade nos seus resultados. Isto é, quando
há muitas falhas metodológicas, os resultados de um estudo
tornam-se questionáveis, podendo, inclusive, não serem
verdadeiros e, assim, a nossa interpretação fica prejudi-
cada. Por isso, é tão importante saber reconhecer os pontos
essenciais na metodologia de cada desenho de estudo para
que possamos confiar ou não em seus resultados. Assim, os
próximos tópicos procuram esclarecer quais os principais
pontos a serem analisados na metodologia de ensaios clínicos,
estudos observacionais e de revisões sistemáticas.

COMO ANALISAR CRITICAMENTE


UM ESTUDO OBSERVACIONAL?

Nos estudos observacionais, o investigador não realiza


nenhum tipo de manipulação sobre os indivíduos participan-
tes, apenas observa no decorrer de um período de tempo. Essa
importante característica os diferencia dos ensaios clínicos,
sendo possível somente nesses últimos o estabelecimento de
uma relação causal entre intervenção e desfecho.

416 DESCOMPLICANDO MBE


Apesar de os ensaios clínicos randomizados (ECRs)
serem considerados o padrão-ouro dentro da hierarquia
de evidências em saúde, em diversos cenários não seria
possível ou mesmo ética sua realização. Por exemplo, ao
se realizar um ECR para descobrir se o hábito de fumar
está ou não relacionado ao desenvolvimento de câncer de
pulmão, estaríamos expondo um dos grupos de pacientes a
uma substância sabidamente danosa apenas para concluir o
propósito do estudo. Nesse sentido, é possível perceber que
se torna aceitável a incerteza dos estudos observacionais
quando o objetivo é retirar um componente possivelmente
deletério (a exemplo do cigarro).
Dessa forma, os estudos observacionais são primor-
diais para avaliação de condutas no mundo real, ou seja,
para avaliar a efetividade de uma intervenção, assim como
identificar efeitos adversos raros ou tardios e obter um resultado
mais aproximado da prática clínica cotidiana. No entanto,
também podem ser utilizados para avaliação de “dano”,
caso preenchidos alguns critérios: grande probabilidade
pré-teste (plausibilidade biológica), impossibilidade ética de
randomização e grande força de associação entre causa-efeito.
Os estudos observacionais também demonstram con-
tribuição em situações de emergência de saúde pública, já
que precisam de um tempo reduzido para obter resultados
significativos e possuem menor custos associados. Dessa
forma, permitem uma investigação rápida e podem ser uti-
lizados para formulação de políticas públicas.

COMO ANALISAR UM ARTIGO CIENTÍFICO 417


CABEÇA PENSANTEԝ

O uso dos estudos observacionais como provedores de relações de


causa-consequência deve ser visto com cautela, devendo sempre
lembrar que essa função cabe aos ECRs!

Agora que relembramos a importância e o correto uso


dos estudos observacionais, vamos nos aprofundar em como
analisá-los criticamente e em quando confiar ou não nos
resultados e conclusões apresentados. Para isso, podemos
fazer uso de ferramentas como a iniciativa Strengthening the
Reporting of Observational studies in Epidemiology (STROBE),
que foi traduzido em português para “Strobe - Aprimorando
a Apresentação de Resultados de Estudos Observacionais
em Epidemiologia”. Essa estratégia é composta por diversas
recomendações criadas por um grupo de pesquisadores
para fortalecer a qualidade das descrições nos estudos
observacionais.
O STROBE enumera diversas informações que devem
estar presentes no resumo, título, introdução, metodologia,
resultados e discussão de artigos observacionais. Contudo,
como esse tipo de pesquisa pode ser realizado de três formas
distintas (coorte, caso-controle e estudo seccional), existem
itens específicos para cada um desses desenhos. No total,
são dezoito itens comuns a todos os estudos observacionais
e quatro próprios de cada desenho.
Como foi dito no capítulo intitulado “O artigo cien-
tífico”, no início do artigo devem estar explicitados os ele-
mentos-chave que caracterizam o desenho do estudo, assim
como o contexto em que o estudo foi desenvolvido (datas,

418 DESCOMPLICANDO MBE


locais, período de recrutamento e acompanhamento, coleta
de dados, entre outros).
Quanto à descrição dos participantes, existem diver-
gências entre as orientações para cada desenho de estudo,
portanto, vamos detalhá-las abaixo:
• Estudos de Coorte: é aconselhado ser claro quanto
aos critérios de elegibilidade, métodos de seleção de
participantes e fontes de dados utilizadas. Além disso,
deve-se descrever como foram aplicados os métodos
de acompanhamento dos participantes. Nos estudos
com uso de pareamento, torna-se importante descrever
os critérios de pareamento e o número de expostos e
não-expostos.
• Estudos seccionais: orienta-se discorrer sobre os crité-
rios de elegibilidade, as fontes utilizadas e os métodos
de seleção dos participantes.
• Estudos de caso-controle: deve-se apresentar os cri-
térios de elegibilidade, as fontes e os critérios diag-
nósticos para identificação dos casos, assim como o
método de seleção dos controles e suas justificativas.
Caso exista pareamento no estudo, torna-se prudente
apresentar os critérios de pareamento e o número de
controles para cada caso.
Na metodologia, também devem estar bem apresen-
tadas as variáveis envolvidas, sendo claramente definidas
as exposições, os desfechos, os potenciais confundidores,
os modificadores de efeitos, os preditores e, se necessário,
os critérios diagnósticos. Cada variável deve ter sua fonte
de dados exposta, assim como os métodos utilizados na sua

COMO ANALISAR UM ARTIGO CIENTÍFICO 419


mensuração. Além disso, o STROBE orienta especificar as
medidas adotadas para evitar potenciais vieses, assim como
detalhar como foi determinado o espaço amostral.
Outro ponto considerado importante por essa fer-
ramenta é a explicação de como são tratadas as variáveis
quantitativas do estudo na análise dos dados, se foram
realizadas categorizações e por qual razão. Por fim, devem
ser descritos os métodos estatísticos, inclusive quais foram
utilizados para controle de vieses, como foram tratados os
dados faltantes (missing data) e como foram realizadas as
análises de subgrupo. Nesse ponto, existem especificações
relacionadas aos diversos desenhos de estudo possíveis em
uma pesquisa observacional:
• Estudos de coorte: deve-se atentar para a forma como
os pesquisadores lidam com as perdas de seguimento,
se presentes no estudo.
• Estudos seccionais: notar a descrição dos métodos
utilizados relacionados à estratégia de amostragem.
No que faz referência à exposição dos resultados no
artigo, torna-se prudente a descrição do número de parti-
cipantes em cada etapa do estudo, as razões de perda de
participantes em cada etapa, com uso de diagramas de fluxo,
por exemplo. Além disso, nessa seção do artigo também
devem ser apresentados de forma clara os dados descriti-
vos dos participantes e as informações sobre exposições e
confundidores em potencial. Essa é uma importante seção
do artigo, já que explicita as diferenças entre os grupos,
que podem ser geradoras de resultados falsos-positivos ou
falsos-negativos.

420 DESCOMPLICANDO MBE


Dentro dos resultados, os desfechos devem ser abor-
dados de diferentes formas conforme o tipo de desenho do
estudo:
• Estudos de coorte e seccionais: notar a descrição do
número de eventos-desfecho ou as medidas-resumo.
• Estudos de caso-controle: a descrição do número de
participantes em cada categoria de exposição deve
ser criteriosa, assim como a apresentação de medidas
resumo de exposição.
Por fim, nos resultados, é importante estar bem descri-
tas as estimativas não ajustadas e ajustadas pelas variáveis
confundidoras, assim como a precisão delas. Análises secun-
dárias devem estar bem caracterizadas, tais como análises
de interação, subgrupo ou sensibilidade.
Chegando ao fim do artigo, deparamo-nos com a
discussão e nela encontramos de forma clara os principais
achados, correlacionando-os com os objetivos do estudo,
assim como suas limitações, potenciais vieses ou impreci-
sões. Nessa seção, também está presente a interpretação dos
resultados, relacionando os achados deste estudo com demais
evidências na literatura e artigos semelhantes.
Outra ferramenta utilizada para auxiliar na leitura
de estudos não-randomizados é a ROBINS-I (Risk of Bias
In Non-randomized Studies of Interventions), criada para
facilitar a classificação da qualidade desses artigos pelos
pesquisadores que se interessam em adicionar esse tipo de
estudo em suas revisões sistemáticas. Nessa estratégia, o
foco de avaliação deixa de ser a qualidade metodológica do
estudo, tornando-se mais importante a análise do risco de

COMO ANALISAR UM ARTIGO CIENTÍFICO 421


viés, classificado em baixo, moderado, sério (crítico). Para
isso, os criadores desta ferramenta elaboraram “signalling
questions” (Perguntas sinalizadoras) para cada domínio de
viés considerado. Essas são perguntas que buscam extrair
informações relevantes que podem indicar a maior ou menor
possibilidade de vieses.
No ROBINS-I, o primeiro passo a ser efetuado na
avaliação da validade de um estudo não randomizado é
considerar quais problemas podem surgir no contexto da
pergunta de pesquisa, ou seja, prever os fatores potenciais
para vieses. Por exemplo, um ponto importante a ser obser-
vado é o prognóstico, que pode ou não participar da decisão
sobre o paciente receber a intervenção em questão, podendo
levar ao viés de confusão (pacientes com pior prognóstico
recebem mais intervenção do que os com melhor prognóstico
e, consequentemente, têm piores desfechos que podem ou
não estar relacionados à intervenção). Da mesma forma, os
vieses de co-intervenção podem modificar o resultado do
estudo, a exemplo se o mesmo grupo de pacientes que recebeu
a intervenção testada também recebeu outras interferências
clínicas que podem ter contribuído para o resultado.
Os passos seguintes recomendados por essa ferramenta
são: 1. Especificar a pergunta de pesquisa considerando um
“estudo alvo”, que seria o equivalente do estudo observa-
cional em questão, porém se fosse realizado nos moldes de
um ensaio clínico randomizado (com a mesma população,
intervenção; 2. Especificar os desfechos e resultados; 3. Para
cada resultado especificado, avaliar como lidaram com os
vieses de confusão e co-intervenção; 4. Responder às “sig-
nalling questions” dos sete domínios de viés; 5. Com base

422 DESCOMPLICANDO MBE


nessas respostas, formular o risco de viés em cada domínio
e, por último, desenvolver um julgamento geral do risco de
viés para o desfecho e resultados do estudo.
Nesse sentido, é notável que a análise de um estudo
observacional pode ser muito mais complexa do que apenas
a aplicação de um check-list, já que eles podem ser metodo-
logicamente acurados, porém ainda contêm as limitações
de um estudo observacional e um alto potencial de viés de
confusão negativo ou positivo. Por isso, devemos sempre
lembrar que a principal função desses estudos é a de gerar
hipóteses (que então podem ser colocadas à prova em ensaios
clínicos randomizados).
Portanto, é possível perceber que ferramentas como
STROBE ou ROBINS-I podem ser úteis para avaliar a qua-
lidade metodológica do estudo, o risco de viés ou mesmo
auxiliar no momento de escrever um artigo com esse dese-
nho. Contudo, devem ser acompanhadas de uma avaliação
crítica prévia que contenha indagações sobre a probabilidade
pré-teste, a força de associação da hipótese, a possibilidade
de realização de um ensaio clínico randomizado para com-
provação, entre outros.

COMO ANALISAR UM ARTIGO CIENTÍFICO 423


Figura 03 - Elementos-chave na leitura
de um estudo observacional

COMO ANALISAR CRITICAMENTE UM


ENSAIO CLÍNICO RANDOMIZADO?

Os Ensaios Clínicos Randomizados (ECRs) compõem,


quando bem feitos, as evidências mais robustas e de maior
qualidade, respondendo a perguntas terapêuticas e de perfil
de segurança. O ECR apresenta arquitetura prospectiva
de seguimento (follow-up) e utiliza a randomização para
equilibrar os grupos de pacientes, exceto em relação ao tra-
tamento ofertado, caso seja a pergunta terapêutica. Por isso,
essa tipologia de estudo representa, no geral, um nível de
evidência muito superior ao atribuído em estudos observa-
cionais, tendo em vista que o principal fator para resultados

424 DESCOMPLICANDO MBE


espúrios é evitado, de modo a afastar viés de confusão. Pela
importância tamanha dos ECRs, é fundamental adquirir
leitura crítica acerca de sua construção, e isso terá como base
os critérios do checklist CONSORT, ou Consolidated Standards
of Reporting Trials (disponível online), o qual atribui padrões
consolidados para a devida avaliação dos trials.
Referente à análise metodológica, ponto essencial para
entendimento do estudo e para a identificação de vieses que
possam fragilizar a qualidade do ECR, é importante pontuar
as seguintes seções:

CABEÇA PENSANTEԝ

Antes dos principais pontos da análise da metodologia, é inte-


ressante que o protocolo do estudo seja lido para entendimento
amplo do trial, sobretudo para conferir se os métodos foram
pré-determinados ou se existiram modificações que conduziram
a vieses. Os protocolos devem ser publicados previamente e
estar disponíveis para domínio público. Os ensaios clínicos são
normalmente registrados no site Clinicaltrials.gov.

• Como foram definidos os participantes? Os critérios


de inclusão precisam ser bem elucidados; o cuidado
aqui deve ser definir critérios suficientes para selecio-
nar a amostra de interesse, para não levar a viés de
seleção. É fundamental perceber que os critérios de
exclusão não representam o contrário dos de escolha
para a elegibilidade dos participantes; é importante que
sejam definidos de forma clara, afinal alguns pacien-
tes precisam ser excluídos (a exemplo de pacientes
com alto risco de efeito colateral). Esses critérios são

COMO ANALISAR UM ARTIGO CIENTÍFICO 425


fundamentais para entender qual deve ser o contexto
populacional de inserção de um tratamento.
Outro ponto neste tópico de participantes é a definição
do local de coleta e do recrutamento; deve-se atentar se é
multicêntrico (estudos de centro único podem ter menor
reprodutibilidade e menor validade externa) bem como
sobre a complexidade dos centros de coleta, as informações
sobre esses locais (hospitais envolvidos, por exemplo), a
viabilidade acerca de como os pacientes foram recrutados,
entre outros fatores.
• Quais são as intervenções propostas? As intervenções
planejadas para cada grupo precisam estar descritas
(além de como e quando foram administradas), de
forma suficiente para permitir a sua replicação, faci-
litar a comparação do estudo e a inclusão em revisões
sistemáticas. Neste tópico, é reforçado o acesso ao
protocolo original do estudo, a fim de garantir a repro-
dutibilidade bem como aplicabilidade da pesquisa e
dar maior confiança aos resultados propostos.
Além disso, é ideal que esteja explícito o período de
tempo em que foi realizada a seleção de dados clínicos e
o tempo de seguimento (follow-up) dos participantes. É
preciso analisar se esse tempo é o ideal para o que se deseja
observar. No cenário de pandemia do coronavírus, por exem-
plo, a avaliação de melhora clínica pode ser vista com um
acompanhamento em dias. Outro contexto é o de avaliação
de desfechos cardiovasculares como IAM, AVC ou morte
no cenário de insuficiência cardíaca: é interessante que os
pacientes sejam acompanhados por alguns anos para obser-
var o impacto da intervenção proposta.

426 DESCOMPLICANDO MBE


• Há desfechos definidos? Quais são? Nesta seção,
é fundamental verificar se os desfechos primários e
secundários foram completamente pré-especificados,
evitando o viés de aferição de desfecho (caso fosse visto
retrospectivamente). Os desfechos preferencialmente
devem ser objetivos (a exemplo de mortalidade, extre-
mamente objetiva). Quando subjetivos ou gerados pelo
médico, também compõem o viés de aferição, sendo
mais vulnerável quanto mais subjetivo (a exemplo de
redução de dor), sobretudo em estudos abertos (sem
cegamento). Se há necessidade de estudo aberto, para
minimizar viés, é fundamental que o desfecho seja
objetivo; já se houver necessidade de desfecho subjetivo,
é premente manter o estudo cego.

Figura 4 – Relação de estudos abertos ou cegos com


o tipo de desfecho escolhido e o risco de viés

Além disso, o leitor deve estar alerta a quaisquer altera-


ções que surgirem nos desfechos após o início do estudo (as
mudanças têm de ser colocadas, com as razões especificadas);

COMO ANALISAR UM ARTIGO CIENTÍFICO 427


por outro lado, as alterações precoces e previstas em protocolo
refletem menor prejuízo à análise.
Outra possibilidade de viés associada ao desfecho é
a perda de follow-up, ou seja, a perda de seguimento em
relação ao número de eventos. Se houver, é interessante
observar se foi semelhante entre os grupos abordados e se
não passou de 10% do total recrutado.
• Como foi determinado o tamanho da amostra? O
cálculo do tamanho amostral considera o equilíbrio
entre o ideal e o factível (amostra suficiente para
encontrar a relação entre as variáveis). Esse cálculo
é realizado com o uso de modelos estatísticos consi-
derando o poder estatístico que se deseja do estudo
e a diferença esperada a ser encontrada entre os dois
grupos. Relativamente à amostra, é válido entender que
é avaliado de acordo com a taxa de eventos no grupo
controle: quanto maior a incidência do desfecho, uma
amostra menor é necessária, ou seja, um “n” menor
pode ser suficiente para ter poder estatístico diante de
fenômenos com maior diferença. Entenda que, para
detectar um fenômeno pequeno, vou precisar de um
estudo poderoso, vou precisar de uma grande lente
de aumento. Nesse contexto, no âmbito da cardiologia,
por exemplo, tratando-se de uma população de alto
risco, com a ocorrência de mais eventos (magnitude
grande do desfecho), a amostra pode ser menor. Por sua
vez, quando é pequena, a amostra precisa ser grande,
contexto da maioria das drogas, ou seja, tenha atenção
ao estudo que vai atrás de diferenças grandes demais.

428 DESCOMPLICANDO MBE


É importante aqui reforçar os tipos de erros aleatórios:
o erro do tipo I é o de rejeitar a hipótese nula quando ela
é verdadeira (afirmar algo falsamente), sendo tolerado em
uma probabilidade de até 5% (alfa); já o de tipo II é o de não
rejeitar a hipótese nula quando ela é falsa (não encontrar uma
associação verdadeira), sendo tolerado em uma probabilidade
de até 20% (beta). Aceitando uma probabilidade de até 20%
de erro do tipo II (falso negativo), o poder estatístico, então,
é de 80% (1-beta %). Quanto maior a amostra, maior o poder.
Quando não alcança a amostra mínima calculada, o poder
estatístico é menor e uma diferença que existe pode não ser
encontrada, sobretudo se ela é pequena. A amostra menor
também aumenta a probabilidade de achar diferença que
não existe (tipo alfa). Desse modo, pode não haver poder
estatístico para testar a hipótese (o estudo é tido como “under-
powered”). Na ausência de poder estatístico, uma diferença
encontrada, mesmo que estatisticamente significante (p <
0.05), tem veracidade duvidosa. Assim, não se pode afastar
o acaso como explicação do resultado encontrado.
• Como é a randomização? Com a randomização,
garante-se um equilíbrio entre as características dos
pacientes. Com um tamanho adequado do estudo, os
efeitos de confusão conseguem ser mitigados, dife-
rentemente dos estudos observacionais, os quais não
garantem o balanceamento entre os grupos. Neste
tópico, o leitor deve atentar se a randomização foi
adequada. Quando aberta, pacientes de melhor prog-
nóstico podem ser colocados no grupo de intervenção,
de modo a favorecer o resultado. Quando local, com o
investigador sendo responsável pelo sorteio, os grupos
também podem ser manipulados. Para ser ideal, então,

COMO ANALISAR UM ARTIGO CIENTÍFICO 429


a randomização precisa ser fechada e central (feita de
forma independente), e não aberta e local.
• Houve cegamento no estudo? Um estudo cego é aquele
no qual as pessoas envolvidas não sabem em qual
grupo os participantes estão alocados; o cegamento
pode ser para os participantes do estudo, para os pes-
quisadores, para os médicos envolvidos na assistência
e até mesmo para os estatísticos responsáveis pela
análise. A ausência de cegamento, ou seja, o estudo
aberto pode gerar viés de desempenho (performance
bias), pois interfere nos cuidados oferecidos aos grupos
intervenção e controle. Quando o cegamento não é
possível, deve-se garantir a mesma atenção para os
dois grupos.
O conhecimento da alocação pelas pessoas envolvidas
no estudo torna o desfecho suscetível tanto por mudança de
comportamento por parte do paciente quanto por superes-
timar o efeito da intervenção ou fazer com que haja desfe-
cho gerado pelo médico. Quando comparados aos estudos
duplo-cegos (no qual nem os participantes nem os médicos
assistentes bem como pesquisadores responsáveis pela aná-
lise sabem a alocação dos pacientes), os estudos com falta
de mascaramento podem superestimar o efeito em média
em 13%. Ademais, os estudos com desfechos subjetivos são
ainda mais suscetíveis aos problemas gerados pela ausência
de mascaramento. O efeito do viés de performance pode ser
minimizado com a utilização de desfechos objetivos, pois
sofre menor influência do não cegamento.
• Quais são os métodos estatísticos empregados? Neste
aspecto, devem ser especificados os procedimentos

430 DESCOMPLICANDO MBE


estatísticos utilizados para desfecho primário e secun-
dário, de preferência escolhidos previamente em rela-
ção aos resultados obtidos. Os métodos para análises
adicionais, como a de subgrupos (avaliar resultados em
subgrupos de um mesmo tratamento, sob a ótica, por
exemplo, da faixa etária ou do sexo), também devem
ser descritos caso sejam feitas essas análises adicionais.
Neste momento da leitura do artigo, deve ser observada
a descrição dos intervalos de confiança atribuídos pelo estudo
(essenciais na interpretação dos resultados), além da definição
do valor de p, a fim de indicar a significância estatística a
partir das análises finais (relembrando que o valor de erro
aleatório do tipo I que é tolerado é de no máximo 5%, ou
seja, p < 0.05).
Para o seguimento do estudo, podem ser realizadas
análises interinas, as quais devem ser bem definidas, feitas
em período pré-estabelecido em protocolo ou de acordo com
número de eventos alcançado. Análises interinas múltiplas
aumentam a chance de encontrar associação por acaso.
Dentre os motivos coerentes para gerar interrupção
de um estudo, temos: o truncamento por futilidade (mesmo
com continuidade do estudo, haveria ausência de benefício
ou benefício desprezível) ou por malefício (por motivos de
segurança, interrupção precoce é um compromisso com a
ótica do “primum non nocere”). Nesse contexto, interromper
um estudo e manter a premissa de que a hipótese nula é
verdadeira está dentro da ordem científica, diferentemente
de rejeitá-la com base em estudo truncado, ou seja, deve-se
ter muito cuidado com resultado positivo diante de estudo
truncado.

COMO ANALISAR UM ARTIGO CIENTÍFICO 431


Figura 5 - Elementos fundamentais na
análise metodológica do ECR

Referente à seção de análise de resultados, é importante


conferir se os passos para maior confiabilidade do estudo
previstos na metodologia foram realizados conforme plane-
jamento. De maneira igualmente importante, os resultados
precisam ser avaliados conforme relevância para represen-
tação de evidência definitiva de terapêutica. Os seguintes
aspectos precisam ser bem destrinchados diante dessa parte
fundamental do artigo:

432 DESCOMPLICANDO MBE


• Há representação do fluxo dos participantes por meio
de diagrama? Sob forma de representação gráfica (com
detalhes de recrutamento, alocação e seguimento dos
indivíduos), o ECR tem de trazer, para cada grupo, o
número de participantes que foram randomicamente
atribuídos, receberam o tratamento pretendido e
foram analisados para o desfecho primário, além
de explicitar perdas e exclusões após a randomiza-
ção (preocupantes pelo potencial gerador de viés ao
influenciar o resultado obtido, ainda mais se a causa
dessas exclusões é suprimida do artigo). Desvios no
protocolo previamente proposto devem também ser
informados e justificados.

Figura 6 - Exemplificação de fluxo de


participantes por meio de diagrama

• Como se deu de fato o recrutamento? Aqui é pre-


mente a descrição do período em que foi realizado, com
informações também sobre o tempo de seguimento
dos participantes, além da definição de interrupção

COMO ANALISAR UM ARTIGO CIENTÍFICO 433


ou não do estudo antes do previsto a depender de
análises interinas.
É importante avaliar se foram randomizados pacientes
suficientes para suprir o número de pacientes planejado no
protocolo do estudo. Dessa forma, já se analisa se o estudo
pode ser underpowered, ou seja, se pode não haver poder
estatístico para testar a hipótese em questão.
• Os dados de base estão devidamente balanceados?
Neste item, as características de base da amostra devem
ser descritas, a fim de expor ao leitor o entendimento
sobre os indivíduos envolvidos, para ser realizado
julgamento otimizado dos resultados, de sua relevância
e aplicabilidade clínica a pacientes com dados de base
semelhantes aos da amostra do grupo de tratamento.
O ponto-chave deste tópico é a observação acerca do
balanceamento entre os grupos, de modo a analisar se
houve equilíbrio entre os grupos ou se o desbalanço
é importante a ponto de suscitar interferência nos
achados do estudo.

434 DESCOMPLICANDO MBE


Tabela 1 - Exemplificação de dados de base
equilibrados entre os grupos do estudo

• A análise se deu pela atribuição original dos grupos?


Perceber se o plano de análise foi pelo princípio de
intenção de tratar, no qual são incluídos na análise
todos os pacientes que iniciaram o estudo, de forma
a preservar a randomização, com todos os indivíduos
analisados conforme alocados. Esse plano de análise
é preferível diante de avaliação de eficácia, diferente-
mente da análise por protocolo, em que se exclui quem
não seguiu o protocolo especificado para o seu grupo
(inclusive, pacientes que não realizaram o tratamento
de forma adequada por mau prognóstico, por exemplo).
É fundamental entender que nem todos do grupo
intervenção completam de fato o tratamento, além
de indivíduos do grupo controle que se utilizam do
tratamento. Esse crossover faz parte de qualquer tipo
de tratamento (afinal, isso ocorre no mundo real). A
exclusão dos que não cumpriram o protocolo pode
incorrer em conclusões equivocadas sobre o efeito real

COMO ANALISAR UM ARTIGO CIENTÍFICO 435


da intervenção, superestimando o efeito da interven-
ção, com resultados mais artificiais. Ademais, essa
conduta pode alterar o processo de randomização e
aumentar o risco de viés de confusão. Para a avaliação
de segurança, por sua vez, a análise por protocolo é
interessante, pois o que se deseja analisar são os efeitos
adversos de uma conduta, do modo que aqueles não
aderentes a conduta estariam “mascarando” os que
realmente foram sujeitos da conduta.
• Qual a relevância dos desfechos? Como avaliar as
análises auxiliares? Deve ser avaliado se a taxa de
desfechos foi suficiente para que o N fosse realmente
adequado; em não sendo, o estudo está mais suscetível
a erro do tipo II. Os resultados devem estar de acordo
com as diferenças propostas no cálculo do tamanho, as
quais devem ser clinicamente relevantes (razão de risco
relativo - RRR - de 20% ou mais). Então, fique esperto
diante de diferença encontrada em estudo sem poder
estatístico devido: se o estudo for muito pequeno, por
exemplo, para se atingir significância estatística (p <
0.05), uma diferença muito grande entre os grupos
deve ser encontrada, de maneira não plausível, tendo
o acaso como possível explicação. Além disso, um
valor de p limítrofe (muito próximo a 0.05) também
deve acender o alerta acerca da possibilidade de erro
aleatório.
Neste tópico, para cada desfecho primário e secundário,
devem ser explicitados os resultados de cada grupo e o
tamanho do efeito estimado com a precisão: para além do
valor de p, é imperioso analisar a precisão do intervalo de

436 DESCOMPLICANDO MBE


confiança (IC), o qual diz respeito à possibilidade de variabi-
lidade entre amostras, de modo a avaliar se ele cruza ou não
1 (sem diferença entre os grupos, efeito tanto faz). Quanto
maior a amostra também, mais preciso será o resultado e
mais estreito será o IC.
Sobre a análise dos desfechos em si, têm de ser vistos
em termos de importância: no geral, os desfechos de maior
relevância são denominados duros, diferentemente dos des-
fechos moles. Os desfechos duros comumente têm maior
objetividade (morte); já os moles podem ser um pouco mais
subjetivos (melhora da dor).
A conclusão do estudo deve ser dada pelo desfecho
primário pré-especificado (antes do início do estudo) e sua
consistência: relativamente à eficácia, uma evidência ideal
deve partir desse tipo de desfecho, com significância estatís-
tica. Desfecho secundário, por sua vez, funciona como gerador
de hipótese ou como um reforço a um resultado positivo,
não sendo gerador de conclusão. Pelos muitos desfechos
secundários analisados de forma simultânea, o problema
das múltiplas comparações amplia a probabilidade de efeito
gerado ao acaso, mesmo diante de valor de p significativo.
Desse modo, desfechos secundários não podem ser vistos
como verdadeiros de forma definitiva, sendo apenas um
resultado parcial que carece de teste próprio em outros
estudos.
Outro aspecto a ser compreendido é o de análises
adicionais de subgrupo: é importante se ater somente à
sugestão de hipótese, não sendo resultado que comprova
eficácia e que promove conclusão definitiva, ainda mais em

COMO ANALISAR UM ARTIGO CIENTÍFICO 437


estudos com resultado negativo para o desfecho primário
pré-especificado.
Por fim, em um último passo de análise de ECR, a dis-
cussão deve compilar as limitações do trial (é bom comparar
às limitações advindas de sua leitura), a generalização dos
achados do estudo clínico, a interpretação dos resultados
(segundo a hipótese testada, incluindo balanço entre
benefícios e danos) e o sumário com conclusões sobre as
implicações clínicas relevantes.
Além do enunciado CONSORT, há uma ferramenta
muito útil e versátil que é a RoB 2 da Cochrane (também
disponível online), a qual avalia risco de viés de estudos
randomizados (a partir de 05 domínios) a fim de enquadrá-los
em baixo risco, em um cenário de algumas preocupações ou
em alto risco de viés. São estes os domínios:
• Decorrente do processo de randomização: avaliar se
sequência de alocação foi aleatória ou não, se houve
ou não ocultação da sequência até à matrícula dos
participantes e designação para intervenção, e ainda
se os grupos na linha de base/baseline foram ou não
equilibrados;
• Devido a desvios das intervenções pretendidas:
avaliar se houve cegamento dos participantes, dos
cuidadores e das pessoas que prestaram as interven-
ções, quanto à intervenção designada para cada grupo;
analisar se houve balanceamento desses desvios entre
os grupos e se houve falha em analisar os participantes
nos grupos para os quais foram randomizados (ver se
seguiu ou não o princípio de intenção de tratar);

438 DESCOMPLICANDO MBE


• Consequente da falta de dados: avaliar se resultado
não se tornou enviesado pela falta de dados;
• Na medição do desfecho: conferir se método de men-
suração foi adequado, se diferiu entre os grupos do
estudo e se os avaliadores de desfecho estavam cientes
ou não da intervenção recebida pelos participantes;
• Na seleção do resultado reportado: avaliar se houve e
se foi seguido plano de análise pré-especificado, além
das medidas e das múltiplas análises em relação aos
resultados.
Assim, conforme trabalhado nos tópicos acima, é
primordial que o leitor se inteire sobre os conhecimentos
básicos para leitura e interpretação de um ECR, a fim de
otimizar o olhar aguçado acerca de uma das evidências de
maior robustez e qualidade.

COMO ANALISAR CRITICAMENTE UMA


REVISÃO SISTEMÁTICA OU METANÁLISE?

As Revisões Sistemáticas (RS) com ou sem metanálises


são consideradas o topo da hierarquia de evidências para
responder perguntas clínicas existentes. Elas consistem em
evidências secundárias, que compilam e sumarizam resulta-
dos obtidos em pesquisas científicas. A Revisão Sistemática
possui uma metodologia rigorosa e bem definida e precisa-
mos estar atentos a isto quando vamos analisar esse tipo de
artigo. Abaixo descreveremos um passo a passo para leitura
crítica de uma revisão sistemática ou metanálise, baseado
nos critérios contidos no PRISMA checklist, que pode ser

COMO ANALISAR UM ARTIGO CIENTÍFICO 439


acessado online, perpassando as principais especificações
na metodologia e nos resultados do estudo.

Figura 7 - Elementos fundamentais na leitura


de uma Revisão Sistemática ou Metanálise

• Esta revisão tem um protocolo pré-definido? Todo


estudo científico precisa de um protocolo estabelecido

440 DESCOMPLICANDO MBE


a priori e não é diferente com revisões sistemáticas.
Devemos procurar no artigo se houve elaboração de
um bom protocolo de revisão e onde ele pode ser lido,
junto com o número de registro dessa revisão.
Qual a importância disso? Não é incomum observar-
mos estudos publicados que tiveram mudança em relação ao
protocolo original, mas falham em informar essa alteração no
texto publicado. E o que isso afeta na leitura? As mudanças
de protocolo podem, por exemplo, terem ocorrido por conve-
niência autoral para modificar os resultados, antes negativos,
para algum achado significativo. Também, em uma revisão
sistemática, o protocolo garante a reprodutibilidade daquela
pesquisa e dá maior confiabilidade aos resultados.
• Quais foram os critérios de elegibilidade dos estudos?
O artigo precisa informar quais características deve
conter a metodologia dos estudos elegíveis para análise,
como desenho do estudo (ensaios clínicos de interven-
ção, estudos observacionais de fatores prognósticos,
entre outros); população estudada; intervenção apli-
cada; desfechos observados; duração de seguimento,
entre outros. E, além disso, deve citar critérios do
artigo em si, como anos de publicação considerados
na busca; idioma original do texto e seu status de
publicação (artigo já publicado ou pré-print). A saber, é
importante que tais critérios estejam definidos a priori
no protocolo da revisão.
Nesse momento, devemos atentar para alguns pontos:
os critérios de elegibilidade devem fornecer boa sensibilidade
para seleção dos artigos. Isto é, precisam ser critérios capazes
de selecionar para análise inicial a maior quantidade de

COMO ANALISAR UM ARTIGO CIENTÍFICO 441


estudos relevantes na área. Esses quesitos complementam
a necessidade de uma estratégia de busca abrangente, como
será descrito.
Além disso, avaliar o status de publicação consiste em
definir se também foi feita uma busca por estudos ainda não
publicados. Essa é uma abordagem importante em revisões
sistemáticas, pois podem existir estudos em andamento
com previsão de publicação próxima e que poderiam ser
incluídos na análise. Ademais, a solicitação de estudos não
publicados a editoras é uma forma de minimizar o problema
do viés de publicação.
• Quais as fontes de informação utilizadas? A RS
que você está lendo descreve com clareza todas as
fontes de dados coletadas? Ela deve informar quais
foram as bases de dados eletrônicas pesquisadas
(MedLine, EMBASE, LILACS, entre outras), além de
outros métodos que possam ter sido utilizados para
coleta de estudos elegíveis, como contato direto com
autores de pesquisas em andamento ou com editores de
periódicos para acesso a estudos não publicados. Além
disso, existem plataformas online (ex.: clinicaltrials.
gov) que contêm informações sobre ensaios clínicos
em andamento e elas podem ser acessadas a fim de
coletar dados de estudos não publicados.
Uma revisão sistemática deve evitar realizar a pesquisa
em somente uma base de dados e procurar também outras
fontes de evidências além das bases eletrônicas (inclusive
entrar em contato com indústrias farmacêuticas, especialistas
na área, entre outros).

442 DESCOMPLICANDO MBE


• O artigo informa a estratégia de busca realizada?
Nesse ponto, deve-se informar os termos que foram
inseridos na pesquisa de estudos elegíveis; os critérios
limitantes na busca (se presentes) e até mesmo as datas
de realização da busca.
Essa etapa é essencial para garantir reprodutibilidade
da metodologia. Além disso, precisamos analisar se essa foi
uma estratégia abrangente o suficiente para selecionar os
principais estudos sobre o assunto.
• Como se deu o processo de seleção dos estudos?
É importante que uma RS descreva como foram
selecionados os estudos elegíveis e como essa amostra
foi eventualmente reduzida aos estudos incluídos na
revisão ou metanálise. Os resultados obtidos com
esse processo pode ser identificado num diagrama de
fluxo, geralmente apresentado na seção de Resultados.
Esse processo idealmente deve ser realizado por dois
pesquisadores de forma independente e cega. De uma forma
geral, os autores realizam o processo de busca padrão e
selecionam os estudos encontrados. Após exclusão dos
duplicados, é inicialmente realizada uma leitura do título e
resumo dos estudos, selecionando aqueles que preenchem
os critérios de elegibilidade (etapa de screening inicial).
Em seguida, os estudos dessa amostra são lidos na
íntegra por cada pesquisador de forma independente, que
decide se o estudo deve ou não ser incluído na análise final.
Em casos de discordância, a metodologia deve descrever como
esta foi resolvida, se através de consenso ou com auxílio de
um terceiro pesquisador.

COMO ANALISAR UM ARTIGO CIENTÍFICO 443


• Como se deu a coleta de dados dos estudos indivi-
duais? Aqui devemos procurar quais foram os dados
extraídos de cada estudo e, caso tenha sido necessário,
como lidaram com dados faltantes. Na seção de resulta-
dos, eles podem ser apresentados através de uma tabela
de comparação, o que facilita a leitura das característi-
cas clínicas e metodológicas dos estudos selecionados.
Além disso, essa tabela permite ao leitor fazer uma
avaliação crítica sobre suas semelhanças e diferenças,
bem como julgar brevemente sua metodologia.
Nesse ponto, o processo de coleta dos dados deve seguir
um padrão determinado previamente para reduzir o risco
de vieses. Assim, é necessário que sejam pré-especificados
os dados que serão extraídos, bem como pode ser definido
um formulário objetivo para coleta de dados.
• Os estudos selecionados foram avaliados acerca de
sua qualidade metodológica? Essa é uma etapa de
grande importância dentro das revisões sistemáticas
e consiste em avaliar em cada estudo individualmente
o risco dos principais vieses a que estão sujeitos. Isso
porque a qualidade de uma RS depende diretamente
da qualidade dos estudos primários que a compõem.
O ideal é que esta etapa também seja realizada por dois
pesquisadores de forma independente e, de preferên-
cia, utilizando as ferramentas apropriadas para esta
finalidade. Existem checklists validados que ajudam
a classificar os estudos em alto, baixo ou incerto risco
de viés, como é o caso do Risk of Bias 2 Tool (RoB 2) da
Colaboração Cochrane para avaliação da qualidade
de ensaios clínicos randomizados.

444 DESCOMPLICANDO MBE


Os resultados obtidos nessa etapa podem ser descritos
em uma tabela avaliando risco para os principais vieses em
cada estudo individual na seção de Resultados. É importante
que o estudo esclareça também como essas informações serão
usadas na síntese dos dados (se, por exemplo, eles irão excluir
da análise os estudos de baixa qualidade metodológica).
Quando analisamos esses pontos na metodologia de
uma revisão sistemática, procuramos definir se este estudo
possui validade interna, se existe confiabilidade nos resul-
tados que serão apresentados.
Após a análise de confiabilidade do estudo, se você
julgou a sua qualidade adequada, podemos partir para a
avaliação da relevância das informações que ele contém.
Sim, estou falando dos Resultados, a seção que até então você
julgava a mais importante de um artigo. E, de fato, ela carrega
sua importância, mas aqui também precisamos ser capazes
de identificar a sua relevância e quais os impactos para a
prática clínica. Vejamos alguns pontos que não podemos
deixar passar despercebidos nesta seção:
• O artigo traz um diagrama de fluxo? Trata-se de
uma representação gráfica do processo de seleção
dos estudos, informando a quantidade de estudos
encontrados e avaliados para elegibilidade, e quantos
destes foram incluídos na análise. É importante que
seja especificado também as razões de exclusão dos
estudos em cada etapa. Um exemplo desse diagrama
pode ser observado na figura 08 abaixo:

COMO ANALISAR UM ARTIGO CIENTÍFICO 445


Figura 8 - Diagrama de fluxo dos estudos

Esses dados não precisam, necessariamente, estar na


forma de gráfico, e podem também ser descritos no corpo
do texto.
• Quais os dados extraídos dos estudos incluídos?
Nesse momento, o leitor deve avaliar quais informações
de cada estudo foram apresentadas: tamanho amostral;
intervenção aplicada; quais os desfechos avaliados
nos grupos estudados; tempo de seguimento; e outras
características clínicas e metodológicas relevantes.
Podem estar expostos numa tabela que serve de com-
paração entre os estudos.
• O artigo expõe de forma clara os resultados indivi-
duais de cada estudo? É importante que a RS descreva,
para cada um dos estudos incluídos, os resultados
observados para cada desfecho (positivo ou negativo)
avaliado. Isso inclui informar a quantidade de eventos
registrada em cada grupo; a medida de associação
resultante (risco relativo, por exemplo) com respectivo

446 DESCOMPLICANDO MBE


intervalo de confiança e valor de P. Esses dados podem
estar sumarizados num gráfico de floresta (do inglês,
forest plot), como exemplificado na figura 09.
• O estudo realizou a síntese dos dados em uma meta-
nálise? Nesse caso, teremos, além dos dados indivi-
duais, uma compilação quantitativa dos resultados
de cada estudo em uma medida sumária com seu
respectivo intervalo de confiança. É importante que o
modelo estatístico usado esteja descrito na metodologia
do artigo (um modelo de efeitos fixos ou de efeitos
aleatórios).

Figura 9 - Forest plot contendo os resultados de


cada estudo e a medida sumária da metanálise.

• O estudo traz uma análise da heterogeneidade? Esse


é um item importante nas metanálises, pois o ideal
é que sejam compilados estudos semelhantes entre
si, tanto em suas características clínicas (população,
intervenção, desfecho…) como metodológicas (desenho
do estudo, cegamento…). Existem cálculos estatísticos

COMO ANALISAR UM ARTIGO CIENTÍFICO 447


a serem usados para avaliar a heterogeneidade. O
principal deles é o teste de qui-quadrado e em seguida
calculamos o valor de p desse teste. A hipótese nula
nesse caso é que não há diferença entre os estudos, logo,
quando p < 0,05 temos que a hipótese nula é rejeitada e a
heterogeneidade é considerável, o que pode prejudicar
nossa interpretação dos resultados. Além disso, pode-
mos quantificar a magnitude dessa heterogeneidade
através da estatística I , a qual consideramos aceitável
2

abaixo de 40%.
Na figura 09 acima, observamos que o valor de P não
obteve significância estatística, então ficamos com a hipótese
nula de que os estudos são homogêneos. Além disso, o valor
de I é nulo, indicando não haver diferenças entre os estudos
2

além do esperado pelo acaso.


• Foi realizada uma avaliação do risco de viés de
publicação? Esse é o principal viés que devemos estar
atentos em revisões sistemáticas e temos duas formas
de avaliá-lo: através de uma medida visual com o
gráfico de funil (funnel plot) ou através de cálculos
estatísticos (teste de Egger ou teste de Begg).
O gráfico de funil é uma representação visual dos
resultados do estudo de acordo com a sua precisão. No eixo
X temos o valor da medida de associação do resultado do
estudo e no eixo Y temos um valor da precisão do estudo
(que tem relação com o seu tamanho, estudos maiores são
mais precisos). O que devemos observar nesse gráfico é a
sua simetria. Na porção inferior, estão os estudos de menor
tamanho, e esperamos que eles apresentem os resultados
mais variados (positivos e negativos de forma semelhante),

448 DESCOMPLICANDO MBE


pois estão mais sujeitos ao erro aleatório. Assim, suspeitamos
do viés de publicação quando este gráfico é assimétrico,
sobretudo favorecendo estudos positivos. Na figura 10 abaixo,
vemos um exemplo de funnel plot que nos faria suspeitar do
viés de publicação.

Figura 10 - Gráfico de funil.

Além disso, os testes de Egger ou Begg fazem o cál-


culo da significância dessa distribuição dos estudos, se ela
deve-se ao acaso ou não. Quando P < 0,05 nesses testes, há
uma sugestão de efeito do viés de publicação.
• O estudo realizou análises adicionais? Isto é, foram
feitas análises de sensibilidade com subgrupos de
artigos ou meta-regressão? Essas análises adicionais
são importantes para validar os resultados encon-
trados. Se esse foi o caso, essas análises devem estar
especificadas previamente no protocolo e devem ser
descritas de forma clara.
Nesse contexto, as análises de sensibilidade que reagru-
pam os estudos são definidas de forma subjetiva pelo autor
da análise: pode separar estudos de baixo versus alto risco
de viés; ou de acordo com a dosagem usada da medicação,

COMO ANALISAR UM ARTIGO CIENTÍFICO 449


entre outros. Por outro lado, a meta-regressão é uma análise
estatística que permite incluir as covariáveis do estudo e
avaliar sua influência no resultado.
Por fim, a nossa última etapa é a leitura da discus-
são, a qual deve conter uma sumarização dos resultados
obtidos, a força dessa evidência para o desfecho avaliado e
quais as populações que se beneficiaram desse resultado. É
importante que sejam discutidas nessa seção as limitações
encontradas na elaboração da RS, como a qualidade dos
estudos incluídos; as falhas na metodologia (caso existam e o
porquê, e nesse momento você deve comparar com as falhas
que você identificou); a heterogeneidade; a possibilidade de
viés de publicação, entre outras considerações a respeito da
interpretação dos resultados.
Por último, a conclusão do estudo deve ser um pará-
grafo sucinto retomando a interpretação geral dos resultados
e seu impacto e relevância. Nesse momento, precisamos
ressaltar que nem sempre uma revisão vai responder com
clareza a pergunta clínica, e nesses casos sua principal função
é denunciar a necessidade da realização de mais estudos de
boa qualidade metodológica na área de estudo.

CONCLUSÃO

Em um mundo de rápida disseminação de conheci-


mentos e ampla produção científica, não adianta apenas ter
em mãos as evidências disponíveis, mas saber interpretá-las
criticamente. Nesse contexto, quando pensamos na con-
fiabilidade dos resultados, estamos falando especialmente
da análise da qualidade da metodologia do estudo e dos
seus potenciais riscos de vieses. Estudos de boa qualidade

450 DESCOMPLICANDO MBE


possuem resultados mais próximos da verdade e são neles
que devemos nos basear para tomar condutas.
Este capítulo é um passo introdutório para análise
crítica das evidências e aplicar essas estratégias na leitura de
artigos é o ideal para facilitar a assimilação desses conheci-
mentos. Você pode complementar alguns conceitos lendo os
capítulos específicos deste livro destinados a cada desenho
de estudo abordado, bem como com a leitura do capítulo
de Erros e Vieses.

REFERÊNCIAS

BERWANGER, O. et al. Como avaliar criticamente revisões sistemá-


ticas e metanálises?. Rev. bras. ter. intensiva, São Paulo, v. 19, n. 4, p.
475-480, Dec. 2007.

BIGBY, M., WILLIAMS, H. Appraising Systematic Reviews and


Meta-analyses. Arch Dermatol. 2003;139(6):795–798. doi:10.1001/
archderm.139.6.795

CORREIA, L.C. Estudos Observacionais: quando confiar, desconfiar


ou descartar?. Medicina Baseada em Evidências, 2 de nov. de 2018.
Disponível em: <http://medicinabaseadaemevidencias.blogspot.
com/2018/11/estudos-observacionais-quando-confiar.html>. Acesso
em: 22/06/2020.

CORREIA, L.C. O Problema das Múltiplas Comparações. Medicina


Baseada em Evidências, 23 de out. de 2016. Disponível em: <https://
medicinabaseadaemevidencias.blogspot.com/2016/10/o-fenomeno-es-
tatistico-do-problema-das.html>. Acesso em: 30/06/2020.

CORREIA, L.C. Por que os resultados da maioria dos estudos


publicados são falsos?. Medicina Baseada em Evidências, 15 de abr. de

COMO ANALISAR UM ARTIGO CIENTÍFICO 451


2017. Disponível em: <https://medicinabaseadaemevidencias.blogspot.
com/2017/04/por-que-os-resultados-da-maioria-dos.html>. Acesso em:
30/06/2020.

CRATO, A.N; VIDAL, L.F.; BERNADINO, P.A.; JÚNIOR, H.C.R.;


ZARZAR, P.M.P.A.; PAIVA, S.M.; PORDEUS, I.A. Como realizar uma
análise crítica de um artigo científico?. Arquivos em Odontologia,
40(1), 5-18, 2004.

GREENHALGH, T. How to read a paper: getting your bearings


(deciding what the paper is about). BMJ 1997; 315: 243.

HIGGINS, J.P.T.; THOMAS, J.; CHANDLER, J.; CUMPSTON, M.; LI,


T.; PAGE, M.J.; WELCH, V.A. Cochrane Handbook for Systematic
Reviews of Interventions version 6.0 (updated July 2019). Cochrane,
2019. Disponível em: <www.training.cochrane.org/handbook>.

MERKOW, R.P.; SCHWARTZ, T.A.; NATHENS, A.B. Practical Guide


to Comparative Effectiveness Research Using Observational Data.
JAMA Surg. 2020;155(4):349–350. doi:10.1001/jamasurg.2019.4395.

MOHER, D.; SCHULZ, K.F.; ALTMAN, D.G. The CONSORT


statement: revised recommendations for improving the qual-
ity of reports of parallel-group randomised trials. Lancet.
2001;357(9263):1191-1194.

SCHULZ, K.F.; ALTMAN, D.G.; MOHER, D. CONSORT 2010


Statement: updated guidelines for reporting parallel group ran-
domised trials. BMJ 2010; 340 :c332

SIQUEIRA, M.M. Iniciativa STROBE: subsídios para a comunicação


de estudos observacionais. Revista de Saúde Pública, São Paulo, v. 44,
n. 3, p. 559-565, 2010.

452 DESCOMPLICANDO MBE


SOUSA, M.R.; RIBEIRO, A.L.P. Revisão sistemática e meta-análise
de estudos de diagnóstico e prognóstico: um tutorial. Arq. Bras.
Cardiol., São Paulo, v. 92, n. 3, p. 241-251, Mar. 2009.

STERNE, J.A.C.; SAVOVIC, J.; PAGE, M.J.; ELBERS, R.G.; BLENCOWE,


N.S.; BOUTRON I. et al. RoB 2: a revised tool for assessing risk of
bias in randomised trials. BMJ 2019; 366:l4898.

ZIMERMAN, A.L. Evidence-Based Medicine: A Short History of a


Modern Medical Movement. AMA Journal of Ethics, Virtual Mentor.
2013;15(1):71-76.

COMO ANALISAR UM ARTIGO CIENTÍFICO 453


ERROS E VIESES

28 Augusto de Galvão e Brito Medeiros


Henrique de Paula Bedaque
Isadora Soares Lopes
Maria Paula Ribeiro Dantas Bezerra

INTRODUÇÃO

O
método científico consiste no conjunto de regras
e procedimentos realizados para elaboração
de um trabalho científico e objetiva investigar
alguma hipótese pré-existente. Quando falamos em desenho
de estudo, estamos nos referindo à sua abordagem metodo-
lógica, a este conjunto de características básicas e processos
empregados para testar uma hipótese.
Nesse contexto, um estudo pode apresentar um resul-
tado positivo ou negativo. Mas esta análise não deve ser assim
tão simples, precisamos ir além e analisar a veracidade dos
achados da pesquisa. Devemos ter em mente que o resultado
de uma pesquisa nem sempre se traduz em uma verdade

455
científica: muitas vezes aquilo que foi encontrado decorre de
um erro do estudo (viés) ou simplesmente do acaso.
A saber, uma associação encontrada pode decorrer de
três fatores: viés, acaso ou causa.
• Causa é quando existe de fato uma relação causal entre
as variáveis estudadas;
• O termo acaso refere-se a associações encontradas de
forma aleatória;
• E o viés representa erros decorrentes da metodologia
do trabalho e que podem, eventualmente, alterar de
forma significativa os resultados.
Ao longo deste capítulo nos ateremos à discussão sobre
essas duas últimas possibilidades e suas consequências
em um estudo. Além disso, iremos esclarecer o porquê da
necessidade de esmiuçar a metodologia de um artigo, como
identificar as possibilidades de viés e afastar a probabilidade
do acaso.

O QUE É ERRO?

Primeiramente, é preciso destacar que todo ato de


medição ou comparação está sujeito a erros, o que não neces-
sariamente significa que ocorreu algo errado no processo
de medição. Erro é a diferença entre o valor real do que
está sendo medido e o resultado encontrado, e pode ser
subdividido em erros aleatórios (decorrentes do acaso) e
erros sistemáticos (isto é, vieses), como apresentado na
Figura 1.

456 DESCOMPLICANDO MBE


Figura 1 – Tipos de erros

ERROS ALEATÓRIOS

Esses erros são aqueles que interferem em cada medida


individualmente de forma aleatória. Assim, os resultados
variam em torno do valor real. Eles são causados por flu-
tuações aleatórias no processo de medir, e prejudicam a
precisão do resultado. O erro aleatório é o resultado que se
deve ao acaso. Como geralmente observamos apenas uma
parcela da população, estamos sujeitos a encontrar alguma
associação restrita a esse grupo e que não se reproduz em
toda a população de interesse.

ERROS E VIESES 457


CABEÇA PENSANTEԝ

E você achava que só você tinha azar? Nada disso, o inesperado


pode ocorrer com qualquer pessoa e em qualquer estudo! Temos
que aprender a conviver com ele e o mais importante: ter
consciência de que existem erros aleatórios (obra do acaso) nos
torna melhores avaliadores de um estudo.

Vamos fazer uma comparação com o processo eleitoral:


as eleições oficiais contabilizam todos os votos e cada um
deles faz a diferença. Por outro lado, numa pesquisa eleitoral,
realizada com apenas uma parcela da população, há margem
para o erro e essa variabilidade, no meio científico, é chamada
de intervalo de confiança. Nessas situações, quanto maior
for a amostra, o grau de imprecisão do resultado tende a
ser menor.
Um outro exemplo de erro aleatório pode ser observado
no processo de medição do peso de uma criança inquieta:
como ela não consegue ficar parada, em dez medições serão
encontrados dez resultados diferentes. Entretanto, esses
valores variam em torno do peso real da criança (às vezes
para mais, às vezes para menos), o que gera uma amostra de
resultados imprecisos. Quanto mais medições forem feitas,
é de se esperar que os resultados encontrados sejam mais
fiéis à realidade.
Sendo assim, após compreender um pouco mais sobre
a natureza dos erros aleatórios, é importante entender como
estes repercutem na metodologia científica de um estudo.

458 DESCOMPLICANDO MBE


Os estudos são desenhados na tentativa de reforçar
ou refutar uma hipótese. Nesse teste, há sempre a hipótese
nula (H0), que frequentemente nega a existência de alguma
associação e é antagônica à hipótese alternativa (H1), a qual
afirma haver associação. Assim, tomando isso como base,
na elaboração de um estudo haverá duas opções: assumir a
hipótese nula como verdadeira; ou então rejeitá-la (Quadro 1).

Quadro 1 – Tipos de erro aleatório

Nesse momento, nossa decisão oscila entre rejeitar


a H0 ou não rejeitar a H0, e esta hipótese pode ou não ser
verdadeira. Vamos ver caso a caso as possibilidades:
• Quando o resultado do estudo rejeita a H0 e essa
hipótese é verdadeiramente falsa, tomamos a decisão
correta (o estudo descobriu a VERDADE).
• Quando o resultado do estudo rejeita a H0 e essa hipó-
tese é realmente verídica, nos deparamos com um erro
aleatório do tipo I (o estudo descobriu uma MENTIRA,
não há a associação supostamente encontrada).

ERROS E VIESES 459


• Quando o resultado do estudo aceita H0 e essa hipótese
é realmente verídica, tomamos a decisão correta (O
estudo descobriu a VERDADE).
• Quando o resultado do estudo aceita H0 e essa hipó-
tese é verdadeiramente falsa, nos deparamos com
um erro aleatório do tipo II (o estudo descobriu uma
MENTIRA; há sim associação, mas o estudo não foi
capaz de encontrá-la).
Com isso, observamos que o resultado de um estudo
pode: 1) encontrar uma associação que realmente existe; 2)
encontrar uma associação que não existe (Erro tipo I); ou ainda
3) não encontrar uma associação verdadeira (Erro tipo II).
Você consegue imaginar qual dessas três possibilidades
representa pior desfecho para a prática clínica?
De fato, admitir como verdadeira uma associação ine-
xistente pode trazer consequências negativas para a prática
clínica, como a iatrogenia de prescrever um tratamento sem
benefício comprovado. Assim, nos parece mais prudente
sempre partirmos do princípio de aceitar a hipótese nula,
e o resultado do estudo deveria então comprovar o oposto.
É como na justiça brasileira: o réu é considerado inocente
até que se prove o contrário.
Numa outra análise: o erro do tipo I é um falso positivo
e a probabilidade de sua ocorrência é conhecida como nível
de significância ou alfa (α). De forma arbitrária, seguindo o
princípio de minimizar esse tipo de erro, o nível de signifi-
cância aceitável é de até 5%. Os testes estatísticos calculam a
probabilidade de um evento ocorrer assumindo-se que a hipótese
nula seja verdadeira. Não por coincidência, essa probabilidade

460 DESCOMPLICANDO MBE


é conhecida como valor de ρ, e se, quando calculada, este
valor é inferior ao nível de significância, pode-se rejeitar a
hipótese nula e aceitar a hipótese alternativa, que afirma
haver diferença ou associação entre os grupos estudados. De
modo simples, aceitamos até 5% a probabilidade de encontrarmos
uma associação decorrente do acaso.

CABEÇA PENSANTEԝ

Usar um alfa de 5% significa que em 5% das vezes que o


estudo rejeita a hipótese nula ele está MENTINDO, mas acha que
encontrou uma verdade.

Por outro lado, o erro do tipo II refere-se a um falso


negativo, isto é, aceitar a hipótese nula quando na verdade
ela é falsa. O risco de erro tipo II é também conhecido como
erro do tipo beta (β) e a ele se relaciona o poder de associação.
Convencionalmente, são aceitáveis estudos com um poder
de associação maior ou igual a 80%, admitindo-se um valor
máximo de erro do tipo β de 20%.

CABEÇA PENSANTEԝ

Usar um beta de 20% significa que em 20% das vezes que um


estudo não consegue rejeitar a hipótese nula ele está EQUIVOCADO,
pois na verdade a afirmação seria verdadeira, mas o estudo não
obteve poder estatístico para achar a verdade.

Vamos analisar isso num estudo hipotético que pro-


curou avaliar a relação entre tabagismo e CA de pulmão
(já sendo bem conhecida uma relação causal entre os dois).
Agora imagine que a resposta obtida foi H0 (fumar não causa

ERROS E VIESES 461


CA de pulmão). Nessa situação, nós percebemos facilmente
que estaríamos aceitando a hipótese nula mesmo ela sendo
FALSA (falso negativo). Como poderíamos nos prevenir desse
tipo de erro? Vendo o valor de beta, que para esse estudo
hipotético foi de 38%, bem acima do aceitável 20%. Assim,
quando a hipótese H0 for a vencedora, vale a pena atentar
para o valor de beta.
De forma semelhante, imagine agora um estudo que
buscou saber se beber água causa CA de pulmão e a res-
posta encontrada foi H1 (água causa CA de pulmão). Nós
percebemos facilmente que estaríamos aceitando a hipótese
alternativa mesmo ela sendo falsa (falso positivo). Como
poderíamos nos prevenir desse erro? Vendo o valor de alfa,
que para esse estudo hipotético foi de 12%, bem acima do
aceitável 5%. Perceba que o autor tentou nos enganar e só
quem entende de estatística conseguiria sair dessa armadilha.
Assim, quando a hipótese H1 for a vencedora, vale a pena
atentar para o valor de alfa.
Portanto, diante desses exemplos hipotéticos extremos,
porém esclarecedores, concluímos que é pior para a prática
clínica encontrar uma associação que não existe do que deixar de
encontrar uma associação verdadeira. Isso porque esta última
situação não modifica nossas condutas (o tratamento padrão
continua mantido), enquanto que uma associação falsa pode
dar um novo rumo “errôneo” à ciência, ocasionalmente
modificando nossas condutas.

462 DESCOMPLICANDO MBE


CABEÇA PENSANTEԝ

É por esse motivo que toleramos um valor de beta (20%) bem


maior que o valor do alfa (5%), pois o alfa tem maior potencial
para modificar condutas, o que poderia resultar em maleficência
ao paciente.

ERROS SISTEMÁTICOS

Nesse tipo de erro, todos os resultados são deslocados


de uma forma parecida (“sistemática”), fazendo com que
os resultados variem em torno de outro valor, diferente do
real. Eles são causados por fontes externas que devem ser
investigadas e eliminadas, pois prejudicam a exatidão do
resultado. Dessa forma, os erros sistemáticos, diferentemente
dos erros aleatórios, são mais previsíveis e podem ser evitados
mais facilmente!

Figura 2 – Erros de exatidão e precisão

ERROS E VIESES 463


Usando o mesmo exemplo da medição do peso da
criança, um exemplo de erro sistemático seria o uso de uma
balança descalibrada, que sempre mostra 5kg a menos: as
variações nesse caso não serão em torno do peso real da
criança, mas sim em torno do seu peso subtraído de 5kg.
Um outro exemplo desse tipo de erro pode ser obser-
vado no estudo ROCKET-AF, que comparou o uso de rivaro-
xabana versus varfarina em fibrilação atrial não valvar. Em
sua análise primária para um desfecho composto por AVE
isquêmico ou hemorrágico e embolismo sistêmico, o estudo
evidenciou que a rivaroxabana foi não inferior à varfarina.
Porém, meses após a publicação de seu artigo principal, foi
reportado que o medidor de INR usado no estudo estava
defeituoso, e que o tratamento assumido como “padrão”
com varfarina, após cálculos de correção, na verdade tornava
questionável o achado de não inferioridade da rivaroxabana.
Nesse contexto, o erro sistemático, que é mais usual-
mente expresso pelo termo viés, é principalmente decorrente
de falhas na metodologia e execução de um estudo e pode
ocorrer em diversas etapas do estudo, como abordaremos
adiante.

TIPOS DE ERROS SISTEMÁTICOS (VIESES)

VIESES RELACIONADOS À INTERVENÇÃOԝ

V I ÉS DE CON FUSÃO OU CON FU N DI M E N TO

Ao estudar a relação entre dois eventos (entre uma


determinada exposição e, por exemplo, alguma doença),
costuma-se controlar o ambiente em investigação, a fim

464 DESCOMPLICANDO MBE


de excluir influências externas sobre tal interação. O viés
de confusão ou confundimento ocorre quando os resultados
da associação entre dois fatores (exposição e desfecho) são
influenciados por uma uma terceira variável não levada em
consideração, a variável de confundimento.
Imagine um estudo que avalia a incidência de câncer
de orofaringe em duas populações: uma de etilistas crônicos
e uma que não faz uso de álcool. O resultado encontrado é
que há uma maior incidência de câncer nos etilistas crônicos,
levando-nos a crer em uma associação direta entre álcool e
câncer de orofaringe. Entretanto, é preciso levar em conside-
ração que os etilistas crônicos estão mais propensos a possuir
outros hábitos que podem ter favorecido esse resultado,
como, por exemplo, o tabagismo.
Analisando mais atentamente, é possível perceber que
no grupo dos etilistas crônicos, “80% desta população” era
tabagista, enquanto no grupo dos não etilistas “apenas 15%”.
Nesse caso, o tabagismo é uma variável de confundimento.
Sendo assim, questionamos até que ponto o aumento na
incidência do câncer de orofaringe foi devido ao álcool ou ao
consumo de tabaco. Portanto, é recomendado para a análise
crítica de qualquer estudo associando dois fatores a indagação
sobre outros fatores “ocultos” ocasionalmente gerando um
viés de confusão.
Esse tipo de viés ocorre de forma recorrente em estudos
observacionais, e esse é um dos grandes motivos que os
tornam inadequados para testar eficácia de um tratamento.
Vamos imaginar, então, uma coorte que comparou dois
grupos de pacientes com uma determinada doença em que
um grupo utilizou uma medicação X e o outro não. Se, nessa

ERROS E VIESES 465


situação, o primeiro grupo apresenta melhora significativa,
isso não é suficiente para atribuir tal melhora à droga. Vamos
entender o porquê!
Diversas variáveis de confusão podem estar agindo
por trás desse resultado e serem os verdadeiros responsáveis
pela melhora. Será que o grupo que utilizou a medicação
não tinha uma doença menos grave, e por isso os médicos
acabaram fazendo o tratamento naqueles pacientes? Será
que a droga estava sendo disponibilizada por um hospital
mais equipado (portanto aqueles que a receberam também
estavam recebendo melhores cuidados médicos)? Será que os
que realizaram o tratamento não eram mais novos, tinham
menos comorbidades, e por isso melhoraram mais rápido?
São tantos “serás” que quase nenhuma conclusão pode
ser tomada. Por isso, o desenho ideal para teste da eficácia de
uma droga é o Ensaio Clínico Randomizado. Ao randomizar
de forma aleatória os pacientes para um grupo de intervenção
ou placebo, é esperado que se elimine de vez as variáveis de
confusão, pois os dois grupos seriam balanceados em suas
características clínicas (idade, comorbidades, gravidade da
doença, centros em que foram tratados...). Espera-se que
a randomização equilibre os dois grupos tanto em carac-
terísticas conhecidas como desconhecidas, assim, a única
diferença entre eles é o fato de um tomar a droga e o outro
não. Logo, podemos atribuir os resultados encontrados ao
tratamento implementado.
Por outro lado, felizmente, existem algumas formas de
minimizar (mas não eliminar) as variáveis de confusão na
elaboração de um estudo observacional, entre tais métodos:
o pareamento, a especificação e a estratificação.

466 DESCOMPLICANDO MBE


• O pareamento é uma ferramenta muito usada em
estudos caso-controle. Nele, o pesquisador avalia
variáveis de confusão em ambos os grupos, casos
e controles, buscando equilibrá-las. Por exemplo:
ao estudar as causas de AVE (Acidente Vascular
Encefálico), assumindo que a idade é uma provável
variável de confusão, procura-se parear cada paciente
de 70 anos e que teve um AVE com um participante
“controle” de idade semelhante sem AVE prévio.
• Na especificação, muito usada em estudos de coorte,
são incluídos no estudo apenas participantes que
não apresentem a variável de confusão. Por exem-
plo, tomando novamente a idade como variável de
confusão, uma coorte que avalie o risco de AVE em
pacientes sedentários ou fisicamente ativos poderia
usar como critério de seleção amostral uma idade
entre 40 e 60 anos. Contudo, vale destacar que uma
limitação desse método ao selecionar um grupo tão
restrito é o comprometimento de sua validade externa,
e um resultado atribuído àquela “minipopulação”.
• Já na estratificação, os dados obtidos seriam estrati-
ficados por grupo etário (ou seja, a associação entre
AVE seria analisada para cada faixa etária definida).
Se diferentes grupos etários mostrarem riscos relativos
muito discrepantes, a idade deve ser entendida como
uma variável de confusão.

V I ÉS DE DESE M PE N HO OU PER FOR M A NCE

O viés de desempenho ocorre quando um grupo tem


melhor desempenho em relação ao outro não pela variável

ERROS E VIESES 467


estudada, mas por interferências externas. Esse viés ocorre
com frequência em estudos abertos, por uma co-intervenção
do pesquisador (mesmo que involuntária), ou quando o
tratamento experimental traz consigo maior atenção da
equipe médica.
Imagine um estudo aberto em que comparamos a
eficácia de uma droga em relação ao placebo no tratamento
da obesidade, alocando pacientes obesos em dois grupos. Em
teoria, os dois grupos deveriam receber as mesmas orien-
tações sobre mudanças de estilo de vida. Entretanto, se os
pesquisadores conhecem o grupo no qual aquele paciente
X está alocado, por interesse em obter resultados positivos
em relação à droga, eles podem orientar mais incisivamente
os participantes do grupo experimental sobre melhorias na
alimentação e prática de atividade física, o que levaria a um
melhor desempenho deste grupo.
Logo, a fim de evitar esse tipo de situação, um estudo
deve ser idealmente duplo-cego, isto é, nem os participantes
nem os pesquisadores conhecem o grupo no qual o paciente
está alocado. Contudo, é preciso destacar que isso nem sem-
pre é possível. Em um estudo que compara a eficácia de
uma cirurgia em relação ao uso de determinada droga, por
exemplo, o cirurgião precisa identificar qual o paciente que
está sendo submetido à cirurgia, e o paciente é consciente
de que está realizando um procedimento cirúrgico ou não.

V I ÉS DA I N T ER PR ETAÇÃO D OS DA D OS

Para entender o viés da interpretação dos dados, é


necessário entender os dois tipos de análise usados para a
interpretação de ensaios clínicos: a análise per protocol (em

468 DESCOMPLICANDO MBE


português, “por protocolo”) e a análise intention-to-treat (“por
intenção de tratar”). Em um ensaio clínico, os participantes
são randomizados e orientados para que sigam uma deter-
minada conduta: por exemplo, tomar um remédio duas vezes
ao dia (sendo que um grupo vai receber o princípio ativo e
o outro um placebo). Todavia, sabemos que eventualmente
tais condutas não são seguidas à risca pelos participantes,
seja porque esquecem de ingerir sua medicação ou porque
abandonam o tratamento. Essas nuances da vida real abrem
margem para duas formas de análise estatística.
De maneira simples, na abordagem per protocol os
pacientes não aderentes ao tratamento são excluídos da
análise. Por outro lado, na análise intention-to-treat impera
o princípio de incluirmos na análise todos os pacientes nos
grupos para o qual foram originalmente randomizados,
independente de adesão ao tratamento. Na prática clínica,
apesar das habilidades de comunicação e conhecimento
técnico do médico, a adesão de seus pacientes a um certo
tratamento não é seguramente garantida, decorrente de
uma série de fatores, seja posologia da medicação, grau de
efeitos adversos ou aspectos particulares do paciente. Assim
sendo, a análise por intenção de tratar é mais fidedigna à
realidade da assistência médica e preserva os princípios de
randomização de uma amostra.
Imagine um certo estudo sobre a eficácia de um novo
medicamento para o controle glicêmico no DM2, uma quantidade
importante de participantes não tomou a medicação estudada pois
ela apresentava um efeito colateral muito desagradável. Apesar
disso, sob uma análise per protocol, tornou-se evidente uma redução
importante nos níveis de HbA1c do grupo de intervenção.

ERROS E VIESES 469


Uma vez que a análise per protocol exclui os participan-
tes não aderentes, superestimamos o efeito do medicamento.
Assim, possivelmente, quando o fármaco estiver disponível
para uso em larga escala, não serão obtidos resultados tão
positivos quanto os verificados em nosso estudo, pois, na vida
real, muitas pessoas acabarão abandonando seu tratamento.
Além disso, a exclusão de pacientes não aderentes da análise
prejudica seriamente a randomização do estudo, visto que
podemos, por exemplo, estar excluindo os pacientes mais
graves.
Portanto, a análise per protocol pode ser interpretada
como “um viés de interpretação dos dados”, muito embora
ela possua seu valor, especialmente no que diz respeito
a estudos de não-inferioridade, comentado no respectivo
capítulo.

ERROS NA APLICAÇÃO DA
INTERVENÇÃO E CONTROLE

Na elaboração de um ensaio clínico, a randomização


permite equilibrar os grupos estudados em relação às suas
variáveis, de tal forma que a diferença entre eles seja apenas
na intervenção aplicada (permitindo o teste de nossa hipótese).
Quando avaliamos as diferenças de tratamento, devemos
comprovar se houve realmente um contraste entre os grupos
nesse quesito. O que ocorre se as metas de intervenção pla-
nejadas não são alcançadas? É nesse contexto que ocorrem
vieses por erros na execução do estudo e na aplicação de sua
intervenção.
Um dos exemplos que podemos citar nesse contexto foi o
estudo SPRINT. Esse foi um ensaio clínico que randomizou pacientes

470 DESCOMPLICANDO MBE


em dois grupos para o tratamento de hipertensão: um grupo padrão,
cuja meta era manter uma pressão arterial sistólica (PAS) abaixo de
140 mmHg; e um de tratamento intensivo, cuja meta era uma PAS
abaixo de 120 mmHg. Certamente, para manter uma PAS mais baixa
é necessário um engajamento maior dos pacientes, mais medicações
e um controle pressórico mais intenso. Imagine, então, que esse
grupo intensivo tivesse falhado em manter níveis pressóricos mais
baixos (na faixa de 120 mmHg) e não se observasse uma diferença
entre a PAS média do grupo padrão e do grupo intensivo ao longo
do estudo. Nessa situação, os resultados não seriam frutos de uma
intervenção diferenciada, e por isso haveria um erro na aplicação
da intervenção.
Ao analisarmos um estudo, devemos buscar infor-
mações (em gráficos, tabelas ou de forma descritiva) que
comprovem o contraste entre os grupos e confirme um
diferencial na aplicação da intervenção.
Imagine agora um estudo onde pacientes obesos foram
randomizados em grupos de atividade física moderada e
de atividade física intensa (que seriam monitorados pela
frequência cardíaca (FC) e gasto calórico do exercício) com
o intuito de avaliar qual grupo teria maior perda de peso
percentual ao final do seguimento. Sabe-se que a intensidade
do exercício físico pode ser moldada por diversas limitações
corporais e a obesidade é muitas vezes um empecilho para a
prática de atividades mais extenuantes. Assim, se não é obser-
vada uma diferença significativa na FC e no gasto calórico
por exercício entre os grupos moderado e intenso, é preciso
questionar se a intervenção proposta foi realmente efetiva
(ou seja, se um grupo estava realmente praticando exercício
de maior intensidade) e isso põe em xeque a credibilidade

ERROS E VIESES 471


de nossa análise diante da ocorrência do erro de aplicação
da intervenção.
Uma outra situação pertinente a ser mencionada nesse
contexto é quando a metodologia do estudo não determina
um protocolo padrão de cuidados entre os dois grupos.
Imagine aqui um estudo multicêntrico e randomizado ela-
borado para avaliar a eficácia de um tratamento experimental
versus placebo em pacientes com quadro grave de COVID-19 e
internados em Unidade de Terapia Intensiva (UTI). O protocolo
do estudo então define que a terapia de suporte foi determinada “a
critério médico” e não estabelece nenhum padrão de tratamento
ou parâmetros vitais que deveriam ser respeitados nos pacientes.
Nessa ocasião, não temos como garantir que os dois
grupos receberam suporte de UTI semelhante e que a dife-
rença de atenção entre os dois grupos deveu-se somente
à terapia em teste. É possível, nessa situação, que o grupo
experimental tenha recebido suporte mais especializado,
modificando assim os resultados.

VIESES RELACIONADOS AO DESFECHO

Após uma abordagem minuciosa da população do


estudo, da aplicação da intervenção e outros fatores de análise,
ainda estamos suscetíveis aos infortúnios de vieses relacio-
nados ao desfecho, também chamado de evento. Os desfechos
são as variáveis monitorizadas no estudo que demonstram
o impacto de determinada intervenção, por exemplo, morte
por evento cardiovascular.
O primeiro ponto que devemos analisar é a escolha
dos desfechos em estudo: são eles subjetivos ou objetivos?

472 DESCOMPLICANDO MBE


Os desfechos subjetivos são aqueles que não podem ser
comprovados por um dado objetivo e são determinados
por uma percepção individual. Em contraponto, o infarto
agudo do miocárdio (IAM) com supra de segmento ST é um
exemplo de desfecho objetivo, pois é determinado por um
exame pontual e existe um dado específico que comprove
sua ocorrência (alteração eletrocardiográfica). Morte também
é um importante desfecho objetivo e não há margem para
falsa interpretação.
Desfechos subjetivos, por exemplo, tornam-se mais
ilustrativos na avaliação da eficácia de medicamentos anti-
depressivos com base na autopercepção do paciente quanto
aos seus sintomas. Nessa situação, uma forma de otimizar
essa análise seria através da aplicação de questionários e
escores objetivos sobre a percepção do paciente.
A subjetividade do desfecho o torna vulnerável a
vieses. No entanto, estudos fechados (por exemplo, duplos-
-cegos) podem manter a pertinência da análise de seus dados
mesmo diante de desfechos subjetivos. Isso ocorre porque o
médico que presta assistência ao paciente não conhece em
qual grupo o mesmo está alocado, evitando comportamentos
preferenciais. Além disso, estudos fechados evitam os poten-
ciais vieses relacionados ao participante: os efeitos Hawthorne e
placebo, descritos a seguir.
O efeito Hawthorne, de um modo geral, é um fenômeno
em que indivíduos modificam o seu comportamento quando
sabem que estão sendo observados. Esse conceito descreve
que os pacientes tornam-se mais engajados e cautelosos
com sua saúde quando estão cientes de que participam de
um estudo. Se determinado estudo é aberto, o paciente é

ERROS E VIESES 473


conhecedor de sua alocação em um grupo de intervenção
ou placebo, de modo que, segundo o efeito Hawthorne, ocorre
um favorecimento do grupo de intervenção e, consequen-
temente, introduz um viés no estudo (pacientes do grupo
intervenção seriam ainda mais engajados se comparados ao
grupo placebo).
Um outro fenômeno importante é o efeito placebo, defi-
nido desde a década de 1950 como a interferência de mecanis-
mos psicológicos no efeito fisiológico de uma medicação ou
procedimento realizado com fins terapêuticos, independente
dos seus reais efeitos. Este fenômeno se aplica a ambos os
grupos do estudo e, mais uma vez, ele opera de forma desi-
gual quando um estudo é aberto: pacientes do grupo de
intervenção podem, inconscientemente, supervalorizar os
resultados benéficos ao saberem que estão recebendo o trata-
mento em teste; enquanto pacientes do grupo controle podem
diminuir e desacreditar de qualquer benefício, já sabendo
que não utilizam do tratamento em análise. Isso gera uma
manipulação dos desfechos, potencialmente modificando
os resultados do estudo.
É importante salientar que todo estudo está sujeito aos
efeitos descritos, porém, em estudos abertos, eles exercem
influências desiguais entre os grupos, o que potencializa a
ocorrência de viés relacionado ao desfecho. Todavia, essa
situação pode ser minimizada se forem escolhidos desfechos
objetivos em estudos abertos.

474 DESCOMPLICANDO MBE


Tabela 1 – Relação entre o tipo de
desfecho e o desenho do estudo

Uma outra condição que também deve ser ponderada


são os “desfechos criados pelo médico”. Para entender melhor
tal conceito, utilizamos um exemplo desse tipo de desfecho:
a internação. Alguns estudos que avaliam efeitos cardio-
vasculares de medicamentos apresentam como desfecho o
número de internações por insuficiência cardíaca (IC).
Veja bem: apesar de atrelada a um conjunto de dados
clínicos e sinais de gravidade, a decisão de internar ou não
um paciente é dada pela conclusão final do médico. Se o
médico assistindo determinado paciente sabe em qual grupo
o mesmo está alocado, é possível que o profissional tome
sua decisão clínica visando obter melhores resultados para
o estudo: decidindo por mais internações aos pacientes que
não estão em uso do tratamento em teste, por exemplo.

V I ÉS DE PER DA SEL ET I VA DE SEGU I M E N TO

A perda de seguimento (perda de follow-up) diz respeito


à perda de dados sobre a evolução de determinados pacientes.

ERROS E VIESES 475


Todo estudo está sujeito à perda de seus participantes, seja
porque estes falecem, retiram consentimento, ou ainda
porque desistem de seguir o tratamento ou de participar
do estudo. Geralmente, essa perda de seguimento pode ser
calculada e prevista antes do estudo se concretizar, baseado
em dados conhecidos da literatura. Devemos estar atentos
para o percentual dessa perda, o qual, idealmente, não deve
ultrapassar 10% da população original, e espera-se que ocorra
de modo semelhante entre os dois grupos.
Quanto maior a perda de seguimento do estudo, mais
sujeito a erros sistemáticos ele se encontra, possivelmente
falseando os resultados encontrados. Isso porque os pacientes
perdidos frequentemente estão associados a piores prognós-
ticos. “Por que esse percentual foi tão significativo?” e “O
que será que aconteceu com esses pacientes?” são perguntas
que devemos indagar, atentando à possibilidade de algum
viés que nos faça desacreditar dos resultados achados.
Nesse sentido, ao observarmos uma determinada perda
de seguimento, podemos utilizar uma estratégia para avaliar
se essa perda é ou não significativa em relação aos resultados
análise estatística. Observe: para estudos com resultados
positivos (ou seja, a associação prevista foi evidenciada),
imaginemos hipoteticamente que o pior desfecho ocorreu:
todas as pessoas do grupo teste apresentaram um desfecho
negativo, enquanto todos os participantes do grupo controle
demonstraram uma evolução positiva. Se, nessas circunstân-
cias imaginadas (mais desfavoráveis ao estudo), seus resulta-
dos permaneceram estatisticamente significativos, então os
achados originais são confiáveis apesar da perda amostral.
Em contrapartida, se a conclusão do estudo for modificada,

476 DESCOMPLICANDO MBE


a perda de seguimento é possivelmente significativa para
o estudo. Nesse sentido, o que realmente importa não é a
perda absoluta de participantes, mas a perda em relação
à quantidade de eventos ocorridos.
Por outro lado, é interessante avaliar também a seme-
lhança em relação às perdas de seguimento entre os grupos.
No geral, os pacientes abandonam um estudo ou por apresen-
tarem evolução maléfica (perfil de efeitos colaterais ou mesmo
óbito) ou por julgarem o tratamento como desnecessário após
uma evolução positiva, com cura ou melhora clínica. O fato
de haver maior perda de seguimento do grupo intervenção
em relação ao grupo controle certamente é um fator criador
de viés (afinal, esse efeito pode se dever ao fato do trata-
mento provocar maior mortalidade, o que, convenhamos, é
extremamente relevante à prática clínica).

VIÉS EM ESTUDOS DE DIAGNÓSTICO/


PROGNÓSTICO

V I ÉS DE V ER I FIC AÇÃO

Ao avaliarmos a acurácia de um teste diagnóstico, é


necessário compará-lo ao teste considerado padrão-ouro
para detecção de uma determinada doença. Utilizemos como
exemplo um estudo que avalie a acurácia da dosagem do
antígeno prostático específico (PSA) para a detecção do cân-
cer de próstata. Nesse caso, devemos compará-lo ao exame
padrão-ouro: a biópsia prostática. Para isso, o ideal é que
todos os pacientes sejam submetidos a uma dosagem de PSA
e uma biópsia prostática (só assim poderíamos averiguar
quantas vezes o teste do PSA “acertou” no diagnóstico, ou

ERROS E VIESES 477


seja, quantos testes negativos de PSA foram negativos na
biópsia, e quantos positivos foram também positivos na
biópsia). Mas isso não é factível em grandes estudos.
Comumente, a decisão em realizar o teste padrão-ouro
é influenciada pelo resultado do primeiro teste. Ou seja,
com maior frequência os pacientes com PSA positivo são
encaminhados para uma biópsia prostática, o que gera um
viés de verificação. Se apenas os indivíduos doentes são
avaliados no teste padrão-ouro, isso poderá superestimar a
sensibilidade e subestimar a especificidade do teste avaliado,
prejudicando a confiabilidade do estudo.
O viés de verificação diferencial, por sua vez, ocorre
quando os indivíduos que apresentaram resultado negativo
no teste avaliado, ao invés de serem encaminhados para o
padrão-ouro, são mais frequentemente encaminhados para
outro teste (normalmente mais barato ou menos invasivo). Um
exemplo disso, no contexto de nosso estudo urológico, seria
o fato de que os pacientes com testes negativos de PSA são
preferencialmente encaminhados para uma USG transretal.
Os vieses em estudos diagnósticos podem ser evitados
quando o protocolo é definido a priori, ou seja, quando os
testes a serem realizados por cada indivíduo são decididos
previamente. Além disso, o ideal é que todos os participantes
de um estudo sejam submetidos ao teste que está sendo
estudado e ao teste padrão-ouro, embora, quando isso não
é possível, seja recomendado que os indivíduos submetidos
à dupla testagem sejam selecionados aleatoriamente.
Quanto ao exemplo da acurácia do teste de PSA
sobre o diagnóstico do câncer de próstata, a conduta clínica
que geraria viés de verificação seria solicitar uma biópsia

478 DESCOMPLICANDO MBE


(padrão-ouro) apenas para os pacientes com o teste alterado.
Isso acabaria por superestimar a sensibilidade do teste (a
sua capacidade de identificar os verdadeiros positivos) e
subestimar a sua especificidade (o quanto o método é eficaz
em identificar os verdadeiramente negativos). Nessa situação:
todos os pacientes com biópsia alterada teriam dosagem de
PSA elevada (sensibilidade 100%); e aqueles com biópsia
negativa também teriam PSA elevado (especificidade 0%).
Nesse contexto, a conduta metodológica ideal seria
que TODOS os pacientes realizassem ambos os exames (o
teste e o padrão-ouro), mas sabemos que isso é muitas vezes
inviável, seja pelos custos ou pela natureza invasiva de algum
dos exames. Assim, uma alternativa para esse entrave seria
fazer uma escolha aleatória prévia dos pacientes que irão
realizar ambos os testes, independente do resultado inicial.
Assim, uma certa quantidade de pacientes, selecionada de
forma randômica, realizaria ambos os exames, independente
do resultado do teste inicial (a dosagem de PSA).

VIÉS EM REVISÕES SISTEMÁTICAS


E METANÁLISES

V I ÉS DE PU BL IC AÇÃO

O viés de publicação é entendido como uma predileção de


publicar determinados achados, sendo um tipo de viés que afeta
especialmente estudos de revisão sistemática e metanálise.
Preocupações relacionadas a esse tipo de viés vieram à tona
a partir da década de 1950, quando observou-se que jornais
científicos tinham uma certa tendência de selecionar estudos
com resultados positivos ao invés dos que tinham resultados

ERROS E VIESES 479


negativos. Essa predileção, portanto, afetaria mais expres-
sivamente trabalhos de revisão sistemática e metanálise,
ou seja, aqueles que buscam agregar e sintetizar evidências
científicas disponíveis na literatura, cujas estimativas sobre as
intervenções em análise seriam potencialmente distorcidas.
Apesar de que as reais consequências desse viés ainda
são pouco entendidas, sabe-se que uma série de fatores
são responsáveis por sua ocorrência. Do ponto de vista de
um estudo particular e de seus autores, é observável um
comportamento que tende à não publicação de estudos
pequenos (exceto quando os mesmos apresentam achados
significantes), ao passo que estudos maiores são publicados
independentemente de seus resultados.
Além disso, o autor de um trabalho é possivelmente
mais tentado a selecionar achados positivos de um estudo cujo
resultado geral seja essencialmente negativo, erroneamente
publicando apenas seus desfechos positivos. Tal tendência de
subtrair desfechos para publicação merece especial atenção
dado que, nas últimas décadas, o desenho de ensaios clínicos
tem adotado uma quantidade cada vez maior de desfechos
secundários e análise de subgrupos, permitindo a omissão
de resultados durante a submissão a um periódico.
No tocante à decisão dos grupos editoriais de um
jornal, a máxima de que “resultados negativos nunca geraram
leituras atraentes” explica a tendência de não publicação
dos ensaios que apresentaram resultados negativos. Tal viés
também pode ser introduzido à medida que pares de revisão
de um periódico podem dificultar o processo de publicação
de um trabalho similar a algum que já estejam conduzindo
(ou mesmo resistir à aceitação de trabalhos de outras áreas

480 DESCOMPLICANDO MBE


de estudo). Do inglês peer review, o procedimento de revisão
por pares, mesmo tratando-se de uma revisão geralmente
anônima, por um especialista ou autor independente na área
de estudo a serviço do jornal, não é livre de vieses.
Curiosamente, o viés de publicação também pode ser
oriundo de uma tendência positiva ou negativa a depender
de seu financiamento ou indústria de interesse. Por exemplo,
companhias farmacêuticas podem desencorajar a publicação
de estudos que demonstrem efeitos neutros de seus fármacos.
Por outro lado, estudos corroborando achados positivos do
tabagismo encontrarão obstáculos intransponíveis dada a
influência de organizações antitabagistas.
Como apontado, o viés de publicação é particular-
mente relevante dado o desenho e a execução de revisões
sistemáticas e metanálises. Estudos publicados podem diferir
significativamente de estudos não publicados (com diferenças
desde resultados antagônicos até uma profundidade distinta
da análise dos dados), de modo que tais revisões podem
nos levar a conclusões incorretas se baseadas apenas na
literatura publicamente em circulação. Um exemplo disso
foi observado com a publicação parcial de ensaios clínicos
investigando o Oseltamivir, um medicamento antiviral uti-
lizado na tratamento da infecção por Influenza. Atenta aos
efeitos desse viés devido a não publicação de certos trabalhos,
a comunidade científica solicitou a divulgação pública dos
dados de estudos não publicados sobre o medicamento.
Após análise de todos os estudos conduzidos (publicados
ou não), observou-se que aproximadamente 60% dos ensaios
incluídos em uma nova revisão não haviam sido publicados,

ERROS E VIESES 481


o que repercutiu consideravelmente na estimativa da real
eficácia do oseltamivir.
Outros aspectos também estão intimamente relacio-
nados ao viés de publicação. No tocante à metodologia de
estudos de revisão sistemática e metanálise, temos uma
característica importante desses desenhos: a inclusão de
estudos com base no idioma de publicação. Tal condição pode
ser chamada de viés de linguagem, que ocorre quando há
predileção por artigos publicados, por exemplo, em inglês
quando comparado a trabalhos publicados em outras línguas,
durante a etapa de pesquisa em bases de dados.
Logo, na tentativa de avaliar vieses de publicação em
estudos de revisão sistemática e metanálise, testes estatísti-
cos podem ser empregados para identificar sua ocorrência.
Dentre os mais utilizados na literatura, o gráfico de funil
(funnel plot) e o teste de Egger são exemplos de métodos
matemáticos capazes de identificar a presença desse tipo
de viés.
Particularmente sobre o funnel plot, este é uma repre-
sentação gráfica da distribuição dos estudos que contém, no
eixo horizontal, um dado derivado da medida de associação
do estudo e, no eixo vertical, uma medida representativa
da precisão do estudo (que tem relação com o seu tamanho
amostral). Os estudos menores e mais imprecisos estão
representados na parte inferior e mais larga do gráfico. É
de se esperar que eles tenham resultados mais variados e,
portanto, é esperado observar maior simetria especialmente
nessa região do gráfico (figura 3A). Porém, quando diante
do viés de publicação, é observada frequentemente uma

482 DESCOMPLICANDO MBE


assimetria no gráfico, ou até mesmo a ausência de estudos
em determinado quadrante (figura 3B).

Figura 3 – Funnel plot

Por outro lado, o teste de Egger é uma análise estatística


da distribuição dos estudos no gráfico que indica se o padrão
observado é ou não decorrente do acaso, e, portanto, ajuda
a determinar se há viés de publicação.
Enfim, ainda como forma de estimular a transparência
e a validação das descobertas científicas, movimentos (ex.
a campanha AllTrials) surgem como esforços da comuni-
dade científica internacional. Tais campanhas repercutem
diretamente nos efeitos do viés de publicação, defendendo,
por exemplo, a divulgação dos dados gerados em ensaios
clínicos (sejam eles publicados ou não), o que reduz portanto
as consequências da publicação parcial de experimentos.

ERROS E VIESES 483


484 DESCOMPLICANDO MBE
CONCLUSÃO

Este capítulo nos ensina que todo estudo está suscetível a


uma gama de erros. Esses erros podem ser aleatórios (decorrentes
do acaso); ou podem ser sistemáticos, também chamados de
vieses, decorrentes de falhas metodológicas de um trabalho,
que devemos identificar ativamente e então julgar a qualidade
de nossa evidência. Os vieses podem ocorrer em diferentes
etapas de um estudo e, como frequentemente são ocultados
ou minimizados no script de um artigo científico, tais erros
podem nos passar despercebidos. É nesse momento que a
criticidade de um leitor atento se torna um diferencial para
uma prática clínica madura e coerente.

REFERÊNCIAS

DIB, R, E. et al. Guia Prático de Medicina Baseada em Evidências. 1.


ed. São Paulo: Cultura Acadêmica, 2014. 25-35p.

RODRIGUES, Célio Fernando de Sousa; DE LIMA, Fernando José


Camello; BARBOSA, Fabiano Timbó. Importância do uso adequado
da estatística básica nas pesquisas clínicas. REVISTA BRASILEIRA
DE ANESTESIOLOGIA, p. 619-625, 10 abr. 2017.

The SPRINT Research Group. A Randomized Trial of Intensive


versus Standard Blood-Pressure Control. The New England Journal of
Medicine, 2015; 373:2103-2116.

M. R. Patel, K. W. Mahaffey, J. Garg et al. Rivaroxaban versus war-


farin in nonvalvular atrial fibrillation. The New England Journal of
Medicine, vol. 365, no. 10, pp. 883–891, 2011.

Grimes, D. A., & Schulz, K. F. Bias and causal associations in obser-


vational research. The Lancet, 2002, 359 (9302), 248–252.

ERROS E VIESES 485


Catalogue of Bias Collaboration. Banerjee A, Pluddemann A,
O’Sullivan J, Nunan D. Performance bias.In:Catalogue Of Bias 2019.
https://catalogofbias/biases/performance-bias/

Berwanger O, Guimarães HP, Avezum A, Piegas LS. Os dez manda-


mentos do ensaio clínico randomizado – princípios para avaliação
crítica da literatura médica. Rev Bras Hipertens vol.13(1): 65-70, 2006

Sackett Catalogue of Bias Collaboration, Spencer EA, Mahtani K,


Hawthorne bias. In: Catalogue Of Bias 2017: https://catalogofbias.org/
biases/hawthorne-effect/

O’Sullivan JW, Banerjee A, Heneghan C, et al. Verification bias. BMJ


Evidence-Based Medicine 2018;23:54-55.

Sedgwick Philip. What is publication bias in a meta-analysis? BMJ


2015; 351:h4419.

Thornton, Alison et al. Publication bias in meta-analysis. Journal of


Clinical Epidemiology, Volume 53, Issue 2, 207 - 216.

Jefferson, T., Doshi, P., Boutron, I., Golder, S., Heneghan, C.,
Hodkinson, A., Jones, M., Lefebvre, C. and Stewart, L.. When to
include clinical study reports and regulatory documents in system-
atic reviews. BMJ Evidence-Based Medicine, 23(6), pp.210-217, 2018.

486 DESCOMPLICANDO MBE


SOBRE OS QUE
CONTRIBUIRAM COM
ESTA PUBLICAÇÃO

ADRIAN LUCCA GUIMARÃES CALDEIRA. Estudante de


Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
ALANA DANTAS DE MELO. Médica formada pela
Universidade Federal do Rio Grande do Norte (UFRN). Egresso
do PET Medicina UFRN.
ANA KARENINA CARVALHO DE SOUZA. Estudante de
Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
AUGUSTO DE GALVÃO E BRITO MEDEIROS. Médico for-
mado pela Universidade Federal do Rio Grande do Norte (UFRN).
BRENO C C SIMAS. Estudante de Medicina da Universidade
Federal do Rio Grande do Norte (UFRN).
BEATRIZ AGUIAR DA SILVA CARVALHO. Médica formada
pela Universidade Federal do Rio Grande do Norte (UFRN).

487
CINTHIA MARIA CIBELLE DE LIMA SOUZA. Médica formada
pela da Universidade Federal do Rio Grande do Norte (UFRN).
CLAUSE WILLDYS MEDEIROS DANTAS. Estudante de
Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
DYEGO LEANDRO BEZERRA DE SOUZA. Professor do
Departamento de Saúde Coletiva da UFRN - Graduação
em Odontologia e mestrado em Odontologia Preventiva
e Social pela UFRN, doutorado em Medicina Preventiva e
Saúde Pública pela Universidade de Zaragoza (Espanha) com
período sanduíche na International Agency for Research on
Cancer - World Health Organization (França).
ELAINE LIRA MEDEIROS BEZERRA. Graduação em
Medicina pela Universidade Federal do Rio Grande do
Norte (UFRN). Médica Reumatologista pela Universidade
Federal de São Paulo(UNIFESP). Professora Associada do
Departamento de Medicina Clínica da UFRN. Mestrado e
Doutorado em Ciências da Saúde pela UFRN. Especialização
em Educação Médica pelo FAIMER Philadelphia ( Foundation
for Advancement of Medical Education and Research).
FERDINAND GILBERT SARAIVA DA SILVA MAIA.
Médico formado pela Universidade Federal do Rio Grande
do Norte. Egresso do PET Medicina UFRN. Residência em
Clínica Médica e Cardiologia pelo Hospital Universitário
Onofre Lopes. Plantonista da Unidade de Terapia Intensiva
do Hospital Promater. Coordenador do Pronto Atendimento
e da Educação Médica do Hospital Rio Grande.
FREDERICO BATAH EL-FEGHALY. Estudante de Medicina
da Universidade Federal do Rio Grande do Norte (UFRN).

488 DESCOMPLICANDO MBE


FREDERICO GALVANI HARCKBART CARVALHO. Médico
formado pela Universidade Federal do Rio Grande do Norte
(UFRN).
GÉSSIKA LANZILLO DE ALMEIDA NUNES. Médica formada
pela Universidade Federal do Rio Grande do Norte (UFRN).
HENRIQUE DE PAULA BEDAQUE. Médico formado pela
Universidade Federal do Rio Grande do Norte (UFRN).
Residente de otorrinolaringologia pelo Hospital Universitário
Onofre Lopes (HUOL) da UFRN. Organizador e Autor do
livro Estudo Ativo: Aprenda otorrinolaringologia com meto-
dologias baseadas em evidências científicas.
IANA FERNANDA DE MEDEIROS CABRAL. Estudante
de Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
ISADORA SOARES LOPES. Estudante de Medicina da
Universidade Federal do Rio Grande do Norte (UFRN).
ÍTALO MEDEIROS DE AZEVEDO. Doutorando do Programa
de Pós-graduação em Ciências da Saúde (PPGCSa), da
Universidade Federal do Rio Grande do Norte (UFRN).
Mestre em Demografia pelo Programa de Pós-graduação
em Demografia da Universidade Federal do Rio Grande do
Norte, pós-graduação (Especialização) em Demografia e
graduação em ESTATÍSTICA pela mesma universidade,
graduação em MATEMÁTICA pela Universidade Potiguar
(1998). É técnico de laboratório da Universidade Federal do
Rio Grande do Norte.
JOÃO VICTOR DE SOUSA CABRAL. Médico formado pela
Universidade Federal do Rio Grande do Norte (UFRN).

SOBRE OS QUE CONTRIBUIRAM COM ESTA PUBLICAÇÃO 489


JULIANA SOARES PIMENTA. Estudante de Medicina da
Universidade Federal do Rio Grande do Norte (UFRN).
LETÍCIAGOESDASILVA. Médica formado pela Universidade
Federal do Rio Grande do Norte (UFRN).
LUIS HENRIQUE SILVEIRA ROCHA BARBOSA. Estudante
de Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
LUIZ CÂNDIDO DA SILVA JÚNIOR. Graduado em Ciências
Biológicas pela Universidade Federal do Rio Grande do Norte
(UFRN) e Estudante de Medicina da UFRN.
MARIA PAULA RIBEIRO DANTAS BEZERRA. Estudante
de Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
MARIA TAMYRES DE CARVALHO FREITAS. Estudante
de Medicina da Universidade Federal do Rio Grande do Norte
(UFRN).
MARÍLIA DE ALMEIDA CARDOSO. Graduação em Medicina
pela Universidade Federal do Rio Grande do Norte (UFRN).
Residência médica em clínica média e endocrinologia pela
Universidade de São Paula (USP-SP).
MELISSA YOLANDA SOARES MELO. Médica formado pela
Universidade Federal do Rio Grande do Norte (UFRN).
PEDRO HENRIQUE ALMEIDA FRAIMAN. Médico formado
pela Universidade Federal do Rio Grande do Norte (UFRN).
THOMAS DINIZ PAPA. Médico formado pela Universidade
Federal do Rio Grande do Norte (UFRN).

490 DESCOMPLICANDO MBE


UGOR TOMAZ FERNANDES. Médico formado pela
Universidade Federal do Rio Grande do Norte (UFRN).
YASMIN DE MEDEIROS CARVALHO. Médica formado pela
Universidade Federal do Rio Grande do Norte (UFRN).

SOBRE OS QUE CONTRIBUIRAM COM ESTA PUBLICAÇÃO 491


Composto na
CAULE DE PAPIRO GRÁFICA E EDITORA
Rua Serra do Mel, 7989, Cidade Satélite
Pitimbu | Natal/RN | (84) 3218 4626

cauledepapiro.com.br
A Medicina Baseada em Evidências (MBE) é hoje uma
realidade na atuação do médico, objetivando o melhor
cuidado aos pacientes, baseada na melhor evidência
científica disponível até o momento. Na verdade, essa
prática vem crescendo tanto, na área da saúde como
um todo, que vemos uma tendência à mudança de ter-
minologia para Saúde Baseada em Evidências (SBE),
mostrando que não só a área médica, mas todos os
profissionais da saúde, cada vez mais, usam da intera-
ção entre as pesquisas científicas e a reflexão da expe-
riência como fundamento para a tomada de decisões.
Assim, o Programa de Educação Tutorial (PET) do cur-
so de Medicina da Universidade Federal do Rio Gran-
de do Norte (UFRN) construiu o presente livro com o
propósito de ser um meio de consulta prática, direta
e descomplicada para sistematizar a leitura de artigos
científicos, compreendendo suas divisões e orientan-
do a retirada de informações essenciais. Além disso,
objetivou proporcionar uma boa fundamentação para
a análise crítica de artigos científicos e reflexões so-
bre como praticar uma exitosa Medicina Baseada em
Evidências.

editora

Você também pode gostar