Você está na página 1de 135

Metodologia Científica para a Área da

Saúde

2A ED.

Sonia Vieira

William Saad Hossne


Sumário

Capa

Folha de rosto

Copyright

Prefácio

Capítulo 1: Noções Básicas


1.1 O que é pesquisa?

1.2 O que é estudo clínico?

1.3 Onde são encontradas pessoas para participar de estudos clínicos?

1.4 Os estudos clínicos estão associados a benefícios ou a danos?

1.5 Onde são feitos os estudos clínicos e com quais recursos?

1.6 Resumo

Capítulo 2: Ensaios Clínicos: Definições


2.1 O que é ensaio clínico?

2.2 O que é controle negativo e o que é controle positivo?

2.3 O que é controle histórico?

2.4 O que é ensaio em paralelo?

2.5 O que é braço do estudo?

2.6 Como os participantes são designados para cada braço do estudo?

2.7 Existe alternativa para a randomização?

2.8 Resumo

Capítulo 3: Ensaios Clínicos: Mais Definições


3.1 O que é variável resposta ou desfecho clínico?

3.2 O que é variável resposta substituta?

3.3 O que são ensaios cegos, duplamente cegos, triplamente cegos, abertos?

3.4 O que são sujeitos ingênuos em ensaios clínicos?

3.5 O que é confundimento?

3.6 O que é washout?

3.7 O que é período de run-in?

3.8 O que é intenção de tratar?

3.9 O que é follow-up?

3.10 Resumo

Capítulo 4: Delineamento de Ensaios Clínicos


4.1 O que é delineamento do ensaio?

4.2 O que são ensaios multicêntricos?

4.3 Por que são necessários delineamentos complexos?

4.4 Resumo

Capítulo 5: Ensaios Clínicos em Farmacologia e Cirurgia


5.1 Ensaios clínicos em farmacologia

5.2 Fases de uma pesquisa clínica em farmacologia

5.3 Ensaios exploratórios e ensaios pragmáticos

5.4 Ensaios de superioridade, de equivalência, de não inferioridade

5.5 Ensaios clínicos em cirurgia

5.6 Resumo

Capítulo 6: Estudos Observacionais


6.1 O que é estudo coorte?

6.2 O que é estudo de caso-controle

6.3 Qual é a diferença entre estudo coorte retrospectivo e estudo de caso-controle?

6.4 O que é estudo transversal?

6.5 O que é estudo de casos?

6.6 Resumo
Capítulo 7: Dados Primários e Dados Secundários
7.1 O que são dados primários e o que são dados secundários?

7.2 O que é análise primária e o que é análise secundária?

7.3 O que é análise provisória?

7.4 O que é delineamento adaptável?

7.5 Dados publicados são sempre confiáveis?

7.6 Quais erros são mais comuns?

7.7 Devem ser usados dados obtidos de forma não ética?

7.8 Resumo

Capítulo 8: Revisão da Literatura


8.1 O que é revisão sistemática da literatura?

8.2 Como são escolhidos os trabalhos que devem ser revistos?

8.3 Como se julga a qualidade de um estudo clínico?

8.4 O que é metanálise?

8.5 O que é Medicina Baseada em Evidência?

8.6 O que é pesquisa documental?

8.7 Resumo

Capítulo 9: Estatística: Mito e Realidade


9.1 Por que fazer um teste estatístico?

9.2 O teste estatístico é uma prova?

9.3 Uma diferença pode ser estatisticamente significante e não ser clinicamente importante?

9.4 Uma diferença pode ser clinicamente importante e não ser estatisticamente significante?

9.5 Em quantos pacientes deve ocorrer um efeito adverso para que esse valor seja estatisticamente significante?

9.6 Comentários finais

Leituras sugeridas
Copyright
@ 2015, Elsevier Editora Ltda.
Todos os direitos reservados e protegidos pela Lei no 9.610, de 19/02/1998.
Nenhuma parte deste livro, sem autorização prévia por escrito da editora, poderá ser
reproduzida ou transmitida sejam quais forem os meios empregados: eletrônicos,
mecânicos, fotográficos, gravação ou quaisquer outros.
ISBN: 978-85-352-7715-9
ISBN (versão digital): 978-85-352-8286-3

Capa
Mello & Mayer Design

Editoração Eletrônica
Thomson Digital

Elsevier Editora Ltda.


Conhecimento sem Fronteiras
Rua Sete de Setembro, 111 – 16o andar
20050-006 – Centro – Rio de Janeiro – RJ
Rua Quintana, 753 – 8o andar
04569-011 – Brooklin – São Paulo – SP
Serviço de Atendimento ao Cliente
0800 026 53 40
atendimento1@elsevier.com
Consulte nosso catálogo completo, os últimos lançamentos e os serviços exclusivos no
site www.elsevier.com.br.

Nota

Como as novas pesquisas e a experiência ampliam o nosso conhecimento, pode haver


necessidade de alteração dos métodos de pesquisa, das práticas profissionais ou do
tratamento médico. Tanto médicos quanto pesquisadores devem sempre basear-se
em sua própria experiência e conhecimento para avaliar e empregar quaisquer
informações, métodos, substâncias ou experimentos descritos neste texto. Ao utilizar
qualquer informação ou método, devem ser criteriosos com relação a sua própria
segurança ou a segurança de outras pessoas, incluindo aquelas sobre as quais
tenham responsabilidade profissional. Com relação a qualquer fármaco ou produto
farmacêutico especificado, aconselha-se o leitor a cercar-se da mais atual informação
fornecida (i) a respeito dos procedimentos descritos, ou (ii) pelo fabricante de cada
produto a ser administrado, de modo a certificar-se sobre a dose recomendada ou a
fórmula, o método e a duração da administração, e as contraindicações. É
responsabilidade do médico, com base em sua experiência pessoal e no
conhecimento de seus pacientes, determinar as posologias e o melhor tratamento
para cada paciente individualmente, e adotar todas as precauções de segurança
apropriadas.

Para todos os efeitos legais, nem a Editora, nem autores, nem editores, nem
tradutores, nem revisores ou colaboradores, assumem qualquer responsabilidade
por qualquer efeito danoso e/ou malefício a pessoas ou propriedades envolvendo
responsabilidade, negligência etc. de produtos, ou advindos de qualquer uso ou
emprego de quaisquer métodos, produtos, instruções ou ideias contidos no material
aqui publicado.

O Editor

CIP-BRASIL. CATALOGAÇÃO-NA-FONTE SINDICATO NACIONAL DOS


EDITORES DE LIVROS, RJ
V718m
Vieira, Sonia, 1942-
Metodologia científica para a área da saúde / Sonia Vieira; William Saad Hossne. - [2.
ed.] - Rio de Janeiro : Elsevier, 2015.
: il. ; 23 cm.
Inclui bibliografia
ISBN 978-85-352-7715-9
1. Ciências médicas - Pesquisa - Metodologia. 2. Medicina. I. Hossne, William Saad. II.
Título.
15-19118 CDD: 610
CDU: 61
Prefácio
O emprego da análise estatística na pesquisa biomédica constitui, sem dúvida alguma,
um fenômeno marcante. Este aprimoramento da metodologia científica levou não
somente à maior objetividade na análise dos resultados, como também ao
aprofundamento do espírito crítico do pesquisador. Desse modo, procurou-se
substituir a impressão na base do “eu acho” pela análise criteriosa dos achados.
O fenômeno, no entanto, foi acompanhado de algumas distorções de certa
gravidade. Assim, alguns passaram a considerar a análise estatística como ornamento
indispensável para um trabalho de pesquisa, sem atentar para a indicação,
conveniência e adequação da metodologia; outros – como já disse alguém – usavam a
análise estatística como o bêbado usa o poste, isto é, como ponto de apoio e não fonte
de iluminação.
Não deixaram de surgir, principalmente nas áreas aplicadas, grupos que se
digladiavam: um grupo querendo ver estatística aplicada sempre, mesmo quando
desnecessária, e o outro repudiando a estatística sistematicamente, com o argumento
de que os fenômenos biológicos, tão variados e complexos, não podiam ser submetidos
às ciências exatas. Em outras palavras, a “técnica” não podia superar a “arte”.
Embora tenham ocorrido tropeços, a metodologia estatística ganhou,
gradativamente, espaço nas pesquisas feitas na área de saúde; o que, é claro, não foi
um processo fácil. De um lado ficava o pesquisador, sem conhecimento de
delineamento de pesquisa e de técnicas estatísticas, conduzia a pesquisa e depois
procurava o estatístico, muitas vezes sem nem saber o que desejava fazer com seus
dados. Não era rara a indagação ao estatístico: “será que esses dados dão tese?”. Do
outro lado ficava o estatístico, sem formação em biologia e sem conhecimento da
natureza dos fenômenos estudados, sem entender a lógica da pesquisa e sem
informação quanto ao modo como os dados haviam sido coletados. Aplicava, então,
testes estatísticos, muitas vezes de maneira inadequada ou, até mesmo, errada.
Apesar dessas distorções ou, principalmente, por causa dessas distorções, busca-se
compreender, cada vez mais, o papel da estatística na pesquisa biomédica. Como
resultado, noções essenciais como “delineamento”, “variabilidade” e “hipótese” vêm
sendo mais bem assimiladas pelos profissionais da área da saúde.
Contudo, às vezes, o clínico ainda se pergunta: “será que o estudo de médias,
porcentagens, significância estatística pode ser mais importante que o estudo do
caso?”. Dito de outra maneira, ao paciente interessa o que acontece com ele ou o que
acontece com mais frequência? É lógico que ao paciente interessa o que acontece com
ele. No entanto, para saber o que acontece com determinado paciente, é preciso saber
o que ocorre em situações análogas às desse paciente, exatamente para entender o que
acontece com ele. Em outras palavras, a metodologia deve trazer elementos para a
compreensão do fenômeno em geral, e do indivíduo, em particular.
Não há, portanto, paradoxo real no fato de a metodologia estatística, que tem seus
primórdios ligados às ciências físicas e naturais, ser aplicada às ciências da saúde.
Importante é aprender a aplicar essa metodologia e saber respeitar a dignidade do ser
humano. Em suma, importante é valorizar o projeto de pesquisa em seus aspectos
essenciais, que incluem o delineamento estatístico correto e o comportamento ético.
Este livro apresenta alguns tópicos da metodologia científica quantitativa aplicada à
área de saúde. Os capítulos estão organizados de maneira didática, de modo a
satisfazer tanto o leitor menos informado quanto o mais bem informado sobre o
assunto. São dados exemplos de diversas áreas, apesar de não ser fácil encontrá-los,
visto que estudos clínicos são muito complexos e é preciso lê-los na íntegra para
buscar o detalhe que possa ilustrar um ponto específico do método em discussão.
Este trabalho somente foi possível porque muitas pessoas nos encorajaram a
escrever. Ficam aqui registrados nossos agradecimentos aos professores que leram os
manuscritos e fizeram sugestões: Bruno Rodolfo Schlemper Junior, da Universidade
Federal de Santa Catarina; Paulo Christo Coutinho da Silva, do Hospital São Camilo;
Marcos de Almeida e José Marques Filho, do Centro Universitário São Camilo.
Devemos, também, agradecimentos à Editora Campus-Elsevier, pela confiança
depositada em nosso trabalho.
Os autores
C AP Í T U L O 1

Noções Básicas
Para melhorar a qualidade de vida do homem e sua relação com o meio ambiente, é
preciso buscar continuadamente novas e melhores formas de prevenir, diagnosticar,
controlar e tratar as doenças. É enorme a quantidade de informações novas
disponibilizadas pelos mais diferentes meios de comunicação. Por essa razão, para
continuar atualizado, o profissional da área de saúde precisa estar sempre estudando.
Além disso, precisa da experiência clínica – sem ela, a prática fica tiranizada pela
busca incessante de informação nos textos acadêmicos. O bom profissional da área da
saúde é aquele que agrega, à experiência clínica, a melhor evidência externa
disponível.1 Este livro apresenta os fundamentos do método científico para pesquisas
com seres humanos e deve, portanto, ajudar tanto os que fazem pesquisas como
aqueles que leem literatura especializada nessa área.

1.1 O que é pesquisa?


Pesquisa é um procedimento sistemático de investigação para rever ou ampliar o
conhecimento existente, descobrindo novos fatos, discutindo novas formas de
pensar, retificando antigas conclusões, desenvolvendo novas tecnologias e
estabelecendo novas teorias.

Em linhas gerais, uma pesquisa pode ser básica ou aplicada. A pesquisa básica
aumenta o conhecimento científico; a aplicada utiliza esse conhecimento para resolver
problemas e desenvolver novas técnicas e novos produtos. Toda pesquisa envolve
riscos e incertezas. Logo, o pesquisador precisa de dados que tragam evidências
suficientes para sua argumentação.

Método de pesquisa é a estratégia usada pelo pesquisador para coletar as


informações de que precisa para desenvolver seu projeto. Uma pesquisa pode ser
feita, basicamente, conforme um de dois métodos, sendo então identificada como: a)
pesquisa qualitativa, ou b) pesquisa quantitativa.

A pesquisa qualitativa tem o objetivo de entender o comportamento das pessoas,


suas opiniões, seus conhecimentos, suas atitudes, suas crenças, seus medos. Está,
portanto, relacionada com o significado que as pessoas atribuem a suas experiências
do mundo e com o modo como entendem o mundo em que vivemos. O pesquisador da
área qualitativa faz entrevistas, organiza grupos de discussão, faz observação direta,
analisa discursos e documentos.
A pesquisa quantitativa tem o objetivo de contar, ordenar e medir para estabelecer a
frequência e a distribuição dos fenômenos, para buscar padrões de relação entre
variáveis, testar hipóteses, estabelecer intervalos de confiança para parâmetros e
margens de erro para as estimativas. O pesquisador da área quantitativa levanta,
portanto, dados numéricos. Os estudos clínicos são pesquisas quantitativas.2 Veja a Figura
1-1.

FIGURA 1-1 Métodos de pesquisa

Em algumas áreas, os pesquisadores se envolvem em verdadeiras guerras para


tentar determinar o “melhor ” método de pesquisa. Uma solução para isso seria
estudar as estratégias de pesquisa lado a lado. Por exemplo, um pesquisador que
pretenda estudar a experiência subjetiva com uma doença mental deve entrevistar
alguns pacientes e depois proceder à análise detalhada dos dados. Já o pesquisador
que pretenda estudar a frequência e a distribuição dessas doenças na população deve
proceder a uma pesquisa quantitativa, levantando dados de grande número de
pessoas.3
Os dois métodos de pesquisa não são, portanto, nem opostos nem oponentes; ao
contrário, são complementares. Quando se está diante de realidades pouco
conhecidas, deve ser feita uma pesquisa qualitativa, que é menos estruturada. Nas
áreas em que existem conhecimentos consagrados, é indicada a pesquisa quantitativa.
A pesquisa qualitativa deve anteceder a quantitativa. De maneira simples, pode ser
feita uma pesquisa qualitativa com poucas pessoas para levantar as palavras ou
expressões mais comumente utilizadas para descrever sentimentos diante de uma
tragédia de grandes proporções. Depois, pode ser feita uma pesquisa quantitativa
organizando um questionário com as palavras ou expressões levantadas na pesquisa
qualitativa.
Historicamente, as pesquisas qualitativas são rejeitadas na área de saúde por conta
da grande possibilidade de viés4 e de as amostras serem muito pequenas para permitir
generalizações; além disso, não têm reprodutibilidade. No entanto, de acordo com
dois pesquisadores da área qualitativa,5 os críticos dizem que a pesquisa qualitativa
traz muita informação sobre poucas unidades. E eles então rebatem: a pesquisa
quantitativa também tem limitações, isto é, nenhuma pesquisa traz a “verdade” sobre
o todo. Importantes são a competência do pesquisador e a propriedade dos dados, das
análises, das conclusões.
O pesquisador escolhe o método em função da pergunta que pretende responder. E
deve usar as técnicas que tornaram o método científico, lembrando sempre que um
estudo conduzido pelo método quantitativo pode gerar questões que precisam ser
tratadas por método qualitativo e vice-versa.6 Pode parecer que a pesquisa qualitativa
ofereça mais detalhes do caso, e que a pesquisa quantitativa tenha maior precisão. No
entanto, qualquer pesquisa traz apenas uma descrição parcial de um fenômeno.

Ex e m plo 1 - 1
Para saber o que brasileiros entendem quando se fala em descriminalizar as
drogas, o pesquisador faria uma pesquisa qualitativa entrevistando poucas (cerca de
100) pessoas. Para saber o percentual de pessoas favoráveis à descriminalização das
drogas no Brasil, o pesquisador teria de fazer uma pesquisa quantitativa
entrevistando aproximadamente 3.000 pessoas, distribuídas por grupos de idade,
sexo, escolaridade, nível socioeconômico, região do país em que vivem, obedecendo
à distribuição desses grupos na população.

1.2 O que é estudo clínico?


Estudo clínico7 (clinical study) significa uma pesquisa que utiliza seres humanos
para avaliar, na área de saúde, o efeito de intervenções ou da exposição a condições
que, pelo menos potencialmente, estejam ligadas à saúde.

7
Glossary of Common Site Terms. Disponível em: clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 11 de
janeiro de 2014.

Estudos clínicos são feitos com seres humanos. Embora a experimentação com animais
e plantas possa ser estudada com técnicas estatísticas similares, os estudos clínicos
têm algumas peculiaridades: é preciso o consentimento esclarecido do participante em
potencial, que tem o direito de se recusar a participar e, mesmo que aceite, tem o
direito de se retirar a qualquer momento, sem prejuízo para si próprio.
No Brasil, o Conselho Nacional de Saúde (CNS),8 órgão subordinado ao Ministério
da Saúde, dita, por meio de resoluções, as normas e diretrizes regulamentadoras de
pesquisas que envolvam seres humanos na área de saúde.9 A Resolução CNS n° 466 de
12 de dezembro de 201210 é uma nova versão da Resolução CNS n° 196 de 10 de
outubro de 1996,11 pois nela há modificações e inclusões.12 A razão de a Resolução CNS
196/96 ser citada aqui é o fato de ela ser o principal marco regulatório da pesquisa com
seres humanos no Brasil, pois introduziu termos e definições com os quais os
pesquisadores rapidamente se familiarizaram. A Resolução CNS 196/96 é referida em
resoluções complementares do próprio CNS e é muito conhecida entre pesquisadores
brasileiros, que a chamam informalmente de a “um-nove-meia”.
Os estudos clínicos são subdivididos em ensaios clínicos (clinical trials), mais
modernamente referidos como estudos de intervenção (interventional studies) e estudos
observacionais (observacional studies). Neste livro, os ensaios clínicos são apresentados
nos Capítulos 2, 3, 4 e 5 e os estudos observacionais, no Capítulo 6. A Resolução CNS n
° 466/12 não contempla esta distinção. Define:

Pesquisa envolvendo seres humanos – pesquisa que, individual ou coletivamente,


tenha como participante o ser humano, em sua totalidade ou partes dele, e o envolva
de forma direta ou indireta, incluindo o manejo de seus dados, informações ou
materiais biológicos.
Resolução CNS n° 466/12, item II.14

A Agência Nacional de Vigilância Sanitária (ANVISA)13 – agência reguladora


também vinculada ao Ministério da Saúde que faz o controle de medicamentos,
cosméticos, alimentos, equipamentos médicos, materiais biológicos e produtos
derivados do sangue humano – emprega ensaio clínico e estudo clínico como
expressões intercambiáveis e, citando a Agência Europeia de Medicamentos (European
Medicines Agency – EMEA),14 define estudo clínico na sua área de competência:

Estudo clínico – qualquer investigação em seres humanos, objetivando descobrir


ou verificar os efeitos farmacodinâmicos, farmacológicos, clínicos e/ou outros efeitos
de produto(s) e/ou identificar reações adversas ao(s) produto(s) em investigação,
com o objetivo de averiguar sua segurança e/ou eficácia.

A pessoa que se submete a um programa de pesquisa no Brasil é denominada


participante de pesquisa, embora muitos textos ainda se refiram ao sujeito de pesquisa –
termo inadequado, porque remete à ideia de sujeição, submissão, acatamento.

Participante da pesquisa – indivíduo que, de forma esclarecida e voluntária, ou


sob esclarecimento e autorização de seu(s) responsável(eis) legal(is), aceita ser
pesquisado.
Resolução CNS n° 466/12, item II.10

Todo estudo clínico deve ser pautado em um protocolo de pesquisa. Toda pessoa que
aceita ser submetida a estudo clínico precisa assinar um Termo de Consentimento Livre e
Esclarecido (TCLE), cujo modelo deve estar anexado ao protocolo de pesquisa. O
protocolo deve ser submetido à apreciação de um Comitê de Ética em Pesquisa (CEP) e,
em certas circunstâncias previstas pelas normas do CNS-MS, à Comissão Nacional de
Ética em Pesquisa (CONEP). Esses documentos e instituições, bastante conhecidos dos
pesquisadores brasileiros porque foram instituídos pela Resolução CNS n° 196/96 e
mantidos na Resolução CNS n° 466/12, estão descritos em seguida.

1.2.1 Protocolo de pesquisa


Protocolo de Pesquisa: conjunto de documentos contemplando a descrição da
pesquisa em seus aspectos fundamentais e as informações relativas ao participante
da pesquisa, à qualificação dos pesquisadores e a todas as instâncias responsáveis.
Resolução n° 466/12, item II.17

Para constituir um protocolo de pesquisa, o pesquisador deve consultar as


instruções da instituição em que pretende desenvolver o trabalho e preencher
formulários específicos. No entanto, precisa também buscar as diretrizes e as normas
regulamentadoras de pesquisas envolvendo seres humanos do CNS,15 que especifica:

O protocolo a ser submetido à revisão ética somente será apreciado se for


apresentada toda documentação solicitada pelo Sistema CEP/CONEP, considerada a
natureza e as especificidades de cada pesquisa. A Plataforma BRASIL é o sistema
oficial de lançamento de pesquisas para análise e monitoramento do Sistema
CEP/CONEP.
Resolução n° 466/12, item VI

Se, por uma razão justa, o protocolo não puder ser obedecido na forma como foi
proposto, é preciso fazer uma justificativa por escrito, juntá-la ao protocolo e
reencaminhar o projeto ao CEP, para novo julgamento. A ANVISA denomina16 emenda
ao protocolo “uma descrição escrita de mudança(s) ou esclarecimento formal de um
protocolo” e denomina17 desvios do protocolo: “a) desvios ou alterações do protocolo
para eliminar riscos imediatos aos sujeitos da pesquisa; b) alterações que impliquem
em aumento do risco aos sujeitos da pesquisa e/ou afetem significativamente a
condução do estudo”.

1.2.2 Termo de consentimento livre e esclarecido


Termo de Consentimento Livre e Esclarecido (TCLE): documento no qual é explicitado
o consentimento livre e esclarecido do participante e/ou de seu responsável legal, de
forma escrita, devendo conter todas as informações necessárias, em linguagem clara
e objetiva, de fácil entendimento, para o mais completo esclarecimento sobre a
pesquisa a qual se propõe participar.
Resolução n° 466/12, item II.23

O TCLE é um documento assinado pelo participante de pesquisa ou por seu


representante legal para proteger principalmente o participante, mas também o
pesquisador e a instituição. É obrigatório obter consentimento do participante. A
lógica dessa exigência repousa na confiança que deve existir entre participante da
pesquisa e pesquisador, durante todo o estudo. O TCLE deve ser escrito de forma que
possa ser compreendido por quem é seu destinatário; os termos técnicos devem ser
explicados.
De qualquer modo, a pessoa convidada a participar de um estudo clínico mostra que
compreendeu a situação se, depois de ler o termo de consentimento livre e esclarecido,
puder responder às seguintes questões:
A quais intervenções o participante será submetido e por quanto tempo?
Quem fará essas intervenções?
Quais condutas do participante (como, por exemplo, faltar a duas visitas
agendadas) o excluirão do estudo?
Que riscos estão envolvidos?
Quais benefícios podem ser esperados?
Em que momento o participante pode se retirar, se assim o desejar?
Se for um ensaio clínico, o participante de pesquisa poderá continuar recebendo o
mesmo tratamento, depois que a pesquisa terminar?
Em caso de dúvida, quem o participante de pesquisa deve procurar?
Nos casos em que a pesquisa é feita com menores de idade ou legalmente incapazes,
o pesquisador precisa obter o TCLE assinado pelo representante legal e o Termo de
Assentimento do próprio participante, mostrando que essa pessoa concordou em ser
submetida à pesquisa.

Termo de Assentimento (é um) documento elaborado em linguagem acessível para


os menores ou para os legalmente incapazes, por meio do qual, após os
participantes da pesquisa serem devidamente esclarecidos, explicitarão sua
anuência em participar da pesquisa, sem prejuízo do consentimento de seus
responsáveis legais.
Resolução n° 466/12, item II.24

Em estudos clínicos para a prevenção de doenças, para o teste de vacinas ou para


mais bem conhecer a fisiologia das pessoas, recrutam-se como participantes de
pesquisa apenas voluntários sadios. É claro que não se pode “provar ” que uma pessoa
é sadia, mas sempre é possível verificar se a pessoa não tem determinadas doenças.
Também são feitos estudos para comparar pessoas sadias com pessoas doentes. Os
voluntários sadios são geralmente recrutados entre estudantes universitários,
empregados de empresas e jovens que estão prestando serviço militar. No entanto, a
maioria dos estudos clínicos inclui apenas participante que tenha doença ou condição
específica.
Relativamente poucas pesquisas são feitas com as chamadas populações vulneráveis.
São vulneráveis, porque não podem compreender o termo de consentimento livre e
esclarecido (TCLE) – internos em asilos, pessoas com perturbação ou doença mental,
os extremamente debilitados, doentes terminais, pessoas com pobreza extrema,
presidiários. A argumentação de que tais indivíduos são voluntários sempre pode ser
colocada em dúvida. Também são feitas pesquisas com populações indígenas.18

Vulnerabilidade – estado de pessoas ou grupos que, por quaisquer razões ou


motivos, tenham a sua capacidade de autodeterminação reduzida ou impedida, ou
de qualquer forma estejam impedidos de opor resistência, sobretudo no que se
refere ao consentimento livre e esclarecido.
Resolução n° 466/12, item II.25

1.2.3 Comitê de Ética em Pesquisa e Comissão Nacional


de Ética em Pesquisa
A avaliação de um protocolo de pesquisa por um grupo de pessoas independentes
ajuda a garantir que os riscos envolvidos na pesquisa sejam tão baixos quanto possível
e valham a pena, dados os possíveis benefícios; além disso, ajuda a garantir os direitos
e o bem-estar dos participantes de estudos clínicos. Para isso, o CNS criou os Comitês
de Ética em Pesquisa (CEP) e a Comissão Nacional de Ética em Pesquisa (CONEP).

Comitês de Ética em Pesquisa (CEP) são colegiados interdisciplinares e


independentes, de relevância pública, de caráter consultivo, deliberativo e
educativo, criados para defender os interesses dos participantes da pesquisa em sua
integridade e dignidade e para contribuir no desenvolvimento da pesquisa dentro
de padrões éticos:
VII. 2.1 – as instituições e/ou organizações nas quais se realizem pesquisas
envolvendo seres humanos podem constituir um ou mais de um Comitê de Ética em
Pesquisa – CEP, conforme suas necessidades e atendendo aos critérios normativos;
VII. 2.2 – na inexistência de um CEP na instituição proponente ou em caso de
pesquisador sem vínculo institucional, caberá à CONEP a indicação de um CEP para
proceder à análise da pesquisa dentre aqueles que apresentem melhores condições
para monitorá-la.
Resolução n° 466/12, item VII

No Brasil, nenhum pesquisador pode iniciar uma pesquisa em seres humanos sem a
aprovação de um Comitê de Ética em Pesquisa (CEP). Então, todo estudo clínico que
esteja sendo feito no Brasil deve ter sido aprovado e estar monitorado por um CEP, que
também assessora os pesquisadores, quando isso se faz necessário.
Os CEP são multidisciplinares, pois são formados por profissionais de áreas
diversas, representantes da comunidade e representantes de usuários do sistema de
saúde da instituição. Eles pertencem às instituições, mas devem ser independentes da
administração, para que possam avaliar aspectos relacionados com a ética do projeto
conforme seus próprios critérios. Portanto, têm a prerrogativa de aprovar, pedir revisão
ou reprovar um projeto. Os CEP estão subordinados à Comissão Nacional de Ética em
Pesquisa (CONEP).

Comissão Nacional de Ética em Pesquisa (CONEP) é uma instância colegiada, de


natureza consultiva, deliberativa, normativa, educativa e independente, vinculada ao
Conselho Nacional de Saúde/MS.
Resolução n° 466/12, item VII.3

Ainda, é obrigatório o registro da pesquisa clínica no Registro Brasileiro de Ensaios


Clínicos.19 Devem ser registradas todas as pesquisas clínicas com participantes
brasileiros, em todas as áreas da saúde.

1.3 Onde são encontradas pessoas para participar de


estudos clínicos?
Os estudos clínicos começam com a triagem (screening) de participantes em potencial,
isto é, identificando pessoas que, aparentemente, atendam às características que serão
estudadas. Devem, então, ser verificados os critérios de inclusão e exclusão.
Critérios de inclusão (inclusion criteria) são as características que os possíveis
participantes devem ter para que sejam selecionados para o estudo. Critérios de
exclusão (exclusion criteria) são as características dos possíveis participantes que os
impedem de serem selecionados para o estudo.
Os critérios de inclusão e exclusão devem explicitar fatores como sexo, idade, raça e
condição socioeconômica. Nem sempre fica claro o motivo da inclusão de apenas
pessoas de certa idade ou a exclusão de um dos sexos; se necessário, isso deve ser
explicado. Além disso, se foram excluídas pessoas de uma raça ou, ao contrário,
incluídas de uma só raça, isso também deve ser explicado. A ANVISA também exige
que, nos critérios de inclusão e exclusão, conste a intensidade da condição clínica do
voluntário para participar da pesquisa.20
É importante definir cuidadosamente os critérios de inclusão e exclusão, porque são
eles que estabelecem a população para a qual os resultados serão generalizados. Por
exemplo, se o estudo foi feito com adultos, seus resultados só podem ser estendidos
para adultos – não para crianças. Se participantes com deficiência física foram
excluídos, os resultados do estudo não podem ser estendidos para essas pessoas.
Os critérios de exclusão também devem retirar do estudo pessoas que poderiam ser
prejudicadas, tais como aquelas com doenças concomitantes e pessoas vulneráveis (p.
ex., deficientes mentais). Isso não significa que essas pessoas não possam participar de
estudos clínicos – elas devem ser recrutadas em estudos que as contemplem nos
critérios de inclusão. Além disso, devem ser excluídas as pessoas que não podem ir ao
centro de pesquisa nas ocasiões em que o protocolo exige.

Ex e m plo 1 - 2
Para um ensaio clínico sobre quimioterapia para casos de câncer de mama, o
critério de inclusão poderia ser o de mulheres menopausadas com idades entre 50 e
75 anos no estágio II da doença.21 Caso as drogas usadas apresentem potencial
nefrotóxico, devem ser excluídas mulheres com disfunção renal.

21
Module 5. Disponível em: http://learn.yale.edu/hsp/module 5/3a_guidance.asp. Acesso em 27 de janeiro de 2014.

No planejamento de um estudo clínico, é importante escrever critérios de inclusão e


exclusão separadamente; no entanto, terminada essa fase, esses critérios podem ser
descritos apenas como critérios de elegibilidade. Não é necessária a distinção entre
critérios de inclusão e de exclusão. Verificada a elegibilidade (elegibility), procede-se ao
recrutamento (recruitment), ou seja, as pessoas são convidadas para participar da
pesquisa. Somente podem participar do estudo clínico pessoas que concordem e
assinem o TCLE.
De qualquer maneira, sempre decorre certo período entre o recrutamento do
paciente e o início do estudo.22 O pesquisador deve empenhar-se em verificar, nesse
período, se o paciente atende, de fato, aos critérios de elegibilidade. Pacientes que não
atendam a esses critérios devem ser excluídos. Procede-se, então, à matrícula
(enrollment) das pessoas como participantes de pesquisa e tomam-se as linhas de base
(baselines), para início do estudo. Veja a Figura 1-2. Dados levantados até a matrícula
não podem ser usados na análise dos resultados.

FIGURA 1-2 Fluxograma para estudo clínico

O número de participantes (tamanho da amostra) de estudos clínicos deve ser


determinado por critérios estatísticos; contudo, os pesquisadores devem recrutar mais
participantes que o necessário a fim de alcançar resultados confiáveis, prevendo a
eventual perda de participantes (dropouts) por falta de vontade de cooperar, mudança
de endereço, desistência etc.

Ex e m plo 1 - 3
Para levantar informações sobre os aspectos dos cuidados médicos que mais
provavelmente influenciam a satisfação com o tratamento e uma possível
recomendação dos serviços do hospital para outras pessoas, foi obtida uma amostra
de pacientes que haviam sido internados em um hospital da Escócia.23 Foram
enviados pelo correio 3.592 questionários, feitos dois repasses e recebidas 2.249
respostas. A perda de possíveis participantes, que foi de aproximadamente 37%,
provavelmente seria muito maior no Brasil.

23
Jenkinson C. et al. Patients’ experiences and satisfaction with health care: results of a questionnaire study of
specific aspects of care. Qual Saf Health Care. 2002 Dez. 11(4): 335-9.
1.4 Os estudos clínicos estão associados a benefícios ou
a danos?
Toda pesquisa com seres humanos envolve risco em tipos e gradações variados.
Quanto maiores e mais evidentes os riscos, maiores devem ser os cuidados para
minimizá-los e a proteção oferecida pelo Sistema CEP/CONEP aos participantes.
Devem ser analisadas possibilidades de danos imediatos ou posteriores, no plano
individual ou coletivo. A análise de risco é componente imprescindível à análise
ética, dela decorrendo o plano de monitoramento que deve ser oferecido pelo
Sistema CEP/CONEP em cada caso específico.
V.1 – As pesquisas envolvendo seres humanos serão admissíveis quando:
a) O risco se justifique pelo benefício esperado;
b) No caso de pesquisas experimentais da área da saúde, o benefício seja maior, ou,
no mínimo, igual às alternativas já estabelecidas para a prevenção, o
diagnóstico e o tratamento.
Resolução no 466/12, item V

Benefícios da pesquisa (é) proveito direto ou indireto, imediato ou posterior,


auferido pelo participante e/ou sua comunidade, em decorrência de sua participação
na pesquisa.
Dano associado ou decorrente da pesquisa – agravo imediato ou posterior, direto
ou indireto, ao indivíduo ou à coletividade, decorrente da pesquisa.
Resolução no 466/12, item II.4 e item II.6

A ANVISA24 define danos dentro de sua área de competência. Então, eventos adversos
graves são “aqueles que resultem em qualquer experiência adversa com drogas ou
produtos biológicos ou dispositivos, ocorrendo em qualquer dose e que tenha um dos
seguintes desfechos:
a) Óbito;
b) Evento adverso potencialmente fatal (aquele que, na opinião do notificante, coloca o
indivíduo sob risco imediato de morte devido ao evento adverso ocorrido);
c) Incapacidade/invalidez persistente ou significativa;
d) Necessidade de internação hospitalar do paciente ou prolongamento de internação
preexistente;
e) Anomalia congênita ou defeito de nascimento.
Risco é a probabilidade de dano. Os participantes de pesquisa estão sujeitos a riscos,
tais como:
Sofrer os efeitos adversos descritos no protocolo ou, até mesmo, outros, não
aventados pelos pesquisadores, uma vez que a intervenção ainda não foi
amplamente usada nem mesmo em longo prazo;
Não receber a intervenção em teste ou receber intervenção sabidamente não
eficiente (p. ex., placebo ou simulação de tratamento);
Fazer várias viagens ao local da pesquisa ou permanecer mais tempo no hospital
que o necessário, em condições de cuidados convencionais;
Suspender o tratamento que vinha fazendo, mesmo que estivesse se sentindo bem.
Podem ser entendidos como benefícios para os participantes:
Ter acesso a novas intervenções, ainda não disponíveis para o público ou,
eventualmente, receber drogas ainda não comercializadas;
Contribuir para o entendimento da doença ou seu tratamento. Isso pode não afetar
o participante diretamente, mas pode lhe dar a satisfação de saber que está
ajudando a melhorar a vida de futuras gerações. Sem os participantes de pesquisa,
não teriam aparecido novas terapias ou novas drogas.

1.5 Onde são feitos os estudos clínicos e com quais


recursos?
No Brasil, a maioria dos estudos clínicos é feita em centros universitários públicos ou
privados, com recursos dos próprios centros ou de financiadoras de pesquisa. Além
disso, são realizados estudos clínicos em serviços públicos e privados e em
consultórios. No caso de pesquisas com fármacos e medicamentos, os recursos para a
pesquisa vêm de três fontes: governo, organizações não governamentais e,
principalmente, companhias farmacêuticas. De qualquer maneira, para que sejam
conduzidas pesquisas clínicas, é preciso ter estrutura, isto é, condições adequadas para
a realização do projeto, condições para atendimento de possíveis efeitos adversos e
colaterais, financiamento para cobrir todos os encargos.

“O pesquisador, o patrocinador e as instituições e/ou organizações envolvidas nas


diferentes fases da pesquisa devem proporcionar assistência imediata, nos termos
do item II.3, bem como responsabilizarem-se pela assistência integral aos
participantes da pesquisa no que se refere às complicações e danos decorrentes da
pesquisa.”
Resolução no 466/12, item V.6
“Os participantes da pesquisa que vierem a sofrer qualquer tipo de dano
resultante de sua participação na pesquisa, previsto ou não no Termo de
Consentimento Livre e Esclarecido, têm direito à indenização por parte do
pesquisador, do patrocinador e das instituições envolvidas nas diferentes fases da
pesquisa.”
Resolução no 466/12, item V.7

Na publicação da pesquisa, é preciso fazer descrição pormenorizada tanto dos


participantes como do local em que foram estudados, para que possa ser feita a
generalização dos resultados, ou seja, para que a pesquisa tenha validade externa.
Além disso, é preciso relatar financiamentos e dados com os nomes de todos os
responsáveis pela pesquisa inteira, ou por partes dela.

1.6 Resumo
Pesquisa é um procedimento sistemático de investigação feita para rever ou ampliar o
conhecimento existente, descobrindo novos fatos, discutindo novas formas de pensar,
retificando antigas conclusões, desenvolvendo novas tecnologias.
Estudo clínico é a pesquisa que utiliza seres humanos para avaliar, na área de saúde, o
efeito de intervenções ou da exposição a condições que, pelo menos potencialmente,
estejam ligadas à saúde. Podem ser ensaios clínicos, também chamados de estudos de
intervenção e estudos observacionais.
Todo estudo clínico deve ter um protocolo de pesquisa. Toda pessoa que aceite ser
submetida a estudo clínico precisa assinar um termo de consentimento livre e esclarecido
(TCLE), cujo modelo deve estar anexado ao protocolo de pesquisa. O protocolo deve
ser submetido à apreciação de um Comitê de Ética em Pesquisa (CEP) e, em certas
circunstâncias previstas pelas normas do Conselho Nacional de Saúde do Ministério
da Saúde, à Comissão Nacional de Ética em Pesquisa (CONEP).

1
Sackett, DL, et al. Evidence based medicine: what it is and what it isn’t. BMJ 1996 Jan. 13; 312(7023):71-2.
2
É importante não confundir: pesquisa qualitativa e pesquisa quantitativa, tratadas aqui, são métodos de pesquisa.
Variáveis qualitativas e variáveis quantitativas são tipos de variáveis. Veja o Capítulo 7 deste livro.
3
Flick U. Uma introdução à pesquisa qualitativa. Tradução de Samira Netz. 2 ed. Porto Alegre, Bookman, 2004. p. 272.
4
A pesquisa qualitativa é considerada, por alguns, como soft science.
5
Mays N, Pope C. Rigour and qualitative research. Brit. Medical J. 1995 Jul 8;311(6997):109-12.
6
Minayo MS, Sanches O. Quantitativo-qualitativo: oposição ou complementaridade? Caderno de Saúde Pública, Rio de
Janeiro, v. 9, n. 3, p. 239-262, jul./set. 1993. Disponível em: http://www.scielo.br/pdf/csp/v9n3/02.pdf. Acesso em 10
de outubro de 2013.
8
Conselho Nacional de Saúde. Disponível em: http://conselho.saude.gov.br. Acesso em 18 de novembro de 2013.
9
No uso da competência que lhe é outorgada pelo Decreto n˚ 93.933 de 14 de janeiro de 1987.
10
Resolução CNS n° 466/12. Disponível em: http://conselho.saude.gov.br./resolucoes/2012/Reso466. Acesso em 18 de
novembro de 2013.
11
Ver: http://conselho.saude.gov.br./23_out_versao_final_196. Acesso em 18 de novembro de 2013.
12
Andrade, S.M.O. Resolução n° 466/12 e Resolução n° 196/96: elementos diferenciais. Campo Grande, junho de 2013.
Disponível em: www.uems.br/conselhodeetica/arquivos/19. Acesso em 23 de junho de 2014.
13
Considerações e definições para Pesquisa Clínica. Disponível em:
http://www.anvisa.gov.br/medicamentos/pesquisa/def.htm. Acesso em 8 de março de 2014.
14
General Considerations for Clinical Trials. Step 5. European Medicines Agency. www.ema-
europa.eu/docs/.../WC500002877.
15
Resolução CNS n° 466/12. Disponível em: http://conselho.saude.gov.br/resolucoes/2012/Reso466.pdf. Acesso em 7
de maio de 2014.
16
Boas Práticas Clínicas: Documento das Américas – Anvisa. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/boaspraticas_americas.pdf
17
Relatório do estudo – Notificação – Anvisa. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc.
18
Ver a Resolução CNS n° 304/2000.
19
Registro Brasileiro de Ensaios Clínicos. Disponível em: www.ensaiosclinicos.gov.br/assistance/faq. Acesso em 14 de maio
de 2014.
20
Relatório do Estudo – Notificação – Anvisa. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc.
22
Período introdutório, também chamado período de pré-randomização (run-in). Ver Seção 3.7 do Capítulo 3.
24
Relatório do Estudo – Notificação – ANVISA. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 21 de fevereiro de 2014.
C AP Í T U L O 2

Ensaios Clínicos: Definições


Considerações de natureza ética dão pleno apoio à condução de ensaios clínicos, que
constituem a maneira correta de estudar a segurança e a eficácia das novas terapias e
estabelecer uma comparação adequada com as já existentes no mercado.1 Por exemplo,
a melhor maneira de saber se um novo tratamento para câncer do pulmão é mais
vantajoso quando comparado às melhores terapias conhecidas, é conduzindo ensaios
clínicos que cumpram as exigências da metodologia científica e atendam às questões
de ética. Ensaios mal conduzidos, além de usarem participantes sem trazer benefícios
para eles próprios ou para o conhecimento científico, desperdiçam verbas e ainda
podem afetar a conduta de outros profissionais, que os tomam como verdades ou até
como modelos para fazer outros ensaios.

2.1 O que é ensaio clínico?


Ensaio clínico (clinical trial) ou estudo de intervenção (interventional study) é um estudo
clínico no qual os participantes são designados para receber uma ou mais intervenções
(ou nenhuma), para que os pesquisadores possam avaliar os efeitos dessas
intervenções em resultados biomédicos ou relacionados com a saúde. O procedimento
para designar as intervenções (ou nenhuma intervenção) é estabelecido no protocolo.2
As intervenções podem ser drogas, procedimentos cirúrgicos, procedimentos de
laboratório, procedimentos radiológicos, dispositivos para uso em humanos, métodos
de diagnóstico, métodos preventivos etc. Tais intervenções são aplicadas aos
participantes dos ensaios clínicos de maneira padronizada, seguindo um protocolo de
pesquisa. Nem todos os participantes são submetidos às intervenções ao mesmo
tempo, mas é preciso que todos sejam monitorados durante o mesmo período de tempo ou
até determinado desfecho. Os pesquisadores devem manter os riscos dos ensaios no
menor patamar possível, procurando maximizar os benefícios para os próprios
participantes.

Ex e m plo 2 - 1
Foi conduzido um ensaio clínico3 para comparar a velocidade de ação de duas
drogas (ticagrelor e clopidogrel) indicadas para prevenir a formação de coágulos de
sangue que podem causar infarto agudo do miocárdio ou acidente vascular cerebral
(AVC). As drogas inibem a agregação de plaquetas (fragmentos de células que
compõem o sangue). Essa agregação é parte da sequência de eventos que conduzem
à formação de coágulos. O objetivo desse ensaio clínico foi comparar a ação das
duas drogas (ticagrelor e clopidogrel) sobre a velocidade da inibição de plaquetas.
Os participantes dos dois grupos foram monitorados durante o mesmo período de
tempo.

3
Paul AG. et al. The ONSET/OFFSET Study: Effects of Ticagrelor Versus Clopidogrel in Patients With Stable
Coronary Artery Disease Assessment of the ONSET and OFFSET of the Antiplatelet. Circulation.
2009;120:2577-2585.

2.2 O que é controle negativo e o que é controle positivo?


Para estudar o efeito de uma intervenção experimental, seria necessário observar o que
acontece quando a intervenção é aplicada e o que teria acontecido se a intervenção não
tivesse sido aplicada. No entanto, isso é impossível. Então o pesquisador faz o
seguinte (conforme a Figura 2-1):

FIGURA 2-1 Ensaio comparativo

Toma um conjunto de participantes com características demográficas similares e na


mesma condição de saúde;
Divide o conjunto de participantes em dois grupos;
Administra a intervenção experimental para um dos grupos;
Deixa o outro grupo sem a intervenção.
Os resultados obtidos no grupo experimental 4 (que recebe a intervenção
experimental) são comparados com os resultados obtidos no grupo que não recebe a
intervenção experimental, denominado grupo-controle.
Controles negativos são pacientes que, durante o ensaio clínico, recebem apenas
placebo.
No teste de drogas terapêuticas, em situações específicas, o grupo-controle recebe
apenas placebo, isto é, uma substância similar à droga quanto ao aspecto, gosto, cor,
cheiro, embalagem etc. – mas inerte farmacologicamente.5 Isso garante que a resposta
do paciente seja explicada pela droga e não pelo fato de se sentir tratado.
O uso de controles negativos exige avaliação cuidadosa. Existem diretrizes
internacionais e regulamentação no Brasil que tratam as condições de uso do placebo.
O projeto de pesquisa precisa:

“(...) ter plenamente justificada, quando for o caso, a utilização de placebo, em


termos de não maleficência e de necessidade metodológica, sendo que os benefícios,
os riscos, as dificuldades e a efetividade de um novo método terapêutico devem ser
testados, comparando-o com os melhores métodos profiláticos, diagnósticos e
terapêuticos atuais. Isso não exclui o uso de placebo ou nenhum tratamento em
estudos nos quais não existam métodos provados de profilaxia, diagnóstico ou
tratamento.”
Resolução n° 466/12, item III.2b 6

6
Ver também a Resolução n° 391/99 (www.anvisa.gov.br/legis/resol391_htm).

O pesquisador é a pessoa mais qualificada para saber se o uso de placebo acarreta


apenas desconforto suportável. Embora o paciente deva dar consentimento livre e
esclarecido para participar da pesquisa – sendo então informado que pode receber, por
exemplo, apenas comprimidos sem potencial de ação – e deva haver uma revisão
adequada do protocolo de pesquisa por parte do CEP da instituição, é o pesquisador
quem deve estabelecer o risco que um paciente submetido ao placebo teria de suportar
e fazer uma avaliação, à luz da ética profissional e da própria consciência.
Em determinadas condições, o uso de placebo é francamente reprovável ou até
mesmo ilegal. No entanto, o placebo já foi utilizado para estabelecer, por exemplo, se
anovulatórios orais eram efetivos, sem que as mulheres participantes do estudo
fossem esclarecidas sobre a possibilidade de estarem recebendo apenas placebo.7 Já se
usou placebo para determinar a dose mínima de AZT que deve ser administrada para
grávidas com HIV.8 A literatura especializada tem muitos exemplos sobre o uso
indevido de placebo.
Na maioria das vezes, porém, não é necessário ter um grupo submetido a placebo.
Se, para uma dada condição (uma doença, um distúrbio, uma síndrome, uma lesão)
existir um tratamento padrão, isto é, um tratamento aceito pelos especialistas como
adequado na situação, esse tratamento deveria servir como base de comparação para
qualquer nova intervenção que venha a ser proposta. O grupo-controle seria, então,
formado pelos participantes que recebem o tratamento padrão.
Controles positivos ou controles ativos são pacientes que, durante o ensaio clínico,
recebem tratamento efetivo reconhecido.
O uso de controles positivos produz, sem dúvida alguma, informação mais útil para
médicos e pacientes. No caso de teste de drogas terapêuticas, por exemplo, as pessoas
querem saber qual é a melhor droga para tratar uma dada condição. No entanto, se a
base para comparação for um grupo que recebe apenas placebo, qualquer droga pode
revelar alguma eficácia,9 o que não significa droga mais eficaz que as que já existem no
mercado.

2.3 O que é controle histórico?


Alguns profissionais da área da saúde argumentam que, por razões de ética, não se
pode privar de tratamento participantes de ensaios clínicos. Segundo eles, é preciso
comparar os resultados obtidos no grupo experimental com os resultados obtidos no
grupo de controles positivos; no entanto, tais ensaios exigem grandes amostras.
Ensaios pequenos não são conclusivos; em geral, eles não mostram diferença entre a
nova intervenção e a intervenção padrão.10 Por exemplo,11 cerca de 30 dos 35
experimentos que compararam um grupo de participantes que recebeu
betabloqueador com um grupo de controles positivos não mostraram diferença entre a
droga em teste e a droga padrão.
Uma solução possível – quando não se admitem controles negativos por razões de
ética – é comparar os resultados obtidos no grupo experimental com os resultados
obtidos por pessoas atendidas antes de a intervenção ter sido proposta – os chamados
“controles históricos”. Quem aponta vantagens na condução de ensaios clínicos com
controles históricos argumenta que, além de atender questões de ética, eles diminuem
tanto o tempo de recrutamento como a duração do ensaio, porque todos os
participantes recebem a nova intervenção.
O termo controle histórico refere-se, portanto, à prática de usar dados de estudos
anteriores ou de bases de dados conhecidas para estimar a resposta potencial ao
placebo ou tratamento padrão, que seria obtida no estudo em andamento.12
Comparam-se os resultados observados em participantes que receberam uma
intervenção experimental com os resultados observados em controles históricos. A
avaliação desse tipo de ensaio exige atenção especial. As características demográficas
dos grupos em comparação devem ser as mesmas. É preciso que a condição inicial dos
dois grupos, avaliada pelos mesmos parâmetros, seja similar. Os registros de dados
dos participantes que recebem a intervenção experimental devem ser feitos
obedecendo aos mesmos critérios usados nos registros de dados dos controles
históricos. Ainda, é preciso verificar se não houve mudança nas características
seculares da doença ou nas atitudes dos próprios médicos em relação à doença.

2.4 O que é ensaio em paralelo?


Ensaio em paralelo é um ensaio clínico no qual dois grupos de participantes recebem
intervenções diferentes.13 Quase sempre, um grupo é o experimental, e o outro é o
controle.
É comum – embora não seja obrigatório – que os dois grupos tenham o mesmo
número de participantes e sejam conduzidos simultaneamente.
2.5 O que é braço do estudo?
Muito da nomenclatura usada nos ensaios clínicos foi substituída. Então, embora
muitos livros ainda falem em grupos como definidos nas duas seções anteriores, essa
palavra foi substituída por braços (arms) nos glossários americanos.
Braço (arm) é um grupo ou subgrupo de participantes de um ensaio clínico que
recebe uma intervenção específica ou nenhuma intervenção, de acordo com o
protocolo apresentado.14
Existem diversos tipos de braços: braço experimental, braço comparador ativo, braço
comparador de placebo, braço comparador simulado e braço comparador de nenhuma
intervenção. As definições dadas em seguida, embora genéricas, identificam a
intervenção que o participante do braço recebe.
Braço experimental (experimental arm) é o grupo de participantes da pesquisa que
recebe a intervenção em teste no estudo.15
Braço comparador ativo (active comparator arm) é o grupo de participantes que recebe
intervenção considerada efetiva.16
Nos ensaios com drogas, o braço comparador ativo pode ser: 1) droga ativa não
experimental; 2) o tratamento que o participante já vinha fazendo; 3) droga ativa não
experimental, acrescida de placebo para a droga experimental; 4) o tratamento que o
participante já vinha fazendo, acrescido de placebo para a droga experimental. Pode
haver mais de um braço comparador ativo; na maioria dos ensaios, no entanto, há
apenas dois braços: o braço experimental e o braço comparador ativo.17

Ex e m plo 2 - 2
Foi conduzido18 um ensaio randomizado, prospectivo, multicêntrico com
pacientes que, na linha de base, tinham pressão sanguínea sistólica de 160 mm Hg
ou mais (no caso de pacientes com diabetes tipo 2, que tinham pressão sanguínea
sistólica de 150 mm Hg ou mais, mesmo tomando três drogas anti-hipertensivas). Os
pacientes foram designados ao acaso para um dos dois braços do ensaio: 1) braço
experimental, em que os pacientes foram submetidos a uma denervação renal, além
de manter o tratamento que vinham fazendo e 2) braço comparador ativo, em que os
pacientes apenas mantiveram o tratamento que vinham fazendo.

18
Symplicity HTN-2 Investigators. Renal sympathetic denervation in patients with treatment-resistant hypertension
(The Symplicity HTN-2 Trial): a randomised controlled trial. Lancet. 2010 Dez. 4;376(9756):1903-9.

Braço comparador de placebo (placebo comparator arm) é o grupo de participantes que


recebe apenas placebo durante o ensaio clínico.19

Ex e m plo 2 - 3
Foi conduzido20 um ensaio randomizado, prospectivo, multicêntrico com 26.449
pacientes que tinham um histórico de infarto do miocárdio, AVC isquêmico ou
doença arterial periférica. Os pacientes foram designados ao acaso para receber
vorapaxar (2,5 mg/dia) ou um placebo e foram seguidos por cerca de 30 meses.
20
Morrow, DA. et al. Vorapaxar in the Secondary Prevention of Atherothrombotic Events. N. Engl. J. Med. 2012
Abril 12; 366(15):1404-13.

Os ensaios em que um grupo de participantes recebe apenas placebo são ditos


placebo controlados. É importante deixar claro que não é placebo controlado o ensaio
em que participantes do braço experimental recebem a intervenção experimental
adicionada ao padrão e participantes do outro braço recebem placebo adicionado ao
padrão. Nesse caso, não há um braço comparador de placebo, mas um braço comparador
ativo.
Braço comparador simulado (sham comparator arm) é um grupo de participantes
submetido a procedimentos ou dispositivos, feitos de tal maneira que não podem ser
distinguidos dos procedimentos ou dispositivos que estão sendo estudados, mas cujos
elementos não estão ativos.21

Ex e m plo 2 - 4
Foi conduzido um ensaio22 para testar a hipótese de que a expressão emocional
por escrito de experiências estressantes do passado produz benefícios tanto de
natureza psicológica como física. Os voluntários foram recrutados na comunidade
em que foi realizada a pesquisa por meio de avisos em jornais, em clínicas e em
hospitais. O critério de inclusão era o diagnóstico confirmado de asma ou artrite
reumatoide. Foram excluídos da pesquisa os seguintes pacientes: psiquiátricos; em
psicoterapia; que estivessem usando medicação que pudesse interferir no
prognóstico da doença; que estivessem usando mais de 10 mg de prednisone por dia
e aqueles impossibilitados de cumprir o protocolo. Participaram do ensaio 58
pacientes com asma e 48 com artrite reumatoide. Os voluntários de cada um desses
grupos foram designados ao acaso para um de dois braços do ensaio: o experimental
e o simulado. Os participantes dos dois grupos foram convidados a escrever durante
20 minutos e por 3 dias consecutivos, em uma sala do departamento em que se
realizou a pesquisa. A diferença estava no assunto sobre o qual deveriam escrever.
Os pesquisadores pediram aos participantes do braço experimental que escrevessem
sobre fatos estressantes do passado; aos participantes do braço simulado, solicitaram
que escrevessem sobre o dia a dia. Os participantes não se encontravam em salas de
espera ou em corredores e todos sabiam que estavam participando de uma pesquisa
para estudar a experiência com o estresse devido à doença. Os pesquisadores
verificaram que os voluntários que haviam escrito sobre episódios estressantes do
passado tiveram melhoras significativas.

22
Smyth JM. et al. Effects of Writing About Stressful Experiences on Symptom Reduction in Patients With Asthma
or Rheumatoid Arthritis: A Randomized Trial. JAMA 1999 Abril 14;281(14):1304-9.

O braço comparador simulado é especialmente atraente nos casos em que o risco é


baixo, e o desfecho é subjetivo. No entanto, ensaios clínicos com braço simulado –
embora constituam opção possível – são raros.23 Na área de cirurgia, não existe nada
que se assemelhe à ideia de placebo. Então, para testar o efeito de uma cirurgia
experimental, o grupo-controle é, em geral, submetido à cirurgia convencional ou é
tratado clinicamente. As cirurgias simuladas são raras, mas há registros na literatura
recente.

Ex e m plo 2 - 5
Meniscectomia parcial artroscópica é um dos procedimentos ortopédicos mais
comuns, embora não haja evidência da eficácia. Foi feito um estudo24 multicêntrico,
randomizado, duplo-cego com 146 pacientes de 35 a 65 anos de idade, sem
osteoartrose de joelho, mas que apresentavam sintomas de degeneração do menisco
medial. Os pacientes foram aleatoriamente designados para meniscectomia parcial
artroscópica ou cirurgia simulada. Não houve diferenças significantes entre os
grupos, comparando as mudanças nas variáveis medidas na linha de base e 12
meses após a cirurgia.

24
Sihvonen R. et al. Finnish Degenerative Meniscal Lesion Study (FIDELITY) Group. N. Engl. J. Med. 2013 Dez.
26;369(26):2515-24.

A literatura mais antiga25 registra um ensaio, muito citado e muito discutido por
razões de ética, em que se mostrou, por meio de um ensaio com braço comparador
simulado, ser desnecessária a ligadura da artéria mamária para tratar a isquemia do
miocárdio. No grupo de pacientes do braço comparador simulado foi feita a anestesia
e, depois, a incisão cirúrgica no tórax, mas não foi feita a ligadura da artéria mamária.
Braço comparador de nenhuma intervenção (no intervention arm) é o grupo de
participantes da pesquisa que não recebe intervenção durante um ensaio clínico.26

Ex e m plo 2 - 6
Foi feito um ensaio clínico27 com 227 mulheres que tiveram câncer de mama e se
submeteram à cirurgia, para testar a hipótese de que intervenção psicológica pode
reduzir o estresse emocional e melhorar indicadores de saúde. Todas as mulheres
fizeram entrevistas, completaram um questionário e forneceram uma amostra de
sangue para determinar a resposta imunológica. Foram então divididas ao acaso em
dois grupos: o grupo que recebeu intervenção psicológica (durante 4 meses, uma
sessão por semana) e o grupo de nenhuma psicoterapia.

27
Anderson BL. et al. Psychological behavior and immune changes after a psychological intervention: a clinical trial.
J. Clin. Oncol. 2004 Set. 1;22(17):3570-80.

2.6 Como os participantes são designados para cada


braço do estudo?
A interpretação dos resultados de um ensaio clínico depende, basicamente, da
confiança que se pode depositar na similaridade dos braços, constituídos no início dos
trabalhos. Mas como se constituem braços similares? A recomendação é antiga: os
participantes devem ser designados aos braços do ensaio por processo casual ou
aleatório (sorteio); ou seja, pelo que se convencionou chamar de randomização.
Para dividir um conjunto de participantes28 ao acaso em dois braços, experimental e
comparador ativo, a ideia que primeiro ocorre é a de jogar uma moeda: se sair “cara”, o
participante é designado, por exemplo, para o braço experimental; se for “coroa”, o
participante é designado para o braço comparador ativo. Completado um braço, os
demais participantes seriam automaticamente designados para o outro braço. Veja a
Figura 2-2.

FIGURA 2-2 Randomização

Atualmente, a constituição dos braços é feita por meio de tabela de números


aleatórios em computador, antes do início dos trabalhos. O resultado da randomização
deve estar escrito e disponível para o pesquisador. Então, para comparar o braço
experimental com o braço comparador ativo, um resultado possível para a
randomização seria, por exemplo, E, A, A, A, E, A, E, E etc. Os participantes são
designados ao braço experimental (E) ou braço comparador ativo (A), na ordem em
que chegarem, mas de acordo com o resultado da randomização. No entanto, a
expressão “jogar uma moeda” é usual entre pesquisadores da área de saúde quando se
referem à randomização.
Um ensaio é definido como ensaio clínico randomizado (randomized clinical trial –RCT)
na base de dados MEDLINE29 quando a randomização emprega técnicas matemáticas
como uma tabela de números aleatórios para designar pacientes para o tratamento em
teste ou controle. Ensaios que empregam métodos de alocação de tratamento como
jogos de moedas, números pares ou ímpares de matrícula no ensaio, número de algum
outro tipo de registro do paciente, dias da semana, número da ficha clínica ou outro
pseudoprocesso de randomização são chamados ensaios clínicos controlados (controlled
clinical trial – CCT).
Ensaios clínicos controlados, como definidos na Medline, envolvem um ou mais
tratamentos em teste sendo pelo menos um deles controle, medidas especificadas de
desfecho para avaliar a intervenção em estudo e um método sem viés para designar
pacientes ao tratamento em teste. O tratamento pode ser uma droga, um dispositivo,
um procedimento em estudo para diagnóstico, efetividade terapêutica ou profilática.
O controle pode ser placebo, droga ativa, nenhum tratamento, formas e regimes de
dosagem, controles históricos.
O princípio da randomização é uma das principais contribuições dos estatísticos à
ciência experimental. A randomização tende a “balancear ” o ensaio, isto é, distribuir
os participantes com características diferentes pelos diversos braços, mesmo que o
pesquisador não esteja consciente dessas características.30

Ex e m plo 2 - 7
O primeiro ensaio clínico randomizado31 foi conduzido no final da década de 1940
(Medical Research Council, 1948). Dada à incerteza do efeito da estreptomicina no
tratamento da tuberculose pulmonar – e respaldado pelo fato de ser reduzida sua
disponibilidade no pós-guerra – o médico Sir Austin Bradford Hill convenceu
médicos ingleses a alocarem aleatoriamente seus pacientes em dois grupos: os que
receberiam e os que não receberiam o medicamento. A distribuição aleatória de
estreptomicina foi, na ocasião, amplamente justificada pelas quantidades limitadas da
droga, mas foi o que possibilitou avaliação não tendenciosa da eficácia do
tratamento.

31
Yoshioka A. Use of randomisation in the Medical Research Council’s clinical trial of streptomycin in pulmonary
tuberculosis in the 1940s. BMJ 1998 Out. 31;317(7167):1220-3.

Os pesquisadores que fazem objeção ao uso de randomização levantam questões de


ética. No entanto, um simples exame da argumentação usada nesses casos quase
sempre revela que a objeção se refere ao ensaio em si – não ao uso de processo
aleatório para a distribuição dos participantes pelos diferentes braços do ensaio. É
claro que se o mérito de uma intervenção estiver comprovado, é errado sortear
participantes de pesquisa para constituir um braço comparador de nenhuma
intervenção. A objeção aqui não se refere à randomização, mas ao fato de um
profissional da saúde recusar a intervenção de comprovada eficiência a um grupo de
pacientes.
É importante ter consciência de que existe um período certo para a condução de
ensaios clínicos randomizados. Qualquer intervenção nova divide a opinião dos
especialistas, a favor e contra essa nova intervenção. A incerteza é da comunidade médica
– não de um médico em particular. É esse o momento para a condução de ensaios
clínicos randomizados, mas a ética exige que:
“(...) se houver necessidade de distribuição aleatória dos participantes da pesquisa
em grupos experimentais e de controle, é preciso assegurar que, a priori, não seja
possível estabelecer as vantagens de um procedimento sobre outro, mediante
revisão de literatura, métodos observacionais ou métodos que não envolvam seres
humanos.”
Resolução n° 466/12, item III.1f

Já foram propostas alternativas para a randomização, como pedir aos pacientes que
se submetam voluntariamente à intervenção experimental. Os que se recusassem
constituiriam o braço comparador ativo – mas isso introduz viés nos resultados. Um
exemplo interessante é o do maior experimento já feito em saúde pública, o da vacina
contra a poliomielite. Esse exemplo, embora longo, é importante, pois mostra o viés
nos resultados quando não se faz a randomização. O tamanho grande da amostra não
compensa a falta de randomização.

Ex e m plo 2 - 8
Em 1954, o Serviço de Saúde Pública dos Estados Unidos32 decidiu fazer um ensaio
para testar a vacina Salk. Cerca de 2 milhões de crianças participaram do ensaio, mas
somente foram vacinadas crianças cujos pais permitissem a vacinação. Assim,
aproximadamente meio milhão de crianças foi vacinado; quase um milhão foi
deixado, deliberadamente, sem a vacina; outro meio milhão recusou a vacina.
Participaram do ensaio crianças de alto risco, isto é, aquelas que frequentavam as
três primeiras séries de escolas espalhadas pelos Estados Unidos.
Houve diversas propostas para o delineamento do ensaio. A primeira foi a
seguinte: pertenceria ao grupo experimental toda criança cujos pais permitissem a
vacinação; pertenceria ao grupo-controle toda criança cujos pais não permitissem a
vacinação. Veja a Figura 2-3. Esse delineamento está tecnicamente errado, porque
pessoas de nível socioeconômico mais alto concordam, mais facilmente, em serem
submetidas a tratamento médico experimental. Então, esse delineamento
introduziria viés contra a vacina, porque as crianças de famílias de renda mais alta
estavam mais sujeitas à poliomielite.
FIGURA 2-3 Ensaio comparativo não randomizado

A Fundação Nacional de Paralisia Infantil propôs outro delineamento: o grupo


experimental seria formado por todas as crianças das segundas séries cujos pais
permitissem a vacinação; no grupo-controle, ficariam as crianças das primeiras e
terceiras séries. Veja a Figura 2-4. Esse delineamento, embora tenha sido adotado
por muitas escolas, apresenta deficiências.

FIGURA 2-4 Ensaio comparativo: Fundação Nacional de Paralisia Infantil

A poliomielite é uma doença contagiosa; então, haveria viés contra a vacina se


ocorressem muitos casos da doença nas segundas séries (o grupo experimental teria
maior número de casos por apresentar condições maiores de contágio); haveria viés
a favor da vacina se ocorressem menos casos nas segundas séries. Outro defeito do
delineamento seria o de que as crianças das segundas séries cujos pais tivessem
concordado com a vacinação poderiam ser diferentes das crianças das primeiras e
terceiras séries, cujos pais nem sequer tivessem sido consultados. Os grupos não
são, portanto, comparáveis.
O melhor delineamento, que foi efetivamente adotado em várias escolas, é o que
usa a técnica da randomização. Toda criança cujos pais permitissem a vacinação era
sorteada para um dos grupos, controle ou experimental. O grupo-controle recebia
um placebo isto é, soro fisiológico em vez de vacina. No entanto, nem as crianças
que participavam do ensaio, nem seus pais e nem os médicos que fizeram o
diagnóstico da poliomielite sabiam a grupo a criança pertencia. Veja a Figura 2-5.

FIGURA 2-5 Ensaio comparativo randomizado

Os resultados33 dos dois delineamentos são dados na Tabela 2-1. Ocorreram


menos casos da doença nos grupos vacinados; é a comprovação de que a vacina
protege contra a doença. No entanto, no contexto de metodologia científica, é
importante comparar os resultados obtidos nos dois delineamentos: 1) as taxas de
incidência da doença em crianças vacinadas são semelhantes nos dois
delineamentos; 2) a taxa de incidência da doença no grupo-controle cujos pais
permitiram vacinar é maior que no grupo-controle constituído de crianças cujos pais
não permitiram vacinar. Qual seria a explicação?

Tabela 2-1
Resultados do experimento com a vacina Salk contra a poliomielite

Técnica Grupo Amostra Casos de pólio Taxa (por 100.000)

Vacinado 200.745 33 16

Randomizado Controle 201.229 115 57

Não consentiram 338.778 121 36

2ª série: vacinado 221.998 38 17

Não randomizado 1ª e 3ª séries 725.173 330 46

2ª série: não vacinado 123.605 43 35

Antes de buscar uma conclusão, convém examinar os fatos: a diferença entre o


grupo-controle formado por sorteio e o grupo-controle formado pelos que se
recusaram a participar do experimento está tanto no fato de o primeiro ter recebido
soro (e o segundo, não) como no fato de o primeiro ter se prontificado a participar (e
o segundo, não). É possível distinguir entre esses dois fatores?
A pólio é causada por um vírus transmitido por via oral. Antes do
desenvolvimento da vacina, quase todas as pessoas, em algum momento, e
principalmente na infância, eram expostas ao vírus, mesmo sem ter consciência
disso. Na maioria das vezes, a paralisia não ocorria, mas a criança ficava imune.
Sabe-se que, quanto mais tarde ocorria a primeira exposição, maior era o risco de
desenvolver a doença. Portanto, as crianças superprotegidas por alto padrão de
higiene eram, provavelmente, mais velhas quando se expunham ao vírus pela
primeira vez. Daí o maior risco de paralisia em crianças de famílias mais ricas.
Atualmente, sabe-se que a decisão das pessoas em participar ou permitir que seus
filhos participem de um programa de vacinação experimental depende de múltiplos
fatores, tais como educação, experiências de vida, doenças na família, interesse em
saúde e higiene. É, portanto, razoável concluir que, no ensaio com a vacina contra a
pólio, mais crianças de alto risco se apresentaram como voluntárias que crianças de
baixo risco.

32
Ver: Meier P. The biggest public health experiment ever: the 1954 field trial of the Salk poliomyellitis vaccine. In:
Tanur, J.M. et al. Statistics: a Guide to the Unknown and Health Sciences. San Francisco, Holden Day, 1978. Ver
também: Bland M. An Introduction to Medical Statistics. Oxford, Oxford Medical Publications, 1987.
33
Meier P. The biggest health experiment ever: the 1954 field trial of the Salk poliomyelitis vaccine. In: Tanur JM. et
al. Statistics: a Guide to the Unknown and Health Sciences. San Francisco, Holden Day, 1978.

2.7 Existe alternativa para a randomização?


Feito o diagnóstico, o médico deve expor ao paciente – quando for o caso – que existem
tratamentos alternativos para a doença e ajudá-lo a escolher um deles. No entanto, é
difícil explicar que o próprio médico – e os médicos em geral – não sabem qual é o
melhor tratamento para essa doença e esperam que o paciente experimente um deles
ao acaso. A pré-randomização34 (pré-randomization design for clinical trials) proposta por
Zelen35 foi concebida como uma maneira de contornar essa situação.
De acordo com a proposta, os pacientes elegíveis para o ensaio devem ser
designados ao acaso para um dos braços, experimental ou comparador ativo
(tratamento padrão). O grupo designado para o tratamento padrão não precisaria ser
consultado – constituiria o braço comparador ativo. Os pacientes designados para o
braço experimental seriam consultados se aceitariam ou não serem submetidos à
intervenção experimental. Quem não aceitasse ficaria pertencendo ao braço
comparador ativo, como mostra a Figura 2-6. Do ponto de vista da estatística, o
delineamento é válido, embora tenha menos eficiência que um ensaio totalmente
randomizado. A grande vantagem seria a de aumentar o número de participantes na
pesquisa.
FIGURA 2-6 Ensaio clínico pré-randomizado

Este delineamento foi bem recebido em alguns círculos, mas encontrou restrição por
parte de pesquisadores preocupados com a ética na pesquisa. Para eles, não se pode
deixar de informar a situação experimental para metade dos participantes. Dada à
controvérsia, não foi conduzido nenhum grande ensaio clínico seguindo a proposta
estrita de Zelen. No entanto, uma pequena variação dessa proposta foi usada nos
Estados Unidos em diversos ensaios clínicos de larga escala, envolvendo pacientes
com câncer.
Essa variação, denominada ensaio clínico pré-randomizado com duplo
consentimento, admite que a designação aleatória das intervenções seja feita a priori,
mas exige que todo paciente tome conhecimento da situação experimental e somente
se torne participante da pesquisa se assim o desejar. É mais fácil convidar o paciente
para participar de uma pesquisa em que se estuda uma intervenção experimental se o
profissional da saúde já souber o que oferecer. Veja a Figura 2-7.

FIGURA 2-7 Ensaio clínico pré-randomizado com duplo consentimento

De qualquer maneira, ainda é grande o número de pessoas que se recusa a receber


uma intervenção que lhes é designada ao acaso. Para estudar as atitudes e o
conhecimento adquirido sobre ensaios clínicos durante o processo de diagnóstico e
tratamento do câncer de mama,36 554 mulheres completaram um questionário. Os
autores concluíram que mulheres com câncer de mama se recusaram mais a participar
de ensaios clínicos (33%) que mulheres que estavam sendo submetidas à mamografia
(15%). Os autores também concluíram que, em relação à randomização, têm atitude
mais favorável e se sentem mais dispostas a participar mulheres que melhor entendem
a proposta de um ensaio clínico. Contudo, não existem alternativas para a
randomização.

2.8 Resumo
Ensaio clínico ou estudo de intervenção é um estudo em que se comparam o efeito e o
valor de intervenções na saúde das pessoas.
Controles negativos são pacientes que, durante o ensaio clínico, recebem apenas
placebo.
Controles positivos ou controles ativos são pacientes que, durante o ensaio clínico,
recebem tratamento efetivo.
Controles históricos são dados arquivados de pacientes que receberam intervenção
comparável com a intervenção experimental em estudo, nas mesmas condições.
Ensaio em paralelo é um estudo clínico no qual grupos de participantes de pesquisa
recebem intervenções diferentes na mesma ocasião.
Braço experimental (experimental arm) é o grupo de participantes de pesquisa que
recebe a intervenção experimental.
Braço comparador ativo (active comparator arm) é o grupo de participantes de pesquisa
que recebe intervenção efetiva.
Braço comparador de placebo (placebo comparator arm) é o grupo de participantes de
pesquisa que recebe apenas placebo.
Braço comparador simulado (sham comparator arm) é o grupo de participantes de
pesquisa submetido a uma simulação de tratamento, isto é, submetido a
procedimentos ou dispositivos falsos, aparentemente iguais ao procedimento ou
dispositivo verdadeiros.
Braço comparador de nenhuma intervenção (no intervention arm) é o grupo de
participantes de pesquisa que não recebe intervenção durante um ensaio clínico.
Randomização é a designação dos participantes de pesquisa para os grupos do ensaio
por processo casual ou aleatório (sorteio).

1
Panter AT, Sterba SK. Handbook of ethics in quantitative methodology. Nova York, Routledge, 2011.
2
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
junho de 2014.
4
Alguns autores dizem grupo tratado.
5
Subdose de droga ativa também é placebo.
7
Katz J. Experimentation with human beings. Nova York, Russell Sage Foundation, 1972.
8
Mudur G. Indian study of women with cervical lesions called unethical. BMJ 1997 Abril 12;314(7087): 1065.
9
Ver Capítulo 5.
10
Quando a amostra é pequena, o poder do teste estatístico é baixo.
11
U.S. Department of Health and Human Services, FDA, Center for Drug Evaluation and Research. Seminar Series:
The use of placebos in Clinical Trials and the ethics of the use of placebos. Disponível em:
www.fda.gov/cder/foi/special/99/case-trans-42199.txt. Acesso em 30 de maio de 2014.
12
Wiley Online Dictionary. Disponível em:
http://onlinelibrary.wiley.com/doi/10.1002/9780471462422.eoct347/abstract. Acesso em 3 de abril de 2014.
13
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
junho de 2014.
14
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
fevereiro de 2014.
15
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
fevereiro de 2014.
16
Idem.
17
Friedman LM, Furberg CD, DeMets DL. Fundamentals of clinical trials. Nova York, Springer. 4 ed., 2010.
19
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
junho de 2014.
21
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
junho de 2014.
23
Sutherland ER. Sham Procedure versus Usual Care as the Control in Clinical Trials of Devices. Proceedings of the
American Thoracic Society 2007; 4(7):574-576.
25
Cobb LA. et al. An evaluation of internal mammary artery ligation by a double blind technique. N. Engl. J. Med.
1959 Maio 28;260(22):1115-8.
26
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10 de
junho de 2014.
28
A randomização descrita aqui é a chamada “randomização simples”, que só deve ser usada quando os participantes
da pesquisa são similares em relação às variáveis demográficas e aos fatores que têm efeito sobre a condição em
estudo. Para outros tipos de randomização, consulte o Capítulo 4.
29
Meinert CL. Clinical trials dictionary. Nova York, Wiley, 2012.
30
A casualização tende a distribuir os indivíduos diferentes pelos dois grupos, mas não é uma garantia de que isso vá
ocorrer.
34
Não confundir pré-randomização proposta por Zelen com o período de run-in. Ver Seção 3.7 do Capítulo 3.
35
Zelen M. A new design for randomized clinical trials. N. Engl. J. Med. 1979 Maio 31;300 (22):1242-5.
36
Ellis PM. et al. Randomized Clinical Trials in Oncology: Understanding and Attitudes Predict Willingness to
Participate. J. Clin. Oncol. 2001 Ago. 1;19(15):3554-61.
C AP Í T U L O 3

Ensaios Clínicos: Mais Definições


Os primeiros ensaios clínicos comparavam novas intervenções com placebo ou
nenhum tratamento, pois pretendiam determinar se o novo tratamento tinha algum
efeito. Esses estudos começaram a ser feitos na Inglaterra logo após a Segunda Grande
Guerra e trouxeram muitas das melhorias que ocorreram nos serviços médicos nas
décadas seguintes. Em virtude do sucesso, os ensaios se multiplicaram e fizeram
surgir novas questões, tanto de ética como de metodologia. Atualmente, normas e
diretrizes nacionais e internacionais exigem, por razões de ética, esclarecer o
participante de pesquisa sobre a situação experimental. Ainda, por razões de ética, o
uso de placebo ou de nenhuma intervenção em situações que já têm tratamento
convencional encontra severas restrições.
No entanto, pessoas que sofrem de doenças muito graves ou fatais, para as quais
não existe terapia efetiva, às vezes insistem em afirmar que ensaios clínicos são
desnecessários. Elas querem o tratamento experimental, que lhes dá a esperança de
melhora ou, até mesmo, de cura. Isso aconteceu com pacientes com a síndrome da
imunodeficiência adquirida (AIDS) que argumentavam não serem os ensaios clínicos a
única forma de se chegar a uma conclusão sobre tratamentos. Isto é verdade, mas a
pesquisa não pode ser atropelada, sob risco de danos maiores.
Por exemplo, em 1991 foi lançado um estudo denominado Iniciativa sobre a Saúde
das Mulheres (Women’s Health Iniciative – WHI), endossado pelo Instituto Americano
de Saúde (National Institute of Health – NIH). Era um conjunto de ensaios clínicos e
um estudo observacional que, juntos, envolviam 161.808 mulheres, a maioria sadia, na
pós-menopausa. Os ensaios tinham o objetivo de testar o efeito da terapia hormonal
para prevenir doenças cardíacas. Quando o teste começou, a terapia hormonal era
comumente prescrita pelos médicos para tratamento dos sintomas da menopausa e
prevenção de doenças cardíacas.
Os trabalhos reunidos pelo WHI foram analisados em conjunto e se chegou à
conclusão de que a terapia hormonal aumenta o risco de acidente vascular cerebral
(AVC) e de coágulos sanguíneos e, nos primeiros anos de uso, aumenta o risco de
doença cardíaca. Nas mulheres que tomam uma combinação de estrógeno e
progesterona, o risco de câncer de mama aumenta. Como consequência, a
Administração de Alimentos e Drogas (Food and Drug Administration – FDA), órgão
do governo dos Estados Unidos que controla alimentos e drogas terapêuticas, hoje
recomenda aos médicos não mais prescrever terapia hormonal para prevenir doenças
cardíacas e a prescrever a menor dose, pelo menor tempo possível, para aliviar os
sintomas da menopausa.

3.1 O que é variável resposta ou desfecho clínico?


Variável resposta (response variable) ou desfecho clínico (clinical endpoint) é o evento
ou o resultado medido objetivamente no decorrer de um estudo clínico para
determinar se a intervenção em estudo é benéfica.

Por exemplo, em um ensaio clínico para comparar a eficácia de três drogas


terapêuticas no alívio de sintomas da asma, a variável resposta é o alívio dos sintomas.
Variável resposta é um termo mais moderno para variável dependente.1
Desfechos clínicos podem ser primários ou secundários. Desfechos clínicos primários
são os resultados mais importantes, buscados no objetivo primário do ensaio. Deve ser
um evento clínico significante para o paciente, clinicamente relevante e diretamente
relacionado com o objetivo principal da pesquisa. É com base no desfecho primário
que se determina o tamanho do ensaio. Desfechos clínicos secundários são resultados
obtidos de questões relevantes, mas não a mais importante, no mesmo estudo.
Como exemplo, considere um ensaio clínico que tenha como objetivo primário
comparar intervenções para diminuir a mortalidade por determinada causa. O
desfecho primário é o número de mortes de participantes ocorridas durante o ensaio,
atribuíveis a essa causa. O objetivo secundário desse ensaio poderia ser, por exemplo,
levantar dados de variáveis respostas secundárias como qualidade de vida, tempo de
hospitalização e custo do tratamento.
A variável resposta deve ser confiável e reprodutível, entendida e aceita
universalmente. O termo achado tem significado bem mais geral.

“(...) achados da pesquisa – fatos ou informações encontrados pelo pesquisador no


decorrer da pesquisa e que sejam considerados de relevância para os participantes
ou comunidades participantes.”
Resolução n° 466/12, item II.1

É mais comum que o objetivo primário de um ensaio clínico aponte apenas uma
variável resposta. No entanto, há diversas situações em que um conjunto básico de
medidas da atividade da doença compõe um índice, que acaba sendo a variável
resposta.2 Além disso, é possível usar eventos combinados para formar uma única
variável resposta. Isto deve ser feito quando os eventos ocorrem tão raramente que
seria necessário um tamanho grande de amostra para observar a ocorrência de cada
um desses eventos, isoladamente. Se for usada uma variável resposta combinada
(combined response variable), é contado apenas um evento por participante.

Ex e m plo 3 - 1
Foram aleatoriamente designados,3 para controle padrão da glicose ou controle
ativo da glicose (uso de glicazida, além de outras drogas, para atingir valor de
hemoglobina glicada de 6,5%) 11.140 pacientes com diabetes tipo 2. O objetivo
primário era estudar desfechos constituídos de uma variável resposta combinada de
eventos macrovasculares (morte por causas cardiovasculares, infarto do miocárdio não
fatal ou derrame não fatal) e microvasculares (nefropatia ou retinopatia nova ou
agravada) que ocorressem juntos, ou separados.
3
ADVANCE Collaborative Group. Intensive Blood Glucose Control and Vascular Outcomes in Patients with Type 2
Diabetes. N. Engl. J. Med. 2008 Jun. 12; 358:2560-72.

Outro tipo de variável resposta combinada é aquela que faz a contagem de eventos
múltiplos, mas todos do mesmo tipo. Então, em vez de apenas registrar a ocorrência
ou não de um evento, o pesquisador conta quantos eventos ocorreram no período. A
variável resposta combinada é, então, uma frequência. Por exemplo, são variáveis
resposta combinadas: 1) a frequência de ataques isquêmicos transitórios e 2) a
frequência de convulsões epiléticas durante um período específico de follow-up.

3.2 O que é variável resposta substituta?


Os ensaios que têm o objetivo de estudar eventos clínicos difíceis de medir ou de
ocorrência mais demorada podem ser caros e/ou de longa duração. Nesses casos, pode
ser medida uma variável resposta substituta (surrogate response variables) em vez da
variável resposta primária (o evento clínico de interesse). A variável resposta substituta
deve ser uma expressão da variável resposta de interesse, porém mais fácil de medir.
Por exemplo, em vez de monitorar infarto do miocárdio ou mortalidade por doença
cardiovascular (ocorrências que seriam a variável resposta primária), o pesquisador
poderia acompanhar o participante medindo o progresso da aterosclerose por meio de
angiografia ou ultrassom (variável resposta substituta). Na área de oncologia, o
tamanho do tumor poderia ser a variável resposta substituta para a incidência de
mortalidade (variável resposta primária). Usando variáveis substitutas, o ensaio se
torna menos caro, porque o pesquisador pode trabalhar com amostras menores em
ensaios de menor duração, uma vez que as medidas são feitas antes de ocorrer o
evento clínico de interesse da pesquisa.

Em estatística, uma variável é substituta (surrogate variable) se, usando essa


variável, qualquer teste da hipótese de nulidade para os grupos em comparação
apresente o mesmo resultado do teste aplicado sobre a verdadeira variável.4

4
Prentice RL. Surrogate endpoints in clinical trials: definition and operational criteria. Stat. Med. 1989 Abril 8(4):
431-40.

No caso de doenças que têm risco de morte iminente, alguns argumentam que
bastariam ensaios clínicos que testassem variáveis substitutas de resposta para
disponibilizar uma nova intervenção. A justificativa, nesses casos, é a de que seria
suficiente detectar qualquer tipo de benefício, mesmo que este seja de curta duração
ou, até mesmo, de efeito duvidoso. No entanto, isso não está certo. Qualquer
intervenção médica deve ser pelo menos potencialmente benéfica.
Outras questões também se impõem: primeiramente, a variável resposta substituta
precisa ser medida com precisão e segurança. Se os erros de medida forem grandes, os
resultados do ensaio são altamente questionáveis. A segunda questão é sobre a técnica
de medida: é aceitável, é invasiva, é inviável? A terceira questão é sobre o preço: será
que para medir essa variável não é preciso equipamento muito caro? E a última
questão: a variável substituta de resposta é suficientemente confiável e bem aceita pela
comunidade médica?
Levantadas as condições em que o uso de variável resposta substituta parece
inadequado, ainda resta perguntar: deve-se usar esse tipo de variável? Sim, mas apenas
nas fases iniciais de pesquisa, para decidir sobre a melhor dosagem ou para decidir se
uma intervenção é suficientemente promissora para merecer um ensaio em que se
observe a variável primária de resposta (verdadeira), que dará resultado mais
confiável.

3.3 O que são ensaios cegos, duplamente cegos,


triplamente cegos, abertos?
É preciso muito cuidado para evitar viés (bias) na coleta de dados. Mesmo que os
aparelhos estejam bem calibrados, pode existir viés nos resultados por conta da
expectativa do pesquisador. Para diminuir esse tipo de erro, em muitas pesquisas se
exige que as pessoas que fazem a medição em uma balança, ao microscópio ou em
uma radiografia não saibam a que grupo pertence o paciente ou o material que
examina.
Em outras pesquisas, é o participante que não deve ser informado a que grupo
pertence. Assim como o pesquisador, o participante pode ter expectativas e mais bem
responder ao tratamento no qual acredita. Ainda, todas as pessoas diretamente
envolvidas no trato do paciente (cuidadores, familiares etc.) não devem ser informadas
a que grupo o participante foi designado, para que seus comentários não afetem as
reações do paciente.

Cegamento (masking ou blinding) é uma estratégia de delineamento de ensaios


clínicos, de acordo com a qual uma ou mais partes envolvidas no ensaio, como o
pesquisador ou o participante, não sabem quais participantes foram designados
para quais as intervenções.5

5
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10
de maio de 2014.

Dada à atual recomendação para evitar termos que não sejam politicamente
corretos, os americanos passaram a designar os delineamentos cegos por masked
designs. Uma tradução adequada seria, então, delineamentos vendados; no Brasil, no
entanto, muitos traduzem masked por mascarado – termo que traz conotações de
simulado, fingido, disfarçado. Neste texto, a palavra usada é, então, ensaio cego. Mas
podem ser feitos ensaios cegos simples, ensaios duplamente cegos e ensaios
triplamente cegos.
Ensaio cego simples (single blind trial ou single masked trial) é aquele em que uma
das partes envolvidas no ensaio clínico, seja o pesquisador ou o participante, não
sabe para qual intervenção cada participante foi designado.6

6
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10
de maio de 2014.

Para evitar confusão sobre quem não está informado a que grupo os participantes
pertencem, os ensaios cegos simples são referidos como:
Cegos em relação ao pesquisador;
Cegos em relação ao participante;
Cegos em relação ao cuidador;
Cegos em relação ao analista (estatístico).
No entanto, não basta omitir ao participante o grupo ao qual ele foi designado. É
preciso que as intervenções sejam não identificáveis. Um ensaio clínico para comparar
drogas terapêuticas não é cego se as drogas puderem ser identificadas pelo gosto,
aspecto, cheiro ou por efeitos colaterais. Por exemplo, em um ensaio sobre os possíveis
benefícios da vitamina C sobre resfriados, participantes que eram da equipe médica
sabiam o que tomavam, porque haviam mordido o tablete para sentir, pelo gosto, se
estavam recebendo vitamina C ou placebo.7 Muitos dos que haviam sido designados
para o braço placebo se retiraram. A vitamina C mostrou ser benéfica para os
participantes que disseram haver identificado a droga, mas não se revelou efetiva para
os participantes que disseram não haver identificado o grupo ao qual pertenciam.
Como a gravidade e a duração dos resfriados eram relatadas pelos próprios
participantes, o fato de o participante se sentir tratado e ter convicção de que vitamina
C é efetiva para prevenir e tratar resfriados deve ter trazido viés aos resultados.
Friedman, Furberg e DeMets8 assinalam, adequadamente, que o fato de os autores
terem apontado as falhas no próprio trabalho foi importante como resultado da
pesquisa, porque mostrou a necessidade do correto cegamento.

Ensaio duplamente cego ou ensaio duplo-cego (double blind ou double masked trial) é
aquele em que duas ou mais partes envolvidas na pesquisa desconhecem como
foram distribuídas as intervenções.9

9
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10
de maio de 2014.

Os ensaios duplamente cegos exigem registros extremamente cuidadosos e, é claro,


não podem ser conduzidos por um único pesquisador. Outra pessoa, que não o
pesquisador, deve designar as intervenções e monitorar a segurança dos participantes.

Ex e m plo 3 - 2
Foi conduzido um ensaio multicêntrico, duplo-cego,10 para estudar a eficácia e a
segurança de donezepil como tratamento para pacientes com doença de Alzheimer
de leve a moderada. Os pacientes foram sorteados para receber placebo (n = 162), 5
mg de donepezil (n = 154) por dia ou 10 mg de donepezil por dia (n = 157) por 24
semanas, seguidas por um período de ensaio cego simples com placebo para todos
os participantes.

10
Rogers SL. et al. A 24-week, double-blind, placebo-controlled trial of donepezil in patients with Alzheimer’s
disease. Neurology 1998 Jan.;50(1):136-45.

Ensaio triplamente cego ou triplo-cego (triple blind) é aquele em que nem o


participante, nem o pesquisador, nem outras pessoas envolvidas na pesquisa (como
quem administra o tratamento ou o estatístico) sabem para qual intervenção o
participante foi designado.

Os ensaios triplamente cegos são pouco referidos, porque as precauções adicionais


exigidas já são tomadas nos ensaios duplamente cegos. No entanto, o termo enfatiza
os cuidados tidos na pesquisa.
De qualquer forma, sempre que possível, deve ser feito algum tipo de cegamento
nos ensaios clínicos, principalmente quando se comparam drogas terapêuticas; no
entanto, só cegamento não basta: é preciso que as drogas pareçam idênticas. Às vezes,
isso não é possível, porque uma das drogas é apresentada, por exemplo, na forma de
comprimido, e a outra, na forma de suspensão. Usam-se, então, placebos duplos (double
placebo), isto é, o placebo é apresentado nas duas formas. No caso do exemplo, haveria
um placebo para o comprimido e um placebo para a suspensão. Os placebos duplos
podem ser usados tanto em ensaios cegos como em ensaios duplamente cegos. Ainda,
quando se usam placebos duplos, podem estar em comparação dois ou quatro grupos.
No caso do exemplo, poderia haver dois grupos, ou seja, o grupo 1 receberia a droga A
(ativa) em comprimido e um placebo (b) para a suspensão e o grupo 2 receberia a
droga B (ativa) na forma de suspensão e um placebo (a) para o comprimido, como
mostra a Figura 3-1.

FIGURA 3-1 Tratamentos para a comparação de dois grupos usando placebos duplos
Também podem existir quatro grupos em comparação: o primeiro grupo receberia
comprimido e suspensão ativos; um segundo grupo receberia comprimido ativo e um
placebo para a suspensão; um terceiro grupo receberia placebo para comprimido e
suspensão ativa; e o quarto grupo receberia dois placebos, um para o comprimido e
outro para a suspensão, como mostra a Figura 3-2.

FIGURA 3-2 Tratamentos para a comparação de quatro grupos usando placebos duplos

Cabe reiterar que a ANVISA pede informações sobre o cegamento (mascaramento)


nos relatórios de ensaios clínicos.11 Contudo, há diferenças entre as definições dadas
aqui e as descritas pela ANVISA, que devem ser assinaladas. Assim, no ensaio cego
simples (single blind), o participante não sabe o tratamento que está recebendo. No ensaio
duplo-cego não simulado, nem participante nem pesquisador sabem a dose da droga que os
participantes estão recebendo, mas todos recebem a droga na mesma forma. Se forem
comprimidos orais, todos os participantes recebem comprimidos com a mesma cor,
mesmo gosto, mesmo cheiro – embora um grupo de participantes esteja recebendo
um placebo. No ensaio duplo-cego duplo simulado (dummy) (double blind double dummy),
nem participante nem pesquisador sabem a dose da droga que os participantes estão
recebendo, mas há placebos duplos. Um grupo recebe, por exemplo, droga ativa na
forma de comprimidos e uma suspensão placebo, e o outro grupo recebe placebo na
forma de comprimidos e droga ativa na forma de suspensão. No ensaio triplo-cego não
simulado, nem participante, nem pesquisador, nem analista sabem a dose da droga que os
participantes estão recebendo, mas todos recebem a droga da mesma forma. No ensaio
triplo-cego simulado (dummy), nem participante, nem pesquisador, nem analista sabem a
dose da droga que os participantes estão recebendo, mas há placebos duplos.

Ensaio aberto (open label trial) é aquele em que não há cegamento. Todas as pessoas
envolvidas sabem para quais intervenções os participantes foram designados.12

12
Glossary of Common Site Terms. Disponível em: http://clinicaltrials.gov/ct2/about-studies/glossary. Acesso em 10
de maio de 2014.

Alguns tipos de ensaios são necessariamente abertos, como aqueles que envolvem
ortodontia, comparação de dispositivos médicos, psicoterapia, mudanças no estilo de
vida (p. ex., hábitos alimentares). Nos ensaios com drogas terapêuticas, é
recomendável que os ensaios abertos sejam precedidos por ensaios duplamente cegos.
Muitos argumentam que os ensaios abertos são mais confortáveis para o médico, que
se sente mais seguro para suspender uma droga nova, quando detecta efeitos
colaterais descritos no protocolo. Contudo, há sempre o perigo de viés. Então os
ensaios abertos podem ser uma complementação para os ensaios duplamente cegos,
que dão maior confiança nos resultados.

3.4 O que são sujeitos ingênuos em ensaios clínicos?


Por questões éticas, o pesquisador deve explicar ao participante em potencial da
pesquisa tudo o que possa, eventualmente, afetar a vontade de essa pessoa participar
do experimento. Deve responder a todas as perguntas que o participante faça ou venha
a fazer sobre os objetivos e os procedimentos experimentais. Entretanto, as exigências
metodológicas de algumas pesquisas na área de psicologia entram em conflito com
essa responsabilidade do pesquisador.
A razão mais comum para limitar o grau de esclarecimento que o pesquisador deve
ao participante de pesquisa é a de que os dados não seriam válidos se o participante
tivesse pleno conhecimento das hipóteses em teste. A pessoa então participa sem
saber o objetivo da pesquisa ou, até mesmo, tendo recebido informações
deliberadamente erradas, porque o pesquisador quer criar condições para observar
determinados comportamentos ou atitudes.

Sujeito ingênuo (naive subject), em psicologia,13 é o participante que desconhece as


hipóteses em teste, isto é, não sabe o que está sendo observado. Em psicologia
social, sujeito ingênuo é a pessoa deliberadamente enganada sobre o real objetivo do
experimento.14

13
Ver: http://dictionary-psychology.com
14
Estes termos são da literatura em língua inglesa e francesa. Não constam dos termos e definições da Resolução n°
466 de 12 de dezembro de 2012 do CNS-MS.

De qualquer maneira, é obrigação do pesquisador que trabalha com “sujeitos


ingênuos” explicar o motivo de a variável resposta que pretende estudar não poder ser
obtida, a menos que o participante desconheça a situação experimental. Isso deve ser
claramente exposto no projeto apresentado ao CEP e, posteriormente, no trabalho
publicado. Ainda, do ponto de vista da ética, é razoável considerar que seja obrigação
do pesquisador explicar, tão logo quanto possível, todo o experimento a cada
participante da pesquisa, mostrando as razões de ter retido informações.

Na pesquisa que depende de restrição de informações aos seus participantes, tal


fato deverá ser devidamente explicitado e justificado pelo pesquisador responsável
ao Sistema CEP/CONEP. Os dados obtidos a partir dos participantes da pesquisa
não poderão ser usados para outros fins além dos previstos no protocolo e/ou no
consentimento livre e esclarecido.
Resolução n° 466/12, item IV.7

Dois psicólogos americanos, Rosenthal e Milgram, ficaram famosos por


experimentos que fizeram usando sujeitos ingênuos (naives). Ambos publicaram livros
com seus relatos. Rosenthal conduziu uma série de experimentos mostrando que
pesquisadores obtêm os resultados que esperam muito mais frequentemente do que
se presume. É o “efeito da expectativa do pesquisador ”, observado em estudos de
aprendizagem, em estudos sobre o tempo de reação das pessoas a determinados
eventos, em julgamentos de psicólogos e em estudos da percepção das pessoas sobre
situações da vida diária.

Ex e m plo 3 - 3
Rosenthal pediu aos alunos de psicologia que testassem a capacidade que ratos de
laboratório têm para aprender a correr em labirinto.15 Forneceu então aos alunos
dois grupos de ratos e identificou um grupo como constituído de “ratos
inteligentes”, que provinham de uma linhagem selecionada pela capacidade de
aprender a correr em labirinto. O outro grupo era de “ratos tolos”, incapazes de
aprender. Os alunos verificaram que os “ratos inteligentes” aprendiam tarefas muito
rapidamente. A questão é que não havia “ratos inteligentes” e “ratos tolos”. Todos
provinham da mesma linhagem e os grupos haviam sido formados ao acaso. É
importante frisar aqui que este não é um experimento com ratos de laboratório, mas
uma pesquisa com seres humanos. Como “sujeitos ingênuos”, eles mostraram ser
verdadeira a hipótese de que existe o “efeito da expectativa do experimentador ”
sobre o que é relatado em uma pesquisa experimental.

15
Rosenthal R. Experimenter effects in behavioral research. Nova York, Appleton-Century Crofts, 1966.

Os experimentos de Milgram também o tornaram famoso, especialmente aqueles


relativos à obediência à autoridade.16 De acordo com este autor, o senso de moral das
pessoas é sensível à pressão externa, ou seja, a ideia de obedecer precede à ideia de
evitar danos a outrem. É claro que essa conclusão é polêmica, mas os experimentos de
Milgram sugerem que as pessoas subestimam o impacto que as outras pessoas
exercem sobre elas próprias.

Ex e m plo 3 - 4
O psicólogo Stanley Milgram, professor da Universidade Yale, começou a fazer
experimentos em 1961, 3 meses após o início do julgamento de Adolf Eichmann, o
alemão nazista criminoso de guerra.17 Milgram concebeu seu estudo para responder,
em ambiente de laboratório, à pergunta “Será que Eichmann e seus milhões de
cúmplices do Holocausto apenas seguiam ordens, como alegavam?”. Os
experimentos de Milgram mediam a disposição dos participantes da pesquisa para
obedecer a uma autoridade, praticando atos que entrassem em conflito com a
consciência deles próprios.
Para isso, 40 homens com idades entre 20 e 50 anos foram convidados para
participar de um experimento sobre “aprendizagem”. De início, eles eram
apresentados a outro participante, que seria o “aluno”. O voluntário tomava o lugar
de “professor ”. O “aluno” deveria decorar uma lista de pares de palavras, para
demonstrar sua capacidade de aprender. Sentava-se, então, em uma cadeira e era
amarrado com eletrodos. Depois, o “professor ” dizia uma das palavras da lista e o
“aluno” deveria dizer seu par. Toda vez que o “aluno” errasse, o “professor ” deveria
dar-lhe um choque elétrico. O “aluno” dava respostas erradas de propósito, porque
era, na verdade, um ator trabalhando para Milgram. Se o “professor ” hesitasse,
recebia o comando para continuar e aumentar o choque, que podia atingir, na
marcação fictícia do aparelho, até 450 volts. Estava aí indicado choque grave, perigo.
Todos os participantes chegaram até 300 volts; 65% atingiram os 450 volts.

17
Milgram S. Behavioral study of obedience. Journal of Abnormal and Social Psychology, 1963 Out. 67:371-378.

Do ponto de vista da metodologia, é importante discutir a questão do “sujeito


ingênuo” por duas razões. A primeira é o fato de que, em inglês, a mesma expressão
(naive subjects) pode indicar pacientes que nunca receberam tratamento.18 Isso
acontece na área médica, mas não em psicologia. Em português, a expressão usada
para pacientes que nunca receberam tratamento é “virgens de tratamento”; em
pesquisas na área de farmacologia, muitas vezes é preciso recrutar este tipo de
paciente. A segunda razão para insistir no tema é o fato de participante cego ser, por
vezes, confundido com “sujeito ingênuo”; contudo, são conceitos diferentes.
O participante cego deve ter pleno conhecimento de que está sendo designado ao
acaso, ou seja, por sorteio, para um dos grupos da pesquisa. No entanto, o participante
cego tem pleno conhecimento da situação experimental, ou seja, dos objetivos da
pesquisa e de que grupos estão em teste. Já o “sujeito ingênuo” desconhece os
objetivos da pesquisa ou foi deliberadamente enganado.

3.5 O que é confundimento?


Há confundimento (confounding) no ensaio quando o efeito da intervenção está
confundido com o efeito de outros fatores, chamados fatores de confundimento ou
fatores de confusão (confounding factors).19

19
Friedman LM, Furberg CD, DeMets DL. Fundamentals of clinical trials. Nova York: Springer. 4 ed., 2010.

Confundimento tem certa similaridade com viés, mas é outro conceito. Enquanto viés
refere-se ao erro sistemático de medição, confundimento é erro na interpretação da
medida obtida. Se, em dado ensaio, os grupos se distinguem apenas pelo fato de um
deles receber determinada intervenção e o outro não, é lógico inferir que a causa da
diferença entre os grupos seja a intervenção. No entanto, se os grupos diferem com
relação a outros fatores, a diferença entre grupos pode ser, no todo ou em parte,
consequência desses outros fatores. Nesses casos, mesmo que exista diferença entre
grupos, não se pode concluir que a intervenção causou a diferença.

Ex e m plo 3 - 5
Quando sexo tem efeito sobre a variável resposta (p. ex., velocidade de corrida),
não se pode colocar no grupo tratado (com treinamento) apenas homens e no grupo-
controle (sem treinamento) apenas mulheres. Veja a Figura 3-3. Sexo e treinamento
ficariam confundidos na resposta. Se o grupo tratado (de homens) correr mais, não há
como concluir que o treinamento teve efeito.

FIGURA 3-3 Confundimento dos fatores sexo e treinamento

Quando o fator de confusão é conhecido, fica fácil lidar com a situação. No entanto,
se o fator de confusão for desconhecido, pode ser impossível distinguir o que é efeito
da intervenção do que é fator de confusão. A melhor defesa contra o confundimento,
quando o fator de confusão é desconhecido, é a randomização, que garante a
distribuição aleatória dos fatores de confusão entre os grupos. No caso do Exemplo 3-
5, em que o fator de confusão é conhecido (sexo, que está confundido com o
tratamento, que é treinamento), é melhor proceder à estratificação como apresentado
no Capítulo 4.
O confundimento também pode ocorrer quando o pesquisador quer estabelecer
associação entre duas variáveis – e ambas não estão associadas entre si, mas a uma
terceira variável.

Ex e m plo 3 - 6
Um pesquisador quer saber se o consumo de café está associado à doença
cardiovascular. Toma um grupo de pessoas que consomem muito café para comparar
com um grupo que não toma café. No entanto, neste caso, o grupo de pessoas que
toma café também tem o hábito de fumar. Como beber café está associado ao
tabagismo, o hábito de fumar é uma variável de confusão que pode levar à falsa
conclusão de que beber café leva à doença cardiovascular. Veja a Figura 3-4.

FIGURA 3-4 Confundimento: consumo de café e tabagismo

3.6 O que é washout?


Para avaliar o efeito de uma droga T, são feitos ensaios em que cada voluntário recebe
tanto a droga T em teste como uma droga R de referência, mas em ocasiões diferentes
O pesquisador deve sortear a droga (T ou R) que será administrada ao voluntário em
primeiro lugar e – decorrido certo período de tempo – deverá administrar a segunda
droga. Esse período de tempo entre as duas administrações, denominado washout, é
obrigatório, porque a droga usada em primeiro lugar pode ter efeito persistente, que
afetará o efeito da droga usada no período subsequente. Denomina-se efeito da droga
àquele observado durante o período no qual ela é administrada e efeito residual (carry
over effect) aquele que persiste, terminado o período da dosagem.

Período de eliminação, mais conhecido no Brasil pela expressão em inglês washout, é


um intervalo de tempo suficientemente grande entre dois períodos de tratamentos
para que o efeito residual de uma formulação, administrada em um período de
tratamento, seja eliminado das unidades experimentais para o próximo período.20

20
ANVISA. Manual de boas práticas em biodisponibilidade: bioequivalência. Módulo 3: Etapa estatística. Agência
Nacional de Vigilância Sanitária. Gerência-Geral de Inspeção e Controle de Medicamentos e Produtos. Brasília,
2002.

Durante o washout, o paciente não recebe droga ativa, mas pode receber um placebo.
O intervalo entre os dois períodos de coleta (washout) deve ser de, no mínimo, sete
meias-vidas de eliminação do fármaco e/ou do metabólito,21 para garantir completa
depuração. Está apresentada, na Tabela 3-1, uma distribuição de estudos de acordo
com o número de dias de washout, para dar ideia da questão.

Tabela 3-1
Distribuição de estudos conforme o número de dias de washout

Tempo de washout Brasil Ásia Europa América Total

6 0 2 0 0 2

7 7 15 9 4 35

14 9 6 2 0 17

De 20 até 28 3 1 3 0 7

Sem informação 2 1 2 1 6

Total 21 25 16 5 67

Fonte: CHELLINI, P.R. Boas práticas estatísticas em estudos de bioequivalência com delineamento crossover 2x2.
http://www.bibliotecadigital.ufmg.br/dspace/bitstream/1843/RFFO-7TZN7W/1/paulachellini.pdf

3.7 O que é período de run-in?


Os estudos clínicos começam com a triagem (screening) de participantes em potencial
para o estudo, isto é, de pessoas que, aparentemente, atendem às características que
serão estudadas. Procede-se, então, a verificação da elegibilidade, ou seja, verifica-se se
os participantes em potencial têm as características descritas nos critérios de inclusão e
não têm as características descritas nos critérios de exclusão. Prossegue-se, depois, ao
recrutamento (recruitment), ou seja, convidam-se as pessoas elegíveis para participar da
pesquisa. As pessoas que concordam em participar assinam o TCLE e iniciam o período
introdutório.

Período introdutório (run-in ou lead-in period) é o período que decorre entre o


recrutamento do paciente após triagem e o início do ensaio.

Conforme dispõe a ANVISA, nesse período pode ser adotado um dos seguintes
procedimentos: 1) com placebo: não se administra tratamento ativo, apenas placebo; 2)
sem placebo: não se administra tratamento ativo nem placebo – seria um período de
washout; 3) não há: não se faz período introdutório. Portanto, no período introdutório,
não se administra tratamento ativo, mas pode ser administrado placebo com controle
de dieta.
Recomenda-se que, no período introdutório, o pesquisador verifique se o
participante atende, de fato, aos critérios de inclusão, pois pessoas não elegíveis podem
ter sido recrutadas por algum tipo de erro. Participantes que não são capazes de
cumprir o protocolo, ou não têm condição estável ou respondem ao placebo também
são excluídos. As razões desses critérios são óbvias, mas há autores que os criticam.
Eles argumentam que retirar participantes que não cumprem o protocolo ou
respondem ao placebo diminui a validade externa do ensaio.22 Na verdade, os
resultados desses ensaios são válidos mesmo quando se retiram tais participantes,
mas só se aplicam a subgrupos de pacientes que não podem ser facilmente
identificáveis pelas características clínicas ou demográficas.23
É preciso notar que, no período introdutório (período de run-in), os medicamentos
que o paciente vinha utilizando antes de iniciar o ensaio são descontinuados. Nos
casos de doenças que têm terapia padrão efetiva, esse procedimento pode não ser
defensável do ponto de vista da ética, principalmente se houver a possibilidade de
prejuízo para o paciente em longo prazo. Período introdutório seguido de placebo é
particularmente inaceitável no caso de pacientes que estavam respondendo bem ao
tratamento que vinham recebendo. Não há sentido em suspender a medicação que
está sendo terapeuticamente eficiente só para que o paciente possa participar da
pesquisa. No entanto, é razoável incluir, nas pesquisas, pacientes virgens de
tratamento.

3.8 O que é intenção de tratar?


Os dados das pessoas que passaram pelo processo de triagem, mas foram
consideradas não elegíveis, não entram na análise estatística, porque elas não foram
randomizadas. Isso não introduz viés para a análise, ou seja, permanece a validade
interna (internal validity). No entanto, os dados perdidos (missing data) – de participantes
que passaram pelo processo de randomização e se retiraram ou foram retirados dos
ensaios (dropouts) – trazem viés para a análise, mesmo que o número de dropouts seja
similar, nos diferentes braços. A validade externa (external validity), isto é, a
generalização dos resultados, fica prejudicada.
Validade interna e validade externa ficam mais bem entendidas com um exemplo
simples. Se, obedecendo ao critério de exclusão, forem retiradas todas as mulheres
com menos de 45 anos de idade de um ensaio que propõe testar uma nova intervenção
para mulheres com câncer de mama, a validade interna não fica comprometida desde
que a amostra seja grande, e as participantes da pesquisa tenham sido randomizadas
para pertencer ao braço experimental ou ao braço comparador ativo. No entanto, os
resultados do ensaio não podem ser estendidos para mulheres com menos de 45 anos
de idade, ou seja, a validade externa fica reduzida com a exclusão de mulheres de
menos de 45 anos.
E por que ocorrem perdas de participantes (dropouts)?24 Alguns participantes podem
ter mudado de cidade ou, por motivos pessoais, não terem mais condições de ir até o
local da pesquisa. Outros podem ter sentido efeitos colaterais do tratamento e, por
conta disso ou por outra razão, terem desistido de cumprir o protocolo ou – não tendo
sentido qualquer melhora – terem procurado ajuda em outro lugar. Quando são
exigidas várias visitas dos participantes ao centro de pesquisa, ocorrem mais
desistências. Por isso, o participante de pesquisa precisa ser informado, com a
necessária antecedência, sobre as datas em que deve comparecer ao centro de pesquisa
e para quê. Ainda, deve ser perguntado se pode comparecer em todos os horários
marcados. Não se deve fazer o paciente retornar ao centro de pesquisa mais vezes que
o necessário, por ser falta de consideração e um risco de perder o participante da
pesquisa.
Às vezes, é o pesquisador quem retira participantes da pesquisa, porque houve erro
no diagnóstico (o participante era não elegível) ou no registro de dados, ou porque o
participante relata não estar seguindo o protocolo ou apresenta efeitos adversos
graves. De qualquer modo, cabe lembrar que é necessário conseguir a cooperação do
paciente, para não perder dados importantes para a análise do trabalho. Um indicador
importante da qualidade do ensaio clínico é a proporção de pacientes perdidos no
follow-up: quanto mais baixa for essa proporção, melhor será a qualidade do ensaio,
medida por esse indicador.
No entanto, há outro motivo para o participante não estar presente no grupo para o
qual foi designado, no momento da coleta final de dados. O participante tem o direito,
mesmo depois de ter assinado o TCLE e ter sido randomizado, de não aceitar o
tratamento que lhe foi designado por processo aleatório. Por exemplo, um participante
designado para o braço experimental pode decidir que quer o tratamento padrão, ou
seja, quer pertencer ao braço comparador ativo. O participante não se retirou, apenas
fez um cruzamento (cross-over).

O princípio de intenção de tratar (intention to treat analysis) afirma que os dados de


todos os participantes randomizados com pelo menos uma avaliação após o início
do tratamento devem ser considerados na análise primária, considerando-os
pertencentes ao grupo para o qual foram designados.25

25
A recomendação dos estatísticos é usar todos os dados de linha de base e os que foram obtidos na sequência.
Quando os dados deixam de existir na planilha, porque o participante se retirou ou foi retirado, o estatístico
deve preencher os dados faltantes com os últimos dados coletados do participante.

A ANVISA26 considera que a análise estatística é feita de acordo com a intenção de


tratar quando os dados são analisados conforme a alocação da medicação do estudo na
randomização, e por protocolo quando os dados são analisados conforme a medicação
da qual os pacientes efetivamente fizeram uso. No entanto, falta informação da
Agência de como considerar, na análise estatística, o paciente que muda de braço no
decorrer do ensaio (se permaneceu no ensaio metade do tempo em um braço, metade
em outro).
Aliás, os pesquisadores geralmente não explicam suficientemente se houve dropouts,
isto é, se participantes se retiraram ou foram retirados da pesquisa. Uma revisão27
mostrou que, de 249 ensaios controlados e randomizados publicados em 1997,
somente cinco (2%) explicitavam que haviam sido analisados os dados de todos os
participantes randomizados. Cerca de metade dos ensaios (119 de 249) relatava análise
de acordo com a intenção de tratar, mas não fornecia detalhes que apoiassem esse
relato.
Quando os participantes se retiram ou são retirados do ensaio depois da
randomização, parece razoável proceder a duas análises: uma com os dados
efetivamente coletados nos respectivos grupos e outra seguindo o princípio de intenção
de tratar. De acordo com esse princípio, o participante é considerado pertencente ao
grupo para o qual foi designado, mesmo que tenha mudado de grupo.

Ex e m plo 3 - 7
Foi conduzido28 um ensaio randomizado, prospectivo, multicêntrico, com 26.449
pacientes que tinham um histórico de infarto do miocárdio, AVC isquêmico ou
doença arterial periférica. Os pacientes foram designados ao acaso para receber
vorapaxar (2,5 mg/dia) ou um placebo e foram acompanhados por cerca de 30 meses.
O desfecho primário era uma variável resposta composta: morte por causas
cardiovasculares, infarto do miocárdio ou AVC. Depois de 2 anos, a comissão de
monitoramento de dados e segurança (Data and Security Monitoring Board)
recomendou descontinuar o tratamento em pacientes com história de AVC devido
ao risco de hemorragia intracraniana. A inibição do fator ativado por proteinase
(PAR-1) com vorapaxar reduziu o risco de morte por causas cardiovasculares e de
eventos isquêmicos em pacientes com aterosclerose que estavam recebendo,
também, terapia padrão. No entanto, aumentou o risco de sangramento inclusive de
hemorragia intracraniana. Foi então conduzida uma análise de eficácia com base no
princípio de intenção de tratar, isto é, foram analisados os dados de todos os pacientes
randomizados, embora tenha sido descontinuado o tratamento em pacientes com
história de AVC. Depois, realizou-se uma segunda análise usando apenas os dados
de pacientes sem história de AVC, mas que já haviam entrado na primeira análise.

28
Morrow DA. et al. Vorapaxar in the secondary prevention of atherothrombotic events. N. Engl. J. Med. 2012 Abril
12;366(15):1404-13.

Também é comum que seja repetida a última medida obtida no participante que se
retira do estudo (dropout), como se fosse essa a medida feita nas visitas subsequentes,
às quais o participante não compareceu. É a chamada LOCF, sigla da expressão em
inglês de last observation carried forward. A Tabela 3-2 apresenta um exemplo de LOCF:
para cada participante, o valor faltante foi substituído pelo último valor observado da
variável. Cumpre apenas lembrar que uma medida da qualidade do ensaio é o número
de participantes que cumpriram todas as visitas.

Tabela 3-2
Valor faltante foi substituído pelo último valor observado da variável

Visita
Participante
1 2 3 4 5 6

1 2,8 2,1 1,0 ? = 1,0 ? = 1,0 ? = 1,0

2 3,1 2,5 2,8 1,4 1,8 2,0

3 2,7 2,4 2,9 3,5 ? = 3,5 ? = 3,5


3.9 O que é follow-up?
No protocolo de pesquisa deve estar descrito o período de acompanhamento ou período de
seguimento, mais conhecido no Brasil pela expressão em inglês follow-up.

Follow-up29 significa monitorar a saúde da pessoa por certo período ao longo do


tempo, depois do tratamento. Nos ensaios clínicos, significa monitorar a saúde da
pessoa tanto durante o ensaio como depois que este termina.

29
Follow-up Care – NCI Dictionary of Cancer Terms – National. Disponível em: www.cancer.gov/dictionary?
cdrid=44671. Acesso em 6 de junho de 2014.

A ANVISA exige que sejam dadas, nos relatórios, informações sobre o número de
segmentos, que define como o número de subdivisões em que o estudo está dividido.
Além disso, pede que o pesquisador indique o número de períodos e exemplifica: run-
in, washout, tratamento, período de acompanhamento. “Em acompanhamento”,
significa “em follow-up após término do uso do produto investigacional”.30 A Agência
define como perdas de seguimento aos participantes que não foram retirados, mas não
aderiram a todas as etapas do ensaio clínico.

3.10 Resumo
Variável resposta ou desfecho clínico é o evento ou o resultado medido objetivamente no
decorrer de um estudo clínico para determinar se a intervenção em estudo foi
benéfica.
Em estatística, uma variável é substituta se, usando essa variável, qualquer teste da
hipótese de nulidade para os grupos em comparação tenha a mesmo resultado do
mesmo teste, quando aplicado sobre a verdadeira variável.
Cegamento é uma estratégia de delineamento segundo a qual uma ou mais partes
envolvidas no ensaio não sabem quais são as intervenções às quais os participantes
foram designados.
Ensaio cego simples é aquele em que uma das partes envolvidas no ensaio clínico não
sabe para qual intervenção o participante foi designado.
Ensaio duplamente cego ou ensaio duplo-cego é aquele em que uma ou mais partes
envolvidas no ensaio clínico não sabem para qual intervenção o participante foi
designado.
Ensaio aberto é aquele em que todas as pessoas envolvidas no ensaio sabem para
quais intervenções foram designados os participantes.
Sujeito ingênuo em psicologia é o participante que desconhece as hipóteses em teste,
isto é, não sabe o que está sendo observado. Em psicologia social, sujeito ingênuo é a
pessoa deliberadamente enganada sobre o real objetivo do experimento.
Existe confundimento no ensaio quando o efeito da intervenção está confundido com
o efeito de outros fatores, chamados fatores de confundimento ou fatores de confusão.
Período de eliminação ou período de lavagem, mais conhecido pela expressão em inglês
wash-out, é o tempo que decorre entre dois períodos em que se administram
tratamentos diferentes.
Período introdutório é o período que decorre entre o recrutamento do paciente após
triagem e o início do ensaio.
O princípio de intenção de tratar afirma que os dados de todos os participantes
randomizados com pelo menos uma avaliação após tratamento devem ser
considerados na análise primária, considerando-os pertencentes ao grupo para o qual
foram designados.
Follow-up é o período de seguimento e o período de acompanhamento do participante de
pesquisa durante e após o ensaio.

1
A análise estatística para este exemplo deve testar a hipótese de que não existe diferença entre as drogas. Então, droga
é variável independente, mais modernamente chamada de variável explanatória.
2
Ver, por exemplo, Felson DT. et al. The American college of rheumatology preliminary core set of disease activity
measures for rheumatoid arthritis clinical trials. Arthritis and Rheumatism 36 (6): 729-40. 1993, que propõem um
índice para acompanhar a evolução da artrite reumatoide.
7
Karloski TR, Chalmers TC, Frenkel LD. et al. Ascorbic acid for the common cold. A prophylactic and therapeutic
trial. JAMA 1975 Mar. 10;231(10):1038-42.
8
Friedman LM, Furberg CD, DeMets DL. Fundamentals of clinical trials. Nova York: Springer. 4 ed. 2010, p. 103.
11
Relatório do estudo – Notificação – Anvisa. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 24 de maio de 2014.
16
Ver: Obedience to authority: an experimental view. New York, Harper Perennial, 1974.
18
Disponível em: http://www.proz.com/kudoz/English/medical_general/856641-treatment_naive_subjects.html.
Acesso em 28 de janeiro de 2014.
21
Resolução RE n° 1.170 de 19 de abril de 2006.
22
Rothwell PM. External validity of randomised controlled trials: “To whom do the results of this trial apply?”. Lancet
2005 Jan 1-7;365(9453):82-93.
23
Méndez PA, Barr RG, Shea S. Run-in periods in randomized trials: implications for the application of results in
clinical practice. JAMA. 1998 Jan 21;279(3):222-5.
24
Uma boa discussão sobre o assunto pode ser encontrada em Friedman LM, Furberg CD, DeMets DL. Fundamentals
of clinical trials. Nova York, Springer. 4 ed., 2010, p. 346-55.
26
Relatório do estudo – Notificação – ANVISA. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 14 de maio de 2014.
27
Hollis S, Campbell F. What is meant by intention to treat analysis? Survey of published controlled trials. BMJ
(319):670-74. In: Schutz KF, Grimes DA. Sample slippages in randomized trials: exclusion and the lost and wayward.
Lancet 2002 Mar 2;359(9308): 781-5.
30
Relatório do estudo – Notificação – ANVISA. Disponível em
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 7 de maio de 2014.
C AP Í T U L O 4

Delineamento de Ensaios Clínicos


Pertencem à história da Medicina os casos de novas intervenções cuja superioridade
foi detectada sem qualquer ensaio clínico. É sempre citada a penicilina, que foi
introduzida na prática médica sem muita pesquisa. No entanto, histórias de novos
tratamentos com efeitos benéficos tão dramáticos são raras. Por outro lado, sabe-se
que são continuamente propostas novas intervenções que trazem contribuição
moderada, que só pode ser percebida mediante muitos e grandes ensaios clínicos. Por
exemplo, Collins et al. (1996)1 argumentam que reduzir a mortalidade por infarto do
miocárdio de 14,9% para 11,4% representa um volume imenso de mortes evitadas,
dada a elevada incidência do problema. Mais exatamente, são evitadas 35 mortes de
cada 1.000 infartados. Essa redução, mediante terapia anticoagulante na ausência de
aspirina, somente foi percebida por meio de uma meta-análise com 26 artigos que
relatavam ensaios randomizados envolvendo 5.020 pacientes, tendo sido designados
2.484 para a terapia anticoagulante e 2.536 para o grupo-controle.
As consequências de não se conduzir ensaios clínicos adequados no devido tempo
podem ser sérias. Um argumento a favor dos ensaios clínicos é o fato de algumas
intervenções terem sido abandonadas logo depois de serem acolhidas com
entusiasmo, por absoluta falta de evidência de superioridade ou, até mesmo, pelo fato
de terem se mostrado prejudiciais. Exemplos clássicos de intervenções introduzidas na
prática médica sem experimentação e que posteriormente se revelaram prejudiciais
são a técnica de resfriamento no caso de úlcera gástrica e o uso de talidomida como
antiemético para gestantes. Os ensaios clínicos são, portanto, essenciais.

4.1 O que é delineamento do ensaio?


Delineamento do ensaio (trial design) ou modelo de intervenção (intervention model) é a
descrição do procedimento adotado para designar as intervenções em estudo aos
diversos participantes de um mesmo ensaio clínico.

Estes são alguns modelos de intervenção: ensaio clínico randomizado, randomização


blocada, randomização estratificada, delineamento cruzado, ensaios clínicos “antes e
depois” e delineamentos fatoriais. Esta seleção de modelos não está completa – há
vários outros modelos – mas inclui os delineamentos mais utilizados.

4.1.1 O que é ensaio clínico randomizado?


Ensaio clínico randomizado (randomized clinical trial) é o modelo de intervenção em
que os participantes da pesquisa são designados aos diferentes braços do ensaio por
processo totalmente aleatório.

A grande vantagem dos ensaios clínicos randomizados é a de permitir ao


pesquisador comparar quantas intervenções quiser, com número diferente de
participantes em cada braço, sem que isso introduza maiores dificuldades na análise
estatística. A grande desvantagem dos ensaios clínicos randomizados é considerar que
os braços formados aleatoriamente são constituídos de participantes similares em
relação a todos os aspectos relevantes para o estudo. Isso, no entanto, somente é
provável para ensaios feitos com grandes amostras.
Um ensaio clínico randomizado pode comparar dois braços, como mostra o
diagrama da Figura 4-1. É bastante comum, embora não seja necessário, que nesse
caso os dois braços tenham o mesmo número de participantes. Diz-se, então, que a
razão de randomização é de 1:1 (lê-se um para um).

FIGURA 4-1 Ensaio clínico randomizado

Ex e m plo 4 - 1
Cento e cinquenta e um pacientes2 com diagnóstico recente de metástase de
câncer de pulmão de células não pequenas foram distribuídos em um ensaio clínico,
em dois grupos: o grupo experimental recebeu cuidado paliativo precoce integrado
ao tratamento oncológico padrão e o grupo-controle recebeu apenas o tratamento
oncológico padrão. Foram avaliados, por meio de escalas conhecidas, o humor e a
qualidade de vida nos dois grupos, tanto na linha de base como 12 semanas depois.
Completaram o ensaio 86% dos pacientes registrados. A conclusão foi a de que
cuidado paliativo precoce melhora significantemente o humor e a qualidade de vida
de pacientes com metástase de câncer de pulmão de células não pequenas.
2
Temel JS. et al. Early palliative care for patients with metastatic non-small cell lung cancer. N. Engl. J. Med. 2010
Ago. 363:733-42.

Também são conduzidos ensaios clínicos randomizados para comparar três braços:
o braço experimental, o braço comparador ativo e um braço comparador placebo. Este
tipo de ensaio é particularmente útil para determinar se a droga experimental tem
resultado mais próximo do placebo ou da droga ativa conhecida. Por questões éticas,
neste tipo de delineamento – que compara três braços sendo um deles placebo – aloca-
se número menor de pacientes no braço comparador placebo. A razão de
randomização pode ser, por exemplo, 3: 3: 1.

4.1.2 O que é randomização blocada?


Nos ensaios clínicos randomizados, os participantes são designados aos diferentes
braços por processo totalmente aleatório. Esse procedimento sempre pode resultar em
ensaios desbalanceados. Por exemplo, se duas intervenções, A e B, são designadas
totalmente ao acaso para 100 participantes, pode acontecer de a intervenção A ser
sorteada para, por exemplo, 68 participantes e a intervenção B, para 32. O ensaio ficaria
desbalanceado porque a intervenção A teria mais que o dobro de participantes. Para
garantir que o número de participantes designados para cada intervenção fique
próximo, usa-se randomização blocada.

Randomização blocada (blocked randomization) é o modelo de intervenção em que os


participantes da pesquisa são organizados em blocos na ordem em que se
apresentam. O número de participantes por bloco é, na maioria das vezes, igual ou
múltiplo do número de braços do ensaio. Nos blocos, os participantes são
designados ao acaso aos diferentes braços do ensaio, mas o número de participantes
em cada braço é o mesmo em todos os blocos.

Por exemplo, para comparar duas intervenções, A e B, os blocos podem ser formados
por 2 ou 4 ou 6 ou 8 etc. participantes. Se forem organizados blocos de quatro
participantes, cada bloco terá dois participantes submetidos à intervenção A e dois
submetidos à intervenção B. Essas intervenções são designadas aos participantes de
um mesmo bloco ao acaso. Então, caso sejam 100 os participantes, o ensaio terá 25
blocos de quatro participantes. Podem ser constituídos blocos com quaisquer das
sequências: AABB; ABAB, BAAB, BABA, BBAA, ABBA. A Figura 4-2 mostra um bloco
de quatro participantes que foram admitidos no ensaio, um em seguida do outro. Para
eles, o resultado da randomização foi ABBA.
FIGURA 4-2 Bloco com quatro participantes de ensaio clínico com dois braços

Para todos os 25 blocos, o resultado da randomização poderia ser, por exemplo, a


que consta na Tabela 4-1. Cabe considerar que a organização dos blocos é agilizada se,
calculado o tamanho da amostra por critério estatístico (no exemplo, n = 100
participantes), os pesquisadores procederem ao sorteio mesmo antes de começar o
ensaio – e ter isso no computador. No exemplo, para cada quatro participantes
matriculados, as intervenções seriam feitas obedecendo à sequência de matrícula e
seguindo a ordem estabelecida para o bloco em que os participantes foram alocados.

Tabela 4-1
Resultado da distribuição aleatória de duas intervenções em 25 blocos de quatro
participantes

Bloco Sorteio Bloco Sorteio Bloco Sorteio

1 ABAB 11 BABA 21 ABBA

2 BBAA 12 AABB 22 ABAB

3 BAAB 13 BABA 23 BBAA

4 ABAB 14 ABAB 24 AABB

5 ABAB 15 BAAB 25 ABBA

6 BAAB 16 ABAB

7 ABAB 17 ABAB

8 AABB 18 AABB

9 ABAB 19 ABAB

10 BABA 20 ABBA

A randomização blocada tem vantagens. Se o período de entrada no ensaio for


relativamente longo ou se os participantes de uma pesquisa vierem de fontes
diferentes, o tipo de participante recrutado pode mudar. Nesses casos, a randomização
blocada produz braços mais comparáveis. Isso também acontece quando os pacientes
mais doentes são atendidos primeiramente. Caso a randomização não seja blocada, é
possível designar mais pacientes muito doentes para um dos braços do ensaio. Ainda,
se o ensaio for suspenso, a randomização blocada garante número equilibrado de
participantes por intervenção. É recomendável que todos os blocos tenham o mesmo
número de braços, mas o número de participantes em cada braço é decidido no
delineamento do ensaio. Por exemplo, para comparar duas intervenções A e B com um
placebo, pode ser feito um ensaio com razão de randomização 2: 2: 1. Se o tamanho da
amostra, calculado por estatística, for de 60 participantes, podem ser organizados 12
blocos com cinco participantes em cada um, ou seis blocos com 10 participantes em
cada um, como mostra a Tabela 4-2. Nem sempre, porém, se procede deste modo. Veja
o Exemplo 4-2.

Tabela 4-2
Resultado da distribuição aleatória de duas intervenções, A e B, e um placebo, P,
em seis blocos de 10 participantes cada um

Bloco Ordem

1 AABPBBAPAB

2 BPAAPBAABB

3 BBPAPABABA

4 ABABPAPABB

5 BPABPABABA

6 AAABPPBABB

Ex e m plo 4 - 2
Para comparar a velocidade de ação de duas drogas (ticagrelor e clopidogrel)
indicadas para prevenir a formação de coágulos de sangue que possam causar
infarto agudo do miocárdio ou acidente vascular cerebral (AVC), foi conduzido um
ensaio clínico.3 Após triagem, foram recrutados 154 pacientes; todos eles fizeram
washout, mas 31 foram dispensados logo em seguida, devido a falhas de avaliação na
triagem. Os 123 pacientes restantes entraram no ensaio sequencialmente. A
proposta era ter 12 pacientes submetidos a placebo. Organizou-se, então, uma
randomização blocada até se conseguir 12 participantes no braço placebo. Como
havia duas drogas em comparação, ticagrelor e clopidogrel, mais o braço placebo,
foram organizados seis blocos de seis pacientes. Quando se constituiu o primeiro
bloco com seis pacientes, foi sorteado ticagrelor para dois, clopidogrel para outros
dois e os dois pacientes restantes receberam placebo. O mesmo procedimento foi
adotado para outros cinco blocos. Conseguidos os 12 pacientes submetidos ao
placebo, passou-se a designar apenas as duas drogas, aleatoriamente, aos demais
participantes do ensaio.
3
Gurbel P. et al. The ONSET/OFFSET Study: Effects of Ticagrelor Versus Clopidogrel in Patients With Stable
Coronary Artery Disease Assessment of the ONSET and OFFSET of the Antiplatelet. Circulation.
2009;120:2577-2585.

A desvantagem do uso de randomização blocada é o fato de a análise estatística ser


bem mais difícil. Alguns pesquisadores fazem randomização blocada e depois a
ignoram na análise, o que está errado. É preciso que a análise estatística seja coerente
com o delineamento. Outra desvantagem é a randomização, de procedimento mais
complicado. Nos ensaios clínicos randomizados, se o paciente for elegível e assinar o
TCLE, é designado para um braço do ensaio por processo totalmente aleatório. A
randomização é feita, portanto, sem qualquer restrição. Nos ensaios com randomização
blocada, se o paciente for elegível e assinar o TCLE, é designado para o bloco que está
sendo organizado. O paciente é designado para um dos braços do ensaio por processo
aleatório. Então, há uma restrição para a randomização: é feita dentro de cada bloco.

4.1.3 O que é randomização estratificada?


O objetivo de alocar participantes aos braços do ensaio por processo aleatório é
conseguir boa distribuição dos fatores de risco e de prognóstico. Se o pesquisador
trabalha com grandes amostras, é bastante provável que essa boa distribuição
aconteça. No entanto, se a amostra for pequena, os pesquisadores precisam se
preocupar em estudar a maneira de bem distribuir fatores de risco ou de prognóstico
nos diversos braços do ensaio – o procedimento aleatório não basta.
Por exemplo, se for razoável pressupor que o estágio da doença tem efeito sobre a
resposta dos pacientes às drogas que vão ser comparadas, o pesquisador deve agrupar
os pacientes que estão no mesmo estágio da doença em estratos. Se os pacientes
recrutados podem ser divididos em apenas dois estágios, o pesquisador deve designar,
por processo aleatório, uma das drogas (p. ex., a droga experimental) para metade dos
pacientes de cada estrato e administrar a outra droga (o controle positivo) à outra
metade dos pacientes, como mostra a Figura 4-3. Em cada estrato os participantes
devem ser similares – no caso do exemplo, mesmo estágio da doença. A randomização
é feita dentro do estrato.

FIGURA 4-3 Dois estratos de um ensaio clínico com dois braços


Randomização estratificada (stratified randomization) é o modelo de intervenção em
que os participantes da pesquisa são organizados em estratos de acordo com os
fatores de prognóstico (idade, sexo, nível socioeconômico, estágio da doença) e
depois, dentro de cada estrato, são designados aos diferentes braços do ensaio por
processo aleatório.

A estratificação pode ser feita, portanto, por mais de um fator. Por exemplo,4 se o
pesquisador quer estratificar por faixa de idade, sexo e hábito de fumar, uma
classificação possível seria:
a) Para idade, faixas de 10 em 10 anos: de 40 a 49, de 50 a 59, de 60 a 69.
b) Para sexo: masculino, feminino.
c) Para hábito de fumar: fumante, ex-fumante, não fumante.
São três faixas de idade, dois sexos e três condições para hábito de fumar. Logo, são
3 × 2 × 3 = 18 estratos, apresentados na Tabela 4-3. Para comparar duas intervenções, A
e B, com quatro participantes por bloco, são necessários 18 × 4 = 72 participantes.

Tabela 4-3
Ensaio com randomização estratificada com quatro participantes por estrato

N° do estrato Faixa de idade Sexo Hábito de fumar Sorteio (Exemplo)

1 De 40 a 49 anos M Fumante ABBA

2 De 40 a 49 anos M Ex-fumante BBAA

3 De 40 a 49 anos M Nunca fumou BABA

4 De 40 a 49 anos F Fumante BAAB

5 De 40 a 49 anos F Ex-fumante AABB

6 De 40 a 49 anos F Nunca fumou BBAA

7 De 50 a 59 anos M Fumante ABBA

8 De 50 a 59 anos M Ex-fumante ABAB

9 De 50 a 59 anos M Nunca fumou BABA

10 De 50 a 59 anos F Fumante BAAB

11 De 50 a 59 anos F Ex-fumante AABB

12 De 50 a 59 anos F Nunca fumou BBAA

13 De 60 a 69 anos M Fumante BABA

14 De 60 a 69 anos M Ex-fumante ABAB

15 De 60 a 69 anos M Nunca fumou BABA

16 De 60 a 69 anos F Fumante BAAB

17 De 60 a 69 anos F Ex-fumante ABBA

18 De 60 a 69 anos F Nunca fumou ABBA

A ideia não é tão complicada como pode parecer à primeira vista, mas pode gerar
dificuldades: os participantes são recrutados na triagem e, evidentemente, não estão
organizados em estratos. Por exemplo, em um mesmo dia podem ser recrutados na
triagem oito homens fumantes na faixa de idade de 40 a 49 anos, todos elegíveis, mas
durante toda a semana não se apresentar para o ensaio nenhuma mulher fumante na
faixa de idade de 60 a 69 anos. Esse ponto precisa ser considerado.
Na randomização estratificada, um número específico de pessoas deve ser recrutado
para cada estrato. O recrutamento de pessoas elegíveis não ocorre na mesma
velocidade. Logo, alguns estratos ficam completos antes de outros. Quando um estrato
estiver completo, é preciso parar o recrutamento de pessoas desse estrato, mas
continuar recrutando pessoas para os estratos que ainda estão incompletos. A Figura
4-4 mostra um grupo de pessoas que poderiam ser recrutadas em determinado dia. Se
o pesquisador pretende organizar estratos com cinco pessoas de mesma cor e mesmo
sexo, deve dispensar um homem cinza, três homens negros, não recrutar mais
mulheres cinza e recrutar mais uma mulher negra.

FIGURA 4-4 Pessoas elegíveis para o ensaio que terá randomização estratificada

Os estratos devem ser diferentes entre si, considerando a variável resposta. Não tem
sentido organizar estratos de pacientes se não houver variabilidade entre estratos. No
entanto, o delineamento será mais eficiente e a análise estatística ficará mais fácil se
todos os estratos forem formados pelo mesmo número de participantes e esse número
for igual ou múltiplo do número de intervenções em comparação.
A grande vantagem dos ensaios clínicos com randomização estratificada é garantir
maior similaridade dos braços em comparação. Por exemplo, em um teste de drogas
terapêuticas para tratar a depressão, os pacientes devem ser estratificados pela
gravidade da doença. Nos testes de drogas para doenças autoimunes como lúpus e
esclerose múltipla, os pacientes devem ser estratificados pelo tempo de diagnóstico,
uma vez que é razoável pressupor que a resposta ao tratamento depende, em parte, de
quanto tempo a pessoa tem a doença. No caso de doenças progressivas como o câncer,
os estratos podem ser organizados por faixas de idade, estágios da doença e
prognósticos.
A randomização estratificada evita o desequilíbrio entre os braços do ensaio, porque
distribui a amostra em estratos, levando em conta fatores conhecidos que influenciam
o prognóstico ou a resposta dos participantes. O número de participantes pode, então,
ser menor. Se os pesquisadores falham na organização dos estratos, a variabilidade das
unidades pode mascarar a diferença entre os tratamentos. Mas uma vez decidido
estratificar, o pesquisador precisa organizar estratos cuidadosamente e lembrar que
eles devem ser levados em consideração na análise estatística.
Finalmente, é fácil confundir randomização blocada e randomização estratificada, ainda
mais pelo fato de que as definições mudam na literatura, de autor para autor. Também
se encontra, na literatura, a expressão randomização simples. Neste livro, as definições
dadas são as apresentadas por Friedman, Furberg e DeMets,5 como segue:

Randomização simples: os participantes da pesquisa são designados aos diferentes braços


do ensaio por processo totalmente aleatório. Este é, essencialmente, o ensaio clínico
randomizado.

Randomização blocada: os conjuntos de participantes que constituem um bloco são


formados na ordem em que esses participantes se apresentam.

Randomização estratificada: os conjuntos de participantes que constituem um estrato são


formados de acordo com os fatores de variação (demográficos, de risco, de prognóstico)
identificados pelo pesquisador na amostra.

A ANVISA6 pede informações sobre o procedimento empregado para a alocação dos


tratamentos. Explica que, na randomização simples, a cada participante que entra no
ensaio atribui-se “tratamento de maneira serial”. Considera que randomização por blocos
é aquela em que “somente a cada X número de sujeitos que entrarem na pesquisa, e
sendo X uma constante ao longo do estudo, o braço de randomização será alterado” e
randomização estratificada é aquela em que “somente a cada X número de sujeitos que
entrarem na pesquisa, e não sendo X uma constante ao longo do estudo, o braço de
randomização será alterado”. Falta clareza às definições.

4.1.4 O que é delineamento cruzado?


Delineamento cruzado (crossover clinical designs) é o modelo de intervenção em que
cada um dos vários participantes recebe dois ou mais tratamentos em períodos
diferentes.

Para avaliar o efeito de uma droga na indução do sono, pode ser feito um ensaio em
que cada voluntário recebe tanto a droga T em teste como a droga R de referência, em
ocasiões diferentes. A condição dos voluntários deve ser estável, isto é, não pode variar
entre os períodos. A grande vantagem dos delineamentos cruzados é o tamanho da
amostra, que pode ser menor, uma vez que cada indivíduo serve de controle para si
mesmo (o mesmo participante testa duas ou mais intervenções em períodos distintos).
A comparação é feita “dentro de indivíduos” (within subjects) em vez de “entre
indivíduos” (between-subjects).
No entanto, esse tipo de ensaio somente pode ser conduzido para estudar o efeito
de intervenções de ação temporária ou de intervenções de ação paliativa para
problemas crônicos. Na comparação de duas drogas, pode haver efeito residual (carry
over effect), isto é, o efeito que persiste terminado o período da dosagem. É necessário
um período de eliminação (washout) entre os dois períodos, o que torna o ensaio mais
longo. Além disso, é preciso considerar a questão de ética: dependendo da condição do
participante e da necessidade que ele tem de ser medicado, um período de washout
muito longo pode não ser ético.
Em psicologia também são feitos ensaios em que cada participante é designado
tanto para a intervenção experimental como para um controle, em períodos diferentes.
Isso pode ser feito, por exemplo, para comparar um novo teste de inteligência com um
“padrão-ouro” – cada voluntário se submete aos dois testes, em ocasiões distintas. Em
odontologia, são usuais ensaios em que cada participante é designado tanto para uma
droga experimental como para uma droga de referência, ou mesmo para comparar
duas drogas, em períodos diferentes e em lados (direito e esquerdo) diferentes. São
testados assim analgésicos e anti-inflamatórios, no caso de microcirurgias, tais como
extração de terceiros molares inclusos ou implantes dentários.
Os exemplos dados são de delineamento cruzado de dois períodos ou crossover 2 × 2 (lê-se
crossover dois por dois), mas existem vários outros tipos de crossover, que podem ser
buscados nos manuais da ANVISA.7 No entanto, como mostra a Figura 4-5 em um
crossover 2 × 2 há dois grupos de participantes: um recebe o medicamento em teste (T)
no primeiro período, seguido do medicamento de referência (R) no segundo período; o
outro grupo recebe o medicamento de referência (R) no primeiro período, seguido do
medicamento em teste (T) no segundo período. A ordem em que cada participante
recebe as intervenções é randomizada, mas aproximadamente metade dos
participantes recebe as intervenções na sequência TR e a outra metade na sequência
RT. Os períodos de dosagem são separados por um tempo suficiente para que a droga
recebida no primeiro período seja completamente metabolizada e/ou eliminada do
corpo quando inicializar o segundo período de dosagem.
FIGURA 4-5 Crossover 2 × 2

4.1.5 O que é ensaio clínico “antes e depois”?


Ensaios clínicos “antes e depois” (before and after) são aqueles em que a medida feita
antes da intervenção atua como um controle para a medida feita depois da
intervenção. Esses ensaios são, portanto, não randômicos (non-randomized clinical
trials).

É preciso ter muita atenção para tirar conclusões desse tipo de ensaio. Outros
fatores, além da intervenção, podem atuar sobre os participantes no período que
decorre entre as duas tomadas de medida. Por exemplo, o participante do ensaio
adquire experiência ou se cansa – se criança, cresce; se adulto, envelhece. Podem
ocorrer alterações no método de medição por mudança de aparelho ou de operador. O
simples fato de se sentir avaliado pode ter efeito na ansiedade ou no medo do
participante, diferente nas diversas ocasiões de tomada de dados.
Para que o ensaio tenha validade, é preciso garantir que nenhum outro fator além da
intervenção tenha agido sobre o pesquisado. Para isso, seria necessário que o
pesquisador obtivesse medidas antes e depois da intervenção no braço experimental, e
antes e depois de uma simulação de intervenção no braço comparador simulado, com
o mesmo intervalo de tempo entre as duas medições, nos dois braços, como mostra a
Figura 4-6.
FIGURA 4-6 Ensaio antes e depois, com dois grupos

4.1.6 O que é delineamento fatorial?


Delineamento fatorial (factorial designs) é um estudo de intervenção em que grupos
de participantes recebem uma combinação de intervenções, em dois ou mais níveis.

No fatorial mais simples, que é o 2 × 2, há duas intervenções (droga A e droga B) em


dois níveis (0 e 1). São, portanto, quatro grupos de participantes. Cada grupo recebe
um dos seguintes pares de intervenções: 1) droga A e droga B; 2) droga A e placebo
para a droga B; 3) droga B e placebo para a droga A; 4) placebo para a droga A e
placebo para a droga B, como foi mostrado na Figura 3-2 do Capítulo 3. O
delineamento, com 60 participantes, poderia ser como mostra a Tabela 4-4. O
pesquisador avalia intervenções e combinações de intervenções contra o controle; este
é o fatorial mais simples, muito usado na área de farmacologia.

Tabela 4-4
Resultado da distribuição aleatória de duas intervenções com placebos duplos
para 60 participantes

Participante Braço Participante Braço


1 A+ B 31 A+ B

2 A + placebo (B) 32 B + placebo (A)

3 B + placebo (A) 33 A+ B

4 A + placebo (B) 34 A + placebo (B)

5 Placebo (A) + placebo (B) 35 Placebo (A) + placebo (B)

6 Placebo (A) + placebo (B) 36 Placebo (A) + placebo (B)

7 A+ B 37 A + placebo (B)

8 A + placebo (B) 38 A+ B

9 Placebo (A) + placebo (B) 39 A+ B

10 A+ B 40 B + placebo (A)

11 A+ B 41 A + placebo (B)

12 B + placebo (A) 42 Placebo (A) + placebo (B)

13 A + placebo (B) 43 A + placebo (B)

14 A+ B 44 A+ B

15 B + placebo (A) 45 B + placebo (A)

16 Placebo (A) + placebo (B) 46 A+ B

17 Placebo (A) + placebo (B) 47 Placebo (A) + placebo (B)

18 B + placebo (A) 48 A+ B

19 B + placebo (A) 49 B + placebo (A)

20 A + placebo (B) 50 A + placebo (B)

21 A + placebo (B) 51 B + placebo (A)

22 Placebo (A) + placebo (B) 52 A + placebo (B)

23 Placebo (A) + placebo (B) 53 Placebo (A) + placebo (B)

24 B + placebo (A) 54 B + placebo (A)

25 A + placebo (B) 55 A+ B

26 A+ B 56 B + placebo (A)

27 A + placebo (B) 57 A + placebo (B)

28 Placebo (A) + placebo (B) 58 B + placebo (A)

29 Placebo (A) + placebo (B) 59 A+ B

30 A + placebo (B) 60 Placebo (A) + placebo (B)

Um ensaio fatorial tem vantagens e desvantagens. A grande preocupação é a


possibilidade de interação das drogas. Interação significa que o efeito de uma das
drogas, a droga A, por exemplo, depende da presença ou ausência da droga B, e vice-
versa (antagonismo ou sinergismo). Se for possível assumir com segurança que não há
interação, um ensaio fatorial 2 × 2 é vantajoso porque vale por praticamente dois
ensaios, mas com número menor de participantes. Por que vale por dois? Porque são
obtidos, em um só ensaio, tanto o efeito de A como o efeito de B:
Se houver grande interação (sinergismo ou antagonismo) entre as drogas, o ensaio
fatorial é vantajoso, porque mostra isso eficientemente, com pequeno aumento da
amostra. Dado o alto custo em dinheiro e em esforço para recrutar participantes e
conduzir um ensaio clínico, a ideia de um fatorial parece bem interessante. No
entanto, se a interação for pequena, o tamanho da amostra deve aumentar e muito.
Esta é uma desvantagem e aparece, também, a questão de ética: até que ponto é justo
submeter pessoas à polifarmácia?

Ex e m plo 4 - 3
Como são incertos os efeitos do controle intensivo da glicose sobre eventos
vasculares nos pacientes com diabetes tipo 2, foi conduzido8 um ensaio
multicêntrico em 20 países da Ásia, Austrália, Europa e América do Norte,
envolvendo 11.140 pacientes com mais de 55 anos de idade nessa condição. O
controle intensivo da glicose significou uso de glicazida e outras drogas necessárias
para reduzir a glicose glicada a 6,5% ou menos. No período de 6 semanas de run-in,
participantes potencialmente elegíveis continuaram com seus cuidados usuais (o
tratamento padrão, que chamaremos standard) para o controle da glicose e
receberam uma combinação de perindopril e indapamida. Aqueles que toleraram
bem as duas drogas e se revelaram cumpridores do tratamento foram divididos ao
acaso em quatro grupos de acordo com um esquema fatorial: 1) controle standard da
glicose + uma combinação de perindopril e indapamida; 2) controle standard da
glicose + uma combinação de indapamida e placebo para perindopril; 3) controle
intensivo da glicose + uma combinação de perindopril e placebo para indapamida;
4) controle intensivo da glicose + uma combinação de placebo para indapamida e
placebo para perindopril. Os desfechos primários eram resultados combinados de
eventos macrovasculares major (morte por causas cardiovasculares, infarto não fatal
do miocárdio ou derrame não fatal) e eventos microvasculares minor (nefropatia ou
retinopatia novas), ocorrendo junto ou separadamente. Não se constatou efeito
significante do tipo de controle (standard ou intensivo) da glicose com eventos
macrovasculares.

8
The ADVANCE Collaborative Group. Intensive Blood Glucose Control and Vascular Outcomes in Patients with
Type 2 Diabetes. N Engl J Med 2008; 358:2560-72.

A ANVISA9 pede informações sobre o procedimento para a comparação dos


tratamentos e considera duas opções: “normal” e fatorial. No ensaio fatorial, os
“desfechos serão avaliados individualmente e depois de maneira combinada,
procurando variáveis que apresentem correlação”. No ensaio “normal”, os desfechos
são, portanto, “avaliados sem combinação de fatores”.
4.2 O que são ensaios multicêntricos?
Projetos multicêntricos – projeto de pesquisa a ser conduzida de acordo com
protocolo único em vários centros de pesquisa e, portanto, a ser realizada por
pesquisador responsável em cada centro, que seguirá os mesmos procedimentos.
Resolução CNS n° 346, item I

Ensaios multicêntricos10 são, portanto, grupos de ensaios conduzidos


concomitantemente em vários centros independentes de pesquisa, em um esforço de
colaboração. Todos os ensaios seguem o mesmo protocolo, isto é, adotam os mesmos
procedimentos para registro, tratamento, monitoramento dos participantes e controle
de qualidade dos dados. Um centro é responsável pela coordenação e administração
dos ensaios.
O centro coordenador ou coordenadoria central precisa ter bom orçamento e precisa
recrutar copesquisadores capazes e colaborativos de centros regionais, que concordem
em seguir um mesmo protocolo clínico e um mesmo programa de trabalho (Figura 4-
7).

FIGURA 4-7 Ensaio multicêntrico

O problema – para os organizadores de ensaios multicêntricos – é o controle da


qualidade dos dados obtidos nos centros regionais. Muitas vezes, é preciso dar
treinamento aos pesquisadores de alguns, ou de vários centros colaboradores. Mas os
maiores problemas que se originam na condução dos ensaios multicêntricos são
explicados pela má comunicação entre os pesquisadores dos diferentes centros de
pesquisa.
A tarefa é extremamente complexa, principalmente no caso de ensaios
multinacionais.11 Nem todos os países exigem a tradução dos documentos usados nos
ensaios, isto é, alguns usam os documentos dos ensaios em inglês – mesmo que
muitos participantes da pesquisa não dominem esse idioma. Quando o país exige
tradução, como é o caso do Brasil, a tarefa é árdua, porque protocolos são documentos
formais, de natureza especializada, que exigem tradutores qualificados, que conheçam
as palavras usadas em farmacologia e na terapêutica, e escrevam na norma culta, mas
que usem também as variações linguísticas para facilitar a comunicação. Sempre cabe
lembrar que o termo de consentimento livre e esclarecido (TCLE) deve ser
esclarecedor, porque, antes de assiná-lo, o participante de pesquisa precisa ter
entendido toda a questão envolvida no ensaio.

4.3 Por que são necessários delineamentos complexos?


A randomização é uma das maiores contribuições dos estatísticos à ciência
experimental. Mas a randomização exige do pesquisador conhecimento de
metodologia para programar como números aleatórios serão designados a cada
participante da pesquisa ou a cada braço do ensaio. Os números aleatórios são obtidos
em computador ou por meio das tabelas de números aleatórios encontradas em livros
de estatística.
As vantagens dos ensaios clínicos randomizados são bem conhecidas. Eles garantem
a cada participante da pesquisa a mesma chance de receber qualquer um dos
tratamentos em teste, pois eliminam o viés de seleção que ocorre quando o
pesquisador escolhe participantes para designar aos diferentes braços do ensaio. Além
disso, grandes grupos formados por processo aleatório têm grande probabilidade de
ficarem “balanceados”, isto é, muito provavelmente os participantes com
características diferentes ficam igualmente distribuídos pelos diversos braços do
ensaio. Em outras palavras, é bastante provável que grandes grupos formados por
processo aleatório sejam similares em relação aos muitos fatores de confundimento
que afetam a variável resposta. Finalmente, a randomização é pressuposição básica
para a aplicação de testes estatísticos.
Proceder à randomização blocada ou à randomização estratificada deve ajudar a
garantir a distribuição similar dos participantes com características diferentes –
quando são conhecidas – pelos diversos braços do ensaio. É importante insistir nesse
ponto, porque as doenças, assim como todos os processos humanos, são variadas e
complexas; entendê-las é altamente complicado. Fatores como idade, nível
socioeconômico e sexo afetam as doenças, mas existem outros fatores (p. ex., estágio
da doença, tratamentos anteriores, doenças concomitantes, estado geral do doente e
comorbidades) que afetam a variável resposta. Assim, a randomização blocada ou
estratificada ajuda a controlar fatores de confundimento.
Ensaios multicêntricos são mais caros e mais difíceis de planejar que ensaios em um
só centro e conferem menos prestígio aos pesquisadores, que precisam compartilhar
as láureas do trabalho com muitos outros. No entanto, eles continuam sendo feitos.
Muitas vezes, um só centro não pode recrutar o número adequado de participantes em
um período de tempo razoável. Então, os ensaios multicêntricos diminuem o tempo de
recrutamento de pacientes e têm, ainda, a vantagem de lidar com uma amostra muito
mais variada e, portanto, mais representativa da população. Também promovem um
ambiente de maior colaboração entre pesquisadores de diferentes partes do mundo
em torno de um problema comum. Além disso, muitos ensaios são feitos em países
que têm custo reduzido e podem recrutar participantes virgens de tratamento nas
mais diversas doenças. E, finalmente, as empresas farmacêuticas têm o interesse de
incentivar novos pesquisadores e assim conquistar novos mercados.

4.4 Resumo
Delineamento do ensaio ou modelo de intervenção é a descrição do procedimento
adotado para designar as intervenções em estudo aos diversos participantes de um
mesmo ensaio clínico.
Ensaio clínico randomizado é o modelo de intervenção em que os participantes da
pesquisa são designados aos diferentes braços do ensaio por processo totalmente
aleatório.
Randomização blocada é o modelo de intervenção em que os participantes da
pesquisa são organizados em blocos na ordem em que se apresentam e, depois, dentro
de cada bloco, são designados aos diferentes braços do ensaio por processo aleatório.
Randomização estratificada é o modelo de intervenção em que os participantes da
pesquisa são organizados em estratos de acordo com os fatores de prognóstico (idade,
sexo, nível socioeconômico, estágio da doença) e depois, dentro de cada estrato, são
designados aos diferentes braços do ensaio por processo aleatório.
Delineamento cruzado é o modelo de intervenção em que cada um dos vários
participantes recebe dois ou mais tratamentos, em períodos diferentes.
Ensaios clínicos “antes e depois” são aqueles em que a medida feita antes da
intervenção atua como um controle para a medida feita depois da intervenção. Esses
ensaios são, portanto, não randômicos.
Delineamentos fatoriais são estudos de intervenção em que grupos de participantes
recebem uma única intervenção ou uma combinação de intervenções, em dois ou mais
níveis.
Ensaios multicêntricos são grupos de ensaios conduzidos concomitantemente em
vários centros independentes de pesquisa, em um esforço de colaboração. Todos os
ensaios seguem o mesmo protocolo, isto é, adotam os mesmos procedimentos para
registro, tratamento, monitoramento dos participantes e controle de qualidade dos
dados. Um centro é responsável pela coordenação e administração dos ensaios.

1
Collins R. et al. Clinical effects of anticoagulant therapy in suspected acute myocardial infarction: systematic
overview of randomised trials. BMJ 1996 Set. 14;313:652.
4
Friedman LM, Furberg CD, DeMets DL. Fundamentals of clinical trials. Nova York: Springer. 4 ed., 2010. p. 103.
5
Friedman, Furberg e DeMets. Op.cit.
6
Anvisa – Medicamentos – Pesquisa clínica. Disponível em:
http://www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 2 de agosto de 2014.
7
Manual de boas práticas em biodisponibilidade: bioequivalência. Volume I / Módulo 3 – Etapa Estatística Gerência-
Geral de Inspeção e Controle de Medicamentos e Produtos. Brasília, ANVISA, 2002.
9
Anvisa – Medicamentos – Pesquisa Clínica. Disponível em:
htpp//www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 13 de agosto de 2014.
10
Ver a Resolução CNS n° 346 de 13 de janeiro de 2005.
11
Sobre pesquisas coordenadas do exterior com participação estrangeira, ver a Resolução CNS n° 292 de 8 de julho de
1999.
C AP Í T U L O 5

Ensaios Clínicos em Farmacologia e


Cirurgia
Os ensaios clínicos são conduzidos para comparar o efeito e o valor de intervenções
na saúde das pessoas. Para isso, devem contrapor os resultados obtidos no braço
experimental com os resultados obtidos em outro tipo de braço: comparador ativo,
comparador de placebo, comparador simulado, comparador de nenhuma intervenção
ou controle histórico. No início dos ensaios, isto é, na linha de base, os participantes
da pesquisa devem ser similares ou estar organizados em blocos ou em estratos.
Sempre que possível, os ensaios clínicos devem ser randomizados e duplo-cegos.
Ainda, é preciso bom monitoramento e análise estatística adequada.
Este capítulo trata, com mais cuidado, de ensaios clínicos na área de farmacologia e
na área de cirurgia. De qualquer modo, independentemente do tipo de ensaio clínico,
as pessoas devem ser alertadas para tomar a decisão de participar de um ensaio
somente depois de compreender todo o processo e todos os riscos que possam estar
envolvidos. Embora em todo ensaio clínico sejam feitos esforços para controlar riscos
devido à incerteza inerente à pesquisa envolvendo novos produtos biológicos na área
da saúde, alguns danos sempre podem ocorrer.

5.1 Ensaios clínicos em farmacologia


No Brasil, os ensaios clínicos em farmacologia estão regulamentados pela Resolução
CNS n° 251/97 e pela ANVISA. Tais regulamentações acompanham a legislação do
FDA1 e do EMEA.2
A ANVISA3 fornece um Guia para Elaboração de Relatórios de Estudos Clínicos
para fins de Registro e/ou Alterações Pós-Registro de Produtos Biológicos,4 em que se
lê:

Na Introdução, p. 5
Para comprovação de eficácia e segurança de um produto biológico, é necessária a
apresentação de estudos clínicos conduzidos com o produto, de acordo com os
requisitos da Resolução da Diretoria Colegiada, RDC N° 55/2010 e suas atualizações,
sendo recomendado que o relatório clínico contenha o conteúdo mínimo e o formato
conforme especificado neste Guia.
Na Descrição Geral do Desenho do Estudo, p. 6
As informações fornecidas devem incluir os tratamentos estudados; a população
de sujeitos de pesquisa estudados e o número de sujeitos de pesquisa a serem
incluídos se o estudo não estiver finalizado; o nível e o método de mascaramento;
o(s) tipo(s) de controle(s) utilizado(s), tais como controles ativos, placebos ou
históricos; o método de alocação para cada braço de tratamento do estudo, tais como
randomização, estratificação; a sequência e a duração de todos os períodos do
estudo, incluindo pré-randomização e períodos pós-tratamento, os períodos de
abstinência e a terapia simples e os períodos de tratamento duplo-cego e o
fluxograma com o calendário das avaliações.

São entendidos como produto biológico soros, vacinas, bacteriófagos, hormônios e


vitaminas naturais ou sintéticas, fermentos e outros.5 Não se enquadram aí ensaios na
área de cirurgia ou que visam a mudança de hábitos.

5.2 Fases de uma pesquisa clínica em farmacologia


Classicamente, ensaios com fármacos são divididos em quatro fases,6 as chamadas
Fase I, Fase II, Fase III e Fase IV. Antes, porém, de apresentar essas quatro fases,
convém lembrar que elas são, obrigatoriamente, precedidas por pesquisas pré-clínicas in
vitro, isto é, em cultura de células e órgãos isolados, e in vivo, ou seja, em animais de
laboratório nos quais se estuda metabolismo, eficácia e toxicidade potencial do
fármaco. Somente depois que uma droga tenha se mostrado promissora nos ensaios
pré-clínicos é que podem ser conduzidos ensaios com seres humanos.

5.2.1 Fase I: teste de segurança


Experimenta-se novo princípio ativo ou nova formulação em seres humanos, pela
primeira vez, na chamada Fase I da pesquisa clínica. Os participantes dessa fase são,
em geral, voluntários sadios, mas também podem participar pacientes que tentaram e
não obtiveram resposta quando submetidos à terapia padrão. A droga é administrada
para pequenos grupos. A ANVISA7 preconiza de 20 a 100 voluntários, que devem ser
estritamente monitorados (follow-up) por certo período de tempo. A ênfase, na Fase I,
é segurança. Coletam-se dados sobre absorção, distribuição, metabolização e
eliminação da droga no corpo humano e se estudam efeitos colaterais.
Além disso, na Fase I são coletados dados para estimar até que ponto a dosagem de
uma droga pode ser aumentada antes de os participantes experimentarem toxicidade
intolerável. Para estimar a dose máxima que pode ser tolerada, o pesquisador começa
administrando uma dose baixa e, passo a passo, aumenta a dosagem, até que seja
alcançado um nível especificado de toxicidade (doses escalonadas). Participam desse
ensaio poucos voluntários sadios. Geralmente cada dose (elas são crescentes) é
experimentada por três voluntários. Então, para testar cinco doses, são necessários 3 ×
5 = 15 participantes. Se for observada toxicidade inaceitável, não se continua o ensaio e
se toma como dose máxima o valor anteriormente administrado. É importante saber
que já existe técnica de estatística bayesiana, mais adequada para o delineamento
desses ensaios, ainda não contemplada na legislação brasileira.
Se as informações coletadas na Fase I indicarem que o uso do novo fármaco é
razoavelmente seguro em humanos, pode-se passar à Fase II. A Fase I tem, portanto, o
objetivo de obter informações sobre a segurança da droga, para o planejamento de
ensaios com pacientes nas fases subsequentes.

5.2.2 Fase II: teste de efetividade


Se o fármaco tiver sido aprovado na Fase I e estabelecido o intervalo dentro do qual as
doses podem variar, o passo seguinte é avaliar, em curto prazo, se o fármaco tem efeito
terapêutico nos pacientes que sofrem da doença ou condição patológica para o qual foi
desenvolvido. Podem, porém, ser exigidos mais alguns critérios de inclusão dos
participantes. Assim, um teste de uma nova droga para lúpus pode exigir, por
exemplo, que os participantes tenham tido o diagnóstico da doença no máximo nos 6
meses anteriores ao início do ensaio e não tenham tomado qualquer droga
modificadora da doença.
Muitos estudos de Fase II são ensaios randomizados, mas em grupos relativamente
pequenos de pacientes estritamente observados. A ANVISA8 preconiza de 100 a 200
participantes. A comparação do efeito terapêutico pode ser feita com um grupo-
controle negativo, com controles históricos ou usando delineamentos que meçam o
estado do paciente, antes e depois do tratamento. São avaliados diversos
biomarcadores.9 Na Fase II, também podem ser testadas várias doses do fármaco,
desde que dentro do intervalo estabelecido na Fase I. Se isso for feito, o estudo pode
ter quatro ou cinco braços. A Fase II tem o objetivo de obter informações adicionais
sobre a segurança da droga e sua efetividade, para que se passe à Fase III.

Ex e m plo 5 - 1
Foi feito um estudo10 para comparar a velocidade de ação de duas drogas,
ticagrelor e clopidogrel, indicadas para prevenir a formação de coágulos de sangue
que possam causar infarto agudo do miocárdio ou acidente vascular cerebral (AVC).
As drogas inibem a agregação de plaquetas (fragmentos de células que compõem o
sangue). Essa agregação é parte da sequência de eventos que conduzem à formação
de coágulos. Nesse estudo foram constituídos três grupos de voluntários; todos eles
tinham doença arterial coronariana. A primeira droga, ticagrelor, foi administrada
para 57 voluntários e a segunda droga, clopidogrel, para 54. Um grupo de 12
voluntários recebeu placebo. Os pacientes foram acompanhados por um período de
53 dias.
Após a administração das drogas, a inibição de agregação das plaquetas (IPA%)
foi medida na linha de base e depois de 30 minutos, 1, 2, 4, 8 e 24 horas, para
estabelecer a velocidade do início da ação das drogas (onset). Decorridas 24 horas, os
pacientes passaram a receber apenas doses de manutenção e não foram feitas
medidas de inibição de agregação das plaquetas durante 42 dias. Para estudar a
velocidade de eliminação (offset), a administração das drogas foi, então, suspensa e
foram obtidos os valores de IPA% em intervalos de tempo variados, durante 240
horas.
Este estudo foi conduzido para estudar a velocidade de absorção e de eliminação de
duas drogas. Os desfechos primários no onset foram IPA medido 2 horas depois da
administração da droga teste; offset: coeficiente angular da reta de regressão
ajustada aos dados de IPA entre 4 e 72 horas após administração da última dose da
droga teste.

10
Gurbel PA. et al. The ONSET/OFFSET Study: Effects of Ticagrelor Versus Clopidogrel in Patients With Stable
Coronary Artery Disease Assessment of the ONSET and OFFSET of the Antiplatelet. Circulation. 2009;
120:2577-2585.

5.2.3 Fase III: teste de eficácia em grandes populações


A Fase III é, de longe, a fase em que empresas multinacionais mais concentram os
ensaios clínicos feitos no Brasil. A droga é administrada a um grande número de
pacientes que sofrem da doença ou da condição patológica para a qual foi
desenvolvida, em ensaios clínicos controlados e randomizados (RCCT). São
conduzidos ensaios multicêntricos, ou até mesmo multinacionais, sempre com o
cuidado de incluir participantes de ambos os sexos, diversos grupos de idade e
diferentes etnias. A ANVISA11 preconiza um mínimo de 800 pacientes para essa fase.
Estudam-se, na Fase III, efeito terapêutico, vias de administração, dosagens, efeitos
colaterais, contraindicações e, ainda, segurança e eficácia da nova droga. No entanto, o
objetivo principal é demonstrar as vantagens potenciais da nova terapia em relação a
outras terapias já existentes no mercado. Considerando, porém, o tempo que a droga
será usada na prática – algumas décadas, no caso de condições ou doenças crônicas –, a
Fase III tem curto período de avaliação (alguns anos). Afinal, nessa fase III, não é
possível estabelecer se doses pequenas de uma droga, administradas por um período
longo de tempo, têm efeitos colaterais indesejáveis. Ainda, os ensaios não são grandes
o bastante para detectar pequenos desvios da normalidade ou efeitos colaterais que
ocorram apenas raramente.

5.2.4 Fase IV: teste dos efeitos EM longo prazo


Os estudos de Fase IV envolvem muitos milhares de pacientes, porque somente assim
é possível comparar a eficácia da nova intervenção com um padrão-ouro e detectar
efeitos colaterais indesejáveis em longo prazo. Aliás, já foi preciso retirar do mercado
produtos que se revelaram tóxicos ou aumentaram a taxa de mortalidade dos pacientes
com eles tratados, mesmo tendo sido submetidos aos ensaios clínicos previstos nas
Fases I, II e III.

Ex e m plo 5 - 2
O Rofecoxibe (Vioxx®) foi muito prescrito pelos médicos para tratar artrites e
outras condições que causam dor crônica ou aguda. A comercialização de todos os
medicamentos com essa droga (Rofecoxibe) foi suspensa em 2004.12 O fabricante
(Merck Sharp Dhome) informou que o uso continuado dessa droga aumentava o
risco de problemas cardiovasculares. Estudos observacionais já haviam mostrado
isso.13 No entanto, a suspensão da comercialização da droga baseou-se, também, em
ensaios clínicos randomizados.
12
Anvisa – Anvisa determina suspensão da venda do Vioxx®: www.anvisa.gov.br/divulga/noticias/2004/300904.htm.
Acesso em 8 de janeiro de 2014.
13
Karha J, Topol EJ. The sad story of Vioxx and what we should learn from it. Cleveland Clinic Journal of Medicine.
Disponível em: www.isdbweb.org/documents/file/82_de_sad. Acesso em 8 de janeiro de 2014.

Por que uma droga, que já está sendo comercializada há anos, é retirada do
mercado? É preciso lembrar que as drogas são aprovadas com base em seus efeitos
sobre desfechos intermediários, tais como diminuir a pressão arterial ou baixar o
colesterol. No entanto, essas drogas podem ter efeitos adversos sérios em longo prazo,
que não podem ser detectados em ensaios clínicos de curto prazo, feitos nas fases
anteriores. A aprovação pode ter ocorrido depois de ensaios que duraram 2 anos, por
exemplo, mas as drogas serem usadas por pacientes com doenças crônicas durante
décadas. Além disso, podem ter sido testadas por centenas ou milhares de
participantes de ensaios clínicos, mas serem usadas por milhões de pacientes. Então,
mesmo depois de aprovada e comercializada, a droga continua em estudo, para
determinar seus efeitos no uso prolongado e em outras populações, que não as já
estudadas. Na Fase IV, a prescrição da droga fica a critério do médico. Nesta fase, são
eventualmente detectadas as contraindicações mediante estudos observacionais, que
podem indicar a necessidade de novos ensaios clínicos.
Além de efeitos adversos sérios em longo prazo e dos efeitos de uso prolongado em
outras populações, que não as já estudadas, a Fase IV possibilita estudar melhor a
variabilidade farmacocinética entre indivíduos. Há várias explicações conhecidas para
essa variabilidade (idade, estado de saúde, doenças concomitantes, estresse emocional,
genética), mas a ciência está longe de ter todas as explicações. A permanente vigilância
é, portanto, absolutamente necessária.
Finalmente, cabe considerar que as recomendações sobre o tamanho das amostras
em cada fase da pesquisa feitas pela ANVISA14 são diferentes das recomendações
sobre tamanho das amostras feitas pelo FDA, como mostrado na Figura 5-1. Do ponto
de vista da estatística, quanto maior for a amostra, melhor. No entanto, existem
restrições de tempo e dinheiro e, principalmente, dos riscos para o participante de
pesquisa.

FIGURA 5-1 Número de participantes por fase do ensaio clínico


O EMEA (European Medicines Agency)15 também considera que o estudo de drogas
terapêuticas tem quatro fases, com os seguintes nomes e objetivos:
1. Farmacologia humana.
Avaliar a tolerância;
Definir ou descrever farmacocinética e farmacodinâmica;
Entender o metabolismo da droga e interações;
Estimar atividade.
2. Estudo exploratório do efeito terapêutico.
Explorar o uso para a indicação alvo;
Estimar a dosagem para estudos subsequentes;
Dar base para estudos confirmatórios, desfechos, metodologias;
3. Estudo confirmatório do efeito terapêutico.
Demonstrar/confirmar eficácia.
Estabelecer perfil de segurança;
Providenciar uma base adequada para avaliar risco/benefício; para poder garantir
o licenciamento;
Estabelecer a relação dose/resposta.
4. Uso terapêutico.
Refinar o entendimento sobre a relação benefício/risco em geral ou em
populações e/ou ambientes especiais;
Identificar reações adversas menos comuns;
Refinar a recomendação sobre dosagem.

5.3 Ensaios exploratórios e ensaios pragmáticos


Existe distinção entre eficácia (efficacy) e eficiência (effectiveness). Eficácia é a capacidade
de produzir efeito. Na área de farmacologia, eficácia refere-se à resposta (efeito
terapêutico) máxima que pode ser conseguida com uma droga. Eficiência é a
habilidade de uma droga produzir efeito benéfico em circunstâncias normais de uso.
Existe a mesma distinção entre ensaios explanatórios (explanatory trials) e ensaios
pragmáticos (pragmatic trials).16 Os ensaios explanatórios responderiam à pergunta:
“Esta intervenção tem eficácia, isto é, funciona em condições ideais?”; enquanto os
ensaios pragmáticos responderiam à pergunta: “Esta intervenção tem eficiência, isto é,
funciona em condições normais?”.
Eficácia e ensaios explanatórios remetem, portanto, à ideia sobre o que a intervenção
conseguiria se tivesse sido feita em condições ideais. Eficiência e ensaios pragmáticos
remetem à ideia do que a intervenção consegue na prática, levando em consideração a
aderência incompleta a um protocolo.17 A análise estatística de ensaios clínicos
randomizados, feita com dados de participantes que cumpriram o protocolo, mede
eficácia; a análise estatística feita usando o princípio de intenção de tratar produz
estimativas de eficiência.

Ensaios explanatórios medem eficácia. Pretendem determinar o que a intervenção


conseguiria se tivesse sido feita em condições ideais.
Ensaios pragmáticos medem eficiência. Pretendem determinar o que a
intervenção consegue na prática, levando em conta aderência incompleta ao
protocolo.

Durante dois congressos internacionais realizados em Toronto (Canadá) nos anos


2005 e 2008, e no período decorrido entre esses encontros, pesquisadores com
experiência clínica, financiadores de pesquisa e metodologistas definiram e
redefiniram aspectos do delineamento dos ensaios que fizessem a distinção entre
explanatórios e pragmáticos.18 A iniciativa surgiu do projeto do Canadá e União
Europeia, para conduzir ensaios pragmáticos em países de baixa e média renda. Foram
identificados os domínios de um indicador para distinguir ensaios explanatórios de
pragmáticos. O indicador foi denominado PRECIS (Pragmatic Explanatory Continuum
Indicator Summary) e está apresentado no trabalho anteriormente citado.

5.4 Ensaios de superioridade, de equivalência, de não


inferioridade
Os ensaios clínicos randomizados controlados duplo-cegos e em paralelo são
amplamente reconhecidos como o melhor método para comparar o efeito terapêutico
de diferentes intervenções. Na área de farmacologia, a situação mais conhecida é da
comparação da droga em teste (T) com uma droga de referência (R), para testar a
hipótese de que T e R têm igual eficácia (hipótese da nulidade) contra a hipótese de
que têm eficácia diferente (hipótese alternativa), como mostra a Figura 5-2. Além
disso, também são conduzidos ensaios clínicos para verificar se uma nova droga é
eficaz, comparando-a com o controle negativo (ou braço comparador de placebo),
embora o uso de placebo seja sempre questionável, como já se discutiu. Estes ensaios
são ditos de superioridade.

FIGURA 5-2 Ensaio clínico randomizado controlado duplo-cego em paralelo


Ensaio de superioridade é aquele que tem como objetivo verificar se existe diferença
entre duas intervenções, ou seja, se uma intervenção é melhor que a outra.

Ex e m plo 5 - 3
Foi conduzido um ensaio clínico randomizado controlado com 5.804 participantes
(2.804 homens e 3.000 mulheres), com idades entre 70 e 82 anos, com história ou
risco de doença vascular.19 Foram formados dois grupos: 2.891 participantes
receberam pravastatina (40 mg por dia) e 2.913 receberam placebo. A concentração
de colesterol na linha de base variou entre 4,0 mmol/L a 9,0 mmol/L. O follow-up foi
de 3,2 anos. O desfecho primário foi uma variável composta: morte por doença
coronariana, infarto não fatal do miocárdio e AVC fatal ou não. Esse foi um ensaio de
superioridade, para estudar eficiência. A análise estatística, usando o princípio de
intenção de tratar, mostrou que a pravastatina tem efeito benéfico, protegendo o
paciente.

19
PROSPER study group. Pravastatin in elderly individuals at risk of vascular disease (PROSPER): a randomised
controlled trial. Lancet. 2002 Nov. 23;360 (9346):1623-30.

Uma análise estatística aplicada aos resultados dos ensaios de superioridade pode
mostrar que uma das intervenções é significantemente melhor que a outra, mas também
pode mostrar que a diferença é não significante. Muitas vezes, um resultado não
significante em um ensaio de superioridade é erroneamente interpretado como prova
de nenhuma diferença entre os dois tratamentos. No entanto, usando testes
estatísticos, é impossível provar que dois tratamentos são iguais em desempenho.
Por ser impossível provar igualdade por meio de testes estatísticos, são feitos ensaios de
equivalência para estabelecer se uma nova intervenção é terapeuticamente similar (nem
melhor, nem pior) a uma intervenção de reconhecida eficácia. Também são conduzidos
ensaios de não inferioridade, que têm o objetivo de estabelecer se a nova intervenção não
é pior que o tratamento reconhecidamente eficaz.20 Vamos ver como isso é feito.
Em ambos os casos é preciso definir, a priori, uma margem de não inferioridade, ou
seja, um limite clinicamente aceitável para a diferença dos efeitos de tratamentos.
Como exemplo, vamos considerar estudos sobre infarto agudo do miocárdio. Parece
razoável considerar que dois tratamentos têm efeitos similares se a diferença nas taxas
de mortalidade entre eles não exceder 1%. Então, este valor é a margem de não
inferioridade (Figura 5-3).
FIGURA 5-3 Diferença de 1% na taxa de mortalidade, que no exemplo define a equivalência de
duas intervenções nos casos de infarto agudo do miocárdio

Ensaio de equivalência é aquele que tem o objetivo de mostrar que a verdadeira


diferença entre duas intervenções cai dentro de margens clinicamente aceitáveis.

Os ensaios de não inferioridade têm o objetivo de mostrar que uma nova


intervenção tem tanta eficácia quanto a intervenção padrão ou, se pior, a diferença
entre elas é menor que a diferença clinicamente aceitável, previamente estabelecida.21
Do ponto de vista da ética, somente se justifica um ensaio de não inferioridade se a
nova intervenção tiver vantagem sobre a intervenção reconhecidamente eficaz, como
apresentar custo menor, ser menos invasiva, ser mais fácil de administrar, ter menos
efeitos colaterais.

Ensaio de não inferioridade é aquele que tem o objetivo de mostrar que a verdadeira
diferença entre a resposta do braço experimental e a resposta do braço comparador
ativo não é menor que uma margem preestabelecida como clinicamente aceitável
(Figura 5-4).
FIGURA 5-4 T é superior à referência se o intervalo de confiança estiver à direita de zero;
não inferior, se estiver à direita da margem inferior; equivalente, se contido na zona entre as
duas margens, -M e +M

Um ensaio de não inferioridade pode ser, às vezes, necessário, mas o crédito neles é
menor. Por exemplo, um ensaio de não inferioridade seria conduzido para verificar se
uma nova droga quimioterápica não é inaceitavelmente pior que a droga em uso. No
entanto, seria necessário apontar uma vantagem. É claro que alguns ensaios de não
inferioridade podem, eventualmente, ser entendidos como subterfúgio de uma
empresa farmacêutica para colocar no mercado um produto inferior – o que não é
necessariamente uma verdade.
Os ensaios de equivalência são usados para garantir o valor terapêutico das drogas,
mas os ensaios de não inferioridade enfrentam controvérsia.22 Afinal, a pessoa é
convidada para participar de uma pesquisa em que se pretende designar as
intervenções ao acaso para estabelecer se uma delas – a nova – não é pior que a
intervenção padrão, de efeito conhecido. Então, a vantagem dessa nova intervenção
sobre a intervenção reconhecida como eficaz deve ser óbvia. De qualquer modo, tanto
ensaios de equivalência como ensaios de não inferioridade exigem que a eficácia do
tratamento de referência tenha sido estabelecida. O uso de um braço comparador de
placebo ou de não intervenção não pode sequer ser considerado. Ainda, os ensaios de
equivalência e de não inferioridade devem ser conduzidos com participantes similares
àqueles dos ensaios que estabeleceram a eficácia do tratamento de referência.
Ensaios de equivalência e ensaios de não inferioridade somente podem ser
conduzidos quando propõem comparar uma nova intervenção com uma intervenção
reconhecida como, por exemplo, para avaliar o comportamento em longo prazo de um
tipo de prótese em artroplastia total do quadril, uma nova combinação de drogas para
AIDS ou modelos de cuidados pré-natais com número menor de visitas. Não devem
ser conduzidos ensaios de equivalência ou não inferioridade quando o tratamento
padrão não é consistentemente melhor que o placebo, como acontece com drogas para
depressão e demência.23

5.5 Ensaios clínicos em cirurgia


Os ensaios clínicos randomizados (RCT) têm importante posição na discussão da
Medicina Baseada em Evidência (Evidence Based Medicine – EBM). No entanto, a
metodologia para os ensaios clínicos foi desenvolvida para o teste de drogas
terapêuticas. As normas do FDA foram praticamente globalizadas, mas tardaram em
cirurgia. Muitos procedimentos cirúrgicos foram adotados por anos, antes que se
estabelecesse a inutilidade deles como aconteceu com a mastectomia radical e a
ligadura da artéria mamária para tratar a isquemia do miocárdio.
Há diversas barreiras para a condução de ensaios clínicos em cirurgia.24 Os custos de
hospitalização e de pessoal auxiliar são altos; há dificuldades para o recrutamento de
pacientes. As agências governamentais e as indústrias têm exigências mais rígidas
para financiar cirurgias experimentais que ensaios na área de nutrição, por exemplo,
devido à maior mortalidade associada às cirurgias. Os CEP também se mostram, às
vezes, muito cautelosos. Obter o consentimento esclarecido do paciente também é
mais demorado que nos ensaios clínicos com drogas. A exceção fica por conta de
doenças com prognóstico ruim, que acontecem em oncologia e cardiologia.
No entanto, são necessários ensaios clínicos em cirurgia para testar a segurança e a
eficácia de um novo procedimento, em curto e longo prazos, e comparar os resultados
obtidos com as técnicas já conhecidas e aprovadas. Como isso seria possível? Os
ensaios clínicos randomizados exigem randomização e um braço comparador. Como
deve ser esse braço em um ensaio em cirurgia? Com quais argumentos um grupo de
cirurgiões e um CEP podem negar a cirurgia (braço de não intervenção) à metade dos
pacientes que, em tese, necessitam dela? E as cirurgias simuladas (braço comparador
simulado)? Embora possíveis, são altamente discutíveis em termos de ética, ainda que
algumas delas tenham trazido informação útil para a área. O que se faz é comparar a
intervenção cirúrgica com o tratamento clínico (braço comparador ativo). O cegamento
é, na maioria das vezes, não factível; em certos casos, no entanto, um pesquisador que
não participou das intervenções pode avaliar os pacientes sem saber quais tratamentos
receberam. Contudo, as dificuldades continuam.
No projeto de pesquisa, é conveniente verificar a viabilidade de propor novas
tecnologias, considerando a necessidade de treinamento, de compra de equipamentos,
de aumentos de preço devido à inclusão de itens diversos. Muitas vezes, há viés na
seleção de pacientes e, sem dúvida, cuidados e atenções extras introduzem viés nos
resultados. O sucesso de uma cirurgia depende, em muito, da habilidade do cirurgião.
Então, os resultados de um ensaio feito por pesquisadores bem treinados não
mostram com exatidão o balanço custo/benefício. E quais variáveis resposta devem ser
consideradas?
Nos ensaios clínicos em cirurgia, as variáveis resposta mais comumente usadas são
taxa de mortalidade, taxa de morbidade e tempo para recuperação. Também são
consideradas medidas de qualidade de vida relacionadas com saúde e satisfação do
paciente. Os fatores que afetam a variável resposta são idade, sexo, índice de massa
corporal, comorbidades, doenças preexistentes, estágio da doença, cirurgião, estado
emocional do paciente, cuidados paliativos, dentre outros.
Importante, nos ensaios em cirurgia, é a metodologia estatística de análise. Devem
ser feitas todas as análises possíveis, isto é, tanto análises considerando a intenção de
tratar como análises considerando as intervenções efetivamente recebidas. É
necessário buscar (e analisar por estatística) os motivos de cruzamento (cross-over).
Entende-se que houve cruzamento quando um paciente, designado por processo
aleatório para um dos braços do ensaio, decide que irá se submeter ao outro tipo de
intervenção. As conclusões se tornam, até certo ponto, dúbias, mas é o que se deve
fazer.

Ex e m plo 5 - 4
Entre 1972 e 1984, o Grupo Cooperativo de Estudo da Cirurgia de Revascularização
do Miocárdio da Admininistração dos Veteranos recrutou pacientes com angina e
evidência radiográfica de doença arterial coronariana para um ensaio clínico
randomizado, que propunha comparar a cirurgia de revascularização do miocárdio
com tratamento clínico. Depois de 14 anos de follow-up, 55% dos pacientes
designados por processo aleatório para serem tratados clinicamente haviam optado
pela cirurgia e 6% dos pacientes designados para serem operados haviam decidido
pelo tratamento clínico. Foram feitas várias análises estatísticas.25

25
Zenati MS. Clinical Trials in Surgery. Disponível em: http://www.pitt.edu/∼super7/43011-44001/43831.ppt.
Acesso em 31 de outubro de 2014.

5.6 Resumo
Fase I (teste de segurança): a droga é administrada a pequeno número de participantes
sadios, de 20 a 100. A ênfase, na Fase I, é segurança. Coletam-se dados sobre absorção,
distribuição, metabolização e eliminação da droga no corpo humano e se estudam
efeitos colaterais.
Fase II (teste de efetividade): tem o objetivo de obter informações adicionais sobre
segurança da droga e sua efetividade, para que se passe à Fase III. São feitos estudos
exploratórios para estudar dosagens de drogas e avaliação de biomarcadores com
número pequeno de participantes doentes, de 100 a 200.
Fase III (teste de efetividade em grandes populações): a droga é administrada a um
grande número de pacientes, isto é, no mínimo 800, que têm a doença ou a condição
patológica para a qual foi desenvolvida. Nessa fase, se estudam segurança, efeito
terapêutico, dosagens, vias de administração, efeitos colaterais e contraindicações.
Fase IV (fase da vigilância): envolve milhares ou milhões de pacientes, para que se
possa comparar a eficácia da nova intervenção com um padrão-ouro, examinar o efeito
da droga em grandes populações e buscar efeitos adversos incomuns.
Ensaios explanatórios medem eficácia; pretendem determinar o que a intervenção
conseguiria se tivesse sido feita em condições ideais.
Ensaios pragmáticos medem eficiência; pretendem determinar o que a intervenção
consegue na prática, levando em conta aderência incompleta ao protocolo.
Ensaio de superioridade tem como objetivo verificar se a droga sob investigação é
superior à droga de referência.
Ensaio de equivalência tem o objetivo de mostrar que a verdadeira diferença entre
resposta do braço experimental e do braço comparador cai dentro de margens
clinicamente aceitáveis.
Ensaio de não inferioridade tem o objetivo de mostrar que a verdadeira diferença entre
a resposta do braço experimental e a resposta do braço comparador ativo é menor que
uma margem preestabelecida como clinicamente aceitável.

1
FDA.COM Information Portal. Disponível em: http://www.fda.com.Acesso em 28 de outubro de 2014.
2
European Medicines Agency. Disponível em: http://www.ema.eu. Acesso em 28 de outubro e 2014.
3
Agência Nacional de Vigilância Sanitária. Disponível em: www.anvisa.gov.br. Acesso em 23 de junho de 2014.
4
Guia para Elaboração de Relatórios de Estudos Clínicos para fins de Registro e/ou Alterações Pós-Registro de Produtos
Biológicos. Disponível em:
http://portal.anvisa.gov.br/wps/wcm/connect/13542f0048bd2498a79daf9a6e94f0d0/produtos_biologicos.pdf?
MOD=AJPERES
5
Veja o Decreto n° 3.961, de 10 de outubro de 2001 que altera o Decreto n° 79.094, de 5 de janeiro de 1977, que
regulamenta a Lei n° 6.360/76.
6
As normas para a pesquisa com novos fármacos, medicamentos, vacinas e testes diagnósticos são dadas na Resolução
no 251/1997 do Conselho Nacional de Saúde, Ministério da Saúde, e na Resolução 391 da Agência Nacional de
Vigilância Sanitária.
7
Anvisa – Medicamentos – Pesquisa clínica. Disponível em:
https://www.anvisa.gov.br/medicamentos/pesquisa/def.htm. Acesso em 9 de julho de 2014.
8
Anvisa – Medicamentos – Pesquisa clínica. Disponível em:
https://www.anvisa.gov.br/medicamentos/pesquisa/def.htm. Acesso em 9 de julho de 2014.
9
Biomarcadores ou marcadores biológicos são variáveis que podem ser medidas e indicam a ocorrência de
determinada função, normal ou patológica, de um organismo. Os biomarcadores podem ser fisiológicos (funções de
órgãos), físicos (alterações características em estruturas biológicas), histológicos (amostras de tecido obtidas por
biopsia) e anatômicos. Os biomarcadores mais usados na pesquisa médica são bioquímicos, porque eles podem ser
obtidos com relativa facilidade a partir de fluidos corporais.
11
Anvisa – Medicamentos – Pesquisa clínica. Disponível em:
https://www.anvisa.gov.br/medicamentos/pesquisa/def.htm. Acesso em 9 de julho de 2014.
14
Anvisa – Medicamentos – Pesquisa. Disponível em: http://www.anvisa.gov.br/medicamentos/pesquisa/def.htm.
Acesso em 9 de julho de 2014.
15
General Considerations for Clinical Trials. Step 5 European Medicines Agency. Disponível Acesso em 27 de outubro de
2014.: http://www.ema.europa.eu/docs/.../WC500002877. Acesso em 27 de outubro de 2014.
16
Coutinho ESF, Huf G, Bloch KV. Ensaios clínicos pragmáticos: uma opção na construção de evidências em saúde.
Cad. Saúde Pública, Rio de Janeiro 19(4):1189-1193, jul-ago, 2003.
17
Friedman LM, Furberg CD, DeMets DL. Fundamentals of clinical trials. Nova York, Springer. 4 ed. 2010, p. 3,
consideram que esta seria a análise feita de acordo com a intenção de tratar. Esses autores não veem a necessidade de
mais definições.
18
Thorpe KE. et al. A pragmatic-explanatory continuum indicator summary (PRECIS): a tool to help trial designers. J
Clin Epidemiol 2009 Maio 62(5):464-75. doi: 10.1016/j.jclinepi.2008.12.011. Disponível em:
www.ncbi.nlm.nih.gov/pubmed/19348971. Acesso em 20 de julho de 2014.
20
Lesaffre E. Superiority, equivalence, and non-inferiority trials. Bull NYU Hosp J. Dis. 2008;66(2):150-4.
21
Piaggio G. et al. Reporting of noninferiority and equivalence randomized trials. JAMA. 2006, Mar. 8;295(10).
Disponível em: http://jama.jamanetwork.com/on07/24/2012.
22
Garattini S, Bertele V. Non-inferiority trials are unethical because they disregard patients’ interests. Lancet. 2007 Dez.
1;370(9602):1875-7.
23
Gotzsche PC. Lessons from and caution about non-inferiority and equivalence randomized trials. JAMA. 2006, Mar.
8;295(10).
24
Zenati MS. Clinical Trials in Surgery. Disponível em: http://www.pitt.edu/∼super7/43011-44001/43831.ppt.
Acesso em 27 de outubro de 2014.
C AP Í T U L O 6

Estudos Observacionais
A metodologia para a condução de ensaios clínicos está bem estruturada,
principalmente na área de farmacologia. No entanto, não é possível aplicar essa
metodologia para comparar condições ou hábitos de vida que não possam ser
distribuídos aos participantes da pesquisa por processo aleatório, tais como estudar os
efeitos do hábito de fumar na saúde das pessoas, o uso abusivo de bebidas alcoólicas
por estudantes universitários ou o estresse em policiais militares. Contudo, podem ser
conduzidos estudos observacionais em vez dos ensaios clínicos randomizados.
Embora nem sempre conclusivos, os estudos observacionais podem gerar hipóteses,
propor perguntas, identificar fatores de risco, fornecer estimativas sobre incidência,
prevalência e prognóstico de doenças – informações importantes para o planejamento
de ensaios clínicos randomizados.
Os estudos observacionais não levantam questões de ética porque os participantes
não são designados para grupos por processo aleatório, como acontece nos ensaios
clínicos randomizados. No entanto, os participantes de pesquisa podem ser
convidados para responder questionários, comparecer periodicamente aos centros de
pesquisa para exames biométricos ou ser submetidos a testes laboratoriais e
diagnósticos, às vezes invasivos.
A preocupação com a validade dos estudos observacionais aumentou muito e passou
a ser mais debatida depois que ficou demonstrado, por meio de ensaio clínico
randomizado, que a terapia de reposição hormonal pós-menopausa, diferentemente
do que apontavam os estudos observacionais, aumenta o risco de doenças
cardiovasculares em mulheres sadias.1 Ficou então claro que achados de estudos
observacionais podem ser diferentes ou, até mesmo, opostos aos achados em ensaios
clínicos randomizados, embora tal disparidade não ocorra na maioria das vezes.
De qualquer modo, a discussão sobre os resultados de estudos observacionais exige
mais senso crítico que a discussão dos resultados de ensaios clínicos randomizados.
Quem lê tais estudos deve ficar atento: pode não existir outra maneira de obter as
respostas procuradas, mas é preciso procurar relações consistentes entre os achados.
Nem sempre os relatos de estudos observacionais permitem interpretação adequada,
como bem colocam vários pesquisadores.2 Então, para facilitar a interpretação, todo
estudo observacional deve fornecer detalhes do que busca relacionar, descrição do
desfecho, características dos participantes e discussão de possíveis variáveis
intervenientes (de confundimento), além de uma boa análise estatística.
Neste capítulo, serão apresentados os seguintes tipos de estudos observacionais:
coorte, caso-controle transversal e estudo de séries de casos.

6.1 O que é estudo coorte?


No estudo coorte (cohort study), um grande grupo de pessoas (coorte) com
características definidas é observado para determinar a incidência de uma doença
específica, mortalidade por determinada causa ou outro tipo de desfecho clínico.3

3
Morabia A. A History of Epidemiologic Methods and Concepts. Birkhaeuser Verlag, Basel, 2004.

Os estudos coorte podem ser prospectivos ou retrospectivos. Os estudos coorte


prospectivos são conduzidos do presente para o futuro. Os estudos coorte
retrospectivos são conduzidos no presente, mas buscam dados no passado.

6.1.1 O que é estudo coorte prospectivo?


No estudo coorte prospectivo (prospective cohort study), um grande número de pessoas
provenientes da mesma população é classificado em dois grupos: um grupo de
expostos a um fator que se supõe de risco e o outro grupo de não expostos a esse
fator. Os grupos são observados durante certo tempo para verificar se a proporção
de um dado desfecho é maior em um dos grupos.

É importante notar que, nos estudos coorte prospectivos, os participantes pertencem


aos grupos pelo fato de estarem, ou não, expostos a um fator que se presume de risco
para determinado desfecho – não são designados aos grupos por processo aleatório. O
esquema do delineamento desse estudo é mostrado na Figura 6-1.

FIGURA 6-1 Estudo coorte prospectivo com dois grupos


Ex e m plo 6 - 1
Na década de 1950, dois pesquisadores ingleses4 fizeram o primeiro estudo coorte.
Eles queriam saber se fumantes apresentam maior risco de ter câncer do pulmão em
comparação com quem não fuma. Para isso, enviaram um questionário para
aproximadamente 60 mil médicos do Reino Unido, perguntando sobre seus dados
demográficos (nome, endereço, sexo, idade etc.) e os hábitos de fumar deles
próprios. Receberam aproximadamente 40 mil respostas. Os pesquisadores
acompanharam a sobrevivência dos médicos durante 53 meses, por meio de um
registro geral. Dentre as pessoas com o hábito de fumar (fator de risco) ocorreram
mais mortes por câncer no pulmão (desfecho).

4
Doll R, Hill AB. Lung cancer and other causes of death in relation to smoking: a second report on the mortality of
British doctors. British Medical Journal 1956 Nov. 10;2(5001):1071-81.

Os estudos coorte prospectivos têm grande potencial para mostrar evidência,


porque os participantes da pesquisa são observados antes de o desfecho ocorrer. Mas é
preciso cuidado ao aceitar a conclusão de relação de causa e efeito, isto é, de que a
exposição ao fator causa o desfecho em estudo. O efeito da exposição ao fator pode
estar confundido com os efeitos de outros fatores – que seriam, estes sim, os
verdadeiros causadores do desfecho em estudo. Veja a Figura 3-2 do Capítulo 3.
No Exemplo 6-1, a população-alvo era de médicos do Reino Unido. Foi obtida uma
amostra de 40 mil médicos, para um estudo coorte prospectivo. Como os médicos não
foram sorteados para se tornarem fumantes ou não fumantes, durante anos foram
levantadas explicações alternativas para a maior incidência de câncer de pulmão entre
fumantes. Por exemplo, a decisão de se tornar fumante poderia estar relacionada com
fatores sociais, genéticos, de personalidade, que seriam fatores intervenientes. No
entanto, depois de muita discussão e com os resultados de outros estudos, chegou-se à
conclusão de que fumantes apresentam, realmente, maior risco de ter câncer no
pulmão.
O fator que se presume de risco também pode ser estudado em vários níveis, ou
seja, o estudo coorte pode comparar vários grupos. Convém rever, mais uma vez, o
Exemplo 6-1, que apresentou a pesquisa de maneira simplificada. Na verdade, nesse
estudo, os médicos foram discriminados em vários grupos de exposição: não fumantes,
fumantes leves, fumantes moderados, fumantes graves, fumantes de charutos,
fumantes de cachimbo etc. Ainda, o mesmo estudo coorte permitiu estudar vários
desfechos, simultaneamente. Além da incidência de morte por câncer do pulmão,
também foram levantadas mortes por outras causas – o que permitiu associar o hábito
de fumar a diversas causas de morte.
O estudo coorte prospectivo também é o método usado para levantar os efeitos
colaterais de novas intervenções em longo prazo. Os ensaios clínicos randomizados
mostram, por exemplo, se determinada droga administrada durante certo período de
tempo tem efeito benéfico sobre certa doença. No entanto, a segurança do uso de
novas drogas em longo prazo é estabelecida por estudos observacionais feitos na fase
IV. Neste caso, a população exposta ao risco é a de pessoas que usam a nova droga.
Busca-se estabelecer a proporção de pessoas que têm efeitos adversos, que são os
desfechos procurados.

6.1.2 O que é estudo coorte retrospectivo?


No estudo coorte retrospectivo (retrospective cohort study), também chamado estudo
coorte histórico (historical cohort study), um grande número de pessoas provenientes
da mesma população é classificado em dois grupos: um grupo de expostos a um
fator que se supõe de risco para determinada doença e o outro grupo de não
expostos a esse fator. Depois, em arquivos ou por meio de questionários, busca-se a
proporção de participantes com a doença nos dois grupos (Figura 6-2).

FIGURA 6-2 Estudo coorte retrospectivo com dois grupos

Ex e m plo 6 - 2
Para estudar a associação5 entre o hábito de fumar cigarros e o risco de artrite
reumatoide em mulheres, foi enviado um questionário para 377.481 mulheres
americanas, profissionais da área da saúde, que participam do Estudo Coorte sobre
a Saúde da Mulher (Women’s Health Cohort Study). As mulheres foram, então,
divididas em dois grupos: fumantes (expostas ao risco) e não fumantes (não expostas).
Para comparar os grupos, a análise estatística considerou diversas variáveis,
demográficas e de saúde. A conclusão foi a de que a duração do hábito, mas não a
intensidade (número de cigarros por dia), está diretamente associada a um pequeno
aumento de risco de artrite reumatoide em mulheres.
5
Karlson EW. et al. A retrospective cohort study of cigarette smoking and risk of rheumatoid arthritis in female
health professionals. Arthritis & Rheumatism, 1999 Maio 19; v. 42:910-17.

A grande desvantagem dos estudos coorte retrospectivos é o fato de o pesquisador


utilizar dados coletados em outra época. Dados obtidos em arquivos ou por meio de
questionários podem ser incompletos e imprecisos, pelo fato de terem sido obtidos
por diferentes examinadores, técnicas e aparelhos.
A vantagem dos estudos coorte retrospectivos é não haver acompanhamento de
participantes, o que os torna baratos em relação aos estudos coorte prospectivos, que
exigem um período demorado de follow-up (até ocorrerem os desfechos procurados).
Ainda, apresentam a vantagem de não perder tantos participantes como os estudos
coorte prospectivos, nos quais a taxa de participantes que se retiram é alta,
principalmente quando o período de latência da doença é longo. De qualquer modo, os
estudos coorte – prospectivos ou retrospectivos – têm a vantagem de poder examinar
situações raras de exposição, porque os participantes da pesquisa são selecionados
exatamente pelo fato de estarem expostos a um fator (condição, doença, hábito) que se
supõe de risco para um dado desfecho.

6.2 O que é estudo de caso-controle


No estudo de caso-controle (case-control study), um grupo de pessoas doentes (casos)
e outro de pessoas sadias (controles) são examinados e questionados para que o
pesquisador possa buscar, na diferença de seus históricos, os fatores que
predispõem pessoas à doença em estudo.

Casos e controles devem ser tão similares quanto possível, diferindo apenas pelo
fato de um grupo ter a doença ou condição em estudo (casos) e o outro não apresentar
essa doença ou condição (controles). O pesquisador examina e questiona cada
participante da pesquisa para saber se foi ou não exposto, e em que grau, ao fator que
se presume de risco para a doença ou condição que estuda. Faz, portanto, um
retrospecto da vida dos participantes de pesquisa e depois compara as proporções de
expostos ao fator de risco, nos dois grupos. O estudo de caso-controle é também
chamado de estudo retrospectivo (Figura 6-3).
FIGURA 6-3 Coorte retrospectivo e caso-controle comparação

Ex e m plo 6 - 3
Para verificar se as doenças periodontais estão associadas ao hábito de fumar, foi
feito um estudo de caso-controle.6 Foram selecionados 95 homens com doença
periodontal (casos) que serviam a Polícia Militar do Estado de Minas Gerais, no
período de junho a outubro de 1998. Esses militares foram pareados com outros 95,
que não tinham doença periodontal (controles). Os pares foram formados com
militares da mesma faixa etária e mesma patente. Levantados os hábitos de fumar
nos dois grupos, pode-se verificar que entre participantes com doenças periodontais
havia mais fumantes.

6
Cruz CMN. Estresse e fumo como fatores de risco para a doença periodontal. Tese de Mestrado. Campinas,
Unicastelo, 2000.

Uma grande vantagem do estudo de caso-controle é o fato de ele ser o único


possível, ou seja, ser praticamente obrigatório quando a condição ou doença em
estudo é muito rara. Um estudo coorte exigiria amostras muito grandes – o que
significaria pesquisa muito cara. Por exemplo, se um pesquisador quisesse relacionar
hábito de fumar com incidência de amiloidose cardíaca, não poderia fazer um estudo
coorte porque talvez não achasse nenhum caso da doença após um período
razoavelmente longo, mesmo que tivesse uma grande amostra de fumantes e outra
grande amostra de não fumantes.
Outra vantagem do estudo de caso-controle é custar menos em tempo e em dinheiro
que outros tipos de estudo. Por esse motivo, são bastante comuns. No entanto, os
resultados dessas pesquisas nem sempre são confiáveis. Os estudos de caso-controle
têm validade menor que os estudos coorte, porque a possibilidade de viés é muito
grande. Essa é a grande desvantagem, que se busca compensar com grandes amostras,
mesmo quando a característica em estudo é mais comum.

Ex e m plo 6 - 4
Foi conduzido um estudo de caso-controle em 52 países para identificar fatores de
risco associados ao infarto do miocárdio de ocorrência prematura.7 Foram
levantados dados de 15.152 casos (infartados) e 14.820 controles (sem ocorrência de
infarto). Os achados (em retrospecto) mostraram que infarto do miocárdio está
positivamente associado a tabagismo, hipertensão, diabetes, obesidade abdominal,
apolipoproteína e fatores psicológicos; e negativamente associado a consumo de
frutas e vegetais, consumo moderado de álcool e atividade física regular.

7
INTERHEART Study Investigators. Effect of potentially modifiable risk factors associated with myocardial
infarction in 52 countries (the INTERHEART study): case-control study. Lancet, 2004 Set. 11; v. 364: 937-52.

A maioria dos estudos de caso-controle busca apenas a presença ou a ausência de


exposição a um fator de risco. O Exemplo 6-4 apresenta, porém, um estudo em que os
pesquisadores buscaram, retrospectivamente, diversos fatores de risco (tabagismo,
hipertensão, diabetes etc.) tanto nos casos (infartados) como nos controles (que não
tiveram infarto).
Os estudos de caso-controle exigem extremo cuidado na seleção dos casos, na
seleção dos controles e na coleta dos dados. Para entender as razões de tantos
cuidados, é preciso saber como esses estudos são projetados. O pesquisador começa
seu estudo com os casos – em geral seus pacientes e os da instituição em que trabalha
ou estuda. Esses pacientes provavelmente estão em estágios diversos da doença e são
diferentes entre si, em termos de variáveis demográficas como sexo, idade, tempo da
doença e comorbidades. Portanto, não são similares.
Tendo os casos, o pesquisador precisa de controles, isto é, de participantes que não
tenham a doença, mas que sejam comparáveis, em todos os outros aspectos, com os
casos em estudo. Deve então decidir onde obter a amostra: da população em geral ou
da população de pacientes com outras doenças, que estão sendo atendidos na
instituição. A última opção é a preferida, por ser de fácil acesso.
Intuitivamente, sabemos que o pesquisador deveria comparar pessoas que têm a
doença em estudo com pessoas sadias (e não com pessoas que apresentem outras
doenças), mas também sabemos que é mais fácil recrutar pacientes hospitalizados
para serem controles. O problema fica resolvido caso sejam escolhidos, para formar o
grupo-controle, pacientes com condições específicas (p. ex., casos de fratura e de
hérnia). No entanto, é preciso ajustar as variáveis demográficas e alguns hábitos.
Fatores como sexo, idade, nível socioeconômico e tabagismo afetam a incidência e o
prognóstico das doenças. O pesquisador pode, então, escolher para cada caso um
controle similar, ou seja, formar pares de caso-controle Dessa forma, os efeitos das
variáveis intervenientes ficam ajustados.
A técnica de formar pares é bastante útil, mas não se deve chegar a extremos. Os
pares devem ser constituídos com a finalidade de eliminar diferenças que poderiam
ser produzidas por fatores já conhecidos, mas não devem trazer um “excesso de
igualdade” entre os grupos, porque isso poderia eliminar exatamente as diferenças
procuradas. Outro aspecto importante é a análise estatística, que deve respeitar o
delineamento feito, isto é, a formação de pares.
Às vezes, é difícil formar pares para diminuir o número de variáveis intervenientes
conhecidas. Se o pesquisador não conseguir um controle para formar par com
determinado caso, pode aumentar os limites dos critérios de inclusão (p. ex., definir
faixas etárias de 10 anos de idade e não de 5) ou excluir alguns casos.
Todos os cuidados são relevantes, mas existe ainda outra fonte possível de viés nos
estudos de caso-controle a opinião preconcebida das pessoas sobre a causa do
desfecho (doença, condição, hábito). O próprio entrevistador, o paciente ou seus
familiares podem introduzir algum tipo de tendência nas respostas. Por exemplo, pode
ser difícil levantar dados imparciais por meio de entrevistas com pacientes com câncer
no pulmão e seus familiares, porque eles podem exagerar ao relatar os hábitos de
fumar, para “explicar ” a doença.
O mesmo acontece com a mãe de um excepcional. Muito provavelmente, em
comparação com outras mães, ela se lembrará com mais facilidade de eventos que
ocorreram durante a gravidez e que, presumivelmente, teriam causado o problema.
Então, a evidência trazida pelos estudos de caso-controle pode ser útil, mas é preciso
considerar outros tipos de pesquisa antes de tirar uma conclusão definitiva sobre os
fatos.

6.3 Qual é a diferença entre estudo coorte retrospectivo e


estudo de caso-controle?
A diferença entre estudo coorte retrospectivo e estudo de caso-controle está na direção.
Nos estudos coorte retrospectivos, os participantes da pesquisa são identificados no
presente, pela exposição ou não ao fator que se supõe de risco para determinada doença.
Depois, busca-se a doença nessas pessoas. Por exemplo, tomam-se dois grupos de
pessoas, fumantes (expostas) e não fumantes (não expostas); em seguida, busca-se o
número de pessoas com doenças cardíacas nos dois grupos, para comparar as
proporções.
Nos estudos de caso-controle a busca é feita em sentido contrário, ou seja, o desfecho
é visto no presente, e a exposição é buscada no passado. Por exemplo, para cada
participante com doença cardíaca, busca-se outro participante, com características
demográficas similares, mas sem a doença. São assim formados dois grupos: o de
casos e o de controles. Depois, contam-se fumantes e não fumantes nos dois grupos e
comparam-se as proporções (Figura 6-4).
FIGURA 6-4 Comparação: coorte retrospectivo e caso-controle

Portanto, no estudo coorte retrospectivo, os grupos são formados pela exposição ou não
ao fator que se presume de risco e busca-se o número de doentes, em cada grupo. No
estudo caso-controle os grupos são formados por terem ou não a doença e busca-se o
número de expostos ao risco, em cada grupo.

6.4 O que é estudo transversal?


No estudo transversal (cross-sectional study), o pesquisador coleta uma amostra da
população e, simultaneamente, levanta dados de duas variáveis – o participante tem
ou não uma doença e foi ou não exposto ao fator que se presume de risco – para
estudar prevalências.

Os estudos transversais são rápidos, baratos, fáceis de serem conduzidos. São


também chamados de estudos de prevalência (prevalence studies), porque são feitos para
estimar prevalências. Não servem para estabelecer relação de causa e efeito, mesmo
que exista associação entre as variáveis – o fator eleito como causa e o presumível
desfecho. Em geral, as doenças são consequências de múltiplos fatores e de um
complexo de inter-relações (Figura 6-5).
FIGURA 6-5 Estudo transversal ou de prevalência

Ex e m plo 6 - 5
Foi feito um estudo transversal8 para investigar, em uma amostra aleatória de
13.779 trabalhadores suecos de ambos os sexos, a relação entre ambiente
psicossocial do trabalho e a prevalência de doença cardiovascular (DCV). Observou-
se que, no grupo que relatou pressão no trabalho, havia maior prevalência de
doenças cardiovasculares em comparação com o grupo que relatou não sentir essa
pressão. Devido à natureza do estudo, que foi transversal, não pode ser feita
inferência de causa e efeito.

8
Johnson JV, Hall EM. Job Strain, Work Place Social Support, and Cardiovascular Disease: A Cross-Sectional Study
of a Random Sample of the Swedish Working population. AJPH, 1988 Out.; 78(10):1336-42.

O Exemplo 6-5 apresenta um estudo transversal: os pesquisadores tomaram uma


grande amostra da população e contaram, na mesma ocasião: 1) o número de
participantes que relataram pressão no trabalho e ter DCV; 2) o número de participantes
que relataram pressão no trabalho e não ter DCV; 3) o número de participantes que
relataram não sentir pressão no trabalho e ter DCV; 4) o número o número de
participantes que relataram não sentir pressão no trabalho e não ter DCV. Depois, os
pesquisadores estabeleceram as prevalências e as compararam.
A escolha da amostra é particularmente difícil nos estudos transversais, porque a
probabilidade de a pessoa pertencer à amostra deve ser rigorosamente igual para
todas as pessoas amostradas. Por exemplo, um médico levanta dados em um hospital
para estudar a prevalência de doenças respiratórias e de doenças do aparelho
locomotor. Se a taxa de internação for muito mais alta para quem tem doença respiratória
do que para quem tem outras doenças, pode ocorrer associação estatística – não pelo
fato de uma doença acarretar a outra, mas por serem mais facilmente internadas
pessoas com doenças do aparelho locomotor que tenham, também, doenças
respiratórias. A associação estatística é explicada pelo fato de uma pessoa com
múltiplos problemas de saúde ter maior probabilidade de ser amostrada. É o que se
chama “falácia de Berkson”.9
6.5 O que é estudo de casos?
No estudo de casos, o pesquisador se propõe a apresentar uma situação ou uma
condição complexa, porém singular, em profundidade e no contexto da vida real.

Os estudos de caso (case studies) e as séries de casos (case series) têm longa tradição na
pesquisa clínica. O estudo de caso é a apresentação de um caso em todos os seus
aspectos. Os mais comuns são os que estudam uma pessoa (como os casos clínicos de
Freud), uma instituição (como um hospital), um programa (como o Bolsa Família) ou
um evento (a eleição do reitor de uma universidade).
A série de casos é um estudo descritivo de uma coleção de casos. Os resultados desses
estudos são úteis para gerar hipóteses para pesquisas mais complexas. Constitui
exemplo de série de casos um conjunto de pacientes submetidos ao mesmo
tratamento, dado que tiveram o mesmo diagnóstico ou um conjunto de faculdades que
estão desenvolvendo um mesmo projeto educacional. As séries de casos são diferentes
dos estudos coorte e dos estudos de caso-controle pelo fato de apresentarem
participantes com uma única característica, sem o grupo-controle e, muitas vezes, com
pequenas amostras.

Ex e m plo 6 - 6
Lesões na coluna cervical afetam grande parte de pessoas com artrite reumatoide,
mas estudos não indicam relação entre as queixas dos pacientes e o fato de haver ou
não lesão na cervical. Foi feito um estudo observacional10 com 100 pacientes com
essa doença; os pacientes responderam um questionário composto por sete itens e
foram submetidos a exames neurológicos e radiográficos. Não se constatou
correlação entre queixa e gravidade da lesão na coluna cervical.

10
Raczkiewicz A. et al. Atlanto-axial lesions in patients with rheumatoid arthritis – observational study.
Reumatologia 2010; 48, 5: 320-29.

Os estudos de casos devem tratar fenômenos originais ou singulares – e não ser


apenas entrevistas de algumas pessoas às quais o pesquisador tem acesso. No entanto,
o pesquisador11 pode descrever (estudos descritivos), explicar (estudos explicativos) ou
explorar (estudos exploratórios) o fenômeno.
Os estudos descritivos utilizam, geralmente, um ou mais exemplos para relatar com
detalhes como o fenômeno ocorre, ou seja, para produzir a imagem da situação
específica. Familiarizam o leitor com o assunto, fornecendo linguagem para discutir a
situação.

Ex e m plo 6 - 7
Foi conduzido um estudo de caso12 para descrever a tomada de decisão de estudantes
de enfermagem em situação clínica. Foi escolhido o estudo de caso, porque teria
sido impossível para o autor obter uma descrição correta da tomada de decisão de
estudantes de enfermagem sem considerar o contexto, isto é, a escola e, mais
especificamente, a situação clínica e o ambiente de sala de aula.

12
Baxter P, Jack S. Qualitative Case Study Methodology: Study Design and Implementation for Novice Researchers.
The Qualitative Report. Dez. 2008; 13(4): 544-59. Disponível em: http://www.nova.edu/ssss/QR/QR13-
4/baxter.pdf

Os estudos explicativos agregam informações de várias fontes, obtidos em tempos


diferentes. A ideia é apontar aspectos embutidos no fenômeno, revelando-os e
esclarecendo situações, expondo o que nem sempre se vê, quando se olha apenas um
caso.

Ex e m plo 6 - 8
Em um estudo explicativo,13 foram examinadas 158 publicações científicas de
autores brasileiros a fim de determinar o quanto obedeciam às diretrizes
internacionais e às normas nacionais para condução de pesquisas em seres
humanos. Os achados mostraram a necessidade de os trabalhos publicados mais
bem informarem a participação efetiva de cada autor, relatar a fase do projeto,
descrever o local da pesquisa, informar patrocínio e indicar o número total de
participantes no Resumo.

13
Pauli CC. Análise, à luz da Bioética, do perfil das publicações científicas de autores brasileiros, antes e após a
homologação das diretrizes éticas referentes à pesquisa clínica (Ensaios) no Brasil. [dissertação]. São Paulo, Centro
Universitário São Camilo, 2013.

Os estudos exploratórios são feitos para buscar conhecimento a respeito de um


assunto sobre o qual não existem teorias. É uma verdadeira caça às informações que
possam, eventualmente, trazer entendimento sobre um problema, para balizar novos
estudos e ajudar a formular hipóteses.

Ex e m plo 6 - 9
Para levantar os procedimentos que poderiam despertar o interesse dos
estudantes de um colégio para os computadores do laboratório da instituição,14 é
possível realizar um estudo exploratório para saber quais são as características e os
interesses dos usuários desse serviço. A questão é fornecer aos pesquisadores
informação que os ajude a formular hipóteses iniciais sobre o assunto.

14
Exploratory reserch and descriptive reserch-Lettyan. Disponível em:
http://lettyann.hubpages.com/hub/Exploratory-Research-and-Descriptive-Research. Acesso em 31 de outubro
de 2014.

Todo estudo de caso começa, necessariamente, com a definição do caso a ser


estudado. Há diferentes critérios para selecionar o caso; se este for selecionado não por
ser representativo de outros casos, mas por ser único, dizemos que é um caso
intrínseco.

Ex e m plo 6 - 1 0
Foi conduzido15 um estudo de caso intrínseco para estudar um casal de idosos com
demência, com a finalidade de entender o impacto da demência sobre a vida diária
deles e de seus parentes.

15
Hellström I, Nolan M, Lundh U.“We do things together”: A case study of couplehood’ in dementia. Dementia
2005; 4:7-22.

Se o caso for selecionado por ser “típico”, permitindo ao pesquisador estudar mais o
fenômeno do que o caso em si, dizemos que é um caso instrumental. Se forem
estudados vários casos, cuidadosamente selecionados, estamos diante de um caso
coletivo ou casos múltiplos.

Ex e m plo 6 - 1 1
Para melhor compreender as representações sobre ensino de estatística,16 foi
conduzido um estudo de caso instrumental, entrevistando professores de estatística
da Unicamp.

16
Wada RS. Estatística e ensino: um estudo sobre representações de professores do 3° grau. Campinas, FE/Unicamp,
1996. Tese de Doutorado. Orientador: Maria José Pereira Monteiro de Almeida.

Como em toda pesquisa, nos estudos de caso, é preciso formular as perguntas que
serão respondidas e apresentar, de início, a literatura de apoio. Entretanto, nos estudos
de caso, ainda é importante estabelecer, a princípio, limites de busca, tais como:
período de tempo coberto pelo estudo, lugar ou espaço geográfico em que serão feitas
as observações e evidências que serão coletadas.

6.6 Resumo
No estudo coorte, um grande grupo de pessoas (coorte) com características definidas é
observado para determinar a incidência de uma doença específica, mortalidade por
determinada causa ou outro tipo de desfecho clínico.
No estudo coorte prospectivo, um grande número de pessoas provenientes da mesma
população é classificado em dois grupos: um grupo de expostos a um fator que se
supõe de risco e o outro grupo de não expostos a esse fator. Os grupos são observados
durante longo tempo para verificar se a proporção de um dado desfecho é maior em
um dos grupos.
No estudo coorte retrospectivo, também chamado estudo coorte histórico, um grande
número de pessoas provenientes da mesma população é classificado em dois grupos:
um grupo de expostos a um fator que se supõe de risco e o outro grupo de não
expostos a esse fator. Depois, em arquivos ou por meio de questionários, busca-se a
proporção com a doença nos dois grupos de participantes.
No estudo de caso-controle um grupo de pessoas doentes (casos) e um grupo de
pessoas sadias (controles) são examinados e questionados para que o pesquisador
possa buscar, na diferença de seus históricos, os fatores que predispõem pessoas à
doença em estudo.
No estudo transversal, o pesquisador coleta uma amostra da população e,
simultaneamente, levanta dados de duas variáveis – tem ou não uma doença e foi ou
não exposto ao fator que se presume de risco – para estudar prevalências.
No estudo de casos, o pesquisador se propõe a apresentar uma situação ou uma
condição complexa, porém singular em profundidade e no contexto da vida real.

1
Writing Group for the Women’s Health Initiative I. Risks and benefits of estrogen plus progestin in healthy
postmenopausal women: principal results From the Women’s Health Initiative randomized controlled trial. JAMA
2002; 288(3):321-333.
2
Writing Group for the Women’s Health Initiative I. Op. cit.
9
Fleiss JL. Statistical methods for rates and proportions. Wiley, 1981.
11
Yin R. Case study research: design and methods. 2 a ed. Thousand Oaks, CA: Sage Publishing; 1994. In: Baxter, P.;
Jack, S. Qualitative case study methodology: study design and implementation for novice researchers. The Qualitative
Report. Dez. 2008; 13(4): 544-59.
C AP Í T U L O 7

Dados Primários e Dados Secundários


Variável é qualquer característica ou atributo que possa ter valores diferentes quando
se observam indivíduos distintos. Dado é o valor assumido pela variável quando se
examina um indivíduo. As variáveis e, por consequência, os dados podem ser
qualitativos e quantitativos. Para saber como tratar os dados, é preciso saber distinguir
os diferentes tipos de variáveis.1

FIGURA 7-1 Tipos de variáveis

Uma variável é qualitativa ou categorizada quando os dados são distribuídos em


categorias mutuamente exclusivas. São exemplos de variáveis qualitativas: sexo
(masculino ou feminino) e cidade de nascimento (se a pessoa nasceu em Niterói,
automaticamente exclui-se a possibilidade de ter nascido em outra cidade).
Uma variável é quantitativa ou numérica quando é expressa por números. São
exemplos de variáveis quantitativas: idade, estatura.
As variáveis qualitativas ou categorizadas são classificadas em dois tipos:
Nominal;
Ordinal.
A variável é nominal quando os dados são distribuídos em categorias mutuamente
exclusivas, mas são indicadas em qualquer ordem. São variáveis nominais: tipo de
sangue (O, A, B, AB) e um desfecho clínico (sim ou não).
A variável é ordinal quando os dados são distribuídos em categorias mutuamente
exclusivas que têm ordenação natural. São variáveis ordinais: gravidade de uma doença
(leve, moderada, severa) e alívio de um sintoma (muito, pouco, nada).
As variáveis quantitativas ou numéricas são classificadas em dois tipos:
Discreta;
Contínua.
A variável discreta somente pode assumir alguns valores em um dado intervalo. São
variáveis discretas: quantidade de filhos (nenhum, 1, 2, 3, 4 etc.) e batimentos cardíacos
por minuto.
A variável contínua assume qualquer valor em um dado intervalo. São variáveis
contínuas: medida do tamanho de tumor e pressão arterial.
Quando a variável resposta de um estudo clínico é contínua, o tamanho da amostra
pode ser bem menor.

7.1 O que são dados primários e o que são dados


secundários?
Dados primários (primary data) são aqueles levantados pelos próprios
pesquisadores que estão conduzindo a pesquisa, no decorrer da pesquisa.

Os pesquisadores que trabalham com dados primários têm a grande vantagem de


conseguir – pelo fato de, eles próprios, obterem os dados – informação com a
qualidade necessária para atender aos objetivos de seus estudos. No entanto, coletar
dados por meio de ensaio clínico ou estudo observacional tem custo alto e é
trabalhoso, como mostram os exemplos de pesquisa apresentados nos capítulos
anteriores.

Dados secundários (secondary data) são dados existentes, levantados por instituições
ou por outros pesquisadores, que não aqueles que estão conduzindo a pesquisa.

À primeira vista, pode parecer fácil fazer uma pesquisa com dados secundários,
porque o pesquisador usa dados coletados por outrem – logo, não despende tempo
nesse trabalho. No entanto, uma pesquisa com dados secundários requer esforço
substancial e um conjunto de habilidades distintas daquelas exigidas para a pesquisa
com dados primários. O pesquisador precisa entender como os dados foram coletados
para que possa bem interpretar cada valor registrado e discutir as limitações das
informações.
Há pesquisadores que analisam dados coletados e publicados por outros, para
examiná-los sob novo ponto de vista, e há pesquisadores que reanalisam dados que
eles próprios coletaram e já analisaram. Dados publicados podem ser reanalisados
sem que se peça permissão a quem os coletou – desde que os pesquisadores que os
reanalisam citem a fonte primária.
No Brasil,2 instituições governamentais coletam e publicam dados relativos à saúde
pública. Pesquisadores independentes podem utilizar esses indicadores como dados
secundários para novas pesquisas.

Ex e m plo 7 - 1
Para analisar mortalidade infantil,3 considerando o peso ao nascer, características
da mãe e tempo de gestação na cidade de Santa Maria/RS, foram coletadas
informações no Banco de Dados do Departamento de Informática do Sistema Único de
Saúde (DATASUS, Ministério da Saúde), com relação ao período decorrido entre 2000
a 2008. A análise mostrou maior prevalência de morte em crianças com peso ao
nascer entre e 500 e 999 g, filhos de mães com idade entre 15 e 24 anos e menos de 7
anos de escolaridade, tempo de gestação de 32 e 41 semanas e parto cesáreo.

3
Potrich T. et al. Mortalidade infantil segundo características da mãe e gestação na cidade de Santa Maria, RS. Enferm.
UFSM 2011 Set.-Dez.;1(3):343-50.

De qualquer modo, a escolha do tipo de dado – primário ou secundário, ou ambos –


depende da pesquisa que será feita. Logo, depende da pergunta que o pesquisador
quer responder, do que tem à disposição em termos de orçamento, da sua área de
atuação, da infraestrutura, do pessoal auxiliar etc. É preciso, então, elaborar o projeto
de pesquisa, pois uma pesquisa só pode ser feita com a permissão da instituição e
aprovação de um Comitê de Ética em Pesquisa.
É importante distinguir, aqui, dados de estatísticas. Dados são as informações
brutas, como foram coletadas. Dados já trabalhados são chamados de estatísticas. As
estatísticas são, portanto, o resultado de uma análise de dados. Por exemplo, quem
conta o número de crianças que estão no pátio de uma escola tem um dado. Se contar
quantos são meninos terá outro dado. Mas se calcular a proporção de meninos no
pátio, terá uma estatística.
Estatísticas oficiais são aquelas coletadas e publicadas por governos, órgãos e
agências governamentais e instituições internacionais que fazem a ligação entre elas.
Pelo menos em tese, as estatísticas oficiais seguem diretrizes internacionais. Aos
profissionais da área da saúde, interessam as seguintes estatísticas:
Registro de nascimentos, óbitos, casamentos, divórcios, morbidade;
Estatísticas de indústria que incluam registros de acidentes de trabalho e motivos
de faltas no trabalho;
Registros policiais de crimes, doenças na prisão, violência etc.
Produtos e serviços oferecidos pelo Sistema Único de Saúde, dados sobre a saúde
no país.
No Brasil, as estatísticas oficiais de interesse da área médica podem ser encontradas,
por exemplo, na Fundação Instituto Brasileiro de Geografia e Estatística (IBGE),4 no
Ministério da Saúde,5 na Fundação Osvaldo Cruz (Fiocruz),6 Sistema Único de Saúde
(SUS).7 As estatísticas oficiais são publicadas e podem ser utilizadas ou citadas sem a
necessidade de pedir permissão a uma autoridade.
Instituições particulares compilam estatísticas não oficiais, em princípio para uso
próprio, mas que, eventualmente, podem ser usadas por outros pesquisadores.
Exemplo de estatísticas não oficiais são as do Serviço de Arquivo Médico e Estatística
(SAME). Esse serviço é conhecido pelo papel de guardião dos prontuários dos
pacientes e de processador de estatísticas médicas, mas também tem importância para
a administração geral do hospital como empresa.8 Os dados desses arquivos têm
restrições para uso (p. ex., exigência de confidencialidade), que deve obedecer às
normas legais, mas podem ser analisados com a permissão da instituição e a aprovação
de um projeto por um Comitê de Ética em Pesquisa.
FIGURA 7-2 Tipos de dados

Finalmente, cabe lembrar aqui que a Resolução CNS n° 347 de 13 de janeiro de 20059
regulamenta pesquisas que envolvam armazenamento de materiais ou uso de
materiais armazenados em pesquisas anteriores. Note-se que esta Resolução se
restringe a materiais biológicos, e não a dados publicados.

7.2 O que é análise primária e o que é análise


secundária?
Análise primária (primary analysis) é a análise originalmente conduzida com os
dados do estudo. É o que, em geral, imagina-se como aplicação de estatística. Análise
secundária (secondary analysis) é a reanálise dos dados para responder às questões
originais com técnicas estatísticas melhores ou a novas questões com dados
antigos.10

10
Glass GV. Primary, Secondary, and Meta-Analysis of Research. Educational Researcher, 1976 Nov.; 5(10):3-8.

As análises primárias geralmente não exaurem toda a informação contida em um


conjunto de dados. As análises secundárias são, portanto, proveitosas, porque
mostram novas maneiras de “ver ” as informações. Por exemplo, um dentista pode
levantar informações adicionais sobre falta às aulas por problemas relacionados com a
saúde bucal em históricos escolares de alunos do curso fundamental, registrados pela
direção da escola apenas como faltas por “dor de dente”. Seria uma análise secundária.
Um médico pode organizar um roteiro e, no hospital, levantar dados dos prontuários
relativos a pacientes que ele não atendeu. Também seria uma análise secundária.
Muitas vezes, uma análise secundária aplicada a um conjunto de dados de boa
qualidade, mesmo que relativamente pequeno, pode responder a novas perguntas. No
caso de grandes coleções de dados de instituições oficiais, de coleta cara e trabalhosa e
que não podem ser obtidos por um único pesquisador, como é o Censo do Brasil,
sempre cabem análises secundárias.

7.3 O que é análise provisória?


Análise provisória (interim analysis) é a análise feita com os dados obtidos no
estudo, mas antes de seu término, para estudar eficácia e recomendar, com base nos
achados, as modificações necessárias.

A ANVISA denomina Relatório Provisório de Estudo Clínico (Análise Provisória)11 o


“relatório sobre os resultados provisórios e sua avaliação com base em análises
conduzidas durante o curso de um estudo”. No entanto, no Relatório do Estudo,12
pede informações da publicação dos dados parciais, no caso de dados já terem sido
disponibilizados para análise interina (aqui chamada de análise provisória) ou final.
Por que é feita a análise provisória? Durante um ensaio clínico,13 acumulam-se dados
que dão informação sobre a eficácia relativa das intervenções. Tais dados em geral não
são analisados antes de ser alcançado o tamanho proposto para a amostra. Este tipo de
projeto – de delineamento com tamanho fixo da amostra e análise de dados apenas no
final – tem a desvantagem, do ponto de vista da ética, de eventualmente incluir mais
pacientes que o necessário para um tratamento que, às vezes, já se mostrou menos
eficaz no decorrer do ensaio.
O projeto de um ensaio pode incluir uma análise provisória quando metade dos
pacientes da amostra tiver sido tratada; no entanto, dependendo da intervenção
experimental, pode incluir até mesmo 10 análises provisórias. Importante é saber que
o foco da análise provisória é eficácia e não segurança, que deve ser monitorada
durante todo o ensaio. Tais análises são, obrigatoriamente, planejadas com
antecedência e definidas no protocolo de pesquisa para apresentação nos relatórios
parciais. O analista deve ser cuidadoso para, na análise estatística, alcançar o poder
adequado e não aumentar o risco de cometer erro tipo I.

Relatório parcial é aquele apresentado durante a pesquisa, demonstrando fatos


relevantes e resultados parciais de seu desenvolvimento. Relatório final é aquele
apresentado após o encerramento da pesquisa, totalizando seus resultados.
Resolução n° 466/12, item II

A análise provisória permite verificar se é razoável terminar o ensaio mais cedo. O


término prematuro de um estudo pode ser justificado por diferentes razões, mas é
óbvio que um ensaio deve ser suspenso se houver evidência, comprovada por critério
estatístico, de que uma intervenção tem efeito muito acima ou muito abaixo de um
valor crítico ou, então, que um grupo de pacientes está sendo prejudicado.

Nas pesquisas na área da saúde, tão logo constatada a superioridade significativa


de uma intervenção sobre outra(s) comparativa(s), o pesquisador deverá avaliar a
necessidade de adequar ou suspender o estudo em curso, visando oferecer a todos
os benefícios do melhor regime.
Resolução n° 466/12, item V.4

A consequência de uma análise provisória não é, necessariamente, a suspensão


definitiva do ensaio. É possível solicitar uma modificação no projeto, a suspensão de
recrutamento de pacientes, o relato imediato dos resultados por meio de um relatório
parcial. Tais relatórios são tratados em resoluções que, contudo, não especificam os
critérios para o pesquisador fazer a modificação e para o sistema CEP/CONEP aceitar a
proposta.
O pesquisador responsável deverá:

1. Apresentar ao Comitê de Ética em Pesquisa – CEP o projeto de pesquisa


completo, nos termos da Resolução, 196/96 e desta Resolução.
2. Manter em arquivo, respeitando a confidenciabilidade e o sigilo, as fichas
correspondentes a cada sujeito incluído na pesquisa por 5 anos, após o término
da pesquisa.
3. Apresentar relatório detalhado sempre que solicitado ou estabelecido pelo CEP,
pela Comissão Nacional de Ética em Pesquisa (CONEP) ou pela Secretaria de
Vigilância Sanitária (SVS/MS).
4. Comunicar ao CEP a ocorrência de efeitos colaterais e ou de reações adversas
não esperadas.
5. Comunicar também propostas de eventuais modificações no projeto e ou
justificativa de interrupção, aguardando a apreciação do CEP, exceto em caso
urgente para salvaguardar a proteção dos sujeitos da pesquisa, devendo então
ser comunicado o CEP a posteriori, na primeira oportunidade.
6. Colocar à disposição do CEP, da CONEP e da SVS/MS toda informação
devidamente requerida.
7. Proceder à análise contínua dos resultados, à medida que prossegue a pesquisa,
com o objetivo de detectar o quanto antes os benefícios de um tratamento
sobre outro ou para evitar efeitos adversos em sujeitos de pesquisa.
Resolução n° 251/97, item III.2

Cabe ao Comitê de Ética em Pesquisa:

1. Emitir parecer consubstanciado apreciando o embasamento científico e a


adequação dos estudos das bases anteriores, inclusive pré-clínica, com ênfase
na segurança, toxicidade, reações e efeitos adversos, eficácia e resultados.
2. Aprovar a justificativa do uso de placebo e washout.
3. Solicitar ao pesquisador principal os relatórios parciais e final, estabelecendo os
prazos (no mínimo um relatório semestral) de acordo com as características da
pesquisa. Cópias dos relatórios devem ser enviadas à SVS/MS.
Resolução n° 251/97, item V.1
De qualquer modo, as questões de estatística14 são apenas parte da avaliação de um
ensaio clínico randomizado, que envolve gestão, administração de intervenções,
avaliação de segurança e eficácia. As comissões de segurança e monitoramento de
dados, obrigatórias em alguns países, recomendam muitas vezes análise provisória
dos dados em algum ponto dos ensaios; e, com base nessas análises, podem até
suspender a pesquisa. Essa inspeção (repetida) dos dados é bem conhecida, embora
sua relevância seja muitas vezes colocada em debate.

7.4 O que é delineamento adaptável?


Delineamento adaptável (adaptative design) para ensaio clínico é o modelo de
intervenção que permite, no decorrer do ensaio, fazer modificação no delineamento
usando resultados obtidos e acumulados do próprio ensaio.15

15
Chow SC, Chang M. Adaptive design methods in clinical trials – a review. Orphanet J Rare Dis. 2008 Maio 2;3:11.

Os delineamentos adaptáveis16 de ensaios clínicos estão sendo progressivamente


adotados em diversas áreas de pesquisa médica, mas exigem monitoramento especial,
com regulamentação apropriada. As adaptações mais comumente usadas nos ensaios
clínicos randomizados são: suspensão precoce do ensaio possivelmente com follow-up
adicional, desde que se possa concluir, com base em testes estatísticos, superioridade,
não inferioridade ou futilidade de tratamento; modificação do procedimento de
randomização devido à identificação de fatores de prognósticos antes não percebidos;
ajustes nas doses das drogas em experimentação ou inserção de braços com novas
drogas em teste, com comprovação estatística de necessidade; retirada de braços ou
alocação de pacientes em braços com melhor resposta ou modificação do desfecho
procurado do ensaio. Além das adaptações feitas com base nos resultados obtidos nas
análises provisórias do próprio ensaio, também se fazem adaptações com base na
estatística bayesiana.

FIGURA 7-3 Tipos de delineamentos adaptáveis

7.5 Dados publicados são sempre confiáveis?


A confiança que se pode depositar em dados que foram publicados ou não depende,
basicamente, da idoneidade da fonte. Os dados devem ser verdadeiros, genuínos. Se a
fonte for desconhecida, convém conferir. Ainda, é razoável desconfiar de dados que
estejam extremamente “de acordo com a teoria”, como genes que segregam
exatamente na proporção de 3:1, taxas de crescimento constantes de 10% ao mês etc.
Há muito tempo, Fisher,17 um estatístico que se tornou famoso graças a seus trabalhos
na área de estatística experimental, cunhou, para esse tipo de dados, a expressão “bom
demais para ser verdadeiro”. Portanto, os dados não devem ter “excesso de coerência”.
É razoável levantar dúvidas sobre a qualidade de dados de ensaios que relatam
verdadeiros milagres como uma melhoria da ordem de 70% ou de ensaios em que
todos os pacientes que receberam a intervenção foram curados enquanto todos os
pacientes que não receberam a intervenção não apresentaram nenhum tipo de reação.
Um produto que já foi vendido no Brasil como capaz de prevenir a cárie, mas depois
retirado do comércio, acusado de não ter sido submetido à experimentação adequada,
relatava estatísticas presumivelmente obtidas com crianças e informava que a
porcentagem de redução de cárie conseguida em 6 meses havia sido de 80%, um
número alto demais para ser verdadeiro.
É particularmente importante observar números e proporções. Como as proporções
dão a importância relativa das categorias, elas expressam, mais que os números, a
extensão dos sucessos ou dos problemas. No entanto, porcentagens devem ser
calculadas para grandes amostras – de preferência aquelas que têm mais de 100
participantes. Dependendo do contexto e, principalmente, quando o número de
indivíduos na amostra é pequeno, as porcentagens dão impressão falsa. Por exemplo,
não tem sentido alardear um percentual de 67% de cura, se esse valor foi calculado
sobre um total de três pacientes.
É preciso verificar se a aritmética faz sentido. Um trabalho18 que foi aceito para
publicação no Journal of Experimental Medicine, mas depois acusado de conter dados
falsos, relatava um experimento com ratos e apresentava a porcentagem de sucessos
devido ao uso de uma droga. Havia seis grupos em comparação, cada grupo com 20
ratos. Embora qualquer porcentagem calculada sobre um total de 20 seja
necessariamente um múltiplo de 5, estavam registradas as porcentagens 53, 58, 63, 46,
48 e 67. É preciso, também, estar alerta para a possibilidade de fraude e de fabricação
de dados, isto é, apresentação de dados que nunca foram coletados, e para a
apresentação de estatísticas erradas ou falsas. Uma revisão2 de casos comprovados e
documentados de fraude em ciência, feita nos Estados Unidos, mostrou que a fraude
em ciência envolve, principalmente, a falsificação (as informações são
deliberadamente alteradas) e a fabricação de dados (não se tem a informação, mas se
inventa). O plágio (cópia de trabalhos de outrem), que também é uma fraude, é mais
raro.
Um caso comentado de falsificação de dados2 ocorreu em 1996. Amitov Hajra, um
candidato ao doutorado, submeteu um trabalho seu em coautoria com seu orientador,
Francis Collins, à revista Oncogenese. Um revisor percebeu que os dados eram falsos e
avisou Collins, que despendeu 2 semanas verificando o que havia sido feito. Constatou
que, além do trabalho submetido à publicação, outros cinco, publicados
anteriormente, continham falsificações. Collins retratou dois e corrigiu três. Hajra foi
expulso do curso de doutorado e teve impedido seu direito de receber verbas federais
para pesquisa.

7.6 Quais erros são mais comuns?


Os padrões de referência aceitáveis em ciência estão melhorando, porque a
compreensão do método científico melhorou. Revistas científicas estão se tornando
cada vez mais rigorosas na avaliação de trabalhos de pesquisa. Isto é bom, porque os
pesquisadores têm a responsabilidade de conhecer os métodos de pesquisa, conduzir
suas pesquisas da melhor maneira possível e publicar os resultados de forma honesta
e imparcial. No entanto, erros acontecem. São descritos aqui alguns dos erros mais
comuns.

7.6.1 O que é erro de medida?


Para estabelecer a exatidão (accuracy) ou viés (bias) de um sistema de medição de
variáveis numéricas, é preciso obter diversas medidas de determinado item usando o
sistema de medição em teste. Tira-se a média das medidas feitas e compara-se essa
média ( ) com o valor real (VR).

Viés é a diferença entre o valor real (VR) de determinado item e a média das
medidas ( ) tomadas nesse item, usando o sistema de medição em teste.

Precisão do sistema de medição (gauge precision) é diferente de exatidão (gauge


accuracy). Enquanto exatidão mede a “distância” entre a média das medidas e o valor
verdadeiro, precisão mede “espalhamento”, ou seja, mede a variabilidade dos erros de
medição em torno da média (Figura 7-4). Para todo novo dispositivo médico proposto,
são feitas muitas medições e estabelecidas exatidão e precisão.

FIGURA 7-4 Exatidão e precisão


Ex e m plo 7 - 2
Foi conduzido19 um estudo para estabelecer a precisão e a exatidão do sistema
NBM-200 (um hemoglobinômetro), que faz medidas não invasivas de hemoglobina
(HB). Nesse estudo, medidas consecutivas de HB, obtidas pelo sistema NBM-200,
foram comparadas com valores de hemoglobina obtidos no sangue venoso.

19
A Trial to Evaluate the Precision and Accuracy of the NBM-200 Series When Used in a Continuous Prospective
Mode. ClinicalTrials.gov. Disponível em: www.clinicaltrials.gov/ct2/show/NCT01917487. Acesso em 4 de
novembro de 2014.

O instrumental utilizado em pesquisas clínicas precisa ser identificado, ter as


condições adequadas de um bom sistema de medição, estar calibrado quando for o
caso. Isso tudo deve ser verificado antes de ser proposto um projeto de pesquisa.20
Erros de medida não podem ser atribuídos apenas aos instrumentos de medição
(repetibilidade), mas também aos examinadores (reprodutibilidade).21 Em geral,
relatos de pesquisa dizem, em uma única frase: “os examinadores foram calibrados”.
Não é especificado o método de treinamento, os padrões de desempenho e a
frequência de reavaliação pelo método de teste e reteste.22 Se o projeto de pesquisa for
de longo prazo, com duração de meses ou anos, é fundamental ter examinadores
periodicamente recalibrados.

7.6.2 O que é erro de delineamento?


Erro de delineamento significa que o procedimento para a seleção dos participantes
de pesquisa ou o processo usado para designá-los aos diferentes braços do ensaio
não obedecem aos critérios estabelecidos para a condução de estudos clínicos.

O erro de delineamento ocorre devido à falha ao especificar os critérios de inclusão e


exclusão e, no caso de ensaios clínicos, também ao método de designar participantes
aos diferentes braços do estudo.23 Independentemente do objetivo da pesquisa, as
conclusões somente podem ser estendidas para a população configurada pelos
critérios de elegibilidade. No entanto, muitos trabalhos de pesquisa omitem
especificações sobre os participantes, ou seja, não trazem a completa descrição de
critérios de elegibilidade. Se não houver essa descrição, a validade externa fica
comprometida, e a aplicação de testes estatísticos é questionável, porque não se sabe
para qual população a inferência pode ser feita. A validade interna dos ensaios clínicos
depende de ter ocorrido randomização para evitar o confundimento; fazer cegamento
para evitar viés; organizar blocos ou estratos quando os participantes da pesquisa não
forem similares em relação à variável resposta.

7.6.3 O que é erro de tamanho da amostra?


O tamanho da amostra deve ser calculado antes do início dos trabalhos por
critérios estatísticos, tendo estabelecidos a priori o nível de significância e o poder
de teste, para que as conclusões do estudo possam ser generalizadas para a
população de onde a amostra proveio.

Muitas vezes, o tamanho da amostra é decidido arbitrariamente, levando em


consideração somente o tempo e o dinheiro disponíveis ou, até mesmo, apenas a
conveniência do pesquisador. Essa falta de critério geralmente conduz a amostras
pequenas, que significam análise estatística com alta probabilidade de erro tipo II.
Para evitar esse tipo de erro, é importante calcular, antes do início da pesquisa, o
número de participantes necessários para obter poder de teste adequado, com o nível
de significância desejado. Existem programas para computador que, com algumas
informações dadas pelo pesquisador, fornecem o tamanho da amostra. Essas
informações exigem compreender a natureza da variável, isto é, ter uma estimativa
razoável do efeito da intervenção e uma medida da variabilidade dos dados. Não
calcular o tamanho da amostra e usar uma amostra pequena pode ser tentador, mas a
pesquisa acaba sendo perda de tempo e de dinheiro, porque é inconclusiva.24

7.6.4 O que é erro de falta de resposta?


Erro de falta de resposta (missing data) ocorre em entrevistas, quando alguns
entrevistados não sabem ou se recusam a responder determinadas questões. Nos
estudos clínicos, também ocorre falta de resposta por perda de participantes
(dropouts).

Se a perda de participantes for alta, o trabalho fica prejudicado. Aliás, a qualidade


de uma pesquisa é medida, também, pela taxa de dados faltantes. Assim, deve sempre
haver um plano para reter os participantes do estudo. Nas entrevistas, se o número de
respondentes que se recusa ou que não sabe responder determinadas questões for
alto, e se suas características forem diferentes daqueles que respondem, os resultados
do estudo são falhos. A gravidade do erro de falta de resposta depende da extensão em
que os que respondem são diferentes dos que não respondem.

Ex e m plo 7 - 3
Para saber se o risco de doença periodontal é maior na presença de tabagismo e
de estresse,25 foram levantadas as condições de saúde oral de militares na ativa da
Polícia Militar, por meio de exame odontológico. Os hábitos de fumar e os sintomas
de estresse foram levantados por meio de questionários autoaplicados. A amostra
era constituída de 190 militares homens. A taxa de respostas para o questionário
sobre hábitos de fumar foi de 100%; e, para o questionário sobre estresse, foi de
73%. Na avaliação dos sintomas de estresse, as questões relativas à sexualidade
foram menos respondidas.
É possível que as questões relativas aos hábitos de fumar fossem de mais fácil
entendimento, mas parece muito mais provável que tenha havido certo
constrangimento, por parte de militares homens, com relação às perguntas que
levantavam disfunções sexuais, que seriam indicativas de estresse. Existe explicação
para esse fato: o questionário foi aplicado em uma instituição militar, por um
superior hierárquico (capitão) do sexo feminino. Parece razoável considerar que o
preconceito e o medo de se expor tenham reduzido o número de respostas para
perguntas vinculadas à sexualidade.

25
Cruz CMN. Estresse e fumo como fatores de risco para a doença periodontal. Tese de mestrado. Campinas,
Unicastelo, 2000.

7.7 Devem ser usados dados obtidos de forma não ética?


O questionamento se refere à reutilização de dados já existentes, obtidos de forma não
ética. A tomada de posição, aqui, é sujeita a controvérsias. De qualquer modo, é
preciso considerar a qualidade dos dados. Existem duas possibilidades: a primeira
seria a de que os dados, embora obtidos de forma não ética, contêm informação
relevante, e a segunda seria a de que os dados não trazem informação nova.
Se os dados trazem informação relevante, devem não apenas ser citados, mas
também analisados de todas as maneiras possíveis. Não se deve censurar a informação
científica que os dados contêm. No entanto, a falta de ética deve ser relatada e
condenada no mesmo artigo que contém a nova análise dos dados. Por outro lado, se
os dados, além de obtidos de forma não ética, não tiverem qualidade do ponto de vista
metodológico, somente deveriam ser citados para serem criticados em textos que
tratam de ética – mas nunca para serem utilizados em análises ou revisões. Isto não é,
porém, o que está na Declaração de Helsinque, documento promulgado em 2013 pela
Associação Médica Mundial (World Medical Association – WMA), em que se lê:

Pesquisadores, autores, patrocinadores e editores têm, todos, obrigações éticas


com relação à publicação e divulgação dos resultados de pesquisa. Pesquisadores
têm o dever de disponibilizar para o público os resultados de sua pesquisa em seres
humanos e são responsáveis pela integridade e precisão dos seus relatórios. Todas
as partes devem aderir às diretrizes aceitas para comunicação ética. Resultados
negativos e inconclusivos, bem como positivos, devem ser publicados ou
disponibilizados ao público. As fontes de financiamento, afiliações institucionais e
conflitos de interesse devem ser declarados na publicação. Relatórios de pesquisa
que não estão em conformidade com os princípios da presente Declaração não
devem ser aceitos para publicação.

É importante notar que, nessa diretriz, está explicitamente recomendada a


publicação de resultados negativos e inconclusivos. A nomenclatura resultados
negativos, embora usada, é dúbia, mas geralmente significa apenas que não se
registrou diferença entre braços do ensaio ou, mais especificamente, não se detectou
diferença significante entre grupos. O termo inconclusivo é menos claro, mas aponta a
necessidade de novos ensaios.

7.8 Resumo
Variável é qualquer característica ou atributo que possa ter valores diferentes ao
observar diferentes indivíduos.
Dado é o valor assumido pela variável quando se examina um indivíduo.
Dados primários (primary data) são aqueles levantados pelos próprios pesquisadores
que estão conduzindo a pesquisa, no decorrer da pesquisa.
Dados secundários (secondary data) são dados existentes, levantados por instituições
ou por outros pesquisadores que não aqueles que estão conduzindo a pesquisa.
Análise primária (primary analysis) é originalmente conduzida com os dados do
estudo. É o que, em geral, imagina-se como aplicação de estatística.
Análise secundária (secondary analysis) é a reanálise dos dados para responder às
questões originais com técnicas estatísticas melhores ou responder a novas questões
com dados antigos.
Análise provisória (interim analysis) é feita com os dados obtidos no estudo, mas
antes de seu término, para estudar eficácia e recomendar, com base nos achados, as
modificações necessárias.
Delineamento adaptável utiliza resultados obtidos nas análises provisórias do próprio
ensaio para modificar o delineamento da pesquisa.
Viés é a diferença entre o valor real (VR) de determinado item e a média das medidas
( ) tomadas nesse item, usando o sistema de medição em teste.
Precisão refere-se à variabilidade inerente ao sistema de medição.
Erro de delineamento refere-se à maneira de selecionar participantes para a pesquisa e
à maneira de designá-los aos diferentes braços.
O tamanho da amostra deve ser calculado antes do início dos trabalhos, para que as
conclusões do estudo possam ser generalizadas para a população de onde a amostra
proveio.
Erro de falta de resposta (missing data) ocorre em entrevistas, quando alguns
entrevistados se recusam a responder determinadas questões. Nos estudos clínicos,
ocorre falta de resposta por perda de participantes.

1
Para ler sobre o assunto: Vieira S. Bioestatística: tópicos avançados. 3ª ed. Rio de Janeiro, Elsevier.
2
Mello Jorge MHP, Gotlieb SLD, Laurenti R. Indicadores básicos de saúde no Brasil: conceitos e aplicações. Brasília,
Organização Pan-Americana da Saúde, 2001.
4
www.ibge.gov.br
5
http://datasus.saude.gov.br/
6
www.fiocruz.br
7
http://www2.datasus.gov.br/DATASUS/
8
Alvarez LEA. Sistemas de informação hospitalar: a importância do serviço de arquivo médico e estatística. Dissertação.
Fiocruz, 2004.
9
Resolução CNS no 347. Ver: conselho.saude.gov.br/resolucoes/2005/reso347.doc
11
Boas Práticas Clínicas: Documento das Américas – ANVISA. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/boaspraticas_americas.pdf
12
Relatório do estudo – Notificação – Anvisa. Disponível em:
www.anvisa.gov.br/medicamentos/pesquisa/1.7_%20instrucoes.doc. Acesso em 4 de novembro de 2014.
13
Lewis RJ. An introduction to the use of interim data analyses in clinical trials. Ann. Emerg. Med. 1993 Sep.; 22
(9):1463-9.
14
Armitage, P. interim analysis in clinical trials. statistics in medicine. vol. 10, issue 6, p. 925-937, 1991.
16
Berry DA. Adaptive Clinical Trials: The Promise and the Caution. Journal of Clinical Oncology. February 20, 2011,
vol. 29, n. 6. p. 606-609.
17
Fisher RA. Has Mendel’s work been rediscovered? Annals of Science (1)1936:115-37.
18
Moore DS. Statistics: Concepts and Controversies. San Francisco, Freeman, 1979. p. 115.
20
Ver: Inciso IV do Art. 3°, Decreto n° 79.094, de 5 de janeiro de 1997.
21
Vieira S. Estatística para a qualidade. Rio de Janeiro, Elsevier, 3ª ed. 2014.
22
Vieira S. Como elaborar questionários. São Paulo, Atlas, 5ª ed. 2009.
23
Clark GT, Mulligan R. Fifteen common mistakes encountered in clinical research. J Prosthodontic Res 55 (2011) 1-6.
Disponível em: www.sciencedirect.com
24
Nayak BK. Understanding the relevance of sample size calculation. Indian J Ophthalmol. 2010 Nov.-Dez.; 58(6): 469-
470.
C AP Í T U L O 8

Revisão da Literatura
Os estudos clínicos são conduzidos com amostras retiradas de populações
específicas, muito menores que aquelas sobre as quais se quer tirar conclusões. Por
exemplo, na maioria das vezes os participantes de pesquisa proveem de um único
hospital, de uma só comunidade ou da população de determinada área da cidade. Por
meio de inferência estatística, generalizam-se os achados dos estudos feitos nesses
locais para outras populações (p. ex., para todos os pacientes com as características
daqueles incluídos no estudo e não apenas para aqueles atendidos no hospital em que
a pesquisa foi feita).
Mas para fazer inferência estatística, é preciso saber também que a história natural
de uma doença descrita em determinado local pode diferir de maneira imprevisível da
história dessa mesma doença descrita em outro local, devido às diferenças de
ambiente, de características culturais e demográficas e da constituição genética da
população. As amplitudes normais de parâmetros clínicos de interesse, isto é, os
limites dentro dos quais cai a maioria da população, podem diferir de etnia para etnia,
de um grupo de idade para outro, de um sexo para outro, de uma condição social para
outra.
Na generalização das informações obtidas por meio de ensaios clínicos, é preciso
ainda mais cuidado. Os ensaios são feitos para responder uma pergunta em condições
específicas e limitadas. Logo, as informações obtidas em ensaios clínicos só podem ser
generalizadas considerando as condições em que esses ensaios foram conduzidos. Por
essa razão, estudos com medicamentos, por exemplo, são multicêntricos ou
multinacionais, isto é, são conduzidos ao mesmo tempo em diversos centros de
pesquisa, localizados em regiões ou países diferentes, para ampliar a variabilidade dos
participantes.
E existem outros problemas. Há publicações com conclusões tendenciosas, mas
mesmo estudos clínicos honestos podem chegar a resultados conflitantes. As
diferenças nos resultados podem surgir por erros de delineamento, por viés nas
medições, por puro acaso. No entanto, quem lê dois trabalhos com resultados
divergentes pode não saber qual deles deve ser usado como base para a prática clínica
ou para a tomada de decisão. O que pode ser feito? Profissionais da área da saúde
precisam ter às mãos boas revisões da literatura.

8.1 O que é revisão sistemática da literatura?


Revisão sistemática da literatura (systematic review) é uma síntese de vários estudos,
feita para apresentar o melhor conhecimento disponível sobre um tema específico,
com definição clara dos critérios de inclusão dos trabalhos.1
1
Sackett DL. et al. Evidence based medicine: what it is and what it isn’t. BMJ 1996 Jan. 13; 312(7023):71-2.

A revisão da literatura deve transmitir ao leitor o avanço de conhecimentos,


conseguido por meio de pesquisa relevante. Novos conhecimentos muitas vezes
invalidam formas antes aceitas de diagnóstico e substituem intervenções antigas por
outras, mais poderosas, mais precisas, mais eficazes e mais seguras.2 Uma revisão da
literatura deve, ainda, apontar controvérsias e mostrar onde falta conhecimento.3 Isso
significa que, para fazer uma revisão sistemática da literatura, é preciso relatar não
apenas os trabalhos que mostram ao leitor o “estado da arte” no momento, mas
também um breve histórico que lembre ao leitor os primórdios do assunto tratado e as
possíveis controvérsias.
No Brasil, candidatos ao título de mestre muitas vezes apresentam uma revisão da
literatura como dissertação. Isso não está errado: o que está errado é achar que esse
trabalho é fácil. Uma boa revisão da literatura exige muita leitura, boa redação e,
sobretudo, bom conhecimento na área específica do tema, além de competência para
discutir e criticar – técnicas que alunos que fazem seu primeiro trabalho ainda não
adquiriram. De qualquer maneira, é preciso deixar claro que revisão não é simples
compilação, mesmo que organizada, de resumos de artigos.
As revisões da literatura apresentadas em revistas especializadas devem ser
encomendadas pelos editores dessas revistas para profissionais de reconhecida
competência, que obedecerão as normas internacionais que determinam seguir um
roteiro.4 Logo, uma revisão sistemática da literatura deve explicitar os critérios
adotados para inclusão de trabalhos, já de início.

8.2 Como são escolhidos os trabalhos que devem ser


revistos?
As revisões bibliográficas tradicionais apresentadas no Brasil incluem, em geral,
artigos publicados em revistas internacionais conhecidas; artigos publicados em
revistas nacionais da área; trabalhos apresentados em congressos nacionais que
publicam anais ou nos quais o autor da revisão esteve presente; referências a livros da
área e referências a teses e dissertações de autores da instituição onde o autor trabalha
ou fez a revisão.

A busca de informação para uma revisão bibliográfica é feita em bases de dados


on-line, em revistas especializadas, em bancos de teses, por comunicação pessoal.

A inclusão de teses e dissertações e, mais raramente, de manuscritos não publicados


pode aumentar a probabilidade de surgirem resultados que não estão de acordo com
as ideias prevalentes sobre o assunto. Isso porque existe certa tendência, por parte dos
editores, de publicarem somente resultados estatisticamente significantes e que não
contradigam o conhecimento estabelecido. No entanto, também é preciso estar alerta
para o fato de o status da publicação refletir diferenças reais na qualidade
metodológica, que podem ter produzido as diferenças nos resultados encontrados. No
Brasil, os periódicos científicos são classificados pela CAPES5 (Coordenação de
Aperfeiçoamento de Pessoal de Nível Superior) em estratos indicativos de qualidade:
A1, o mais elevado; A2; B1; B2; B3; B4; B5 e C, com peso zero.
Os artigos para revisão são localizados usando descritores,6 sinônimos e variações
ortográficas. O portal de pesquisa da Biblioteca Virtual da Saúde7 (BVS) usa
Descritores em Ciências da Saúde (DeCS) para descrever os artigos científicos
indexados nas bases de dados LILACS e MEDLINE. Alguns autores, no entanto,
empregam descritores que não constam do catálogo.8 Contudo, os bibliotecários estão
capacitados para dar ajuda e informação técnica. De qualquer modo, um problema
permanece: para fazer uma revisão da literatura, ainda há autores que selecionam os
trabalhos que lhes parecem mais importantes, sem explicitar os critérios de seleção.
Se houver este viés, as revisões ficam incompletas e seletivas em relação aos dados
que referenciam. E há autores de revisões que são francamente opiniáticos e não
referenciam artigos de desafetos ou de outros grupos de pesquisa, que não o deles
próprios. Por essas razões, os estatísticos consideram hoje que a revisão de literatura,
tal como feita tradicionalmente, não dá fundamentação sólida para a tomada de
decisão. Na opinião de um dos autores9 que escreveu sobre o assunto, os principais
problemas na revisão tradicional da literatura são:
Inclusão seletiva de trabalhos, baseada na visão de qualidade do revisor que, em
geral, não especifica os próprios critérios;
Ponderação subjetiva dos trabalhos na discussão;
Falta de exame das características dos estudos que poderiam, eventualmente,
explicar resultados consistentes ou discrepantes;
Falha no exame de variáveis intervenientes.

8.3 Como se julga a qualidade de um estudo clínico?


Para avaliar um estudo clínico, não bastam conhecimentos na área. É importante que o
trabalho seja avaliado à luz de conhecimentos de metodologia científica e de
estatística. É verdade que a estatística está se tornando cada vez mais complexa e não é
possível, para um profissional da área de saúde, dominar todo o conhecimento da sua
área de trabalho, acrescido de conhecimentos avançados de estatística.
No entanto, existem folhas de verificação (checklist) que indicam o que pode ser
julgado, em termos de planejamento e da condução de estudos clínicos. Essas folhas
de verificação, feitas pelas equipes de editoração das revistas especializadas, estão
disponíveis para revisores. Com base em várias dessas folhas, muitas delas disponíveis
on-line, foi construída a folha de verificação apresentada aqui, que não é exaustiva, mas
pode ajudar.
1. O projeto foi aprovado pelo(s) Comitê(s) de Ética em Pesquisa onde o estudo foi
realizado?
2. O objetivo do estudo está escrito de forma clara e compreensível?
3. A revisão da literatura dá suporte ao objetivo proposto?
4. O método do estudo está bem descrito?
5. O método proposto para conduzir o estudo é adequado para alcançar o objetivo?
6. Há descrição do local onde os participantes foram recrutados e a maneira como isso
foi feito?
7. Os critérios de inclusão e exclusão estão suficientemente descritos?
8. Foi dado o critério para a escolha do tamanho da amostra?
9. É dado o tempo de estudo e de seguimento dos participantes?
10. Os grupos em comparação são equivalentes?
11. Foram apresentados dados coletados na linha de base?
12. Está claramente explicada a forma de medir a variável resposta?
13. A taxa de respostas foi adequada?
14. Os procedimentos de estatística estão suficientemente descritos?
15. A estatística é apropriada?
16. As conclusões estão de acordo com os resultados da análise estatística?
17. Os objetivos foram alcançados?
No caso de ensaios clínicos, acrescentar as questões:
1. As intervenções feitas estão bem descritas?
2. Foi feita randomização?
3. A técnica de randomização está descrita?
4. Os fatores de prognóstico foram considerados na randomização?
5. O ensaio tem algum tipo de cegamento?
6. São dadas as situações que determinariam a suspensão do ensaio?
7. O ensaio pode ser repetido?
É especialmente importante que profissionais da área específica em que a pesquisa
se enquadra discutam a variável resposta, que deve ser definida de maneira
operacional. Nos casos em que a forma de medir estiver internacionalmente
consagrada (como é o caso do uso da balança para medir massa), não é necessário dar
muitas explicações, mas se a maneira de medir a variável for discutível ou estiver em
plena discussão (como acontece com expressões de dor), é essencial explicar como
foram feitas as medidas. As conclusões do ensaio são válidas levando em conta o
modo como foi medida a variável resposta.
E será que a variável resposta fornece, realmente, informação sobre o que está em
estudo? Algumas vezes, a medida feita não mede exatamente o que o pesquisador
quer analisar. Por exemplo, até que ponto batimentos acelerados do coração e
transpiração palmar medem ansiedade? Se o pesquisador mediu transpiração palmar,
as conclusões são válidas para essa variável, que pode ser usada como indicador de
ansiedade, mas nunca uma “medida” de ansiedade.
É claro que estudos que propõem formas de medir uma variável ou que comparam
diversas formas de medir a mesma variável devem permanecer válidos quando
aplicados a outras populações. Mais especificamente, dois métodos diferentes de
medir uma mesma variável que se revelarem similares em determinado local (p. ex.,
São Paulo) provavelmente darão resultados similares em outros locais (p. ex., Manaus).
Também é importante descrever as intervenções com precisão. Por exemplo, a
informação “exercícios físicos regulares” é imprecisa: não especifica que tipo de
exercício, regularidade etc.; e é possível que os experimentos padeçam de falta de
realismo. É claro que experimentos sobre comportamentos feitos com ratos de
laboratório ou macacos Rhesus são indicadores do que pode acontecer com pessoas e,
certamente, dão a direção das hipóteses; no entanto, para saber o que acontece com
seres humanos, é preciso fazer o experimento com seres humanos. Contudo, alguns
experimentos feitos com pessoas também são artificiais.

Ex e m plo 8 - 1
Em 1971, o psicólogo Philip Zimbardo et al., resolveram conduzir um experimento
para analisar o impacto que uma pessoa sofre ao se tornar um prisioneiro ou guarda
prisional.10 Os pesquisadores então construíram uma falsa prisão no porão do
prédio de psicologia da Universidade de Stanford. Selecionaram 24 alunos de
graduação para os papéis de prisioneiros ou de guardas. Os papéis foram
distribuídos aleatoriamente. Os participantes não tinham antecedentes criminais,
não tinham problemas de saúde física ou mental. Os “prisioneiros” ficaram
confinados 24 horas por dia, em celas pequenas, em grupos de três. Os “guardas”
trabalhavam em equipes de três, com turnos de 8 horas e, depois de cada turno,
eram autorizados a voltar para suas casas até o próximo turno. Os pesquisadores
observaram o comportamento dos “prisioneiros” e “guardas” utilizando câmeras e
microfones escondidos.
O Experimento da Prisão de Stanford deveria durar 14 dias, mas foi interrompido
depois de apenas 6 dias, devido ao que estava acontecendo com os alunos
participantes. Os “guardas” se tornaram abusivos, e os “prisioneiros” começaram a
mostrar sinais de estresse e ansiedade extrema.
De acordo com Zimbardo et al., o Experimento da Prisão de Stanford demonstra o
papel poderoso que a situação pode ter no comportamento humano. Como os
“guardas” foram colocados em posição de poder, começaram a se comportar de
maneira que normalmente não atuariam em suas vidas cotidianas ou em outras
situações. Os “prisioneiros”, colocados em uma situação sem nenhum controle real,
tornaram-se passivos e deprimidos. O Experimento da Prisão de Stanford é
frequentemente citado como um exemplo de pesquisa antiética. De qualquer modo,
é artificial, porque os “prisioneiros” puderam se revoltar e depois sair; no entanto,
na vida real, a revolta de presos na maioria das vezes desencadeia métodos
hediondos de contenção.

10
Cherry K. The Stanford Prison Experiment. Disponível em:
http://psychology.about.com/od/classicpsychologystudies/a/stanford-prison-experiment.htm. Acesso em 18 de
agosto de 2014.

8.4 O que é metanálise?


Metanálise (meta-analysis) significa “análise das análises”. É uma técnica de revisão da
literatura que sintetiza, de maneira objetiva, os achados de vários trabalhos clínicos de
qualidade.11 Para fazer uma metanálise, é preciso, primeiramente, levantar os trabalhos
relevantes sobre o assunto que se quer analisar. Alguns analistas adotam o critério de
pedir, a todo primeiro autor de bons trabalhos na área, quaisquer outros trabalhos que
tenha escrito, mesmo que não tenham sido publicados. A ideia é a de que a inclusão de
trabalhos não publicados possa reduzir o potencial de viés, devido à preferência dos
editores por significância estatística.
Reunidos os artigos, passa-se ao segundo passo, que é a avaliação da qualidade. Essa
avaliação deve ser feita por pelo menos dois pesquisadores independentes, usando
folhas de verificação previamente organizadas. Os estudos não podem diferir muito
quanto ao delineamento, isto é, devem ser combináveis. Portanto, os critérios de
inclusão e a exclusão de artigos devem ser cuidadosamente especificados. É comum
incluir apenas ensaios clínicos randomizados e estudos prospectivos, porque se
entende que outros tipos de estudo não são adequados, embora possam,
eventualmente, ser considerados.12 As discordâncias entre avaliadores são resolvidas
por consenso. No entanto, a validade da metanálise depende, sobretudo, da
similaridade dos estudos que foram combinados.
Escolhidos os artigos que passaram pelo critério de qualidade e podem ser
combinados, realiza-se a terceira fase em que, por procedimentos estatísticos,
combinam-se os resultados de estudos clínicos individuais. A metanálise, então,
generaliza os resultados de estudos quantitativos.
É difícil fazer uma metanálise, mas dela se tiram conclusões com base em uma série
de bons artigos e de maneira objetiva, isto é, independentemente da opinião de seus
autores. As metanálises tornaram-se muito importantes para as ciências da saúde. No
entanto, evidências obtidas por meio de metanálise mostram, muitas vezes, notórias
discrepâncias com as recomendações feitas por especialistas. Algumas das causas que
poderiam explicar a falta de concordância entre resultado de metanálise e
recomendações dos especialistas são:13
Grande quantidade de ensaios clínicos: o número de ensaios clínicos randomizados na
literatura de qualquer especialidade é muito grande para que um especialista da
área possa ler e entender todos eles ou, até mesmo, a simples maioria.
Ensaios clínicos randomizados negativos: alguns revisores podem não entender que
um pequeno ensaio, cujos resultados não sejam estatisticamente significantes, não
é, necessariamente, um ensaio negativo, no sentido de que sugere que o tratamento
não funciona. Por outro lado, pode ser que alguns especialistas adotem sempre
uma atitude conservadora em relação aos pequenos ensaios, mesmo que tenham
mostrado resultados estatisticamente significantes, esperando a publicação de
grandes ensaios.
Pouca ou nenhuma familiaridade com a metanálise: a técnica estatística da metanálise
ficou comum na literatura clínica recentemente. Portanto, muitos revisores podem
não saber interpretar os resultados desse tipo de análise; outros talvez tenham
reservas quanto ao processo de combinar os resultados de ensaios múltiplos.
Confiança na própria experiência: um exemplo interessante de que confiar na própria
experiência é sempre muito problemático é o fato, registrado, de os autores de
revisões e capítulos de livros sobre infarto do miocárdio terem apresentado a
tendência de ignorar os trombolíticos, que provaram reduzir a mortalidade e se
entusiasmar com a lidocaína, que não tem efeito. Isso se explica pelo fato de o
clínico muitas vezes raciocinar apenas com base em alguns eventos que presenciou,
de baixa taxa de ocorrência. No primeiro caso, dos trombolíticos, os médicos
podem ter visto o efeito colateral da hemorragia, depois de tratar alguns poucos
pacientes, ou podem ter ouvido sobre isso; no segundo caso, da lidocaína, eles
podem ter visto arritmias ventriculares, que imaginaram ser o precursor de morte
súbita, diminuírem com a medicação.
Disponibilidade no mercado: a disponibilidade da droga no mercado facilita a sua
prescrição para outro uso, que não aquele para a qual foi desenvolvida (off-label).
Os betabloqueadores são um bom exemplo disso, porque foram recomendados
para uso em uma grande variedade de condições cardiovasculares. Logo, foram
prescritos para reduzir a mortalidade nos casos de infarto do miocárdio, com muito
mais frequência que vasodilatadores e anticoagulantes, dois tipos de drogas cuja
eficiência na redução da mortalidade já era conhecida.
Existe uma rede social (network) de profissionais de saúde, pesquisadores, pacientes
e advogados que buscam tornar útil a evidência gerada por meio de pesquisa.14 É a
Colaboração Cochrane Internacional (International Cochrane Collaboration), uma
organização sem fins lucrativos, com colaboradores em mais de 120 países. De acordo
com o site da organização, a International Cochrane Collaboration tem a “visão de um
mundo com mais saúde, em que decisões sobre saúde e cuidados com a saúde são
esclarecidos por evidência obtida em pesquisas de alta qualidade, relevantes e
atualizadas”.
Já existe um Centro Cochrane do Brasil, que funciona na Universidade Federal de
São Paulo (UNIFESP). Lá estão disponíveis, em inglês, muitas informações para
profissionais interessados na área da saúde, como o texto completo das Revisões
Sistemáticas da Colaboração Cochrane, ensaios clínicos, estudos de avaliação
econômica em saúde, informes de avaliação de tecnologias de saúde e revisões
sistemáticas resumidas criticamente.15
De acordo com um pesquisador,16 a Colaboração Cochrane Internacional é um
empreendimento que se rivaliza, em termos de importância, com o Projeto do Genoma
Humano, devido às implicações potenciais para a moderna Medicina. No entanto, não
se deve ter ilusões e esperar resultados retumbantes. Muitas estratégias usadas
atualmente serão validadas, porque foram testadas por estudos de alta qualidade, mas
uma grande quantidade de pesquisas não levará à conclusão alguma.

8.5 O que é Medicina Baseada em Evidência?


Medicina Baseada em Evidência (Evidence Based Medicine – EBM)17 é o uso explícito,
consciente e judicioso da melhor evidência disponível para tomar decisões ao cuidar
de um paciente. Significa, portanto, integrar experiência clínica com evidência externa.
Experiência clínica é adquirida na prática diária e significa fazer diagnósticos com
grande grau de acerto e entender os problemas, as urgências, os direitos e as
preferências dos pacientes para a tomada conjunta de decisão. Evidência externa é
conseguida por meio da leitura sistemática de artigos científicos de qualidade. E as
dificuldades, aqui, são óbvias. A quantidade de informação na área da saúde, em
permanente expansão, torna impossível para um profissional ler, avaliar e apreender
todas as informações disponíveis de maneira a se manter atualizado.
Medicina Baseada em Evidência, no entanto, significa que os médicos precisam aliar,
à prática clínica, os melhores conhecimentos disponíveis. A leitura não substitui a
experiência clínica – apenas agrega informação. É a experiência clínica que mostra
como decidir e como usar conhecimentos para cuidar de um dado paciente, mas é
preciso rastrear a melhor evidência externa para responder às perguntas que surgem.
A prática médica pode ser arriscada se não houver experiência, mas se torna atrasada
se não houver constante busca por novos conhecimentos.18
Por força de sua lógica, a Medicina Baseada em Evidência permanece como
disciplina relativamente jovem apesar de ter origem antiga, e só agora seus impactos
positivos começam a ser mais bem entendidos. No entanto, se é fácil para o
profissional da área da saúde entender que deve agregar muita leitura à prática clínica,
é difícil julgar e hierarquizar as muitas informações disponíveis na literatura
especializada. Mas já há algum consenso: o nível de evidência de uma afirmativa
depende do tipo de estudo no qual essa afirmativa se baseia. Assim, a Tabela 8.1
mostra que ensaios clínicos com amostras adequadas trazem mais evidência do que
um relato de caso, por exemplo.19

Tabela 8.1
Tipos de estudo de acordo com o nível de evidência

Nível da
Tipo de estudo
evidência

I Ensaios clínicos únicos ou multicêntricos, com nível de significância e poder adequados, ou revisão sistemática
desses ensaios.

II Ensaios clínicos únicos ou multicêntricos, estudos coorte prospectivos ou revisão sistemática desses estudos.

III Estudos coorte retrospectivos, estudos de caso-controle ou revisão sistemática desses estudos.

IV Séries de casos.

V Opinião de especialistas, relato de casos.

Os ensaios clínicos randomizados multicêntricos ou aqueles abalizados em uma


metanálise constituem, sem dúvida, o “padrão-ouro” para comparar intervenções.
Entretanto, o FDA20 faz, no caso de drogas, mais exigências para ter evidência
substancial,21 que define como a evidência obtida de investigação adequada e bem
controlada, incluindo ensaios clínicos conduzidos por especialistas qualificados e
cientificamente bem treinados, com experiência na avaliação da eficácia da droga
considerada.

8.6 O que é pesquisa documental?


Documentos de arquivo são registros de informações produzidas, recebidas e
mantidas por um órgão público ou empresa privada no exercício de suas atividades.
Os documentos arquivados pelos órgãos e entidades da Administração Pública no
exercício de suas funções e atividades são registrados nos documentos públicos e podem
ser usados por pesquisadores. Os documentos arquivados por instituições privadas
como hospitais, clínicas, empresas de planos de saúde e serviços de saúde particulares,
em princípio para uso da própria instituição, também podem ser usados por
pesquisadores, desde que o projeto de pesquisa seja aprovado pela instituição.
Os documentos podem ser textos escritos em papel, mas também podem estar
apresentados em suporte magnético ou óptico. Não é raro que os administradores de
instituições que arquivam documentos desconheçam o possível uso ou, até mesmo, a
existência de algum tipo de dado que lá é coletado.

Pesquisa documental (documentary research) é aquela que faz uso de documentos de


arquivo como material de informação, ou seja, dados estatísticos, registros oficiais,
pronunciamentos de governos, diários, imagens.

A pesquisa documental é muito utilizada nas ciências sociais22 e, às vezes, é


confundida com revisão da literatura.23 A diferença está na natureza das fontes: a
revisão da literatura avalia as contribuições de outros pesquisadores sobre
determinado tema, enquanto a pesquisa documental busca documentos de arquivo –
não em artigos científicos publicados em revistas especializadas.

8.7 Resumo
Revisão sistemática da literatura é uma síntese de vários estudos, feita para apresentar o
melhor conhecimento disponível sobre um tema específico, com definição clara dos
critérios de inclusão dos trabalhos.
A busca de informação para uma revisão tradicional é feita em bases de dados on-line,
em revistas especializadas, em bancos de teses, por comunicação pessoal.
Metanálise é uma técnica de revisão sistemática da literatura que usa métodos
estatísticos para combinar os resultados de estudos clínicos individuais.
Medicina Baseada em Evidência significa integrar experiência clínica com evidência
externa.
Documentos de arquivo são registros de informações produzidas, recebidas e
mantidas por um órgão público ou empresa privada no exercício de suas atividades.
Pesquisa documental faz uso de documentos de arquivo como material de informação,
ou seja, dados estatísticos, registros oficiais, pronunciamentos de governos, diários,
imagens.

2
Idem.
3
University of York: Centre for reviews and dissemination. Systematic Reviews: CRD’s guidance for undertaking
systematic reviews in health care. 2009. Disponível em: www.york.ac.uk/inst/crd/pdf/Systematic_Reviews.pdf. Acesso
em 23 de setembro de 2014.
4
Light RJ, Pillemer DB. Summing up: the science of reviewing research. Cambridge, Mass: Harvard Univ. Pr., 1984. Ver
também: Khan K. et al. Systematic reviews to support evidence based medicine. 2 a ed. Londres, Royal Society of
Medicine, 2011.
5
Classificação da produção intelectual. Disponível em: www.capes.gov.br/avaliacao/intrumentos-de-apoio/classificacao-
da-producao-intelectual. Acesso em 4 de novembro de 2014.
6
Também conhecidos como unitermos, palavras-chave (key words).
7
Biblioteca Virtual do Ministério da Saúde. Disponível em: http://bvsms.saude.gov.br/. Acesso em 4 de novembro de
2014.
8
Azevedo JLMC, Poblacion DA, Goldenberg S. Descritores (unitermos) nos artigos científicos. Acta Cir. Bras. 5 (2):35-
54, abr-maio,1990.
9
Wolf FM. Meta-analysis: quantitative methods for research synthesis. Beverly Hill, Sage Publications, 1986.
11
Hunter JE, Schimidt FI. Methods of Meta-Analysis. Newbury Park, CA, Sage, 1990.
12
Hedges LV, Olkin I. Statistical Methods for Meta-Analysis. Orlando, Academic Press, 1985.
13
Antman EM. et al. A Comparison of Results of Meta-analyses of Randomized Control Trials and Recommendations
of Clinical Experts. JAMA, 1992; 268(2):240-248.
14
The Cochrane Collaboration. Disponível em: www.cochrane.org. Acesso em 13 de agosto de 2014.
15
Colaboração Cochrane – Centro Cochrane do Brasil. Disponível em: https://www.centrocochranedobrasil. Acesso em
14 de agosto de 2014.
16
Naylor CD. Grey zones of clinical practice: some limits to evidence-based medicine. Lancet (345): 840-2, abril de
1995.
17
Sackett DL. Evidence based medicine: what it is and what it isn’t. BMJ, 1996, Jan 13;312(7023)71-2.
18
Idem.
19
Jae WS, Kevin CC. Observational Studies: Cohort and Case-Control Studies. Plast Reconstr Surg. Dez. 2010; 126(6):
2.234-2.242.
20
Federal Food, Drug and Cosmetic Act, capítulo 5 (seção 501). Disponível em:
http://www.fda.gov/regulatoryinformation/legislation/federalfooddrugandcosmeticactfdcact/fdcactchaptervdrugsanddevices/default.xhtm
21
Evidência substancial significa evidência de tal maneira relevante que uma mente razoável aceita como adequado para
apoiar uma conclusão. Ver: Traver D. Social Security Disability Advocate’s Handbook. James Publishing, 2013. p. 202.
22
Scott J. Documentary research. Nova York, Sage, 2006.
23
Sá-Silva JR, Almeida CD, Guindani JF. Pesquisa documental: pistas teóricas e metodológicas. Revista Brasileira de
História & Ciências Sociais, Ano I, n. I, Jul. 2009. Disponível em: www.rbhcs.com.
C AP Í T U L O 9

Estatística: Mito e Realidade


A expressão “estatisticamente significante” parece bastante científica mesmo
quando desprovida de sentido. No entanto, essa expressão deve apenas remeter o
leitor à ideia de que, com base no resultado de um teste estatístico feito com os dados
coletados da maneira apresentada no trabalho, determinada hipótese foi rejeitada.
Então, a expressão “estatisticamente significante” somente deve merecer atenção se os
dados forem bons e se forem boas as hipóteses em teste.
A grandeza da diferença em teste não importa. Contudo, muitas vezes, os
estatísticos ouvem perguntas do tipo: “uma diferença de 20 g é estatisticamente
significante?”. É preciso pensar um pouco: 20 g do quê, onde, em que contexto? Que
hipóteses tem o pesquisador que pergunta se 20 g é “estatisticamente significante”?
Um exemplo fictício ajuda a entender.
Um pesquisador trabalha com ratos de laboratório. Para saber se adicionar
determinada proteína à ração tem efeito sobre o peso de ratos, um conjunto de 16
ratos similares foi dividido ao acaso em dois grupos: 1) controle, que recebeu a ração
padrão; 2) experimental, que recebeu a proteína adicionada à ração, como mostra a
Figura 9-1.

FIGURA 9-1 Ratos que receberam ração padrão (grupo-controle) e ratos que receberam
proteína adicionada à ração (grupo experimental)

Depois de algum tempo, o pesquisador pesou os ratos dos dois grupos, calculou as
médias e constatou que a diferença entre médias era de 20 g a favor do grupo que
recebeu proteína adicionada à ração. Agora, o pesquisador quer saber: será que a
diferença de 20 g que ele observou na amostra é suficientemente grande para ser
tomada como evidência de que adicionar proteína à ração de ratos de laboratório tem
efeito sobre o peso deles? Em outras palavras, a diferença entre médias é
estatisticamente significante?
O estatístico faz, então, duas hipóteses: a primeira, chamada hipótese da nulidade, diz
que proteína adicionada à ração não tem efeito sobre peso de ratos (a diferença entre
as médias de pesos de ratos dos dois grupos é nula); a segunda, chamada hipótese
alternativa, diz que proteína adicionada à ração tem efeito sobre peso de ratos (a
diferença entre as médias de pesos de ratos dos dois grupos é diferente de zero).
É importante notar que as hipóteses referem-se à população, isto é, aos ratos de
laboratório em geral e não apenas à amostra de ratos que o pesquisador criou em seu
laboratório. Então, o pesquisador quer saber se a diferença de peso que observou em
seu laboratório constitui evidência de que a proteína que acrescentou à ração tem
efeito sobre o peso de ratos, em geral.
Se o teste estatístico rejeitar a hipótese da nulidade ao nível de 5% de significância,1
diz-se que “o resultado é estatisticamente significante”. Então, é razoável concluir que
ratos que recebem proteína adicionada à ração têm, em média, peso diferente de ratos
que não recebem esse aditivo.
Cabe, aqui, um alerta: uma diferença numérica “significante” em um trabalho pode
ser “não significante” em outro. Alguns pesquisadores acreditam, equivocadamente,
que o importante é a diferença relativa, ou seja, existe a ideia de que uma diferença de
20 g é “significante” se uma das médias for, por exemplo, 60 g e a outra 80 g (porque 20
g representa 33% a mais de peso no grupo experimental), mas não é significante se
uma média for 200 g, e a outra, 220 g.
No entanto, uma diferença relativa bastante grande não constitui garantia de
resultado “estatisticamente significante”. É preciso examinar a variabilidade: se os
dados variam muito, diferenças grandes podem ser “não significantes”; se os dados
variam pouco, diferenças pequenas podem ser “significantes”. O Exemplo 9-1 mostra
isso.

Ex e m plo 9 - 1
A Tabela 9-1 apresenta dados de dois experimentos fictícios com ratos de
laboratório. No primeiro experimento, as médias do grupo-controle e do grupo
experimental são 100 g e 120 g, respectivamente, e a diferença de 20 g não é
estatisticamente significante.2 No segundo experimento, as médias ainda são 100 g e
120 g, respectivamente, e a diferença, de 20 g, é “estatisticamente significante”.3 Isso
acontece porque a variabilidade, neste segundo experimento, é bem menor.

Tabela 9-1
Pesos em gramas de ratos de laboratório, em dois experimentos fictícios

Experimento n° 1 Experimento n° 2

Grupo-controle Grupo experimental Grupo-controle Grupo experimental

50 65 100 120
50 160 90 110

150 75 110 120

150 180 100 130

2
Foi feito o teste t de Student para amostras independentes. O resultado (t = 0,487) não é estatisticamente
significante (p = 0,6436).
3
Foi feito o teste t de Student para amostras independentes. O resultado (t = 3,46) é estatisticamente significante (p
= 0,0134).

9.1 Por que fazer um teste estatístico?


Não basta informar, para quem busca conhecimento científico, que alguns pacientes
em determinada condição melhoraram quando submetidos a determinado tratamento:
é preciso informar o melhor tratamento para todos os pacientes nessa condição. No
entanto, a informação sobre o melhor tratamento é obtida por meio de pesquisas – e
os pesquisadores trabalham com amostras (alguns pacientes). Será que o pesquisador
tem o direito de transferir a informação da sua amostra para outros pacientes? Ou
seja, o pesquisador tem o direito de fazer inferência?
O pesquisador pode fazer inferência se tiver bons dados e teste estatístico
adequado; no entanto, é necessário ter bons dados. Não existe teste estatístico que
compense a falta de qualidade dos dados. Aliás, o teste estatístico, nesses casos,
confere apenas um ar espúrio de respeitabilidade, nada mais. Por outro lado, se os
dados são bons e as diferenças observadas são tão grandes que seria absurdo atribuí-
las ao acaso, o teste estatístico pode ser até desnecessário. Na maioria dos casos, no
entanto, o teste estatístico contribui para a interpretação objetiva dos resultados. Para
entender a lógica dos testes estatísticos, convém discutir novamente o exemplo
apresentado na seção anterior. Um pesquisador cria dois grupos de ratos similares da
maneira mais idêntica possível, com uma única diferença: uma proteína é adicionada à
ração de um dos grupos. Se depois de algum tempo os ratos forem pesados, o
pesquisador provavelmente verificará que:
Os pesos dos ratos de um mesmo grupo variam;
As médias de pesos dos dois grupos são diferentes.
A variação de peso dentro dos grupos é casual, porque os ratos do mesmo grupo
foram tratados da mesma maneira, mas a diferença de médias entre grupos tanto pode
ser casual como pode ter sido causada pela adição de proteína à ração de um dos grupos.
Diante dos resultados de um experimento como esse, o pesquisador se pergunta: a
diferença de médias é suficientemente grande para que se possa concluir a proteína foi
a causa da diferença entre grupos?
O julgamento do pesquisador precisa ser objetivo. Então, ele precisa de um método
que permita tomar decisão sem influência de suas opiniões pessoais. É para isto que
serve o teste estatístico: estabelece se a diferença de médias é “estatisticamente
significante”, ou seja, verifica se uma diferença tão grande ou maior que a obtida tem
baixa probabilidade (p-valor) de ocorrer por acaso.
9.2 O teste estatístico é uma prova?
Um teste estatístico responde à pergunta:
A diferença é significante?
No entanto, o teste não responde à pergunta:
O que causou a diferença?
No exemplo, o pesquisador quer saber se a proteína adicionada à ração é a causa da
diferença entre as médias, mas o teste estatístico mostra apenas se a diferença de médias
é muito alta para ser considerada casual.
Se o pesquisador concluir que a diferença de médias de grupos é explicada pela
proteína adicionada à ração dos ratos, estará fazendo tanto uma inferência estatística
(em função do resultado do teste) como uma inferência lógica (se os dois grupos forem
similares em todos os aspectos, exceto pelo fato de um receber determinada proteína e
o outro não, então essa substância deve ser a causa da diferença entre os grupos).
Portanto, a conclusão de causa não se baseia no teste estatístico, mas no delineamento
correto do experimento. A importância do delineamento está ilustrada no Exemplo 9-2.

Ex e m plo 9 - 2
Uma pessoa garante que, quando joga um dado, usa força mental para fazer
aparecer a face que lhe interessa. Para testar essa afirmativa, foi feito um
experimento.
Foi pedido à pessoa que lançasse um dado 720 vezes e usasse sua força mental
para fazer ocorrer a face “seis”. Essa face apareceu 143 vezes. Como a probabilidade
de ocorrer “seis” no jogo de dados é 1/6, em 720 lançamentos espera-se que ocorra a
face “seis” 120 vezes. A diferença entre o valor observado (143) e o valor esperado
(120) é

estatisticamente significante.4 É muito pouco provável que ocorra por acaso


diferença tão grande ou maior que a observada (foram 23 ocorrências a mais da face
6 que o esperado). Seria lógico, então, concluir que a pessoa tem, muito
provavelmente, força mental para influenciar o resultado do jogo de dados se, e
somente se, o experimento tivesse sido bem delineado. Mas não foi. Isso está
discutido no Exemplo 9-3.

4
Foi aplicado o teste de χ2. O resultado (χ2 = 4,41) é significante no nível de 5%.

Um teste estatístico não mostra o que causou a diferença; apenas informa se a


diferença é estatisticamente significante, ou seja, se é pouco provável que uma
diferença igual ou maior que a observada ocorra por acaso. Logo, diante de um
resultado significante, é preciso discutir o delineamento.

Ex e m plo 9 - 3
Uma pessoa garante que, quando joga um dado, usa força mental para fazer
aparecer a face que lhe interessa. Para testar essa afirmativa, foi feito um
experimento.
Foi pedido à pessoa que lançasse um dado 720 vezes e usasse sua força mental
para fazer ocorrer “um” nas 120 primeiras jogadas, “dois” nas 120 seguintes e assim
por diante, até “seis”. Se, para qualquer número que fosse tentado, a face “seis” sair
mais vezes, é lógico concluir que a causa da diferença é o fato de o dado ser viciado.

9.3 Uma diferença pode ser estatisticamente significante


e não ser clinicamente importante?
A informação de que a diferença entre o grupo experimental e o grupo- controle é
“estatisticamente significante” não implica a informação de que essa diferença é
“clinicamente importante”. Por “estatisticamente significante” deve-se entender
apenas que a diferença observada não é casual. A importância da diferença em termos
clínicos não pode ser julgada por estatísticos: é da competência exclusiva dos
profissionais da área em que a pesquisa se enquadra.5
No entanto, cabe aqui um alerta: se o ensaio foi conduzido de maneira correta, uma
diferença estatisticamente significante, mesmo que não seja sentida na prática clínica,
deve ser analisada com cuidado: afinal, foi detectado que a intervenção experimental
tem, muito provavelmente, efeito sobre a variável resposta.

9.4 Uma diferença pode ser clinicamente importante e


não ser estatisticamente significante?
Cabe aqui perguntar: por que não se detectam diferenças estatisticamente
significantes entre os braços de um ensaio? Podem ser levantadas duas hipóteses. A
primeira seria, obviamente, de que não se detectou diferença entre os braços do
ensaio, porque essa diferença não existe; a segunda seria a de que a diferença,
percebida na prática clínica, existe, mas o ensaio foi muito pequeno para detectá-la (p.
ex., um ensaio com 10 voluntários por braço é pequeno) ou mal delineado, isto é, existe
grande variabilidade entre os participantes da pesquisa, que não foi controlada (p. ex.,
foi feito um ensaio clínico com randomização simples, quando deveria ter sido feita
randomização estratificada).

9.5 Em quantos pacientes deve ocorrer um efeito adverso


para que esse valor seja estatisticamente significante?
De acordo com a Resolução n° 466/12 e suas complementares da CONEP,6 o
pesquisador deve relacionar, no protocolo de pesquisa, os riscos e os benefícios para os
participantes da pesquisa que está sendo proposta. Se o protocolo nada diz sobre, por
exemplo, risco de morte, isso significa que o pesquisador considera que o risco de
morte é zero. Não há sentido em considerar a hipótese de que o pesquisador se
“esqueceu” de mencionar esse risco.
Partindo, então, da hipótese de que o risco de morte é zero, se ocorrer uma morte
relacionada com o tratamento em teste, a hipótese de risco zero é rejeitada por
qualquer teste estatístico, a qualquer nível de significância. É preciso, então, uma
emenda no protocolo.
No item 11 de seu relatório,7 a ANVISA pede que o pesquisador indique se algum
dos seguintes itens ocorreu no estudo:
Eventos adversos graves inesperados.
Eventos adversos graves possíveis, prováveis ou definitivamente. relacionados com
o(s) produto(s) em teste, ocorridos no Brasil.
Um evento adverso grave de ocorrência inesperada significa, obviamente, que esse
evento não foi aventado nem no protocolo, nem no TCLE. Uma emenda se faz
necessária. No protocolo de pesquisa e no TCLE, entretanto, devem estar relacionados
riscos de eventos adversos graves conhecidos; mas essas estimativas somente podem
ser feitas com base em dados já coletados em outros estudos.
A ANVISA também pede que, na descrição dos resultados de um ensaio clínico,
sejam dadas estimativas com intervalos de confiança e valores de NNT ou NNH, para
cada intervenção.8 São então dadas aqui as definições desses valores.

Número necessário tratar (number needed to treat), conhecido como NNT, é o número
de pacientes com determinada patologia que precisam ser tratados para evitar que
um deles tenha um desfecho ruim como, por exemplo, morte. Então, uma droga
indicada para essa patologia, que tenha NNT = 5, evita uma morte em cada cinco
pacientes.

Para entender como se calcula o NNT, é melhor considerar um exemplo fictício. Para
verificar se uma nova intervenção reduz o risco de morte por infarto agudo do
miocárdio, foi feito um ensaio clínico randomizado: 100 pacientes foram designados
para o controle e 100 para a nova intervenção. Morreram 10 pacientes do grupo-
controle e 8 do grupo submetido à nova intervenção. Este resultado, apresentado na
Tabela 9-2, mostra que o risco de morte sem a intervenção é de 10%, mas com a
intervenção, é de 8%. Então a morte de 2 dos 100 infartados que receberam a
intervenção foi evitada, porque sem essa intervenção morreriam 10, e não 8. Este
resultado também é visível na Figura 9-2.

Tabela 9-2
Número de mortes registradas nos dois grupos

Grupo
Evento
Controle Intervenção
Morreram 10 8

Sobreviveram 90 92

FIGURA 9-2 Número de mortes registradas nos dois grupos

De acordo com a definição, NNT é o número de pacientes que precisam ser tratados para
que se previna um desfecho ruim. No exemplo, ocorreram duas mortes (o desfecho
ruim) a menos no grupo de 100 pacientes submetidos à intervenção, ou seja, com a
intervenção foram evitadas duas mortes no total de 100 pacientes. Usando a “regra de
três”:

O número necessário tratar NNT refere-se a uma intervenção específica. É calculado a


partir de revisões sistemáticas ou de meta-análises de ensaios clínicos randomizados
controlados, que fornecem o mais alto nível de evidência. Portanto, o número necessário
tratar somente deve ser utilizado quando os dados usados em seu cálculo atendem os
critérios de qualidade e validade, em ensaios conduzidos com tamanho adequado.
É interessante considerar outro exemplo. Se 12% das pessoas com determinado
diagnóstico morrem dentro de 1 ano e uma nova droga reduz a mortalidade nesse
período para 8%, então 4 de cada 100 pacientes que iriam morrer não morrem, graças à
nova droga. Aplicando a “regra de três”, o NNT é 25, ou seja, de cada 25 pacientes
tratados, um não morre porque usou a nova droga. Assim, o tratamento teria NNT = 1,
pois NNT = 1 para o desfecho morte significa que, usando a droga, um paciente a mais
irá sobreviver.

Número necessário para causar dano (number needed to harm), conhecido como NNH,
é o número de pacientes com determinada patologia que precisam ser tratados para
que um deles sofra danos ou tenha um desfecho ruim como, por exemplo,
complicações terapêuticas. Então, uma droga indicada para essa patologia que tenha
NNH = 100, causa dano em 1 de cada 100 pacientes tratados.

A comparação do valor do NNT com o valor do NNH dá ideia do risco/benefício de


uma intervenção. Quanto menor for o NNT, maior será o número de pacientes que
terão o benefício; quanto maior for o NNH, menor será o número de pacientes que
terão efeitos adversos.

9.6 Comentários finais


A literatura recente na área de saúde traz grande quantidade de análise de dados, com
metodologia e técnicas de análise cada vez mais complexas. É verdade que o
pesquisador que trabalha com dados numéricos pode optar por estatísticas simples
(apresentação tabular e gráfica de dados, cálculo de médias e proporções) que levam a
respostas simples. No entanto, as estatísticas que precisam de ajuda profissional
(análise de variância, de regressão, multivariada e de sobrevivência) oferecem maior
possibilidade de discussão. A análise estatística, entretanto, apenas faz sentido se o
delineamento do estudo clínico estiver correto, com hipóteses bem formuladas.
Portanto, todo pesquisador precisa de treinamento em metodologia científica.

1
Veja, por exemplo: Vieira, S. Introdução à Bioestatística. Rio de Janeiro, Elsevier, 4 ed. 2008.
5
Ver a seção 5.3 do Capítulo 5.
6
Ver: http://conselho.saude.gov.br/web_comissoes/conep/aquivos/resolucoes/resolucoes.htm
7
Anvisa – Medicamentos – Pesquisa clínica. Disponível em:
https://www.anvisa.gov.br/medicamentos/pesquisa/def.htm. Acessso em 14 de outubro de 2014.
8
Idem.
Leituras sugeridas
ALTMAN, D. O. Practical Statistics for Medical Research, 2 ed. Londres: Chapman & Hall; 1993.
ARMITAGE, P., BERRY, G., MATTHEWS, J. N.S. Statistical methods in medical research, 4 ed. Oxford: Blackwel
Science. Publications; 2002.
BLAND, M. An introduction to medical statistics, 3 ed. Oxford: Oxford University Press; 2002.
CHOW, S. C., LIU, J. L. Design and analysis of clinical trials. Nova York: Wiley; 2004.
CHOW, S. C., LIU, J. L. Design and Analysis of Bioavailability and Bioequivalence Studies, 3 ed. Boca Raton: Chapman
& Hall/CRC; 2009.
DANIEL, W. W., CROSS, C. Biostatistics: a foundation for analysis in the health sciences, 10 ed. Nova York: Wiley; 2013.
DEAN, A., VOSS, D. Design and analysis of experiments. Nova York: Springer; 1999.
FRIEDMAN, L. M., FURBERG, C. D., DeMETS, D. L. Fundamentals of clinical trials, 4 ed. Nova York: Springer; 2010.
GLANTZ, S. A. Primer of biostatistics. Nova York: McGraw; 1987.
HULLEY, S. B., et al. Designing Clinical Research, 2 ed. Filadelfia: Lippincott Williams & Wilkins; 2007.
VIEIRA, S. Elementos de Estatística, 5 ed. São Paulo: Atlas; 2003.
VIEIRA, S. Introdução à Bioestatística, 2 ed. Rio de Janeiro: Campus-Elsevier; 2008.
VIEIRA, S. Bioestatística: Tópicos Avançados, 2 ed. Rio de Janeiro: Campus-Elsevier; 2008.
VIEIRA, S. Análise de variância. São Paulo: Atlas; 2006.

Você também pode gostar