Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
N aepidemiologia
Seção III, revisamos os principais tipos de delineamento de estudo utilizados em
e examinamos como os resultados destes estudos são usados para demonstrar
associações e inferir relações causais. Mesmo que os aspectos metodológicos discutidos
sejam interessantes e intrigantes, grande parte da empolgação com a epidemiologia vem do fato
de que seus resultados têm aplicação direta em problemas que envolvem a saúde humana. Os
desafios que estão envolvidos, entretanto, incluem realizar inferências válidas dos dados gerados
por estudos epidemiológicos, assegurar a apropriada comunicação desses achados e suas
interpretações pelos responsáveis por políticas e o público geral, tendo cuidado com os
problemas éticos que surgem da estreita ligação da epidemiologia com a saúde humana, com a
prática clínica e políticas de saúde pública.
Esta seção discute o uso da epidemiologia na avaliação tanto de serviços de saúde (Capítulo
17) quanto programas para rastreamento e detecção precoce de doenças (Capítulo 18). Esses dois
capítulos também abordam alguns dos desafios metodológicos e conceituais que surgem em
ambos. Posteriormente, voltamo-nos à outras questões envolvidas na aplicação da epidemiologia
para o desenvolvimento de políticas (Capítulo 19), incluindo a relação da epidemiologia com a
prevenção, avaliação de risco, a epidemiologia nos tribunais e as origens e o impacto da
incerteza.
No capítulo final, discutimos as principais considerações éticas e profissionais que surgem
tanto da condução de investigações epidemiológicas e utilização dos resultados desses estudos
para melhorar a saúde da comunidade. Estudos epidemiológicos são uma das principais
abordagens para o aumento da efetividade do cuidado clínico e de intervenções de saúde pública.
Algumas das principais questões nesse capítulo incluem as obrigações do investigador para com
os sujeitos em estudo, conflitos de interesse e a interpretação dos achados de estudos
epidemiológicos e como são aplicados nos processos de desenvolvimento e aprimoramento das
políticas de saúde pública em diferentes comunidades (Capítulo 20).
Capítulo 17
Uso da Epidemiologia na Avaliação de
Serviços de Saúde
Objetivos de aprendizagem
■ Diferenciar medidas de processo de medidas de desfecho e discutir possíveis medidas
de desfecho em pesquisa sobre serviços de saúde
■ Definir eficácia, efetividade e eficiência no contexto dos serviços de saúde
■ Comparar e confrontar estudos epidemiológicos sobre etiologia de doenças com
estudos epidemiológicos de avaliação de serviços de saúde
■ Discutir pesquisa de desfechos no contexto de dados ecológicos, e apresentar alguns
dos potenciais vieses de estudos epidemiológicos que avaliam serviços de saúde
utilizando dados em nível de grupos
■ Descrever possíveis delineamentos de estudos que podem ser utilizados para avaliar
serviços de saúde utilizando dados individuais, incluindo delineamentos
randomizados e não randomizados
Talvez o exemplo mais antigo de uma avaliação seja a descrição da criação feita pelo livro do
Gênesis, 1:1-4, apresentada no seu original em hebreu na Figura 17-1. Traduzida, com o
acréscimo de alguns subtítulos, ela diz o seguinte:
DADOS INICIAIS
No princípio, Deus criou o céu e a terra. A terra era sem forma e vazia e havia trevas sobre a
face das profundezas.
IMPLEMENTAÇÃO DO PROGRAMA
E disse Deus: “Faça-se a luz.” E a luz foi feita.
AVALIAÇÃO DO PROGRAMA
E Deus viu a luz, que estava boa.
OUTRAS ATIVIDADES DO PROGRAMA
E Deus separou a luz das trevas.
Esse trecho inclui todos os componentes básicos do processo de avaliação: dados iniciais (de
base), implementação do programa, avaliação do programa e implementação de novas atividades
do programa baseadas em resultados da avaliação. No entanto, dois problemas surgem nessa
descrição. Primeiro, não temos os critérios exatos usados para determinar se o programa foi
“bom”; somente disseram que Deus o achou bom. Segundo, essa avaliação exemplifica um
problema frequentemente observado: o diretor do programa está avaliando seu próprio programa.
Vieses tanto conscientes quanto subconscientes podem surgir na avaliação. Adicionalmente,
mesmo que o diretor administre o programa maravilhosamente, ele pode não ter as habilidades
específicas necessárias para conduzir uma avaliação metodologicamente rigorosa do programa.
Figura 17-1. A primeira avaliação conhecida (Gênesis 1:1-4).
O Dr. Wade Hampton, uma autoridade em epidemiologia no início do século 20, abordou o
uso da epidemiologia na avaliação de programas de saúde pública em uma apresentação à
“American Public Health Association” (Associação Americana de Saúde Pública) em 1925.1 Ele
escreveu, em parte, o seguinte:
O gestor de saúde ocupa a posição de um agente a quem o povo confia alguns de seus
recursos, em dinheiro público e cooperação, para que sejam investidos de maneira que
rendam os melhores resultados em saúde; e no emprego das responsabilidades de sua
posição espera-se que ele siga os mesmos princípios gerais de procedimento que um agente
fiscal em circunstâncias semelhantes…
Como seu capital vem inteiramente do público, é razoável esperar que ele esteja preparado
para explicar ao público os motivos que o levaram a fazer cada investimento e dar alguma
estimativa do retorno esperado. Ele também não pode considerar despropositado se o
público quiser uma prestação de contas periodicamente, para ficar sabendo que retornos de
fato estão sendo recebidos e como eles se alinham com as estimativas dadas. Certamente,
qualquer agente fiscal esperaria ter seu discernimento dessa forma avaliado, bem como
esperaria ganhar ou perder a confiança de seus clientes na proporção de que suas
estimativas se verificassem ou não.
No entanto, para tal prestação de contas, o gestor de saúde se encontra em uma situação
difícil e, possivelmente, constrangedora, posto que por mais que ele tenha um registro
razoavelmente exato de quanto dinheiro e esforço dedicou a cada uma de suas muitas
atividades, ele raramente será capaz de contabilizar com exatidão e simplicidade similares
os retornos desses investimentos, considerados separada e individualmente. Isso,
seguramente, não é de todo sua culpa. É, primariamente, devido ao caráter dos dividendos
provindos dos empreendimentos em saúde pública, e da maneira com que eles estão
distribuídos. Eles não são recebidos em prestações separadas de uma moeda uniforme, cada
uma sumarizada à sua fonte e registrada quando do recebimento; mas vêm irregularmente
dia após dia, distribuídas a indivíduos sem identificação através da comunidade, que não
estão individualmente conscientizados de que os receberam. Eles são benefícios positivos
para o prolongamento da vida e melhoria da saúde, mas o único registro normalmente feito
nas estatísticas de morbidade e mortalidade é o registro parcial e negativo de morte e de
enfermidade de determinados tipos bem definidos de doenças, principalmente as doenças
transmissíveis mais agudas, que representam somente uma fração da morbidade total.1
A séria reivindicação do Dr. Frost, para que os procedimentos da medicina preventiva sejam
colocados em um firme embasamento científico é oportuna. Realmente, ela teria sido
oportuna em qualquer momento, durante os últimos 40 anos, e, teme-se, será igualmente
necessária nos próximos 40.
Chapin claramente subestimou o número de anos; essa necessidade continua tão crucial ainda
hoje, quase 90 anos depois, como era em 1925.
Estudos de Desfecho
Dadas as limitações dos estudos de processo, o restante deste capítulo focalizará as medidas de
desfecho. Desfecho denota se um paciente se beneficia do cuidado médico oferecido ou não.
Desfechos em saúde são o domínio da epidemiologia. Embora essas medidas tenham sido
tradicionalmente mortalidade e morbidade, o foco da pesquisa de desfechos nos últimos anos
expandiu-se, e as medidas de interesse incluem satisfação do paciente, qualidade de vida, grau de
dependência e incapacidade e medidas similares.
TABELA 17-1. Alguns dos Possíveis Desfechos para Avaliação de Sucesso de um Programa de Vacinação
1. Número (ou proporção) de pessoas imunizadas
2. Número (ou proporção) de pessoas sob (alto) risco imunizadas
3. Número (ou proporção) de pessoas imunizadas que apresentam resposta sorológica
4. Número (ou proporção) de pessoas imunizadas e posteriormente expostas, nas quais a doença em fase clínica não se
desenvolveu
5. Número (ou proporção) de pessoas imunizadas e posteriormente expostas, nas quais a doença em fase clínica ou subclínica
não se desenvolveu
Eficácia
O agente ou intervenção “funcionam” nas condições ideais “de laboratório”? Testamos novas
drogas em grupos de pacientes que concordaram em ser hospitalizados e que são observados
enquanto recebem a terapia. Ou uma vacina é testada em um grupo de sujeitos de comum acordo.
Assim, eficácia é uma medida em uma situação em que todas as condições são controladas para
maximizar o efeito do agente.
Efetividade
Se administrarmos o agente em uma situação da “vida real”, ele será efetivo? Por exemplo,
quando uma vacina é testada em uma comunidade, muitos indivíduos podem não comparecer à
vacinação. Ou, ainda, uma medicação oral pode ter um sabor tão indesejável que ninguém a toma
(o que a torna não efetiva), apesar do fato de que em condições controladas, quando a
cooperação está garantida, a droga se mostra eficaz.
Eficiência
Se um agente se mostra eficaz, qual a relação custo-benefício? É possível alcançar nossas metas
de uma maneira melhor e mais barata? Custo inclui não apenas dinheiro, mas também
desconforto, dor, absenteísmo, incapacidade e estigma social.
Se uma medida de cuidado à saúde não se mostrar efetiva, não há muito sentido em se
observar a eficiência porque, se ela não for efetiva, a alternativa mais barata é não usá-la de
forma nenhuma. Às vezes, é claro, pressões políticas e sociais podem sustentar um programa que
não é efetivo. No entanto, o enfoque desse capítulo se dará unicamente na ciência da avaliação,
especificamente na questão da efetividade na avaliação de serviços de saúde.
MEDIDAS DE DESFECHO
Se a eficácia de uma medida tiver sido demonstrada - isso é, se os métodos de prevenção e
intervenção de interesse demonstrarem que funcionam, podemos então nos voltar para a
avaliação da efetividade. Que diretrizes devemos usar na seleção de uma medida de desfecho
adequada, que sirva como índice de efetividade? Primeiro, a medida deve ser claramente
quantificável; isto é, devemos poder expressar seu efeito em termos quantitativos. Segundo, a
medida de desfecho deve ser relativamente fácil de definir e diagnosticar. Se a medida for usada
em um estudo populacional, certamente não queremos depender de um procedimento invasivo
para avaliar qualquer benefício. Terceiro, a medida selecionada deve ser padronizável para o
propósito do estudo. Quarto, a população estudada (e a de comparação) devem estar sob risco
para a mesma condição para qual a intervenção está sendo avaliada. Por exemplo, obviamente
não faria nenhum sentido testar a efetividade de um programa de detecção de anemia falciforme
na população branca da América do Norte.
TABELA 17-2. Alguns dos Possíveis Desfechos para Avaliação de Sucesso de um Programa de Cultura de Garganta
1. Número de culturas coletadas (sintomáticas ou assintomáticas)
2. Número (ou proporção) de culturas positivas para infecção por estreptococos
3. Número (ou proporção) de pessoas com culturas positivas para as quais foi obtida assistência médica
4. Número (ou proporção) de pessoas com culturas positivas para as quais o tratamento apropriado foi prescrito e realizado
5. Número (ou proporção) de culturas positivas seguidas de recidiva
6. Número (ou proporção) de culturas positivas seguidas de febre reumática
O tipo de desfecho final que selecionarmos deverá depender da pergunta que estamos
fazendo. Embora isso possa parecer óbvio, não é sempre imediatamente aparente. A Tabela 17-1
mostra possíveis desfechos na avaliação da efetividade de um programa de vacinas. Qualquer
desfecho que selecionarmos deve ser explicitado de maneira que os leitores do relato de nossos
achados possam fazer seu próprio juízo sobre a adequação da medida selecionada e a qualidade
dos dados. A medida selecionada realmente será adequada, dependendo dos aspectos clínicos e
de saúde pública da doença em questão.
A Tabela 17-2 mostra possíveis escolhas de medidas para avaliar a efetividade de um
programa de cultura de garganta em crianças. Medidas do volume de serviços fornecidos,
culturas coletadas e número de consultas clínicas são tradicionalmente as favoritas porque elas
são relativamente fáceis de contar e úteis na justificativa de pedidos para aumento de verbas para
o programa no ano seguinte. No entanto, essas medidas são de processo e não nos dizem nada
sobre a efetividade da intervenção. Devemos, portanto, buscar outras possibilidades listadas
nesta tabela. Novamente, as medidas mais adequadas dependem da pergunta que está sendo feita.
A questão deve ser específica. Não é o suficiente apenas perguntar o quão bom é o programa.
Pesquisa de Desfecho
O termo pesquisa de desfechos tem sido cada vez mais usado nos últimos anos para denotar
estudos que comparam efeitos de duas ou mais intervenções ou modalidades de atendimento,
como tratamentos, formas de organização dos cuidados em saúde ou tipo e extensão da cobertura
de seguro e reembolso do provedor, sobre os desfechos em saúde ou econômicos. Os desfechos
em saúde podem incluir morbidade e mortalidade, bem como medidas de qualidade de vida,
estado funcional, percepções do paciente sobre seu estado de saúde, incluindo reconhecimento de
sintomas e satisfação. Medidas econômicas podem refletir custos diretos ou indiretos e incluir
taxas de hospitalização, atendimentos na sala de emergência e de pacientes ambulatoriais, dias de
trabalho perdidos, atendimento infantil e dias de restrição de atividade. Consequentemente, a
epidemiologia é uma das várias disciplinas necessárias na pesquisa de desfechos.
A pesquisa de desfecho frequentemente utiliza grandes bancos de dados, derivados de
grandes populações. Embora, nos últimos anos, alguns desses grandes conjuntos de dados
tenham sido desenvolvidos a partir de coortes originalmente estabelecidas para diferentes
propósitos de pesquisa, muitos dos bancos usados eram frequentemente iniciados para propósitos
administrativos ou fiscais, em vez de objetivos de pesquisa. Frequentemente, vários desses
grandes bancos de dados, cada um com informações sobre variáveis diferentes, podem ser
conectados para explorar uma questão de interesse.
As vantagens de usar grandes bancos são de que os dados se referem à população do mundo
real, e que as questões de “representatividade” e “generalização” são minimizadas.
Adicionalmente, como os bancos já estão estabelecidos no momento em que a pesquisa é
iniciada, a análise pode ser concluída e os resultados gerados com relativa rapidez. Além disso,
posto que os bancos utilizados são grandes, o tamanho amostral normalmente não é problema,
exceto quando subgrupos menores são examinados. Dadas essas considerações, os custos para
utilizar bancos de dados existentes são geralmente mais baixos do que os custos de coleta de
dados primários.
As desvantagens são que, como os dados foram frequentemente coletados para fins tributários
e administrativos e talvez não sejam adequados para fins de investigação nem mesmo para
responder à questão de pesquisa específica do estudo. Mesmo quando os dados forem
originalmente coletados para pesquisa, talvez nosso atual conhecimento sobre o assunto, seja
agora mais completo, e novas questões de pesquisa podem ter surgido, que podem não ter sido
consideradas quando a coleta dos dados originais foi iniciada. Em geral, os dados podem estar
incompletos. Dados sobre as variáveis independentes e dependentes podem ser muito limitados,
além de que informações sobre detalhes clínicos podem estar ausentes, incluindo gravidade da
doença, dados sobre detalhes das intervenções e a codificação de diagnósticos pode ser
inconsistente. Os dados relacionados com possíveis fatores de confusão poderão estar
inadequados ou ausentes, uma vez que a pesquisa que está sendo realizada era, com frequência,
impossível quando os dados foram gerados. Como algumas variáveis que hoje são consideradas
relevantes, não foram incluídas no banco de dados original, pesquisadores podem, em algum
momento, criar variáveis substitutas para as faltantes, usando certas variáveis que estão incluídas
no banco, mas que podem não refletir diretamente a variável de interesse. No entanto, tais
variáveis substitutivas diferem no quanto seriam medidas adequadas para a variável de interesse
faltante. Por todas essas razões, a validade das conclusões obtidas pode ser, portanto, duvidosa.
Outro problema importante que pode surgir com grandes bancos de dados é que as variáveis
necessárias podem estar ausentes no banco disponível e o pesquisador pode, consciente ou
inconscientemente, mudar a questão original que gostaria de abordar, por uma menos
interessante para ele, mas para a qual as variáveis necessárias para o estudo estejam presentes.
Assim, ao invés de o pesquisador decidir qual questão de pesquisa deveria ser avaliada, o
conjunto de dados pode vir a determinar as perguntas a serem feitas na pesquisa.
Finalmente, usando grandes conjuntos de dados, os pesquisadores tornam-se
progressivamente mais afastados dos indivíduos estudados. Com o passar dos anos, entrevistas
diretas e revisão de prontuários de pacientes têm sido substituídos por grandes bancos de dados
computadorizados. Usando essas fontes de dados, muitas características pessoais dos sujeitos
nunca são exploradas e sua relevância para as questões abordadas nunca são virtualmente
avaliadas.
Uma área na qual as fontes de dados existentes são frequentemente usadas em estudos de
avaliação é o cuidado no período do pré-natal. Os problemas discutidos acima são
exemplificados com o uso de certidões de nascimento. Esses documentos são normalmente
utilizados, pois são de fácil acesso e fornecem determinados dados de atendimento médico, como
o trimestre no qual o atendimento pré-natal começou. No entanto, certidões de nascimento de
mulheres com gestações de alto risco apresentam dados perdidos ou faltantes com maior
frequência do que as de mulheres com gestações de baixo risco. A qualidade dos dados
proporcionados por certidões de nascimentos pode também apresentar variações regionais e
internacionais, que complicam qualquer comparação a ser realizada.
Um exemplo de pesquisa de desfechos usando grande conjunto de dados é o estudo feito por
Gornick et al., sobre os beneficiários da Medicare nos Estados Unidos da América.2 Desde que a
cobertura de saúde da Medicare é proporcionada a praticamente todos os idosos do país, assume-
se que se um estudo populacional se limita àqueles cobertos pela Medicare, os obstáculos
financeiros ao atendimento e outras variáveis sejam constantes através de diferentes grupos,
como subpopulações étnicas. Entretanto, grandes disparidades ainda persistem entre negros e
brancos na utilização de muitos de seus serviços. Os autores estudaram os efeitos da raça e da
renda sobre mortalidade e uso de serviços entre os beneficiários da Medicare. Para isso,
relacionaram dados do censo de 1990 sobre a mediana de renda em cada Código de
Endereçamento Postal (CEP) com dados administrativos de 1993 sobre 26,3 milhões de
beneficiários da Medicare com 65 anos ou mais. Calcularam taxas de mortalidade ajustadas por
idade e taxas ajustadas por idade e sexo para vários diagnósticos e procedimentos, de acordo com
raça e renda e calcularam a razão de negros para brancos.
Como observado na Figura 17-4, a mortalidade ajustada por idade foi maior para homens
negros do que para brancos (razão de mortes de negros:brancos = 1,19) e para mulheres negras
comparadas às brancas (razão de mortes de negras:brancas = 1,16). Em cada um desses
subgrupos, exceto mulheres negras, o grupo de maior renda apresentava as menores taxas de
mortalidade e o de menor renda, as mais altas taxas de mortalidade.
Foram examinados muitos procedimentos e diagnósticos. O uso de mamografias, por
exemplo, variava substancialmente por raça e renda (Fig. 17-5). As mulheres brancas tinham
maiores taxas de mamografia, mas tanto brancas como negras, as mais pobres faziam menos
mamografias do que as mais ricas. As taxas de amputação, parcial ou total de extremidades
inferiores eram significativamente maiores entre negros do que entre brancos (razão de
negros:brancos = 3,64) (Fig. 17-6). Tanto entre negros quanto brancos, as taxas de amputação
foram maiores entre os mais pobres. Os dados sugerem que esses grupos de beneficiários
apresentam maior risco para procedimentos associados a atendimentos abaixo do ideal para
condições crônicas, como o diabetes.
Figura 17-4. Taxas de mortalidade de acordo com raça, sexo, e renda entre os beneficiários da
Medicare, com 65 anos ou mais, 1993. As taxas estão ajustadas para idade para toda a população
da Medicare. (De: Gornick ME, Eggers PW, Reilly TW, et al.: Effects of race and income on
mortality and use of services among Medicare beneficiaries. N Engl J Med 335:791-799, 1996.
Copyright © 1996 Massachusetts Medical Society. Todos os direitos reservados.)
Os autores afirmaram que o conjunto de dados utilizado não fornece informações sobre o
estado de saúde dos indivíduos e condições médicas dos beneficiários e sugeriram que a falta de
tais dados pode limitar algumas das inferências que possam vir a serem realizadas. De qualquer
maneira, concluíram que raça e renda afetam substancialmente a mortalidade e o uso de serviços,
entre os beneficiários do Medicare, e que sua cobertura apenas não é suficiente para promover
padrões efetivos de uso de todos os beneficiários. (Ver também a seção “Raça e Etnia nos
Estudos Epidemiológicos”, no Capítulo 20.)
Potenciais Vieses na Avaliação de Serviços de Saúde com o Uso de Dados de
Grupo
Estudos que avaliam serviços de saúde utilizando dados de grupos são suscetíveis a muitos dos
vieses que caracterizam os estudos etiológicos, como discutido no Capítulo 15. Além disso,
certos vieses são particularmente relevantes para áreas e tópicos de pesquisa específicos. Por
exemplo, os estudos da relação dos cuidados no período pré-natal com desfechos do nascimento
são propensos a diversos e importantes potenciais vieses. Nesses estudos, a questão
frequentemente avaliada é se o atendimento do período pré-natal, medido pelo número de
consultas, reduz o risco de prematuridade e baixo peso ao nascer. Vários vieses em potencial
podem ser introduzidos nesse tipo de análise. Por exemplo, outros fatores sendo iguais, uma
mulher que dá a luz prematuramente terá menos consultas de pré-natal (isso é, a gestação foi
mais curta, assim, houve menos tempo de estar “sob risco” de consultas pré-natais). O resultado
seria uma relação artificial entre o menor número de consultas e a prematuridade, somente
porque o período gestacional foi mais curto. Entretanto, o viés também pode operar na direção
oposta. Uma mulher que inicia o atendimento pré-natal no último trimestre da gravidez não terá
um parto muito precoce, uma vez que já chegou ao seu último trimestre. Isto levaria a uma
observação de associação entre menos consultas de pré-natal e uma menor probabilidade de
parto muito prematuro. Adicionalmente, mulheres que tiveram complicações médicas no passado
também podem estar sob maior risco de um desfecho adverso. Assim, os vieses em potencial
podem se dar nas duas direções. Se essas mulheres estiverem sob alto risco que não possa ser
amenizado através da prevenção, uma associação aparente entre mais consultas de pré-natal e o
desfecho adverso pode ser observada.
Figura 17-5. Taxas de mamografias de acordo com raça e renda entre beneficiárias da Medicare
do sexo feminino, com 65 anos ou mais, 1993. As taxas estão ajustadas para a idade da
população total da Medicare do sexo feminino. (De: Gornick ME, Eggers PW, Reilly TW, et al.:
Effects of race and income on mortality and use of services among Medicare beneficiaries. N
Engl J Med 335:791-799, 1996. Copyright © 1996 Massachusetts Medical Society. Todos os
direitos reservados.)
Figura 17-6. Taxas de amputação total ou parcial de membros inferiores, de acordo com raça e
renda, entre beneficiários da Medicare, com 65 anos ou mais, 1993. As taxas de amputação estão
ajustadas para idade e sexo para a população total da Medicare. (De: Gornick ME, Eggers PW,
Reilly TW et al.: Effects of race and income on mortality and use of services among Medicare
beneficiaries. N Engl J Med 335:791-799, 1996. Copyright © 1996 Massachusetts Medical
Society. Todos os direitos reservados.)
Delineamentos Randomizados
A randomização elimina o problema do viés de seleção que resulta tanto da autosseleção pelo
paciente ou da seleção do paciente pelo provedor de cuidado. Normalmente, os participantes do
estudo são arrolados para receber um tipo de atendimento versus outro, em vez de “com e sem”
atendimento (Fig. 17-7). Por diversos motivos, tanto éticos quanto práticos, a randomização de
pacientes para não receberem cuidados, frequentemente não é considerada.
Consideremos um estudo que usou um delineamento randomizado para avaliar diferentes
abordagens de cuidado em saúde. Manejo precoce, organizado e baseado em hospitalização tem
sido fortemente recomendado para o cuidado de pacientes que sofreram acidente vascular
encefálico (AVE). No entanto, poucos dados de estudos bem conduzidos e controlados estão
disponíveis para comparar cuidado hospitalar com cuidado especializado em casa (cuidado
domiciliar). Adicionalmente, uma alternativa para unidades de AVE no hospital é uma equipe
especializada em AVE que possa prover cuidado em qualquer local no hospital em que pacientes
que sofreram AVE estejam sendo tratados. Essa consideração tem importância prática porque
pode não ser possível para todos os hospitais oferecer cuidado em unidade especializada para
todos os pacientes que tiverem AVE, devido a limitações de espaço ou outras questões
administrativas ou financeiras.
Combinação de Delineamentos
A Figura 17-13 mostra resultados hipotéticos de um estudo não randomizado comparando os
níveis de morbidade em um grupo que não recebeu um atendimento de saúde (Grupo X, em
vermelho) com os níveis de morbidade me um grupo que recebeu um atendimento de saúde
(Grupo Y, em preto). Como o nível de morbidade observado é mais baixo para o Grupo Y do que
para o Grupo X, podemos ficar tentados a concluir, a partir desses resultados, que os serviços de
saúde reduzem morbidade. Como visto na Figura 17-13 (esquerda da figura), porém, para
chegarmos a essa conclusão, devemos supor que os níveis originais de morbidade dos dois
grupos eram comparáveis em um momento prévio à oferta de cuidados ao Grupo Y. Se os níveis
de morbidade para X1 e Y1 fossem similares, poderíamos interpretar o achado de um nível mais
baixo de morbidade no Grupo Y (Y2) do que no Grupo X (X2) em um momento posterior à
administração do tratamento provavelmente como resultado do tratamento oferecido.
Figura 17-10. Mortalidade cirúrgica ajustada entre pacientes da Medicare em 1998 e 1999, de
acordo com o volume de procedimentos realizados pelo cirurgião para 4 procedimentos
cardiovasculares (painel A) e 4 procedimentos de ressecção de câncer (painel B). A mortalidade
cirúrgica foi definida como a taxa de morte antes da alta hospitalar ou dentro de 30 dias após
procedimento índice. O volume de procedimentos realizados pelo cirurgião se baseou no número
total de procedimentos realizados. (De: Birkmeyer JD, Stukel TA, Siewers AE et al.: Surgeon
volume and operative mortality in the United States. N Engl J Med 349:2117-2127, 2003.)
Figura 17-11. Delineamento de um estudo de coorte não randomizado comparando usuários e
não usuários de um programa.
Entretanto, como observado na Figura 17-13 (direita da figura), é possível que os grupos
tenham sido originalmente diferentes e que seus prognósticos diferissem naquela ocasião, mesmo
antes que qualquer atendimento fosse prestado. Se esse fosse o caso, qualquer diferença na
morbidade observada após o tratamento (isto é, Y2 menor que X2) pode somente estar refletindo
as diferenças originais anteriores à administração do cuidado, e não trariam, necessariamente,
esclarecimentos sobre a efetividade do tratamento oferecido. Sem dados sobre níveis de
morbidade nos dois grupos antes da administração do tratamento, essa última explicação para as
observações não pode ser excluída.
TABELA 17-4. Relação entre Mortalidade Neonatal e História de Atendimento no Período de Pré-Natal, Residentes
em Baltimore Menores de 17 Anos, 1960-1961
Receberam cuidados no pré-natal Não receberam cuidados no pré-natal
Número de nascimentos 1.397 315
Número de mortes neonatais 42 28
Mortes neonatais por 1.000 nascidos vivos 30,1 88,9
Adaptada de Stine OC, Rider RV, Sweeney E: School leaving due to pregnancy in an urban adolescent population. J Public
Health 54:1-6, 1964.
Tendo em vista este problema, outra abordagem para a avaliação de programas seria usar uma
combinação de delineamentos, que envolva ambos os delineamentos: antes – depois e programa
– sem programa. Essa abordagem é demonstrada no exemplo a seguir, no qual foi avaliado o
atendimento ambulatorial de crianças com dor de garganta.
O estudo foi delineado para avaliar a efetividade do atendimento ambulatorial para dor de
garganta em crianças determinando se as crianças elegíveis para esse tipo de atendimento
tiveram menores taxas de febre reumática do que as crianças não elegíveis.10 A lógica foi a
seguinte: gargantas infeccionadas por estreptococos são comuns em crianças e se não tratadas
podem levar à febre reumática. Se as gargantas infeccionadas por estreptococos forem
adequadamente tratadas, a febre reumática pode ser prevenida. Portanto, se esses programas
forem efetivos no tratamento de gargantas infeccionadas por estreptococos, menos casos de febre
reumática deveriam ocorrer nas crianças que receberam o tratamento.
Figura 17-13. Duas possíveis explicações para uma diferença observada na morbidade entre o
Grupo X e o Grupo Y após o Grupo Y (apresentado em preto) ter recebido um serviço de saúde.
Veja discussão no texto nas páginas. 319 e 321-322.
Estudos de Casos-Controle
O uso do delineamento de casos-controle para avaliação dos serviços de saúde, incluindo vacinas
e outras formas de programas de prevenção e rastreamento, tem suscitado crescente interesse.
Embora o delineamento de casos-controle tenha sido inicialmente aplicado em estudos
etiológicos, quando se obtêm os dados adequados, esse delineamento pode servir como substituto
útil, porém limitado, para os ensaios randomizados. Contudo, como esse delineamento exige a
definição e especificação de casos, ele se aplica mais a estudos de prevenção de doenças
específicas. A “exposição” é, então, o método preventivo específico ou outra medida de saúde
que está sendo avaliada. Como na maioria das pesquisas com serviços em saúde, estratificação
por gravidade de doença e por outros possíveis fatores de prognóstico é essencial à interpretação
apropriada dos achados. Os problemas metodológicos associados a esses estudos (discutidos
extensivamente no Capítulo 10) também surgem quando o delineamento de casos-controle é
utilizado para avaliar efetividade. Em particular, estes estudos devem abordar a seleção de
controles e questões associadas com fatores de confusão.
Figura 17-14. Atendimento abrangente e incidência de febre reumática por 100.000 pessoas,
1968-1970; Baltimore, população negra, entre 5 e 14 anos. (Adaptada de Gordis L: Effectiveness
of comprehensive-care programs in preventing rheumatic fever. N Engl J Med 289:331-335,
1973.)
CONCLUSÃO
Este capítulo revisou a aplicação dos delineamentos de estudos epidemiológicos básicos para a
avaliação de serviços de saúde. Muitas das questões que surgem são semelhantes às dos estudos
etiológicos, embora, às vezes, apresentem idiossincrasias diferentes. Em estudos etiológicos
estamos basicamente interessados na possível associação de um potencial fator causal com uma
doença específica e fatores, como serviços de saúde, frequentemente, representam possíveis
fatores de confusão que devem ser considerados. Nos estudos de avaliação de cuidados à saúde,
estamos basicamente interessados nas possíveis associações de um atendimento, medidas
preventivas, desfechos e situações como uma doença preexistente, outros prognósticos e fatores
de risco, se tornam potenciais fatores de confusão que devem ser levados em consideração.
Consequentemente, embora permaneçam muitas das questões de delineamento, o foco da
pesquisa de avaliação recai, com frequência, sobre diferentes questões de medida e avaliação. O
ensaio randomizado permanece sendo o método ideal para demonstrar a efetividade de uma
intervenção em saúde. Ao iniciar qualquer estudo de avaliação de cuidados à saúde, devemos
perguntar, no princípio, se são biológica e clinicamente plausíveis, dado o conhecimento atual,
para esperarmos um benefício específico dos cuidados que estão sendo avaliados.
Por razões práticas, observações não randomizadas são também necessárias e devem ser
aproveitadas para que sejam expandidos os esforços de avaliação. Críticos de ensaios
randomizados argumentam que esses estudos incluem – e somente podem incluir – uma pequena
fração de todos os pacientes que receberam atendimento no sistema de cuidados à saúde, assim, a
generalização dos resultados é um problema em potencial. Embora isso seja verdade, a
generalização é um problema em qualquer estudo, não importando o quão grande seja a
população estudada. De qualquer maneira, mesmo que possamos refinar ainda mais a
metodologia dos ensaios clínicos, também precisaremos aperfeiçoar métodos para melhorar as
informações que possam ser obtidas mesmo de avaliações não randomizadas de serviços de
saúde.
É essencial o estudo de componentes específicos de cuidados, em vez do próprio programa de
atendimento em si. Dessa forma, se um elemento efetivo puder ser identificado em uma
combinação de muitas modalidades, os outros poderão ser eliminados, e a qualidade dos
cuidados pode ser aumentada de forma econômica.
No próximo capítulo, a discussão da avaliação será ampliada para um tipo específico de
programa de serviços de saúde: rastreamento de doenças em populações humanas.
REFERÊNCIAS
1. Frost WH: Rendering account in public health. Am J Public Health 15:394-398, 1925.
2. Gornick ME, Eggers PW, Reilly TW, et al: Effects of race and income on mortality and use
of services among Medicare beneficiaries. N Engl J Med 335:791-799, 1996.
3. Kalra L, Evans A, Perez I, et al: Alternative strategies for stroke care: A prospective
randomized controlled trial. Lancet 356:894-899, 2000.
4. Drummond AE, Pearson B, Lincoln NB, et al: Ten year follow-up of a randomized
controlled trial of care in a stroke rehabilitation unit. BMJ 331:491-492, 2005.
5. Kahn KL, Rubenstein LV, Draper D, et al: The effects of DRG-based prospective payment
system on quality of care for hospitalized Medicare patients: An introduction to the series.
JAMA 264:1953-1955, 1990.
6. Kosecoff J, Kahn KL, Rogerts WH, et al: Prospective payment system and impairment at
discharge: The “quicker and sicker” story revisited. JAMA 264:1980-1983, 1990.
7. Jollis JG, Peterson ED, DeLong ER, et al: The relation between the volume of coronary
angioplasty procedures at hospitals treating Medicare beneficiaries and short-term mortality.
N Engl J Med 331:1625-1629, 1994.
8. Birkmeyer JD, Stukel, TA, Siewers AE, et al: Surgeon volume and operative mortality in the
United States. N Engl J Med 349:2117-2127, 2003.
9. Stine OC, Rider RV, Sweeney I: School leaving due to pregnancy in an urban adolescent
population. J Public Health 54:1-6, 1964.
10. Gordis L: Effectiveness of comprehensive-care programs in preventing rheumatic fever. N
Engl J Med 289:331-335, 1973.
Taxa de Letalidade (CF), no Hospital para 100 Homens não Tratados em uma Unidade de Tratamento Coronariano
(CCU) e para 100 Homens Tratados em uma CCU, de acordo com uma Escala com Três Níveis Clínicos de Gravidade
de Infarto do Miocárdio (Ml)
PACIENTES NÃO CCU (NO. DE PACIENTES) PACIENTES CCU (NO DE PACIENTES)
Nível clínico Total Morte CF (%) Total Morte CF (%)
Moderado 60 12 20 10 3 30
Severo 36 18 50 60 18 30
Choque 4 4 100 30 13 43
5. Os autores concluíram que a UTC foi muito benéfica para homens com MI severo e para
aqueles em choque, pois as taxas de letalidade por caso no hospital para essas categorias
eram muito menores na UTC. Essa conclusão:
a. Está correta
b. Pode estar incorreta, pois foram usadas taxas de letalidade em vez de taxas de mortalidade
c. Pode estar incorreta, por um viés de referência, pelo envio de pacientes a esse hospital
feita por hospitais de cidades distantes
d. Pode estar incorreta por diferenças na atribuição do grau de gravidade na escala clínica,
antes e depois da abertura da UTC
e. Pode estar incorreta em razão de falha em reconhecer um possível decréscimo na taxa de
incidência anual de MI nos últimos anos