Avaliacao Impacto Politicas Saude Guia Sus

MINISTÉRIO DA SAÚDE
AVALIAÇÃO DE
IMPACTO DAS
POLÍTICAS DE SAÚDE
UM GUIA PARA O SUS
Brasília – DF
2023
Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde
Departamento de Ciência e Tecnologia
AVALIAÇÃO DE
IMPACTO DAS
POLÍTICAS DE SAÚDE
UM GUIA PARA O SUS
Brasília – DF
2023
2023 Ministério da Saúde.
Esta obra é disponibilizada nos termos da Licença Creative Commons – Atribuição – Não Comercial
– Compartilhamento pela mesma licença 4.0 Internacional. É permitida a reprodução parcial ou total
desta obra, desde que citada a fonte.
A coleção institucional do Ministério da Saúde pode ser acessada, na íntegra, na Biblioteca Virtual em Saúde do Ministério da
Saúde: bvsms.saude.gov.br.
Tiragem: 1ª edição – 2023 – versão eletrônica

Elaboração, distribuição e informações:
Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde
Departamento de Ciência e Tecnologia
Coordenação-Geral de Evidências em Saúde
Esplanada dos Ministérios, bloco G, Ed. Sede, sobreloja
CEP: 70058-900 – Brasília/DF
Ministra de Estado da Saúde:

Nísia Trindade Lima
Secretário de Ciência, Tecnologia, Inovação e Complexo da Saúde:

Carlos Augusto Grabois Gadelha
Organização:
Erika Santos de Aragão
Luís Eugenio Portela Fernandes de Souza
Marcio Santos da Natividade
Vinícius de Araújo Mendes
Acompanhamento técnico:
Ana Maria Caetano de Faria
Daniela Fortunato Rêgo
Fernanda Borges Serpa
Fernanda Madeira de Ley Botelho da Cunha
Jayne Cecília Martins
Letícia Alves Tadeu Santiago
Luiz Claudio Barcelos
Marina Melo Arruda Marinho
Patricia de Campos Couto
Projeto gráfico e diagramação:

Gilson Rabelo de Almeida Neto
Grasiela de Sousa Pereira
Luciana Travassos Sapucaia
Revisão:
Maria Creuza Ferreira da Silva
Maria Goret Ferreira de Moraes
Normalização:
Delano de Aquino Silva – Editora MS/CGDI
Ficha Catalográfica
Brasil. Ministério da Saúde. Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde. Departamento de
Ciência e Tecnologia.
Avaliação de impacto das políticas de saúde: um guia para o SUS [recurso eletrônico] / Ministério da Saúde,
Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde, Departamento de Ciência e Tecnologia. – Brasília:
Ministério da Saúde, 2023.
714 p. : il.
Modo de acesso: World Wide Web:

http://bvsms.saude.gov.br/bvs/publicacoes/avaliacao_impacto_politicas_saude_guia_sus.pdf
ISBN 978-65-5993-537-6
1. Avaliação – Políticas Públicas. 2. Avaliação de Impacto – Políticas Públicas. 3. Políticas Públicas de saúde. I.
Título.
CDU 614.2
Catalogação na fonte – Coordenação-Geral de Documentação e Informação – Editora MS – OS 2023/0383
Título para indexação:
Impact Evaluation of Health Policies: A Guide for The Brazilian Health System
SUMÁRIO
APRESENTAÇÃO 07
Avaliação de impacto das políticas de saúde: um guia para o SUS

Departamento de Ciência e Tecnologia – DECIT 08
INTRODUÇÃO
Avaliação de impacto das políticas públicas de saúde: uma introdução
Vinicius Mendes, Erika Aragão e Luís Eugenio Portela Fernandes de Sousa 12
PARTE 1:
INTRODUÇÃO À AVALIAÇÃO DE IMPACTO DE POLÍTICAS DE SAÚDE 30
CAPÍTULO 1
Avaliando o impacto na saúde da população de políticas e programas de proteção
social e de saúde implementadas no Brasil
Erika Aragão e Mauricio Lima Barreto 31
CAPÍTULO 2
Institucionalização da avaliação no âmbito do Executivo Federal: CMAP e editais de
pesquisa em saúde
Luciana Mendes Santos Servo e Rodrigo Pucci de Sá e Benevides 46
CAPÍTULO 3
Indicadores e medidas em saúde: conceitos e aplicações para as informações
disponíveis no Brasil
Mônica Viegas Andrade, Kenya Noronha, Aline Souza e Júlia Almeida Calazans 81
PARTE 2:
FUNDAMENTOS LÓGICOS E CONCEITUAIS 124
CAPÍTULO 4
Avaliação de impacto de políticas públicas: racionalidade, fundamentos lógicos e
experiências das políticas sociais
Naercio Menezes Filho e Bruno Kawaoka Komatsu 125
CAPÍTULO 5
Teoria da Mudança: definição, utilidade e como construir
Isabela Furtado, Carolina Marinho e Carolina Melo 156
CAPÍTULO 6
Projetando o impacto de intervenções futuras: princípios e métodos
Rodrigo Volmir Anderle, Felipe Alves Rubio, José Alejandro Ordoñez e
Davide Rasella 178
CAPÍTULO 7
Causalidade e sobredeterminação: abordagem translacional-transdisciplinar na
avaliaçao em saúde
Naomar de Almeida-Filho e Denise Coutinho 193
PARTE 3:
MÉTODOS DE INFERÊNCIA CAUSAL 230
CAPÍTULO 8
Diagramas causais e equações estruturais na avaliação de políticas públicas
Marcelo M. Taddeo, Leila Denise Amorim e Rosana Aquino 231
CAPÍTULO 9
Introdução aos modelos experimentais e não-experimentais aplicados à avaliação
de políticas públicas em saúde
Aléssio Tony Cavalcanti de Almeida e Antônio Vinícius Barros Barbosa 267
CAPÍTULO 10
Randomized Controlled Trials: os experimentos aleatórios em políticas públicas
André Portela Souza, Lycia Lima e Caio Castro 291
CAPÍTULO 11
Métodos baseados em escore de propensão e suas aplicações em avaliação de
políticas de saúde
Dandara de Oliveira Ramos e Rosemeire Leovigildo Fiaccone 307
CAPÍTULO 12
O Método diferenças-em-diferenças
Bladimir Carrillo Bermudez e Danyelle Santos Branco 329
CAPÍTULO 13
Regressão descontínua e aplicações na área de saúde
Breno Sampaio e Giuseppe Trevisan 344
CAPÍTULO 14
O método de variáveis instrumentais e aplicações em políticas de saúde
Rudi Rocha 370
PARTE 4: CIÊNCIA DE DADOS COM FOCO NO DATASUS 385
CAPÍTULO 15
Um debate sobre dados pessoais e dados sensíveis para pesquisa científica e para
pesquisa em saúde pública a partir da Lei Geral de Proteção de Dados
Bethânia Almeida 386
CAPÍTULO 16
Segurança no uso dos dados sensíveis para pesquisa em saúde: Repositório de
dados
Marcio Natividade, Samilly Silva Miranda, Alberto Sironi, Evandro Mota Lopes e Juracy
Bertoldo 401
CAPÍTULO 17
Acesso aos dados agregados e microdados do SUS
Raphael de Freitas Saldanha, Marcel de Moraes Pedroso e
Monica de Avelar F. M. Magalhães 418
CAPÍTULO 18
Modelagem e gestão de banco de dados com SQL e integração com o R
Felipe Ferré 435
CAPÍTULO 19
Manipulando dados no R
Wagner Hugo Bonat 502
CAPÍTULO 20
Introdução à visualização de dados com o R
Marcelo S. Perlin 544
CAPÍTULO 21
Análise de regressão
Gleice M. S. Conceição e Maria do Rosário de Oliveira Latorre 576
CAPÍTULO 22
Machine learning em políticas públicas de saúde
Alexandre Chiavegatto Filho 615
PARTE 5:
POLÍTICAS INFORMADAS POR EVIDÊNCIAS E TRADUÇÃO DO CONHECIMENTO 634
CAPÍTULO 23
Evidências para políticas de saúde: aspectos conceituais e suas implicações para
avaliações de impacto
Jorge Otávio Maia Barreto e Maurício Mota Saboya Pinheiro 635
CAPÍTULO 24
A tradução do conhecimento e a avaliação de impacto de políticas e programas de
saúde
Luís Eugenio Portela Fernandes de Souza, Daniela Fortunato Rego e Roberta Borges
Silva 672
CAPÍTULO 25
Como comunicar evidências científicas para gestores públicos e tomadores de
decisão?
Fabiana Mascarenhas e Luciano Maximo 686
APRESENTAÇÃO
Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

7
Avaliação de impacto das políticas
de saúde: um guia para o SUS
Departamento de Ciência e Tecnologia – Decit
8 Ministério da Saúde
O campo de avaliação de políticas públicas vem se consolidando na administração pública
como um passo fundamental do ciclo da política pública. Incorporar de forma sistemática
essa prática, particularmente no que se refere à avaliação de impacto de políticas de saúde,
é fundamental para o aprimoramento e fortalecimento do Sistema Único de Saúde (SUS).
Por isso, é com grande satisfação que se entrega esta obra – Avaliação de impacto das
políticas de saúde: um guia para o SUS – cujo objetivo é colaborar para o processo de
institucionalização da pesquisa em avaliação de impacto das ações no âmbito das políticas
de saúde.
Obviamente uma obra desse porte é um projeto de longo prazo que envolve muitos
profissionais, tanto do ministério quanto aqueles vinculados a outras instituições, como
prova o amplo leque de autores que se dedicaram para colocar seu conhecimento neste
registro. Esse é um ponto que vale a pena destacar, não somente pela abrangência que o
livro toma para si, mas para lembrar que este projeto começou há algum tempo, com duas
oficinas realizadas em 2018 e 2019, em momentos de reunir ideias, contemplar abordagens
e definir conteúdo. Isso mostra que o compromisso com o uso de evidências no exercício
de avaliação de políticas perpassa diferentes gestões do Ministério da Saúde. Desse modo,
esta obra assume contornos programáticos dos mais relevantes.
A cultura da avaliação das políticas públicas vem se fortalecendo por normativas recentes,
tais como o Decreto nº 9.203 de 22/11/2017 e o Decreto nº 10.411 de 30/6/2020, os quais
estabelecem o uso de evidências e metodologias de pesquisa na elaboração,
implementação e revisão das políticas públicas. Ademais, o Decreto nº 11.358 de 1/1/2023
define, dentre as competências do Decit/SECTICS/MS, coordenar a elaboração, execução
e avaliação de programas e projetos de saúde.
Assim, entende-se que se aprofunda, no âmbito das políticas de saúde, as orientações

consagradas em publicações de referência, lançadas em 2018 pela Casa Civil e Instituto
de Pesquisas Aplicadas: Avaliação de Políticas Públicas: Guia Prático de Análise Ex-Ante
e Avaliação de Políticas Públicas: Guia Prático de Análise Ex-Post. O indispensável
panorama geral traçado por esses guias precisava ser complementado tendo-se em mente
especificamente as políticas de saúde. Essa é a lacuna que a presente obra tem por objetivo
contribuir para preencher.

9
Importante registrar que essa publicação foi elaborada no contexto de uma cooperação
entre o Ministério de Saúde, por meio do Departamento de Ciência e Tecnologia (Decit), e
a Universidade Federal da Bahia, por meio do Instituto de Saúde Coletiva (ISC). Essa
cooperação visa contribuir para a institucionalização da pesquisa avaliativa por intermédio
desta obra, a qual apresenta aspectos conceituais e metodológicos a serem empregados
em avaliações de impacto, bem como pela capacitação de profissionais dos quadros do
Ministério da Saúde, tanto em nível de formação quanto na elaboração de avaliações
executivas, enquanto porta de entrada para o processo avaliativo.
Espera-se que este guia subsidie fortemente os profissionais que realizarão avaliações de
impacto, apresentando grande parte do referencial conceitual e arsenal metodológico
disponíveis. Por outro lado, almeja-se sensibilizar gestores do SUS que atuam nos diversos
níveis da administração pública para a importância da cultura de avaliação e a toda a gama
de práticas avaliativas, particularmente de avaliação de impacto, as quais podem ser
acessadas para estudar os resultados finalísticos de intervenções de saúde.
A avaliação de impacto de políticas, programas, projetos, estratégias ou outras

intervenções de saúde, refletindo sobre a efetividade, eficiência e eficácia dessas, como
demonstrado ao longo dos capítulos deste livro, dialoga com o desenvolvimento de
métodos capazes de mensurar com rigor científico o nexo causal entre determinada
intervenção sendo executada e a realidade que essa buscava alterar. Torna-se nítido,
então, a incorporação, no exercício de avaliação de impacto, de técnicas estatísticas e
econométricas, baseadas em abordagens experimentais ou quase-experimentais que se
valem de processos de aleatorização e seus substitutos. É relevante apontar também que
a maior disponibilidade de dados e aprimoramento dos sistemas de informação vem ao
encontro do atendimento da demanda avaliativa, a qual integra o ciclo da política pública.
No mesmo sentido, é de interesse lembrar os esforços do Decit para promover a

transparência ativa da produção científica gerada pelo Ministério da Saúde, por meio de
reestruturação de sistema de coleta e disponibilização de informações e evidências
científicas. Assim, transformar e impulsionar a forma como se faz uso da pesquisa científica
é um importante recurso para as políticas públicas, aumentando para toda a sociedade o
conhecimento sobre o fazer científico. Historicamente o desenvolvimento científico
encontrou desafios para a tradução do conhecimento visando sua incorporação ao
processo de tomada de decisão. Nesse contexto, buscamos reduzir as distâncias e permitir
a aproximação dos vários atores envolvidos: pesquisadores, gestores, sociedade, indústria,
órgãos de controle e outros. Iniciativas dessa natureza contribuem para que no futuro se
possa atingir a almejada avaliação de impacto da pesquisa para o SUS.
Que os esforços para sistematizar e disponibilizar informações se conjuguem com esta

publicação, a qual congrega aspectos teóricos e práticos do exercício de avaliação de
impacto. Em um primeiro momento, essa obra ficará disponível no formato digital, como
forma de alcançar o público mais amplo possível.
Boa leitura, bons estudos e que o conhecimento sobre avaliação de impacto sistematizado
nesta obra se materialize na gestão em saúde no SUS.
Departamento de Ciência e Tecnologia – Decit

Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde – SECTICS
Ministério da Saúde

11
Introdução
Avaliação de impacto das políticas

públicas de saúde: uma introdução
Vinícius de Araújo Mendes1

Erika Santos de Aragão2
Luís Eugenio Portela Fernandes de Souza2
Faculdade de Economia, Universidade Federal da Bahia (PPGE-UFBA)

1
Instituto de Saúde Coletiva, Universidade Federal da Bahia (ISC-UFBA)

2
1 Introdução
A expressão Avaliação de Políticas Públicas adentrou o debate público no Brasil na década

de 2010, o que inclusive rendeu o esforço da Casa Civil da Presidência da República de
organizar dois excelentes guias sobre o assunto: o Guia Prático de Análise ex ante
(BRASIL, 2018a) e o Guia Prático de Análise ex post (BRASIL, 2018b). Esse processo de
institucionalização da avaliação no âmbito do Executivo Federal é descrito no capítulo 2
deste livro.
O debate acadêmico sobre a avaliação de políticas públicas, no entanto, remete a décadas

anteriores e passou por diferentes fases ao longo do tempo. Alguns fatores explicam o
motivo desse tema ser tão presente na agenda acadêmica nos últimos 30 anos: novas
metodologias, maior acesso a dados (em especial microdados), mais recursos para
financiamento de experimentos com foco em políticas sociais em países em
desenvolvimento e, consequentemente, maior interesse acadêmico na agenda com a
finalidade de contribuir para melhorar a situação econômica e social, incluída a da saúde
das populações.
Os livros-textos atuais sobre avaliação de políticas públicas – ou avaliação de impacto ou

inferência causal – partem do Modelo de Resultados Potenciais para mostrar que causa é
resultado da comparação entre uma situação factual e uma situação contrafactual
(hipotética) quando o único elemento de mudança nos dois cenários é a exposição a uma
intervenção, aqui traduzida como Política Pública. Para esses diversos livros, esse ponto
de partida faz referência ao Modelo de Rubin1. Angrist e Pischke apresentam tal modelo no
Capítulo 2 de Mostly Harmless (2008) e no Capítulo 1 de Mastering Metrics (2015); Imbens
e Rubin (2015) apresentam tal framework no Capítulo 1 e a história do modelo desde
estatísticos clássicos até Rubin 1974, Capítulo 2.
É notável que, apesar da ideia de causalidade para avaliação de intervenções, como

políticas públicas, estar fundada em um artigo da década de 1970, a explosão de artigos
acadêmicos com foco em avaliar intervenções nas áreas sociais – educação, saúde,
mercado de trabalho, desenvolvimento em geral – ocorreu quase três décadas depois. Essa
agenda de pesquisa, cujo cerne era estabelecer relações causais, com aplicações políticas
sociais, provocou uma revolução empírica e deu a Abhijit Banerjee, Esther Duflo e Michael
1
Donald Rubin e seu artigo canônico de 1974.

13
Kremer o Prêmio Nobel de Economia de 2019, pelo uso de experimentos (Randomized
Controlled Trials) para testar o impacto de políticas sociais em países em desenvolvimento.
Dois anos mais tarde, essa mesma agenda deu a David Card, Joshua Angrist e Guido
Imbens o Prêmio Nobel de Economia pelo uso de experimentos naturais como estratégia
para identificar relações causais entre políticas públicas e situação social.
O recurso a experimentos naturais foi muito importante, em especial nas décadas de 1980
e 1990, para se aprofundar o debate sobre as fontes de vieses em trabalhos empíricos e
como corrigi-los. Causalidade era sinônimo de identificação. Ou seja, se o experimento
natural corrigia a fonte de viés, o parâmetro estimado era identificado sem viés e, portanto,
a relação causal era estabelecida2. Essa literatura teve forte inserção na área de economia
do trabalho, educação, saúde, demografia, economia política e democracia, entre outras3.
Um exemplo de experimento natural muito utilizado foi a ocorrência de nascimento de
gêmeos. Em 1980, Rosenzweig e Wolpin publicaram um artigo no qual testavam como
quantidade e qualidade (capital humano, educação) interagem na escolha pelo número
ótimo de filhos, usando gêmeos como experimento natural4. Ponczek e Souza (2012)
fizeram esse exercício no Brasil e incorporaram todos os avanços da literatura. Gêmeos
foram utilizados como experimento natural para se testar o retorno da escolaridade na
educação por Ashenfelter e Krueger (1994). Nos anos 2000, os estudos que recorreram a
experimentos e quase-experimentos tornaram-se protagonistas e colocaram a Avaliação
de Políticas Públicas em destaque. Esses estudos recuperaram a contribuição seminal de
Rubin (1974) e puseram uma lupa em um problema de viés mais específico – o viés de
seleção.
A abordagem experimental de Avaliação de Políticas Públicas parte da ideia de que, se a

escolha do grupo de tratamento – e consequentemente do grupo de controle – for
totalmente aleatória, o problema de viés de seleção estaria superado e a comparação na
2
Ao se estimar o modelo 𝑌𝑌 = 𝑋𝑋𝑋𝑋 + 𝜀𝜀 com correlação entre X e 𝜀𝜀 diferente de zero, 𝑐𝑐𝑐𝑐𝑐𝑐(𝑋𝑋, 𝜀𝜀) ≠ 0, isto
significa que X afeta Y, (𝑋𝑋 → 𝑌𝑌), 𝜀𝜀 afeta Y, (𝜀𝜀 → 𝑌𝑌), e Y é afetado por X via 𝜀𝜀, (𝜀𝜀 → 𝑋𝑋 → 𝑌𝑌). Portanto, quando
isso ocorre 𝛽𝛽 é estimado com viés (captura tanto o efeito 𝑋𝑋 → 𝑌𝑌 quanto o efeito 𝜀𝜀 → 𝑋𝑋 → 𝑌𝑌). A literatura de
experimentos naturais busca um experimento natural, como nascimento de gêmeos, um choque climático,
uma mudança de lei, alguma fonte de variação exógena que anule o efeito de 𝜀𝜀 em X. Assim, uma vez
anulado, 𝛽𝛽 captura apenas o impacto de X em Y, ou 𝑋𝑋 → 𝑌𝑌. Portanto, a literatura de identificação indica que
𝛽𝛽 captura o efeito causal de X em Y.
3
Rosenzweig; Wolpin (2000) fazem ampla revisão da literatura de experimentos naturais em economia.
4
A ideia é bem intuitiva. Quanto maior a quantidade de filhos que um casal decide ter, é mais custoso
proporcionar qualidade a todos (educação, saúde etc.). Ao decidir ter menos filhos, o casal pode estar
trocando quantidade de filhos por qualidade. Na literatura isso ficou denominado Quantity-Quality Trade-off.
No entanto, comparar um casal que decidiu ter um filho com um casal que decidiu por dois filhos seria
comparar grupos diferentes. Ao se utilizarem gêmeos, a literatura consegue comparar um casal que decidiu
por um filho com um casal que também decidiu por um filho, mas um experimento da natureza proporcionou
dois filhos a esse casal com a ocorrência de gêmeos.
média entre o grupo de tratamento e o grupo de controle representaria o efeito médio do
tratamento sobre os tratados ou Average Treatment Effect on the Treated (ATT). Em 2007,
Duflo, Kremer e Gleenerster divulgaram um toolkit completo sobre o uso de aleatorização
em pesquisa sobre desenvolvimento econômico5 voltada para avaliar o impacto de políticas
públicas em áreas como pobreza, nutrição, educação, finanças e saúde, com a finalidade
de aumento do bem-estar da população afetada pela política pública6. Vale registrar que o
periódico Social Science & Medicine dedicou o volume 2010 do ano 2018 à discussão sobre
os potenciais e os limites do uso de Randomized Controlled Trials (RCTs) para avaliar
políticas públicas em diversas áreas como medicina, sociologia, educação, economia,
tendo como autores especialistas Andrew Gelman, Judea Pearl, Angus Deaton, Nancy
Cartwright e Guido Imbens, entre outros7.
O uso de RCTs para avaliar intervenções tem o grande potencial de estimar as relações de
causa e efeito e permite o controle de vieses, notadamente o de seleção. Suas limitações,
contudo, não são pequenas e a primeira é o custo de realização de tais experimentos.
Algumas instituições financiam a prática de RCTs para se avaliar políticas públicas em
países em desenvolvimento, como o caso do J-PAL, Banco Mundial, Banco Interamericano
de Desenvolvimento. Pesquisadores com acesso a recurso conseguiriam planejar e
conduzir um experimento aleatório. Porém, nesse ponto, a segunda limitação seria ter
acesso a uma localidade em um país-alvo e convencer tanto o público local quanto as
autoridades sobre os benefícios de se conduzir tal pesquisa. Por fim, existem limites
institucionais e éticos que inviabilizariam a realização de um experimento. Exemplo disso
seria uma política pública de saúde no Brasil. Uma vez que o sistema é universal, garantir
uma intervenção em um grupo (tratado) e não proporcionar o acesso a tal política ao grupo-
controle fere o importante princípio da universalidade do SUS. Então, quando um
5
Anterior ao Tookit, Shadish, Cool e Campbell (2001) era um livro-texto referência sobre o assunto. Imbens
e Rubins (2015) são uma referência atual sobre o assunto, dedicando toda a Parte II do livro à literatura
estatística e econométrica dos Experimentos Aleatórios Clássicos.
6
Importante fazer a ressalva de que a prática de se separarem dois grupos, o tratado e o controle, por um
processo aleatório, fazer uma intervenção apenas no grupo de tratamento e, após um certo período, compará-
los para se testar o efeito de tal intervenção é o padrão-ouro da prática clínica. É a forma tradicional de se
testar novos medicamentos, por exemplo, em experimentos duplo-cegos ou triplo-cegos. Tal prática é mais
antiga do que a similar aplicação em avaliação de Políticas Públicas. As aplicações clínicas são realizadas
em escala menor, usualmente, com maior controle sobre todos os fatores que podem influenciar o resultado
potencial, em especial confounding, externalidades, desbalanceamento, que são problemas reais em um
experimento. O grupo de controle recebe um placebo, o que não alteraria seu comportamento em relação ao
grupo dos tratados. Em Políticas Públicas, escalas são usualmente maiores, há maior dificuldade de se coletar
informações a todo instante para se controlar os possíveis efeitos que contaminariam o resultado potencial e,
por fim, o grupo de controle, ao não receber a intervenção pública, pode mudar seu comportamento (não
existe aqui normalmente um placebo nesse grupo).
7
Kawachi, Subramanian e Ryan (2018).

15
experimento não é o caminho metodológico para se avaliar uma política pública, a outra
opção é buscar um quase-experimento8.
O desenho do quase-experimento depende do desenho da política (intervenção), da

disponibilidade e organização dos dados e do planejamento da avaliação, se ex-ante ou
ex-post. Parte da literatura sobre quase-experimentos concentra-se em estudos
observacionais. Essa literatura remete a Rosenbaum e Rubin9 no início dos anos 1980 e a
Dehejia e Wahba10 no final dos anos 1990 e início dos anos 2000. Outra parte dessa
literatura orienta-se pelo conceito de Variável Instrumental, conceito previamente explorado
nos experimentos naturais. O experimento natural era, nesse caso, o instrumento, a fonte
de variação exógena que controlava o viés e permitia estabelecer-se uma relação de causa-
e-efeito entre X e Y. Durante a década de 1990, a literatura de variável instrumental se
encontra com a literatura de Resultados Potencias11. Dois braços dessa literatura Quase-
Experimental merecem destaques: desenhos com Diferenças-em-Diferenças e desenhos
com Regressão descontínua. O destaque nesses dois métodos deve-se aos avanços
metodológicos que tal literatura sofreu nos últimos anos12.
O público interessado em avaliação de políticas públicas era contemplado pela literatura

canônica experimental e quase-experimental em manuais clássicos como o Impact
Evaluation in Practice do Banco Mundial13 e o Avaliação Econômica de Projetos Sociais da
Fundação Itaú de Menezes Filho e Pinto (2017), além do clássico Mostly Harmless
Econometrics de Angrist e Pischke (2008). Tais manuais, bem estabelecidos no campo de
avaliação de políticas públicas, apresentam ao leitor (pesquisador, avaliador, gestor) os
fundamentos e as aplicações básicas dos principais métodos nas áreas de
desenvolvimento e de projetos sociais. Os avanços recentes da literatura aparecem nos
manuais publicados na terceira década dos anos 2000, como Causal Inference: The
Mixtape, de Scott Cunningham (2021), The Effect: An Introduction to Research Design and
Causality, de Nick Huntington-Klein (2022), ambos da econometria; e da epidemiologia, o
manual Causal Inference: What If, de Miguel Hernán e James Robins (2020).
8
Quase-experimento é a tradução realizada pela literatura nacional de Quasi-Experimental Designs.
9
Rosenbaum; Rubin (1983), Rosenbaum; Rubin (1984).
10
Dehejia; Wahba (1999), Dehejia; Wahba (2002) e Dehejia (2005).
11
Imbens; Angrist (1994).
12
Para a literatura sobre Diferenças-em-Diferenças, Roth et al. (2022) fazem uma atualização dos recentes
métodos e avanços. Para a literatura sobre Regressão Descontínua, ver Cattaneo e Titiunik (2022).
13
Primeira edição de 2011 e segunda edição de 2016. Livro disponível, pelo Banco Mundial, em inglês
(original), português, espanhol e francês: Gertler et al. (2016).
Assim, faltava na literatura brasileira um livro sobre avaliação de políticas públicas que
discutisse tanto as versões canônicas dos modelos experimentais e quase-experimentais
e seus avanços metodológicos mais recentes quanto inclusive visões críticas sobre o
conceito de causalidade. Faltava também um livro que jogasse luz sobre as políticas
públicas de saúde, com foco no SUS especificamente, ainda que sem esquecer as
experiências internacionais.
Além disso, este livro busca avançar em outras direções: (1) reconta as experiências de
avaliação de políticas públicas sociais e de saúde; (2) apresenta ao leitor caminhos para
interpretar os principais indicadores em saúde; (3) debate a questão do acesso aos dados
e como utilizá-los em pesquisas empíricas, sem ferir a privacidade das pessoas; e 4) discute
a comunicação de achados científicos para o público em geral.
O livro é escrito para públicos diversos e se destina a acadêmicos ou cientistas que realizam
(ou desejam realizar) avaliações de impacto de políticas de saúde, autoridades políticas e
gestores e técnicos de serviços públicos que precisam e demandam tais avaliações para
subsidiar suas decisões sobre a formulação, a implementação e a (des)continuação de
políticas de saúde.
2 O livro: sua história, objetivos e potenciais alcances
A ideia original deste livro ocorre em 2018, quando gestores e técnicos do Ministério da
Saúde sentem a necessidade de institucionalizar a prática da avaliação de impacto e, para
isso, buscam apoio de pesquisadores e acadêmicos avaliadores de políticas públicas. A
essa altura, os Guias Ex Ante e Ex Post eram uma realidade no setor público brasileiro, em
especial na esfera federal, e o termo Avaliação de Políticas Públicas havia se tornado mais
corriqueiro dentro do governo federal.
Assim, em dezembro de 2018, o Departamento de Ciência e Tecnologia do Ministério da

Saúde (Decit), em parceria com o Hospital Alemão Oswaldo Cruz, organiza a 1ª Oficina
para Elaboração de Diretrizes de Avaliação de Impacto de Políticas e Programas de Saúde.
De acordo com a chamada do evento, a “[...] oficina tem o objetivo de reunir pesquisadores
e gestores com experiência na condução de avaliação de programas em saúde visando a
construção de diretrizes para a condução de avaliações no âmbito do SUS [...]”. A Figura

17
1, abaixo, mostra os principais pontos abordados pelos nove palestrantes dessa primeira
oficina.
Figura 1 - Resumo dos Debates da Primeira Oficina
Fonte:
Fonte: Atrium FacilitaçãoVisual,
Atrium Facilitação Visual,2018,
2018,
1º 1º Oficina
Oficina Avaliação
Avaliação de Políticas
de Políticas de Saúde,
de Saúde, Ministério
Ministério daeSaúde
da Saúde HAOC.e
HAOC.
No ano 2019, o Decit organiza mais duas Oficinas para Elaboração de Diretrizes de
Avaliação de Impacto de Políticas e Programas de Saúde: a segunda, em maio, em nova
parceria com o Hospital Alemão, e a terceira, em dezembro, em parceria com o Hospital do
Coração. Ao todo, entre palestrantes e colaboradores, mais de 60 pessoas estiveram
envolvidas nas segunda e terceira oficinas.
O resultado desse intenso debate foi uma proposta de elaboração de um guia orientador
da realização de pesquisas de avaliação de impacto, útil a pesquisadores e a gestores
interessados em conduzir e em interpretar estudos avaliativos. A proposta desse guia
transforma-se, em 2021, no projeto de elaboração do presente livro, liderado pelo Programa
de Economia, Tecnologia e Inovação em Saúde (PECS) do Instituto de Saúde Coletiva da
Universidade Federal da Bahia (ISC-UFBA). Dois anos depois, o livro está sendo publicado.
A estrutura do livro, com suas seções e capítulos, assim como a seleção de autores e
autoras, emergiu das contribuições recebidas desde a 1ª oficina mencionada e evoluiu por
meio do contato direto entre gestores do Ministério da Saúde, notadamente da
Coordenação de Evidências e Informações Estratégicas para Gestão em Saúde, vinculada
ao Decit, e pesquisadores das áreas de Economia da Saúde, Política de Saúde e Avaliação
de Políticas Públicas.
Em setembro de 2021, realizou-se nova oficina com todos os 58 autores e autoras

convidados, cujo objetivo foi discutir e pactuar a estrutura do livro e os conteúdos a serem
desenvolvidos nos diversos capítulos, de modo que o livro viesse a cumprir o papel de guia
para a avaliação de políticas públicas de saúde, apoiando o diálogo entre gestores e
técnicos do SUS, de um lado, e pesquisadores e avaliadores de políticas públicas do outro.
Ao todo, 60 autores e autoras, vinculados a 29 instituições (universidades, faculdades,
institutos de pesquisa, órgãos do governo, centros, grupos de pesquisas, dentre outros),
participaram, ao longo do ano de 2022, das discussões e da redação dos 25 capítulos que
compõem o livro.
3 A estrutura do livro
O livro se inicia com uma reflexão da equipe do Departamento de Ciência e Tecnologia do

Ministério da Saúde, à guisa de apresentação, e com uma descrição do processo e do
produto elaborada pelos organizadores do livro, à guisa de introdução. A apresentação e a
introdução têm como objetivo principal explicitar a motivação, os conceitos básicos e as
estratégias que orientaram as equipes do Decit/MS e do ISC/UFBA na realização do
projeto. Têm também o objetivo de apontar como se articulam as partes e os capítulos do
livro, mostram que mesmo escritos por autores e autoras independentes todos se conectam
no propósito maior de guiar a realização de estudos de avaliação de políticas públicas,
discutem desde seus fundamentos até seus limites e passam pela discussão de modelos,

19
aplicações e ferramentas e pelas questões de comunicação e utilização dos resultados das
avaliações nos processos de formulação e implementação de políticas.
Para atingir tais objetivos, o livro foi estruturado em cinco partes – (1) Introdução à avaliação
de impacto de políticas de saúde; (2) Fundamentos lógicos e conceituais; (3) Métodos de
inferência causal; (4) Ciência de dados com foco no DataSUS; e (5) Políticas informadas
por evidências e tradução do conhecimento – as quais serão detalhadas a seguir.
Parte 1: Introdução à avaliação de impacto de políticas de saúde
A parte 1 do livro apresenta ao leitor o debate atual sobre Avaliação de Impacto de Políticas,
com foco em saúde, uma atenção especial para a saúde pública, sem se aprofundar na
discussão sobre métodos de avaliação. Trata-se de um convite ao leitor para se familiarizar
com os conceitos e as teorias da área, recorrendo-se a exemplos de avaliações de políticas
públicas de saúde.
O capítulo 1 – Avaliação de Impacto de Políticas e Programas de Saúde no Brasil – de

autoria de Maurício Barreto (ISC/UFBA e Cidacs/Fiocruz) e Erika Aragão (ISC/UFBA), usa
exemplos de avaliações realizadas pelas duas instituições, como a do programa Aqui Tem
Farmácia Popular e a do impacto do Programa Bolsa Família na mortalidade infantil para
mostrar a experiência brasileira de avaliação de políticas de saúde e destaca a importância
de se contar com grandes bancos de dados (Big Data) – no caso, a coorte de 100 milhões
de brasileiros e brasileiras.
O capítulo 2 – Institucionalização da Avaliação no Âmbito do Setor Público – de Luciana

Servo (IPEA) e Rodrigo Benevides (IPEA), narra a experiência dos dois pesquisadores no
esforço de se institucionalizar a avaliação de políticas públicas na esfera federal. Os autores
analisam avaliações financiadas pelo próprio Ministério da Saúde e é importante ressaltar
que esses participam do debate sobre Avaliação de Políticas Públicas desde a década de
2010, quando se geraram os referidos Guias Ex-Ante e Ex-Post, da Casa Civil e do IPEA.
No capítulo 3 – Indicadores e medidas em saúde: conceitos e aplicações para as

informações disponíveis no Brasil – quatro pesquisadoras da Universidade Federal de
Minas Gerais – Monica Viegas, Kenya Noronha, Aline Souza e Julia Calazans – apresentam
os principais indicadores e medidas em saúde usados para mensurar o estado de saúde
de uma população. Nesse capítulo são apresentadas as principais bases de dados
domiciliares ou de registros administrativos disponíveis e se discutem quais medidas –
individuais ou agregadas –podem ser geradas e utilizadas em estudos de avaliação de
Parte 2: Fundamentos lógicos e conceituais
A parte 2 do livro se inicia com o capítulo 4 – Avaliação de Impacto de Políticas

Públicas: Racionalidade, Fundamentos Lógicos e Experiências das Políticas Sociais – de
Naercio Menezes Filho (Insper e FEA-USP) e Bruno Komatsu (Insper). Esse capítulo é
central para o entendimento dos conceitos e das aplicações da avaliação de impacto. Com
efeito, os autores apresentam os fundamentos da Avaliação de Políticas Públicas, com
base em uma extensa revisão da literatura e em resultados de estudos avaliativos de
políticas sociais no Brasil voltadas para problemas ou áreas como pobreza e desigualdade
de renda, consumo, saúde e nutrição, educação e mercado de trabalho.
As pesquisadoras do Insper – Isabela Furtado, Carolina Marinho e Carolina Melo – dedicam

o capítulo 5 à Teoria da Mudança, ferramenta para o desenho, o monitoramento e a
avaliação de políticas públicas. O cerne do capítulo é apresentar ao leitor o significado e a
importância de explicitar a teoria da mudança que subjaz a qualquer política pública e, para
isso, recorre a um exemplo prático. Vale ressaltar que representa uma inovação o destaque
que o presente livro dedica ao tema – um capítulo inteiro sobre a Teoria da Mudança14. De
fato, livros consagrados de Avaliação de Políticas Públicas abordam a Teoria da Mudança
como um tópico contido em um capítulo mais abrangente, como no caso do Getler et al.
(2016), que dedica apenas uma seção ao tema no capítulo 2.
Ainda que a avaliação ex-post tenha proeminência neste livro, o capítulo 6 – Projetando e
avaliando o impacto de intervenções futuras: princípios e métodos – escrito por Rodrigo
Volmir, Felipe Rubio, José Ordoñez e Davide Rasella, pesquisadores do ISC/UFBA,
apresenta os fundamentos das avaliações de impacto ex-ante com foco em modelos
matemáticos e estatísticos preditivos do comportamento da morbidade (hospitalização) e
da mortalidade por diferentes causas em segmentos diversos da população. Dentre os
14
Tal destaque deve-se às contribuições da Professora Elizabeth Moreira dos Santos (ENSP) na Terceira
Oficina para elaboração de Diretrizes Metodológicas para Avaliação de Impacto de Políticas de Saúde,
ocorrida nos dias 5 e 6 de dezembro de 2019 em Brasília.

21
métodos, o capítulo discute as séries temporais, os modelos comportamentais, a
microssimulação e os modelos baseados em agentes.
No capítulo 7 – Causalidade e sobredeterminação: abordagem translacional-
transdisciplinar nas Ciências da Saúde – Naomar de Almeida-Filho (ISC/UFBA e IEA/USP)
e Denise Coutinho (Instituto de Psicologia/UFBA) problematizam a ideia clássica de
determinação causal e introduzem o conceito de sobredeterminação, visando a construção
de modelos de avaliação tecnológica, os quais, por meio da articulação transdisciplinar de
estratégias de pesquisa, sejam capazes de dar conta de problemas complexos no campo
da saúde. Vale ressaltar que se trata de outra inovação deste livro, o que o distingue dos
manuais de avaliação: a inclusão de um capítulo crítico aos fundamentos da prática
hegemônica de avaliação que, além disso, pragmaticamente oferece modelos alternativos.
Parte 3: Métodos de inferência causal
A parte 3 do livro apresenta os métodos clássicos para inferência causal. Aqui, o leitor terá
contato com diferentes métodos e suas aplicações e conhecerá as potencialidades e os
limites de cada um. Nessa discussão, serão privilegiados exemplos da literatura de saúde,
saúde pública e epidemiologia. Como citado, os principais livros sobre inferência causal e
avaliação de políticas públicas tinham como ponto de partida o Modelo de Resultados
Potenciais de Rubin. Apenas os livros mais recentes apresentam ao leitor uma visão
alternativa para se pensar causalidade, especialmente aquela de Judea Pearl.
O capítulo 8 – Diagramas Causais e Equações Estruturais na Avaliação de Políticas

Públicas – escrito por Marcelo Taddeo (IME/UFBa), Leila Amorim (IME/UFBa) e Rosana
Aquino (ISC/UFBA) destaca especialmente a contribuição de Judea Pearl e apresenta o
uso de diagramas causais enquanto técnica para se entender os mecanismos causais de
dada intervenção (uma política pública de saúde, por exemplo)15.
O capítulo 9 – Introdução aos Modelos Experimentais e Não-Experimentais Aplicados à

Avaliação de Políticas Públicas em Saúde – escrito por Aléssio Almeida e Antonio Vinícius
Barbosa, ambos do Departamento de Economia da Universidade Federal da Paraíba,
apresenta uma esquematização para a escolha do método de inferencial causal de alguns
parâmetros e inclui o desenho da política pública (experimental ou quase-experimental), a
15
Cunningham (2021) apresenta os DAG – Directed Acyclic Graphs – em seu Capítulo 3, Huntington-Klein
(2022) em seu capítulo 6 e Hernán e Robins (2020) também em seu capítulo 6.
disponibilidade de dados (longitudinal ou corte transversal), o número de unidades tratadas
e a existência de problemas na implementação da intervenção. Ressalte-se que o método
de Controle Sintético é somente apresentado nesse capítulo.
No capítulo 10 – Randomized Controlled Trials: os experimentos aleatórios em Políticas

Públicas – André Portela, Lycia Lima e Caio Castro da Escola de Economia de São Paulo
da Fundação Getúlio Vargas, apresentam o padrão ouro da Avaliação de Impacto: os
ensaios clínicos randomizados – ou experimentos aleatórios – e suas aplicações na
avaliação do impacto de políticas públicas. A importância dos RCTs em avaliação de
impacto de políticas públicas pode ser estimada pelo fato de três pesquisadores terem
recebido o Nobel de Economia de 2019 por conta de suas pesquisas com a utilização desse
método e dos resultados empíricos encontrados. Este capítulo, além de discutir a
importância dos experimentos aleatórios para avaliação de impacto, apresenta as
dificuldades em sua aplicação, recorrendo a exemplos de aleatorização na avaliação de
No capítulo 11 – Métodos baseados em escores de propensão e suas aplicações em

avaliação de políticas de saúde – as pesquisadoras do ISC/UFBA Dandara Ramos e
Rosemeire Fiaccone escrevem sobre os métodos baseados em escore de propensão
(Propensity Score) e suas aplicações em avaliação de políticas de saúde.
No capítulo 12 – O Método de Diferenças-em-Diferenças Aplicado à Avaliação de Políticas

Públicas de Saúde – os pesquisadores da Escola de Economia de São Paulo da Fundação
Getúlio Vargas – Bladimir Carrillo e Danyelle Branco – apresentam o Método de Diferenças-
em-Diferenças em sua versão clássica, utilizando um exemplo de avaliação do Programa
Mais Médicos para o Brasil. A seguir, os autores apresentam uma versão generalizada do
modelo e debatem as hipóteses de identificação do modelo e suas plausibilidades16.
No capítulo 13 – Dando um Salto de Qualidade: Regressão Descontínua e Aplicações em

Políticas de Saúde – Breno Sampaio (PIMES, GAPPE, IZA) e Giuseppe Trevisan (UFPE,
GAPPE) apresentam a Regressão Descontínua e discutem dois casos: Sharp e Fuzzy.
Argumentam também as aplicações desse método na área de saúde, particularmente nas
questões de consumo de álcool e mortalidade, aposentadoria e saúde e acesso a seguro
de saúde, entre outros.
16
Os autores disponibilizaram o banco de dados e a rotina de programação do Stata para que o leitor
consiga replicar os exemplos apresentados no capítulo.

23
No capítulo 14 – O Método de Variáveis Instrumentais e Aplicações em Políticas de Saúde
– Rudi Rocha (FGV-EAESP) apresenta objetivamente o Método de Variáveis Instrumentais
e suas aplicações em políticas de saúde, questiona o problema mais comum de
endogeneidade (viés) e mostra como o método de Variável Instrumental pode solucioná-lo.
O autor apresenta ainda uma seção de estimação do método, questões práticas e o LATE
(Local Average Treatment Effect). Por fim, expõe como o método foi concretamente
aplicado para avaliar o impacto do Programa Aqui Tem Farmácia Popular.
Parte 4: Ciência de dados com foco no DataSUS
A parte 4 do livro apresenta ao leitor conceitos e ferramentas para utilização de dados –

especialmente dados públicos e administrativos do SUS – em pesquisas empíricas com
foco em avaliação de impacto. O tema da utilização de dados é menos desenvolvido em
livros-textos de avaliação de impacto, tornando-se mais um diferencial do presente livro.
Pesquisadores e avaliadores, acadêmicos e gestores têm, assim, um guia de utilização de
dados nessa parte do livro e encontram nessa seção informações sobre a Lei Geral de
Proteção de Dados Pessoais (LGPD), como construir um protocolo para utilização de dados
sensíveis, capítulos sobre acesso aos microdados do SUS, banco de dados relacional e
Big Data, manipulação, visualização, assim como material para estimação e predição de
modelos com regressão linear e machine learning.
No capítulo 15 que inicia essa parte, intitulado – Um debate sobre dados pessoais e dados
sensíveis para pesquisa científica e avaliação de políticas públicas a partir da Lei Geral de
Proteção de Dados – Bethânia Almeida (Cidacs/Fiocruz) debate profundamente sobre o
uso de dados pessoais e dados sensíveis para pesquisas, em especial em saúde pública,
a partir da LGPD. A produção de conhecimento depende do uso de dados e o acesso a
microdados sensíveis possibilita realizar avaliação de impacto em saúde com diversos
desfechos. O capítulo mostra como é possível usar os dados sensíveis e proteger
simultaneamente a privacidade das pessoas a que se referem os seus dados.
No capítulo 16 – Segurança no uso do dado identificado: como montar um protocolo – os

pesquisadores do ISC/UFBA Márcio Natividade, Samilly Miranda, Alberto Sironi, Evandro
Neto e Juracy Bertoldo aproveitam todo o debate sobre proteção de dados do capítulo
anterior e apresentam ao leitor um guia para construção de um repositório seguro de dados
sensíveis. É um passo a passo para se construir uma infraestrutura que armazene dados
sensíveis, em especial do SUS, para utilizá-los em pesquisas e avaliação de políticas
públicas, respeitando a LGPD.
No capítulo 17 – Acesso aos dados agregados e microdados do SUS – os pesquisadores

Raphael Saldanha, Marcel Pedroso e Mônica Magalhães (Fiocruz) descrevem a criação do
DataSUS e o desenvolvimento dos Sistemas de Informação em Saúde no Brasil. Além
disso, discutem as formas de acesso aos dados desses sistemas de informação, por meio
do TabeNet e do TabWin e, por fim, apresentam um pacote de acesso direto aos
microdados do DataSUS, usando o R17.
No capítulo 18 – Banco de Dados Relacional e Analítico – Felipe Ferré, técnico do Conselho

Nacional de Secretários de Saúde, apresenta as ferramentas de modelagem e gestão de
banco de dados com SQL e integração com o R. Nesse capítulo, o leitor encontrará tópicos
sobre banco de dados, SQL, Big Data, aplicações em bancos de dados do DataSUS.
O capítulo 19 – Manipulando dados no R – escrito por Wagner Bonat, da Universidade

Federal do Paraná, apresenta as principais ferramentas do R para manipulação de dados
e as suas principais ações – filtrar, ordenar, selecionar, criar/transformar e resumir. Dados
do DataSUS são utilizados no R em todas as aplicações para o leitor se familiarizar com os
principais comandos para manipular e estruturar um banco de dados.
O capítulo 20 – Visualização de Dados – escrito por Marcelo Perlin, da Universidade

Federal do Rio Grande do Sul, tem como foco o pacote ggplot2 do R com aplicações em
dados do DataSUS. Esse capítulo manifesta a preocupação de apresentar os diversos tipos
de gráficos, como construí-los no R e utilizar da técnica visual para comunicar estatísticas
complexas.
O capítulo 21 – Análise de Regressão – de autoria de Gleice Conceição e Maria do Rosário

Latorre, da Faculdade de Saúde Pública da Universidade de São Paulo, apresenta os
fundamentos da Análise de Regressão Linear Simples e Múltipla, com aplicações no R. As
autoras gentilmente disponibilizaram o banco de dados que pode usado pelos leitores para
replicar todos os exemplos. Além das hipóteses dos modelos de regressão linear, há a
17
Raphael Saldanha publicou, em conjunto com Ronaldo Bastos e Christovam Barcellos, o artigo
Microdatasus: pacote para download e pré-processamento de microdados do Departamento de Informática
do SUS (DATASUS) no CPS em 2019. A leitura do Capítulo 17 e desse artigo é necessária para qualquer
pesquisador que queira acessar microdados do DataSUS.

25
preocupação de verificar a validade das principais hipóteses do modelo, além da
interpretação dos parâmetros estimados.
No capítulo 22 – Aprendizagem de Máquina – Alexandre Chiavegatto (FSP-USP)

demonstra como os modelos de Machine Learning podem ser utilizados na gestão do
sistema de saúde e no desenvolvimento de políticas públicas. O autor faz rápida
apresentação dos conceitos e, a partir de achados da literatura, mostra como inteligência
artificial e aplicações de aprendizado de máquina têm impacto direto tanto na prática clínica
quanto na formulação e implementação de políticas de saúde. Tais avanços devem-se tanto
à maior disponibilidade de dados, em especial dados de saúde, quanto a avanços na
capacidade computacional.
Parte 5: Políticas informadas por evidências e tradução do conhecimento
A parte 5 do livro, com seus três capítulos, busca jogar luz sobre duas questões centrais:
como o processo e o produto da avaliação de impacto de determinada intervenção –
complexos em razão do desenho do experimento ou quase-experimento ou do tratamento
dos dados – podem ser comunicados a uma grande audiência? Ou ainda como podem
subsidiar a formulação de políticas públicas e informar de forma significativa a gestores
públicos que tomam decisões políticas?
No capítulo 23 – Aspectos conceituais e suas aplicações na avaliação de impacto de

políticas de saúde – Maurício Saboya (IPEA) e Jorge Barreto (Fiocruz) ampliam a visão
sobre Avaliação de Impacto em Políticas de Saúde, salientam como suas limitações
conceituais podem influenciar os achados e introduzem vieses negativos, inclusive na
tomada de decisão da política pública. Os autores apresentam alguns caminhos para
superar essas limitações e usam exemplos de avaliações com diferentes abordagens.
No capítulo 24 – A tradução do conhecimento e sua importância na disseminação de

resultados científicos para gestão em saúde – Daniela Rêgo (COEVI/MS), Roberta Silva
(COEVI/MS) e Luís Eugênio Souza (ISC/UFBA) mostram as potencialidades e os limites da
tradução do conhecimento e apontam ferramentas inovadoras que podem promover o uso
de conhecimento científico na tomada de decisão relativas a políticas de saúde. Por fim,
argumentam que as estratégias de disseminação de resultados de pesquisa são mais
efetivas quando se associam ao exercício democrático da cidadania no interior das
organizações.
No capítulo 25 – Como comunicar evidências científicas de estudos de avaliação de

impacto de políticas e programas de saúde para gestores? – Fabiana Mascarenhas (MS) e
Luciano Máximo (Insper), jornalistas especializados em comunicação científica, escrevem
sobre as estratégias de comunicação voltadas para gestores de saúde e para o público em
geral. Os autores discutem o papel da comunicação e apresentam exemplos de políticas
públicas de saúde e estratégias utilizadas para sua comunicação.
4 Conclusão
Esta introdução tentou explicar, de forma resumida, os conceitos básicos da avaliação de

impacto de políticas de saúde, a partir do conhecimento consolidado nos livros-textos, das
críticas e dos avanços mais recentes. Tentou mostrar também como e por que a avaliação
de impacto ganhou relevância nas últimas décadas no debate público. A seguir, apresentou
breve história deste livro e como todas as colaborações e sugestões se materializaram nos
25 capítulos e nas cinco partes que o compõem. A introdução perpassou ainda cada um
dos capítulos e apresentou o tema de cada um, seus objetivos e suas possíveis
contribuições para gestores, pesquisadores e avaliadores de políticas públicas com
interesse no SUS.
Os organizadores esperamos que esta longa introdução seja útil ao leitor, o qual pode –
com mais elementos – escolher fazer a leitura sequencial do primeiro ao último capítulo do
livro ou ir diretamente à parte que lhe interessa em especial. Boa leitura!

27
Referências
ANGRIST, J.; PISCHKE, J. S. Mostly harmless econometris: an empiricist’s companion.

Nova Jersey: Princeton University Press, 2008.
ANGRIST, J.; PISCHKE, J. S. Mastering metrics: the path from cause to effect. Nova
Jersey: Princeton University Press, 2015.
ASHENFELTER, O.; KRUEGER, A. Estimates of the economic return to schooling from a

new sample of twins. The American Economic Review, v. 84, n. 5, p. 1157-1173, 1994.
BRASIL. Casa Civil da Presidência da República. Avaliação de políticas públicas: guia

prático de análise ex ante. Brasília, DF: Ipea, 2018a. v. 1. Disponível em:
https://repositorio.ipea.gov.br/handle/11058/8853. Acesso em: 21 maio 2023.
BRASIL. Casa Civil da Presidência da República. Avaliação de Políticas Públicas: guia

prático de análise ex post. Brasília, DF: 2018b. v. 2. Disponível em:
https://repositorio.ipea.gov.br/handle/11058/8853. Acesso em: 22 maio 2023.
CATTANEO, M. D.; TITIUNIK, R. Regression discontinuity designs. Annual Review of

Economics, n. 14, p. 821-851, 2022.
CUNNINGHAM, S. Causal inference: The Mixtape. London: Yale University Press, 2021.
DEHEJIA, R. Pratical propensity score matching: a reply to Smith and Todd. Journal of
Econometrics, n. 125, p. 355-364, 2005.
DEHEJIA, R.; WAHBA, S. Causal effects in nonexperimental studies: reevaluating the

evaluation of training programs. Journal of the American Statistical Association, v. 94,
n. 448, p. 1053-1062, 1999.
DEHEJIA, R.; WAHBA, S. Propensity score-matching methods for nonexperimental causal

studies. The Review of Economics and Statistics, v. 84, n.1, p. 151-161, 2002.
DUFLO, E.; GLENNERSTER, R.; KREMER, M. Using randomization in development

economics research: a toolkit. In: SCHULTZ, P.; STRAUSS, J. A. (org.). Handbook of
development economics. Amsterdã: Elsevier, 2007. p. 3895-3962. v. 4.
GERTLER, P. J. et al. Impact evaluation in practice. Washington, DC: The World Bank,
2016.
HERNÁN, M. A.; ROBINS, J. M. Causal inference: what if. London: Chapman &
Hall/CRC, 2020.
HUNTINGTON-KLEIN, N. The effect: an introduction to research design and causality.

London: Taylor & Francis Group, 2022.
IMBENS, G. W.; ANGRIST, J. D. Identification and estimation of local average treatment

effects. Econometrica, v. 62, n. 2, p. 467-475, 1994.
IMBENS, G. W.; RUBIN, D. B. Causal inference for statistics, social, and biomedical
sciences: an introduction. Cambridge: Cambridge University Press, 2015.
KAWACHI, I.; SUBRAMANIAN, S. V.; MOWAT, R. Randomized controlled trials and
evidence-based policy: a multidisciplinary dialogue. Social Science & Medicine, v. 210,
p. 1, 2018.
MENEZES FILHO, N. A.; PINTO, C. C. X. (org.). Avaliação econômica de projetos

sociais. 3. ed. São Paulo: Fundação Itaú Social, 2017.
PONCZEK, V.; SOUZA, A. P. New evidence of the causal effect of family size on child
quality in a developing country. Journal of Human Resources, v. 47, n. 1, p. 64-106,
2012.
RASELLA, D. et al. Effect of a conditional cash transfer programme on childhood mortality:

a nationwide analysis of Brazilian municipalities. The Lancet, v. 382, n. 9886, p. 57-64, jul.
2013.
ROSENMAUM, P. R.; RUBIN, D. B. The central role of the propensity score in

observational studies for causal effects. Biometrika, v. 70, n. 1, p. 41-55, 1983.
ROSENMAUM, P. R.; RUBIN, D. B. Reducing bias in observational studies using

subclassification on the propensity score. Journal of the American Statistical
Association, v. 79, n. 387, p. 516-524, 1984.
ROSENZWEIG, M. R.; WOLPIN, K. I. Testing the quantity-quality fertility

model: the use of twins as a natural experiment. Econometrica, v. 48, n. 1, p. 227-240,
1980.
ROSENZWEIG, M. R.; WOLPIN, K. I. Natural “natural experiments” in economics. Journal

of Economic Literature, v. 38, p. 827-874, 2000.
ROTH, J. et al. What’s trending in difference-in-differences? A Synthesis of the recent

econometrics literature. 2022. (Working Paper). Disponível em:
https://www.jonathandroth.com/assets/files/DiD_Review_Paper.pdf. Acesso em: 21 maio
2023.
RUBIN, D. B. Estimating causal effects of treatment in randomized and nonrandomized

studies. Journal of Education Psychology, v. 66, n. 5, p. 688-701, 1974.
SALDANHA, R. F.; BASTOS, R. R.; BARCELLOS, C. Microdatasus: pacote para

download e pré-processamento de microdados do Departamento de Informática do SUS
(DATASUS). Cadernos de Saúde Pública, v. 35, n. 9, p. 1-9, 2019. Disponível em:
https://www.scielo.br/j/csp/a/gdJXqcrW5PPDHX8rwPDYL7F/?lang=pt. Acesso em: 21
maio 2023.
SHADISH, W. R.; COOK, T. D.; CAMPBELL, D. T. Experimental and quasi-

experimental designs for generalized causal inference. 2nd Boston: Houghton Mifflin,
2001.

29
PARTE 1:
INTRODUÇÃO À AVALIAÇÃO DE
IMPACTO DE POLÍTICAS DE SAÚDE
Capítulo 1
Avaliando o impacto na saúde da

população de políticas e programas
de proteção social e de saúde
implementadas no Brasil
Erika Aragão1
Mauricio L. Barreto1,2
1
Instituto de Saúde Coletiva, Universidade Federal da Bahia
2
Centro de Integração de Dados e Conhecimentos para a Saúde (Cidacs), Fiocruz - Bahia
RESUMO:
O objetivo deste capítulo é apresentar um panorama dos estudos de Avaliação de Impacto de
políticas e programas de proteção social e de saúde que tenham efeito sobre a saúde da população
brasileira, considerando-se a complexidade dos determinantes sociais que interferem nas condições
de saúde de qualquer população. Serão apresentados os esforços de investigação realizados no país
buscando-se atribuir nexos causais entre as intervenções resultantes de políticas públicas e seus
efeitos na saúde, fenômeno essencialmente complexo, bem como a heterogeneidade destes efeitos,
em diferentes extratos da população (nível de pobreza, cor-etnia, sexo etc.), os principais achados
dos estudos apresentados, em busca de se identificarem suas contribuições para o aperfeiçoamento
das políticas públicas avaliadas, assim como as principais limitações para a realização desses estudos.
PALAVRAS-CHAVE:
Avaliação de Impacto de Políticas e Programas de Saúde. Avaliação de Impacto de Políticas e
Programas Sociais.

31
1 Introdução
O objetivo deste capítulo é apresentar um panorama dos estudos de Avaliação de Impacto

de políticas e programas de proteção social e de saúde que tenham efeito sobre a saúde
da população brasileira, considerando-se a complexidade dos determinantes sociais que
interferem nas condições de saúde de qualquer população. Em primeiro lugar, serão
apresentados os esforços de investigação realizados no país buscando-se atribuir nexos
causais entre as intervenções resultantes de políticas públicas e seus efeitos na saúde,
fenômeno essencialmente complexo, bem como a heterogeneidade destes efeitos, em
diferentes extratos da população (nível de pobreza, cor-etnia, sexo etc.). Em seguida, serão
discutidos os principais achados dos estudos apresentados, em busca de se identificarem
suas contribuições para o aperfeiçoamento das políticas públicas avaliadas. Por fim,
apontar-se-ão as principais limitações para a realização desses estudos, assim como
estratégias tornem possível realizar investigações dessa natureza de forma mais ágil,
visando contribuir para informar de maneira mais ampla e robusta os formuladores e
gestores de políticas públicas que afetam direta ou indiretamente a saúde da população. O
foco será um conjunto relevante de estudos realizados no Instituto de Saúde Coletiva (ISC)
da Universidade Federal da Bahia (UFBA) e no Centro de Integração de Dados e
Conhecimentos para a Saúde (Cidacs) da Fiocruz-Bahia.
2 As condições de saúde e o estudo dos determinantes sociais
No Brasil, as avaliações de impacto de políticas e programas que tenham efeito sobre a

saúde da população são relativamente recentes. Atribuir causalidade de intervenções a
mudanças registradas na saúde da população não se constitui em uma tarefa simples, por
ser a saúde um fenômeno complexo, com diferentes expressões e que possui múltiplos
determinantes, tais como as condições socioeconômicas, culturais, ambientais, dentre
outras. Nessa direção, a Organização Mundial de Saúde (OMS), no momento de sua
fundação (1948), adotou uma concepção ampliada de saúde, para além de uma abordagem
centrada na doença. Assim, institucionalmente incorporou a perspectiva trazida por
pesquisadores de diversos campos, sobretudo a partir do século XIX. Podemos destacar o
exemplo de Louis René Villermé (1782-1863), o qual, ao analisar a mortalidade nos
diferentes bairros de Paris, identificou que as variações observadas eram especialmente
condicionadas pelo nível de renda da população de cada bairro; na mesma linha, Edwin
Chadwick (1800-1890) relatou as condições sanitárias da população trabalhadora da Grã-
Bretanha (SCLIAR, 2007). Pode-se citar ainda, na Europa, os trabalhos pioneiros de
Frederik Engels (2010), no campo da economia política, denunciando as terríveis condições
da classe trabalhadora na Inglaterra.
Dos Estados Unidos, recebeu-se a importante contribuição do demógrafo americano

Samuel Preston no que diz respeito à relação entre pobreza, grau de desenvolvimento e
saúde. Preston (1975) relaciona a renda nos países, medida pelo PIB per capita, aos níveis
de saúde das suas respectivas populações, criando o que se chamaria “curva de Preston”.
Em seus trabalhos demonstrou que à medida que a riqueza de um país aumenta, melhoram
das condições de saúde de sua respectiva população. Tal processo se dá de forma
acelerada entre os países muito pobres, nos quais pequenos avanços no PIB per capita
transformam-se em significativos avanços nos níveis de saúde. Depois de certo nível de
renda, sucessivos aumentos no PIB per capita continuam a refletir na melhora das
condições de saúde, mas em um nível muito mais lento. Portanto, o que se destaca na
denominada curva de Preston é que mesmo pequenas reduções das condições de pobreza
de uma população podem ser cruciais para transformar as suas chances de sobrevivência.
Outro avanço importante no entendimento dos fatores que determinam os níveis de saúde
de uma população foi quando se percebeu que, além da pobreza absoluta, as
desigualdades sociais constituem-se importante determinante; isso explica que mesmo em
sociedades afluentes, porém com significativos níveis de desigualdades, como acontece na
maioria dos países considerados desenvolvidos, as condições de saúde da população são
piores naqueles mais desiguais. Portanto, como tem apontado Wilkinson (1997), os níveis
de desigualdades são importantes definidores de sociedades mais ou menos saudáveis.
Krieger (1999), epidemiologista americana, por seu turno, amplia o conceito de

desigualdade - fundado em elementos econômicos - e desenvolve a ideia de que a
discriminação é um importante determinante da saúde. Quer dizer, além da desigualdade
econômica, nas mais diferentes sociedades existem elementos relacionais, quer seja entre
indivíduos ou grupos sociais, e que vão para além da dimensão econômica, denominada
discriminação, e que se verificou serem importantes fontes de geradoras de desigualdades
nas sociedades humanas. Cita-se, como exemplo, as expressões de discriminação
existentes com relação às mulheres (discriminação de gênero) ou com relação a grupos
raciais ou étnicos (racismo).

33
A influência dos determinantes sociais sobre a saúde foi ratificada na Conferência de Alma-
Ata, sobre Cuidados Primários de Saúde, no final dos anos 1970 - 22 anos após a criação
da OMS - e a saúde reconhecida como um direito humano fundamental, cuja realização
depende da ação de outros setores sociais e econômicos, para além do setor da saúde.
Essa conferência não foi um evento isolado, ocorreu no bojo de um conjunto de
conferências promovidas por organizações das Nações Unidas durante a década de 1970,
as quais trouxeram ao debate uma agenda ampliada para que os países pudessem
trabalhar para reduzir as iniquidades entre si, contexto no qual era central o papel do Estado
na garantia desses direitos (GIOVANELLA et al., 2019).
Nos anos 1980 e 1990 questionou-se fortemente esse papel do Estado; as políticas
neoliberais pautaram a agenda internacional. O Sistema Único de Saúde (SUS) brasileiro
foi criado nesse contexto de redução do Estado nas economias centrais e recomendações
de sua adoção para a América Latina. O chamado Consenso de Washington propunha
medidas como corte de gastos públicos para a redução da dívida pública e reforma fiscal
focada na redução da tributação das empresas, ampliação do setor privado em todas as
áreas mediante privatizações e abertura comercial e econômica. A premissa era a de que
a redução do protecionismo iria ampliar a abertura das economias para o investimento
estrangeiro e promoveria consequentemente o crescimento econômico (ARAGÃO;
FUNCIA, 2021).
Nessa perspectiva, mundialmente predominou o enfoque da saúde como um bem privado

e o debate voltou a se concentrar em uma concepção centrada na assistência médica
individual. Nos anos 2000, com o fracasso das políticas neoliberais no que tange às
melhorias das condições de vida e saúde das populações, retomou-se a ênfase nos
determinantes sociais, o que culminou na criação da Comissão Mundial sobre
Determinantes Sociais da Saúde da OMS, em 2005, cujo relatório, publicado três anos
depois, recomendava aos governos que atuassem de modo a promover, entre outras
coisas, melhorias nas condições de vida cotidianas; governança baseada em interesses
públicos considerando-se as desigualdades na distribuição de recursos em termos
mundiais, bem como maior compreensão sobre os determinantes sociais da saúde, a partir
da investigação sobre o tema, o monitoramento e a avaliação do impacto das políticas
públicas sobre esses (BUSS; PELEGRINO FILHO, 2007).
Tendo em vista as múltiplas determinações que interferem na saúde, as relações entre os

determinantes sociais e os seus efeitos na saúde não são possíveis de traduzir-se em algo
simples, direto e unicausal. Desse modo, o principal desafio das investigações sobre as
relações entre determinantes sociais e saúde consiste em estabelecer uma hierarquia de
determinações entre as condições sociais, econômicas, ambientais, políticas e como essas
incidem sobre as condições de saúde, tanto no âmbito individual quanto no coletivo. O
estudo dessa cadeia de mediações permite também identificar onde e como devem ser
feitas as intervenções com o objetivo de reduzir as desigualdades de saúde, ou seja, os
pontos mais sensíveis nos quais tais intervenções podem provocar maior impacto. Ou seja,
reduzir desigualdades sociais, por exemplo, é fundamental para a redução das
desigualdades em saúde (BUSS; PELEGRINO FILHO, 2007).
Diversos são os modelos que procuram esquematizar a trama de relações entre os vários
fatores estudados por meio desses enfoques, como os do modelo de Dahlgren e Whitehead
(GUNNING-SCHEPERS, 1999) e do modelo de Didericksen e outros (EVANS et al., 2001).
Tais modelos ajudam a operacionalizar as diferentes camadas e inter-relações entre os
diferentes fenômenos que afetam a saúde. Em termos gerais, incorporam a crescente
influência da percepção de que as condições sociais, econômicas e culturais dos países e
assumem a importância de se enfrentar problemas como a pobreza e as condições de
saúde.
Na área da saúde, investigações sobre as complexas relações entre pobreza e

desigualdade, saúde e sobre o impacto de intervenções advindas de políticas de proteção
social sobre esses determinantes e em cadeia no estado de saúde foram ampliadas no
país, passaram a ser objeto de estudo e incorporaram metodologias de diversos campos,
para além da epidemiologia, para dar conta de isolar o efeito causal e compreender como
uma intervenção, conjunto de intervenções ou políticas afetam a saúde da população
brasileira e contribuem para a redução das desigualdades existentes, mesmo quando o
foco primário das mesmas não seja a saúde. Neste capítulo, buscar-se-á mostrar a
evolução da pesquisa avaliativas nesse campo a partir da experiência de alguns atores.
3 Avaliação de impacto de políticas de proteção social nas condições de saúde
Tendo em vista a perspectiva de que a saúde é fruto de determinações sociais, grande

parte das avaliações de impacto no Brasil se concentra em compreender como
intervenções de infraestrutura, econômicas e sociais, por exemplo, impactam as condições
de saúde da população brasileira. O país é fruto da interação entre o reflexo histórico da

35
desigualdade estrutural, social e econômica, do grande contingente de trabalhadores
desempregados e informais, potencializada pelas precárias condições de vida, a exemplo
da baixa cobertura de saneamento básico, habitações superlotadas, bem como do sistema
de produção e tributação concentrador de renda (BALTRUSIS; D’OTTAVIANO, 2009;
MIRANDA et al., 2021). Desse modo, na área da saúde, as avaliações de impacto de
políticas nesses campos se entrelaçam com as avaliações de políticas de saúde.
Exemplo de estudo pioneiro nesse campo foi a avaliação do impacto de um grande

programa de saneamento na cidade de Salvador. O objetivo desse programa, denominado
Bahia Azul, era aumentar a cobertura da rede de esgoto, naquela cidade, de 26% para 80%
e teve o seu início em 1997; ao conectar mais de 300 mil residências à rede de esgoto em
Salvador causou imenso impacto na redução de diarreia em crianças. Antes da intervenção
de saneamento, estudo liderado por pesquisadores do ISC/UFBA acompanhou 841
crianças entre 1997-1999 e 1.007 crianças após a intervenção, a partir de outubro de 2003.
Utilizando-se de engenhosa metodologia foi possível demonstrar que a incidência de
diarreia entre crianças caiu 22%, como consequência da ampliação da rede de esgoto
(BARRETO et al., 2007).
As políticas de proteção social direcionadas às populações mais vulneráveis,

particularmente as de transferência de renda (Cash Transfer), têm sido objeto de muita
investigação em razão de sua capacidade de atuar rapidamente na melhoria da redução da
pobreza e nas condições de vida em geral. Esse tipo de política tem sido ampliado e
atualmente é utilizado em grande parte do mundo em desenvolvimento. Os países na
América Latina, África e a Ásia implementam políticas dessa natureza e, evidentemente, os
efeitos das políticas têm sido investigados por diferentes grupos de pesquisa. Muitos
estudos têm mostrado efeitos positivos sobre diferentes desfechos na educação, na
capacidade de trabalho da sua população e, também, na saúde.
No Brasil, um dos programas sociais cujos efeitos têm sido mais estudados, inclusive na
área da saúde, é o Bolsa Família, programa de transferência condicional de renda criado
em 2003; diz-se condicional porque estabelece pré-requisitos para as famílias receberem
o benefício. Tais condicionalidades são centradas na educação e saúde de crianças e
gestantes. Colocar e manter as crianças na escola, o calendário vacinal e pré-natal em dia
eram exigências para que as pessoas aptas pudessem continuar a receber recursos.
Um estudo seminal no campo da saúde coletiva foi o de Rasella e colaboradores (2013),
cujo objetivo foi avaliar o efeito do programa Bolsa Família nas mortes de crianças menores
de cinco anos decorrentes de causas específicas associadas à pobreza: desnutrição,
diarreia e infecções respiratórias. Nos municípios nos quais havia um programa consolidado
de transferência de renda houve redução de cerca de 25% da mortalidade de crianças
menores de 5 anos. Entre as doenças mais impactadas pelo programa estão as diarreias,
cuja redução foi de quase 50%, e a desnutrição - ainda uma causa importante de óbito -
teve um decréscimo de mais de 60%. Essa foi a primeira demonstração do efeito de um
programa de transferência de renda sobre a chance de sobrevivência de crianças
brasileiras.
Sabe-se que os estudos de base individual são muito mais demonstrativos e rigorosos em
termos de testar esse tipo de hipótese causal, mas os estudos e dados agregados são
muito importantes. O trabalho de Rasella et al. (2013) foi reproduzido para diferentes tipos
de desfechos e desde então uma série de estudos tem sido conduzida e publicada por
diferentes pesquisadores, a mostrar o impacto de programas sociais, como o Bolsa Família
e outros em diferentes desfechos de saúde como tuberculose (SOUZA et al., 2018),
hanseníase (NERY et al., 2014), violência (MACHADO et al., 2018), suicídio (ALVES et al.,
2019), saúde materna (RASELLA et al., 2021), dentre outros.
Com o surgimento, em Salvador, do Centro de Integração de Dados e Conhecimentos de

Saúde (Cidacs-Fiocruz)1, e a possibilidade de vinculação de dados, torna-se possível a
proposta de que as bases utilizadas em avaliações anteriores, em forma agregada por
municípios, fossem integradas e utilizadas em forma individuada. Entre essas bases de
dados inclui-se o Cadastro Único, bases dos registros de todos que aplicam para programas
de proteção social, as bases dos beneficiados por diferentes programas sociais como o
programa Bolsa Família, programa Minha Casa Minha Vida ou Programa de Cisternas. A
estas se interligaram diferentes bases de dados de saúde, como as informações sobre o
nascimento (SINASC), registro de diferentes doenças infecciosas (SINAN), hospitalizações
(SIH) e óbitos (SIM). Para gerir responsavelmente estas bases de dados, o Cidacs
desenvolveu um sistema de governança de dados que incluiu estritos mecanismos de
proteção e privacidade, de acordo com regras legais e éticas em vigor. Entre os importantes
recursos estabelecidos no Cidacs, frutos da integração dessas diferentes bases em
estruturas de dados longitudinais, destacam-se a Coorte de 100 Milhões de Brasileiros
(BARRETO et al., 2019) e a Coorte de Nascimento do Cidacs (PAIXÃO et al., 2021) A
1
https://cidacs.bahia.fiocruz.br.

37
primeira, atualmente conta com mais de 130 milhões de indivíduos e a segunda supera os
28 milhões de nascimentos; ambas são periodicamente atualizadas (BARRETO et al.,
2022).
A partir dessas iniciativas, tornou-se possível montar investigações muito mais detalhadas
para demostrar o impacto dos efeitos do Bolsa Família e outros programas sociais e de
saúde, na saúde. Em resumo, com esses recursos tem sido possível avaliar com maior
precisão, mais detalhes e nuances os efeitos na saúde dos programas e políticas avaliadas.
Em uma análise transversal, aninhada à Coorte dos 100 Milhões de Brasileiros, em que
foram analisados dados de 6,3 milhões de crianças menores de cinco anos, cujas famílias
se inscreveram no Cadastro Único entre 2006-2015 (RAMOS et al., 2021), mostrou-se que
o Bolsa Família tem importante efeito na mortalidade de crianças menores de 5 anos (da
ordem de 17% menor entre as crianças de famílias que receberam o benefício em relação
àquelas de famílias não contempladas pelo auxílio), achados compatíveis com o estudo
prévio, em que se utilizaram dados agregados (RASELLA et al., 2013). Porém, esses novos
achados mostraram nuances que não poderiam ser observadas nos estudos ecológicos.
Utilizando-se dados individualizados, evidenciou-se que o efeito do Bolsa Família foi maior
nos grupos mais vulneráveis; da ordem de 28% nos municípios mais pobres, de 26% entre
crianças de mães negras ou de 22% entre crianças nascidas a pré-termo. Avaliação do
impacto do Bolsa Família sobre a hanseníase indicou redução de 14% na incidência nos
municípios com alta carga da doença (PESCARINI et al., 2020a), além de evidenciar 22%
de aumento na taxa de aderência/adesão ao tratamento e 24% nas taxas de cura
(PESCARINI et al., 2020b). Estudo similar sobre o impacto do Bolsa Família sobre as taxas
de suicídio mostrou que para as pessoas que receberam o benefício essas foram
aproximadamente 50% menores relativamente aos que não o receberam (MACHADO et
al., 2022). Sobre a mortalidade das doenças cardiovasculares, um estudo realizado em
período relativamente curto de seguimento indicou que enquanto não se observou um efeito
global em todo o país, houve redução da ordem de 14% na população de 30-60 anos de
idade, residentes nos municípios mais pobres do país (PESCARINI et al., 2022)
Em seu conjunto, os resultados dos diferentes estudos, publicados em revistas científicas

de alto impacto, demonstram a importância do Bolsa Família nas condições de saúde da
população brasileira. Mesmo sendo um incentivo monetário relativamente pequeno, tais
quantias podem reduzir a chance de sobrevivência de uma criança, ou um indivíduo optar
entre autodestruir-se ou não.
Em resumo, os estudos mais recentes que utilizam dados individuados sobre os quais
aplicam-se os denominados métodos quase-experimentais, como apresentados acima,
comprovam os efeitos observados nas avaliações a partir de dados agregados. Entretanto
os estudos individuados são mais robustos, podem capturar efeitos sobre diferentes
estratos e grupos sociais, os quais foram sempre maiores entre os mais pobres e excluídos.
Desse modo, os achados, em seu conjunto, indicam que apesar dos seus limites, esses
programas vêm contribuindo para o desenvolvimento de uma sociedade mais saudável e
menos desigual, na medida que os efeitos são maiores nos grupos mais vulneráveis,
reduzindo as desigualdades em saúde existentes.
4 Avaliação de impacto de políticas e programas de saúde
A abordagem avaliativa utilizada para os programas sociais vem sendo ampliada para
políticas e programas de saúde. Estudos com dados agregados têm consistentemente
mostrado efeitos do Programa Saúde da Família (PSF) sobre a saúde, sejam na saúde
infantil (AQUINO et al., 2009; RASELLA et al., 2010) e nas doenças cardiovasculares e
cerebrovasculares (RASELLA et al., 2014). Estudos mais recentes, explorando as mesmas
questões, porém realizados com dados da Coorte de 100 milhões de Brasileiros. mostram
que em municípios com alta cobertura do PSF apresentaram reduções significativas na
incidência e na mortalidade por tuberculose, 22% e 28% respectivamente (JESUS et al.,
2022), enquanto estudo em curso, ainda não publicado, usando metodologia ainda mais
rigorosa que o anterior, mostra que o PSF tem o efeito de reduzir cerca de 40% a
mortalidade infantil (PINTO-JR, 2023). Mais recentemente e no contexto das mudanças
climáticas, iniciam-se esforços para a avaliação do impacto de políticas ambientais na
mitigação de efeitos climáticos extremos, os quais ocorrem em frequência cada vez maior,
mundialmente e também no nosso país.
No âmbito do Programa Economia, Tecnologia e Inovação em Saúde do Instituto de Saúde

Coletiva (PECS/ISC/UFBA), vários estudos para avaliação dos impactos de políticas de
saúde têm sido conduzidos, com o objetivo de se entender melhor como as intervenções
públicas de saúde impactam os indicadores de bem-estar da população alvo. A avaliação
do Programa Aqui tem Farmácia Popular (ATFP) teve como objetivo principal entender
como a segunda fase do programa, a gratuidade e sua forte expansão a partir de 2011,
com o Saúde Não Tem Preço, possibilitou reduções em internações e mortalidade relativas
às doenças hipertensivas e diabetes. O estudo utilizou microdados de mortalidade (SIM),

39
internações (SIH) e acesso a medicamentos do Farmácia Popular para agrupar a população
de 5570 municípios em grupos etários (coortes sintéticas) e acompanhá-los de 2008-2016.
A estratégia quase-experimental foi utilizar a variação no número de farmácias cadastradas
(variação na oferta de medicamentos) e como cada coorte respondeu a tal variação. Em
média, o programa ATFP reduziu internações por diabetes em 5,46%, com índices maiores
para mulheres, para internações urgentes e para internações que resultaram em óbito e
reduziu internações por hipertensão em 5,2% no período de análise. O programa reduziu
mortalidade por diabetes em 8,3% e mortalidade por hipertensão em 12,2%. O uso dos
microdados possibilitou testar efeitos heterogêneos, como impacto para homens e
mulheres para diferentes grupos etários ou em localidades com piores indicadores
socioeconômicos (ARAGÃO et al., 2019).
Após a avaliação do ATFP, o PECS realizou a avaliação de impacto, avaliação de custo e

avaliação de satisfação das Policlínicas Regionais de Saúde da Bahia. Nesta avaliação de
impacto, o foco foi nos 8 primeiros consórcios, 175 municípios beneficiados; os consórcios
foram firmados nas regiões de saúde da Bahia e inaugurados a partir de dezembro de 2017.
Por existirem municípios contemplados e municípios não contemplados pelos consórcios,
um desenho quase-experimental foi utilizado com uma abordagem longitudinal. Microdados
do BPA individualizado, Sistema de Informação Ambulatorial, foram utilizados para se
testarem os deslocamentos dentro dos clusters de policlínicas e fora da região de saúde.
Os resultados do Difference-in-Difference (e pelo Event Study) mostraram que as
Policlínicas Regionais de Saúde aumentaram atendimentos de média complexidade em
43% na região de saúde onde funcionam e reduziram em 12% deslocamentos para fora da
região de saúde. Além disso, internações urgentes sofreram redução da ordem de 4,5%,
mortalidade por neoplasias 7,7% e mortalidade por hipertensão 5%. O uso dos microdados
possibilitou estimar o impacto para grupos heterogêneos (ARAGÃO et al., 2022).
Por fim, o Programa Economia, Tecnologia e Inovação em Saúde do Instituto de Saúde

Coletiva (PECS/ISC/UFBA) trabalha atualmente na avaliação do Programa de Pesquisa
para o SUS (PPSUS), criado em 2004; a avaliação abrange o período 2009-2020. O acesso
aos dados identificados de todos os concorrentes, os resultados de cada projeto e a nota
final possibilitaram o uso do quase-experimento Discontinuity Regression Design (RDD
Sharp) e a variável de interesse repousa na trajetória acadêmica de cada concorrente:
número de artigos publicados, fator de impacto de cada artigo, participação em projetos,
redes de colaboração, orientações, congressos e impacto tecnológico. O cerne da pesquisa
é entender se pesquisadores em localidades com menos acesso a recursos para pesquisas
na área de saúde, foco no SUS, tem sua trajetória acadêmica beneficiada, uma vez
contemplados com recursos para tal pesquisa, se comparados com pesquisadores que
concorreram, porém não foram beneficiados.
Políticas públicas de saúde, como o Aqui Tem Farmácia Popular, as Policlínicas Regionais
de Saúde ou o PPSUS, com o objetivo de gerar resultados acadêmicos que melhorem as
práticas do SUS, são formuladas pelo Ministério da Saúde ou pelas Secretarias de Saúde
e precisam ser avaliadas especialmente por dois motivos: 1) testar empiricamente se tais
programas cumprem o seu objetivo principal; 2) testar os canais de impacto e seus
potenciais efeitos heterogêneos. O conjunto de resultados pode aumentar a quantidade de
informações para que gestores do Sistema Único de Saúde tomem melhores decisões,
melhorem o sistema e, consequentemente, os indicadores da população beneficiada.
5 Considerações finais
A ideia de que as políticas sociais, além de reduzir a pobreza e desigualdades sociais

podem ter efeitos sobre a saúde, em particular na desigualdade que ocorre nessa função
social, abre novas possibilidades de estudar os determinantes sociais de saúde, de vincular
a epidemiologia - a ciência que estuda os determinantes sociais da saúde - com os
processos políticos em curso na sociedade. As políticas de transferência condicional (e
eventualmente não-condicional) de renda, que a partir de 1980 vêm sendo implementadas
em diferentes países de baixa e média renda como solução para reduzir a pobreza, a
extrema pobreza e as desigualdades sociais, têm sido modelo para investigação,
considerando-se que ao modificarem a situação de pobreza e as desigualdades sociais
atuam sobre importantes determinantes das condições de saúde de uma população. No
Brasil, onde assume a denominação de Bolsa Família, as investigações acima resumidas
têm consistentemente mostrado importantes efeitos dessa política na saúde da população
brasileira. Tais estudos, sejam utilizando-se de dados agregados em nível municipal ou
dados individuados provenientes da Coorte de 100 milhões de Brasileiros e da Coorte de
Nascimento - mantidas no Cidacs - têm consistentemente mostrado efeitos benéficos do
recebimento da Bolsa Família nos mais diferentes desfechos em saúde. Os estudos com
dados individuados, usando-se métodos quase-experimentais, além de comprovarem os
efeitos observados anteriormente vão além ao desagregarem os efeitos por diferentes
estratos e grupos sociais; os efeitos mostram-se sempre maiores entre os mais pobres e

41
os excluídos. Apesar dos seus limites, esses programas têm contribuído para o
desenvolvimento de uma sociedade menos desigual e mais saudável.
Do ponto de vista conceitual e metodológico, os estudos realizados mostram, em última

instância, o potencial do uso integrado de grandes bases de dados nacionais e a aplicação
de métodos rigorosos da pesquisa epidemiológica e da pesquisa avaliativa para aprofundar
as investigações relacionadas as desigualdades sociais da saúde e como as políticas
sociais e de saúde amenizam as desigualdades existentes. Porém, servem também para
estreitar os vínculos da pesquisa epidemiológica com os processos e acontecimentos
políticos em sociedades concretas e contribuir para entender como as políticas e as
intervenções em diferentes esferas, sejam na proteção social, na saúde ou na proteção
ambiental, afetam a dinâmica de ocorrência das doenças e do sofrimento e, em última
instância, as condições de saúde da população.
Referências
ALVES, F. J. O.; MACHADO, D. B.; BARRETO, M. L. Effect of the Brazilian cash transfer
programme on suicide rates: a longitudinal analysis of the Brazilian municipalities. Social
Psychiatry and Psychiatric Epidemiology, 54, n. 5, p. 599-606, 2019. DOI:
10.1007/s00127-018-1627-6.
AQUINO, R. et al. Impact of the Family Health Program on infant mortality in Brazilian
municipalities. American Journal of Public Health, v. 99, n. 1, p. 87-93, 2009.
ARAGÃO, E. S.; FUNCIA, F. R. Austeridade fiscal e seus efeitos no complexo econômico-

industrial da saúde no contexto da pandemia da COVID-19. Cadernos Saúde Pública, v.
37, n. 9, p. 1-5, 2021.
ARAGÃO, E. S. et al. Avaliação da efetividade, impacto econômico e abrangência do

Programa Aqui Tem Farmácia Popular do Brasil: relatório de pesquisa. Brasília:
ARAGÃO, E. S. et al. Avaliação de custo e efetividade das policlínicas: relatório de

pesquisa. Salvador: SESAB: BID, 2022.
BALTRUSIS, N.; DIOTTAVIANO, M. C. L. Rich and por, each one in their place:
socioespatial inequality in São Paulo. Caderno CRH, v. 22, n. 55, p.135-149, 2009.
BARRETO, M. L. et al. Effect of city-wide sanitation programme on reduction in rate of

childhood diarrhoea in northeast Brazil: assessment by two cohort studies. Lancet, v. 370,
n. 9599, p. 1622-1628, 2007. DOI: 10.1016/S0140-6736(07)61638-9.
BARRETO, M. L. Health inequalities: a global perspective. Ciência & Saúde Coletiva, v.

22, n. 7, p. 2097-2108, 2017. DOI: 10.1590/1413-81232017227.02742017.
BARRETO, M. L. et al. The Centre for Data and Knowledge Integration for Health
(CIDACS): linking health and social data in Brazil. International Journal of Population
Data Science, v. 4, n. 2, p. 1-12, 2019. DOI: 10.23889/ijpds.v4i2.1140.
BARRETO, M. L. et al. Cohort profile: the 100 Million Brazilian Cohort. International
Journal of Epidemiology, v. 51, n. 2, p. e27-e38, 2022.
BIRN, A. E. Back to Alma Ata, from 1978 to 2018 and beyond. American Journal of
Public Health, v. 108, n. 9, p. 1153-1155, 2018.
BUSS, P. M.; PELLEGRINI FILHO, A. A saúde e seus determinantes sociais. Revista

Saúde Coletiva, v. 17, n. 1, p. 77-93, 2007.
ENGELS, F. A situação da classe trabalhadora na Inglaterra. São Paulo: Boitempo,
2010. 388p.
EVANS, T. et al. Challenging inequities in health from ethics to action. Oxford: Oxford
University Press, 2001.
GIOVANELLA, L. et al. De Alma-Ata a Astana. Atenção primária à saúde e sistemas

universais de saúde: compromisso indissociável e direito humano fundamental. Cadernos
Saúde Pública, v. 35, n. 3, p. 1-6, 2019.

43
GUNNING-SCHEPERS, L. J. Models: instruments for evidence-based policy. Journal
Epidemiology Community Health, v. 53, n. 5, p. 263, 1999.
JESUS, G. S. et al. The effect of primary health care on tuberculosis in a nationwide

cohort of 7·3 million Brazilian people: a quasi-experimental study. Lancet Global Health,
v. 10, p. e390-e397, 2022.
KRIEGER, N. Embodying inequality: a review of concepts, measures, and methods for

studying health consequences of discrimination. International Journal Health Services,
v. 29, n. 2, p. 295-352, 1999. DOI: 10.2190/M11W-VWXE-KQM9-G97Q.
MACHADO, D. B. et al. Conditional cash transfer programme: impact on homicide rates

and hospitalisations from violence in Brazil. PLoS One, v. 13, p. e0208925, 2018. DOI:
10.1371/journal.pone.0208925
MACHADO, D. B. et al. Relationship between the bolsa familia national cash transfer
programme and suicide incidence in Brazil: a quasi-experimental study. PLoS Medicine,
v. 19, n. 5, p. 1-17, 2022. DOI: 10.1371/journal.pmed.1004000.
MIRANDA, S. S. et al. (org.). Construção de conhecimento no curso da pandemia de

COVID-19: aspectos biomédicos, clínico-assistenciais, epidemiológicos e sociais.
Salvador: Edufba, 2021. p. 1-29. v. 2.
NERY, J. S. et al. Effect of the Brazilian conditional cash transfer and primary health care
programs on the new case detection rate of leprosy. PLoS Neglected Tropical Diseases,
v. 8, n. 11, p. 1-7, nov. 2014. DOI: 10.1371/journal.pntd.0003357.
PAIXÃO, E. S. et al. Cohort profile: Centro de Integração de Dados e Conhecimentos para

Saúde (CIDACS) Birth Cohort. International Journal of Epidemiology, v. 50, n. 1, p. 37-
38., mar. 2021. DOI: 10.1093/ije/dyaa255.
PINTO-JR, E. P. et al. Impact of PHC system factors on under-5 mortality: final report.
Salvador: Cidacs/Fiocruz, 2023. Disponível em: https://cidacs.bahia.fiocruz.br/aps/.
Acesso em: 21 maio 2023.
PESCARINI, J. M. et al. Conditional cash transfer program and leprosy incidence: analysis
of 12.9 million families from the 100 Million Brazilian Cohort. American Journal of
Epidemiology, v. 189, n. 12, p. 1547-1558, 2020a. DOI: 10.1093/aje/kwaa127
PESCARINI, J. M. et al. Effect of a conditional cash transfer programme on leprosy

treatment adherence and cure in patients from the nationwide 100 Million Brazilian Cohort:
a quasi-experimental study. Lancet Infectious Diseases, v. 20, p. 618-627, 2020b.
PESCARINI, J. M. et al. Impact of Brazil’s Bolsa Família Programme on cardiovascular

and all-cause mortality: a natural experiment study using the 100 Million Brazilian Cohort.
International Journal of Epidemiology, v. 51, n.6, p. 1847-1861, 2022. DOI:
10.1093/ije/dyac188.
PRESTON, S. The changing relation between mortality and level of economic

development. Population Studies, v. 29, n. 2, p. 231-248, 1975.
RAMOS, D. et al. Conditional cash transfer program and infant mortality: a nested cross-
sectional analysis in the Cohort of 100 Million Brazilians. PloS Medicine, v. 18, n. 9, p. 1-
20, 2021. DOI:10.1371/journal.pmed.1003509.
RASELLA, D. et al. Effect of a conditional cash transfer program on infant mortality: a
national analysis of Brazilian municipalities. Lancet, v. 382, n. 9886, p. 57-64, 2013. DOI:
10.1016/S0140-6736(13)607151.
RASELLA, D.; AQUINO, R.; BARRETO, M. L. Reducing childhood mortality from diarrhea
and lower respiratory tract infections in Brazil. Pediatrics, v. 126, n. 3, p. 534-540, 2010.
RASELLA, D. et al. Impact of primary health care on mortality from heart and
cerebrovascular diseases in Brazil: a nationwide analysis of longitudinal data. British
Medical Journal, n. 348, p. 1-10, 2014. DOI: 10.1136/bmj.g4014.
RASELLA, D. et al. Long-term impact of a conditional cash transfer programme on

maternal mortality: a nationwide analysis of Brazilian longitudinal data. BMC Medicine, v.
19, p. 1-9, 2021. DOI: 10.1186/s12916-021-01994-7.
SCHRENK, M.; VIRCHOW, R. 150 Geburtstag. Berlin: Ficher Verlag, 1971.
SCLIAR, M. História do conceito de saúde. Physis: Revista Saúde Coletiva, v. 17, n. 1, p.

29-41, 2007. DOI: 10.1590/S0103-73312007000100003
SOUZA, R. et al. Family health and conditional cash transfer in Brazil and its effect on
tuberculosis mortality. International Journal of Tuberculosis and Lung Disease, v. 22,
p. 1300-1306, 2018.
VILLERMÉ L. R. Reseña del estado físico y moral de los obreros de las industrias del
algodón, la lana y la seda. In: BUCK, C. et al. (ed.). El desafio de la epidemiología:
problemas y lecturas seleccionadas. Washington: OPAS, 1988. p. 34-37.
WHITEHEAD, M. The concepts and principles of equity and health. Geneva: WHO,
2000. (EUR/ICP/RPD 414, 7734r).
WILKINSON, R. G. Socioeconomic determinants of health. Health inequalities: relative or

absolute material standards? British Medical Journal, v. 314, p. 591-595, 1997.

45
Capítulo 2
Institucionalização da avaliação no
âmbito do Executivo Federal: CMAP e
editais de pesquisa em saúde
Luciana Mendes Santos Servo1

Rodrigo Pucci de Sá e Benevides1
1
Instituto de Pesquisa Econômica Aplicada - IPEA
RESUMO:
Este capítulo discute a institucionalização da avaliação de programas e políticas de saúde. As
ações vêm sendo objeto de avaliação há anos, tanto pela maior interação entre universidades,
institutos de pesquisa e Ministério da Saúde quanto pela atuação do CMAP. O trabalho parte
de análises documentais, revisão da literatura, além de buscar dados sobre financiamento das
pesquisas e incorporar a perspectiva a partir do PPA e da LOA. Apesar da longa discussão sobre a
institucionalização da avaliação, ainda há muitos desafios para que as avaliações sejam efetivamente
incorporadas e contribuam para aperfeiçoamento das políticas públicas de saúde.
PALAVRAS-CHAVE:
Avaliação. Institucionalização. Políticas públicas de saúde.
1 Apresentação
A avaliação tem, entre outros objetivos, apoiar a gestão para aprimoramento das políticas
públicas. Como seu objeto – as políticas públicas – se reveste de níveis de complexidade,
institucionalidade e maturidade bem diferenciados, a institucionalização da avaliação deve
considerar esses fatores e ter capacidade para a esses se adaptar (VAISTMAN; PAES-
SOUZA, 2011).
A avaliação de políticas públicas para informar o processo de planejamento plurianual e do

orçamento anual estava prevista na Constituição Federal de 1988, com demandas diretas
para o órgão responsável pelo planejamento central no Executivo federal. Desde então,
diversas tentativas vêm sendo realizadas para institucionalizar a avaliação sob a
coordenação do centro de governo, sendo a mais recente relacionada à criação do
Conselho de Monitoramento e Avaliação de Políticas Públicas (CMAP).
A denominação centro de governo vem sendo utilizada para se referir às representações

que compõem as estruturas organizadas (comitês, conselhos, grupos de trabalho) nesse
processo de institucionalização. Ainda que essa denominação tenha diferentes
conceituações em diferentes contextos, esses centros – no sentido mais amplo – podem
ser compostos por instituições de governo que atuem, também, em atividades transversais
e de integração. “Podem exercer atribuições finalísticas; no entanto, devem também possuir
um segundo papel relacionado a temas intersetoriais e a funções de planejamento,
coordenação e gerenciamento” (CAVALCANTE, 2018, p. 19). É nesse sentido que se pode
entender que os ministérios da Fazenda, Planejamento e Economia – além daqueles
diretamente vinculados à Presidência da República – podem fazer parte de centros de
governo. Assim, entende-se como vinculado ao centro de governo o processo de
institucionalização do qual faz parte o CMAP.
Nesse processo recente, ações da área de saúde têm sido selecionadas para
monitoramento e avaliação. Para além dessa avaliação pelo centro de governo, as políticas,
programas e ações do Ministério da Saúde têm sido objeto de avaliação com fomento por
esse órgão setorial e parceiros. Esse fomento acontece diretamente por meio das áreas
técnicas gestoras dos programas ou por editais coordenados pela Secretaria de Ciência,
Tecnologia e Insumos Estratégicos (SCTIE).

47
Este capítulo tem por objetivo descrever e analisar esse processo de institucionalização da
avaliação no governo federal, seus avanços e desafios no âmbito do CMAP e apresentar
alguns dados de pesquisas financiadas por editais da SCTIE. Espera-se contribuir para
ampliar o conhecimento sobre esse processo e, por conseguinte, os debates para seu
aprimoramento. Na próxima seção será apresentada a metodologia utilizada para análise.
A seção 3 tem por foco o CMAP. Em seguida analisam-se algumas informações sobre a
avaliação nos editais da Secretaria de Ciência, Tecnologia e Insumos Estratégicos (SCTIE)
do Ministério da Saúde. Por fim, apontam-se algumas questões relacionadas a esses
processos e tecem-se considerações que podem apoiar seu aprimoramento.
2 Metodologia
A análise da institucionalização do monitoramento e avaliação no âmbito do centro de

governo do Executivo Federal foi realizada a partir de revisão da literatura e análise
documental. No caso das avaliações financiadas por editais do Ministério da Saúde, a
análise concentrou-se nos editais da SCTIE. A principal fonte foram os dados e informações
disponibilizadas por meio do Pesquisa Saúde, um sítio do Ministério da Saúde que contém
pesquisas fomentadas pelo Departamento de Ciência e Tecnologia (DECIT) da SCTIE,
relacionadas à Agenda Nacional de Pesquisas Prioritárias em Saúde (ANPPS) e Pesquisas
Estratégicas para o Sistema de Saúde (PESS), as quais serão apresentadas na seção 4.
Fontes para análise da institucionalização no Centro de Governo: o caso do CMAP
Para análise do processo de institucionalização no centro de governo, realizou-se revisão

da literatura sobre o tema e a partir da legislação com informações sobre esse processo.
Ademais, para análise do período mais recente, além da experiência dos autores deste
capítulo como executores e coordenadores de avaliações do CMAP, analisaram-se os
documentos disponibilizados na página do Conselho. Quando do fechamento deste
capítulo, encontravam-se disponíveis a legislação, as atas e resoluções do período
fevereiro de 2019-junho de 2022, os relatórios de avaliação, recomendações e
manifestação dos gestores dos Ciclos 2019, 2020 e 2021, o relatório anual do Ciclo 2020
enviado ao Congresso Nacional, os guias para avaliação ex-ante e ex-post, bem como
boletins e outras informações sobre capacitação e apresentações (BRASIL, 2022a).
Editais da SCTIE: Pesquisa Saúde
O sítio do Pesquisa Saúde contém diferentes formas de acesso aos dados das pesquisas
relacionadas aos editais do DECIT. Uma dessas formas é por meio do Tabnet (disponível
na página), o qual contém informações sobre o ano de publicação do edital ou da
contratação do projeto; da instituição de vínculo do coordenador proponente do projeto de
pesquisa; subagenda da ANPPS; vinculação aos objetivos estratégicos das PESS;
modalidade de fomento; modalidade de gestão; tipo de pesquisa; natureza da pesquisa;
setor de aplicação; parceiro administrativo; parceiro orçamentário e se houve formação de
mestre, doutor ou especialista. Os conteúdos de pesquisa disponíveis no Tabnet incluem:
quantidade de projetos, valor com bolsa, valor sem bolsa, valor DECIT, valor parceiro e
valor total dos projetos. O foco da análise eram avaliações financiadas pelos editais e
avaliações de impacto. O termo “avaliação” aparece nas subagendas da ANPSS, em
objetivos estratégicos das PESS e no setor de aplicação. Contudo, quando são analisados
os dados pelo Tabnet1, observa-se uma grande inconsistência das informações disponíveis,
como a ausência de informações sobre as pesquisas para os anos 2015 a 2017 e ausência
parcial de informações para os anos 2004, 2011, 2018 e 2021. Essas inconsistências foram
verificadas utilizando-se a variável “unidade da federação” e comparando com a planilha
obtida por meio do mecanismo de busca do site Pesquisa Saúde2, de onde é possível extrair
as planilhas Excel® usando-se o filtro ano a ano. O total de registros pelo Tabnet foi de
5.405 pesquisas, enquanto nas planilhas extraídas do mecanismo de busca foram 7.094,
ou seja, 24% das pesquisas não constam do Tabnet. Outra inconsistência da consulta do
Tabnet é a ausência parcial de informações de algumas variáveis (nem todas foram
testadas) como “Subagenda ANPPS”, que consta somente em 1.964 pesquisas, 28% do
total de 7.094 pesquisas financiadas entre 2002 e 2021.
Optou-se por trabalhar com a base mais detalhada sobre as pesquisas. A base completa
dos editais não foi localizada devido às mudanças realizadas na vinculação do site do
Ministério da Saúde ao gov.br. Assim, decidiu-se por realizar a extração ano a ano de todas
as pesquisas por meio do mecanismo de busca do sítio do Pesquisa Saúde, que traz
informações relevantes não disponíveis no Tabnet, tais como o título e o resumo de todas
as pesquisas financiadas.
1
A consulta de dados do site Pesquisa Saúde pelo Tabnet está disponível em:
http://pesquisasaude.saude.gov.br/erro/httpErro404.xhtml;jsessionid=x7riWKf8iVMte5e6AgmHesW4.
2
O mecanismo de busca do sítio Pesquisa Saúde está disponível em:
http://pesquisasaude.saude.gov.br/pesquisas.xhtml.

49
Para essa análise, optou-se por considerar as informações das pesquisas informadas até
2019, excluindo-se da análise aquelas cujo ano fosse 2020 e 2021. A partir do título do
edital, do título da pesquisa e dos resumos, realizou-se uma busca dos termos “avaliação”
e “impacto”. O resultado pelo título do edital3 foi muito menor (226 pesquisas) do que a
análise pelo título (1.387) ou pelo resumo (2.452). Considerando a seleção pelo resumo,
foram contabilizados: total de pesquisas contendo esses termos, total de pesquisas e por
vinculação às subagendas da ANPSS. Como será apresentado posteriormente, a
vinculação aos objetivos estratégicos da PESS apresentou muitos casos de “não
informados”. Assim, com todas essas questões, optou-se por fazer uma análise exploratória
inicial e sintética desses dados, que serão apresentados na seção 4.
3 Monitoramento e avaliação no executivo federal: o caso do CMAP
3.1 Breve histórico da institucionalização até 2019
O Plano Plurianual (PPA) foi estabelecido na Constituição Federal de 1988 (CF 88),
no capítulo que trata “Dos Orçamentos”, Art. 165, que se refere também à Lei de
Diretrizes Orçamentárias (LDO) e à Lei Orçamentária Anual (LOA). Enquanto o PPA
é um instrumento de planejamento de quatro anos, o qual começa no segundo ano
do mandato presidencial e vai até o primeiro ano do mandato seguinte, a LDO e a
LOA são anuais. A CF 88 previa também um sistema de controle interno mantido
pelos poderes Executivo, Legislativo e Judiciário, com a finalidade, entre outras, de
avaliar o cumprimento das metas previstas no plano, bem como os seus resultados
relativos à eficácia e à eficiência (Art. 74).
Figura 1 - Fases do monitoramento e avaliação do PPA
Fonte: Elaboração Própria.
3
Não foram contabilizados os títulos de editais que repetem o título da pesquisa, por se considerar que
houve erro no preenchimento.
O primeiro PPA teve vigência no período 1991-1995 – o único quinquenal – e foi
marcado pela instabilidade econômica e política (GARCIA, 2000). O PPA para o
período 1996-1999 buscou vincular planejamento e orçamento – ocasião em que se
iniciou a construção de um sistema de informações gerenciais para monitoramento
do plano – e a avaliação era mencionada como atribuição de cada órgão setorial.
Garcia (2000) considera que esse plano nem chegou a ser avaliado, pois não havia
instrumentos efetivos para isso e o foco estava muito centrado na questão fiscal,
reduzindo-se a importância do planejamento.
O PPA 2000-20034 foi o primeiro a utilizar o Sistema de Informações Gerenciais e

de Planejamento (Sigplan) e explicitou a obrigatoriedade de se enviar ao Congresso
Nacional o relatório de avaliação de cada exercício. Esse documento deveria conter
a análise do comportamento dos principais indicadores macroeconômicos utilizados
para elaboração do plano, bem como análise de indicadores por programa,
considerando-se o índice alcançado ao término do exercício anterior comparado ao
índice previsto, e uma avaliação, por programa, da possibilidade de alcance do
previsto e cumprimento das metas. Além disso, deveria conter a execução física e
financeira de forma regionalizada e separada entre orçamentos fiscal e da
seguridade social, de investimentos e demais fontes 5 . Em linhas gerais, essa
obrigatoriedade foi mantida na Lei do PPA 2004-2007 (BRASIL, 2004a), no qual a
inovação foi a discussão da proposta nas 27 unidades da federação. Nessa lei,
previa-se que os órgãos setoriais enviariam um plano de avaliação dos seus
programas ao órgão central de planejamento do Executivo federal.
Em 2006, inicia-se no Ministério do Planejamento a elaboração de um sistema de

avaliação do PPA e promulga-se uma lei que prevê o acesso do Congresso Nacional
a esse sistema. Além disso, estavam previstas avaliações pela gerência do
programa, avaliação dos órgãos setoriais, consolidada por uma Unidade de
Monitoramento e Avaliação (UMA), em geral vinculada às subsecretarias de
planejamento, orçamento e administração (SPOA) de cada órgão, e avaliação do
Plano, esse último sob responsabilidade do Ministério do Planejamento, Orçamento
4
PPA 2000-2003: https://bibliotecadigital.economia.gov.br/handle/123456789/525650.
5
Cabe destacar que “[...] antes da aprovação da Lei do PPA 2000-2003, houve a promulgação da LRF, que
inaugura, segundo Barcelos (2012), um novo regime de governança orçamentária no Brasil. Nesse ponto, a
sobreposição e a disputa entre os instrumentos de planejamento e orçamento revelam-se de maneira nítida”
(COUTO; CARDOSO JUNIOR, 2020, p. 26).

51
e Gestão (MPOG). O programa deveria ser avaliado em sua concepção,
implementação e resultados. Os gerentes deveriam responder a questões de
monitoramento e avaliação que compunham um formulário dentro do Sigplan e cujas
respostas e análises seriam consolidadas e complementadas pelas SPOA. O MPOG
realizava a análise das respostas e mapeava as dificuldades para implementação e
alcance dos objetivos do programa.
Ainda na vigência do PPA 2004-2007 instituiu-se a Comissão de Monitoramento e

Avaliação (CMA), apoiada por um Comitê Técnico de Monitoramento e Avaliação
(CTMA), a qual integrava o sistema de avaliação do Plano (BRASIL, 2004b). A CMA
era composta por representantes de secretarias do MPOG, do Ministério da
Fazenda, da Casa Civil da Presidência e pelo IPEA. O Ministério do Meio Ambiente
também participava da CMA no que se refere ao exame da viabilidade técnica e
socioeconômica de projetos de grande vulto. Dentre suas atribuições estavam a
elaboração de normas e procedimentos gerais para monitoramento e avaliação do
PPA; diretrizes gerais para implementar metodologias de avaliação, bem como
avaliar propostas de aprimoramento de metodologias e selecionar programas a
serem avaliados (SERPA, 2011).
No período 2008-2011 criou-se o Comitê de Gestão do Plano e o papel da CMA

passou a ser o de assessorar esse comitê. A composição da CMA mudou, com a
saída do MMA e a inclusão da Secretaria Geral da Presidência, do IBGE e da Diretoria
de Estatais (DEST) do MPOG. Além do CTMA, passa a contar com o apoio da
Câmara Técnica de Projetos de Grande Vulto (CTPGV). As Unidades de
Monitoramento e Avaliação (UMA), que deveriam ser criadas em cada ministério,
passaram a ter, entre outras atribuições, o papel de assessorar o secretário executivo
ou seu equivalente no monitoramento e avaliação dos objetivos setoriais do conjunto
dos programas e ações do órgão (SERPA, 2011).
Como ressalta Serpa (2011), em ambos os PPAs a atuação da CMA foi dominada
pela análise dos projetos de grande vulto. Além disso, não houve reuniões da CMA
durante os anos 2008, 2010 e início de 2011 (SERPA, 2011). Ainda segundo a
análise realizada por essa comissão, houve discussões para desenvolvimento de
metodologias centradas no que se denominou avaliações rápidas, as quais foram
baseadas na construção de modelo lógico de programas visando explicitar a teoria
do programa, seus objetivos, insumos, atividades e resultados esperados. A
proposta metodológica foi aplicada a um programa (FERREIRA; CASSIOLATO;
GONZALEZ, 2009) e consolidada também em uma nota técnica de orientação
elaborada por equipe do IPEA (CASSIOLATO; GUERESI, 2010). Ainda que não
tenha sido concluída no âmbito da CMA, a aplicação dessa metodologia foi
disseminada pela equipe da Secretaria de Planejamento e Investimentos
(SPI/MPOG) – que coordenava a formulação, monitoramento e avaliação do PPA –
e o Tribunal de Contas da União (TCU) constatou sua importância para melhoria da
formulação dos programas e atividades de avaliação (SERPA, 2011).
Outro ponto importante destacado por Serpa (2011) a partir de avaliação realizada
pelo Banco Mundial, em 2006, é que a estrutura do PPA e as informações produzidas
para seu monitoramento e avaliação eram mais utilizadas para subsidiar as
necessidades do gestor do Plano no MPOG e não atendiam diretamente às
necessidades dos órgãos setoriais. Essa questão remete a duas outras, as quais
permitem fazer conexões com a discussão específica desse processo de
institucionalização da avaliação de políticas: (1) o foco nas ações orçamentárias e a
menor importância conferida ao planejamento; (2) a não conformidade entre o que o
PPA e os órgãos setoriais denominam programa; (3) a atuação das UMAs como
coordenadoras dos processos de avaliação setoriais e estabelecimento de diálogo
entre PPA e a programação de cada órgão.
Com relação ao primeiro ponto, Navarro, Santos e Franke (2012) argumentam que
o planejamento era voltado para controlar as ações, tendo os programas como
centros de custos e cujo objetivo era a redução dos gastos públicos. A eficiência se
tornou o objetivo preponderante a ser alcançado nesse processo. A análise das
políticas públicas, a elaboração de diagnósticos e a revisão do plano não eram o foco
principal. Assim, conforme esses autores, predominam a preocupação com a revisão
de estruturas orçamentárias e discussões contábeis. Cavalcante (2007) chama
atenção também para o peso dado ao controle orçamentário que influenciará a
sistemática de monitoramento e avaliação no âmbito do Executivo. Esse autor
também salienta a dificuldade dos gestores dos programas para aferir seus
resultados, expressa nas limitações na elaboração de indicadores de resultados –
principalmente para mensurá-los – e mais, para estimar o impacto desses
programas.
Pensadas para fortalecerem o monitoramento e avaliação no âmbito dos órgãos

setoriais, as UMAs foram assumidas pelas coordenações gerais de planejamento

53
quando essas existiam naquele órgão. Não foram, em sua maioria, criadas novas
estruturas ou ampliado o quadro de pessoal para responder por essa função
(SERPA, 2011). Em questionário para levantamento do número de avaliações
realizadas por cada órgão, o Ministério da Saúde foi aquele que informou o maior
número de avaliações setoriais realizadas – total de 44. Essas avaliações foram
executadas sem a participação da UMA – ou mesmo conhecimento sobre os
trabalhos realizados – e contratadas diretamente pelas áreas responsáveis pela
implementação dos programas. Como aponta Serpa (2011), essa situação ocorreu
também em outros órgãos.
Criado ainda na vigência do PPA 2004-2007, o SMMP pretendia dar mais celeridade
às respostas para o alto escalão e produzir informações diferenciadas daquelas
contidas no PPA. As prioridades eram definidas por um comitê composto pela Casa
Civil e suas duas subchefias – Subchefia de Articulação e Monitoramento (SAM) e
Subchefia de Ação Governamental (SAG) – e pela SPI/MPOG. Estabelecia-se um
fluxo de informações que geravam posteriormente um relatório situacional e de
encaminhamentos para orientar as decisões do Ministro-Chefe da Casa Civil e do
Presidente (MAIA; SILVA; SALVIANO, 2013). Ainda em 2007, com a criação do
Programa de Aceleração do Crescimento (PAC), estabeleceu-se um novo sistema
para acompanhamento das metas presidenciais relacionadas ao PAC. O SIOP
respondia por todo o PPA e o SISPAC pelo monitoramento do PAC.
Outra alteração nesse período refere-se ao desenvolvimento do Sistema Integrado

de Planejamento e Orçamento do Governo Federal (Siop), pela Secretaria de
Orçamento Federal (SOF) do Ministério da Fazenda, cujo início se deu em 2009,
com o objetivo de substituir o Sistema Integrado de Dados Orçamentários (Sidor) e
o Sigplan. Em parte, esse sistema visava resolver outra questão, uma avaliação de
que o Sigplan não conseguia atender às necessidades de resposta dos objetivos
estratégicos de governo.
O SIOP passou a ser utilizado para elaboração e revisão do PPA e dos projetos da
LDO e da LOA, para alterações orçamentárias e de créditos, do orçamento
impositivo, informação sobre as receitas, acompanhamento das estatais,
acompanhamento orçamentário e monitoramento do PPA (ENAP, 2021). A princípio
esse sistema integrou ainda mais o processo de elaboração do orçamento e do PPA.
Ao mesmo tempo, os debates sobre a preponderância do orçamento sobre o
planejamento levaram a uma proposta de separação entre ambos, a qual foi
consolidada no processo de elaboração do PPA 2012-2015. A expectativa era dar
maior clareza às prioridades de governo, estabelecer mecanismos para a gestão
estratégica do Plano, bem como ampliar a participação social. Havia argumentos de
que se mantém uma inversão no processo: “em vez de o PPA balizar a elaboração
das LOAs, as dotações atualizadas das leis orçamentárias é que têm alimentado o
processo de revisão do PPA” (MARTINS NETO; CARDOSO JUNIOR, 2018). Esse
argumento é reforçado em outras análises que reiteram a predominância do
orçamento sobre o planejamento (COUTO; CARDOSO JUNIOR, 2020). Como
argumentam Martins Neto e Cardoso Jr., a despeito dos avanços o fato de o PPA ter
que consolidar toda a ação de governo, “[...] fez com que as políticas prioritárias
ficassem escondidas em um universo de mais de 400 objetivos e 2 mil metas”
(MARTINS NETO; CARDOSO JUNIOR, 2018, p. 73). Os autores, contudo,
consideram que esse PPA cumpriu papel importante quanto à participação social.
Foi proposta nova metodologia, na qual as ações orçamentárias deixariam de fazer

parte do PPA e a articulação entre ambos se daria por outros meios. Foram criadas
“Iniciativas”, que vinculariam o orçamento ao PPA, as quais agregavam várias ações
(COUTO; CARDOSO JUNIOR, 2020). Criaram-se Programas Temáticos, aos quais
estavam vinculados Objetivos e Iniciativas. Os primeiros deveriam expressar a
entrega de bens e serviços à sociedade. Os objetivos deveriam expressar o que se
quer fazer definido em macroáreas de atuação do governo. As iniciativas derivam
dos objetivos e significam o que se fará para alcançar os objetivos. Esperava-se,
com essa nova metodologia, deixar as prioridades de governo mais claras e realizar
um monitoramento mais estratégico (COUTO; CARDOSO JUNIOR, 2020).
No final do ciclo desse PPA, em 2015, por decreto se criou o Grupo de Trabalho
Interministerial para Acompanhamento de Gastos Públicos do Governo Federal
(Gtag), composto pelo MPOG, Ministério da Fazenda, Casa Civil e Controladoria-
Geral da União (CGU). Seus objetivos estavam relacionados a melhorias da
eficiência e efetividade do gasto público e aperfeiçoamento das políticas públicas. O
GTAG tinha caráter temporário.

55
Em 2016 instituiu-se o Comitê de Monitoramento e Avaliação (CMAP)6, por portaria,
como instância coordenadora do monitoramento e avaliação no âmbito do poder
executivo, com objetivos bem próximos daqueles do Gtag (BRASIL, 2016).
Anualmente seria selecionado e analisado um grupo de políticas, programas e
ações. A presidência e a secretaria-executiva cabiam ao MPOG e o comitê também
era composto por representantes de secretarias desse ministério, do Ministério da
Fazenda, da Controladoria Geral da União (CGU) e da Casa Civil. A Portaria previa
o apoio ao CMAP por parte do Instituto de Pesquisa Econômica Aplicada (IPEA), do
Instituto Brasileiro de Geografia e Estatística (IBGE), da Escola Nacional de
Administração Pública (ENAP), da Escola de Administração Fazendária (Esaf) e da
Ouvidoria Geral da União.
Em 2017 criou-se o Comitê de Avaliação dos Subsídios da União (CMAS),

coordenado pelo Ministério da Fazenda, contando com membros da Casa Civil e da
CGU e apoio da Esaf, IPEA e IBGE. Na primeira versão do decreto que criou o CMAS
não se fez menção ao CMAP. Assim, esse ficaria responsável pelo gasto direto e
aquele pelos subsídios (FEU et al., 2022).
Formalmente o CMAP não contava com apoio técnico e administrativo específico,

nem com um arcabouço pré-definido para seleção das políticas públicas (MIRANDA
et al., 2021); essa função continuava a ser exercida pela SPI/MPOG. Com o fim do
MPOG e sua junção com o Ministério da Fazenda, as atividades passaram a ser
assumidas pela Secretaria de Avaliação, Planejamento, Energia e Loteria (Secap),
criada no âmbito do Ministério da Economia 7 . Em 2019, novo decreto criou o
Conselho de Monitoramento e Avaliação de Políticas Públicas (CMAP), com a
atribuição de conduzir avaliações de políticas públicas financiadas por gastos diretos
e subsídios da União, selecionadas anualmente (BRASIL, 2019)8. Esse conselho
passou a contar com dois Comitês: o Comitê de Avaliação do Gasto Direto (CMAG)
e o Comitê de Avaliação de Subsídios (CMAS). Na lei do PPA 2020-2023, a
6
BRASIL. Ministério do Planejamento, Orçamento e Gestão. Portaria Interministerial n. 102, de 7 de abril
de 2016. Brasília, DF: MOG, 2016. Disponível em: https://bit.ly/3OThw5z. Acesso em: 2 jan. 2022.
7
Em janeiro de 2019, por meio da Medida Provisória 870, posteriormente convertida em lei (Lei nº 13.844,
de junho de 2019), a reforma administrativa unificou os Ministério da Fazenda e o MPOG, que passaram a
fazer parte do Ministério da Economia. Nessa reforma a ESAF foi incorporada à ENAP.
8
Antes da formalização do CMAP na lei do PPA, entre 2016-2018, havia então um processo de avaliação
de diversas políticas selecionadas pelo Centro de Governo (SACCARO; ROCHA; MATION, 2018); no
âmbito da saúde foi avaliado o Programa Farmácia Popular do Brasil e seu impacto sobre indicadores de
internações (ALMEIDA; VIEIRA; SÁ, 2018). Essa avaliação foi realizada no momento em que houve
questionamentos sobre a efetividade do programa, a qual mostrou impactos positivos de redução de
internações por doenças crônicas; em momentos posteriores, essa avaliação foi mencionada em defesa da
continuidade do programa quando houve propostas de extingui-lo.
avaliação foi incluída como um processo sistemático, integrado e institucionalizado
a ser realizado no âmbito do CMAP tanto para políticas financiadas pelo gasto direto
quanto por subsídios.
3.2 A Criação do CMAP e o Processo de Seleção de Ações para Avaliação
O Conselho de Monitoramento e Avaliação (CMAP) guarda semelhanças quanto à

composição do comitê que o antecedeu, com relação à representação dos
secretários executivos da Casa Civil, Ministério da Economia e CGU e por sua
atribuição de selecionar os programas e ações do PPA a serem avaliados
anualmente. Igualmente, o Instituto de Pesquisa Econômica Aplicada (IPEA), o
Instituto Brasileiro de Geografia e Estatística (IBGE) e a Escola Nacional de
Administração Pública (ENAP) figuram como apoiadores do CMAP. A Secap/ME,
que no final de 2021 passaria a integrar a Secretaria Especial de Economia, Trabalho
e Orçamento (SETO/ME), assessora o CMAP.
Em 2019, a partir da proposta da Secap/ME, foram formalizados e tornados

transparentes os critérios de seleção de programas a serem avaliados. Essa
formalização visava responder à recomendação do acórdão do TCU nº 2.515/2019.
Os critérios definidos se basearam naqueles aplicados pelo próprio TCU e pela
Controladoria Geral da União quando da realização de suas auditorias. Os critérios
foram: materialidade, criticidade e relevância. A materialidade refere-se à
participação da ação no orçamento (valor no PLOA ou dotação na LOA) ou do gasto
tributário no subsídio 9 . A criticidade refere-se à taxa de variação real dessas,
enquanto a relevância relaciona-se com as prioridades estabelecidas pelo governo
(BRASIL, 2019).
Como exposto no documento de priorização, a ação orçamentária é proxy para a

política pública relativa ao gasto direto e são selecionadas considerando-se os
programas que compõem cada PPA (nesse caso, o PPA 2020-2023)10. No processo
9
No caso dos subsídios, de acordo com a “projeção disponível dos Demonstrativos de Gasto Tributário
(DGT) e dos Benefícios Financeiros e Creditícios (DBF&C), no caso dos subsídios” (BRASIL, 2019).
10
“O rol de gastos com Subsídios são ações não orçamentárias, relacionadas a benefícios tributários e
creditícios, que não constam no OGU, somados aos subsídios financeiros, que têm ações orçamentárias.
As ações classificadas como Gastos Diretos são as demais ações orçamentárias de Programas Finalísticos,
excluindo-se, adicionalmente, as despesas financeiras orçamentárias que geram subsídios creditícios”
(BRASIL, 2019, p. 2).

57
de seleção, os programas finalísticos são ordenados de acordo com sua
materialidade e o critério de corte para inclusão como passível de avaliação aqueles
acima de mediana nesse critério11. Assim, inicialmente, para o PPA 2020-2023 foram
selecionados 33 programas relacionados ao gasto direto e 24 programas
relacionados aos subsídios.
Selecionados os programas, passou-se à seleção das ações orçamentárias dentro

dos programas, aplicando-se os mesmos critérios. Ao mesmo tempo buscavam
responder a outra recomendação do TCU, avaliando-se pelo menos uma política de
cada programa no decorrer dos quatro anos de vigência do PPA. Ao se considerar
essas duas recomendações, a princípio, a proposta da Secap seria avaliar ações de
oito programas de cada grupo (gasto direto ou subsídios) em cada ciclo de avaliação,
passando para os seguintes no ordenamento no próximo ciclo. Ou seja, no período
de 12 meses, as ações relacionadas a 16 programas seriam avaliadas e sua seleção
ocorreria considerando-se os critérios de materialidade, criticidade e relevância,
além de não ter sido avaliada no ciclo anterior (BRASIL, 2020a).
Em seguida, as instituições membros do CMAP e seus apoiadores são convidados,

a partir de oficinas, para propor questões de avaliação para cada ação selecionada.
Nessas oficinas são discutidos os focos das avaliações, elaboradas propostas de
questões, definidos os coordenadores de cada avaliação e os executores das
questões de avaliação. Cada avaliação tem uma instituição coordenadora, um
executor responsável por cada questão e poderá contar com outras instituições
executoras. A supervisão e apoio aos trabalhos era feita pela Secap/ME. Em outubro
de 2020, por meio da Resolução Conjunta nº1 do CMAG/CMAS foram estabelecidas
formalmente as funções e responsabilidades das instituições envolvidas nas
avaliações ex-post do CMAP (BRASIL, 2020b).
Assim, um ciclo de avaliação do PPA começa pelo processo de seleção das ações
a serem avaliadas. Uma vez selecionadas as ações, as secretarias do Ministério da
Economia, a CGU, o IPEA, a ENAP e o IBGE, bem como convidados com notório
11
“Gasto Direto foi de R$ 328,98 milhões [2]. No caso dos Subsídios da União, a mediana das políticas é de
R$ 651,88 milhões para 2020. Os Programas Finalísticos acima dos respectivos pisos representaram 99,5%
do total do Gasto Direto e 97,4% do total do Subsídios da União elencados no PPA” (BRASIL, 2019, p. 3).
saber são chamados a contribuir com as avaliações do CMAP12. São realizadas
oficinas em que se discute como a avaliação será conduzida: quais as questões de
avaliação propostas, qual a metodologia a ser utilizada, qual o órgão coordenador
da avaliação e quem serão os executores de cada questão. Em 2020 e 2021, o IPEA
foi um dos órgãos que mais coordenou e executou avaliações, após a CGU. A ENAP
tem atuado com a produção de materiais ou textos de apoio à avaliação, contratação
de consultores para apoiar oficinas e prestar outros apoios por demanda dos
coordenadores da avaliação e em acordo com a equipe de supervisão das
avaliações da Secretaria Especial do Tesouro e Orçamento (SETO/ME), criada em
2021, tendo em sua composição o Departamento de Avaliação de Políticas Públicas,
que passou a ser o supervisor das avaliações do CMAP.
As metodologias utilizadas nas avaliações do CMAP seguem os dois guias de

avaliação produzidos em 2018, relacionados a metodologias da avaliação ex-ante
(BRASIL, 2018a) e metodologias de avaliação ex-post (BRASIL, 2018b). Ainda que
o Guia ex-ante apresente diversas metodologias, até o Ciclo de 2022 não havia
previsão de realizar avaliações ex-ante que não fossem relacionadas à avaliação de
desenho e construção de modelo lógico. Assim, até 2021, as avaliações estão
relacionadas àquelas previstas no Guia de avaliação ex-post. No âmbito do CMAP,
há um conjunto de avaliações executivas – avaliações rápidas – as quais buscam
abordar aspectos relacionados ao desenho, à execução orçamentária e financeira,
à governança, à implementação e aos resultados dos programas. Há avaliações que
avançam em análises mais detalhadas e aprofundadas da execução orçamentária e
financeira, da governança, da implementação, dos resultados e/ou impactos dos
programas ou das ações selecionadas em cada ciclo de avaliação que podem
abordar todas ou apenas algumas dessas questões.
Na seleção do CMAP, observa-se um peso grande da materialidade, isto é, as ações

com maiores orçamentos foram as primeiras a serem avaliadas. Aqui surge uma
questão à qual voltaremos quando tratarmos das avaliações na área de saúde: os
programas e as ações do PPA não necessariamente dialogam com aquilo que os
órgãos setoriais – nesse caso o Ministério da Saúde – chamam de programas e
ações. Assim, quando se faz a seleção a partir do PPA, há nova etapa, uma seleção
12
Podem ser convidados a contribuir pesquisadores e representantes de outros órgãos e de entidades
públicas e privadas com notório saber (BRASIL, 2019).

59
da seleção: o que é passível de ser avaliado dentro daquela ação ou daquele
programa.
Cabe aos coordenadores elaborarem – conjuntamente com os executores – um

programa de trabalho a ser enviado e acompanhado pela equipe de supervisão.
Nesse momento são mapeadas as necessidades de dados de acesso restrito e, por
meio da antiga Secap/ME e atual SETO/ME, formaliza-se a demanda para os órgãos
setoriais gestores de cada base ou sistema de informação.
Um relatório intermediário deve ser enviado para a supervisão e há pelo menos uma
reunião técnica com participação dos membros do comitê ao qual se refere a
avaliação (CMAG ou CMAS). Outra reunião técnica é realizada no início do ano
seguinte. Além do relatório de avaliação, a instituição coordenadora deve produzir,
junto com os executores, um relatório de recomendações e esses dois produtos
devem ser enviados para os órgãos setoriais gestores dos programas/das ações até
março do ano subsequente. Os órgãos setoriais têm, em geral, 15 dias para produzir
uma manifestação sobre ambos os relatórios, mas o foco principal é sobre as
recomendações. A coordenação deve enviar as versões finais dos relatórios de
avaliação e recomendação, acompanhadas das manifestações dos órgãos setoriais
para o CMAP até o final de abril ou começo de maio do ano seguinte àquele do início
do ciclo de avaliação. Assim, os executores e a coordenação têm cerca de 10 meses
para produzirem as avaliações e os relatórios mencionados.
Em seu campo de atuação, os membros do CMAG e do CMAS analisam as questões

propostas para avaliação, aprovam-nas ou propõem alterações e orientam o CMAP,
exercendo a função de orientar as decisões do CMAP. Além disso, analisam os
resultados intermediários e os finais da avaliação, esclarecem dúvidas sobre os
relatórios entregues e orientam a análise do CMAP, a qual será realizada no final do
período de avaliação. Durante o processo de elaboração das avaliações, há
interação da coordenação da avaliação e dos executores diretamente com a equipe
de supervisão da SETO/ME e, em geral, pelo menos duas vezes com os membros
do comitê ao qual a avaliação está vinculada. Além disso, os coordenadores são
convidados a apresentarem as recomendações na reunião final com os membros do
CMAP. Os coordenadores da avaliação não votam, e os relatórios de avaliação e de
recomendações indicativos são enviados com antecedência à reunião de
deliberação pelo Conselho. Os membros do Conselho debatem os resultados e as
recomendações, aprovam, solicitam alterações ou exclusão dessas e inclusive
consideram as manifestações dos órgãos setoriais. Após a deliberação do CMAP,
tornam-se públicos os relatórios aprovados juntamente com as atas que contêm as
deliberações do Conselho.
Adicionalmente, em 2021, produziu-se um relatório anual das avaliações do ciclo

2020, composto pelos resultados das avaliações selecionadas, o qual foi
apresentado ao Congresso Nacional (BRASIL, 2021a). Nesse relatório apresentou-
se o processo de institucionalização da avaliação no centro de governo no período
mais recente, bem como o resumo das avaliações e recomendações realizadas no
Ciclo 2020; tal relatório destaca uma fase de pré-avaliação – a partir do Ciclo 2020
– que compreenderia o período de outubro do ano anterior até abril do ano da
avaliação. Essa fase seria para debates entre especialistas e gestores das políticas
a serem avaliadas, após a qual se definiriam as questões de avaliação; a fase de
execução da avaliação teria duração de 12 meses. Como se discutirá na próxima
seção, mesmo após essa fase, em alguns casos ainda se faz necessário avançar
nas discussões com os gestores para delimitação do escopo da avaliação.
3.3 CMAP: avaliações de programas e ações de saúde
No Quadro 1 são apresentadas todas as ações que foram avaliadas no âmbito do

CMAP nos ciclos 2019, 2020 e 2021. Em 2019, no âmbito do CMAG, foi selecionada
a ação Assistência Farmacêutica Especializada. Em 2020, quando da aplicação dos
critérios para seleção dos programas, há um grande peso da materialidade no que
se refere ao gasto direto e foi selecionada toda a ação do Piso da Atenção Básica
(219A) e toda a ação da Atenção Ambulatorial e Hospitalar à população em
procedimentos de média e alta complexidade (8585). Além dessas, foram
selecionadas as deduções com despesas médicas do imposto de renda pessoa
física e o Certificado de Entidades Beneficentes da Assistência Social na área de
saúde (CEBAS-Saúde) no âmbito do CMAS. Em 2021, no âmbito do gasto direto, foi
selecionada a ação Educação e Formação em Saúde (20YD).
No quadro 1 observa-se que a CGU é o órgão que mais coordenou avaliações na

área de saúde. Em 2021, o IPEA coordenou a avaliação do Pró-residência; nos anos

61
anteriores participou da execução de pelo menos uma questão de avaliação
naquelas realizadas no âmbito do CMAP. Os resultados das avaliações, os relatórios
de recomendações e as manifestações dos gestores estão disponíveis nos sítios do
CMAP, conforme o Quadro 1.
No Ciclo 2019, uma das dificuldades para se analisar a ação selecionada (CEAF) foi
o fato de ela ser parte de uma política mais ampla, qual seja, a Política Nacional de
Assistência Farmacêutica (PNAF), bem como se relacionar a políticas de
incorporação de tecnologia, desenvolvimento produtivo e regulação de preços, entre
outras. Isso ficou claro na elaboração do modelo lógico da ação selecionada,
contudo, a avaliação não tratava da PNAF, mas de uma ação que era parte dessa
política. Além disso, como destacado no relatório de avaliação, o CEAF é composto
por medicamentos de três grupos (básico, estratégicos e especializados), cujas
características, forma de organização da ação e responsabilidades de cada ente
federado são distintas (BRASIL, 2020a). Essas dificuldades também fizeram parte
dos processos de avaliações das outras ações selecionadas nos ciclos
subsequentes.
Quadro 1 - Avaliações de Programas e Ações de Saúde nos Ciclos 2019 a 2021 do CMAP
Ciclo Programa do Órgão Relatório de Manifestação do

Ação Comitê Coordenação Executores Relatório de
PPA setorial Avaliação Gestor
Recomendação
Componente
Assistência
Especializado da SOF/ME,
Farmacêutica Ministério
2019* Assistência CMAG SOF/ME SECAP/ME, https://bit.ly/3Q5PlRU https://bit.ly/3oNkAFF https://bit.ly/3PTHJ5a
e Insumos da Saúde
Farmacêutica CGU e IPEA
Estratégicos
(CEAF – 4705)
Piso da Atenção Atenção
Ministério https://bit.ly/3zRn38d;
Básica Variável Primária à CMAG CGU CGU e IPEA https://bit.ly/3BAvwxU https://bit.ly/3zT8eSU https://bit.ly/3OZCnUB
da Saúde
(PAB - 219A) Saúde
Atenção à saúde
da população
para Atenção https://bit.ly/3znqS3I;
Ministério
procedimentos Especializada CMAG CGU CGU e IPEA https://bit.ly/3zuC2np https://bit.ly/3SjynRZ https://bit.ly/3vE7z55
da Saúde https://bit.ly/3cUwxXj
de média e alta à Saúde
complexidade
(8585)
2020
Certificação de
Entidade
Beneficente da Atenção
Ministério https://bit.ly/3OZoAg
Assistência Especializada CMAS CGU CGU e IPEA https://bit.ly/3zqKrIo https://bit.ly/3oPulDl
da Saúde W
Social à Saúde
- Saúde (CEBAS
Saúde)
Dedução de Atenção SPE/ME,
Ministério
Despesas Primária à CMAS SPE/ME SECAP/ME https://bit.ly/3oPulDl https://bit.ly/3PVbkLL https://bit.ly/3SmUgj5
da Saúde
Médicas do IRPF Saúde e IPEA
Ministério
Gestão do
Educação e da Saúde e SOF/ME,
Sistema https://bit.ly/3cYcLdC
2021 formação em CMAG Ministério IPEA CGU, IPEA e https://bit.ly/3oQBTpo https://bit.ly/3vzFyvC https://bit.ly/3JpaBQi
Único de
saúde (20YD)** da INSPER
Saúde
Educação
Fonte: elaboração própria.
Nota: *No Ciclo 2021, instituições ou pessoas que não são membros ou apoiadores do CMAP foram convidadas pelo Ministério da Economia para contribuir
voluntariamente com as avaliações do CMAP. ** Para avaliação foi selecionada parte de um plano orçamentário dessa ação, relacionado ao Programa
Nacional de Apoio à Formação de Médicos Especialistas em Áreas Estratégicas para o SUS - Pró-residência Médica.

63
No Quadro 2, apresentam-se algumas questões surgidas após a seleção inicial no
Ciclo 2020 e 2021. A primeira se refere ao fato de muitas ações orçamentárias serem
“guarda-chuvas” para um conjunto de programas ou iniciativas no âmbito do
Ministério da Saúde. Isso não acontece apenas nesse ministério e está relacionado,
entre outros, ao fato de quanto mais detalhado for o orçamento, visando aproximar-
se do que seriam os programas e ações setoriais, mais complexas se tornam as
realocações intraorçamentárias pelo órgão gestor do programa. Assim, no processo
de elaboração do orçamento e do PPA os programas e ações orçamentárias
definidos foram bastante amplos, o que permite que o órgão setorial faça a gestão
com maior flexibilidade, de acordo com as questões e as necessidades que surgem
ao longo do processo de execução.
No Ciclo 2020, duas das ações selecionadas referiam-se a várias políticas,

programas e ações no âmbito do Ministério da Saúde (BRASIL, 2021a, 2021b). Além
disso, essas ações têm sua execução orçamentária realizada por meio de
transferências a estados e municípios. Ou seja, a implementação depende de outros
entes subnacionais. No caso da ação Atenção à saúde da população para
procedimentos de média e alta complexidade, conforme destaque no relatório de
avaliação, essa se refere a todo o teto da média e da alta complexidade (teto MAC).
No caso da atenção básica, a ação inicialmente selecionada foi o Piso da Atenção
Básica Variável, que também refletia vários programas do Ministério da Saúde. Em
ambos os casos, foram selecionados alguns aspectos dessas ações para análise,
sem abarcar todas as questões a essas relacionadas. Além disso, nesse ano haviam
sido alterados os critérios de transferências federais para a atenção básica por meio
de um programa denominado Previne Brasil. A proposta do CMAP, naquele
momento, não previa avaliações de linha de base. Assim, incluiu-se na discussão o
problema de se estar avaliando uma ação orçamentária que passaria por muitas
mudanças. Com isso, foi incluída uma análise dos efeitos das mudanças nos critérios
de transferências no orçamento dos municípios, mas mantido o foco da análise da
maior parte do relatório de avaliação no período anterior à mudança.
No Ciclo 2021, considerando-se as experiências das avaliações anteriores, tentou-

se estabelecer um foco mais claro para a avaliação da ação Educação e Formação
em Saúde (20YD), a qual também abarca vários planos orçamentários, como se pode
ver no Quadro 2. Essa ação no âmbito do Ministério da Saúde, envolvia o Programa
de Educação pelo Trabalho para a Saúde (PET-Saúde), o Programa de Qualificação
e Estruturação da Gestão do Trabalho e da Educação no SUS (ProgeSUS), entre
outros que eram parte de planos orçamentários. O principal plano orçamentário
dessa ação era o Apoio ao Desenvolvimento da Graduação, Pós-Graduação Stricto
e Latu Sensu em áreas estratégicas para o SUS (PO 0003), em razão de responder
por mais de 80% do recurso da ação em 2020. Contudo, somente por meio de
análises para além dos planos orçamentários, em diálogo com a equipe da Secretaria
de Gestão do Trabalho e da Educação na Saúde (Sgets) foi possível saber que os
recursos alocados nesse principal plano orçamentário são destinados principalmente
para o Programa Nacional de Apoio à Formação de Médicos Especialistas em Áreas
Estratégicas (Pró-residência Médica) e o Programa Nacional de Bolsas de
Residências Multiprofissionais e em Área Profissional da Saúde. Considerando-se a
impossibilidade de se avaliarem todos aqueles denominados programas pelo
Ministério da Saúde, os quais compunham essa ação orçamentária no ciclo de
CMAP, a partir das discussões entre os potenciais executores da avaliação
aplicaram-se novamente os critérios de materialidade (peso no orçamento) e de
criticidade para selecionar o Pró-residência como o programa a ser avaliado no Ciclo
2021.
Quando as discussões avançaram, observou-se que também seria difícil avaliar

ambas as modalidades de residência (médica e multiprofissional) no prazo
estipulado. Assim, mais uma vez se realizou nova seleção e a avaliação foi realizada
para o Pró-residência Médica13. Ainda que a ação orçamentária tenha como único
gestor o Ministério da Saúde, a portaria que instituiu o Pró-residência define também
o Ministério da Educação (MEC) como responsável pela gestão do programa. Assim,
no processo de avaliação e considerando-se a importância da coordenação entre
esses órgãos, o MEC foi convidado a participar das oficinas de avaliação de desenho
e de outras discussões durante o processo de avaliação. Além disso, fez uso de
sistemas de informações diretamente vinculado ao programa – do Sistema de
Gestão do Pró-residência (Sigresidencias) e, também, do Sistema do Conselho
Nacional de Residências Médicas (SisCNRM) gerido pelo MEC. Realizaram-se as
recomendações levando-se em consideração a importância do apoio do MEC na
gestão do programa.
13
Em 2021 os recursos foram alocados em outros dois novos POs (000E – Pró-residência médica e em
área multiprofissional da saúde no âmbito da atenção especializada e 000F – Pró-residência médica e em
área multiprofissional da saúde no âmbito da atenção primária), os quais não separavam as bolsas por
modalidade, mas por nível de atenção. Contudo, em 2022, novamente voltou a ter somente um plano
orçamentário.

65
Quadro 2 - Planos orçamentários e Programas relacionados às ações orçamentárias
selecionadas nos Ciclos 2020 e 2021 do CMAP
Programa
Ciclo % % %
PPA 2020- Ação / Plano Orçamentário 2020 R$ milhões
CMAP ASPS Programa Ação
2023
Total ASPS 2020 160.985,11 100,0
Programa 5018 - Atenção especializada
99.371,73 61,7 100,0
à saúde
Programa Ação 8585 - Atenção à saúde da
50.200,26 31,2 50,5 100,0
5018 - população para procedimentos em MAC
Atenção 0000 - Atenção à saúde da população para
44.023,49 27,3 44,3 87,7
especializada procedimentos em MAC
à saúde 0001 - SAMU - 192 1.160,97 0,7 1,2 2,3
0005 - Fundo de Ações Estratégicas e
5.015,80 3,1 5,0 10,0
Compensação-FAEC
Programa 5019 - Atenção Primaria à
26.717,15 16,6 100,0
Saúde
Ação 219A - Piso de atenção básica em
2020 20.647,66 12,8 77,3 100,0
saúde
0002 - Agente Comunitário de Saúde 3.945,42 2,5 14,8 19,1
0008 - Incentivo financeiro da APS -
Programa 8.929,20 5,5 33,4 43,2
capitação ponderada
5019 -
0009 - Incentivo financeiro da APS -
Atenção 1.654,83 1,0 6,2 8,0
desempenho
Primária à
000A - Incentivo para ações estratégicas 2.950,30 1,8 11,0 14,3
Saúde
000B - Incentivo financeiro da APS - per
1.125,16 0,7 4,2 5,4
capita de transição
000C - Incentivo financeiro da APS - fator
1.572,88 1,0 5,9 7,6
compensatório de transição
000D - Programa de informatização da
469,87 0,3 1,8 2,3
APS
Total ASPS 2020 160.985,11 100,0
Programa Programa 5021 - Gestão e organização

1.871,15 1,2 100,0
5021 - do SUS
2021 Gestão e Ação 20YD - Educação e formação em

1.244,72 0,8 66,5 100,0
organização saúde
do SUS 0000 - Educação e formação em saúde 121,68 0,1 6,5 9,8

0000 - Educação e formação em saúde -
0,89 0,0 0,0 0,1
despesas diversas
continua
conclusão
0002 - Formação de profissionais técnicos
de saúde e fortalecimento das escolas 5,46 0,0 0,3 0,4
técnicas/centros formadores do SUS
0003 - Apoio ao desenvolvimento da
graduação, pós-graduação stricto e latu 1.039,51 0,6 55,6 83,5
sensu em áreas estratégicas para o SUS
Programa
Ciclo % % %
PPA 2020- Ação / Plano Orçamentário 2020 R$ milhões
CMAP ASPS Programa Ação
2023
0004 - Apoio a educação permanente dos
48,70 0,0 2,6 3,9
trabalhadores do SUS
0005 - Apoio à melhoria da capacidade de
gestão de sistemas e gerência de unidades 0,60 0,0 0,0 0,0
do SUS
0006 - Modernização e qualificação do
11,98 0,0 0,6 1,0
trabalho no SUS
000C - Democratização das relações de
trabalho e regulação das profissões de 4,01 0,0 0,2 0,3
saúde
000D - Apoio às ações de saúde digital 11,89 0,0 0,6 1,0
Fonte: Siga Brasil / Senado Federal.
Dentre os aprendizados no processo de avaliação da área de saúde, destaca-se a

importância de se compreenderem as diferenças entre as ações orçamentárias da
LOA e aquilo que se denomina programa no âmbito do Ministério da Saúde. Isso
demanda um processo de seleção do que será avaliado que vai além dos critérios
utilizados para seleção das ações, o qual passa por uma discussão entre a
supervisão da avaliação no âmbito do CMAP, uma primeira análise por parte dos
executores do que seria possível avaliar naquele ciclo em diálogo com os gestores
e equipe técnica do órgão setorial, e um retorno ao CMAP da proposta das questões
de avaliação com foco mais bem delineado.
Em todas as avaliações realizadas na área de saúde observou-se que os resultados

da avaliação estavam relacionados: (i) ao conhecimento prévio dos executores sobre
a área em que se inseria o programa ou a ação; (ii) às possibilidades de interações
constantes com os gestores do programa e disponibilidade desses para responder
às questões da equipe de avaliação; (iii) à compreensão dos gestores sobre o
processo de avaliação e receios desses quanto ao uso dos resultados da avaliação;
(iv) ao quanto a avaliação depende do acesso a informações, documentos e bases

67
de dados de acesso restrito; (v) às interações entre os diversos executores de
questões em uma mesma avaliação; (vii) à atuação e interação com os supervisores
da avaliação.
Um conhecimento prévio sobre a programação setorial e a LOA é uma questão

relevante, mas que apresenta desafios. Uma das dificuldades apresentada pela
equipe que assessora o CMAP está na ausência de um catálogo de políticas e ações
de governo que possam apresentar a visão setorial para além do PPA (FEU et al.,
2022). Além disso, outras questões envolvem: (i) dificuldades relacionadas ao
desenho dos programas e ações; (ii) o CMAP não ter dotação orçamentária para
contratar avaliações; (iii) as avaliações do CMAP foram pensadas para serem feitas
em um período curto: desde as primeiras oficinas até a entrega dos relatórios para
análise pelo CMAP seriam 12 meses, dos quais 8 a 10 relacionados ao efetivo
período da avaliação.
Quanto ao primeiro ponto, se o programa ou ação em questão tiver um desenho

claro e bem documentado e ter sido objeto de análise ou mesmo de alguma
avaliação em períodos anteriores, a primeira etapa da avaliação é facilitada.
Contudo, a maioria dos programas e ações não têm um modelo lógico elaborado, a
documentação nem sempre é suficiente para sua compreensão e a legislação
envolve várias normas. Isso demanda interação ainda maior com os gestores e as
equipes técnicas antes de se delimitar o objeto da avaliação. Assim, com o avançar
do processo de avaliação do CMAP na área de saúde, parece mais clara a
importância da realização de algumas oficinas para discussão sobre o programa e
seu desenho, inclusive a definição da necessidade de se incluir a avaliação de
desenho no processo de avaliação.
Relativamente ao segundo ponto – a ausência de uma dotação orçamentária

específica – não há previsão legal ou orçamentária para isso no CMAP. Assim, a
realização das avaliações depende da alocação de pessoas e recursos de outros
órgãos e instituições. Idealmente, além do envolvimento dessas instituições,
poderiam ser previstos recursos para trazer especialistas externos ou descentralizar
recursos para outras instituições públicas que estejam participando das avaliações.
Com referência ao terceiro ponto, esse tem sido um tema também importante nas
avaliações do CMAP: acesso a bancos de dados e sistemas de informação para
realização das avaliações. A maioria das avaliações realizadas no âmbito do CMAP
na área de saúde demandou dados que não estavam disponíveis publicamente.
Mesmo na relação direta entre órgãos da administração pública federal e nos casos
de instituições que garantiam o devido tratamento restrito ou sigiloso dos dados,
entre a demanda inicial e o efetivo recebimento das informações, em muitos casos
os dados demoram mais de 6 meses para serem obtidos. Alguns dados chegaram
próximos ao prazo final de entrega dos relatórios para o CMAP e não foram usados,
a exigir adaptações metodológicas e alguma revisão do escopo da avaliação. Nesse
processo, antes mesmo de se obterem os dados, eram importantes as rodadas de
discussão com as equipes técnicas para compreensão dos sistemas, registros e
formatação da demanda. O acesso aos dados em tempo oportuno para a realização
de avaliação, cujo prazo efetivo é de 10 meses, tem sido um ponto crítico para a
realização das avaliações de implementação, resultados e impactos de programas e
ações da área de saúde e também relatado por equipes de outras avaliações
setoriais.
O Ministério da Saúde, como dito anteriormente, é um órgão que contrata muitas

avaliações externas por diversas modalidades. Uma parte importante dessa
experiência está relacionada a editais elaborados por meio da Secretaria de Ciência,
Tecnologia e Insumos Estratégicos (SCTIE). Na próxima seção, será apresentada
breve análise dessa experiência de institucionalização e, posteriormente,
apresentadas as considerações sobre desafios e possibilidades de diálogo com os
processos de institucionalização do CMAP.
4 A institucionalização da avaliação no âmbito do Ministério da Saúde: agendas de

prioridades em pesquisa e editais
4.1 Breve histórico
Em 2004, ocorreu a II Conferência Nacional de Ciência e Tecnologia em Saúde, na

qual foi apresentada a necessidade de aprovação de uma agenda de prioridades de
pesquisa. A primeira Agenda Nacional de Prioridades de Pesquisa em Saúde
(ANPPS) foi elaborada entre 2003 e 2004 e publicada em 2006. A proposta era
induzir a produção de conhecimentos e bens nas áreas prioritárias para o
desenvolvimento das políticas sociais. A última versão, publicada em 2015, era

69
composta por 24 subagendas: saúde dos povos indígenas; saúde mental; violência,
acidentes e traumas; saúde da população negra; doenças não-transmissíveis; saúde
do idoso; saúde da criança e do adolescente; saúde da mulher; saúde dos portadores
de necessidades especiais; alimentação e nutrição; bioética e ética na pesquisa;
pesquisa clínica; complexo produtivo da saúde; avaliação de tecnologias e economia
da saúde; epidemiologia; demografia e saúde; saúde bucal; promoção da saúde;
doenças transmissíveis; comunicação e informação em saúde; gestão do trabalho e
educação em saúde; sistema e políticas de saúde; saúde, ambiente, trabalho e
biossegurança; e assistência farmacêutica. O tema da avaliação de políticas e
programas de saúde em linhas de pesquisa e suas subdivisões aparece em todas
essas (BRASIL, 2015).
Nesse mesmo ano, o Ministério da Saúde (MS) estabeleceu conjuntamente com o

CNPQ e fundações de amparo à pesquisa (FAP) o Programa de Pesquisa para o
SUS: gestão compartilhada em saúde (PPSUS), com o objetivo de estabelecer um
programa descentralizado de fomento à pesquisa em todas as unidades da
federação e atender às necessidades e diferentes realidades de cada uma. O
PPSUS se constituiu em um programa descentralizado de fomento à pesquisa com
recursos próprios e de parceiros. As parcerias são estabelecidas tanto com outros
órgãos do governo federal quanto com os governos estaduais. O coordenador pelo
Ministério da Saúde é o DECIT/SCTIE. A parte dos recursos do MS é transferida
para o CNPq, parceiro administrativo e também fomentador de projetos. Os recursos
são, então, transferidos para as FAP. Essas fundações e as secretarias estaduais
de saúde são os agentes executores e também fomentadores nos estados. Elas
devem lançar editais públicos para seleção de projetos de pesquisa e definir as
prioridades de acordo com o sistema local de saúde, em diálogo com a ANPPS
(BRASIL, 2011).
Conforme ressaltado em documento do Ministério da Saúde, ainda que se observem

avanços em ambos os processos, alguns anos depois do lançamento da ANPPS fez-
se necessário estabelecer quais seriam os objetivos estratégicos desse fomento
(BRASIL, 2011, p. 14). Assim que, em 2011, o MS publicou o documento
denominado Pesquisas Estratégicas para o Sistema de Saúde (PESS), contendo 16
objetivos estratégicos, o qual não substitui a ANPPS, mas busca convergir os temas
das prioridades da Política Nacional de Saúde. No documento da PESS há grande
destaque para as Iniciativas do PPA 2012-2015 relacionadas à saúde e a tentativa
de vincular os objetivos estratégicos e prioridades de pesquisa a essas iniciativas.
Todos esses processos foram coordenados por meio da SCTIE/MS; em sua maior
parte, o fomento se deu por meio de editais. A análise dos quantitativos e alguns
detalhamentos relacionados a esses editais são o objeto da próxima seção.
4.2 Pesquisa Saúde Valor Parceiro Nº de

Ano Valor Total Valor DECIT Valor Parceiro
Não Informado Editais
As principais
2002
informações
2,0
sobre 2,0
as pesquisas
0,0
financiadas0,0pelo MS 88
por 3,0742
meio de
editais2003
2004
11,1
da SCTIE estão
82,0
10,7
disponíveis
70,9
0,4
em planilhas
11,2
anuais no0,0
0,0
130
site Pesquisa
835
2,6798 1
Saúde .
2,5140
Entre 2005
2002 e 2019146,8
2006 158,8
86,1
6.480 pesquisas
77,6
60,7
contaram
81,1
0,0
com recursos
0,0
619 2,3524
principalmente
815 2,2579
do
2007 37,4 23,9 13,5 0,0 168 2,1786
próprio MS e do CNPq
2008 174,8
e em alguns
75,3
casos também
99,5
das secretarias
0,0
estaduais
329 2,0615
de
2009 118,1 72,3 45,8 0,0 773 1,9655
saúde, Capes, Unesco,
2010 52,2 entre outros.
19,7 As pesquisas
15,0 financiadas
17,5 somam
190 R$ 1,50
1,8712
2011 36,5 15,1 14,0 7,4 36 1,7547
bilhão2012
no período2; desse
79,8 montante,
51,2 53,1% de recursos do13,8
14,7 DECIT e o354restante
1,6648dos
2013 157,9 86,1 44,1 27,7 984 1,5675
parceiros.
2014 Contudo, no
64,4Gráfico 1 observa-se
60,0 grande
3,8 flutuação
0,6no volume
200de recursos
1,4742
2015 2,9 1,8 1,0 0,0 41 1,3521
e na classificação
2016 daqueles
98,5 aportados
18,5 por parceiros.
23,6 56,4 299 1,2434
2017 123,0 70,6 27,3 25,1 400 1,2020
2018 72,0 36,2 18,9 16,8 169 1,1595
2019 85,7 20,5 1,3 64,0 68 1,1178
Gráfico 1 – Recursos aplicados
1.503,8 nas pesquisas
798,5 financiadas
475,9 pela SCTIE/MS
229,4 e por parceiros, por
100,0% 53,1% 31,6% 15,3%
ano dos editais, em R$ milhões correntes
200
175
180
159 158
160 147
140 28
123
118
99
120 81
61
44 98 25
100 86
82 46
80
80 27 72
11 14 64
56
60 52 1
4 17
15
64
37 37 19
40 86 17 86
71 78 75 72 71
14 7 60 24
15 51
20 11 14 1
36
2 0 24 3 20
20 15 18
0 11 0
1
0 2 2
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
Valor DECIT Valor Parceiro Valor Parceiro Não Informado Valor Total
Fonte: Ministério da Saúde. Pesquisa Saúde.

Disponível em: https://bit.ly/3Ah5ldF" https://bit.ly/3Ah5ldF.
1
Site http://pesquisasaude.saude.gov.br/ (https://bit.ly/3Ah5ldF).
2
Os valores das planilhas apresentaram algumas inconsistências que foram corrigidas da seguinte forma:
quando o valor total da pesquisa é menor do que a soma do “valor DECIT” com o “valor parceiro”, assumiu-
se que corresponde a essa soma; quando o valor total da pesquisa é maior do que a soma do “valor DECIT”
com o “valor parceiro”, criou-se uma coluna com essa diferença identificada como “valor parceiro não
informado”, a qual corresponde a 15,3% do total.

71
Comunicação e Informação em Saúde 96 1,5%
Saúde dos Povos Indígenas 84 1,3%
Os temas
Saúde das pesquisas
da Pessoa são classificados em 27 subagendas
com Deficiência 62 3 , dentre as quais se
1,0%
Saúde da População Negra e das Comunidades Tradicionais 50 0,8%
destacam as relacionadas às doenças transmissíveis (19,7%) e doenças crônicas
Desenvolvimento de Tecnologias e Inovação em Saúde 24 0,4%
não transmissíveis
Demografia e Saúde (11,8%) que juntas representam quase
13 1/3 do
0,2%total de pesquisas.
Saúde Materno Infantil 5 0,1%
Economia e Gestão em Saúde 2 0,0%
Gráfico 2 – Pesquisas financiadas pela SCTIE/MS por subagenda, 2002 a 2019
6480
Outras
Outras 336
336
Violência,Acidentes
Violência, AcidenteseeTraumas
Traumas 128
128
Saúdedo
Saúde doIdoso
Idoso 129
129
BioéticaeeÉtica
Bioética Éticana
naPesquisa
Pesquisa 156
156
Ambiente,Trabalho
Ambiente, TrabalhoeeSaúde
Saúde 162
162
ComplexoProdutivo
Complexo Produtivoda
daSaúde
Saúde 177
177
Promoçãoda
Promoção daSaúde
Saúde 191
191
SaúdeBucal
Saúde Bucal 202
202
Epidemiologia
Epidemiologia 212
212
Saúde
Saúdeda
daCriança
Criançaeedo
doAdolescente
Adolescente 233
233
Gestão
Gestãodo
doTrabalho
TrabalhoeeEducação
Educaçãoem
emSaúde
Saúde 244
244
Saúde
SaúdeMental
Mental 248
248
Saúde
Saúdeda
daMulher
Mulher 249
249
Assistência
AssistênciaFarmacêutica
Farmacêutica 252
252
Sistemas,
Sistemas,Programas
ProgramaseePolíticas
Políticasem
emSaúde
Saúde 341
341
Alimentação e Nutrição
Alimentação e Nutrição 363
363
Avaliação de Tecnologias e Economia da Saúde
Avaliação de Tecnologias e Economia da Saúde 386386
Pesquisa Clínica 435
Pesquisa Clínica 435
Doenças Crônicas Não Transmissíveis 757
Doenças Crônicas Não Transmissíveis 757
Doenças Transmissíveis 1,279
Doenças Transmissíveis 1,279
0 200 400 600 800 1000 1200 1400
0 200 400 600 800 1000 1200 1400
Fonte: Ministério da Saúde. Pesquisa Saúde. Disponível em: https://bit.ly/3Ah5ldF.
Em uma busca pelos termos “avaliação” e “impacto” nos resumos das pesquisas,
verificou-se que em 38% constam pelo menos um dos termos e que em 5% (320
pesquisas) ambos os termos.
3
Na base de dados consultadas surgem mais três subagendas, além das 24: “Saúde materno-infantil”, a
partir de 2013, e “Desenvolvimento de Tecnologias e Inovação em Saúde” e “Economia e Gestão em
Saúde”, a partir de 2017. Outras seis subagendas também tiveram sua nomenclatura alterada.
Tabela 1 – Pesquisa Saúde 2002 a 2019 – resumos de
pesquisas com os termos “avaliação” e “impacto”
Total de Resumo com os termos "Avaliação" ou "Impacto"
Projetos de Resumo com os termos "Avaliação" ou "Impacto"
SubagendaSubagenda Total de % do "Avaliação" "Avaliação
Pesquisa Total "Avaliação" "Impacto"
Projetos Total e "Impacto" de impacto"
2002dea 2019
"Avaliação" e "Avaliação
Total 6,480 Total
Pesquisa 2,446% do38%"Avaliação"
1,448 672 "Impacto"
320 6
2002 a Total
Doenças Transmissíveis 1,279 368 29% 199 133
"Impacto"de 36
impacto"
2019
Doenças Crônicas Não
Total 6.480 2.446 27738%
757 1.448 173
37% 67277 320 27 6
Transmissíveis
Doenças Transmissíveis 1.279 368 29% 199 133 36 1
Pesquisa Clínica
Doenças Crônicas Não 757435 134
277 37% 31% 72
173 77 51 11
27 1
Transmissíveis
Avaliação de Tecnologias e Economia 435 134 31% 72 51 11
386 203 53% 119 43 41
daPesquisa
Saúde Clínica 386 203 53% 119 43 41
Avaliação edeNutrição
Alimentação Tecnologias e
363363 19719754%54% 111
111 53 53 32
32 1
Economia da
Sistemas, Programas e Políticas em 47% 20 1
Saúde 341341 160160 47% 103
103 36 36 20 1
Saúde
Alimentação e Nutrição 42% 12
252 20
Assistência Farmacêutica 252 10610629% 42% 7474 20 7
12 1
Sistemas, Programas e Políticas em 249 73 40% 51 15 18 1
Saúde da Mulher
Saúde 249 73 29% 51 15 7
248 100 42% 58 24 17
Saúde Mental 244 248 103 10038% 40% 58 1524 18
Assistência Farmacêutica 70 13
Gestão doda
Trabalho 233 30
Saúde Mulher e Educação em 244
88 40%
103 42% 70
45
15 12
17 1
Saúde
Saúde Mental 212 84 38% 42 29
18
Saúde da Criança e do Adolescente 202233 76 88 38% 4539 18 30 13 1
Gestão do Trabalho e Educação em 40% 6
191 76 47 23 3
Saúde
Epidemiologia 212 8423%40% 42 29 12 1
177 40 33 4 10
Saúde Bucal
Saúde da Criança e do Adolescente 202 39%
76 38% 39 18 18 1
162 63 22% 28 25 1
Promoção da
EpidemiologiaSaúde 191 76 40% 47 23 6
156 34 55% 32 1 10
Saúde Bucal
Complexo Produtivo da Saúde 129177 71 40 23% 33 134 3
43% 48 8
Promoção da Saúde
Ambiente, Trabalho e Saúde 128162 55 63 39% 28 21 25 10
4
42% 25
Complexo Produtivo da
Bioética e Ética na Pesquisa Saúde 96156 40 34 22% 32 131 13
37% 23
Ambiente, Trabalho e Saúde 7
Saúde do Idoso 84129 31 71 55% 4821 13 6
10
Bioética e Ética na Pesquisa 44% 3
Violência, Acidentes e Trauma 62128 27 55 43% 2518 21 84 1
Saúde do Idoso 40% 8
Comunicação e Informação em Saúde 50 96 20 40 42% 238 13 4
Violência, Acidentes e Trauma
Saúde dos Povos Indígenas 84 3142%37% 21 6 7 3
Comunicação e Informação em 24 1
10 4
Saúde da dos
Saúde Pessoa comIndígenas
Povos Deficiência 62 2754%44% 18 3 3 6
Saúde 13 7 3
Saúde da da Pessoa com
População NegraDeficiência
e das 40% 1
5 50 2 20 40% 8 1 8 4
Saúde da População
Comunidades Tradicionais Negra e das 50%
2
Comunidades Tradicionais 1 1
Desenvolvimento de Tecnologias e
Desenvolvimento de Tecnologias e 24 10 42% 4 6
Inovação
InovaçãoememSaúde
Saúde
Demografia
Demografia e Saúde
e Saúde 13 7 54% 3 3 1
Saúde Materno
Saúde Infantil
Materno Infantil 5 2 40% 1 1
Economia
Economia e Gestão
e Gestão em em Saúde
Saúde 2 1 50% 1
Fonte: Ministério da Saúde. Pesquisa Saúde. Disponível em: https://bit.ly/3Ah5ldF.
O banco de pesquisas tem duas variáveis para registro de informações sobre os

resultados dessas. Uma é “Recomendações para o SUS”, preenchida por 2,1 mil

73
pesquisas, 32% do total; a outra é o link da pesquisa, preenchida para 48 pesquisas,
0,7% do total.
Do total de pesquisas contendo os termos mencionados anteriormente, 998

continham os termos impacto, avaliação de impacto e avaliação e impacto. Desse
total, observou-se que algumas delas estavam relacionadas a políticas, programas
e ações públicas, incluindo-se: transferência condicionada de renda; ações
educativas direcionadas para profissionais ou para a população; regulação
econômica; impacto econômico de doenças e agravos; impacto financeiro. Dessas
pesquisas, 719 apresentaram descrição da metodologia, nas quais não se localizou
termos como diferenças em diferenças, efeitos fixos, regressão com descontinuidade
ou análise de dados em painel. Os termos método experimental, quase-experimental
e painel apareceram quando se tratava de estudos clínicos ou de análise de impacto
de uma intervenção clínica. Observaram-se, também, poucas menções a uso de
dados provenientes de registros administrativos de órgãos gestores da saúde
(secretarias ou ministérios) e muitos estudos de casos de intervenções em unidades
de saúde ou municípios específicos.
5 Discussão e considerações finais
O processo de institucionalização da avaliação de políticas públicas no centro de governo

do Executivo federal vem sendo estruturado desde o começo dos anos 2000 como resposta
às demandas de avaliação do Plano Plurianual. Em linhas gerais, a elaboração de um
sistema de monitoramento e avaliação do Plano passou pela definição de comitês,
comissões e grupos de trabalho que contaram com membros representantes da área de
planejamento e orçamento do governo federal (Ministério do Planejamento, Ministério da
Fazenda e atualmente Ministério da Economia), instituições vinculadas à Casa Civil e à
Controladoria Geral da União. A definição de metodologias, capacitação para realização
das avaliações e construção de indicadores contou com o apoio do IPEA, IBGE, Enap e
Esaf, a última posteriormente incorporada à Enap.
Feu et al. (2022), ao analisarem esse processo de institucionalização do CMAP, destacam

a sua importância para o ciclo orçamentário. A maior parte das questões de avaliação foram
relacionadas ao desenho dos programas (27). Em seguida aparecem questões sobre
resultados (24), implementação (19), impacto (15) e governança (13) e 46 programas
haviam sido avaliados até o Ciclo 2021 (FEU et al., 2022). Essa importância das avaliações
de desenho mostra a centralidade de se conhecer melhor o objeto da avaliação,
aprofundando-se na elaboração desse tipo de avaliação e nas interações com os gestores
dos programas.
Outro ponto que chama atenção nessa análise dos autores é a centralidade do processo
orçamentário para o CMAP. Ao fazerem considerações sobre esse processo recomendam
mudanças ainda maiores nessa direção:
A primeira é que o processo orçamentário precisa ter ênfase na priorização

dos gastos. A segunda é que o orçamento tem que ser baseado numa
classificação de programas que identifique resultados e produtos relativos
aos gastos realizados e não ser simplesmente baseado em insumos e
unidades orçamentárias. A terceira grande mudança é ter Spending
Reviews (SR) realizadas pelas equipes internas do governo de forma
contínua dentro do processo orçamentário. Isso seria uma porta de entrada
do resultado das avaliações e de indicadores de desempenho como insumo
para se tomar decisões (FEU et al., 2022, p. 29).
Essa questão tem sido um dos pontos centrais da discussão sobre os rumos que deve
tomar a avaliação no Centro de Governo. Uma PEC com o intuito de acabar com o PPA
chegou a ser elaborada, mas não foi aprovada. Contudo, isso mostra que essa é uma
discussão ainda em andamento e que pauta o debate sobre os rumos da avaliação no
âmbito do Executivo federal.
Com relação a questões mais diretamente ligadas à realização das avaliações, dois pontos
merecem destaque: (i) a clareza de que a seleção do objeto da avaliação (programa, ação,
plano orçamentário) demanda interações com os gestores e equipes técnicas nos órgãos
setoriais que atuam no que está sendo avaliado; (ii) após realizar essa seleção, para
aqueles programas ou ações que não tenham modelo lógico elaborado, essa pode ser uma
etapa importante do processo de avaliação: a realização de uma avaliação de desenho; (iii)
as avaliações deveriam ser um processo contínuo, ou seja, se existem questões relevantes
que não puderem ser respondidas em um ciclo do CMAP, mas que seriam importantes para
melhor compreensão dos resultados, o ciclo seguinte deveria incorporar a continuidade da
avaliação. Esse último caso é particularmente relevante quando há acesso a dados
restritos. A experiência do CMAP tem mostrado que entre a demanda, o acesso aos

75
registros administrativos e sua efetiva organização como um banco de dados, o tempo da
avaliação tem sido, muitas vezes, insuficiente.
Um dos pontos positivos do CMAP é a transparência, ao disponibilizar atas, resoluções e

outros documentos e incluir relatórios de avaliação, de recomendações e da manifestação
dos gestores. No caso da área de saúde, no que se refere aos programas de gasto direto,
as recomendações feitas não têm envolvido corte de gastos, mas visam contribuir para
aprimoramentos dos programas avaliados. Contudo, não há relatórios que mostrem se o
acompanhamento das recomendações tem feito parte das discussões de decisores no
centro de governo, daquelas atuando diretamente na gestão do programa no órgão setorial
e do Congresso Nacional. Em suma, ainda há pouca informação sobre o seu uso.
Esse processo de institucionalização de avaliações e definição de prioridades de pesquisa

também faz parte das discussões no âmbito do Ministério da Saúde. Nesse órgão foram
definidas prioridades de pesquisa nas quais a avaliação tem figurado com uma linha citada
e realizada ao longo dos anos 2000. Um banco de dados elaborado a partir de informações
disponibilizadas pela SCTIE/MS mostra que os termos “avaliação” ou “impacto” aparecem
em mais de um terço das pesquisas que contaram com financiamento do Ministério da
Saúde ou parceiros. Contudo, ainda se faz necessário aprofundar nas análises das
metodologias empregadas, dos resultados dessas avaliações, bem como seu uso para
aprimoramento da ação pública. Com relação à transparência, ainda que várias
informações sejam disponibilizadas nesse banco de dados, os links para os resultados e
produtos das avaliações não estão disponíveis na maioria das vezes. A transparência
desses resultados poderia apoiar as decisões do que e o que poderia ser adicionalmente
avaliado durante os ciclos de avaliação do PPA.
Outro ponto relevante tanto para o CMAP quanto para as avaliações financiadas com
recursos do Ministério da Saúde é a elaboração de catálogos de planos, políticas,
programas e ações, incluindo-se as informações sobre o seu arcabouço legal, seu desenho,
relatórios de monitoramento, avaliações realizadas e seus resultados, bem como
disponibilizados os produtos entregues. O IPEA tem trabalhado em uma proposta de
catálogo a partir do SIOP, do PPA e das bases legais de ações, planos e programas para
apoiar, entre outros, os trabalhos realizados no âmbito do CMAP (BRITO; MELLO;
ALENCAR, 2022). Um grande desafio é estabelecer o diálogo entre a estrutura
orçamentária e do PPA e aquilo que os órgãos setoriais da saúde, particularmente o
Ministério da Saúde, denominam de programa, ação, iniciativa ou intervenção. De qualquer
forma, a elaboração de catálogos permitirá ampliar essas discussões e o diálogo entre as
avaliações no âmbito do CMAP e aquelas financiadas pelo Ministério da Saúde.

77
Referências
ALMEIDA, A. T. C.; VIEIRA, F. S.; SÁ, E. D de. Os Efeitos do acesso a medicamentos por
meio do Programa Farmácia Popular sobre a saúde de portadores de doenças crônicas
não transmissíveis. In: SACCARO, N.; ROCHA, W.; MATION, L. CMAP 2016 a 2018:
estudos e propostas do Comitê de Monitoramento e Avaliação de Políticas Públicas
Federais. Rio de Janeiro: IPEA, 2018. Disponível em: https://bit.ly/3zXLYWH. Acesso em:
5 jan. 2022.
BARCELOS, C. L. K. Governança orçamentária e mudança institucional: o caso da

norma geral de direito financeiro – Lei n. 4.320/64. 2012. Tese (Doutorado) - Faculdade
de Economia, Administração e Contabilidade, Universidade de Brasília, Brasília, 2012.
BRASIL. Lei nº 10933, de 11 de agosto de 2004. Dispõe sobre o Plano Plurianual para o
período 2004/2007. Brasília, DF: Câmara dos Deputados, 2004a. Disponível em:
https://bit.ly/3f7qOPs. Acesso em: 5 set. 2022
BRASIL. Decreto nº 5233 de 06 de outubro de 2004. Estabelece normas para a gestão

do Plano Plurianual 2004-2007 e de seus Programas e dá outras providências. Brasília,
DF: Câmara dos Deputados, 2004b. Disponível em: https://bit.ly/3W3iv7Y. Acesso em: 5
set. 2022.
BRASIL. Ministério da Saúde. Programa de Pesquisa para o SUS: gestão compartilhada

em saúde: diretrizes técnicas. 4. ed. Brasília, DF: Ministério da Saúde, 2011 (Série A
Normas e Manuais Técnicos). Disponível em: https://bit.ly/3C9VPLU. Acesso em: 5 set.
2020.
BRASIL. Ministério da Saúde. Secretaria de Ciência, Tecnologia e Insumos Estratégicos.

Departamento de Ciência e Tecnologia. Agenda nacional de prioridades de pesquisa
em saúde. 2. ed. 4. reimpr. Brasília, DF: Ministério da Saúde, 2015.
BRASIL. Portaria Interministerial nº 102, de 7 de abril de 2016. Institui o Comitê de

Monitoramento e Avaliação de Políticas Públicas Federais CMAP. Brasília, DF: Ministério
do Planejamento, Orçamento e Gestão, 2016. Disponível em: https://bit.ly/3OThw5z.
Acesso em: 2 jan. 2022.
BRASIL. Presidência da República. Casa Civil. Avaliação de políticas públicas: guia

prático de análise ex ante. Brasília, DF: Casa Civil, 2018a. v.1. Disponível em:
https://bit.ly/3TysHDP. Acesso em: 5 set. 2022.
BRASIL. Presidência da República. Casa Civil. Avaliação de Políticas Públicas: guia

prático de análise ex post. Brasília, DF: Casa Civil, 2018b. v. 2. Disponível em:
https://bit.ly/3W6uNwd.
Acesso em: 5 set. 2022.
BRASIL. Ministério da Economia. Conselho Nacional de Monitoramento e Avaliação de

Políticas Públicas. Políticas públicas selecionadas para avaliação: ciclo 2019, ciclo
2020. Brasília, DF: Ministério da Economia, 2019. Disponível em: https://bit.ly/3PXsB73"
https://bit.ly/3PXsB73. Acesso em: 28 jul. 2022.
BRASIL. Ministério da Economia. Proposta de critérios para a seleção dos programas

do PPA 2020-2023 que serão objeto de avaliação pelo CMAP. Brasília, DF: Ministério
da Economia, 2020a. (Nota Técnica SEI nº 1702/2020/ME). Disponível em:
https://bit.ly/3vzjP6Q. Acesso em: 15 dez. 2021.
BRASIL. Ministério da Economia. Resolução Conjunta CMAS/CMAG nº 01 - Atores, de

23 de outubro de 2020. Estabelece as funções e as responsabilidades dos atores
envolvidos no processo de avaliação ex post no âmbito do Conselho de Monitoramento e
Avaliação de Políticas Públicas – CMAP. Brasília, DF: CMAP, 2020b. Disponível em:
https://bit.ly/3R0BfSl. Acesso em: 28 jul. 2022.
BRASIL. Ministério da Economia. Conselho de Monitoramento e Avaliação de Políticas

Públicas (CMAP). Brasília, DF: Ministério da Economia, 2022. Disponível em:
https://bit.ly/3dtovFd. Acesso em: 28 jul. 2022.
BRITO, A.; MELO, J.; ALENCAR, J. Catálogo de políticas públicas: primeiros resultados
e hipóteses de pesquisa. Brasília, DF: IPEA, 2022. (Texto para Discussão, preliminar).
Disponível em: https://bit.ly/3MOhSuF. Acesso em: 29 set. 2022.
CASSIOLATO, M.; GUERESI, S. Como elaborar Modelo Lógico: roteiro para formular
programas e organizar avaliação. Brasília, DF: IPEA, 2010. (Nota Técnica n. 6, Disoc).
CAVALCANTE, P. O plano plurianual: resultados da mais recente reforma do

planejamento e orçamento no Brasil. Revista do Serviço Público - RSP, v. 58, n. 2, p.
129-150, 2007.
CAVALCANTE, P. Núcleo, Centro de Governo, Centro Presidencial, Alto Governo:

várias nomenclaturas e uma questão principal. Brasília, DF: IPEA, 2018. (Texto para
discussão n. 2359).
COUTO, L. F.; CARDOSO JUNIOR, J. C. A função dos planos plurianuais no

direcionamento dos orçamentos anuais: avaliação da trajetória dos PPAs no
cumprimento da sua missão constitucional e o lugar do PPA 2020-2023. Brasília, DF:
IPEA, 2020. (Texto para Discussão n. 2549).
ESCOLA NACIONAL DE ADMINISTRAÇÃO PÚBLICA. Sistema Integrado de

Orçamento e Planejamento (SIOP). Brasília, DF: ENAP, 2021. (Instrumentos de
Planejamento: PPA, LDO e LOA, Módulo 4). Disponível em: https://bit.ly/3bZjILp. Acesso
em: 5 set. 2022.
FERREIRA, H.; CASSIOLATO, M.; GONZALEZ, R. Uma experiência de

desenvolvimento metodológico para avaliação de programas: o modelo lógico do
programa segundo tempo. Brasília, DF: IPEA, 2009. (Texto para Discussão n. 1369).
FEU, A. et al. A relação entre avaliação e orçamento e o papel do Conselho de

Monitoramento e Avaliação de Políticas Públicas: publicação preliminar. In: COUTO, L.
F.; RODRIGUES, J. M. (org.). Governança orçamentária no Brasil. Brasília, DF: IPEA,
2022. Disponível em: https://bit.ly/3w5uqXB. Acesso em: 5 set. 2022.
GARCIA, R. C. Reorganização do processo de planejamento do governo federal: o

PPA 2000-2003. Brasília, DF: IPEA, 2000. (Texto para Discussão, n. 726).
MAIA, L. V. A.; SILVA, M. S. S.; SALVIANO, V. M. O monitoramento das prioridades de

governo no Ministério do Planejamento. Revista Brasileira de Monitoramento e
Avaliação, n. 5, p. 29-47, jan./jun. 2013.

79
MARTINS NETO, R.; CARDOSO JUNIOR, J. C. Nem causalidade, nem casualidade:
uma análise qualitativa dos planos plurianuais 2004-2007 e 2012- 2015 sob o prisma do
triângulo de governo de Carlos Matus. Revista Brasileira de Planejamento e
Orçamento, v. 8, n. 1, p. 57-80, 2018.
MIRANDA, P. C. de et al. O CMAP e a institucionalização da avaliação de políticas

públicas no Governo Federal. Cadernos ASLEGIS, n. 61, p. 35-56, 2021.
Disponível em: https://www.aslegis.org.br/files/cadernos/caderno61/aslegis-61-35-56.pdf.
Acesso em: 16 nov. 2022.
NAVARRO, C. A. A. L.; SANTOS, E. A. V.; FRANKE, F. D. A estrutura do PPA 20122015.

Revista Brasileira de Planejamento e Orçamento, v. 2, n. 1, p. 24-47, 2012.
SACCARO, N.; ROCHA, W.; MATION, L. CMAP 2016 a 2018: estudos e propostas do
Comitê de Monitoramento e Avaliação de Políticas Públicas Federais. Rio de Janeiro:
IPEA, 2018. Disponível em: https://bit.ly/3zpCJyc. Acesso em: 5 jan. 2022.
SERPA, S. M. H. C. Levantamento do Tribunal de Contas da União sobre os sistemas de

monitoramento e avaliação da administração direta do Poder Executivo. Revista
Brasileira de Monitoramento e Avaliação, n. 2, jul./dez. 2011.
VAISTMAN, J.; PAES-SOUZA, R. Avaliação de programas e profissionalização da gestão

pública. Revista Brasileira de Monitoramento e Avaliação, v. 1, p.18-35, 2011.
Capítulo 3
Indicadores e medidas em saúde:

conceitos e aplicações para as
informações disponíveis no Brasil
Mônica Viegas Andrade1

Kenya Noronha1
Aline Souza1
Júlia Almeida Calazans1
1
Centro de Desenvolvimento e Planejamento Regional – CEDEPLAR/UFMG
RESUMO:
Este capítulo apresenta os principais indicadores para mensurar o estado de saúde individual ou
agregado. São discutidos o método de cálculo, fontes de dados, vantagens e limitações. O uso de
indicadores sociais é uma ferramenta importante para planejamento, formulação e acompanhamento
de políticas públicas. No Brasil, a avaliação de programas e políticas tem crescido, sobretudo devido
à ampla disponibilidade de bases de dados oficiais. Este capítulo contribui para esse debate à medida
que oferece um portfólio de métricas que podem ser facilmente incorporadas à definição de metas
e políticas.
PALAVRAS-CHAVE:
Indicadores de saúde. Medidas individuais. Mortalidade. Morbidade.

81
1 Introdução
Umas das principais dificuldades em estudos que envolvem saúde é sua definição e
mensuração. Uma contribuição fundamental ocorreu em 1946 com a proposição da
Organização Mundial de Saúde (OMS), para a qual saúde é “um estado completo de bem-
estar físico, mental e social e não apenas a ausência de doença ou enfermidade” (WHO,
1946). Essa abordagem avança em relação à visão predominante na época que se
abordava a saúde como ausência de doença. Por ser holístico, o conceito proposto pela
OMS é capaz de considerar a multidimensionalidade presente no conceito de bem-estar
individual e social (PAHO, 2018). Embora bem aceita por diferentes stakeholders, essa
abordagem traz pelo menos duas dificuldades fundamentais. A primeira é tornar a
formulação de políticas de saúde um desafio quase intangível, à medida que as políticas
dificilmente terão a abrangência proposta. A segunda é a multidimensionalidade implícita
dificultar a sua mensuração, em virtude de isoladamente nenhuma medida ser capaz de
abarcar as múltiplas dimensões envolvidas no conceito de bem-estar (SEGRE; FERRAZ,
1997; BATISTELLA, 2007).
Existem diversos indicadores para mensurar a saúde, os quais permitem avaliar distintas
dimensões, desde as mais específicas, a exemplo de taxas de mortalidade por determinada
causa, até dimensões mais amplas que avaliam condições gerais de saúde (PAHO, 2018).
Os indicadores também se distinguem segundo o nível de análise, a depender da forma
como as informações de saúde são disponibilizadas, se no nível mais agregado – com
abrangência regional – ou desagregadas – até o nível do indivíduo. A escolha dependerá
dos objetivos dessa mensuração e da disponibilidade das informações. As medidas
agregadas se referem ao estado de saúde médio da população e permitem traçar o perfil
epidemiológico e o monitoramento das doenças na sociedade, além de contribuir para a
formulação de políticas públicas de saúde. As medidas individuais, por sua vez, por
propiciarem uma análise mais desagregada, fornecem um retrato da condição de saúde
individual. Além disso, a análise de sua distribuição permite avaliar a condição de saúde
entre diferentes grupos sociodemográficos e vai além de uma medida sintética média.
Esses indicadores podem contemplar dimensões diferentes da condição de saúde dos
indivíduos ou fatores de risco incluindo-se hábitos ou estilo de vida. Além dos indicadores
que medem o estado de saúde, é comum também avaliar a utilização e gastos com serviços
de saúde, determinantes importantes do estado de saúde da população (WHO, 2007;
TRAVASSOS; CASTRO, 2012).
Este capítulo tem como objetivo apresentar os principais indicadores de saúde e as bases
de dados disponíveis no Brasil. Além desta introdução, este capítulo está dividido em mais
7 seções. A próxima seção faz breve discussão das principais propriedades e atributos que
os indicadores devem apresentar. Na seção 3 apresentam-se as bases de dados e fontes
de informações disponíveis de saúde para o Brasil e abordam-se as principais pesquisas
considerando-se sua disponibilidade em um período mais recente e sua possibilidade de
comparação com outras pesquisas internacionais. As seções 4 e 5 discutem as medidas
individuais e agregadas, respectivamente, e apresentam-se as dimensões de saúde que
esses indicadores abordam, suas vantagens e limitações. A seção 6 trata dos indicadores
referentes à utilização e gastos com saúde; a seção 7 apresenta uma discussão acerca da
ênfase mais recente sobre análises de desempenho do sistema de saúde que envolvem os
aspectos de equidade e eficiência. Por fim, na seção 8, as considerações finais.
2 Principais propriedades e atributos dos indicadores1
Os indicadores de saúde têm sido cada vez mais um instrumento fundamental de políticas.
A escolha dos indicadores, entretanto, precisa obedecer a determinados critérios. Jannuzzi
(2017) discute de forma abrangente os atributos básicos e as propriedades desejáveis dos
indicadores sociais. De acordo com o autor, os atributos básicos permitem melhor definição
dos indicadores, tais como referência conceitual, unidade de medida (por exemplo por
habitantes, em termos percentuais, por casos e anos de vida), unidade de análise (por
exemplo individual, familiar, agregado por municípios, estados, países), referência de
tempo ou período, abrangência territorial, fonte de dados e instituição responsável, uso,
significado e limitação. A referência conceitual diz respeito ao arcabouço teórico que
justifica a dimensão da saúde que está sendo analisada. Esse referencial não
necessariamente contempla uma estrutura de causalidade, mas remete a uma associação
entre o evento/condição de saúde e o indicador. Além do referencial teórico, a definição do
indicador está condicionada à sua capacidade e limitação na interpretação do fenômeno de
saúde mensurado.
A escolha dos indicadores, por sua vez, deve ser pautada pelas propriedades desejáveis
que esses devem atender. Jannuzzi (2017) elenca as seguintes propriedades: validade,
confiabilidade (qualidade do levantamento da informação), grau de cobertura, sensibilidade,
especificidade, reprodutibilidade, comunicabilidade, periodicidade de atualização, nível de
1
Essa seção está baseada em Jannuzzi (2017).

83
desagregação e comparabilidade no tempo. Dentre essas propriedades, três
necessariamente precisam ser consideradas para que o indicador seja capaz de refletir o
evento/condição de saúde analisada: validade, sensibilidade e especificidade. A
sensibilidade é a capacidade do indicador de refletir mudanças significativas se as
condições gerais se alteram. A especificidade é a capacidade de alteração do indicador
diante de mudanças nas condições estritas da dimensão social de interesse. A validade
pode ser interna ou externa. A validade interna é observada quando o indicador tem forte
associação com a população específica para o qual foi construído, enquanto a validade
externa diz respeito à possibilidade de generalização dessa relação para outras
populações. Se atendidas, essas propriedades garantem que o indicador tenha aderência
ao evento mensurado e capacidade de captar variações na dimensão analisada.
3 Principais bases de dados no Brasil
As fontes de informações sobre saúde no Brasil provêm de pesquisas domiciliares e de

registros administrativos. O Apêndice A apresenta uma síntese dessas fontes de dados e
de suas principais características.
3.1 Pesquisas domiciliares
As principais pesquisas domiciliares desenvolvidas com o objetivo de analisar a

saúde são: suplementos de saúde da Pesquisa Nacional por Amostra de Domicílios
(PNAD), Pesquisa Nacional de Saúde (PNS), pesquisa sobre Vigilância de Fatores
de Risco e Proteção para Doenças Crônicas por Inquérito Telefônico (VIGITEL). Vale
ainda mencionar a Pesquisa de Orçamento Familiar (POF), que apesar de não ser
específica de saúde, permite analisar de forma detalhada os gastos com bens e
serviços de saúde realizados pelas famílias. Além disso, como são coletadas
informações detalhadas sobre os gastos, consumos e orçamento, a POF possibilita
ainda avaliar em que medida os gastos com saúde têm implicações sobre o nível de
bem-estar das famílias (O’DONNELL et al., 2007; SANTOS, 2015).
Até o final dos anos 2000, a PNAD era a principal pesquisa domiciliar no Brasil que
contemplava informações de saúde e era realizada por processo de amostragem,
com ampla cobertura nacional e periodicidade anual. A pesquisa coletava
informações detalhadas sobre os atributos individuais, tais como mercado de
trabalho, rendimentos e migração. A cada ano, a PNAD apresentava um suplemento
contendo informações sobre temas específicos; em 1981, 1986, 1988, 1998, 2003 e
2008 a saúde foi o tema abordado. Em 1981, 1986 e 1988 as perguntas presentes
nos suplementos referiam-se a características mais específicas da saúde, tais como
gravidez e parto, e à utilização dos serviços de saúde, sem conter informações mais
amplas que permitissem mensurar o estado de saúde dos indivíduos (ANDRADE,
2002; TRAVASSOS et al., 2008). Em 1998, 2003 e 2008 ampliou-se o questionário
do suplemento saúde e se forneceu um conjunto bastante detalhado do estado de
saúde dos indivíduos e informações sobre utilização e acesso aos serviços de saúde.
A PNAD representou um avanço importante para análises e estudos sobre a saúde

no Brasil. Devido a sua abrangência nacional, com possibilidades de comparações
entre as regiões brasileiras, foi possível conhecer melhor o perfil de saúde da
população e as diferenças regionais e socioeconômicas. Até então, as informações
sobre saúde no nível individual eram mais limitadas e, muitas vezes, desatualizadas.
Os suplementos saúde da PNAD possibilitaram o desenvolvimento de estudos
comparativos entre os anos 1998 e 2008 e abrangeram o período de consolidação
do SUS. Os resultados desses estudos mostram evoluções importantes no acesso
e utilização dos serviços de saúde, sobretudo entre os grupos socioeconômicos
menos privilegiados (PORTO et al., 2011; ANDRADE et al., 2013).
Em 2011, a PNAD foi substituída pela PNAD contínua; essa, além de alterar o seu
desenho amostral e periodicidade de coleta, não prevê a inclusão dos suplementos
relacionados com as informações sobre saúde, as quais passaram a ser coletadas
por meio da Pesquisa Nacional sobre Saúde (PNS), realizada pelo Ministério da
Saúde em parceria com o IBGE, sob a coordenação da Fiocruz. Além de guardar
certa comparabilidade com os suplementos de saúde da PNAD, a PNS ampliou o
conjunto de informações investigadas e incorporou medidas antropométricas,
mensuração da pressão arterial e coleta de amostras de sangue e de urina para
exames clínicos. Além disso, há um módulo referente à saúde do idoso e saúde da
mulher e gestante. A primeira PNS foi conduzida em 2013; a periodicidade prevista
de coleta das informações era quinquenal, no entanto, devido a problemas técnicos,
a segunda pesquisa foi realizada somente em 2019.
A VIGITEL compreende uma pesquisa realizada anualmente desde 2006 pela

Secretaria de Vigilância em Saúde do Ministério da Saúde. As entrevistas são

85
realizadas por inquérito telefônico em uma amostra de indivíduos adultos, com18
anos e mais, residentes nas capitais brasileiras. Seu objetivo é monitorar os fatores
de risco para doenças crônicas não transmissíveis, tais como diabetes mellitus,
câncer e doenças cardiovasculares, incluída a hipertensão arterial sistêmica. São
investigadas informações sobre a saúde dos indivíduos, condições e hábitos de vida
e aspectos sociodemográficos. As informações sobre estilo e hábitos de vida
compreendem consumo de tabaco e álcool, hábitos alimentares, prática de
exercícios físicos e excesso de peso e obesidade (BRASIL, 2021a).
Existem ainda outras pesquisas específicas no país para determinados grupos

populacionais que merecem destaque pela sua importância e nível de detalhamento
em relação às informações sobre saúde investigadas: Estudo Longitudinal de Saúde
dos Idosos Brasileiros (ELSI-Brasil), estudo sobre Saúde, Bem-estar e
Envelhecimento (SABE), Estudo Longitudinal da Saúde do Adulto (ELSA-Brasil),
Pesquisa Nacional de Demografia e Saúde da Criança e da Mulher (PNDS) e
Pesquisa Nacional de Saúde do Escolar (PeNSE). Algumas dessas pesquisas
possuem caráter longitudinal como o ELSI-Brasil, SABE e ELSA-Brasil. Tanto o
ELSI-Brasil como a SABE têm como objetivo analisar a saúde dos idosos e permitem
comparações internacionais. Dentre esses estudos, o ELSI-Brasil possui a maior
abrangência. A pesquisa é coordenada pela Fiocruz, em parceria com a
Universidade Federal de Minas Gerais (UFMG), possui amostra representativa para
a população com 50 anos e mais e cobre todas as regiões brasileiras. A primeira
pesquisa domiciliar foi conduzida em 2015-16, a qual constitui a linha de base, na
qual foram entrevistados 9.412 indivíduos residentes em 70 municípios. O estudo
compõe uma rede internacional de estudos, o Health and Retirement family of
studies (HRS), que apesar de realizados de forma independente, utilizam uma
metodologia comum de forma a permitir comparações internacionais. O estudo está
disponível para os Estados Unidos (HRS), países da comunidade europeia (SHARE
- Survey of Health, Ageing and Retirement in Europe), Inglaterra (ELSI - English
Longitudinal Study of Ageing), México (MHAS - Mexican Health and Aging Study)
entre outros (LEBRÃO; DUARTE, 2003; ELSI-BRASIL, 2015; LEBRÃO et al., 2019;
ELSA, [2000]).
A PNDS contempla informações sobre saúde sexual e reprodutiva e investiga

mulheres em idade fértil (entre 15 e 49 anos) e crianças menores de cinco anos. A
pesquisa faz parte de um projeto mais amplo, MEASURE Demographic and Health
Survey (DHS), que envolve diferentes países e permite comparações internacionais.
Entretanto, no Brasil, a pesquisa foi conduzida em três pontos no tempo, a última
realizada há mais de 10 anos, em 2006 (BRASIL, 2009a; DHS, [2018]).
A PeNSE fornece dados sobre hábitos alimentares, prática de atividade física, saúde
sexual e reprodutiva e uso de tabaco, álcool e outras drogas por estudantes do 9º
ano do ensino fundamental de escolas públicas e privadas. A pesquisa foi iniciada
em 2009 e é realizada pelo IBGE e Ministério da Saúde com apoio do Ministério da
Educação. A partir de 2015 foi incluída uma amostra de escolares de 13 a 17 anos
de idade com a finalidade de permitir comparações internacionais, especificamente
com a pesquisa Global School-based Student Health Survey (GSHS), desenvolvida
pela OMS e realizada em diversos países da América, África, Europa, Ásia e Oceania
(IBGE, 2021a).
3.2 Registros administrativos
Os registros administrativos são informações oficiais, cujo principal objetivo é auxiliar

na implementação e avaliação dos programas governamentais desenvolvidos em
diferentes esferas da administração pública. Na área da saúde, esses registros são
coletados pelas secretarias estaduais de saúde e disponibilizados pelo sistema de
informações DATASUS, produzido pelo Ministério da Saúde. Esse sistema utiliza
informações dos registros de óbitos, estatísticas de produção do Sistema Único de
Saúde (SUS), registros de vacinação e busca abranger todo o universo dos eventos
ocorridos. Exemplos de bases de dados dessa natureza são o Sistema de
Informações sobre Mortalidade (SIM), Sistema de Informações sobre Nascidos Vivos
(Sinasc), Sistema de Informação de Agravos de Notificação (Sinan), Sistema de
Informações Hospitalares/ Autorizações de Internações Hospitalares (SIH/AIH) e
Sistema de Informações Ambulatoriais/ Autorização de Procedimento de Alta
Complexidade (SIA/APAC). Por ter como objetivo principal quantificar o evento,
fornece poucas informações socioeconômicas e demográficas sobre os indivíduos.
Além disso, as informações existentes apresentam deficiências relativas ao
preenchimento das declarações. O SIM foi instituído pelo Ministério da Saúde em
1975, com a unificação dos diferentes modelos de atestado de óbito que existiam no
país, com a finalidade de produzir informações abrangentes de mortalidade para o
planejamento de políticas de saúde e de seguridade social. O documento que
alimenta o sistema é a Declaração de Óbito (DO), que tem como base a classificação
internacional das causas de morte padronizada pela OMS. O preenchimento da DO

87
é de responsabilidade do médico atestante; em caso de óbito ocorrido em localidade
sem médico o preenchimento é feito pelo oficial de registro do cartório civil. Além dos
dados referentes ao óbito, os registros do SIM contam com informações
socioeconômicas e demográficas do falecido (BRASIL, 2011a).
Similar ao SIM, o Sinasc foi implantado pelo Ministério da Saúde em 1990, com o
objetivo de obter dados de natalidade e diminuir a subnotificação de nascimentos. A
coleta de dados é feita por meio da Declaração de Nascido Vivo (DN), cujo
preenchimento é feito pelos profissionais de saúde ou parteiras tradicionais
vinculadas às unidades de saúde. Caso o parto ocorra sem assistência, a emissão
da DN é realizada pelo oficial de registro do cartório civil. O sistema contém
informações do nascimento, pré-natal e características demográficas e
socioeconômicas dos pais (BRASIL, 2011b). A principal limitação ao uso das
informações do SIM e do Sinasc é a qualidade do registro no que tange a sua
cobertura e completude. Define-se como cobertura o percentual de população
coberta por esses sistemas e como completude o percentual de informação
preenchida no sistema. Ainda que a qualidade dos registros tenha aumentado
consideravelmente ao longo das últimas décadas, a utilização dessas informações
deve ser feita cautelosamente, utilizando-se técnicas demográficas para a correção
de tais problemas (HAKIM, 1983; FRIAS et al., 2010; QUEIROZ et al., 2017).
Entre 1990 e 1993, o Ministério da Saúde implementou o Sinan com a finalidade de

consolidar informações de morbidade da população. Inicialmente, a instituição do
sistema não foi realizada de forma unificada entre estados e municípios. Para
resolver esse problema, em 1998 desenvolveu-se um novo software e sua
alimentação se tornou compulsória. Os dados são gerados a partir da notificação de
certas doenças e agravos definidos na lista nacional de doenças de notificação
compulsória quando há suspeita e/ou confirmação de casos. São coletadas
informações de data e local de ocorrência do agravo e notificação e dados
sociodemográficos do paciente (BRASIL, 2007a). O SIH e SIA são sistemas
complementares que visam monitorar os atendimentos financiados pelo SUS
referentes a internações hospitalares e procedimentos ambulatoriais
respectivamente. O SIH foi criado na década de 1980 pelo Ministério da Saúde e
implementado pelo Instituto Nacional de Assistência Médica e Previdência Social
(INAMPS). Os dados são coletados por meio da Autorização de Internação
Hospitalar (AIH), que contém detalhes da hospitalização e dos procedimentos
realizados, custo da internação e informações socioeconômicas e demográficas do
paciente (BRASIL, 2007b). O SIA foi amplamente estabelecido no país a partir de
1995. Os principais documentos de alimentação do sistema são a Autorização de
Procedimento de Alta Complexidade (APAC) e o Boletim de Produção Ambulatorial
(BPA). São disponibilizados dados dos procedimentos, custos e informações
demográficas dos pacientes (BRASIL, 2010).
Outros registros administrativos relevantes para o planejamento do setor de saúde

no país são: Sistema de Informações sobre Orçamentos Públicos em Saúde
(SIOPS), Cadastro Nacional de Estabelecimentos de Saúde (CNES) e dados da
Agência Nacional de Saúde Suplementar (ANS), como a Troca de Informações na
Saúde Suplementar (TISS). O SIOPS foi criado em 2000 pelo Ministério da Saúde,
para disponibilizar informações sobre receitas e despesas com ações e serviços
públicos de saúde. O sistema permite o acompanhamento e fiscalização dos
recursos aplicados e torna o gasto público mais transparente. Desde 2013, o registro
é obrigatório para municípios, estados e união e deve ser realizado bimestralmente
(BRASIL, 2021b).
O Cadastro Nacional de Estabelecimentos de Saúde (CNES) foi criado em 2000 pela

Secretaria de Atenção à Saúde do Ministério da Saúde e implementado
nacionalmente em 2003 (BRASIL, 2009b). Trata-se de cadastro oficial de
preenchimento obrigatório por todos os estabelecimentos de saúde públicos e
privados. A principal finalidade do CNES é cadastrar, atualizar e disponibilizar
informações sobre estabelecimentos de saúde e suas dimensões, como recursos
físicos, humanos e serviços ofertados. Diversos estudos vêm utilizando o CNES para
a avaliação da oferta de serviços, bem como suas desigualdades regionais (ROCHA
et al., 2018; NORONHA et al., 2020; CARVALHO; ANDRADE; AMARAL, 2021). Por
ser um cadastro alimentado pelos estabelecimentos de saúde, a atualização das
informações não ocorre necessariamente de forma sistemática e, além disso, não
há processo de auditoria e crítica dos registros realizados. Como exigência
contratual, os estabelecimentos prestadores de serviços devem manter suas
informações atualizadas no SUS e no sistema de saúde suplementar.
Desde 2003, os dados do setor de saúde suplementar relacionados aos beneficiários

e às operadoras de planos privados de saúde são disponibilizados pela ANS. As
informações são divulgadas trimestralmente, permitem analisar a evolução do setor
e são primordiais para o planejamento e melhoria da qualidade da assistência à

89
saúde. Para padronizar as ações administrativas do setor a ANS estabeleceu a TISS,
um padrão de troca de informações entre as operadoras, obrigatório desde 2007. A
TISS contribui tanto para a redução de fraudes quanto para a organização do
faturamento e redução da assimetria de informações para os beneficiários (BRASIL,
[1999]).
4 Medidas individuais de saúde
As medidas individuais são, em geral, construídas com base em informações provenientes

de pesquisas domiciliares. Existem diferentes classificações das medidas individuais. Neste
trabalho, propomos uma tipologia que contempla três categorias definidas a partir do critério
de apuração: antropométricas, clínicas ou autorreportadas. As medidas antropométricas se
referem a características físicas dos indivíduos com parâmetros de referência objetivos e
universalmente aceitos; compreendem peso, altura, circunferência do quadril e da cintura,
entre outros (WHO, 1995). Um dos indicadores mais utilizados é o Índice de Massa Corporal
(IMC), definido pela razão entre o peso e o quadrado da altura. Esse indicador é adotado
pela OMS e por diversos profissionais da saúde para avaliar a condição nutricional dos
indivíduos bem como o seu risco cardiovascular e de morte. O IMC permite classificar os
indivíduos em diferentes categorias de composição corporal associadas a riscos de
desenvolvimento de doenças crônicas e status nutricional; compreende peso ideal (entre
18,5 e 24,9), baixo peso (abaixo de 18,5), sobrepeso (entre 25 e 30) e obesidade (≥ 30)
(WHO, 1995). Por ser facilmente obtido e interpretado, esse indicador é amplamente
utilizado. A principal limitação é que para determinadas populações, como idosos, o IMC
pode não refletir de forma adequada a proporção e distribuição da gordura corporal (CERVI
et al., 2005). Além disso, indivíduos que apresentam massa muscular elevada podem
apresentar níveis elevados de IMC mesmo sem ter excesso de gordura. Uma medida
alternativa, a razão cintura/quadril (RCQ), mensura o acúmulo da gordura abdominal que
tem sido associado ao risco de diabetes e desenvolvimento de doenças cardiovasculares
(BJÖRNTORP, 1997; PEREIRA et al., 1999; MARTINS; MARINHO, 2003; PITANGA;
LESSA, 2007).
As medidas clínicas são obtidas a partir de exames realizados por profissionais de saúde
ou por pesquisadores os quais são marcadores para o risco de desenvolvimento de
doenças crônicas ou eventos agudos (por exemplo, nível de estresse, inflamações). As
mais comumente utilizadas são medidas da pressão sanguínea e coleta de amostras de
sangue ou de saliva para a detecção de determinadas doenças. Apesar de serem medidas
mais objetivas, não estão livres de limitações. A primeira refere-se ao custo elevado de
coleta desses dados, sobretudo em pesquisas domiciliares com ampla cobertura geográfica
e populacional. A segunda limitação a que essas medidas também estão sujeitas são os
erros de mensuração. O diagnóstico da doença é sensível ao tipo de teste realizado, à
metodologia escolhida para definir os pontos de cortes e parâmetros referentes à
concentração da substância analisada, às condições que os indivíduos se encontravam no
momento da realização do exame e às condições de armazenamento do material coletado
(NATIONAL RESEARCH COUNCIL, 2000).
Dessa forma, a maior parte das pesquisas domiciliares, sobretudo aquelas de cobertura
geográfica mais ampla, baseiam-se na autopercepção dos indivíduos para se obterem
medidas sobre o seu estado de saúde. As principais medidas autorreportadas
compreendem três dimensões do estado de saúde: clínica, funcional e geral. A dimensão
clínica define a doença como um desvio de uma norma fisiológica. Nas pesquisas
domiciliares disponíveis para o Brasil, as principais medidas que permitem avaliar essa
dimensão referem-se à presença de doenças crônicas. As doenças comumente
investigadas são diabetes, hipertensão arterial sistêmica, doenças cardiovasculares,
doenças respiratórias como asma e bronquite, artrite/reumatismo, problemas de coluna e
doenças mentais como depressão e ansiedade. A declaração dessas doenças pelos
indivíduos entrevistados depende do acesso aos serviços de saúde, do estágio/evolução
da doença e da capacidade de identificar a enfermidade com base nos sintomas. Algumas
doenças podem ser detectadas por meio de sintomas amplamente conhecidos. No entanto,
em alguns casos, é necessário que o processo de deterioração do estado de saúde esteja
em um estágio mais avançado para que os sintomas sejam percebidos (NORONHA;
ANDRADE, 2006). A hipertensão, por exemplo, está associada a ocorrência de eventos de
pressão elevada enquanto a diabetes é uma doença crônica mais silenciosa, sem o
aparecimento de sintomas. Essas características resultam em uma autodeclaração da
diabetes bem inferior àquela observada para a hipertensão quando comparadas aos níveis
reais de prevalência esperados (SCHMIDT et al., 2009; SENA, 2017). No caso de
depressão, são utilizados instrumentos específicos que permitem classificar os indivíduos
segundo o grau de depressão a partir de uma lista de sintomas pré-definidos. Um
instrumento muito utilizado para rastrear risco de depressão na população geral é o Patient
Health Questionnaire (PHQ-9), um questionário simples e de fácil aplicação. O PHQ-9
apresenta nove questões e contempla os seguintes sintomas, definidos pelo Manual
Diagnóstico e Estatístico dos Transtornos Mentais (DSM-IV): humor deprimido, perda de
interesse ou prazer em realizar atividades cotidianas, distúrbios de sono, cansaço ou falta

91
de energia, mudança no apetite ou peso, sentimento de culpa ou inutilidade, problemas de
concentração, sentir-se lento ou inquieto e pensamentos suicidas (KROENKE; SPITZER,
2002). Para o Brasil, as informações disponíveis na PNS possibilitam avaliar os indivíduos
segundo o seu grau de depressão a partir desses sintomas, classificando-os em
basicamente três categorias: sem episódio de depressão, com episódio moderado ou com
episódio severo (BARROS et al., 2017).
Na dimensão funcional, a doença é definida como a falta de habilidade ou dificuldade para

desempenhar tarefas habituais, tais como atividades da vida diária (AVDs), atividades
instrumentais da vida diária (AIVDs) e mobilidade física. Por serem mais objetivas, estão
menos sujeitas a erros sistemáticos de declaração e não precisam ser diagnosticadas por
algum profissional de saúde, sem depender, portanto, do acesso aos serviços de saúde
para serem percebidas pelos indivíduos (NORONHA; ANDRADE, 2006). As AVDs medem
a capacidade de autocuidado dos indivíduos, como vestir-se, tomar banho e comer,
enquanto as AIVDs incluem atividades um pouco mais complexas do cotidiano, como
preparar a comida, manusear o próprio dinheiro e realizar tarefas domésticas. As atividades
relacionadas à mobilidade física, por sua vez, medem a capacidade do indivíduo correr,
caminhar várias ruas, subir ou descer escadas. Em geral, a deterioração da saúde dos
indivíduos pode inicialmente comprometer a capacidade de realização das AIVD e
posteriormente, quando a saúde está mais fragilizada, das AVD (BERLEZI et al., 2016;
ARAÚJO et al., 2019). A principal limitação desse conjunto de indicadores é que nem todas
as morbidades acarretam limitações físicas. Além disso, como a perda de capacidade para
realizar essas atividades tende a ocorrer entre indivíduos com idades mais avançadas,
essas medidas são pouco sensíveis para avaliar a condição de saúde dos demais grupos
etários (NORONHA; ANDRADE, 2006).
A dimensão referente ao estado de saúde geral é bastante utilizada na literatura empírica,

por ser capaz de considerar, em única variável, diferentes dimensões de saúde dos
indivíduos. Essa medida é captada nas pesquisas domiciliares a partir da avaliação que os
indivíduos fazem sobre sua condição geral de saúde e pode ser classificada como muito
boa, boa, regular, ruim e muito ruim. Evidências empíricas têm mostrado a existência de
forte relação entre esse indicador e a mortalidade futura, assim como com outras medidas
de morbidade (IDLER; KASL, 1995; IDLER; BENYAMINI, 1997). A principal dificuldade,
entretanto, é o alto grau de subjetividade envolvido nessa avaliação. A percepção dos
indivíduos, em geral, está condicionada ao estado de saúde das demais pessoas da
comunidade e às características do contexto em que está inserido, o que dificulta estudos
comparativos entre diferentes localidades ou subgrupos populacionais. Além disso, essa
variável está sujeita a erros sistemáticos de declaração, uma vez que depende do conjunto
de informações que os indivíduos possuem ao avaliarem sua condição de saúde
(STRAUSS; THOMAS, 1998). Por exemplo, por terem menos acesso aos serviços de
saúde, os indivíduos das classes de renda mais baixa podem ter mais dificuldades para
avaliar de forma precisa seu estado de saúde e superestimar o percentual de pessoas
saudáveis nessa camada de renda.
Por fim, outro conjunto de indicadores que se baseia na autodeclaração dos indivíduos
refere-se aos hábitos e estilo de vida. Apesar de não serem medidas diretas do estado de
saúde, o monitoramento desses indicadores é importante por se constituírem fatores de
risco para o desenvolvimento de determinadas condições e morbidades (BRASIL, 2005;
STEYN; DAMASCENO, 2006). Em geral, são investigados o consumo de cigarro e de
bebidas alcoólicas, hábitos alimentares (medidos pelo consumo de determinados grupos
de alimentos), prática de exercícios físicos e comportamentos relacionados à saúde sexual
e reprodutiva.
5 Medidas agregadas de saúde
Os indicadores agregados de saúde fornecem uma medida sintética que permitem avaliar
e monitorar o estado de saúde médio de uma população e podem ser construídos com base
em informações sobre mortalidade ou morbidade. O conhecimento do perfil epidemiológico
da população e sua trajetória é fundamental para a formulação de políticas de saúde de
forma a atender melhor às demandas e necessidades dos indivíduos de uma determinada
sociedade. Adicionalmente, o acompanhamento dos indicadores ao longo do tempo permite
avaliar e monitorar o desempenho das políticas de saúde implementadas (MALTA; SILVA,
2013; SILVA et al., 2020).
As principais fontes de informações para a sua estimação são os registros administrativos

que apresentam periodicidade anual, os quais propiciam seu monitoramento de forma
contínua. Esses indicadores podem ser calculados em níveis de agregação municipal,
estadual ou nacional. A escolha do nível de agregação depende do objetivo da análise e
do comportamento do indicador. No Brasil, em função da existência de municípios com
população muito pequena, é necessário avaliar a frequência do evento de interesse para
garantir a viabilidade do uso do indicador.

93
Medidas agregadas sobre a prevalência de determinadas condições crônicas também
podem ser obtidas a partir de dados individuais provenientes de pesquisas domiciliares.
Essas informações, entretanto, são limitadas do ponto de vista da periodicidade em que
são atualizadas, devido ao alto custo incorrido na condução dessas pesquisas. Além disso,
no Brasil, as pesquisas domiciliares que investigaram a presença de doenças crônicas são
representativas até o nível da unidade da federação e região metropolitana, o que não
permite análises no nível municipal.
5.1 Medidas agregadas construídas com base em informações de mortalidade
As principais medidas que utilizam informações de mortalidade em sua construção

são esperança de vida, taxa de mortalidade infantil, razão de mortalidade materna e
taxa de mortalidade ou mortalidade proporcional por causas selecionadas. Por se
basearem em informações de óbitos, cujo registro é compulsório em diversos países,
permitem comparabilidade internacional e em diferentes pontos no tempo. Além
disso, alguns países buscam seguir a padronização dos registros recomendada pela
OMS, de forma a permitir a comparação mais direta das taxas de mortalidade (WHO,
2016). Apesar de sua obrigatoriedade, há diferenças de cobertura e de qualidade do
registro entre países e entre regiões do mesmo país. Essas diferenças são
observadas uma vez que a qualidade do registro depende do acesso aos serviços
de saúde para atestar a causa do óbito. Recentemente, o Brasil tem observado
mudanças importantes na cobertura do registro e melhoria da qualidade das
informações. Entretanto, mesmo com essas melhorias, ainda persistem no país
diferenças regionais importantes em relação à qualidade do registro, sobretudo no
que se refere à mortalidade materna e mortalidade infantil (BITTENCOURT et al.,
2013; OLIVEIRA, 2018).
Uma pesquisa realizada pela Fundação Oswaldo Cruz (Fiocruz), em parceria com o
Ministério da Saúde, permitiu estimar a cobertura e o fator de correção dos registros
de óbitos e de nascidos vivos para os municípios brasileiros. Foi conduzida busca
ativa dessas informações em uma amostra de 129 municípios do nordeste e
Amazônia Legal. Os resultados, estimados com base nessa amostra, foram
posteriormente extrapolados para todos os municípios brasileiros. Para o Brasil, a
cobertura do SIM (para todos os grupos de idade) e do Sinasc é alta, acima de 90%.
Para os óbitos infantis, entretanto, a cobertura, além de mais baixa, apresenta
desigualdades importantes entre as regiões e municípios brasileiros
(SZWARCWALD et al., 2011). Enquanto no norte e nordeste, em média a cobertura
é igual a 69,4% e 73,1%, nas regiões sul e sudeste, esses percentuais são bem mais
elevados, em torno de 98% e 94%, respectivamente. Esses achados evidenciam que
a subnotificação dos óbitos infantis ainda é uma questão que precisa ser enfrentada
pelos gestores, sobretudo nas localidades mais pobres.
5.2 Esperança de vida
A esperança de vida ao nascer é o indicador de longo prazo que reflete as condições

gerais de saúde de determinada população. A esperança de vida fornece o número
médio de anos que um indivíduo em uma determinada idade espera viver se exposto,
ao longo de seu ciclo de vida, aos riscos atuais de morte de cada grupo de idade e
sexo (PRESTON; GUILLOT, 2000). A principal limitação é que esse indicador pode
não refletir o risco real de morte a que cada coorte de nascimento estará exposta,
uma vez que são utilizados em sua construção os riscos correntes. Em sociedades
que vêm experimentando reduções acentuadas na mortalidade, a esperança de vida
calculada com base nos riscos de morte correntes tenderá a ser menor do que a
efetivamente observada para cada coorte (GUERRA; FÍGOLI, 2013). Além disso, a
expectativa de vida, por ser um indicador que depende das condições de saúde de
toda a população pode apresentar baixa sensibilidade, a depender do evento de
interesse.
Segundo estimativas do IBGE, em 1940 a esperança de vida ao nascer no Brasil era

igual a 41,5 anos; passou para 70,4 anos em 2000 (IBGE, [1999]) e 76,8 anos em
2020 (IBGE, 2021b). Inicialmente, os ganhos na esperança de vida ao nascer no
Brasil foram provenientes de reduções substanciais na taxa de mortalidade infantil.
Com o envelhecimento da população e aumento da longevidade, os ganhos mais
recentes têm sido atribuídos a quedas da mortalidade nas idades mais avançadas,
acima de 60 anos, devido a reduções nas taxas de mortalidade por doenças
crônicas, sobretudo doenças do aparelho circulatório (CORRÊA; MIRANDA-
RIBEIRO, 2017; BOMFIM; CAMARGOS, 2021).
5.3 Taxa de mortalidade infantil
A taxa de mortalidade infantil é definida como a razão entre os óbitos de crianças

menores de 1 ano e total de nascidos vivos, multiplicado por 1000. Os fatores que
afetam a mortalidade infantil dependem do tempo de vida da criança e é fundamental
considerar a idade da criança no momento do óbito para orientar a formulação de

95
políticas em saúde. A mortalidade infantil pode ser neonatal e pós-neonatal. A
mortalidade neonatal ocorre quando a criança tem entre 0 e 27 dias de vida e está
associada principalmente às causas perinatais e anomalias congênitas. Sua
prevenção envolve melhorias das condições pré-natais, melhor assistência ao parto
e ao pós-natal imediato e geralmente abrange investimentos em serviços
hospitalares de tecnologia mais complexa (LANSKY et al., 2002). A mortalidade pós-
neonatal, cujo óbito ocorre entre 28 dias e menos de 1 ano de vida, está fortemente
associada a fatores ambientais, tais como condições de vida e exposição às doenças
infecciosas. A taxa de mortalidade infantil é mais elevada quando a mortalidade pós-
neonatal representa a maior parcela dos óbitos infantis. Nesse caso, a redução da
mortalidade dependerá fortemente de melhorias em saneamento básico, condições
nutricionais, redução da incidência de doenças infectocontagiosas e aumento da
cobertura vacinal (SOUSA; MELO, 2013).
No Brasil, observou-se redução significativa na TMI de 162 para 83 mortes por mil
nascidos vivos entre 1930 e 1980, uma queda de quase 50% em um período de 50
anos. Essa queda foi constatada em todas as regiões do país e é explicada
principalmente por reduções nos óbitos ocorridos durante o período pós-neonatal
(VICTORA et al., 2011). Como consequência, os óbitos neonatais passaram a ser o
principal componente da mortalidade infantil. Em 2019, utilizando informações
disponibilizadas pelo SIM e Sinasc, a taxa de mortalidade infantil era igual a 12,4 por
mil nascidos vivos; as mortes neonatais responderam pela maior parte dos óbitos
entre crianças menores de um ano de idade (70%).
A mortalidade infantil é um indicador bastante sensível a variações nas condições

de saúde e, portanto, geralmente tem alta sensibilidade e especificidade. A
associação entre as condições de saúde e a taxa de mortalidade infantil entre os
países é empiricamente reconhecida. Além disso, esse indicador é capaz de sofrer
alterações mediante intervenções de políticas públicas, não somente específicas
para crianças, mas também para a população de forma geral (por exemplo,
saneamento básico) (MARTINS et al., 2020). Nos últimos anos, a taxa de
mortalidade infantil no Brasil sofreu reduções expressivas com o avanço de medidas
de saúde pública, incluídos tanto o aumento da imunização infantil quanto o aumento
na cobertura de saneamento básico, a refletir melhoras nas condições de vida da
população (LEAL et al., 2018).
5.4 Razão de mortalidade materna
A razão de mortalidade materna (RMM) é calculada como a razão entre óbitos

maternos e nascidos vivos, multiplicada por 100.000. Para o seu cálculo são
considerados todos os óbitos de mulheres até 42 dias depois do término da gravidez,
independentemente da causa, excluindo-se apenas as causas acidentais ou
incidentais (BRASIL, 2021c). A principal dificuldade na estimação da RMM no Brasil
refere-se aos problemas de sub-registro e subdiagnóstico, o que dificulta não apenas
conhecer a magnitude dessas mortes, mas também as causas a essas relacionadas.
Esforços empreendidos pelo Ministério da Saúde, intensificados a partir de 2008,
têm procurado melhorar os registros de mortalidade materna no país (BRASIL,
2018).
No Brasil, nas últimas décadas, houve redução importante nesse indicador devido
principalmente à implementação de políticas públicas direcionadas à saúde materna.
Essas políticas vêm sendo implementadas desde a década de 1980 e têm propiciado
melhorias de acesso ao cuidado pré-natal e aumento do número de partos realizados
em instituições apropriadas. Apesar dessas melhorias, os níveis atuais da RMM no
Brasil ainda permanecem em patamares elevados e chega a ser de 5 a 10 vezes
superior ao observado em países de alta renda (VICTORA et al., 2011). Entre 1990
e 2015, foi de 50% a redução observada nesse indicador no Brasil, abaixo da meta
estabelecida pelos Objetivos de Desenvolvimento do Milênio (ODM), que era de
70%. Estimativas para 2015 mostram que a RMM no país está em torno de 62 óbitos
maternos por 100.000 nascidos vivos. Esse valor está dentro da meta estabelecida
pelos Objetivos de Desenvolvimento Sustentável (ODS), que preconiza taxas
inferiores a 70 óbitos por 100.000 nascidos. No entanto, devido às grandes
disparidades observadas entre as regiões do país, algumas localidades ainda
apresentam valores superiores (BRASIL, 2018).
5.5 Mortalidade por causas específicas
Conhecer a importância de cada doença na sociedade é fundamental para o melhor

direcionamento das políticas de saúde. Essa análise pode ser realizada com base
nas taxas de mortalidade ou distribuição proporcional por causas específicas. A taxa
de mortalidade por causa é calculada como a razão entre o total de óbitos por
determinada causa dividido pela população exposta, que pode ser definida pela
população total ou específica de um grupo de sexo e idade. Por definição, essa taxa

97
fornece uma medida de risco de morte por determinada causa. A mortalidade
proporcional por causas específicas, por sua vez, fornece o peso de uma
causa/doença no total dos óbitos da população analisada. A despeito de não ser
uma medida de risco, essa permite avaliar a composição dos óbitos e evidencia a
importância da doença analisada. Para definir as causas de morte, os registros de
óbitos seguem a décima versão da Classificação Internacional de Doenças e
Problemas Relacionados à Saúde (CID-10).
No Brasil, o perfil epidemiológico da população tem se alterado com o processo de

transição demográfica e verifica-se o aumento da prevalência de doenças crônicas
(LEBRÃO, 2007; DUARTE; BARRETO, 2012). No entanto, diferentemente do
observado em países de maior renda, o aumento dessa prevalência vem ocorrendo
em um contexto no qual as doenças transmissíveis ainda representam parcela
relativamente importante das mortes (SCHRAMM et al., 2004). Dessa forma, tal
como destacam os estudos de Borges (2017) e Calazans e Queiroz (2020)
coexistem no país diferentes perfis de morbidade, com as seguintes causas de morte
se destacando entre as mais prevalentes: doenças infecciosas e parasitárias
(Capítulo I da CID-10); doenças do aparelho circulatório (Capítulo IX); doenças do
aparelho respiratório (Capítulo X); doenças endócrinas, nutricionais e metabólicas
(IV); e neoplasias (Capítulo II). Além disso, devido ao alto nível de violência e
criminalidade, os óbitos por causas externas (Capítulo XX) também se destacam
entre as principais causas e são alvos de monitoramento por parte tanto dos gestores
quanto de pesquisadores da área.
Além de traçar o perfil epidemiológico da população, há ainda dois grupos de causas

que permitem caracterizar a qualidade e cobertura tanto do cuidado com a saúde
quanto dos registros de mortalidade. O primeiro refere-se a causas mal definidas
(Capítulo XVIII). Nos últimos anos, melhorias na cobertura e qualidade do registro
do SIM contribuíram para reduzir a proporção de mortes por esse grupo de causas
no Brasil – de 15% em 1996 para cerca de 6% em 2019 (BRASIL, [2019]). O segundo
grupo compreende as causas evitáveis, ou seja, mortes que poderiam ser
prevenidas pela atuação do sistema de saúde, conforme definido pela Lista Brasileira
de Mortes Evitáveis. Essa lista foi elaborada por um grupo de pesquisadores e
especialistas de diversas áreas, sob a coordenação do Ministério da Saúde.
Definiram-se dois conjuntos de causas, um para crianças menores que cinco anos e
outro para a população entre 5 e 74 anos. O conjunto de causas que compõem a
lista requer atualização periódica devido ao desenvolvimento de novas tecnologias
de saúde (MALTA et al., 2010a). Diversos estudos têm mostrado a importância das
causas evitáveis no Brasil, mas com redução nos últimos anos sobretudo nas regiões
com níveis mais elevado de desenvolvimento econômico (ABREU et al., 2007;
KANSO et al., 2013; MALTA et al., 2010b, 2018).
5.6 Limitação das medidas agregadas de mortalidade
A principal limitação desses indicadores – por serem construídos com base em

informações de mortalidade – é desconsiderarem parte importante da qualidade de
vida relacionada à saúde da população. Algumas doenças, mesmo que gerem perda
de bem-estar individual, não se traduzem em mortalidade. Essa questão é
especialmente relevante à medida que a população envelhece. Os idosos tendem a
sofrer morbidades, como doenças crônicas degenerativas, as quais não se traduzem
prontamente em mortalidade, mas podem gerar perdas importantes de bem-estar.
Além disso, o desenvolvimento de tecnologias terapêuticas, como vacinas e
antibióticos, tem contribuído para reduzir a letalidade das doenças transmissíveis. A
construção de taxas de incidência e prevalência de doenças específicas
complementam as medidas baseadas em mortalidade na caracterização do perfil
epidemiológico e monitoramento dessas doenças. Essas medidas, em geral, fazem
parte do conjunto de indicadores universais elencados para a definição de metas de
desenvolvimento humano sustentável, como os indicadores dos Objetivos de
Desenvolvimento Sustentável (ODS) (SILVA; PELIANO; CAVES, 2018).
5.7 Medidas agregadas construídas com base em informações de morbidade
As principais medidas agregadas de morbidade no Brasil são construídas a partir de

três fontes: Sistema de Informação de Agravos de Notificação (Sinan), Sistema de
Informações de Internações Hospitalares (SIH-SUS) e pesquisas amostrais
domiciliares. A partir das informações do Sinan é possível calcular a taxa de
incidência e prevalência das doenças e agravos de notificação compulsória, tais
como dengue, zika, tuberculose, Aids, sífilis e acidentes por animais peçonhentos
(SAN MARTIN et al., 2010; DOMINGUES et al., 2013; MARTELLI et al., 2015). O
monitoramento desses indicadores é importante do ponto de vista da vigilância
epidemiológica e permite avaliar a efetividade e sustentabilidade dos programas de
controle e prevenção dessas doenças. A principal dificuldade com o uso de
indicadores derivados do Sinan é a diferença de cobertura da vigilância

99
epidemiológica entre os municípios brasileiros, uma vez que o sistema somente é
alimentado quando o evento é notificado. Além disso, a qualidade dos indicadores
também do processo de investigação do evento (LAGUARDIA, 2004; SOUZA MELO,
2018), o que torna necessária a busca ativa e a correção do sub-registros para
diversos agravos.
O Sistema de Informações Hospitalares (SIH) permite a construção de indicadores

de morbidade e de produção hospitalar. Em relação à morbidade hospitalar é
possível construir indicadores de taxas de internação por causas da CID-10,
considerando-se inclusive os atributos de idade e sexo, enquanto privilegia-se o
recorte dos grupos de procedimentos para a produção hospitalar. Além disso, é usual
a agregação de algumas causas específicas a depender do objeto de interesse na
análise. Um dos indicadores mais relevantes na análise de performance de sistemas
de saúde é o de Internações Sensíveis por Atenção Primária; são condições de
saúde que a efetiva atenção primária é capaz de reduzir o risco de internações. Esse
indicador foi proposto originalmente nos Estados Unidos e atualmente é
mundialmente disseminado. No Brasil a lista é composta de 120 categorias da CID-
10 com três dígitos (ALFRADIQUE et al., 2009).
Esses indicadores, entretanto, por se referirem a doenças específicas, não permitem

medir o bem-estar em saúde de forma mais ampla. Para contornar essa limitação, a
literatura tem avançado na proposição de indicadores que considerem a qualidade
de vida. Os principais indicadores se referem à carga da doença que permite estimar
os Anos de Vida Perdidos Ajustados por Incapacidade (AVAI, do inglês Disability
Adjusted Life Years - DALYs) (ALFRADIQUE et al., 2009). Mais recentemente, um
indicador tem sido amplamente utilizado em avaliação de tecnologias em saúde,
compreende os Anos de Vida Ajustados por Qualidade (AVAQ, do inglês Quality-
Adjusted Life Years - QALY). Esse indicador, por construção, ajusta o valor de cada
ano de vida à perda de qualidade decorrente de deterioração na condição de saúde
(SANTOS et al., 2022).
Tanto o AVAI como o AVAQ permitem combinar informações de sobrevida /

mortalidade e qualidade de vida relacionada à saúde. A qualidade de vida
relacionada à saúde é incorporada como um fator de ponderação para cada ano de
vida que o indivíduo espera viver experimentando determinada morbidade. A
principal diferença entre o AVAI e o AVAQ refere-se à forma como os pesos

associados à qualidade de vida relacionada à saúde são definidos. O AVAI foi
introduzido no primeiro estudo da Carga Global da Doença (Global Burden Disease,
do inglês - GBD) em 1993, desenvolvido pelo Banco Mundial em colaboração com a
OMS. O indicador é a soma de dois componentes: mortalidade prematura devido à
doença (YLL, do inglês Years of Life Lost) e anos vivido com incapacidade (YLD, do
inglês Years of Healthy Life Lost due to disability). O YLD é medido considerando-se
a incidência da doença na população, ponderada pela duração média e gravidade
da doença. O fator de ponderação referente à gravidade da doença varia de zero a
1 e indica respectivamente perfeita saúde e morte (WHO, 2020). A forma como os
pesos, referentes à gravidade, são estimados tem se alterado ao longo das revisões
do GBD. Incialmente, os pesos de severidade foram estimados com base em um
painel de especialistas em saúde. Na versão do GDB de 2010, os pesos foram
estimados considerando-se uma amostra da população geral residente em mais de
100 países (HAAGSMA et al., 2015).
O AVAQ foi desenvolvido por Klarman et al. (1968) e definido como o número de
anos vividos em determinada condição de saúde ponderada pela sua respectiva
qualidade de vida. A qualidade de vida é mensurada a partir da escolha de um
instrumento específico. Entre os principais instrumentos, citam-se o EQ-5D,
desenvolvido pelo grupo Euroqol, o SF-36d, o SF-6D e o Whoqol (HAWTHORNE et
al., 2003; CRUZ, 2010). O EQ-5D e o SF-6D são os instrumentos mais utilizados no
Brasil. O primeiro descreve a saúde em cinco dimensões, com três níveis de
severidade possíveis, o que resulta em 243 estados de saúde possíveis; o segundo
são seis dimensões com quatro a seis níveis de severidade, o que resulta em 18000
estados de saúde. Para qualquer um desses instrumentos os pesos da qualidade de
vida são mensurados com base nas preferências em saúde dos indivíduos de
determinada sociedade. Essas preferências são obtidas a partir de questionários
individuais que permitem aos indivíduos valorarem estados de saúde distintos. As
técnicas utilizadas para avaliar os estados de saúde são fundamentadas na teoria
microeconômica. Em linhas gerais, a ideia subentendida no processo de valoração
é que existe um trade-off entre quantidade e qualidade de vida. Dessa forma, é
possível encontrar um número de anos de vida em perfeita saúde e um número de
anos de vida com alguma doença que iguala a utilidade dos indivíduos em cada um
desses estados. Os valores dos pesos podem variar entre zero e 1 e indicar o valor
de utilidade médio atribuído para morte e saúde plena respectivamente.

101
6 Indicadores de demanda por serviços de saúde: utilização e gastos
A demanda por serviços de saúde pode ser mensurada por indicadores de utilização ou de
gastos. No Brasil, esses indicadores são calculados principalmente a partir dos dados
administrativos para a produção ambulatorial e hospitalar, disponíveis por intermédio do
Sistema de Informações Ambulatoriais (SIA) e Sistema de Informações Hospitalares (SIH)
no Sistema Único de Saúde, respectivamente. Os indicadores de produção hospitalar são
mais confiáveis uma vez que cada internação financiada no SUS requer o preenchimento
de uma AIH. Essa exigência administrativa, torna os dados do SIH bastante adequados
para mensurar o quantitativo da produção hospitalar. A produção ambulatorial, por outro
lado, não requer a abertura de um registo administrativo específico para cada serviço
realizado e possibilita ao município fazer o lançamento da produção total ou desagregada.
Como as informações ambulatoriais ainda apresentam certa heterogeneidade na forma de
lançamento dos dados no sistema, os dados ambulatoriais são menos confiáveis e por isso
menos usados.
Além dos registros administrativos, a utilização de serviços de saúde pode ser mensurada
por meio das informações individuais disponíveis nas pesquisas domiciliares. A principal
pesquisa domiciliar para a construção de indicadores de utilização é a Pesquisa Nacional
em Saúde, que fornece informações sobre consultas e internações. A vantagem do uso da
PNS é a possibilidade de construção de indicadores considerando-se atributos individuais
tais como idade, sexo, local de residência, escolaridade, renda domiciliar. As pesquisas
domiciliares são fundamentais para investigar a relação entre os atributos individuais e a
demanda por serviços de saúde. Um dos recortes amplamente realizado é a presença de
cobertura de serviços de saúde que permite comparar a utilização e acesso aos serviços
de saúde para os beneficiários de planos de saúde e para os usuários do SUS (MACINKO;
LIMA-COSTA, 2012; ANDRADE et al., 2013; CASTRO et al., 2019). Essas análises são
fundamentais para subsidiar políticas públicas, sobretudo análises da equidade no acesso
e no estado de saúde.
O uso de indicadores de gasto com serviços de saúde é ainda pouco disseminado no Brasil.
Em parte, esse uso menos frequente se deve às limitações das fontes de dados disponíveis.
A principal fonte de dados para indicadores de gasto são os sistemas administrativos: SIH,
sistema APAC (Autorização de Procedimentos de Alta Complexidade) e SIA. Para todos
esses sistemas são registradas as despesas com procedimentos financiados pelo SUS. A
principal limitação dessas bases de dados, entretanto, deve-se à distorção dos preços
relativos dos serviços. O agregado do gasto ou despesa é resultado do produto entre o

número de procedimentos realizados multiplicado pelo valor de cada procedimento. Nesse
sentido, o gasto pode variar quando a quantidade contratada de serviços variar ou quando
os preços relativos se alterarem na economia. No SUS, o sistema de ajustamento do valor
do reembolso dos procedimentos não tem sido realizado de forma transparente e muito
menos por meio de regras bem estabelecidas. Assim, setores mais organizados da indústria
têm conseguido estabelecer seus reajustes, enquanto os demais setores, principalmente
os mais intensivos em mão de obra, não praticam reajustes o acarreta significativa
defasagem de valores de reembolso em tabelas. Esse modelo de reajuste tem determinado
um sistema de preços defasado, distorcido e pouco sustentável do ponto de vista da
sociedade no que se refere aos procedimentos financiados pelo SUS.
Outra fonte de dados muito usada para a mensuração da utilização e gastos em serviços
de saúde no Brasil é a Pesquisa de Orçamentos Familiares (POF), a qual visa mensurar as
estruturas de consumo, dos gastos, dos rendimentos e parte da variação patrimonial das
famílias. Dessa forma, é possível traçar um perfil das condições de vida da população
brasileira a partir da análise de seus orçamentos domésticos, incluídos os gastos com
saúde. Além das informações diretamente associadas à estrutura orçamentária, várias
características dos domicílios e das famílias são investigadas, o que possibilita a análise
por outros fatores socioeconômicos (VIACAVA et al., 2006; MALTA et al., 2008; BOOING
et al., 2014; SANTOS et al., 2017). A primeira pesquisa de orçamentos familiares realizada
no Brasil ocorreu em 1974-1975 e se chamava Estudo Nacional de Despesa
Familiar (Endef). Desde então foram realizadas diversas edições da POF com frequência
relativamente periódica: POF 1987-1988, POF 1995-1996, POF 2002-2003, POF 2008-
2009 e POF 2017-2018. O desenho da amostra foi estruturado de modo a propiciar a
publicação de resultados para Brasil, grandes regiões (norte, nordeste, sudeste, sul e
centro-oeste) e, também, por situações urbana e rural. Para as UF, os resultados
contemplam o total e a situação urbana. Nas nove regiões metropolitanas e nas capitais
das unidades da federação, os resultados correspondem à situação urbana.
Além dos indicadores de demanda, as informações disponíveis no Brasil permitem também

a construção de métricas que permitem avaliar e caracterizar a estrutura de oferta de
serviços de saúde. Esses indicadores compreendem medidas de estrutura física (leitos,
equipamentos, estabelecimentos) e recursos humanos. A principal base de dados para a
construção desses indicadores é o CNES, que abrange os setores público e privado e
permite desagregação em todos os níveis. Esses indicadores são fundamentais para o
planejamento da capacidade de oferta de serviços, organização de redes e regiões de

103
saúde, identificação de vazios assistenciais e pactuação do fluxo de atendimento entre os
municípios.
7 Indicadores de equidade e eficiência

Além do monitoramento dos indicadores de saúde e de utilização dos serviços, a avaliação
do desempenho dos sistemas de saúde é fundamental do ponto de vista das políticas
públicas (CARNUT; NARVAI, 2016). Essa análise tem sido realizada sob duas óticas
distintas: equidade e eficiência (VIACAVA et al., 2004). A ótica da equidade privilegia o
aspecto distributivo enquanto a eficiência prioriza o uso dos recursos escassos. Na maioria
das sociedades, uma das principais preocupações tem sido desenhar políticas de saúde
que busquem promover a distribuição equitativa de saúde e o acesso/utilização dos
serviços desse setor. Especificamente em relação ao acesso/utilização, o critério
usualmente adotado baseia-se nos princípios da equidade horizontal (indivíduos com igual
necessidade deveriam receber o mesmo tratamento) e equidade vertical (indivíduos com
necessidades diferentes deveriam receber tratamentos diferenciados). De acordo com
esses princípios, os bens e serviços de saúde deveriam ser distribuídos segundo a
necessidade de cuidado independentemente da sua capacidade de pagamento
(TRAVASSOS; CASTRO, 2012).
A metodologia usualmente empregada para avaliar equidade em saúde tem sido a

construção de Índices de Concentração (IC), derivado da literatura de distribuição de renda.
O IC é estimado a partir da relação entre a proporção acumulada da população ordenada
de forma crescente pelo nível socioeconômico contra a proporção acumulada de indivíduos
de acordo com a condição de saúde ou de acesso/utilização dos serviços de saúde
(SCHNEIDER et al., 2002). Os valores do IC podem variar entre -1 e 1. IC positivo indica
haver uma concentração do atributo de saúde analisado entre os indivíduos com nível
socioeconômico mais elevado. Em contraposição, IC negativo indica concentração do
atributo entre os indivíduos mais pobres. IC igual a zero, por sua vez, indica ausência de
desigualdade social. A representação gráfica do IC é a Curva de Concentração (CC), com
o IC medido pela área delimitada pelas CC e diagonal. A diagonal representa perfeita
igualdade do atributo de saúde entre os grupos socioeconômicos. Quando a CC coincide
com a diagonal, o IC é zero. Se, por outro lado, o atributo analisado estiver concentrado
nos grupos socioeconômicos mais altos (baixos), a CC posiciona-se abaixo (acima) da
diagonal e o IC resultante é positivo (negativo) (ANDRADE et al., 2015). Uma limitação
dessa metodologia é a possibilidade de a CC cruzar a diagonal. Como a área acima da

diagonal pode compensar a área abaixo da diagonal, o IC resultante não refletirá a
iniquidade presente entre os grupos socioeconômicos. Dessa forma, é importante que a
análise da CC seja realizada de forma complementar à análise do IC. A despeito dessa
limitação, o IC tem sido bastante utilizado pela literatura empírica nacional e internacional
por ser de fácil implementação e interpretação e por permitir comparabilidade ao longo do
tempo e entre diferentes sociedades (MEDEIROS, 2012). Além disso, o IC satisfaz a três
requisitos desejáveis por indicadores que se propõem a medir desigualdades sociais: 1)
reflete a dimensão socioeconômica; 2) considera a experiência de toda a população e não
apenas de grupos extremos da distribuição; e 3) é sensível a mudanças na distribuição da
população entre grupos socioeconômicos (SCHNEIDER et al., 2002).
As evidências empíricas nacionais e internacionais mostram que de modo geral existe

desigualdades sociais favoráveis aos grupos privilegiados. Esses resultados são
observados mesmo em países desenvolvidos, onde as disparidades de renda não são tão
elevadas, e em países que possuem sistemas nacionais de saúde organizados, como
Canadá e Inglaterra (NORONHA; ANDRADE, 2005; ASADA; KEPHART, 2007). Para o
Brasil, as evidências apontam desigualdades importantes em saúde e no acesso aos
serviços, sobretudo no cuidado ambulatorial. Para o cuidado hospitalar, não há evidências
de desigualdades sociais favoráveis aos grupos socioeconômicos privilegiados (ANDRADE
et al., 2013). Um dos principais fatores que explicam a desigualdade no acesso aos serviços
no país é a presença de cobertura privada de saúde. Esse resultado reflete o duplo acesso
ao sistema para os indivíduos que têm maior capacidade de pagamento. Entretanto, as
políticas públicas de saúde implementadas desde meados da década de 1990 têm
contribuído para melhorar o acesso aos serviços de saúde entre as camadas de renda mais
baixa, concorrendo para reduzir essas desigualdades. Destaca-se o papel da Estratégia de
Saúde da Família, que tem colaborado para melhorar o acesso aos serviços de prevenção
e à atenção primária no SUS (ANDRADE et al., 2013). Desde a sua implementação, o
modelo de cuidado com saúde tem priorizado o cuidado preventivo, centrado na família,
em detrimento do modelo vigente até então, baseado na lógica hospitalocêntrica
(MENDES, 2009).
A análise de eficiência necessariamente requer a combinação de indicadores de resultados

e gastos/insumos utilizados no processo de produção do cuidado. Do ponto de vista da
produção, o conceito de eficiência está associado à otimização da produção, dos recursos
ou dos custos. Dois conceitos principais são mais usados em abordagens empíricas para
estimar a eficiência: a eficiência técnica e a eficiência alocativa. A eficiência técnica é

105
definida como a capacidade de se obter a maior produção possível e se utilizar a menor
combinação de insumos, enquanto a eficiência alocativa considera também a capacidade
da unidade produtiva de se utilizar os recursos em uma combinação ideal dados os preços
relativos do mercado. Além da comparação de indicadores de desempenho, análises de
eficiência podem ser realizadas a partir da estimação modelos paramétricos e não
paramétricos. Os métodos mais usuais são o método de fronteira estocástica e a análise
de envoltória de dados (DEA, do inglês Data Envelopment Analysis). O DEA é uma técnica
não-paramétrica de combinação linear para estimar fronteiras de produção de unidades
produtivas que empregam processos tecnológicos semelhantes para transformar múltiplos
insumos em múltiplos produtos. A principal vantagem do DEA é não exigir pressuposto
algum sobre a função de produção, usualmente desconhecida. A análise de fronteira
estocástica, por outro lado, é uma técnica paramétrica para estimar a eficiência. Essa
abordagem parte de uma forma funcional específica para o processo de produção e admite
um componente estocástico no processo produtivo que diferencia as unidades de
produção. As duas abordagens têm sido amplamente utilizadas na área da saúde.
No Brasil, os principais estudos que empregam o DEA ou o método de fronteira estocástica

para analisar o desempenho do sistema de saúde apontam ineficiências no setor. Isso
implica que mais serviços poderiam ser ofertados utilizando o mesmo nível de recursos e
gerariam potenciais melhoras dos resultados de saúde da população. Estima-se que a
ineficiência média na atenção primária seja de 37% e de 71% e nas atenções secundária e
terciária (WORLD BANK, 2017). Em relação ao desempenho hospitalar, em que os níveis
de ineficiência são altos, o principal problema está na escala de produção. O elevado
número de hospitais de pequeno porte localizados em municípios menores contribui para o
funcionamento abaixo do nível ideal de atendimentos (La FORGIA; COUTTOLENC, 2008;
BOTEGA, 2020). No que se refere a comparações internacionais, a posição relativa do
Brasil nas avaliações de eficiência varia bastante entre os estudos. Embora não haja
consenso sobre a classificação do país, todos os trabalhos indicam que existe espaço para
ganhos significativos de eficiência (MARINHO et al., 2012, 2020).
O Quadro 1 sintetiza os principais indicadores discutidos nesse capítulo.

Quadro 1 - Principais indicadores de saúde, descrição, fontes e usos
Fontes
Indicador Descrição Principais usos Limitações
principais
Medidas individuais de saúde
Padrão de
referências ou
VIGITEL, POF, Avaliação da ponto de corte
Características físicas
PNDS (DHS condição das medidas
Antropométricas dos indivíduos (ex.:
Brasil), SABE, nutricional e risco pode não refletir a
peso, altura, IMC)
ELSA de doenças condição de
grupos
específicos
Exames realizados por Avaliação do Custo elevado de

profissionais de saúde PNDS (DHS estado de saúde coleta dos dados
Clínicas
ou por pesquisadores Brasil), ELSA associado a e erros de
(ex.: pressão sanguínea) condições mensuração
específicas
Autopercepção dos Condicionada às
indivíduos do seu estado PNAD, PNS, expectativas dos
Avaliação do
de saúde (ex: presença PeNSE, VIGITEL, indivíduos
Autorreportadas estado de saúde
de doenças crônicas, SABE, ELSI-
individual
dificuldade para realizar Brasil
tarefas habituais)
Medidas agregadas de saúde
Medida sintética que Desconsideram
permite avaliar e parte importante
monitorar o estado de da qualidade de
saúde médio de uma vida relacionada
população com base em Conhecimento à saúde da
Baseadas em informações de das causas de população.
dados de mortalidade (ex: SIM morte e avaliação Algumas
mortalidade esperança de vida, taxa das condições de doenças, mesmo
de mortalidade, vida gerando perda de
mortalidade por causas bem-estar
específicas) individual, não se
traduzem em
mortalidade
Diferença de
Medida sintética que
cobertura da
permite avaliar e
vigilância
monitorar o estado de
epidemiológica,
saúde médio de uma
Monitoramento do análise de
Baseadas em população com base em
estado de saúde doenças
dados de informações de SINAN, SIH,
médio da específicas não
morbidade morbidade (ex: taxa de
população permitem medir o
incidência e prevalência
bem-estar em
das doenças, taxa de
saúde de uma
internação, QALY)
forma mais
ampla,
continua

107
conclusão
Fontes
Indicador Descrição Principais usos Limitações
principais
Indicadores de demanda por serviços de saúde
Dados
Produção ambulatorial e
ambulatoriais são
hospitalar (ex.:
menos confiáveis
consultas, internações) Acompanhament
devido a
o da demanda e
Utilização SIA, SIH, PNS heterogeneidade
acesso aos
na forma de
serviços de saúde
lançamento das
informações no
sistema
Despesas realizadas Fiscalização e
com procedimentos de planejamento do Distorção dos
Gasto saúde (ex.: gastos com SIA, SIH, POF uso dos recursos preços relativos
medicamentos e dos serviços
exames)
Avaliação do desempenho dos sistemas de saúde
Conhecimento Indicadores
Distribuição equitativa
das necessidades diferentes podem
de saúde e no
PNAD, PNS, de grupos levar a diferentes
Equidade acesso/utilização dos
SABE específicos para conclusões sobre
serviços (ex.: índice de
redução das a existência de
concentração)
diferenças desigualdades
Estimação
Avaliação da
Combinação de sensíveis às
relação entre os
indicadores de especificações do
resultados
Eficiência resultados e insumos SIOPS modelo
obtidos e os
utilizados no processo
recursos
de produção do cuidado
empregados
(ex.: gasto com saúde
per capita)

Este capítulo apresenta um panorama dos principais indicadores associados à saúde,

vinculando as bases de dados disponíveis no Brasil que permitem a sua construção. A
saúde por ser multidimensional requer o uso de um conjunto mais amplo de indicadores. A
avaliação de políticas avançou no Brasil nos últimos 20 anos e atualmente se configura
como uma prática na gestão pública. O uso de indicadores necessariamente é parte
fundamental do monitoramento e definição de metas na condução da política pública. O
Brasil é um dos países que se desponta com um sistema de informação oficial amplo e
publicamente disponível que permite a construção desses indicadores nas diversas
dimensões. Além disso, a existência de um inquérito domiciliar com periodicidade
quinquenal e abrangência nacional tem sido fundamental para garantir pesquisas que
foquem as desigualdades no acesso, utilização e estado de saúde. Essas investigações
têm sido norteadoras importantes da política de avaliação e reorganização do Sistema de
Saúde Brasileiro.
Um avanço importante no nosso sistema de informação seria a vinculação de todos os

registros administrativos através da identificação única dos indivíduos. A vinculação desses
registros permitiria o acompanhamento longitudinal da utilização dos serviços de saúde nos
setores público e privado. Além disso a associação das bases de utilização de serviços de
saúde com o Sistema de Informações de Mortalidade abre um potencial de investigação de
análises de impacto de política na sobrevida dos indivíduos.
Esse trabalho contribui com a sistematização dos indicadores e fontes de informações

disponíveis, mas apresenta algumas limitações importantes. Em primeiro lugar, o capítulo
não esgota todas as possibilidades de indicadores existentes na área da saúde, mas
procurou focar nos que são mais utilizados e que as bases de dados disponíveis no Brasil
permitem mensuração de forma sistemática. Em segundo lugar, foge do escopo desse
capítulo a discussão sobre tratamento dos indicadores, como por exemplo, padronização
por sexo e idade, suavização de séries e uso das informações para eventos raros e
pequenas áreas.

109
Referências
ABREU, D. M. X. D.; CÉSAR, C. C.; FRANÇA, E. B. Relação entre as causas de morte

evitáveis por atenção à saúde e a implementação do Sistema Único de Saúde no Brasil.
Revista Panamericana de Salud Pública, v. 21, n. 5, p. 282-291, 2007.
ALFRADIQUE, M. E. et al. Internações por condições sensíveis à atenção primária: a

construção da lista brasileira como ferramenta para medir o desempenho do sistema de
saúde (Projeto ICSAP-Brasil). Cadernos de Saúde Pública, v. 25, n. 6, p. 1337-1349,
2009.
ANDRADE, M. V. A saúde na PNAD. Belo Horizonte: UFMG/ Centro de Desenvolvimento

e Planejamento Regional, 2002. 31p. (Texto para Discussão, 170).
ANDRADE, M. V. et al. Desigualdade socioeconômica no acesso aos serviços de saúde

no Brasil: um estudo comparativo entre as regiões brasileiras em 1998 e 2008. Economia
Aplicada, v. 17, n. 4, p. 623-645, 2013.
ANDRADE, M. V. et al. A equidade na cobertura da Estratégia Saúde da Família em

Minas Gerais, Brasil. Cadernos de Saúde Pública, v. 31, n. 6, p. 1175-1187, jun. 2015.
ARAÚJO, G. K. N. D. et al. Capacidade funcional e fatores associados em idosos

residentes em comunidade. Acta Paulista de Enfermagem, v. 32, n. 3, p. 312-318, 2019.
ASADA, Y.; KEPHART, G. Equity in health services use and intensity of use in Canada.
BMC Health Services Research, v. 7, n. 41, p. 1-12, 2007.
BARROS, M. B. D. A. et al. Depressão e comportamentos de saúde em adultos

brasileiros–PNS 2013. Revista de Saúde Pública, v. 51, p. 1-10, 2017. Supl. 1.
BATISTELLA, C. Abordagens contemporâneas do conceito de saúde. In: FONSECA, A.

F.; CORBO, A. D. (org.). O território e o processo saúde-doença. Rio de Janeiro:
EPSJV/Fiocruz, 2007. p. 51-86.
BERLEZI, E. M. et al. Como está a capacidade funcional de idosos residentes em

comunidades com taxa de envelhecimento populacional acelerado? Revista Brasileira
de Geriatria e Gerontologia, v. 19, n. 4, p. 643-652, 2016.
BITTENCOURT, S. D. D. A.; DIAS, M. A. B.; WAKIMOTO, M. D. (org.). Vigilância do

óbito materno, infantil e fetal e atuação em comitês de mortalidade. Rio de Janeiro:
EAD/Ensp/ Fiocruz, 2013. 268 p.
BJÖRNTORP, P. E. R. Body fat distribution, insulin resistance, and metabolic diseases.

Nutrition, v. 13, n. 9, p. 795-803, 1997.
BOMFIM, W. C.; CAMARGOS, M. C. S. Mudanças na expectativa de vida no Brasil:

analisando o passado e o futuro, de 1950 a 2095. Revista NUPEM, v. 13, n. 29, p. 210-
223, 2021.
BORGES, G. M. Health transition in Brazil: regional variations and

divergence/convergence in mortality. Cadernos de Saúde Pública, v. 33, n. 8, p. 1-15,
2017.

BOTEGA, L. A. Três ensaios sobre o desempenho do setor hospitalar do Sistema
Único de Saúde do Brasil. 2020. Tese (Doutorado) - Faculdade de Ciências
Econômicas, Universidade Federal de Minas Gerais, Belo Horizonte, 2020.
BRASIL. Ministério da Saúde. Agência Nacional de Saúde de Suplementar. A agência

reguladora do setor de planos de saúde do Brasil. Brasília, DF: Ministério da Saúde,
[1999]. Disponível em: https://www.gov.br/ans/pt-br. Acesso em: 28 maio 2022.
BRASIL. Ministério da Saúde. A vigilância, o controle e a prevenção das doenças

crônicas não-transmissíveis: DCNT no contexto do Sistema Único de Saúde brasileiro.
Brasília, DF: OPAS, 2005. 80p.
BRASIL. Ministério da Saúde. Secretaria de Vigilância em Saúde. Departamento de

Vigilância Epidemiológica. Sistema de Informação de Agravos de Notificação – Sinan:
normas e rotinas. 2. ed. Brasília, DF: Ministério da Saúde, 2007a. 68p. (Série A. Normas e
Manuais Técnicos).
BRASIL. Ministério da Saúde. Secretaria de Atenção à Saúde. Departamento de

Regulação, Avaliação e Controle. Manual técnico do sistema de informação
hospitalar. Brasília, DF: Ministério da Saúde, 2007b. 198p. (Série A. Normas e Manuais
Técnicos).
BRASIL. Ministério da Saúde. Centro Brasileiro de Análise e Planejamento. Pesquisa

Nacional de Demografia e Saúde da Criança e da Mulher – PNDS 2006: dimensões do
processo reprodutivo e da saúde da criança. Brasília, DF: Ministério da Saúde, 2009a.
300p. (Série G. Estatística e Informação em Saúde).
BRASIL. Ministério da Saúde. Secretaria-Executiva. Departamento de Informática do

Sistema Único de Saúde. Sistema de Cadastro Nacional de Estabelecimentos de
Saúde: manual de operação. Brasília, DF: Ministério da Saúde, 2009b. 412p.
BRASIL. Ministério da Saúde. Secretaria de Atenção à Saúde. Departamento de

Regulação, Avaliação e Controle. Coordenação Geral de Sistemas de Informação.
Manual técnico operacional SIA/SUS - Sistema de Informações Ambulatoriais.
Brasília, DF: Ministério da Saúde, 2010. 69p.

Análise de Situação de Saúde. Manual de instruções para o preenchimento da
Declaração de Óbito. Brasília, DF: Ministério da Saúde, 2011a. 54p. (Série A. Normas e
Manuais Técnicos).

Análise de Situação de Saúde. Manual de instruções para o preenchimento da
Declaração de Nascido Vivo. Brasília, DF: Ministério da Saúde, 2011b. 28p. (Série A.
Normas e Manuais Técnicos).

Vigilância de Doenças e Agravos não Transmissíveis e Promoção da Saúde. Saúde
Brasil 2017: uma análise da situação de saúde e os desafios para o alcance dos
objetivos de desenvolvimento sustentável. Brasília, DF: Ministério da Saúde, 2018. 426p.

111
BRASIL. Coordenação Geral de Informações e Análises Epidemiológicas. Departamento
de Análise Epidemiológica e Vigilância de Doenças Não Transmissíveis. Sistema de
Informação sobre Mortalidade - SIM. Brasília, DF: Secretaria de Vigilância em Saúde,
[2019]. Disponível em: http://svs.aids.gov.br/dantps/cgiae/sim. Acesso em: 24 maio 2022.

Análise em Saúde e Vigilância de Doenças Não Transmissíveis. Vigitel Brasil 2020:
vigilância de fatores de risco e proteção para doenças crônicas por inquérito telefônico:
estimativas sobre frequência e distribuição sociodemográfica de fatores de risco e
proteção para doenças crônicas nas capitais dos 26 estados brasileiros e no Distrito
Federal em 2020. Brasília, DF: Ministério da Saúde, 2021a. 124p.
BRASIL. Ministério da Saúde. Secretaria-Executiva. Departamento de Economia da

Saúde, Investimentos e desenvolvimento. Cartilha de orientação SIOPS. Brasília, DF:
Ministério da Saúde, 2021b. 169p.
BRASIL. Ministério da Saúde. Secretaria de Vigilância em Saúde. Mortalidade materna no

Brasil, 2009-2019. Boletim Epidemiológico, v. 52, n. 29, p. 13-24, ago. 2021c.
CALAZANS, J. A.; QUEIROZ, B. L. The adult mortality profile by cause of death in 10 Latin
American countries (2000–2016). Revista Panamericana de Salud Publica, v. 44, p. 1-9,
2020.
CARNUT, L.; NARVAI, P. C. Avaliação de desempenho de sistemas de saúde e

gerencialismo na gestão pública brasileira. Saúde e Sociedade, v. 25, n. 2, p. 290-305,
2016.
CARVALHO, L. R.; ANDRADE, M. V.; AMARAL, P. V. M. Avaliação dos parâmetros de

oferta mínimos para os leitos SUS no Brasil em 2015. Planejamento e Políticas
Públicas, n. 58, p. 11-32, abr./jun., 2021.
CASTRO, M. C. et al. Brazil's unified health system: the first 30 years and prospects for
the future. The Lancet, v. 394, n. 10195, p. 345-356, 2019.
CERVI, A.; FRANCESCHINI, S. D. C. C.; PRIORE, S. E. Análise crítica do uso do índice

de massa corporal para idosos. Revista de Nutrição, v. 18, n. 6, p. 765-775, dez. 2005.
CORRÊA, E. R. P.; MIRANDA-RIBEIRO, A. D. Ganhos em expectativa de vida ao nascer

no Brasil nos anos 2000: impacto das variações da mortalidade por idade e causas de
morte. Ciência & Saúde Coletiva, v. 22, n. 3, p. 1007-1017, 2017.
CRUZ, L. N. Medidas de qualidade de vida e utilidade em uma amostra da população

de Porto Alegre. 2010. Tese (Doutorado) – Faculdade de Medicina, Universidade Federal
do Rio Grande do Sul, Porto Alegre, 2010.
DOMINGUES, R. M. S. M. et al. Sífilis congênita: evento sentinela da qualidade da

assistência pré-natal. Revista de Saúde pública, v. 47, n. 1, p. 147-157, 2013.
DUARTE, E. C.; BARRETO, S. M. Transição demográfica e epidemiológica: a

epidemiologia e serviços de saúde revisita e atualiza o tema. Epidemiologia e Serviços
de Saúde, v. 21, n. 4, p. 529-532, out./dez. 2012.

ELSA-BRASIL. Estudo Longitudinal de Saúde do Adulto: a geração de conhecimento
científico sobre doenças crônicas no país. [2000]. Disponível em:
http://www.elsa.org.br/oelsabrasil.html. Acesso em: 22 jan. 2022.
ELSI-BRASIL. Estudo Longitudinal de Saúde dos Idosos Brasileiros.

c2015.Disponível em: http://elsi.cpqrr.fiocruz.br/. Acesso em: 22 jan. 2022.
FRIAS, P. G. D. et al. Avaliação da adequação das informações de mortalidade e

nascidos vivos no Estado de Pernambuco, Brasil. Cadernos de Saúde Pública, v. 26, n.
4, p. 671-681, 2010.
GUERRA, F.; FÍGOLI, M. B. G. Esperança de vida e sua relação com indicadores de

longevidade: um estudo demográfico para o Brasil, 1980-2050. Revista Brasileira de
Estudos de População, v. 30, S85-S102, 2013. Supl.
HAAGSMA, J. A. et al. Assessing disability weights based on the responses of 30,660

people from four European countries. Population Health Metrics, v. 13, n. 10, p. 1-15,
2015.
HAKIM, C. Research based on administrative records. The Sociological Review, v. 31, n.

3, p. 489-519, 1983.
HAWTHORNE, G.; RICHARDSON, J. R. J.; DAY, N. A comparison of five multi

attribute utility instruments. Melbourne: Monash University, Centre for Health Program
Evaluation, 2003.
IBGE. Coordenação de População e Indicadores Sociais. Pesquisa nacional de saúde

do escolar: 2019. Rio de Janeiro: IBGE, 2021a. 162p.
IBGE. Tábuas completas de mortalidade para o Brasil 2020. Rio de Janeiro: IBGE,
2021b. (Nota técnica n. 01/2021). Disponível em:
https://static.poder360.com.br/2021/11/nota-tecnica-tabuas-de-mortalidade.pdf. Acesso
em: 8 set. 2022.
IBGE. Séries estatísticas. Rio de Janeiro: IBGE, [1999.]. Disponível em:

https://seriesestatisticas.ibge.gov.br/default.aspx. Acesso em: 25 maio 2022.
JANNUZZI, P. D. M. Indicadores sociais no Brasil: conceitos, fontes de dados e

aplicações. 6. ed. rev. e amp. Campinas: Alínea, 2017.
KANSO, S. et al. A evitabilidade de óbitos entre idosos em São Paulo, Brasil: análise das
principais causas de morte. Cadernos de Saúde Pública, v. 29, n. 4, p. 735-748, abr.
2013.
KROENKE, K.; SPITZER, R. L. The PHQ-9: a new depression diagnostic and severity
measure. Psychiatric Annals, v. 32, n. 9, p. 509-515, 2002.
La FORGIA, G. M.; COUTTOLENC, B. F. Hospital performance in Brazil: the search for

excellence. Washington, DC: World Bank, 2008. Disponível em:
https://documents1.worldbank.org/curated/en/815061468015870054/pdf/448330PUB0Box
3101official0use0only1.pdf. Acesso em: 8 set. 2020.

113
LAGUARDIA, J. et al. Sistema de informação de agravos de notificação em saúde
(Sinan): desafios no desenvolvimento de um sistema de informação em saúde.
Epidemiologia e Serviços de Saúde, v. 13, n. 3, p. 135-146, 2004.
LANSKY, S.; FRANÇA, E.; LEAL, M. D. C. Mortalidade perinatal e evitabilidade: revisão

da literatura. Revista de Saúde Pública, v. 36, n. 6, p. 759-772, dez. 2002.
LEAL, M. D. C. et al. Saúde reprodutiva, materna, neonatal e infantil nos 30 anos do

Sistema Único de Saúde (SUS). Ciência & Saúde Coletiva, v. 23, n. 6, p. 1915-1928, jun.
2018.
LEBRÃO, M. L.; DUARTE, Y. A. SABE-saúde, bem-estar e envelhecimento, o Projeto

Sabe no município de São Paulo: uma abordagem inicial. Brasília, DF: OPAS, 2003.
LEBRÃO, M. L. O envelhecimento no Brasil: aspectos da transição demográfica e

epidemiológica. Saúde Coletiva, v. 4, n. 17, p. 135-140, 2007.
LEBRÃO, M. L. et al. 10 Anos do Estudo SABE: antecedentes, metodologia e organização

do estudo. Revista Brasileira de Epidemiologia, v. 21, p. 1-21, 2019. Supl. 2.
MACINKO, J.; LIMA-COSTA, M. F. Horizontal equity in health care utilization in Brazil,

1998–2008. International Journal for Equity in Health, v. 11, n. 1, p. 1-8, 2012.
MALTA, D. C. et al. Inquéritos Nacionais de Saúde: experiência acumulada e proposta

para o inquérito de saúde brasileiro. Revista Brasileira de Epidemiologia, v. 11, p.
159-167, 2008. Supl. 1.
MALTA, D. C. et al. Atualização da lista de causas de mortes evitáveis por intervenções

do Sistema Único de Saúde do Brasil. Epidemiologia e Serviços de Saúde, v. 19, n. 2,
p. 173-176, abr./jun. 2010a.
MALTA, D. C. et al. Mortes evitáveis em menores de um ano, Brasil, 1997 a 2006:

contribuições para a avaliação de desempenho do Sistema Único de Saúde. Cadernos
de Saúde Pública, v. 26, n. 3, p. 481-491, mar. 2010b.
MALTA, D. C.; SILVA JUNIOR, J. B. D. O plano de ações estratégicas para o

enfrentamento das doenças crônicas não transmissíveis no Brasil e a definição das metas
globais para o enfrentamento dessas doenças até 2025: uma revisão. Epidemiologia e
Serviços de Saúde, v. 22, n. 1, p. 151-164, jan./mar. 2013.
MARINHO, A.; CARDOSO, S. D. S.; ALMEIDA, V. V. D. Avaliação comparativa de

sistemas de saúde com a utilização de fronteiras estocásticas: Brasil e OCDE. Revista
Brasileira de Economia, v. 66, n. 1, p. 3-19, mar. 2012.
MARINHO, A.; CARDOSO, S. D. S.; ALMEIDA, V. V. D. Avaliação comparativa dos

sistemas de saúde do Brasil e de países da América Latina, do Caribe, e da OCDE com o
uso de fronteiras estocásticas. Economia Aplicada, v. 24, n. 2, p. 195-214, 2020.
MARTELLI, C. M. T. et al. Economic impact of dengue: multicenter study across four

Brazilian regions. PLoS Neglected Tropical Diseases, v. 9, n. 9, p. 1-19, 2015.
MARTINS, I. S.; MARINHO, S. P. O potencial diagnóstico dos indicadores da obesidade

centralizada. Revista de Saúde Pública, v. 37, n. 6, p. 760-767, dez. 2003.

MARTINS, I. P. M.; NAKAMURA, C. Y.; CARVALHO, D. R. Variáveis associadas à
mortalidade materna e infantil: uma revisão integrativa. Revista de Atenção à Saúde, v.
18, n. 64, p. 145-165, abr./jun. 2020.
MEDEIROS, M. Medidas de desigualdade e pobreza. Brasília, DF: Editora Universidade

de Brasília, DF, 2012.
MENDES, E. V. As redes de atenção à saúde: Belo Horizonte: Escola de Saúde Pública

de Minas Gerais, 2009.
NATIONAL RESEARCH COUNCIL. Cells and surveys: should biological measures be

included in social science research? Washington, DC: National Academy Press, 2000.
NORONHA, K.; ANDRADE, M. V. Aspectos teóricos e metodológicos da relação entre

o estado de saúde e a desigualdade de renda. Belo Horizonte: Universidade Federal de
Minas Gerais/Centro de Desenvolvimento e Planejamento Regional, 2006. (Texto para
Discussão, 291).
NORONHA, K. V. M. D. S. et al. Pandemia por COVID-19 no Brasil: análise da demanda e

da oferta de leitos hospitalares e equipamentos de ventilação assistida segundo
diferentes cenários. Cadernos de Saúde Pública, v. 36, n. 6, p. p. 1-17, 2020.
O’DONNELL, O. et al. Analyzing health equity using household survey data: a guide
to techniques and their implementation. Washington, DC: World Bank, 2007. Disponível
em:https://openknowledge.worldbank.org/bitstream/handle/10986/6896/424800ISBN9780
11O FFICIAL0USE0ONLY10.pdf?sequence=1&isAllowed=y. Acesso em: 9 set. 2022.
OLIVEIRA, A. T. R. (org.). Sistemas de estatísticas vitais no Brasil: avanços,

perspectivas e desafios. Rio de Janeiro: IBGE, Coordenação de População e Indicadores
Sociais, 2018. 70p.
PAN AMERICAN HEALTH ORGANIZATION. Health indicators: conceptual and

operational considerations. Washington, DC: PAHO, 2018. Disponível em:
https://iris.paho.org/handle/10665.2/49056. Acesso em: 8 set. 2022.
PEREIRA, R. A.; SICHIERI, R.; MARINS, V. M. Razão cintura/quadril como preditor de

hipertensão arterial. Cadernos de Saúde Pública, v. 15, n. 2, p. 333-344, abr. 1999.
PITANGA, F. J. G.; LESSA, I. Associação entre indicadores antropométricos de

obesidade e risco coronariano em adultos na cidade de Salvador, Bahia, Brasil. Revista
Brasileira de Epidemiologia, v. 10, n. 2, p. 239-248, jun. 2007.
PORTO, S. M.; UGÁ, M. A. D.; MOREIRA, R. D. S. Uma análise da utilização de serviços

de saúde por sistema de financiamento: Brasil 1998-2008. Ciência & Saúde Coletiva, v.
16, n. 9, p. 3795-3806, set. 2011.
PRESTON, S. H.; HEUVELINE, P.; GUILLOT, M. Demography: measuring and modeling

population processes. New Jersey: Wiley-Blackwell, 2000.
QUEIROZ, B. L. et al. Completeness of death-count coverage and adult mortality (45q15)

for Brazilian states from 1980 to 2010. Revista Brasileira de Epidemiologia, v. 20, supl.
1, p. 21-33, 2017.

115
ROCHA, T. A. H. et al. Cadastro Nacional de Estabelecimentos de Saúde: evidências
sobre a confiabilidade dos dados. Ciência & Saúde Coletiva, v. 23, n. 1, p. 229-240, jan.
2018.
SAN MARTÍN, J. L. et al. The epidemiology of dengue in the Americas over the last three
decades: a worrisome reality. The American Journal of Tropical Medicine and
Hygiene, v. 82, n. 1, p. 128-135, Jan. 2010.
SANTOS, I. C. M. V. A iniquidade do financiamento nas aquisições de

medicamentos: gastos catastróficos e empobrecimento. 2015. Tese (Doutorado em
Economia) - Centro de Desenvolvimento e Planejamento Regional, Universidade Federal
de Minas Gerais, Belo Horizonte, 2015.
SANTOS, I. C. M.; ANDRADE, M. V.; NORONHA, K. Gastos catastróficos a partir da

aquisição de medicamentos das famílias. In: ENCONTRO NACIONAL DE ESTUDOS
POPULACIONAIS, 20., 2017. Anais [...] Rio de Janeiro: Associação Brasileira de
Estudos Populacionais (ABEP), 2017. p. 1-19. Disponível em:
http://www.abep.org.br/publicacoes/index.php/anais/article/view/2880/2748. Acesso em: 9
set. 2022.
SANTOS, M. et al. Guidelines for utility measurement for economic analysis: the brazilian
policy. Value in Health Regional Issues, v. 31, p. 67-73, 2022.
SCHMIDT, M. I. et al. Prevalência de diabetes e hipertensão no Brasil baseada em

inquérito de morbidade auto-referida, Brasil, 2006. Revista de Saúde Pública, v. 43, p.
74-82, 2009. Supl. 2.
SCHNEIDER, M. C. et al. Métodos de medición de las desigualdades de salud. Revista

Panamericana de Salud Pública, v. 12, n. 6, p. 398-415, 2002.
SCHRAMM, J. M. D. A. et al. Transição epidemiológica e o estudo de carga de doença no

Brasil. Ciência & Saúde Coletiva, v. 9, n. 4, p. 897-908, dez. 2004.
SEGRE, M.; FERRAZ, F. C. O conceito de saúde. Revista de Saúde Pública, v. 31, n. 5,

p. 538-542, out. 1997.
SENA, H. P. O manejo da hipertensão arterial sistêmica e da diabetes mellitus na

Unidade de Saúde Moreninha, município de Santa Helena-PR. 2017. Monografia
(Especialização) - Universidade Federal de Santa Catarina, Florianópolis, 2017.
SILVA, E. R. A.; PELIANO, A. M.; CHAVES, J. V. (coord.). Agenda 2030: ODS-Metas

nacionais dos objetivos de desenvolvimento sustentável. Brasília: IPEA, 2018. Disponível
em: http://repositorio.ipea.gov.br/bitstream/11058/8855/1/Agenda_2030_ods_metas_nac_
dos_obj_de_desenv_susten_propos_de_adequa.pdf. Acesso em: 9 set. 2022.
SILVA, Z. M. et al. Indicadores de saúde: obtenção e análise da situação de saúde.

Teresina: EDUFPI, 2020. 72p.
SOUSA, M. L. B.; MELO, C. A. Impacto da Política de Atenção Básica à Saúde na taxa de

mortalidade infantil nos municípios brasileiros. Revista Política Hoje, v. 22, n. 1, p. 250-
276, 2013.

SOUZA MELO, M. A. et al. Percepção dos profissionais de saúde sobre os fatores
associados à subnotificação no Sistema Nacional de Agravos de Notificação (Sinan).
Revista de Administração em Saúde, v. 18, n. 71, p. 1-17, 2018.
STEYN, K.; DAMASCENO, A. Lifestyle and related risk factors for chronic diseases. In:
JAMISON, D.T. et al. (org.). Disease and mortality in Sub-Saharan Africa. Washington,
DC: The World Bank, 2006. p. 247-65.
STRAUSS, J.; THOMAS, D. Health, nutrition, and economic development. Journal of

Economic Literature, v. 36, n. 2, p. 766-817, 1998.
SZWARCWALD, C. L. et al. Busca ativa de óbitos e nascimentos no Nordeste e na

Amazônia Legal: estimação das coberturas do SIM e do Sinasc nos municípios
brasileiros. In: BRASIL. Ministério da Saúde. Secretaria de Vigilância em Saúde.
Departamento de Análise de Situação em Saúde. Saúde Brasil 2010: uma análise da
situação de saúde e de evidências selecionadas de impacto de ações de vigilância em
saúde. Brasília: Ministério da Saúde, 2011. p. 79-98.
THE DHS Program Demografic ang Health Surveys. Rockville: DHS, [2018]. Disponível
em: https://dhsprogram.com/methodology/survey-search.cfm? sendsearch=1&str1=
49,&crt= 1&listgrp=0 . Acesso em: 22 jan. 2022.
TRAVASSOS, C.; VIACAVA, F.; LAGUARDIA, J. Os suplementos saúde na Pesquisa

Nacional por Amostra de Domicílios (PNAD) no Brasil. Revista Brasileira de
Epidemiologia, v. 11, p. 98-112, 2008. Supl. 1.
TRAVASSOS, C.; CASTRO, M. S. M. D. Determinantes e desigualdades sociais no

acesso e na utilização de serviços de saúde. In: GIOVANELLA, L. et al. (org.). Políticas e
sistema de saúde no Brasil. 2. ed. rev. e amp. Rio de Janeiro: Fiocruz, 2012.
VIACAVA, F. et al. Uma metodologia de avaliação do desempenho do sistema de saúde

brasileiro. Ciência & Saúde Coletiva, v. 9, n. 3, p. 711-724, 2004.
VIACAVA, F.; DACHS, N.; TRAVASSOS, C. Os inquéritos domiciliares e o Sistema

Nacional de Informações em Saúde. Ciência & Saúde Coletiva, v. 11, n. 4, p. 863-869,
2006.
VICTORA, C. G. et al. Maternal and child health in Brazil: progress and challenges. The
Lancet, v. 377, n. 9780, p. 1863-1876, 2011.
WORLD BANK. Um ajuste justo: análise da eficiência e equidade do gasto público no

Brasil: Brasil revisão das despesas públicas. Síntese. Washington, DC: World Bank, 2017.
v.1. Disponível em: https://documents1.worldbank.org/curated/en/884871511196609355/
/pdf/121480-REVISED-PORTUGUESE-Brazil-Public-Expenditure-Review-Overview-
Portuguese-Final-revised.pdf. Acesso em: 8 set. 2022.
WORLD HEALTH ORGANIZATION. Constitution of the World Health Organization.

American Journal of Public Health, v. 36, n. 11, p. 1315–1323, 1946. Disponível em:
https://ajph.aphapublications.org/doi/epdf/10.2105/AJPH.36.11.1315. Acesso em: 8 set.
2022.

117
WORLD HEALTH ORGANIZATION. Physical status: the use of and interpretation of
anthropometry. Report of a WHO Expert Committee. Geneva: WHO, 1995. (Technical
Series, 854). https://apps.who.int/iris/bitstream/handle/10665/37003/W?sequence=1.
WORLD HEALTH ORGANIZATION. ICD-10: International statistical classification of

diseases and related health problems. 10th rev. 5th edit. 2016. Geneva: WHO, 2016.
Disponível em:
https://icd.who.int/browse10/Content/statichtml/ICD10Volume2_en_2019.pdf. Acesso em:
8 set. 2022.
WORLD HEALTH ORGANIZATION. Everybody's business-strengthening health

systems to improve health outcomes: WHO's framework for action. Geneva: WHO,
2007. Disponível em: https://apps.who.int/iris/handle/10665/43918. Acesso em: 8 set.
2022.
WORLD HEALTH ORGANIZATION. WHO methods and data sources for global
burden of disease estimates 2000-2019. Geneva: WHO, 2020. (Global Health
Estimates Technical Paper WHO/ DDI/DNA/GHE/2020.3). Disponível em:
https://cdn.who.int/media/docs/default-source/gho-documents/global-health-
estimates/ghe2019_daly-methods.pdf?sfvrsn=31b25009_7. Acesso em: 8 set. 2022.

APÊNDICE A
Principais pesquisas domiciliares com informações sobre saúde no Brasil
informações de
Financiamento
Periodicidade
Abrangência
Tamanho da
Principais
Pesquisa
Objetivo
amostra
saúde
Ano
Nacional,
PNAD Conhecer as 112.434 grandes Estado de saúde,
1998, Ministério da
(Pesquisa características de domicílios/ regiões, cobertura privada Quinquenal
2003, Saúde / IBGE
Nacional por saúde da 344.975 Unidades da de saúde, acesso
2008
Amostra de população pessoas Federação e utilização de
Domicílio) (1998) (UF), regiões serviços de
133.255 metropolitanas saúde
domicílios/ e distrito
384.834 federal
pessoas
(2003)
150.591
domicílios/
391.868
pessoas
(2008)
Mensal
Cerca de Nacional e
PNAD COVID- 2020 Estimar o número Sintomas da (maio a Ministério da
193 mil grande
19 de pessoas com COVID-19 e nov.) / Saúde/ IBGE
domicílios regiões
sintomas da providências Semanal
por mês / 48
síndrome gripal e tomadas em (maio a
mil
monitorar os relação aos setembro)
domicílios
impactos da sintomas
por semana
pandemia da
COVID-19 no
mercado de
trabalho
Coletar 81.357
PNS 2013, informações domicílios / Estado de saúde, Quinquenal Ministério da
(Pesquisa 2019 sobre o 64.348 hábitos de vida, Saúde/IBGE/
Nacional de desempenho do entrevistas cobertura privada Fiocruz
Nacional,
Saúde) sistema de saúde (2013) e utilização de
grandes
e condições de 108.525 serviços de
regiões e UF
saúde da domicílios / saúde
população 90.846
entrevistas
(2019)
Tamanho
VIGITEL Monitorar a
amostral Nacional, Ministério da
(Vigilância de frequência e a Estado de saúde, Anual
mínimo de capitais e Saúde/
Fatores de 2006- distribuição de hábitos de vida,
2.000 distrito federal Secretaria de
Risco e 2020 fatores de risco e excesso de peso
adultos (18 Vigilância em
Proteção para proteção para e obesidade
anos ou Saúde
Doenças Doenças
mais) por
Crônicas por Crônicas em
cidade
Inquérito todas as capitais
Telefônico)
1987- Avaliar perfil das Nacional, Despesas com Desde Ministério da
POF
2018 condições de 48.470 grandes saúde, peso e 1995 a Saúde/IBGE

119
(Pesquisa de vida da domicílios regiões e altura (2002-2003 cada 6-7
Orçamentos população a (2002-2003) urbana/ rural e 2008-2009) e anos
Familiares) partir da análise 55.970 hábitos de
dos orçamentos domicílios alimentação
domésticos (2008-2009)
57.920
domicílios
(2017-2018)
Examinar a Ministério da
ELSI-Brasil* dinâmica do Comportamentos Eventual Saúde /
2015- 9.412 Nacional e
(Estudo envelhecimento em saúde, saúde Ministério da
2016 indivíduos grandes
Longitudinal da da população, geral e doenças Ciência,
com 50 anos regiões
Saúde dos seus e uso de serviços Tecnologia,
ou mais
Idosos) determinantes e de saúde Inovações e
a demanda pelos Comunicação
sistemas sociais (Fiocruz-MG /
e de saúde. UFMG)
2.143 idosos
(2000) Estado de saúde, Universidade
SABE †
2000, Avaliar as
1.413 idosos uso e acesso a de
(Saúde, bem- 2006, condições de Cidade de Eventual
(2006) serviços de Wisconsin-
estar e 2010 vida e saúde das São Paulo
saúde, medidas Madison /
envelhecimento) pessoas idosas
antropométricas OPAS /
1.334 idosos e testes FAPESP /
(2010) funcionais, Ministério da
qualidade de vida Saúde/
e exame da OPAS / USP
cavidade bucal
15.105 Contatos
ELSA Investigar Instituições Ministério da
2008- servidores/as Histórico médico, telefônicos
(Estudo doenças crônicas das regiões Saúde /
2010; de hábitos de vida e anuais com
Longitudinal de e fatores sul, sudeste e Secretaria de
2012- instituições realização de re-exames
Saúde do biológicos, nordeste Ciência,
2014; públicas de exames clínicos e
Adulto) comportamentais, (Fundação Tecnologia e
2017- ensino entrevistas
ambientais, Oswaldo Cruz Insumos
2019 superior e a cada 3-4
ocupacionais e / USP / UFBA Estratégicos /
pesquisa anos
sociais / UFES / Ministério de
com idade
UFMG / Ciência,
entre 35 e 74
UFRGS) Tecnologia e
anos
Inovação /
Decit / CNPq
/ FINEP/
Fiocruz-RJ /
USP / UFBA /
UFES /
UFMG /
UFRGS
PNDS (DHS 1986, Nacional e por Saúde sexual e Eventual Ministério da

Brasil)‡ 1991, Descrever o perfil 5.892 UF. Em 1991, reprodutiva, Saúde/ IBGE
(Pesquisa 1996, da população mulheres / a pesquisa foi saúde da criança, / BEMFAM /
Nacional de 2006 feminina em 1.132 realizada medidas CEBRAP /
Demografia e idade fértil (15-49 crianças somente no antropométricas UNICAMP /
Saúde da anos) e das (1986) NE e coleta de USP / Ibope /
Criança e da crianças menores 6.222 sangue DHS Macro
Mulher) de cinco anos mulheres / International
materno-infantil. 1.266 Inc / UNFPA /
maridos / UNICEF /
3.392 USAID)
crianças
(1991)

12.612
mulheres /
2.949
maridos /
4.782
crianças
(1996)
Cerca de
15.000
mulheres/
5.000
crianças
(2006)
1.453
escolas /
63.411
estudantes
(2009)
2.842
escolas /
109.104
Conhecer e
estudantes Ministério da
dimensionar os
PeNSE§ (2012) Nacional, Fatores de risco Eventual Saúde (IBGE
2009, fatores de risco e
(Pesquisa 9º ano: 3.160 grandes comportamentais, / Ministério
2012, proteção à saúde
Nacional de escolas / regiões, saúde sexual e da
2015, dos adolescentes
Saúde do 102.072 capitais e reprodutiva e Educação)
2019 (9º ano do ensino
Escolar) estudantes e distrito federal saúde mental
fundamental e
13 a 17
escolares de 13 a
anos: 380
17 anos de idade
escolas /
a partir de 2015)
10.926
estudantes
(2015)
4.242
escolas /
125.123
estudantes
(2019)
Notas: * Elsi-Brasil é comparável internacionalmente aos estudos Health and Retirement Family of Studies,
realizados em diversos países da Europa e Ásia, nos EUA, México, Costa Rica, Nova Zelândia, África do Sul
e Gana.
†
SABE é comparável internacionalmente às pesquisas realizadas em Bridgetown (Barbados); Buenos Aires
(Argentina); Santiago (Chile); Havana (Cuba); Cidade do México (México) e Montevidéu (Uruguai).
‡
PNDS é comparável internacionalmente ao projeto Measure DHS (Demographic and Health Survey, que
tem apoio da Agência dos Estados Unidos para o Desenvolvimento Internacional (USAID) e parceria de várias
instituições internacionais.
§
PeNSE é comparável internacionalmente ao Global School-based Student Health Survey (GSHS) da OMS,
realizada com escolares de 13 a 17 anos.

121
APÊNDICE B
Principais registros administrativos de saúde no Brasil
Ano/ Principais
Registro Alimentação do
Periodicid Objetivo Abrangência informações de
Administrativo sistema
ade saúde
Registros Administrativos do Ministério da Saúde
Declaração de
Local de residência e
SIM Desde Óbito (DO)
Coletar dados Nacional, ocorrência do óbito;
(Sistema de 1975 / preenchidas pelas
sobre grandes regiões, óbitos fetais e não
Informação mensal e unidades
mortalidade UF e municípios fetais; condições e
sobre anual notificantes do
causas do óbito
Mortalidade) óbito
Declaração de
SINASC Desde Coletar dados Nascido Vivo Local e data do
(Sistema de 1990 / epidemiológicos (DN), preenchida Nacional, nascimento,
Informações mensal e referentes aos pelos profissionais grandes regiões, informações da
sobre Nascidos anual nascidos vivos da saúde ou UF e municípios gravidez e parto e do
Vivos) parteiras recém-nascido
tradicionais
autorizadas
Coletados pela
SINAN Ficha Individual de
Desde Registrar e Período e local da
(Sistema de Notificação (FIN) e
1990 / processar os Nacional, notificação e/ou
Informação de pela Ficha
mensal e dados sobre grandes regiões, agravo
Agravos de Individual de
anual agravos de UF e municípios
Notificação) Investigação (FII),
notificação
preenchidas pelas
compulsória
unidades
assistenciais para
cada paciente
Autorização de
Nacional,
Internação
SIH Desde Registrar grandes regiões, Informações da
Hospitalar (AIH)
(Sistema de 1981 / internações UF e municípios hospitalização; valor
preenchida pelo
Informações mensal e hospitalares e das AIH;
hospital após a
Hospitalares) anual financiadas pelo estabelecimento procedimentos
alta hospitalar e
SUS s realizados na
enviada para a
internação
Secretaria de
Saúde municipal
ou estadual
O BPA (Boletim
de Produção
SIA Desde Nacional, UF, Dados do paciente,
Processamento Ambulatorial) é
(Sistema de 1992 / municípios e estabelecimento e
das informações preenchido pelo
Informações mensal e estabelecimento procedimentos
de atendimento estabelecimento
Ambulatoriais) anual s
ambulatorial de saúde. Nos
financiados pelo procedimentos de
SUS alta complexidade,
as informações
são coletadas
através da APAC
(Autorização de
Procedimentos de
Alta
Complexidade)

Preenchimento de
formulário em
SIOPS
Desde software
(Sistema de Consolidar Federal, estadual Despesas, receitas e
2000 / desenvolvido pelo
Informações informações de e municipal indicadores de
bimestral e DATASUS. As
sobre gasto público cumprimento dos
anual informações são
Orçamentos em saúde percentuais mínimos
transmitidas
Públicos em aplicados
eletronicamente
Saúde)
para o banco de
dados do sistema.
O SIOPS possui
um sistema
automático de
críticas e avisos
sobre prováveis
erros/inconsistênci
as de
preenchimento
Automatizar
CNES As secretarias de
todo o processo
(Cadastro saúde municipais
de coleta de Atendimento
Nacional de e estaduais
dados sobre a prestado,
Estabelecimento coletam as
Desde capacidade Nacional, UF, equipamentos,
s de Saúde) informações das
2000 / física, serviços municípios e serviços
unidades de
mensal e disponíveis, estabelecimento especializados,
saúde usando
anual profissionais e s instalações físicas,
formulários
equipes da ESF profissionais e
específicos,
vinculados aos equipes
consolidadas no
estabelecimento
nível nacional
s de saúde
Registros Administrativos da Agência Nacional de Saúde
As operadoras de
Beneficiários de
planos de saúde
Dados da ANS Fornecer planos privados de
fornecem Nacional,
(Agência panorama da saúde, operadoras
Desde periodicamente à grandes regiões,
Nacional de evolução do de planos privados
2003 / ANS informações UF, capital,
Saúde) setor de saúde de saúde, dados
trimestral e cadastrais, interior, região
suplementar, financeiros,
anual gerenciais, metropolitana
gerando mais assistenciais e
demonstrativos e
transparência ressarcimentos ao
informações
das informações SUS
gerais
Padronizar a As operadoras
Conteúdo e
TISS troca de precisam enviar
estrutura, 2)
(Troca de informações mensalmente Nacional, UF
2007 / Representação de
Informações na entre informações como
mensal conceito em saúde,
Saúde operadoras de demonstrativos de
3) Comunicação, 4)
Suplementar) planos de saúde pagamento, de
Segurança e 5)
e prestadores análise de contas
Organizacional
de serviços de e recursos de
saúde sobre os glosa
procedimentos
realizados

123
PARTE 2:
FUNDAMENTOS LÓGICOS
E CONCEITUAIS

Capítulo 4
Avaliação de impacto de políticas

públicas: racionalidade, fundamentos
lógicos e experiências das políticas
sociais
Naercio Menezes Filho1

Bruno Kawaoka Komatsu2
1
Cátedra Ruth Cardoso do Insper, Faculdade de Administração, Economia e
Contabilidade da Universidade de São Paulo e Academia Brasileira de Ciências.
2
Cátedra Ruth Cardoso do Insper.
RESUMO:
Neste capítulo, o objetivo é colocar os conceitos fundamentais para o entendimento do que é uma
avaliação de impacto e fazer um panorama da literatura empírica sobre avaliação de políticas sociais
no Brasil. Em primeiro lugar, será introduzida brevemente a noção de avaliação de impacto e se
discutirá o que é uma avaliação, quais são seus fundamentos e elementos centrais e quais são os
motivos para fazê-la. Além disso, para mostrar o desenvolvimento dessa literatura no Brasil, será
elaborado um levantamento de estudos empíricos que realizaram avaliações de impacto utilizando
alguma das metodologias discutidas neste livro, as quais permitem isolar o efeito causal a partir de
hipóteses de identificação. O foco será o levantamento de políticas sociais direcionadas à educação
e ao mercado de trabalho e políticas federais de transferência de renda; serão interpretados os fatos
estilizados e conclusões obtidas.
PALAVRAS-CHAVE:
Avaliação de impacto. Conceitos. Efeito causal.

125
1 Introdução e objetivos
Este capítulo caracteriza o que são avaliações de programas sociais que utilizam dados
quantitativos e discute brevemente sua relevância e os fundamentos lógicos que sustentam
a sua realização. Mostra também o desenvolvimento da literatura de avaliação ao trazer
um levantamento de trabalhos que utilizam metodologias discutidas neste livro e que
permitem isolar o efeito causal dos programas sociais analisados a partir de algumas
hipóteses de identificação. Realizou-se levantamento cujo foco são três das principais
políticas públicas das áreas de transferência de renda, educação e mercado de trabalho.
Grandes quantidades de recursos públicos são alocadas em políticas públicas e programas

sociais, em todos os anos e nas três esferas de governo, em meio a demandas crescentes
da sociedade por diversos tipos de serviços e assistências. Os recursos públicos para a
implementação de programas sociais no Brasil, além disso, são limitados e se tornaram
ainda mais escassos em anos recentes, devido aos reflexos da pandemia da Covid-19
(ECLAC, 2020a, 2020b). Em situações como essas, líderes e gestores públicos devem
tomar decisões fundamentais que afetam o bem-estar da população e responder a
questões como: quais são os programas que devem continuar recebendo recursos e ser
expandidos? E quais deveriam receber menos recursos ou serem encerrados?
Avaliações de impacto de programas sociais podem justamente trazer evidências que

contribuam para a tomada de decisões com critérios claros, as quais são fundamentalmente
medidas do quanto aqueles programas foram capazes de modificar resultados de interesse
em algum grupo de referência (pessoas abrangidas pelos programas ou a população no
geral).1 A característica específica de uma avaliação de impacto é seu foco no efeito causal
do programa em análise sobre os resultados de interesse – isolando-o dos efeitos dos
outros fatores por meio de metodologias experimentais ou quase experimentais – e
responde a duas questões centrais: se o programa teve algum efeito causal sobre os
resultados de interesse e de quanto foi a magnitude de desses efeitos.
Para além do interesse acadêmico sobre os impactos de programas específicos, as
avaliações de impacto – juntamente com informações sobre o custo dos programas –
permitem calcular quanto cada benefício é gerado pelo programa analisado para cada
unidade de custo, ou seja, para cada R$ 1 gasto. Esses dados trazem duas informações
relevantes para a tomada de decisões: quais programas valem o seu custo, isto é, dos
1
Políticas públicas voltadas à área da saúde, por exemplo, podem ser avaliadas em relação a seus efeitos
sobre indicadores como aqueles descritos no capítulo 3 deste livro.

programas que geram benefícios quais superam os seus custos e, quando se comparam
programas com objetivos semelhantes, quais entregam o maior benefício para o mesmo
custo.
Podem-se se usar evidências como essas para a tomada de decisões. Por exemplo,
poderiam ser ampliados os programas cujos benefícios superam seus custos e que
entregam mais benefícios do que programas alternativos para cada unidade de custo,
enquanto poderiam ser reduzidos ou substituídos os que trazem menos benefícios do que
seus custos. As avaliações podem ajudar também a se decidir sobre a manutenção de
inovações de desenho de programa ou formas alternativas de se implementá-lo.
Nesse sentido, as avaliações de impacto fazem parte de uma estrutura mais ampla de
implementação de políticas públicas baseadas em evidências (PPBE), com o objetivo de
melhorar a qualidade do gasto público, a qual tem sido incorporada ao processo de gestão
das políticas federais (BRASIL, 2018). As PPBE compõem um conjunto de análises e
procedimentos baseados no uso da melhor evidência disponível sobre os resultados de um
programa para guiar o processo de tomada de decisão política, com os objetivos de reduzir
gastos desnecessários, expandir programas inovadores e aumentar a transparência (PEW-
MACARTHUR, 2014).
2 Fundamentos da avaliação de políticas
Concretamente, como é possível avaliar os efeitos causais de um programa social?
Diversas metodologias para dados quantitativos, experimentais e quase experimentais

foram desenvolvidas para responder a essa questão e todas essas podem ser
compreendidas a partir do modelo de causalidade de Rubin (SEKHON, 2007) – também
chamado modelo de resultados potenciais. Nesta seção, esse modelo será brevemente
descrito.
Em primeiro lugar, chama-se programa social qualquer conjunto de ações integradas e

articuladas do governo para produzir e ofertar bens e serviços para a população (BRASIL,
2018). Um programa é desenhado com o objetivo de modificar um conjunto de resultados
de interesse em determinada magnitude por meio dos bens e serviços ofertados.

127
Normalmente os objetivos de um programa social são alinhados a objetivos coletivos,
definidos a partir da agregação de escolhas individuais (PAES DE BARROS; LIMA, 2016).
Os impactos de programas sociais são estudados a partir da noção de causalidade

associada à ação realizada por uma unidade de análise, para a qual gera um resultado. As
unidades podem ser, entre outras, indivíduos, famílias, empresas ou mesmo municípios e
estados, em determinado momento. Isso significa que o mesmo objeto físico, a exemplo de
uma família, é considerado uma unidade de análise diferente em instantes diferentes do
tempo.
Com programas sociais em mente, pode-se considerar dois tipos de ações: um mais ativo
– que é o de participar do programa em dado momento (o qual também se chama
tratamento) – e um mais passivo – que seria não participar do mesmo programa naquele
mesmo momento (o qual chamamos controle). Uma unidade de análise possui um resultado
possível que deriva de cada uma dessas ações. A esses chamamos resultados potenciais,
nome que se deve ao fato fundamental de que – em determinado momento posterior à
realização da ação – somente o resultado potencial associado à ação realizada será
concretizado e somente será possível observar esse resultado. Para maior precisão, para
cada unidade o tratamento será representado por uma variável que indica a participação
no programa social 𝑊𝑊, o qual assumirá o valor 1 quando houve participação e valor 0
quando não houve. Além disso, o resultado realizado de cada unidade será representado
pela variável numérica 𝑌𝑌 e os resultados potenciais por 𝑌𝑌! – quando houve participação –
e por 𝑌𝑌" – quando não houve.
O efeito causal do programa deriva-se da comparação entre os resultados potenciais

ligados à participação e à não participação. Para uma unidade de análise, o efeito causal
do programa é definido como: 𝑌𝑌! − 𝑌𝑌" . Isso significa que para se calcular o efeito do
programa para uma unidade de análise participante seria preciso comparar o valor do
resultado observado com o resultado no cenário contrafactual que teria ocorrido caso essa
não tivesse participado.
O resultado contrafactual, no entanto, não pode ser observado. Dessa forma, quando se
quer estimar o efeito causal do programa, o problema central é o de que não é possível
observar os dois potenciais resultados simultaneamente, fato também chamado problema
fundamental da inferência causal. De outra forma, faltam dados (do inglês missing data) e

como somente se pode realizar estimações com dados observados, é preciso prever ou
imputar o resultado contrafactual a partir dos dados observados de outras unidades.
Quando se trabalha com várias unidades de análise, no entanto, a comparação de

resultados potenciais é mais complexa, uma vez que o resultado potencial de cada unidade
poderia ser alterado por cada ação das demais unidades. Para possibilitar a estimativa do
efeito causal do programa com dados observados de várias unidades de forma crível, é
preciso que os dados atendam a hipóteses conhecidas como hipóteses de estabilidade de
valor da unidade de tratamento (do inglês stable unit treatment value assumption ou
SUTVA). Essas hipóteses são externas aos dados, no sentido de que não podem ser
verificadas com esses e sua justificativa demanda algum conhecimento prévio sobre o
comportamento e as características da população analisada. Há duas hipóteses: i) de que
os resultados potenciais para qualquer unidade não variam com a atribuição para o
tratamento de outra unidade e ii) para cada unidade não há diferentes formas de tratamento
ou versões de cada nível de tratamento que leve a diferentes resultados potenciais. Há
vários motivos para que a primeira das hipóteses SUTVA não seja verdadeira. Por exemplo,
em um programa para melhoria da qualidade da educação em algumas escolas
selecionadas, os alunos das escolas do grupo de controle (escolas observadas, mas que
não recebem o programa em si) podem saber que estão fora do programa, sentirem-se
desfavorecidos e mostrarem motivação competitiva para superarem as notas dos alunos
das escolas abrangidas pelo programa. Em alguns desses casos seria possível evitar a
violação da SUTVA por meio de um desenho da intervenção em grupos mais agregados.
Se os dados atenderem à SUTVA, a análise é simplificada, porém não fica isenta do

problema de dados faltantes. Então, como se pode realizar a análise na prática?
Em avaliações de impactos, normalmente há dois objetos de interesse, os quais são

parâmetros causais que se quer estimar: o efeito médio do tratamento (do inglês average
treatment effect – ATE) e o efeito médio do tratamento entre os tratados (do inglês average
treatment effect on the treated – ATT ou ATET). O ATE representa o efeito causal médio
do programa na população, que seria a média das diferenças entre os resultados que teriam
sido observados no cenário em que todas as unidades da população participam do
programa e os resultados observados no cenário em que nenhuma unidade da população
participa do programa. O ATT representa o efeito causal médio entre os que participaram
do programa – a média da diferença entre os resultados dos tratados e os resultados que

129
teriam sido observados entre os tratados – caso esses não tivessem participado do
programa. Definem-se esses parâmetros como:
ATE = 𝐸𝐸(𝑌𝑌! − 𝑌𝑌" ) e ATT = 𝐸𝐸(𝑌𝑌! − 𝑌𝑌" |𝑊𝑊 = 1) (1)
onde o operador 𝐸𝐸(⋅) representa a média ou o valor esperado na população.
Na prática, para estimar esses parâmetros com dados observados, pode-se tentar estimar
o parâmetro da diferença de médias dos resultados observados. No entanto, há uma
diferença entre esse parâmetro e o ATE e o ATT, os quais são vieses introduzidos quando
os resultados potenciais possuem alguma associação com o tratamento. De outra forma,
se os resultados potenciais dos grupos tratados em média não são iguais, essa diferença
faz com que haja um viés.
Nesse ponto, fica claro que para haver capacidade de se estimar o ATE e o ATT sem viés,
precisa-se entender como o tratamento é atribuído às unidades, ou seja, é preciso saber
por que algumas unidades participam do programa e outras não. Essa forma de atribuição
do tratamento é chamada de mecanismo de seleção, de acordo com o qual é preciso usar
uma metodologia econométrica específica para se estimarem aqueles parâmetros. As
metodologias abordadas nesse livro lidarão com diferentes mecanismos, com hipóteses
específicas sobre os dados para a identificação dos efeitos dos programas.
3 Panorama de avaliações de impacto de políticas pública do Brasil
Nesta seção, breve panorama da literatura de avaliação de impacto de políticas será trazido
nas áreas de transferência de renda, educação e mercado de trabalho. Para cada área
selecionou-se um programa federal relevante e realizou-se o levantamento de artigos e
working papers que trazem avaliações de impacto. Utilizou-se como critério principal na
seleção daqueles estudos o uso de metodologias que realizam comparações explícitas
entre grupos de tratamento e de controle – ou de regressões que controlam por uma série
de variáveis – ou seja, exercícios empíricos que fazem a comparação entre os grupos
afetados ou não pela política, mantendo-se constantes uma série de características nos
dois grupos.2
2
Para mais detalhes sobre a metodologia da análise de regressão ver capítulo 21 desse livro.

3.1 Programa Bolsa Família
Entre as políticas de transferência de renda, realizou-se o levantamento de estudos

que avaliam o impacto do Programa Bolsa Família (PBF) – o maior programa de
transferência condicional de renda no Brasil e um dos maiores do mundo (NEVES et
al., 2020). As transferências chegaram a representar entre 0,4% e 0,5% do PIB
(FGV Social [...], [20-]; SOUZA, 2011) e no último mês de operação, outubro de
2021, o programa chegou a incluir 14,6 milhões de famílias (BRASIL, 2022).
Criado em 2003, 3 como parte do Plano Brasil sem Miséria, o PBF unificou a
gestão e a execução de programas federais de transferência de renda
anteriores,4 realizada pelo antigo Ministério do Desenvolvimento Social e Combate
à Fome (MDS). O PBF permaneceu em operação durante 18 anos e foi
substituído em 2021 pelo Auxílio Brasil, outro programa de transferência
condicional de renda.5
Para ter direito ao benefício do PBF, uma família deveria ser incluída pelos
governos municipais que aderiram ao programa no Cadastro Único (Cadúnico).
Além disso, o nível de renda familiar per capita das famílias deveria ser inferior à
linha de pobreza extrema do programa (R$ 89 em 2021) ou inferior à linha de
pobreza (R$ 178 em 2021)6 e incluir crianças e jovens de até 17 anos de idade,
nutrizes ou grávidas. As famílias incluídas como extremamente pobres receberiam
um benefício básico (de R$ 89 mensais em 2021). Além disso, todas as famílias
pobres ou extremamente pobres poderiam receber um benefício variável para
cada criança ou jovem de até 15 anos de idade, nutriz ou grávida, até o limite de
cinco benefícios por família (cada benefício de R$ 41 em 2021). A partir de 2008,
as famílias compostas por jovens de 16 ou 17 anos de idade poderiam ainda
receber um benefício variável para cada jovem (de R$ 48 em 2021), até o limite
de dois por família. A informação do Cadúnico era atualizada e verificada a cada
dois anos e as famílias poderiam sair do PBF caso recebessem transferências de
outros programas ou não mais se encaixassem no perfil do PBF.
3
O PBF foi criado por meio da Medida Provisória nº 132 e instituído em 2004 por meio da Lei nº 110.836 de
9 de janeiro de 2004. O programa foi posteriormente regulamentado por vários decretos ao longo dos anos.
4
O Programa de Renda Mínima vinculada à Educação (também chamado de Bolsa Escola Federal), o
Programa Nacional de Acesso à Alimentação (também chamado de Cartão Alimentação), o Programa
Nacional de Renda Mínima vinculado à Saúde (também chamado de Bolsa Alimentação), o Programa
Auxílio Gás e, a partir de 2005, também o Programa de Erradicação do Trabalho Infantil (PETI).
5
O PBF foi extinto em novembro de 2021 pelo Decreto nº 10.852 de 2021, que instituiu o Auxílio Brasil.
6
Os valores nominais das linhas de pobreza e pobreza extrema foram sendo atualizados ao longo dos
anos. Para valores até 2019, veja Neves et al. (2020, p. 5).

131
Para permanecerem no programa, as famílias deveriam cumprir condicionalidades
de educação e saúde para as crianças e grávidas, cujo objetivo de longo prazo era
o de permitir a geração de renda pelas crianças quando chegassem à fase adulta,
por meio do investimento em capital humano (TAVARES et al., 2009). As crianças e
jovens de até 17 anos de idade deveriam ser matriculados em escolas e manterem
a presença mínima de 85% para os jovens de até 15 anos e de 75% para os jovens
de 16 ou 17 anos. As crianças de até 7 anos deveriam ser levadas a postos de saúde
para as equipes de saúde acompanharem o desenvolvimento, manterem em dia as
vacinas recomendadas e terem o peso e altura medidas. As gestantes deveriam
realizar consultas pré-natais. Caso as famílias não cumprissem as condicionalidades,
o benefício poderia ser cancelado após a quinta ocorrência de descumprimento,
dentro de um período limitado.
Como o PBF não foi implementado com o planejamento de uma avaliação de

impacto randomizada,7 as avaliações dos seus impactos dependem de metodologias
quase experimentais, baseadas em particularidades do desenho do programa ou
que dependem diretamente da hipótese de seleção em observáveis. Há longa
literatura de avaliação sobre esse programa, a qual examina seus efeitos sobre
diversas dimensões do comportamento e bem-estar dos beneficiários e usa
metodologias e bases de dados variadas. Os estudos foram separados por áreas
temáticas nas subseções seguintes.
3.1.1 Pobreza e desigualdade de renda
Apesar de o objetivo principal do PBF ser o alívio imediato da pobreza e de haver

diversos estudos descritivos sobre a relação entre o PBF, a pobreza e a
desigualdade de renda (NEVES et al., 2020) há poucos estudos sobre o tema que
usam metodologias com grupos de controle. Desses, dois são relevantes e indicam
efeitos do PBF no sentido de reduzir a pobreza. Denes, Komatsu e Menezes-Filho
(2018) utilizam um painel de municípios e mostram que um aumento de R$ 1.000 no
valor do benefício per capita do PBF está associado a uma redução de 23 pontos
percentuais na taxa de pobreza. Os resultados sobre a desigualdade são menos
conclusivos porque dependem da medida de dispersão de renda utilizada.
Cavalcanti, Costa e Silva (2013) usam dados individuais e encontram efeitos no
7
Para discussão mais detalhada sobre metodologias experimentais, ver o capítulo 10 desse livro.

sentido de reduzir a probabilidade de ser pobre na região nordeste, porém esses
efeitos possuem baixas magnitudes.
3.1.2 Consumo
Outro ramo da literatura investiga como o PBF impacta o consumo e a nutrição das
famílias. O aumento da renda disponível pode aumentar o gasto de consumo das
famílias, porém, essa relação não é imediata, considerando-se que essas poderiam
alterar outros comportamentos, como a oferta de trabalho e a poupança. Além do
nível do consumo, o PBF poderia alterar sua composição, como o aumento da
aquisição de bens não essenciais e que não se relacionam com a redução da fome
ou desnutrição (OLIVEIRA et al., 2007).
A maioria dos estudos encontrados sobre os efeitos do PBF são relacionados ao

consumo usa dados das Pesquisas de Orçamentos Familiares (POF) do Instituto
Brasileiro de Geografia e Estatística (IBGE) e todos utilizam metodologias de
pareamento por escore de propensão (propensity score matching ou PSM).8 Apesar
de alguns estudos encontrarem efeitos negativos do PBF sobre o consumo no geral
ou em grupos específicos (OLIVEIRA et al., 2007; DUARTE; RODRIGUES, 2019),
os estudos têm encontrado mais efeitos no sentido de aumentar o consumo no geral,
especialmente com alimentos (DUARTE; SAMPAIO B.; SAMPAIO Y., 2009), alguns
deles por utilizarem metodologias com maior controle por características não
observáveis (KAMAKURA; MAZZON, 2015; ROCHA; MATTOS; COELHO, 2018;
ROCHA et al., 2016). Apesar do aumento de valores absolutos, alguns estudos
encontram redução da importância relativa dos gastos com alimentos (ROCHA;
MATTOS; COELHO, 2018; ROCHA et al., 2016).
Outro ramo da literatura avança e investiga os efeitos do PBF sobre a qualidade do

consumo alimentar das famílias. No geral, os estudos concluem que o PBF aumenta
a diversificação alimentar, contudo, usam medidas diferentes para a qualidade geral
da alimentação e não chegam a consenso. Almeida, Mesquita e Batista (2016) não
encontram efeitos do PBF sobre o consumo de uma cesta de alimentos mais
saudáveis (medida pelo índice healthy food diversity). Outros estudos concluem que
o PBF aumenta o consumo de refrigerantes entre crianças (CARMO et al., 2016) e
8
A metodologia de PSM consiste, em linhas gerais, em construir um grupo de comparação a partir das
famílias não beneficiárias que possuem características observáveis semelhantes às das beneficiárias. Ver
capítulo 11 desse livro para maiores detalhes.

133
que esse está associado a uma redução do consumo de alimentos ricos em cálcio,
porém também se associa ao aumento do consumo de leite em pó e leite não
pasteurizado, o que traz maior risco de infecção por bactérias (CARVALHO;
CARVALHO, 2015). Por outro lado, alguns estudos estimam impactos positivos do
PBF sobre o consumo de itens alimentares associados a uma dieta saudável
(COELHO; MELO, 2017; COSTA; BRAGA; TEIXEIRA, 2017; BAPTISTELLA, 2012),
como alimentos in natura ou pouco processados e ingredientes culinários
(MARTINS; MONTEIRO, 2016; SPERANDINO et al., 2017).
3.1.3 Saúde e nutrição
Além do aumento de renda, as condicionalidades do PBF podem representar fatores

importantes para a mudança de comportamento dos beneficiários e para geração de
alterações em dimensões de saúde e nutrição. Há evidências de que as
condicionalidades de saúde estão sendo parcialmente cumpridas. Apesar de
estudos anteriores trazerem conclusões diferentes (OLIVEIRA et al., 2007; BRAUW
et al., 2012; ANDRADE et al., 2012), a evidência atual mais robusta é a de que a
vacinação de crianças é impactada positivamente entre as crianças de até 6 anos
de idade, mas esse impacto não é suficiente para que a carteira de vacinação esteja
em dia (KERN; VIEIRA; FREGUGLIA, 2018). Além disso, a evidência indica ausência
de efeitos sobre a probabilidade de atender ao mínimo de consultas de pré-natal
segundo critério do Sistema Único de Saúde (OLIVEIRA et al., 2007), porém há
evidência de que o PBF aumenta o número de consultas de pré-natal (BRAUW et
al., 2012) e reduz o número de mães que não comparece a consulta alguma de pré-
natal (RASELLA et al., 2021).
Há avaliações de efeitos do PBF também sobre outros resultados de saúde,

utilizando-se dados agregados no nível de municípios e modelos de efeitos fixos para
dados em painel. Há consenso sobre os efeitos do PBF no sentido de reduzir a
mortalidade infantil ou de crianças de menos de 5 anos de idade, especialmente
sobre a mortalidade devido à desnutrição ou diarreia e na presença da Estratégia
Saúde da Família (SHEI, 2013; SILVA; PAES; SILVA; 2018; MALERBA, 2018;
SILVA; PAES, 2019; RASELLA et al., 2013). Esses resultados são confirmados em
estudo com uma nova base de dados no nível da pessoa (RAMOS et al., 2021),
especialmente em municípios com menor renda ou com melhor qualidade de gestão
do PBF. Há ainda evidência de efeito negativo do PBF sobre a mortalidade materna

e positivo sobre a proporção de partos em hospitais (RASELLA et al., 2021). Não há,
porém, evidências de efeitos sobre o peso ao nascer (BRAUW et al., 2012).
Outros resultados de saúde são relacionados a doenças específicas. Estudos

recentes indicam que o PBF reduz a incidência de tuberculose, aumenta a
probabilidade de cura de tuberculose e de hanseníase e a taxa de adesão ao
tratamento de hanseníase (NERY et al., 2017; TORRENS et al., 2015; PESCARINI
et al., 2020). A associação entre o PBF e a incidência ou cura de doenças pode estar
relacionada tanto ao aumento da quantidade e variedade de alimentos consumidos,
à maior exposição dos beneficiários ao sistema de saúde – via condicionalidades –
ou à redução da migração, que facilitaria a adesão ao tratamento. Há ainda evidência
de que o PBF reduz a taxa de suicídio e interfere diretamente sobre o vínculo entre
pobreza e saúde mental (ALVES; MACHADO; BARRETO, 2019).
Estudos sobre nutrição encontram impactos do PBF no sentido de diminuir a

insegurança alimentar (MELO; STARZEC; GARDES, 2013) e melhorar o estado
nutricional de crianças e jovens, ao aumentar medidas de altura e de adequação do
peso (BAPTISTELLA, 2012; BRAUW et al., 2012; NETO; BARRIEL, 2017). Os
efeitos sobre o estado nutricional podem estar relacionados não somente às
mudanças de consumo de alimentos como também às condicionalidades do
programa.9
3.1.4 Educação
Adicionalmente, um longo ramo da literatura estudou os efeitos do PBF sobre

resultados escolares, os quais podem estar relacionados à exigência do programa
sobre a frequência escolar mínima de crianças e jovens. No geral, as avaliações
utilizam diferentes recortes de idade, porém as evidências indicam efeitos positivos
9
Vários dos estudos discutidos nesta subseção utilizam indicadores e bases de dados discutidos no
capítulo 3 desse livro. Estudos que usam indicadores agregados de mortalidade, como a taxa de
mortalidade por suicídio (ALVES; MACHADO; BARRETO, 2019), taxa de mortalidade de crianças menores
de 5 anos (RASELLA et al., 2013; RASELLA et al., 2021; MALERBA, 2018) ou a taxa de mortalidade infantil
(SHEI, 2013) utilizam dados do Sistema de Informação sobre Mortalidade (SIM). Os estudos que calculam
taxas de mortalidade infantil ou de crianças também utilizam dados do Sistema de Informação sobre
Nascidos Vivos (SINASC). Outros estudos usam dados do Sistema de Informação de Agravos de
Notificação (Sinan) para construir o indicador agregado de incidência de tuberculose (NERY et al., 2017) ou
para construir uma variável indicadora de cura de tuberculose (TORRENS et al., 2015). Há ainda estudos
cujas fontes de dados não são tipicamente de estudos de saúde, mas que utilizam indicadores de saúde
como o IMC cf. Batistella (2012), com dados da POF/IBGE) ou medidas antropométricas cf. Neto e Barriel
(2017), com dados da POF/IBGE, e Brauw et al. (2012), com dados das pesquisas de linha de base do
PBF).

135
sobre as matrículas na escola e negativos sobre a taxa de abandono e a distorção
idade-série (OLIVEIRA et al., 2007; CAVALVANTI; COSTA; SILVA, 2013;
GONÇALVES; MENIUCCI; AMARAL, 2017; AMARAL; GONÇALVES; WEISS,
2018). 10 Os resultados sobre frequência à escola e atraso escolar se mantêm,
mesmo com o controle por outras transferências governamentais (COSONATO;
CORRÊA; PAIVA, 2018; DENES; KOMATSU; MENEZES FILHO, 2018). Há
impactos positivos ainda sobre uma medida de tempo na escola (NERI; OSÓRIO,
2019) e estimativas de efeitos negativos sobre notas, os quais podem estar
relacionados ao aumento das matrículas e à correção de fluxo (SIMÕES; SABATES,
2014).
Há menos consenso sobre outros indicadores educacionais e evidências de que o

PBF reduz a falta às aulas (NERI; OSÓRIO, 2019; SCHAFFALAND, 2011; OLIVEIRA
et al., 2007); alguns estudos trazem estimativas não significantes (RIBEIRO;
CACCIAMALI, 2012; FAHEL; FRANÇA; MORAES, 2011). Isso também ocorre a
respeito das taxas de reprovação: evidências de efeitos negativos e alguns estudos
com estimativas não significantes (JULIÃO; CHEIN, 2015; BRAUW et al., 2012;
KERN; VIEIRA; FREGUGLIA, 2017; BATISTA; OLIVEIRA; SOARES, 2013). Sobre
as taxas de aprovação há resultados positivos e negativos, no entanto, estudos mais
recentes não encontram impactos significantes (OLIVEIRA et al., 2007; BRAUW et
al., 2012; SIMÕES; SEBATES, 2014; CAMARGO; PAZELLO, 2014; BRAUW et al.,
2015; KERN; VIEIRA; FREGUGLIA, 2017; CASONATO; CORRÊA; PAIVA, 2018;
PAIVA et al., 2021). Os controles por características observáveis e os métodos de
pareamento também variam entre os estudos, o que se reflete nas magnitudes
variadas encontradas por cada autor.
A análise de heterogeneidade de efeitos permite insights sobre o funcionamento do

programa. De forma geral, as avaliações indicam efeitos com maior magnitude nas
regiões com níveis socioeconômicos menores, como as regiões norte e nordeste e
as áreas rurais (BRAUW et al., 2015; FAHEL; FRANÇA; MORAES, 2011;
SCHAFFLAND, 2011; KERN; VIEIRA; FREGUGLIA, 2017) ou com níveis piores de
indicadores educacionais (BARRIENTOS; DEBOWICZ; WOOLARD, 2016). Além
disso, os efeitos sobre a frequência escolar são mais intensos entre os jovens com
10
As taxas de aprovação e de abandono são calculadas em relação ao total de matrículas no início do ano.
A distorção idade-série é a proporção de crianças e jovens com atraso escolar dentro de algum grupo de
idade ou grau escolar. O atraso escolar normalmente é definido como a situação em que a criança possui
dois anos a mais do que a idade ideal mínima para estar em cada série.

maior idade (BRAUW et al., 2015; FAHEL; FRANÇA; MORAES, 2011), porém os
efeitos sobre as faltas às aulas são mais intensos entre os mais jovens
(SCHAFFLAND, 2011). Em relação à heterogeneidade dos efeitos sobre frequência
escolar por sexo, a literatura não encontra resultados convergentes. Alguns estudos
encontram efeitos significantes somente entre meninas (BRAUW et al., 2015; MELO;
DUARTE, 2010), enquanto outros não encontram diferenças por sexo ou encontram
efeitos mais intensos entre meninos (SCHAFFLAND, 2011; FAHEL; FRANÇA;
MORAES, 2011). Há evidências ainda de atenuação dos efeitos do PBF sobre
abandono escolar ao longo do tempo (AMARAL; MONTEIRO, 2013) e sobre notas
(SIMÕES; SABATES, 2014).
3.1.5 Alocação de tempo e mercado de trabalho
As transferências de renda do PBF também podem afetar as decisões sobre a oferta

de trabalho dos domicílios e de alocação do tempo de jovens entre os estudos e o
trabalho. Como uma fonte de renda não relacionada ao trabalho, o PBF poderia ter
um efeito renda no sentido de reduzir a oferta de trabalho de adultos ou crianças ou
de somente um desses grupos. Outra preocupação é a de que as transferências
também poderiam levar as famílias a escolherem trabalhos informais, cujo
rendimento não fosse facilmente verificável pelo governo (BARBOSA; CORSEUIL,
2014). Além disso, a condicionalidade de frequência mínima à escola também
poderia atuar no sentido de reduzir o tempo de trabalho das crianças e, além disso,
aumentar a oferta de trabalho das mães, pela redução no tempo de cuidado dos
filhos (TAVARES, 2010).
Relativamente à alocação de tempo dos jovens entre estudos e trabalho, os

resultados obtidos referem que o PBF atua no sentido de aumentar as probabilidades
de crianças e jovens de somente estudarem – ou de estudarem e trabalharem – e
diminuir as probabilidades de não estudarem e não trabalharem (jovens nessa
situação também são chamados de “nem-nem”) (CACCIAMALI; TATEI; BATISTA,
2010; ARAÚJO; RIBEIRO; NEDER, 2010; SILVEIRA; HORN; CAMPOLINA, 2013;
CHITOLINA; FOGUEL; MENEZES FILHO, 2016; VASCONCELOS et al., 2017). Os
resultados sobre a alocação de somente trabalharem não encontram consenso.
Quanto à questão sobre a redução da oferta de trabalho de adultos, revisão de

literatura de Oliveira e Soares (2013) conclui que o PBF gera maior participação no
mercado de trabalho, porém com menos procura por trabalho. Entre as mulheres,

137
cuja oferta de trabalho é mais elástica às transferências, há efeitos pequenos de
redução da participação no mercado de trabalho, o que pode representar mais tempo
de cuidado com os filhos. Há ainda evidências de efeito renda negativo sobre a oferta
de trabalho de adultos e mães, porém um efeito positivo de participar do programa
devido às condicionalidades (TAVARES, 2010; TEIXEIRA, 2010).
Na literatura mais recente, a maioria dos estudos levantados mantém as conclusões

dos estudos anteriores (BRAUW et al., 2015; FREGUGLIA; KERN; VIEIRA, 2018).
Evidência recente mostra ainda que o PBF tem efeito no sentido de aumentar a
duração dos vínculos de trabalho formais (SANTOS et al., 2017). Há estudos que
encontram efeitos negativos do PBF nas variáveis de trabalho, analisando-se
variáveis agregadas para famílias e domicílios. Dois desses examinam os efeitos do
PBF sobre quantis da distribuição de horas trabalhadas e rendimentos do trabalho e
encontram efeitos negativos sobre percentis relativamente baixos até os mais
elevados (CAVALCANTI et al., 2016; COSTA et al., 2018).
3.1.6 Outros resultados
Há ainda estudos que investigam os efeitos sobre fecundidade, crime e crescimento

da economia.
Os efeitos sobre fecundidade decorrem da preocupação sobre o possível incentivo

das regras do PBF a ter mais filhos, porque, apesar de cada filho adicional
representar um aumento do investimento em capital humano, o programa faria uma
redução de custo por filho (CECHIN et al., 2015; ROCHA, 2018). Sobre essa questão,
há consenso entre os estudos que examinaram esses efeitos com dados dos anos
iniciais do programa (SIGNORINI; QUEIROZ, 2011; SIMÕES; SOARES, 2012;
ROCHA, 2018). No entanto, estudo com dados mais recentes encontra efeitos
positivos sobre a probabilidade de ter o segundo filho entre famílias pobres ou
extremamente pobres, embora com magnitude baixa (CECHIN et al., 2015). É
possível que os efeitos sobre o comportamento de fecundidade demorem mais para
se realizarem, devido ao tempo necessário para a gradual compreensão do
funcionamento e regras do programa pela população.
O PBF pode ainda ter efeitos sobre o comportamento criminal entre jovens, por
intermédio dos efeitos sobre frequência à escola e alocação de tempo sem estudos

e sem trabalho. Ainda há poucos estudos nessa área, porém Chioda, Mello e Soares
(2016) encontram efeitos negativos sobre a ocorrência de crimes em torno de
escolas, utilizando-se de uma metodologia robusta de variáveis instrumentais e
efeitos fixos. Machado et al. (2018) também encontram efeitos negativos do PBF
sobre taxa de homicídios e hospitalizações por causas violentas em dados
municipais.
Por fim, alguns estudos consideram os efeitos macroeconômicos do PBF e procuram

estimar os impactos do programa sobre o crescimento do PIB per capita dos
municípios e sobre a estrutura produtiva. As transferências do PBF para o alívio
imediato de famílias pobres ou extremamente pobres poderiam gerar efeitos de
segunda ordem sobre as empresas e empregos nos municípios pelo aumento do
consumo. Os resultados na literatura indicam efeitos positivos do PBF sobre o PIB
per capita e a renda das famílias (DENES; KOMATSU; MENEZES FILHO, 2018) e
aumento da atividade industrial leve, atividades informais e de serviços de baixa
produtividade (ROUGIER; COMBARNOUS; FAURÉ, 2018).
3.2 Fundeb
Nesta seção, examinam-se avaliações de impacto do programa de financiamento

educacional instituído com o Fundeb (Fundo de Manutenção e Desenvolvimento da
Educação Básica e de Valorização dos Profissionais da Educação), anteriormente
chamado Fundef (Fundo de Manutenção e Desenvolvimento do Ensino Fundamental
e de Valorização do Magistério), um dos mais importantes instrumentos para a
redução da desigualdade de recursos entre as redes da educação básica dos
municípios e estados no Brasil.
O Fundeb foi criado com caráter temporário (mantido de 1998 a 2006),11 como uma
solução de financiamento no contexto de correção de fluxo do ensino fundamental
no início dos anos 1990 e constitui uma série de fundos (uma para cada unidade
federativa) formados a partir de transferências entre entes federativos e com regras
de uso dos recursos disponíveis para financiar a educação. Os estados e municípios
transferem parcelas de suas receitas tributárias e das transferências federais do
Fundo de Participação dos Estados (FPE) e dos Municípios (FPM) para os fundos
dos respectivos estados. Há então a redistribuição dos recursos dentro de cada
11
O Fundef foi instituído pela Lei nº 9.424 de 1996.

139
estado, de acordo com o número de matrículas, com pesos diferentes para cada
etapa e modalidade de ensino. O governo federal, então, realiza uma
complementação de recursos direcionada aos estados com os menores níveis de
arrecadação por aluno.12 Os recursos do Fundef tinham origem em percentuais de
receitas tributárias e de transferências federais13 e eram direcionados para gastos
no ensino fundamental regular dos estados e municípios. A instituição do Fundeb14
trouxe mais recursos 15
e expandiu a destinação desses a todos os níveis da
educação básica, incluídas modalidades não regulares. Os governos estaduais e
municipais podem gastar os recursos em todos os níveis e modalidades da educação
básica de forma livre, desde que 60% dos valores sejam gastos com salários de
professores da rede pública em atividade e desde que não sejam gastos com itens
como programas suplementares de alimentação e outras formas de assistência
social, obras de infraestrutura, salários de profissionais em desvio de função (e
outros itens especificados pelo Artigo 71 da Lei 9.394 de 1996). Antes da criação do
Fundef, o financiamento educacional de estados e municípios dependia inteiramente
de sua capacidade de arrecadação (GORDON; VEGAS, 2004), o que contribuía para
a manutenção da desigualdade entre regiões. O Fundeb teve vigência entre 2007 e
2020 e foi substituído pelo Novo Fundeb,16 que trouxe algumas alterações no sentido
de aumentar os percentuais de contribuição e alterar as regras de distribuição.
A literatura da avaliação sobre o Fundef e o Fundeb, de modo geral, explora a

variação gerada pelos programas sobre os gastos educacionais de governos
municipais ao longo do tempo. As regras do programa geram modificações daqueles
gastos que no primeiro ano de implementação não eram previsíveis nem
relacionados com as preferências locais que os determinavam (ESTEVAM, 2015;
MENEZES FILHO; PAZELLO, 2007; CHAUVIN, 2018). Além disso, o desenho dos
programas permite o uso de variáveis instrumentais (GORDON; VEGAS, 2004;
CRUZ; SILVA, 2000; KOSEC, 2011) 17 e a comparação entre os municípios que
12
Os valores arrecadados pelos estados com os menores valores por aluno e a redistribuição dos recursos
federais determinam o valor mínimo que deve ser gasto por estudante. Para mais detalhes, ver Hirata, Melo
e Oliveira (2020).
13
Os recursos tinham como origem percentuais das receitas tributárias do ICMS (Imposto sobre Circulação
de Mercadorias e Serviços), do IPI (Imposto sobre Produtos Industrializados) proporcional às exportações,
além de percentuais dos Fundos de Participação dos Estados (FPE) e dos Municípios (FPM).
14
O Fundeb foi instituído pela Emenda Constitucional nº 53 de 2006 e regulamentado pela Lei 11.494 de
2007 e pelo decreto 6.253 de 2007.
15
O Fundeb é composto por parcelas do ICMS, ITR (Imposto sobre a Propriedade Rural), ITCMD (Imposto
de Transmissão Causa Mortis e Doação), FPE, FPM, IPVA (Imposto sobre Propriedade de Veículos
Automotores), IPI exp. e Desoneração de Exportações.
16
O Novo Fundeb foi instituído pela Emenda Constitucional 108 de 2020 e regulamentado pela Lei 14.113
de 2020.
17
Para mais informações sobre a metodologia de variáveis instrumentais, veja o capítulo 14 deste livro.

ganharam ou perderam recursos com a redistribuição gerada pelos programas
(MENEZES FILHO; PAZELLO, 2007; CRUZ, 2018).
Os estudos se concentram sobre a avaliação de dois conjuntos de variáveis, o

primeiro dos quais refere-se a resultados educacionais, como a taxa de matrículas,
indicadores de fluxo e o desempenho nas notas; o segundo são indicadores relativos
a como os governos municipais realizam gastos educacionais. A maioria dos estudos
encontra efeitos do Fundef/Fundeb no sentido de aumentar as matrículas e melhorar
o desempenho dos alunos de escolas públicas em exames no ensino fundamental e
no ensino médio (GORDON; VEGAS, 2004; MENEZES FILHO; PAZELLO, 2007;
ANDRADE; PINTO, 2014; SILVEIRA et al., 2017; HADDAD; FREGUGLIA; GOMES,
2017; CRUZ; ROCHA, 2018). Alguns estudos encontram ainda efeitos positivos de
fatores que afetam o aprendizado dos alunos, como o número de professores
dedicados ao EF e a proporção de professores do EF com ES completo em escolas
públicas (FRANCO; MENEZES FILHO, 2011).
No que se refere às notas, há menos convergência em relação à magnitude dos

efeitos (HADDAD; FREGUGLIA; GOMES, 2017) e aos impactos sobre
desigualdades (SILVEIRA et al., 2017; POLITI; REIS, 2019). Além disso, não há
consenso sobre os efeitos sobre os salários dos professores. Alguns estudos trazem
estimativas positivas (MENEZES FILHO; PAZELLO, 2007; ANDRADE; PINTO,
2014), porém há evidência recente de que aqueles efeitos foram significativos
apenas entre os municípios que ganharam recursos com a redistribuição e que – de
maneira geral – os recursos foram gastos com a contratação de professores, sem
aumento dos salários (CRUZ, 2018). Além das escolas públicas, há evidência de que
os programas reduzem a participação das escolas privadas nas matrículas, por
intermédio de transferências de alunos (ESTEVAN, 2015).
Em relação aos efeitos sobre indicadores de fluxo, a literatura mais recente tem
encontrado resultados de melhoria do fluxo escolar com o Fundef/Fundeb. Apesar
de resultados iniciais não conclusivos (FRANCO; MENEZES FILHO, 2011), há
evidências de efeitos negativos do Fundeb sobre a distorção idade-série (CRUZ;
ROCHA, 2018) e de que desvios dos recursos daquele programa por corrupção
aumentam as taxas de abandono e de reprovação (FERRAZ; FINAN; MOREIRA,
2012).

141
A exposição de crianças ao Fundeb gerou ainda efeitos positivos sobre escolaridade
e salários quando se tornaram adultas, porém em consequência da migração e não
do aumento do capital humano (CHAUVIN, 2018). Além disso, o programa gerou
efeitos negativos sobre mercados de trabalho locais, os quais indicam aumento da
oferta de mão de obra qualificada maior do que a demanda.
O outro conjunto de resultados estudados são indicadores sobre a forma como os

municípios realizam os gastos em educação. Os estudos convergem em relação à
constatação de que o aumento dos recursos devidos ao Fundef/Fundeb gera
aumento mais do que proporcional nos gastos em educação, especialmente quando
comparado a outros tipos de transferência (GORDON; VEGAS, 2004; ARVATE;
ENLINSON; ROCHA, 2015; MATTOS; POLITI; YAMAGUCHI, 2018; CRUZ; SILVA,
2020). Além disso, Kosec (2011) estuda sobre o que motiva governos municipais
semelhantes a gastarem mais em áreas com substitutos privados (educação e
saúde). Esse artigo inaugura uma estratégia de variável instrumental simulada –
derivada das regras do Fundef – também utilizada por outros estudos posteriormente
e a qual conclui que municípios com níveis maiores de desigualdade e da mediana
da renda são menos propensos a gastar em educação e mais propensos a gastar
em infraestrutura, em razão de que nesses municípios menos pessoas apoiam os
gastos em educação pública e pessoas pobres possuem menos influência sobre os
políticos.
3.3 Desoneração da folha de pagamentos
Nesta seção realizou-se o levantamento de avaliações sobre a política de

desoneração da folha de pagamento, cujo objetivo foi gerar impactos em empresas
e no mercado de trabalho. A política de desoneração da folha de pagamento foi
criada como parte central do conjunto de ações de estímulo ao crescimento
econômico Plano Brasil Maior, lançado em 2011 18 com os objetivos gerais de
aumentar a competitividade das empresas nacionais, investimentos e
desenvolvimento tecnológico, com a redução da assimetria entre o produto nacional
e o importado, o aumento das exportações e a formalização do mercado de trabalho.
18
A política de desoneração da folha de pagamentos foi incluída na Medida Provisória (MP) 540 de 2011,
transformada na Lei 12.546 de 2011. Aquela política foi posteriormente alterada por diversas leis e decretos.

Concretamente a política de desoneração substituiu a contribuição obrigatória do
empregador – Contribuição Previdenciária Patronal (CPP) – ao Regime Geral de
Previdência Social (RGPS) por um imposto sobre receitas brutas, excluídas as
receitas de exportação (então isentas da contribuição). Os trabalhadores do setor
privado formal devem contribuir obrigatoriamente para o RGPS; o pagamento da
contribuição é dividido entre o trabalhador e o empregador – a CPP era de 20% do
valor da folha de pagamento. A política de desoneração substitui essa contribuição
por um imposto sobre as receitas brutas, exceto de exportações, com alíquotas que
inicialmente eram de 1,5% e 2,5%, respectivamente para os setores industriais e de
serviços.19 A adesão a essa política era obrigatória entre as empresas dos setores e
produtos selecionados e que não operavam pelo Simples Nacional. A desoneração
inicialmente tinha uma focalização desenhada para induzir competitividade nos
setores e produtos mais intensivos em trabalho e com maior exposição à
concorrência externa.20 Essa focalização, no entanto, perdeu-se com a expansão do
programa para diversos setores e incluiu setores não exportadores (AFONSO;
BARROS, 2013).
A desoneração de folha tinha validade até 2014, prazo que foi expandido, porém
com modificações nas regras do programa. A partir de 2015 a adesão se tornou
voluntária e, a partir de 2017, a abrangência setorial foi reduzida para os setores de
transportes, construção civil e comunicações. A nova versão do benefício seria
encerrada no fim de 2021, mas foi ampliada por mais dois anos.21
Apesar de a seleção para o tratamento representado pela política de desoneração

não ser aleatória, a literatura de avaliação daquela política explorou o fato de que as
suas regras colocam critérios claros de seleção por setores e produtos e pelo regime
de tributação para identificar seus impactos. No geral, os estudos comparam
empresas ou clusters incluídos e não incluídos na política ao longo do tempo, com a
metodologia de diferenças em diferenças ou de triplas diferenças, para estudar os
efeitos sobre o emprego e os salários no setor formal da economia.22 Os resultados
19
As alíquotas foram reduzidas para respectivamente 1% e 2% no primeiro ano de vigência da política pela
Lei 12.715 de 2012.
20
Os setores inicialmente selecionados foram de indústria de confecção, de artefatos de couro e calçados,
serviços de tecnologia da informação, tecnologia da informação e comunicação e serviços de call center cf.
Dallava ( 2014).
21
Expansão instituída pela Lei 14.288 de 2021.
22
Os estudos levantados exploram essas variações com estimações pelo método de diferenças em
diferenças. Maiores detalhes sobre essa metodologia podem ser encontrados no capítulo 12 deste livro.

143
das avaliações têm convergido para a ausência de efeitos significantes da política
sobre o emprego e salários, embora estudos tenham encontrado efeitos positivos.
O trabalho de Carmo (2012) usa dados no nível de pessoas de 2011 e 2012 e que
incluem tanto o mercado formal quanto o informal para avaliar os efeitos da política
de desoneração. A autora não encontra efeitos significantes nem sobre o grau de
formalização nem sobre a realocação da mão de obra entre atividades econômicas.
Os demais estudos utilizam dados somente do mercado formal, provenientes da

Relação Anual de Informações Sociais (RAIS), atualmente divulgados pela
Secretaria Especial de Trabalho do Ministério da Economia. Com dados sem
identificação por empresa, Dallava (2014) trabalha com cluster de empresas e define
como grupo de tratamento os clusters de setores incluídos na desoneração e como
grupo de controle os clusters de setores não incluídos, ambos formados por
empresas que não operavam no Simples Nacional. A autora não encontra efeitos
sobre emprego e salários nos setores industriais, mas estima efeitos positivos nos
serviços de tecnologia da informação e negativos no setor de hospedagem e
alimentação. São possíveis problemas de identificação daquele estudo que os
controles utilizados são possivelmente impactados pela política de desoneração
(SCHERER, 2015) e os contrafactuais na estimação do setor de tecnologia da
informação não são bons (BAUMGARTNER, 2017). Scherer (2015) procura resolver
esses problemas utilizando-se de outro contrafactual – as empresas que operavam
no Simples. O autor trabalha com dados no nível de empresa, de 2010 a 2012, e
encontra efeitos positivos sobre o emprego (entre 14% e 16%), horas trabalhadas
(entre 8% e 10%) e os salários (entre 2% e 2,3%). As estimativas, no entanto, podem
novamente apresentar problemas de identificação, considerando-se que o autor não
encontra tendências paralelas entre os grupos de tratamento e controle no período
pré-tratamento (GARCIA; SACHSIDA; CARVALHO, 2018) e as empresas do
Simples podem também ter sido indiretamente afetadas pela desoneração
(BAUMGARTNET, 2017).
Outra contribuição relevante é a de Baumgartner (2017), que usa dados de 2009 a

2014, diferencia sua análise entre as empresas desoneradas pelo critério do setor
de atividade ou pelo critério do produto produzido e avalia diretamente os efeitos
sobre as empresas do Simples. O autor não encontra efeitos significativos entre
empresas incluídas devido aos produtos, porém, ao analisar as empresas incluídas

em função do setor encontra efeitos positivos sobre o emprego entre as empresas
que foram desoneradas (7,5%). Comparando-se empresas do Simples de setores
afetados com as de setores não afetados, o autor encontra efeitos negativos e indica
possível migração das empresas do Simples para o regime comum de tributação.
Garcia, Sachsida e Carvalho (2018) procuram superar as dificuldades da

metodologia de diferenças em diferenças e utilizam um modelo de triplas diferenças,
cuja hipótese de identificação é relativamente mais fraca. Os autores comparam
setores afetados e não afetados, entre empresas do regime comum e do Simples,
ao longo do tempo, e encontram efeitos não significantes sobre o emprego no geral
e efeitos positivos fracos em algumas especificações.
Em resumo, não há evidência consolidada de efeitos positivos da desoneração da

folha de pagamento sobre o emprego formal e os salários. Em contrapartida, as
estimativas de custos são relativamente elevadas (AFONSO; BARROS, 2013;
BARROS; AFONSO, 2013; DINIZ; AFONSO, 2014). Diniz e Afonso (2014) estimam
custos de R$ 22,71 bilhões em 2004, cerca de 0,46% do PIB. Como comparação,
esse valor é semelhante ao custo do PBF em anos mais recentes (FGV Social, s.d.;
SOUZA, 2011).
4 Conclusão
Avaliações de impacto de programas sociais são ferramentas importantes para a tomada

de decisão sobre a alocação de recursos públicos – em meio à restrição desses recursos,
especialmente nos últimos anos – e à crescente demanda da sociedade. A decisão sobre
a alocação de recursos afeta diretamente o bem-estar de grupos de cidadãos e as
avaliações podem contribuir trazendo transparência às decisões.
Neste capítulo descrevem-se alguns fundamentos lógicos – o modelo de causalidade de

Rubin – e hipóteses fundamentais para o trabalho com dados orientado para a realização
de avaliações de impacto. Foram realizados também levantamentos de avaliações sobre
três políticas relevantes nas áreas de transferências de renda, educação e mercado de
trabalho: o Programa Bolsa Família (PBF), o Fundeb e a política de desoneração da folha
de pagamentos. As avaliações trazem evidências de que o PBF afeta o comportamento
dos beneficiários não somente pelo aumento na renda familiar, mas também pelas
condicionalidades de educação e saúde das crianças, jovens e gestantes das famílias que

145
recebem o benefício. Há ainda efeitos de segunda ordem sobre as economias locais, os
quais podem impactar a população de modo geral. Verificou-se extensa produção de
avaliações de impactos sobre áreas como pobreza, desigualdade de renda, consumo,
nutrição, saúde, educação, alocação de tempo dos jovens, fecundidade, crimes e
crescimento econômico.
A literatura de avaliação sobre o Fundeb também encontra efeitos de melhorar o

desempenho em exames e o fluxo de estudantes de ensino fundamental e ensino médio.
Há também impactos estimados das transferências no sentido de aumentar os gastos dos
governos locais em educação. As avaliações sobre a política de desoneração da folha de
pagamentos, por outro lado, não indicam efeitos consolidados no sentido de aumentar o
emprego ou os salários nos setores formais da economia, os quais eram seus objetivos
iniciais. Apesar de não haver um cálculo monetário dos benefícios do programa, a
informação sobre o custo dessa política – de ordem similar ao do PBF – indicam que
provavelmente o programa não está gerando benefícios maiores do que seus custos.

Referências
ALMEIDA, A. T. C; MEQUITA, S. P. de; SILVA, M. V. B. da. Impactos do Programa Bolsa

Família sobre a diversificação do consumo de alimentos no Brasil. Pesquisa e
Planejamento Econômico, v. 46, n. 1, p. 7-39, 2016. Disponível em:
http://repositorio .ipea.gov.br/bitstream/11058/6645/1/PPE_v46_n01_Impactos.pdf.
Acesso em: 23 ago. 2022.
AFONSO, J. R.; BARROS, G. L. de. Desoneração da folha: renúncia revisitada. Rio de

Janeiro: FGV, 2013. 22p. Disponível em: https://bibliotecadigital.fgv.br/dspace/ handle/
10438/11698?locale-attribute=en
ALVES, F. J. O.; MACHADO, D. B.; BARRETO, M. L. Effect of the Brazilian cash transfer
programme on suicide rates: a longitudinal analysis of the Brazilian municipalities. Social
Psychiatry and Psychiatric Epidemiology, v. 54, n. 5, p. 599–606, 2019. DOI: 10.1007/
s00127-018-1627-6.
AMARAL, E. F. de L.; MONTEIRO, V. do P. Avaliação de impacto das condicionalidades

de educação do Programa Bolsa Família (2005 e 2009). Dados, v. 56, n. 3, p. 531–570,
2013. DOI: https://doi.org/10.1590/S0011-52582013000300003.
AMARAL, E. F. de L.; GONÇALVES, G. Q.; WEISS, C. The impact of Brazil’s Bolsa

Família Program on school attendance, age-grade discrepancy, and child labor, 2010.
Journal of Social Science for Policy Implications, v. 2, n. 1, p. 101–125, 2018. DOI:
https://doi.org/ 10.31235/osf.io/u8crb.
ANDRADE, G.; PINTO, C. C. de X. Higher salaries, more teaching, better

performance? 2014. 47p. Disponível em:
https://2014.economicsofeducation.com/user/pdfsesiones/155.pdf.
ANDRADE, M. V. et al. Income transfer policies and the impacts on the immunization of
children: the Bolsa Família Program. Cadernos de Saúde Pública, v. 28, n. 7, p.1347-
1358, 2012. Disponível em: http://www.scielosp.org/pdf/csp/v28n7/13.pdf. Acesso em: 22
ago. 2022.
ARAÚJO, G. S.; RIBEIRO, R.; NEDER, H. D. Impactos do Programa Bolsa Família sobre
o trabalho de crianças e adolescentes residentes na área urbana em 2006. Economia, v.
11, n. 4, p. 57-102, dez. 2010. Disponível em: http://www.anpec. org.br/revista/ vol11/
vol11n4p5 7_ 102.pdf. Acesso em: 24 ago. 2022.
ARVATE, P.; ENLINSON, M; ROCHA, F. Intergovernmental transfers and public

spending in Brazilian municipalities. São Paulo: Department of Economics- FEA/USP,
2015. 44p. (Working Papers REAP nº 2015-03). Disponível em: http://www.repec.eae.
fea.usp.br/documentos/Arvate_Mattos_Rocha_03WP.pdf. Acesso em: 24 ago. 2022.
BAPTISTELLA, J. C. F. Avaliação de programas sociais: uma análise do impacto do

Programa Bolsa Família sobre o consumo de alimentos e status nutricional das famílias.
Revista Brasileira de Monitoramento e Avaliação, v. 3, p. 26-53, 2012. DOI:
https://doi.org/10.4322/rbma201203003.
BARBOSA, A. L. N. de H.; CORSEUIL, C. H. L. Conditional cash transfer and informality

in Brazil. IZA Journal of Labor and Development, v. 3, n. 1, p. 1-18, 2014. DOI:
https://doi.org/10.1186/s40175-014-0024-0.

147
BARRIENTOS, A.; DEBOWICZ, D.; WOOLARD, I. Heterogeneity in Bolsa Família
outcomes. Quarterly Review of Economics and Finance, v. 62, p. 33–40, 2016. DOI:
https://doi.org/10.1016/j.qref.2016.07.008.
BARROS, G. L. de; AFONSO, J. R. Evolução inicial da desoneração da folha salarial.

2013. Disponível em: http://www.brasilmaior.mdic.gov.br/ Acesso em: 24 ago. 2022.
BATISTA DE OLIVEIRA, L. F.; SOARES, S. S. D. The Impact of the Programa Bolsa

Família on grade repetition: results from the single registry. Attendance Project and
School Census. Brasília, DF: International Policy Centre for Inclusive Growth, 2013. (IPC
Working Paper, nº 119).
BAUMGARTNER, E. A desoneração da folha salarial e seu efeito sobre o mercado de

trabalho no Brasil. 2017. Dissertação (Mestrado em Teoria Econômica) – Faculdade de
Economia, Administração e Contabilidade, Universidade de São Paulo, São Paulo, 2017.
Disponível em: https://teses.usp.br/teses/disponiveis/12/12138/tde-28092017-104436/pt-
br.php. Acesso em: 24 ago. 2022.
BRASIL. VIS Data - Base de dados online. Brasília, DF: Secretaria de Avaliação e
Gestão da Informação-SAGI, 2022. Disponível em:
https://aplicacoes.mds.gov.br/sagi/vis/data3/data-explorer.php.
BRASIL. Casa Civil da Presidência da República. Avaliação de políticas públicas: guia

prático de análise ex post. Brasília, DF: Casa Civil da Presidência da República, 2018. v.2.
BRAUW, A. et al. Bolsa Família and household labor supply. Economic Development
and Cultural Change, v. 63, n. 3, p. 423–457, 2015. DOI: https://doi.org/10.1086/680092.
BRAUW, A. et al. The impact of Bolsa Família on schooling. World Development, v. 70,
p. 303-316, 2015. DOI: https://doi.org/10.1016/j.worlddev.2015.02.001.
BRAUW, A. et al. The impact of Bolsa Familia on child, maternal, and household
welfare. Washington, D.C: IFPRI, 2012.
CACCIAMALI, M. C.; TATEI, F.; BATISTA, N. F. Impactos do Programa Bolsa Família

federal sobre o trabalho infantil e a frequência escolar. Revista de Economia
Contemporânea, v. 14, n. 2, p. 269–301, 2010. DOI: https://doi.org/10.1590/
s1415-98482010000200003.
CAMARGO, P. C.; PAZELLO, E. T. Uma análise do efeito do programa bolsa família

sobre o desempenho médio das escolas brasileiras. Economia Aplicada, v. 18, n. 4, p.
623-640, 2014. DOI: https://doi.org/10.1590/1413-8050/ea388.
CARMO, A. S. et al. Influence of the Bolsa Família Program on nutritional status and food
frequency of schoolchildren. Jornal de Pediatria, v. 92, n. 4, p. 381-387, 2016. DOI:
http://dx.doi.org/10.1016/ j.jped.2015.10.008.
CARMO, M. S. do. Avaliação empírica da desoneração da folha salarial. 2012.

Dissertação (Mestrado Profissional em Economia) - Departamento de Economia, Instituto
de Ensino e Pesquisa (Insper), São Paulo, 2012. Disponível em:
https://repositorio.insper.edu.br/bitstream/11224/880/1/MICHELLE%20SCHUINDT%20DO
%20CARMO.inserido.pdf. Acesso em: 24 ago. 2022.

CARVALHO, G. R.; CARVALHO, C. O. Demand analysis on food: effects of Bolsa Família
on dairy consumption as a source of calcium. Planejamento e Políticas Públicas, v. 45,
p. 221-244, 2015. Disponível em: http://www.ipea.gov. br/ppp/index.php/ PPP/article/ view
File /493/376. Acesso em: 24 ago. 2022.
CASONATO, L.; CORRÊA, A. L.; PAIVA, S. C. F. de. O Bolsa Família no enfrentamento

da pobreza e na sequência histórica das grandes políticas econômicas brasileiras: suas
condições de possibilidade. Leituras de Economia Política, v. 26, p. 77-94, jan./jun.
Disponível em: https://www.eco.unicamp.br/images/arquivos/artigos/3655/Artigo5A.pdf.
CAVALCANTI, D. M.; COSTA, E. M.; DA SILVA, J. L. M. Programa Bolsa Família e o

nordeste: impactos na renda e na educação, nos anos de 2004 e 2006. Revista de
Economia Contemporânea, v. 17, n. 1, p. 99-128, 2013. DOI:
https://doi.org/10.1590/S1415-98 4820 13000100004.
CAVALCANTI, D. M. et al. Impactos do Programa Bolsa Família na renda e na oferta de

trabalho das famílias pobres: uma abordagem usando o efeito quantílico de tratamento.
Economia Aplicada, v. 20, n. 2, p. 173-201, 2016. DOI: https://doi.org/10.11606/1413-
8050/ea130092.
CECHIN, L. A. W.; CARRARO, A.; RIBEIRO, F. G.; FERNANDEZ, R. N. O impacto das

regras do Programa Bolsa Família sobre a fecundidade das beneficiárias. Revista
Brasileira de Economia, v. 69, n. 3, p. 303-329, 2015. DOI: https://doi.org/10.5935/0034-
7140. 2015 0014.
CHAUVIN, J. P. Public education investment and local labor markets: evidence from a
large Federal Program in Brazil. Washington, D.C: Inter-American Development
Bank/Department of Research and Chief Economist, 2018. (Discussion paper, IDB-DP nº
606). Disponível em: https://publications.iadb.org/en/public-education-investment-and-
local-labor-markets-evidence-large-federal-program-brazil. Acesso em: 25 ago. 2022.
CHIODA, L.; MELLO, J. M. P. de; SOARES, R. R. Spillovers from conditional cash transfer
programs: Bolsa Família and crime in urban Brazil. Economics of Education Review, v.
54, p. 306-320, 2016. DOI: https://doi.org/10.1016/j.econedurev.2015.04.005.
CHITOLINA, L.; FOGUEL, M. N.; MENEZES-FILHO, N. A. The impact of the expansion of

the bolsa família program on the time allocation of youths and their parents. Revista
Brasileira de Economia, v. 70, n. 2, p. 183-202, 2016. DOI: https://doi.org/10.5935/0034-
7140.20160009.
COELHO, P. L.; MELO, A. S. S. D. A. The impact of the “Bolsa Família” Program on

household diet quality, Pernambuco state, Brazil. Ciência Saúde Coletiva, v. 22, n. 2, p.
393-402, 2017. DOI: https://doi.org/10.1590/1413-81232017222.13622015.
COSTA, L. V.; BRAGA, M. J.; TEIXEIRA, E. C. Impactos do Programa Bolsa Família

sobre o consumo de nutrientes das famílias beneficiárias. Ensaios FEE, v. 37, n.4, p.
947-974, 2017. Disponível em: https://revistas.dee.spgg.rs.gov.br/index.php/ensaios/
/article/view/3486. Acesso em: 26 ago. 2022.
COSTA, R. A.; COSTA, E. M.; MARIANO, F. Z.; CAVALCANTI, D. M. Impactos do

Programa Bolsa Família no mercado de trabalho e na renda dos trabalhadores rurais.
Nova Economia, v. 28, n. 2, p. 385-416, 2018. DOI: https://doi.org/10.1590/0103-
6351/3289.

149
CRUZ, T. Teacher hiring decisions: how do governments react to an exogenous
redistribution of education funds? Economics of Education Review, v. 67, p. 58-81, May,
2018. DOI: https://doi.org/10.1016/j.econedurev.2018.09.002.
CRUZ, T.; SILVA, T. Minimum spending in education and the flypaper effect. Economics
of Education Review, v. 77, Aug. 2020. DOI: https://doi.org/ 10.1016/ j.econedurev. 2020.
102 012.
CRUZ, G.; ROCHA, R. Efeitos do FUNDEF/B sobre frequência fscolar, fluxo fscolar e
trabalho infantil: uma análise com base nos censos de 2000 e 2010. Estudos
Econômicos, v. 48, n. 1, p. 39-75, mar. 2018.
DALLAVA, C. C. Impactos da desoneração da folha de pagamentos sobre o nível de

emprego no mercado de trabalho brasileiro: um estudo a partir dos dados da RAIS.
2014. Dissertação (MPFE) - Escola de Economia de São Paulo, Fundação Getúlio
Vargas, São Paulo, 2014. Disponível em: https://bibliotecadigital.fgv.br/dspace/bitstream/
/handle/104 38/11497/ Dissertacao_CarolineDallava.pdf?sequence=1&isAllowed=y.
DENES, G.; KOMATSU, B. K.; MENEZES-FILHO, N. Uma avaliação dos impactos

macroeconômicos e sociais de programas de transferência de renda nos municípios
Brasileiros. Revista Brasileira de Economia, v. 72, n. 3, p. 292-312, 2018. DOI:
https://doi.org/10.5935/0034-7140.20180014.
DINIZ, E.; AFONSO, J. R. Benefícios fiscais concedidos (e mensurados) pelo

Governo Federal. Rio de Janeiro: FGV/IBRE, 2014. (Texto de discussão). Disponível em:
https://portalibre.fgv.br/sites/default/files/2021-03/benef_cios-fiscais-concedidos-_e-
mensurados_-pelo-governo-federal.pdf. Acesso em: 26 ago. 2022.
DUARTE, G. B.; SAMPAIO, B.; SAMPAIO, Y. Programa Bolsa Família: impacto das
transferências sobre os gastos com alimentos em famílias rurais. Revista de Economia e
Sociologia Rural, v. 47, n. 4, p. 903-918, 2009. DOI: https://doi.org/10.1590/S0103-
20032009000400005.
DUARTE, H. F. F. L.; FARIA, A. C. L. de; RODRIGUES, C. T. Avaliação de impacto do

Programa Bolsa Família sobre o consumo das famílias beneficiárias: uma análise através
da Pof 2008- 2009. RDE - Revista de Desenvolvimento Econômico, v. 3, n. 44, p. 230-
251, 2019. DOI: https://doi.org/10.36810/rde.v3i44.6357.
ECONOMIC COMMISSION FOR LATIN AMERICA AND THE CARIBBEAN. Report on the
economic impact of coronavirus disease (COVID-19) on Latin America and the Caribbean.
2020a. Disponível em:https://repositorio.cepal.org/bitstream/handle/11362/ 45603/1/
S2000312_en.pdf. Acesso em: 25 dez. 2022.
ECONOMIC COMMISSION FOR LATIN AMERICA AND THE CARIBBEAN. The social
challenge in times of COVID-19. 2020b. (Special Report COVID-19, n. 3). Disponível em:
https://repositorio.cepal.org/handle/11362/45544?locale-attribute=en. Acesso em: 25 dez.
2022.
ESTEVAN, F. Public education expenditures and private school enrollment. Canadian

Journal of Economics, v. 48, n. 2, p. 561-584, May 2015. DOI: https://doi.org/ 10.1111/
caje.12136.

FAHEL, M. C. X.; FRANÇA, B. C.; MORAES, T. O efeito da condicionalidade educação do
Bolsa Família em Minas Gerais: uma avaliação por meio da PAD/MG. Revista Brasileira
de Monitoramento e Avaliação, v. 2, p. 4-25, 2011. DOI: https://doi.org/10.4322/rbma20
1102 002.
FERRAZ, C.; FINAN, F.; MOREIRA, D. B. Corrupting learning. Evidence from missing
federal education funds in Brazil. Journal of Public Economics, v. 96, n. 9-10, p. 712-
726, 2012. DOI: https://doi.org/10.1016/j.jpubeco.2012.05.012.
FGV Social comenta os cortes no Bolsa Família e o aumento da extrema pobreza no

Brasil. [20-]. Disponível em: https://cps.fgv.br/bf2020. Acesso em: 26 ago. 2022.
FRANCO, A. M. de P.; MENEZES-FILHO, N. A. Os impactos do FUNDEF sobre

indicadores educacionais. In: ENCONTRO NACIONAL DE ECONOMIA, 39., 2011, Foz do
Iguaçu. Anais [...]. Foz do Iguaçu: ANPEC, 2018.
FREGUGLIA, R. da S.; KERN, A. P.; VIEIRA, M. de T. Impacto do Programa Bolsa

Família na oferta de trabalho dos beneficiários. In: ENCONTRO NACIONAL DE
ECONOMIA, 46, 2018, Rio de Janeiro. Anais [...]. Rio de Janeiro: ANPEC, 2018. 20p.
Disponível em: https://www.anpec.org.br/encontro /2018/submissao/files_I/i13-
0067d7849ac13f746bba8538313776d3.pdf. Acesso em: 26 ago. 2022.
GARCIA, F.; SACHSIDA, A.; CARVALHO, A. X. Y de. Impacto da desoneração da folha

de pagamentos sobre o emprego: novas evidências. Brasília: IPEA, 2018. (Texto para
Discussão, n. 2357). Disponível em: https://www.econstor.eu/bitstream/10419/177573/1/td
_ 2357.pdf. Acesso em: 30 ago. 2022.
GONÇALVES, G. Q.; MENIUCCI, T. M. G.; AMARAL, E. F. de L. Diferencial educacional

entre beneficiários e não beneficiários do Programa Bolsa Família. Cadernos de
Pesquisa, v. 47, n. 165, p. 770-795, 2017. DOI: https://doi.org/10.1590/198053144297.
GORDON, N.; VEGAS, E. Educational finance, equalization, spending, teacher

quality, and student outcomes: the case of Brazil’s FUNDEF. Incentives to Improve
Teaching. Lessons from Latin America. 2004. 34p. Disponível em: https://register.rti.org/
Education Finance/background/Equity/gordon_vegas_06_01_04%20(4).pdf. Acesso em:
26 ago. 2022.
HADDAD, M. A.; FREGUGLIA, R.; GOMES, C. Public spending and quality of education in
Brazil. Journal of Development Studies, v. 53, n. 10, p. 1679-1696, 2017. DOI: https://
doi.org/10.1080/00220388.2016.1241387.
JULIÃO, N. A.; CHEIN, F. Avaliação de impacto do Programa Bolsa Família sobre a

educação dos jovens. Revista de Desenvolvimento e Políticas Públicas, v. 1, p. 75-
107, 2015. DOI: https://doi.org/10.31061/redepp.v0n1.75-107.
KAMAKURA, W. A.; MAZZON, J. A. Measuring the impact of a conditional cash transfer

program on consumption behavior with propensity scoring. Customer Needs and
Solutions, v. 2, n.4, p. 302-316, 2015. DOI: https://doi.org/10.1007/s40547-015-0037-0.
KERN, A. P.; VIEIRA, M. de T.; FREGUGLIA, R. da S. Impactos do Programa Bolsa

Família na educação das crianças. In: ENCONTRO NACIONAL DE ECONOMIA, 45.,
2017, Natal. Anais [...]. Natal: ANPEC, 2017. 20p. Disponível em:
https://www.anpec.org.br/ encontro/ 2017/ submissao/files_I/i12- 00e6a236f55d70ceed
173a. 082b0e15a9.pdf. Acesso em: 26 ago. 2022.

151
KERN, A. P.; VIEIRA, M. de T.; FREGUGLIA, R. da S. Impactos do Programa Bolsa
Família na educação das crianças. In: ENCONTRO NACIONAL DE ECONOMIA, 46.,
2018, Rio de Janeiro. Anais [...]. Rio de Janeiro: ANPEC, 2018. 20 p. Disponível em:
https://www.anpec.org.br/encontro/2017/submissao/files_I/i12-00 e6a236f55d70ceed
173a082b0e15a9.pdf. Acesso em: 26 ago. 2022.
KOSEC, K. Politics and preschool: the political economy of investment in pre-primary

education. The World Bank, 2011. (The World Bank, 2011). Disponível em:
https://documents1.worldbank.org/curated/en/942241468091776922/pdf/WPS5647.pdf.
MACHADO, D. B. et al. Conditional cash transfer programme: impact on homicide rates

and hospitalisations from violence in Brazil. PLoS ONE, v. 13, n. 2, p. 1-13, 2018. DOI:
https://doi.org/ 10.1371/ journal.pone.0208925.
MALERBA, D. The heterogeneous effects of conditional cash transfers across

geographical clusters: do energy factors matter? Manchester: University of Manchester/
Global Development Institute, 2018. (Global Development Institute Working Paper Series,
2018/021). Disponível em: https://papers.ssrn.com/sol3/papers.cfm? abstract_id=314371
8.Acesso em: 26 ago. 2022.
MARTINS, A. P. B.; MONTEIRO, C. A. Impact of the Bolsa Família Program on food

availability of low-income brazilian families: a quasi experimental study. BMC Public
Health, v. 16, n. 1, p. 1-11, 2016. DOI: https://doi.org/10.1186/s12889-016-3486-y.
MATTOS, E.; POLITI, R.; YAMAGUCHI, A. Grants and dispersion of local education
spending in Brazil. Regional Studies, v. 52, n. 2, p. 239-249, 2018. DOI: https://doi.org/
10.1080/00343404.2017.1287891.
MELO, A. S. S. D. A.; STARZEC, C.; GARDES, F. The “ Bolsa-Família” Program and the
Food Insecurity in Brazilian household between 2009 and 2013. In: ENCONTRO
NACIONAL DE ECONOMIA, 44., 2013, Foz do Iguaçu. Anais [...]. Foz do Iguaçu:
ANPEC, 2013. 19 p. Disponível em: https://www.anpec.org.br/encontro/2016/submissao/
/files_I/i5-15947443edc6e1498446b776165267a7.pdf. Acesso em: 26 ago. 2022.
MENEZES-FILHO, N.; PAZELLO, E. Do teachers’ wages matter for proficiency? Evidence

from a funding reform in Brazil. Economics of Education Review, v. 26, n. 6, p. 660-672,
2007. DOI: https://doi.org/10.1016/j.econedurev.2007.08.003.
NERI, M.; CAMILLO OSORIO, M. Bolsa Família, tempo na escola e motivações

estudantis. Revista de Administração Pública, v. 53, n. 5, p. 859–878, 2019. DOI:
https://doi.org/ 10.1590/0034-761220180267.
NERY, J. S. et al. Effect of Brazil’s conditional cash transfer programme on tuberculosis

incidence. International Journal of Tuberculosis and Lung Disease, v. 21, n. 7, p.790–
796, 2017. DOI: https://doi.org/10.5588/ijtld.16.0599.
NETO, V. R. de P.; BERRIEL, C. M. Transferências condicionais de renda e nutrição:

efeitos do Bolsa Família nas áreas rurais e urbanas do Brasil. Economia Aplicada, v. 21,
n. 2, p. 185-205, 2017. DOI: https://doi.org/10.11606/1413-8050/ea139199.
NEVES, J. A. et al. The Brazilian cash transfer Program (Bolsa Família): a tool for
reducing inequalities and achieving social rights in Brazil. Global Public Health, v. 0, n. 0,
p. 1-17, 2020. DOI: https://doi.org/10.1080/17441692.2020.1850828.

OLIVEIRA, A. M. H. C. de et al. Primeiros resultados da análise da linha de base da
pesquisa de avaliação de impacto do Programa Bolsa Família. In: VAITSMAN, J.; PAES-
SOUZA, R. Avaliação de políticas e programas do MDS: resultados. Brasília, DF: MDS,
2007. v. 2.
OLIVEIRA, L. F. B. de; SOARES, S. S. D. "Efeito Preguiça" em Programas de

Transferência de Renda? In: CAMPELO, T.; NERI, M. C. Programa Bolsa Família: uma
década de inclusão e cidadania. Brasília, DF: IPEA, 2013.
PAES DE BARROS, R.; LIMA, L. Avaliação de impacto de programas sociais: por que,
para que e quando fazer? In: MENEZES FILHO, N. A.; PINTO, C. C. de X. (orgs.).
Avaliação econômica de projetos sociais. 3. ed. São Paulo: Fundação Itaú Social,
2016.
PAIVA, L. H.; SOARES, F. V.; VIANA, I. A. V.; CIRENO, F.; DURAN, A. C. The effects of
conditionality monitoring on educational outcomes: evidence from Brazil’s Bolsa Família
Programme. Brazilian Political Science Review, v. 15, n. 1, p. 1-39, 2021. DOI:
https://doi.org/10.1590/1981-3821202100010001.

treatment adherence and cure in patients from the nationwide 100 million brazilian cohort:
a quasi-experimental study. The Lancet Infectious Diseases, v. 20, n. 5, p. 618-627,
2020. DOI: https://doi.org/10.1016/S1473-3099(19)30624-3.
PEW-MACARTHUR. Results first initiative. Evidence-Based Policymaking: a guide

for effective government. Washington, DC: Pew Charitable Trusts and the MacArthur
Foundation, 2014.
POLITI, R.; REIS, I. Financiamento da educação e a disparidade no desempenho escolar

entre municípios brasileiros. In: ENCONTRO NACIONAL DE ECONOMIA, 47, 2019, São
Paulo. Anais [...]. São Paulo: ANPEC, 2019. Disponível em: https://www.anpec.org.br
/encontro/ 2019/submissão /files_I/i5-8077df959cc98d5eac7a6ae31a327f8e.pdf. Acesso
em: 26 ago. 2022.
RAMOS, D. et al. Conditional cash transfer program and child mortality: A cross-sectional
analysis nested within the 100 million brazilian cohort. PLoS Medicine, v. 18, n. 9, p. 1-20,
2021. DOI: https://doi.org/10.1371/journal.pmed.1003509.
RASELLA, D. et al. Long-term impact of a conditional cash transfer programme on

maternal mortality: a nationwide analysis of brazilian longitudinal data. BMC Medicine, v.
19, n. 1, p. 1-9, 2021. DOI: https://doi.org/10.1186/s12916-021-01994-7.
RASELLA, D. et al. Effect of a conditional cash transfer programme on childhood mortality:

a nationwide analysis of brazilian municipalities. The Lancet, v. 382, n. 9886, p. 57-64,
2013. DOI: https://doi.org/10.1016/S0140-6736(13)60715-1.
RIBEIRO, R.; CACCIAMALI, M. C. Impactos do Programa Bolsa-Família sobre os

indicadores educacionais. Economia, v. 13, n. 2, p. 415-446, 2012.
ROCHA, M. A.; MATTOS, L. B. de; COELHO, A. B. Influência do Programa Bolsa Família

na alocação de recursos: uma análise considerando a presença de mulheres no domicílio.
Economia e Sociedade, v. 27, n. 3, p. 997-1028, 2018. DOI:
https://doi.org/10.1590/1982-3533.2018v27n3art11.

153
ROCHA, M. A.; MATTOS, L. B. de; RODRIGUES, C. T.; LIMA, J. E. de. Efeito do
Programa Bolsa Família sobre o consumo dos domicílios rurais e urbanos no Brasil.
Revista Econômica do Nordeste, v. 47, n. 2, p. 9-25, 2016.
ROCHA, R. C. B. da. Programas condicionais de transferência de renda e fecundidade:

evidencias do Bolsa Família. Economia Aplicada, v. 22, n. 3, p. 175-201, 2018. DOI:
https://doi.org/10.11606/1980-5330/ea168739.
ROUGIER, E.; COMBARNOUS, F.; FAURÉ, Y. A. The “Local Economy” effect of social
transfers: an empirical assessment of the impact of the Bolsa Família Program on local
productive structure and economic growth. World Development, v. 103, p. 199-215,
2018. DOI: https://doi.org/10.1016/j.worlddev.2017.09.019.
SANTOS, D. B.; LEICHSENRING, A. R.; MENEZES FILHO, N.; MENDES-DA-SILVA, W.

Os efeitos do Programa Bolsa Família sobre a duração do emprego formal dos indivíduos
de baixa renda. Revista de Administração Pública, v. 51, n. 5, p. 708-733, 2017. DOI:
https://doi.org/10.1590/0034-7612171851.
SCHAFFLAND, E. Conditional cash transfers in Brazil: treatment evaluation of the

“Bolsa Família” Program on Education. Göttingen: University of Göttingen, 2011.
(Discussion Papers, n� 84). Disponível em: http://www2.vwl.wiso.uni-
goettingen.de/courant-papers/CRC-PEG_DP_84.pdf. Acesso em: 26 ago. 2022.
SCHERER, C. Payroll tax reduction in Brazil: effects on employment and wages.

Rotterdam: International Institute of Social Studies, 2015. 64p. (Working Paper, n. 602).
Disponível em: https://repub.eur.nl/pub/77532. Acesso em: 30 ago. 2022.
SEKHON, J. S. The Neymar-Rubin model of causal inference and estimation via

matching methods. Oxford: University Press, 2007
SHEI, A. Brazil’s conditional cash transfer program associated with declines in infant
mortality rates. Health Affairs, v. 32, n. 7, p. 1274-1281, 2013. DOI: https://doi.org/
10.1377/hlthaff.2012.0827.
SIGNORINI, B. A.; QUEIROZ, B. L. The Impact of Bolsa Família Program in the

beneficiary fertility. Belo Horizonte: UFMG/CEDEPLAR, 2011. 24p. (Texto para
discussão, n� 439). Disponível em:
https://www.cedeplar.ufmg.br/pesquisas/td/TD%20439.pdf. Acesso em: 26 ago. 2022.
SILVA, E. S. de A. da; PAES, N. A. Programa Bolsa Família e a redução da mortalidade

infantil nos municípios do semiárido brasileiro bolsa. Ciência Saúde Coletiva, v. 24, n. 2,
p. 623-630, 2019. DOI: https://doi.org/10.1590/1413-81232018242.04782017.
SILVA, E. S. de A. da; PAES, N. A.; SILVA, C. C. da. Efeitos dos programas

governamentais e da fecundidade sobre a mortalidade infantil do semiárido brasileiro.
Saúde em Debate, v. 42, n. 116, p. 138-147, 2018. DOI: https://doi.org/10.1590/0103-
1104201811611.
SILVEIRA, F. G.; Van HORN, R.; CAMPOLINA, B. A substitute for substitution: Bolsa
Família’s effects on the combination of work and school for children and adolescents aged
10-18. Brasília: International Policy Centre for Inclusive Growth (IPC - IG), 2013. 27p.
Disponível em: https://ipcig.org/sites/default/files/pub/en/IPCWorkingPaper121.pdf? page=
73d9cd4d54. Acesso em: 26 ago. 2022.

SILVEIRA, I. M. da et al. Avaliação do efeito do FUNDEB sobre o desempenho dos alunos
do ensino médio no Brasil. Pesquisa e Planejamento Econômico, v. 47, n. 1, p. 7-44,
2017.
SIMÕES, A. A.; SABATES, R. The contribution of Bolsa Família to the educational

achievement of economically disadvantaged children in Brazil. International Journal of
Educational Development, v. 39, p. 151-166, 2014. DOI: https://doi.org/10.1016/
j.ijedudev.2014.07.012.
SIMÕES, P.; SOARES, R. B. Efeitos do Programa Bolsa Família na Fecundidade das

Beneficiárias. Revista Brasileira de Economia, v. 66, n. 4, p. 533-556, out./dez. 2012.
DOI: https://doi.org/10.1590/S0034-71402012000400004.
SOUZA, A. P. Políticas de distribuições de renda no Brasil e o Bolsa-Família. São

Paulo: FGV-EESP, 2011. 33 p. (Texto para discussão, nº 281-C-Micro nº 01). Disponível
em: https://bibliotecadigital.fgv.br/dspace/bitstream/handle/10438/9995/TD% 2081%20
-%20C-Micro%2001%20-%20Andr%C3%A9%20Portela.pdf. Acesso em: 26 ago. 2022.
SPERANDIO, N.; RODRIGUES, C. T.; FRANCESCHINI, S. DO C. C.; PRIORE, S. E.

Impacto do Programa Bolsa Família no consumo de alimentos: estudo comparativo das
regiões Sudeste e Nordeste do Brasil. Ciência Saúde Coletiva, v. 22, n. 6, p. 1771-1780,
2017. DOI: https://doi.org/10.1590/1413-81232017226.25852016.
TAVARES, P. A. Efeito do Programa Bolsa Família sobre a oferta de trabalho das mães.
Economia e Sociedade, v. 19, n. 3, p. 613-623, 2010. DOI:
https://doi.org/10.1590/s0104-06182010000300008.
TAVARES, P.; PAZELLO, E.; FERNANDES, R.; CAMELO, R. Uma avaliação do

Programa Bolsa Família: focalização e impacto na distribuição de renda e pobreza.
Pesquisa e Planejamento Econômico, v. 39, n. 1, p. 25-58, 2009. DOI:
http://www.memoria.nemesis. org.br/index.php/ppe/article/viewFile/1062/1044. Acesso
em: 26 ago. 2022.
TEIXEIRA, C. G. A heterogeneity analysis of the Bolsa Familia Programme effect on

men and women’s work supply. Brasília: International Policy Centre for Inclusive Growth
(IPC - IG). Poverty Practice, Bureau for Development Policy, UNDP, 2010. 20p. (Working
Paper IPC-IG, nº 61), 2010. Disponível em: http://www.ipc-undp.org /pub /IPC Working
Paper61.pdf. Acesso em: 26 ago. 2022.
TORRENS, A. W. et al. Effectiveness of a conditional cash transfer programme on TB

cure rate: a retrospective cohort study in Brazil. Transactions of the Royal Society of
Tropical Medicine and Hygiene, v. 110, n. 3, p. 199-206, 2015. DOI:
https://doi.org/10.1093/ trstmh /trw011.
VASCONCELOS, A. M. et al. Programa Bolsa Família e geração “nem-nem”: Evidências

para o Brasil. Revista Brasileira de Economia, v. 71, n. 2, p. 233-257, 2017. DOI:
https://doi.org/10.5935/0034-7140.20170012.

155
Capítulo 5
Teoria da Mudança: definição,

utilidade e como construir
Isabela Furtado1
Carolina Marinho1
Carolina Melo1
1
Insper - Instituto de Ensino e Pesquisa
RESUMO:
A teoria da mudança é uma ferramenta útil para o desenho, monitoramento e avaliação de programas.
Por meio de uma sequência lógica descreve como os resultados almejados por uma intervenção
podem ser alcançados. Este capítulo tem como objetivo informar o gestor público, o avaliador ou a
parte interessada no processo de desenho, monitoramento e avaliação de uma política ou programa
sobre a definição, utilidade e método de construção de uma teoria da mudança. Por fim, para ilustrar
os conceitos apresentados, a última seção do capítulo apresenta um exemplo prático.
PALAVRAS-CHAVE:
Teoria da mudança. Cadeia de resultados. Desenho e avaliação de políticas e programas.

1 Introdução
Nas últimas décadas, as sociedades têm investido recursos monetários e não monetários
em políticas públicas. De maneira geral, as intervenções que constituem tais políticas são
desenhadas com objetivos específicos como, por exemplo, aumentar a renda de uma
população, reduzir analfabetismo e combater problemas de saúde (GERTLER et al., 2016).
Muitas vezes, políticas públicas são apresentadas para a sociedade sem que seus
resultados sejam acompanhados e mensurados (CRUMPTON et al., 2016). Porém, tão
importante quanto lançar e implementar uma intervenção é realizar seu desenho,
monitoramento e avaliação de impacto de forma adequada. Do ponto de vista da gestão, o
monitoramento permite revelar se a intervenção está sendo (ou foi) implementada conforme
seu protocolo pré-estabelecido, enquanto a avaliação de impacto busca mensurar
justamente os efeitos do programa e medir os efeitos causais da intervenção sobre os
resultados de interesse. O monitoramento é importante para a avaliação, pois, sem esse,
não se sabe o que foi de fato entregue aos beneficiários.
É, então, por meio do monitoramento e de uma avaliação de impacto que policy makers
terão os elementos necessários para verificar se o programa atingiu os efeitos esperados,
e, a partir de uma análise custo-benefício ou custo-efetividade, compreender se realizaram
um bom investimento e se, portanto, o programa deve ser continuado – condicionado ou
não a um redesenho – expandido ou cancelado. Do ponto de vista da sociedade programas
que contam com desenho, monitoramento e avaliação bem estruturados são mais
transparentes e permitem o conhecimento do grau de assertividade das decisões dos
gestores.
Porém, na prática, os programas sociais são complexos – particularmente os desafios no

setor de saúde – de forma que para que o objetivo final seja alcançado, há uma cadeia de
resultados que deve ser percorrida previamente. Nesse contexto, tão importante quanto
monitorar a implementação e mensurar os impactos sobre resultados finais está o
estabelecimento dessa cadeia de resultados interligados, que deve explicitar quais
mecanismos e hipóteses são necessários para que as ações do programa atinjam seus
objetivos. O ponto de partida é, então, a elaboração de uma teoria da mudança, a qual irá
expor à sociedade, de forma clara e objetiva, o mapa que conecta as ações executadas, as
mudanças que podem ser provocadas por essas ações e os resultados esperados.
A teoria da mudança é um conceito de bastante utilidade e está presente em políticas

públicas, programas ou projetos cujo objetivo é gerar impacto social ou ambiental positivo

157
(IMAS; RIST, 2009; KUSEK; RIST, 2004; ROGERS, 2014). Tal teoria descreve como o
resultado almejado de uma intervenção pode ser alcançado por meio de uma sequência
lógica de resultados intermediários que partem diretamente dos produtos gerados pelas
intervenções previstas (BREUER et al., 2016; GERTLER et al., 2016). A ferramenta tem
importante função na disseminação de informações relevantes de uma política pública,
programa ou projeto entre formuladores, investidores, gestores, implementadores,
avaliadores e também para a sociedade. Pode ser elaborada na fase de desenho e
planejamento da política, programa ou projeto em questão ou ainda pode ser construída
para intervenções que estão desenhadas e/ou lançadas. Independentemente da situação
em que é elaborada, a ferramenta é útil para explicitar o objetivo da política, programa ou
projeto, o problema que é atacado pela intervenção e os resultados almejados.
Este capítulo está dividido em 4 seções além desta introdução. Na segunda seção o
conceito de teoria da mudança será exposto detalhadamente, assim como sua origem e
sua estrutura. Na terceira seção, será abordada a utilidade da ferramenta, expondo-se os
principais agentes que se beneficiam da teoria da mudança. Na quarta seção, será
explicado como a teoria da mudança deve ser construída. Por fim, na última seção, se
evidenciará um exemplo prático de aplicação da teoria da mudança, que será fundamental
para que os principais conceitos sejam expostos e trabalhados.
2 O que é a Teoria da Mudança
A teoria da mudança é um conceito bastante amplo presente em políticas, programas ou

projetos que têm como objetivo gerar um impacto social ou ambiental positivo (IMAS; RIST,
2009; KUSEK; RIST, 2004; ROGERS, 2014). Assim, é construída para evidenciar e auxiliar
no entendimento do potencial encadeamento lógico entre as iniciativas de uma política,
programa, ou projeto socioambiental e as mudanças de longo prazo ou resultados finais
pretendidos. Para que se alcance o resultado final há uma série de resultados iniciais e
intermediários, os quais devem ocorrer previamente e o estabelecimento dessa cadeia de
resultados interligados deve expor os mecanismos e hipóteses necessários para que as
ações do programa sejam bem sucedidas (BREUER et al., 2016; GERTLER et al., 2016).
A teoria da mudança é, portanto, uma ferramenta que estrutura esse mapa e conecta as

ações de uma única intervenção ou de um conjunto de intervenções1 às mudanças
pretendidas.
Em uma avaliação de impacto, tão importante quanto mensurar os resultados, é o

estabelecimento das hipóteses e mecanismos que explicam como esses foram atingidos,
uma vez que identificar mecanismos é essencial para que se compreenda como a
intervenção atua e seus possíveis desdobramentos. Assim, a teoria da mudança está
inserida no desenho do plano de monitoramento de avaliação de intervenções, pois permite
definir quais indicadores serão utilizados para mensurar os resultados pretendidos, quais
as hipóteses necessárias para que as ações iniciais tenham os impactos esperados e como
e por que o programa deve funcionar.
O conceito de teoria da mudança teve sua origem em duas correntes de pensamento

distintas. Foi desenvolvida para auxiliar avaliações de impacto, mas também está ligada a
discussões mais amplas relacionadas a teorias de mudança social na década de 70
(JAMES, 2011).2 Em relação à avaliação, durante os anos 90 houve a necessidade, por
parte dos avaliadores, de se ter um framework conceitual mais explícito para auxiliá-los no
estudo de projetos sociais complexos, envolvendo diversas esferas sociais. Muitas vezes,
não estava claro como o projeto atuaria e como atingiria seus principais objetivos (JAMES,
2011). Nesse contexto, o termo “Teoria da Mudança” foi inicialmente utilizado por Weiss
(1995), que propôs um método de avaliação para intervenções complexas. Em vez de
utilizar metodologias que enfatizam o impacto por meio de avaliação de métricas
quantitativas e indicadores de resultados, a teoria da mudança assume que os programas
sociais são baseados em teorias explícitas ou implícitas que descrevem como o programa
funcionará. Weiss enfatiza que essas teorias devem ser a base da avaliação, a qual deve
considerar e avaliar as hipóteses necessárias para que o programa tenha sucesso e ainda
ancorar a avaliação em sólida literatura.
A teoria da mudança pode ser representada de diversas maneiras, com diferentes níveis
de complexidade e aprofundamento da cadeia de processos, atividades e indicadores de
resultado. Para avaliação de impacto de projetos sociais complexos, e particularmente os
projetos de saúde, a teoria da mudança é muitas vezes representada por diagramas ou por
1
Por exemplo, para que se atinja determinado objetivo de saúde pública em áreas urbanas vulneráveis,
determinada intervenção pode envolver não somente uma intervenção isolada, mas um conjunto de ações
nos campos da educação, infraestrutura básica e moradia (FUNDAÇÃO TIDE SETÚBAL; ITAÚ SOCIAL;
INSPER METRICIS, 2021).
2
As teorias de mudança social estão relacionadas à corrente de pensamento do educador Paulo Freire, que
argumentava pela combinação de teoria e ação para se criar uma mudança social.

159
uma cadeia de resultados (GERTLER et al., 2016; BREUER et al., 2016; MAINI; MOUNIER-
JACK; BORGHI, 2018). Os diagramas permitem que os elementos de programas que
envolvem diversas esferas sociais se relacionem de maneira não linear e admitam ligações
indiretas e loops nos indicadores avaliados (MAINI; MOUNIER-JACK; BORGHI, 2018).
Apesar de serem representadas de diversas maneiras, existem algumas etapas principais
ou elementos que são usualmente encontrados em teorias da mudança (INSPER
METRICIS, 2022; GERTLER et al., 2016).
1) Recursos e insumos ou inputs: incluem todos os recursos monetários e não

monetários disponíveis para o programa. Nessa etapa serão descritos os
financiamentos, os recursos físicos e os recursos de pessoal que serão utilizados.
2) Atividades: incluem as ações e intervenções do programa e todas as iniciativas

que serão efetuadas para que o programa atinja seus objetivos;
3) Produtos ou outputs: representam o que é gerado diretamente pelas atividades

e recursos do programa e geralmente podem ser contabilizados (por exemplo, em
um programa de formação de professores o produto será o número de professores
treinados ou em um programa de vacinação em massa o produto será o número de
doses de vacinas ofertadas). Como são gerados diretamente pelas atividades, estão
sob controle da agência ou instituição responsável por lançar a política, programa
ou projeto. Os produtos não representam resultados, mas são o ponto de partida
para a transformação almejada;
4) Resultados das atividades ou outcomes: representam os primeiros resultados

a serem alcançados pela iniciativa ou programa social quando a população
beneficiária usufrui dos produtos. São as primeiras mudanças que podem ocorrer e,
por isso, são também chamados de resultados iniciais – quando são gerados
diretamente pelos produtos – ou de resultados intermediários – quando dependem
dos resultados iniciais para ocorrerem. Por serem as primeiras mudanças
pretendidas, são essenciais para auxiliar no mapeamento e entendimento dos
mecanismos necessários para que o programa alcance os resultados finais
almejados;

5) Resultados finais ou resultados à sociedade: 3 representam as mudanças de
longo prazo4 almejadas pelo programa ou os seus resultados finais. São as
mudanças sociais mais amplas que o programa pretende gerar, as quais podem ser
influenciadas por diversos fatores e, muitas vezes, há uma defasagem temporal
entre a implantação da intervenção e o atingimento dessas mudanças.
A cadeia de resultados ou diagrama apresenta assim um encadeamento entre insumos,

atividades, produtos, resultados das atividades e resultados finais. São essas as cinco
etapas principais de uma teoria da mudança e, para que os resultados sejam aferidos e a
relação de causa e efeito seja de fato documentada, faz-se necessário uma avaliação de
impacto do programa em questão. Importante ressaltar que cada etapa da cadeia de
resultados é conectada com as demais por uma série de hipóteses fundamentais que
explicam como e por que o programa age. Muitas vezes, o próprio diagrama irá mostrar os
pressupostos e as condições necessárias para que o programa funcione, mas tais
pressupostos não estão sob o controle dos implementadores (ROGERS, 2014). A cadeia
de resultados também pode ser utilizada para representações mais complexas, com
diferentes atores atuando e caminhos causais distintos e não lineares (ROGERS, 2014).
Importante ressaltar que, em alguns casos, a teoria da mudança também irá mapear
possíveis resultados negativos de um programa.
Há ainda outras ferramentas muito utilizadas para monitoramento de programas sociais

que têm uma estrutura similar àquela da teoria da mudança. O marco lógico, por exemplo,
descreve algumas etapas da teoria da mudança e destaca as atividades, os produtos e os
resultados pretendidos para uma intervenção, porém, tende a ser mais rígido e linear, sem
representar a relação entre as etapas e sem explicitar as hipóteses necessárias para que
a iniciativa atinja os resultados finais (BREUER et al., 2016).
Não há consenso na literatura sobre quais são as características de uma “boa teoria da
mudança”, porém, segundo Mayne (2017), essa deve apresentar um modelo bem
3
Usualmente são também conhecidos como “Efeito” ou “Impacto”, porém por serem resultados pretendidos
preferimos as nomenclaturas “Resultados finais ou Resultados à sociedade” já que a definição de impacto
está ligada ao efeito causal propriamente dito. Quando se mapeia resultados em uma teoria da mudança,
mapeia-se potenciais resultados causais, que não podem ser considerados impactos até que seja feita uma
avaliação rigorosa que confirme-os como tais (INSPER METRICIS, 2022).
4
O conceito de longo prazo, neste contexto, não significa necessariamente um grande espaço de tempo
entre a intervenção e os resultados finais. Existem políticas sociais em que os resultados são mais
imediatos, havendo um curto espaço de tempo entre a intervenção e os resultados ou efeitos à sociedade.
O longo prazo significa que são os resultados mais distantes ou finais almejados desde a implantação do
programa ou ainda que serão os últimos resultados alcançados.

161
articulado, conectado, lógico e crível. Uma teoria da mudança com esses atributos irá apoiar
a intervenção, evidenciará que os resultados são plausíveis e também fornecerá uma base
sólida tanto para o monitoramento desta intervenção quanto para sua avaliação de impacto.
3 A Utilidade de uma Teoria da Mudança
A teoria da mudança é uma ferramenta que comunica de forma clara, lógica e visual a
política pública, programa ou projeto, explicita a intervenção que se pretende implementar,
os insumos necessários para que essa seja colocada em funcionamento, os produtos que
se espera obter a partir dessa intervenção e os resultados iniciais, intermediários e finais
necessários para que se alcance o objetivo mais amplo da intervenção (IMAS; RIST, 2009;
INSPER METRICIS, 2022; FUNNEL; ROGERS, 2011). Assim, a ferramenta tem importante
função na disseminação de informações relevantes da política pública, programa ou projeto
entre diferentes stakeholders como formuladores, investidores, gestores, implementadores,
avaliadores e também para a sociedade.
A partir da teoria da mudança, os stakeholders interessados podem, por exemplo,

facilmente identificar quais são os Objetivos de Desenvolvimento Sustentável com que a
intervenção contribui, permitindo entender como a política, programa ou projeto colabora
para avanços e resultados à sociedade.5 Se o processo de construção da teoria da
mudança envolver uma etapa de benchmarking e uma revisão de literatura rigorosa – como
sugere Weiss (1995) e Insper Metricis (2022), em que são analisados cuidadosamente
estudos prévios de intervenções similares levando-se em consideração a validade interna
e externa deles, a teoria da mudança pode ser uma ferramenta de comunicação ainda mais
poderosa, que convence a relevância da intervenção com alta credibilidade.
Para além da função como ferramenta de comunicação da política, programa ou projeto em

sentido mais amplo, a teoria da mudança pode ser útil para os formuladores da intervenção
no processo de desenho da política, programa ou projeto. Isso se deve a que ferramenta
pode ser utilizada como complemento de uma “árvore de problema” e/ou “árvore de
5
O Guia de Avaliação de Impacto Socioambiental para Utilização em Projetos e Investimentos de Impacto
do Insper Metricis, por exemplo, sugere que o avaliador que desenvolverá a teoria da mudança faça a
conexão dos resultados mapeados com os Objetivos de Desenvolvimento Sustentável e, assim, facilite o
entendimento dos stakeholders da contribuição da intervenção para o cumprimento da agenda 2030
(INSPER METRICIS, 2022).

objetivos”,6 contribuindo para a identificação das causas e consequências de um problema
socioambiental e das possíveis ações a serem tomadas para resolver tal problema e
alcançar os objetivos pretendidos (MACKENZIE; BLAMEY, 2005). Além disso, a ferramenta
é útil para formuladores no processo de argumentação no que se refere à obtenção de
financiamento. Para financiadores, a teoria da mudança pode auxiliar na justificativa da
decisão de investimento (BRASIL, 2018).
Adicionalmente, a teoria da mudança tem grande utilidade para o monitoramento e a

avaliação da política, programa ou projeto. Gestores podem guiar a implementação e o
monitoramento da intervenção utilizando os indicadores definidos a partir da ferramenta; os
avaliadores podem utilizá-la para fundamentar o desenho de uma avaliação de impacto
(MACKENZIE; BLAMEY, 2005).
A partir de uma teoria da mudança, é possível definir indicadores para os produtos e

resultados esperados de uma intervenção (INSPER METRICIS, 2022). Esses indicadores
podem ser utilizados por gestores para monitorar a implementação da política, programa
ou projeto e revelar se a intervenção está sendo (ou foi) implementada conforme seu
protocolo preestabelecido. Sem o monitoramento, não se sabe o que, de fato, foi entregue
aos beneficiários, o que tem implicações negativas na utilidade de uma futura avaliação de
impacto. Ainda que se encontre evidência sólida de que a intervenção foi bem sucedida, se
não houve monitoramento de sua implementação, são limitados os aprendizados gerados
para a sociedade e as possibilidades de expansão da política, programa ou projeto.
Por sua vez, os indicadores dos resultados mapeados a partir de uma teoria da mudança,
além de serem utilizados para monitoramento, também são úteis para mensuração de
impacto. Como os indicadores de resultado medem mudanças valorizadas pelos
beneficiários da intervenção, esses são adequados para avaliar o sucesso – ou impacto –
da política, programa ou projeto (INSPER METRICIS, 2022). A teoria da mudança também
auxilia o avaliador a definir quando a mensuração de impacto deve ser realizada. O
encadeamento dos resultados apresentados pela ferramenta pode revelar o tempo que a
intervenção leva para gerar as mudanças pretendidas para a população-alvo (IMAS; RIST,
2009). Por exemplo, se a intenção do avaliador for mensurar o impacto da intervenção
sobre um resultado que deve ser observado no longo prazo, não é recomendável realizar
a avaliação no curto prazo ou logo após o início da implementação.
6
Para mais informações sobre o que é uma árvore de problema e uma árvore de objetivos, veja (DEARDEN
et al., 2002).

163
Além de contribuir para a definição do que e quando medir, a teoria da mudança pode ser
útil para a definição da estratégia de identificação (método para inferência causal) a ser
utilizada na avaliação de impacto (MACKENZIE; BLAMEY, 2005). A partir do claro
mapeamento da intervenção, incluídos os critérios para participação dos beneficiários, as
variáveis de resultado de interesse e quanto tempo após a intervenção é necessário para
que se observe algum efeito, o avaliador pode traçar uma estratégia factível para aferição
do impacto.
De forma mais prática: a teoria da mudança irá, em um primeiro momento, guiar o avaliador
na busca por dados que permitam realizar medição de impacto. Ciente dos dados
disponíveis, o avaliador poderá, então, recorrer à teoria da mudança para obter outras
informações relevantes sobre a intervenção e para traçar uma estratégia de medição
factível que forneça o mais alto grau de validade interna possível, sem abdicar do poder de
generalização dos resultados para outros contextos (o que é importante, por exemplo, para
futuras discussões de expansão da política, programa ou projeto).
Por fim, a teoria da mudança pode ainda auxiliar o avaliador e o gestor público a
entenderem os resultados da avaliação. A avaliação pode gerar evidências de que a
conexão entre um produto e um resultado ou entre um resultado e outro resultado é
confirmada para aquela intervenção em particular. No entanto, quando a avaliação revela
que a conexão outrora mapeada não se sustenta, faz-se necessário buscar entender se
alguma hipótese assumida para garantir tal conexão é violada. Esse exercício ajuda na
identificação de potenciais causas de falhas no desenho da intervenção que impedem o
atingimento dos objetivos pretendidos. Dessa forma, a teoria da mudança contribui para o
redesenho de políticas, programas e projetos sociais (FUNNEL; ROGERS, 2011). O
constante aprimoramento da intervenção motiva a contínua revisão da teoria da mudança,
em um processo de busca incessante pela solução para um problema social complexo.
4 Como construir a Teoria da Mudança

A estratégia utilizada para construção da teoria da mudança dependerá do estágio de
implantação da política pública, programa ou projeto - se a intervenção está em fase de
elaboração e desenho, ou se já foi desenhada e até mesmo lançada.
Na situação em que a teoria da mudança é construída na fase de desenho e planejamento

da política pública, programa ou projeto, essa será essencial na definição das atividades

necessárias para gerar os resultados pretendidos pela intervenção (MACKENZIE;
BLAMEY, 2005). A abordagem “de trás para frente” será utilizada para sua construção,
iniciada pela definição dos objetivos mais amplos e resultados finais pretendidos, partirá
para a definição dos resultados intermediários e, depois, dos resultados iniciais. Com a
cadeia de resultados mapeada, o próximo passo é propor um conjunto de atividades e
produtos que a essa se conectem (CLARK, 2021; MACKENZIE; BLAMEY, 2005;
ANDERSON, 2005).
Na segunda situação, em que a teoria da mudança é elaborada quando a intervenção já foi

desenhada e possivelmente lançada, a ferramenta será estruturada, por exemplo, com o
objetivo de apoiar a avaliação de impacto (MACKENZIE; BLAMEY, 2005). Os insumos,
atividades e produtos da política, programa ou projeto estão estabelecidos e precisam
apenas ser documentados. Resta, então, mapear os resultados que se pretende gerar com
a intervenção proposta e possivelmente levantar indicadores relevantes para a
intervenção.7 A construção da teoria da mudança poderá ser realizada utilizando-se a
abordagem retrospectiva, a partir de documentos, conversas com os envolvidos e registros
de monitoramento e avaliações anteriores (CLARK, 2021). Nesse caso, recomenda-se
partir da descrição das atividades da política, programa ou projeto social e passar para a
documentação dos insumos necessários para a implementação das atividades e os
produtos diretamente gerados por essas. Por fim, deve-se mapear os resultados iniciais,
que estão conectados com os produtos das atividades, os resultados intermediários e os
resultados finais.
Independentemente da abordagem a ser utilizada, é primordial que a construção de uma

teoria da mudança abarque a identificação do problema que será atacado, incluídas suas
causas e consequências, e a definição dos objetivos mais amplos almejados pela política,
programa ou projeto. Assim, será possível compreender o escopo da política, programa ou
projeto e definir quais resultados serão apresentados no encadeamento lógico da teoria da
mudança (BAMBERGER; MABRY, 2019; ROGERS, 2014; WK KELLOGG FOUNDATION,
2004; INSPER METRICIS, 2022).
As conexões entre produtos das atividades e resultados e entre os diferentes resultados

devem ser baseadas em uma pesquisa de benchmark que recolha evidências de
7
A teoria da mudança pode ser uma ferramenta útil para a definição de indicadores que serão utilizados
para mensurar e monitorar os resultados da intervenção. Porém, o mapeamento de indicadores não
necessariamente é realizado na elaboração da teoria da mudança.

165
intervenções similares e de relações causais documentadas entre os resultados de
interesse (INSPER METRICIS, 2022). Essa pesquisa também deve subsidiar o
mapeamento das hipóteses que devem ser válidas para que cada conexão seja sustentada
(ANDERSON, 2005; RIBEIRO, 2022). Por exemplo, suponha-se um programa de
treinamento de professores de Ensino Fundamental que gera como produto determinada
quantidade de professores treinados e que esse produto esteja conectado com o resultado
descrito como “alunos aprendem matemática”. Por trás dessa conexão há uma série de
hipóteses como: professores aprendem nos treinamentos conteúdos relevantes para
melhorar a qualidade do ensino de matemática na sala de aula; professores efetivamente
implementam o que aprenderam nos treinamentos; os alunos frequentam as aulas
lecionadas por esses professores e possuem todas as outras condições necessárias para
aproveitar essas aulas etc. Se uma ou mais hipóteses não forem válidas, a conexão entre
professores treinados e o aprendizado de matemática dos alunos não será sustentada e o
programa falhará em atingir seus objetivos. Assim, recomenda-se o mapeamento das
hipóteses que sustentam as conexões estabelecidas na teoria da mudança.
É importante notar que o processo de construção de uma teoria da mudança pode se

beneficiar de consultas a especialistas e stakeholders envolvidos na política, programa ou
projeto. O engajamento de terceiros – para além dos responsáveis pela construção da
ferramenta ou dos avaliadores – pode ser usado para validação das conexões mapeadas
pela pesquisa de benchmark e também para obtenção de apoio para implementação,
monitoramento e avaliação da intervenção (CLARK, 2021; ANDERSON, 2005; FUNDAÇÃO
TIDE SETÚBAL; ITAÚ SOCIAL; INSPER METRICIS, 2021; RIBEIRO, 2022).
5 Exemplo prático de construção de uma Teoria da Mudança
Para exemplificar o processo de construção de uma teoria da mudança utilizaremos o caso

apresentado na publicação “A Lupa na Cidade: Painel de Indicadores de Desenvolvimento
de Áreas Urbanas Vulneráveis”.8 O trabalho é uma iniciativa da Fundação Tide Setúbal e
teve como objetivo criar um painel de indicadores para monitoramento do desenvolvimento
de áreas urbanas vulneráveis. A pesquisa foi realizada pelo Insper Metricis – Núcleo para
8
Material disponível em: https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-
indicadores-de-desenvolvimento-de-areas-urbanas-vulneraveis/.

Medição de Impacto Socioambiental do Insper – e financiada pela própria Fundação Tide
Setúbal e Itaú Social.9
É importante destacar que o trabalho visava a criação de um painel de indicadores para ser
aplicado a diferentes territórios urbanos periféricos que enfrentam problemas parecidos e,
portanto, não estava relacionado a uma política, programa ou projeto específico. Para
definição do conjunto de indicadores, o ponto de partida da pesquisa foi a elaboração de
uma teoria da mudança e, na ausência de um objetivo específico associado a uma
intervenção, procedeu-se ao levantamento dos problemas mais comuns em áreas urbanas
vulneráveis, os quais foram associados a objetivos gerais explicitados de forma alinhada
com os Objetivos de Desenvolvimento Sustentável (ODSs),10 também utilizados para
representar os resultados finais para a sociedade. O passo seguinte foi o mapeamento dos
resultados necessários para que tais objetivos pudessem ser alcançados e, por fim, foram
propostas intervenções (produtos, atividades e insumos) capazes de gerar esses
resultados. Assim, a construção da teoria da mudança seguiu uma abordagem “de trás para
frente”, partindo dos resultados finais para a sociedade até chegar aos insumos necessários
para a realização das atividades propostas (CLARK, 2021; MACKENZIE; BLAMEY, 2005;
ANDERSON 2005).
Para identificar os problemas mais comuns enfrentados por territórios urbanos periféricos,
a equipe de pesquisa do Insper Metricis partiu do estudo e observação de bairros periféricos
da cidade de São Paulo, como o Jardim Lapenna, localizado no distrito de São Miguel
Paulista (zona leste),11 Pinheirinho D’Água, localizado no distrito de Jaraguá (zona oeste)
e Parque Novo Mundo, localizado no distrito de Vila Maria (zona norte). Os pesquisadores
também estudaram casos bem-sucedidos de desenvolvimento de áreas urbanas periféricas
das cidades de Recife (PE) e de Medellín (Colômbia).12 Os problemas mapeados foram
9
Uma das autoras deste capítulo integrou a equipe técnica do projeto e descreve aqui a construção da teoria
da mudança sob o olhar da sua participação no processo. Quaisquer erros ou falhas na interpretação do
projeto são de responsabilidade da autora.
10
Para conhecer quais são os Objetivos de Desenvolvimento Sustentável da Agenda 2030, acesse:
https://brasil.un.org/pt-br/sdgs.
11
As experiências da Fundação Tide Setúbal em projetos de desenvolvimento do território do Jardim Lapenna
foi a grande motivação para a realização do trabalho, considerando-se que a organização apoia o
desenvolvimento do bairro desde 2005.
12
Como sugerido no trabalho “A Lupa na Cidade: Painel de Indicadores de Desenvolvimento de Áreas
Urbanas Vulneráveis”, para mais informações sobre as intervenções urbanas realizadas em Medellín,
consulte Silva (2013), Chagas (2016), Echeverri (2017), Salles e Alvim (2019), Brasil (2015) e Urán Arenas
(2012), e para mais informações sobre as intervenções urbanas realizadas em Recife, consulte Salles e Alvim
(2019), Recife (2016), Rego, Menezes e Ratton Júnior (2019).

167
classificados em oito macrotemas: segurança pública, emprego e renda, educação, capital
social, saúde pública, infraestrutura básica, moradia e mobilidade urbana.
Adicionalmente, como os problemas mapeados são complexos e multissetoriais, foram

estabelecidas conexões entre esses para possibilitar uma visão sistêmica dos desafios
enfrentados nos territórios urbanos periféricos. Podemos citar como exemplo exposição a
doenças infectocontagiosas e respiratórias, um dos problemas de saúde mapeados. Esse
problema é, evidentemente, classificado no macrotema saúde e diretamente conectado ao
ODS 3,13 mas também pode ser afetado pela falta de água tratada, coleta de esgoto e de
resíduos sólidos, por meio do aumento no risco de contaminações e incidência de doenças,
questões associadas ao macrotema infraestrutura básica.
Para cada macrotema foi elaborada uma versão inicial da teoria da mudança, partindo-se
de uma pesquisa de benchmarking que abrangeu revisão da literatura acadêmica e técnica
sobre intervenções capazes de gerar os resultados pretendidos em contextos com
características similares.14 Muitas vezes não foi possível encontrar estudos prévios que
trouxessem evidência da capacidade de uma intervenção afetar um resultado à sociedade
e contribuir para atingir um ODS de forma mais ampla. Nesses casos, buscou-se por
estudos prévios sobre intervenções capazes de afetar resultados intermediários os quais,
por sua vez, apresentassem eficácia documentada para afetar os resultados finais
pretendidos.
As versões iniciais das teorias da mudança foram, então, apresentadas para discussão com
diversos stakeholders – incluídos especialistas nos macrotemas específicos, equipe de
trabalho da Fundação Tide Setúbal e grupos de lideranças tradicionais e lideranças jovens
do bairro Jardim Lapenna – com o intuito de validar as conexões estabelecidas, verificar a
completude do trabalho feito até ali e, consequentemente, identificar novos potenciais
canais de mudanças ainda não mapeados. A partir das ideias oriundas dessas discussões,
a revisão de literatura foi integralizada e as versões iniciais das teorias da mudança foram
revisadas, produzindo uma versão final para cada um dos oito macrotemas.
Por fim, foi construída uma teoria da mudança integrada, única, que engloba todos os
macrotemas. Para tanto, primeiramente foram identificados os insumos, atividades,
13
ODS 3: Saúde e Bem-Estar - Garantir o acesso à saúde de qualidade e promover o bem-estar para todos,
em todas as idades (NAÇÕES UNIDAS BRASIL, 2022).
14
Foram priorizados estudos com o nível mais alto possível de validade interna e externa. No entanto, na
ausência de estudos quantitativos mais rigorosos, evidências qualitativas foram utilizadas; na ausência de
estudos sobre intervenções implementadas em contextos parecidos, foram utilizadas evidências sobre
contextos com características menos similares àqueles presentes nos territórios de interesse.

produtos e resultados que estavam presentes em mais de uma teoria da mudança individual
(de um macrotema específico). De forma prática, todas as teorias da mudança individuais
foram colocadas em única figura e, se algum insumo, atividade, produto ou resultado
aparecesse mais de uma vez, esse (a) foi consolidado(a) em única caixa – o que, na maioria
das vezes, envolveu um ajuste de fraseologia. Depois de consolidadas as teorias da
mudança dos diferentes macrotemas em única figura, fez-se nova revisão de literatura,
dessa vez com abordagem intencionalmente multissetorial, com o intuito de buscar por
evidências adicionais de potenciais conexões entre atividades, produtos e resultados de
diferentes macrotemas. As conexões resultantes da nova revisão de literatura foram, então,
incorporadas à figura para a representação final da teoria da mudança integrada.
Como exemplo, nas figuras 1 e 2, apresenta-se um recorte da teoria da mudança integrada

que contém as atividades classificadas sob o macrotema saúde pública.15 Como pode-se
notar na figura 1, os insumos que alimentam as atividades são descritos de uma forma
geral, por alimentarem também atividades de outros macrotemas na teoria da mudança
completa. Os produtos gerados pelas atividades de saúde pública, por sua vez, se
conectam diretamente com dois resultados, dos quais um na área da saúde – “R35:
População tem acesso a serviços de saúde básica de qualidade” e outro relacionado a
emprego e renda – “R15: População local se insere no mercado de trabalho formal, seja
como empregado ou empreendedor, incluindo as pessoas de diferentes gêneros, raças,
níveis iniciais de renda ou com deficiência”.
Na figura 2, os resultados R35 e R15 são conectados a outros resultados intermediários e

a resultados à sociedade que, devido à natureza multissetorial do problema, são expressos
não somente pelo ODS 3, o qual diz respeito a saúde e bem-estar, mas também pelos
ODSs 1, 2, 8 e 10, referentes à erradicação da pobreza, fome zero, trabalho decente e
crescimento econômico e redução das desigualdades, respectivamente.
Importante destacar ainda que os resultados das atividades podem estar conectados entre
si. Por exemplo, o R6 está conectado aos resultados R12, R13, R23 e R27. E, ao se
examinar cuidadosamente a teoria da mudança integrada completa, pode-se notar que os
resultados presentes na cadeia de mudança que parte das atividades de saúde pública
também são alimentados por atividades de outras áreas e isso também acontece com a
15
Como a teoria da mudança integrada é muito extensa, não a apresentamos completa ao leitor aqui,
contudo, essa pode ser encontrada na publicação original do trabalho, disponível em:
https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-indicadores-de-desenvolvimento-
de-areas-urbanas-vulneraveis/.

169
cadeia de mudança que parte de atividades das demais áreas. Cada resultado, portanto, é
fruto de uma orquestração de atividades de diferentes macrotemas e evidencia a
necessidade de coordenação entre múltiplos setores e múltiplos stakeholders para o
cumprimento das metas de desenvolvimento sustentável.
Figura 1 - Recorte da teoria da mudança integrada que apresenta as atividades relacionadas ao

macro tema de saúde pública (parte 1)
Fonte: Reprodução parcial da teoria da mudança apresentada na publicação “A Lupa na Cidade: Painel de
Indicadores de Desenvolvimento de Áreas Urbanas Vulneráveis”, referente a trabalho desenvolvido pelo
Insper Metricis e financiado pela Fundação Tide Setúbal e Itaú Social.

Figura 2 - Recorte da teoria da mudança integrada que apresenta as atividades
relacionadas ao macrotema saúde pública (parte 2)
Por fim, a Tabela 1 exemplifica as justificativas para as conexões entre os produtos

das atividades de saúde pública (P.5, P.6, P.31 e P.32) e os resultados iniciais (R.35 e
R.15).
Enquanto as justificativas para conexão entre os produtos e o resultado R.35 são mais
diretas, a justificativa para a conexão entre o produto de uma das atividades de saúde
pública (P.31) com o resultado de emprego e renda (R.15) é mais indireta.16
16
Um quadro completo de justificativas para todas as conexões mapeadas na teoria da mudança integrada
pode ser encontrado na publicação original do trabalho, disponível em:
https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-indicadores-de-desenvolvimento-
de-areas-urbanas-vulneraveis/.

171
Quadro 1 - Justificativas para as conexões entre os produtos das atividades de saúde pública
com o resultado de saúde pública
De: Para: Justificativa
P.5: Número de novas R.35: População tem Como um princípio do

famílias cobertas pela ESF acesso a serviços de saúde Sistema Único de Saúde
(ODS 3.8) básica de qualidade (SUS) brasileiro, atingir uma
cobertura de saúde
universal é chave para
garantir o acesso à saúde
pública de qualidade
(CASTRO et al., 2019;
WHO, 2010).
P.6: Número de protocolos e R.35: População tem Seguir protocolos e listas de

encaminhamentos aplicados acesso a serviços de saúde controle é uma forma de
adequadamente pelas básica de qualidade garantir a qualidade dos
equipes de SF serviços de saúde prestados
(WHO, 2010). A garantia da
formação de recursos
humanos adequados é um
dos aspectos necessários
para os resultados
desejáveis do ESF
(GIOVANELLA et al., 2009).
A atuação adequada das
equipes de SF deve, ainda,
favorecer a estabilidade da
família e fortalecer os laços
familiares.
P.31: Número de equipes de R.35: População tem Uma equipe de saúde

Saúde da Família acesso a serviços de saúde composta por um "mix"
compostas por, no mínimo, básica de qualidade adequado de profissionais é
um médico, um enfermeiro, essencial para que se
um auxiliar ou técnico de garanta a qualidade dos
enfermagem, Agentes serviços de Saúde da
Comunitários de Saúde Família prestados.
(com, no máximo 750
pessoas atendidas e 12
ACS por equipe) originários
das comunidades locais e
profissionais de saúde bucal
continua

conclusão
De: Para: Justificativa
P.32: Número de UBSs que R.35: População tem Para que haja uma entrega
contam com a estrutura acesso a serviços de saúde de serviços de saúde básica
adequada de suprimentos e básica de qualidade de qualidade, é necessário
equipamentos que as unidades de saúde
contem com uma estrutura
mínima de equipamentos e
medicamentos (WHO,
2010). Estudos apontam
que a infraestrutura das
unidades de saúde da
família e os equipamentos
para ações na Atenção
Básica são insuficientes e
insatisfatórios (MOREIRA et
al., 2017).
P.31: Número de equipes de R.15: População local se Empregar pessoas da

Saúde da Família insere no mercado de comunidade local como
compostas por, no mínimo, trabalho formal, seja como Agentes Comunitários de
um médico, um enfermeiro, empregado ou Saúde é uma forma de
um auxiliar ou técnico de empreendedor, incluídas as inseri-las no mercado de
enfermagem, Agentes pessoas de diferentes trabalho formal.
Comunitários de Saúde gêneros, raças, níveis
(com, no máximo 750 iniciais de renda ou com
pessoas atendidas e 12 deficiência (ODS 8.5, 8.6)
ACS por equipe) originários
das comunidades locais e
profissionais de saúde bucal
No que tange especificamente ao tema saúde pública, a teoria da mudança apresentada

na publicação “A Lupa na Cidade: Painel de Indicadores de Desenvolvimento de Áreas
Urbanas Vulneráveis” pode servir como ponto de partida ou como um modelo a ser
adaptado para a construção de teorias da mudança de diversas políticas, programas ou
projetos que envolvam tanto intervenções multissetoriais que busquem resolver problemas
de saúde quanto intervenções de saúde que busquem resolver problemas multissetoriais.

173
Referências
ANDERSON, A. A. The community builder's approach to theory of change. a practical

guide to theory development. New York: The Aspen Institute Roundtable on Community
Change, 2005. Disponível em: https://www.theoryofchange.org/pdf/TOC_fac_guide.pdf.
BAMBERGER, M.; MABRY, L. 2019. RealWorld evaluation: working under budget, time,
data, and political constraints. New Yor: Sage publication, 2019.
BRASIL. Ministério do Meio Ambiente. Sustentabilidade urbana: impactos do

desenvolvimento econômico e suas consequências sobre o processo de urbanização em
países emergentes: textos para as discussões da Rio+20: mobilidade urbana. Brasília,
DF: Ministério do Meio Ambiente, 2015. v. 1. Disponível em: https://www.mpba.mp.br/
sites/default/files/biblioteca/meio-ambiente/projeto-movimenta-planejando-mobilidade-
urbana/material_de_apoio/sustentabilidade_urbana_-_volume_1_-
_mobilidade_urbana.pdf. Acesso em: 11 set. 2022.
BRASIL. Presidência da República. Casa Civil. 2018. Avaliação de políticas públicas:

guia prático de análise ex post. Brasília, DF: Casa Civil, 2018. Disponível em:
https://www.gov.br/casacivil/pt-br/centrais-de-conteudo/downloads/guiaexpost.pdf/view.
BREUER, E. et al. Using theory of change to design and evaluate public health
interventions: a systematic review. Implementation Science, v. 11, n. 63, p. 1-17, 2016.
Disponível em: https://implementationscience.biomedcentral.com/track/pdf/10.1186/s130
12-016-0422-6.pdf. Acesso em: 11 set. 2022.
CASTRO, M. et al. Brazil's unified health system: the first 30 years and prospects for the
future. The Lancet, v. 394, n. 10195, p. 345-356, 2019
CHAGAS, M. M. W. Arquiteturas possíveis para políticas urbanas inovadoras: diálogos

entre São Paulo e Medellín. In: SIMPÓSIO INTERNACIONAL PENSAR E REPENSAR A
AMÉRICA, 2., 2016. Anais [...]. São Paulo: Universidade de São Paulo, 2016.
CLARK, H. Theory of change in a nutshell: Blog integration and implementation insights.

2021. Disponível em: https://i2insights.org/2021/08/24/theory-of-change-in-brief/. Acesso
em: 8 set. 2022.
CRUMPTON, C. D. et al. Evaluation of public policies in Brazil and the United States: a
research analysis in the last 10 years. Revista de Administração Pública, v. 50, n. 6, p.
981-1001, nov./dez. 2016. Disponível em:
https://www.scielo.br/j/rap/a/ptZ4nqddFYXYsL3ZqCSKgRz/?format=pdf&lang=en. Acesso
em: 11 set. 2022.
DEARDEN, P. et al. Tools for development: a handbook for those engaged in

development activity. Department for International Development (DFID), 2002. Disponível
em: http://www.protectedareas.info/upload/document/toolsfordevelopment-dfid.pdf. Acesso
em: 11 set. 2022.
ECHEVERRI, A. Medellín reescreve seus bairros. Revista Prumo, v. 2, n. 3, 2017.

Disponível em: http://periodicos.puc-rio.br/index.php/revistaprumo/article/view/324. Acesso
em: 11 set. 2022.

FUNDAÇÃO TIDE SETÚBAL; ITAÚ SOCIAL; INSPER METRICIS. A Lupa na cidade:
painel de indicadores de desenvolvimento de áreas urbanas vulneráveis. São Paulo:
Fundação Tide Setúbal, 2021. (Este relatório é resultado de projeto desenvolvido pelo
Insper Metricis - Núcleo para Medição de Impacto Socioambiental, sob o patrocínio da
Fundação Tide Setúbal e do Itaú Social). Disponível em:
https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-indicadores-de-
desenvolvimento-de-areas-urbanas-vulneraveis/. Acesso em: 8 set. 2022.
FUNNEL, S. C.; ROGERS, P. J. Purposeful program theory: effective use of theories of

change and logic models. San Franciso: John Wiley & Sons. 2011.
GERTLER, P. J. et al. Impact evaluation in practice. 2nd. Washington, DC: Inter-

American Development Bank and World Bank, 2016. Disponível em:
https://openknowledge.worldbank.org/handle/10986/25030. Acesso em: 11 set. 2022.
GIOVANELLA, L. et al. Saúde da Família: limites e possibilidades para uma abordagem

integral de atenção primária à saúde no Brasil. Ciência & Saúde Coletiva, v. 14, n. 3, p.
783-794, 2009. Disponível em:
https://www.scielo.br/j/csc/a/XLjsqcLYxFDf8Y6ktM4Gs3G/?format=pdf&lang=pt. Acesso
em: 11 set. 2022.
IMAS, L. G.; RIST, R. C. The road to reasults. designing and conducting effective
development evaluations. Washington, DC: World Bank, 2009. p. 59-74. The World Bank.
2009.
INSPER METRICIS. Guia de avaliação de impacto socioambiental para utilização em

projetos e investimentos de impacto: guia geral com foco em monitoramento e
verificação de adicionalidade. 5. ed. São Paulo: Insper/ Núcleo de Medição para
Investimentos de Impacto Socioambiental, 2022. Disponível em:
https://www.insper.edu.br/wp-content/uploads/2022/05/GUIA-AVALIACAO-DE-IMPACTO-
SOCIOAMBIENTAL_PT.pdf. Acesso em: 11 set. 2022.
JAMES, C. Theory of change review. London: Comic Relief, 2011.
KUSEK, J. Z.; RIST, R. C. Ten steps to a results-based monitoring and evaluation

system: a handbook for development practitioners. Washingthon, DC: The World Bank,
2004. Disponível em: https://openknowledge.worldbank.org/bitstream/handle/10986/14926
/296720PAPER0100steps.pdf?sequence=1&isAllowed=y. Acesso em: 11 set. 2022.
MACKENZIE, M.; BLAMEY, A. The practice and the theory: lessons from the application of
a theories of change approach. Evaluation, v. 11, n. 2, p. 151-168, 2005.
MAINI, R., S.; MOUNIER-JACK, S.; BORGHI, J. How to and how not to develop a theory
of change to evaluate a complex intervention: reflections on an experience in the
Democratic Republic of Congo. BMJ Global Health, v. 3, n. 1, p. 1-6, 2018. Disponível
em: https://gh.bmj.com/content/3/1/e000617. Acesso em: 11 set. 2022.
MAYNE, J. Theory of change analysis: building robust theories of change. Canadian

Journal of Program Evaluation, v. 32, n. 2, p. 155-173, 2017. Disponível em:
https://journalhosting.ucalgary.ca/index.php/cjpe/article/view/31122. Acesso em: 11 set.
2022.

175
MOREIRA, K. S. et al. Avaliação da infraestrutura das Unidades de Saúde da Família e
equipamentos para ações na Atenção Básica. Cogitare Enfermagem, v. 22, n. 2, p. 1-10,
2017. Disponível em: https://revistas.ufpr.br/cogitare/article/view/51283/pdf. Acesso em: 11
set. 2022.
NAÇÕES UNIDAS (Brasil). Sobre o nosso trabalho para alcançar os ojetivos de

desenvolvimento sustentável no Brasil: como as Nações Unidas apoiam os objetivos
de desenvolvimento sustentável no Brasil. Brasilia: Casa ONU Brasil, 2022. Disponível
em: https://brasil.un.org/pt-br/sdgs. Acesso em: 8 set. 2022.
RECIFE. Prefeitura Municipal. Centro Comunitário da Paz – COMPAZ. Recife, 2016.

Disponível em: https://www2.recife.pe.gov.br/pagina/conheca-o-compaz-fabrica-de-
cidadania-do-recife. Acesso em: 11 set. 2022.
REGO, R. R. S.; MENEZES, T. A. de; RATTON JÚNIOR, J. L. A. Política pública e

redução da criminalidade urbana: uma análise empírica do Compaz em bairros do Recife.
In: SEMINÁRIO DE CIÊNCIA POLÍTICA E RELAÇÕES INTERNACIONAIS DA UFPE, 8.,
2019, Recife. Anais ... Recife: Universidade Federal de Pernambuco, 2019. p. 1-22.
Disponível em: https://viiiseminariocpri.files.wordpress.com/2019/04/capa.pdf. Acesso em:
11 set. 2022.
RIBEIRO, M. M. R. Da teoria à prática um estudo de caso do Primeira Infância

Melhor: fatores contextuais e processuais na elaboração da Teoria da Mudança. 2022.
Dissertação (Mestrado) - Insper Instituto de Ensino e Pesquisa-Insper, 2022.
ROGERS, P. Theory of change. Florence: UNICEF Office of Research - Innocenti, 2014.

p. 1-16. (Methodological Briefs Impact Evaluation, n. 2). Disponível em:
https://www.entwicklung.at/fileadmin/user_upload/Dokumente/Evaluierung/Theory_of_Cha
nge/UNICEF_Theory_of_change.pdf. Acesso em: 11 set. 2022.
SALLES, M.; ALVIM, R. Urbanismo e segurança pública. São Paulo: BEI, 2019.
SILVA, E. Inclusión de habitantes en la ciudadanía plena: experiencias de desarrollo

urbano e inclusión social en América Latina.Carcas: Corporación Andina de Fomento-
CAF, 2013. Disponível em: https://scioteca.caf.com/handle/123456789/326. Acesso em:
11 set. 2022.
URÁN ARENAS, O. A. Participación ciudadana y espacio popular urbano en Medellín:

entre ciudadanía insurgente y programas de planeación participativa y urbanismo social -
Comuna 1 y Comuna 13. Una reflexión comparativa. E-Metropolis, n. 8, ano 3, p. 31-43,
mar. 2012. Disponível em: https://bibliotecadigital.udea.edu.co/bitstream/10495/4739/1/
Ur%c3%a1nOmar_2012_Participiaci%c3%b3nCiudadanaEspacio.pdf. Acesso em: 11 set.
2022.
WEISS, C. Nothing as practical as good theory: exploring theory-based evaluation or

comprehensive community initiatives for children families. In: CONNELL, J. P. (ed.). New
approaches to evaluating community iniatives: concepts, methods, and contexts. New
York: The Aspen Institute, 1995. p. 65-92. Disponível em:
https://canvas.harvard.edu/files/1453087/download?download_frd=1&verifier=IVZpf0ynt3ir
iSXpb8lE7WirRBXUHfbceDQUHleG. Acesso em: 11 set. 2022.

WK KELLOGG FOUNDATION. W. K. Kellogg Foundation logic model development
guide. Battle Creek: WK Kellogg Foundation, 2004. Disponível em:
https://www.naccho.org/uploads/downloadable-resources/Programs/Public-Health-
Infrastructure/KelloggLogicModelGuide_161122_162808.pdf. Acesso em: 11 set. 2022.
WORLD HEALTH ORGANIZATION. Monitoring the building blocks of health systems:

a handbook of indicators and their measurement strategies. Genebra: WHO, 2010.

177
Capítulo 6
Projetando o impacto de intervenções

futuras: princípios e métodos
Rodrigo Volmir Anderle1

Felipe Alves Rubio1
José Alejandro Ordoñez1
Davide Rasella1,2

1
2
ISGlobal, Hospital Clínic - Universitat de Barcelona, Barcelona, Espanha
RESUMO:
Este capítulo teve como objetivo apresentar as principais metodologias utilizadas para projeção de
impactos futuros de políticas em saúde ou avaliação de impacto ex-ante. Essa apresentação foi feita
de forma sucinta, destacando as principais características e exemplos de aplicação. Desse modo,
o capítulo funciona como uma porta de entrada dessa abordagem para analistas e tomadores de
decisão. O capítulo também aponta a necessidade de planejamento e continuidade na aplicação
dessas metodologias como forma de construção de recursos chaves para aplicações emergenciais
como as vivenciadas com a Covid-19.
PALAVRAS-CHAVE:
Forecast. Avaliação de impacto ex-ante. Série Temporal. Modelo compartimental. Microssimulações.
Modelo baseado em agentes.

1 Introdução
Projetar impactos de intervenções em saúde é essencial para o desenho de políticas

públicas. Esse exercício, que também pode ser chamado de avaliação do impacto ex-ante,
utiliza-se de diferentes metodologias que possam auxiliar na construção de cenários futuros
da implementação de uma política, bem como de contrafactuais (cenários sem a
intervenção) (KHANDKER; KOOLWAL; SAMAD, 2009). A comparação desses diferentes
cenários municia os tomadores de decisão com informações pontuais para a
implementação de políticas. Tais projeções podem aumentar a conscientização e o
advocacy, influenciar a implementação de políticas e o processo de tomada de decisões
(WISMAR et al., 2007).
Diferentes metodologias podem ser utilizadas para realizar esse tipo de projeção com
diferentes estruturas de dados, complexidades, premissas, modelagem de risco, incertezas
e compreensibilidade geral. Este capítulo se propõe a apresentar quatro dessas
metodologias quantitativas1; uma de base estatística, outra matemática e as duas restantes
de base computacional. Estes métodos são: I) Séries Temporais, II) Modelos
Compartimentais, III) Microssimulações e IV) Modelos Baseados em Agentes (ABM).
Essas metodologias variam em seus pressupostos e formas de modelagem do fenômeno

que trazem diferentes elementos de validação e incerteza. Seus resultados são de especial
importância para a tomada de decisão, pois as projeções apresentam resultados/cenários
mensuráveis do impacto das intervenções em análise (JOFFE; MINDELL, 2005). Para além
de trazer previsões de impactos quantitativos, essas metodologias também trazem cenários
qualitativos (por exemplo, otimistas/pessimistas, positivos/negativos) os quais auxiliam a
direcionar políticas. O exercício de consolidar evidências empíricas para projetar cenários
futuros auxilia a identificação de lacunas de conhecimento e o direcionamento de novas
pesquisas que poderão aperfeiçoar a capacidade de projetar os impactos das políticas.
Nesse sentido, realizar projeções de impactos de políticas em saúde fecha um ciclo de
produção de evidências para a condução de políticas. Este capítulo apresentará algumas
metodologias básicas para essa abordagem.
1Também é possível aplicar metodologias qualitativas de projeção de impactos de políticas que se utilizam
de entrevistas estruturadas com especialistas ou ainda de métodos que combinem abordagens quantitativas
e qualitativas.

179
2 Principais dificuldades para projeção de impactos na saúde
Altamente relevantes para a escolha de um método são as estruturas de dados e recursos

disponíveis e o contexto no qual será feita a projeção. Ao desenvolver modelos e apresentar
resultados, os pesquisadores devem trabalhar com o usuário final (por exemplo,
formuladores de políticas) desde o início dos projetos, para garantir que as perguntas e as
análises realizadas sejam viáveis, relevantes, compreensíveis, oportunas e eficientes em
termos de recursos, enquanto as expectativas mútuas são atendidas (NIEUWENHUIJSEN
et al., 2017).
Vários desafios comuns em relação aos métodos de previsão foram identificados

anteriormente (REMAIS et al., 2014) e estão relacionados a a) modelar o curso do tempo
do contrafactual, ou seja, implementação imediata versus introdução progressiva da
intervenção proposta; b) atrasos no acúmulo de benefícios de saúde e considerações de
desconto de impactos futuros; c) tratamento das incertezas, relacionadas aos parâmetros
de entrada do modelo; d) incerteza geral na projeção do futuro, relacionada a fatores de
saúde, tendências demográficas e socioeconômicas e resultados de saúde; e e) como lidar
com rupturas estruturais e imprevistos (por exemplo, crise econômica mundial, pandemias
etc.) com fortes ramificações que levam à instabilidade dos parâmetros do modelo.
3 Metodologias de projeção de impacto de intervenção futuras
Neste capítulo trata-se sobre os princípios e métodos para projetar o impacto futuro de
políticas em saúde. Focamos a discussão nos quatro modelos mais utilizados: Séries
Temporais, Modelos Compartimentais, Microssimulações e Modelos Baseados em
Agentes. Outras metodologias menos utilizadas não abordadas neste capítulo também
podem ser consideradas para esse princípio. Por exemplo, avaliação comparativa de risco
(MURRAY et al., 2004), modelos econométricos estruturais (WILLIAMS et al., 2020) e
modelos de inteligência artificial e aprendizado de máquina (GIBERT et al., 2018).
3.1 Séries temporais
Os dados em séries temporais referem-se a uma sequência de observações de uma

determinada variável que está sendo coletada ao longo do tempo, geralmente em
intervalos de tempo iguais e para única unidade de análise. A análise de séries
temporais geralmente se baseia na suposição de que o passado é um bom preditor

para o futuro. A natureza da variável de desfecho, a dependência temporal e a
presença de covariáveis servem como guias para a escolha do modelo mais
adequado.
O modelo autorregressivo (AR) assume que uma variável no presente é dependente

dos valores passados dessa variável. O modelo AR é útil para previsão quando a
estrutura de autocorrelação dos dados é substancial, significando similaridade das
observações em função do tempo. O modelo autorregressivo de média móvel
(autoregressive–moving-average – ARMA) introduz a dependência temporal dos
erros aleatórios, ou seja, a suposição de que a próxima observação é a média de
todas as observações anteriores. Os modelos AR e ARMA baseiam-se na suposição
de estacionariedade, o que implica que a média e a variância são constantes ao
longo do tempo (ou seja, não são sazonais). Como essa suposição é comumente
irrealista em desfechos de saúde – por terem geralmente um componente sazonal –
o modelo autorregressivo integrado de médias-móveis (autoregressive integrated
moving average – ARIMA) é preferido e acomoda comportamentos não
estacionários em séries temporais (HAMILTON, 1994).
Como geralmente na modelagem estatística, o modelo ARIMA consiste na

identificação, estimativa e aplicação. Durante a etapa de identificação, as funções
de autocorrelação e autocorrelação parcial são aplicadas para se verificar a
sazonalidade e outras tendências da série. Essas etapas permitem encontrar o
modelo linear apropriado para o qual os parâmetros são previstos por meio da
estimação de máxima verossimilhança. Finalmente, o modelo é aplicado para se
preverem pontos futuros no tempo.
A análise de série temporal é substancialmente diferente de outras metodologias de

previsão, pois ela somente pode prever com base em dados históricos. No entanto,
existem modelos de Séries Temporais estendidos que podem superar essa
limitação: o modelo de série temporal interrompida (interrupted time series – ITS) é
um método quase experimental usado para examinar o impacto de uma política em
única série temporal. Contudo, o ITS não considera covariáveis. Para considerá-las
pode-se contar com o paradigma Bayesiano usando modelos de regressão dinâmica
(dynamic regression models - DRM), os quais também se consideram modelos de
séries temporais. Enquanto os modelos ARIMA assumem que determinado
resultado em determinado momento depende de suas observações passadas, mas

181
não depende de outras covariáveis relevantes, os modelos de regressão podem
considerar covariáveis, mas não consideram a dependência temporal da série. Os
DRMs, por outro lado, podem combinar essas duas funcionalidades e incorporar
covariáveis, bem como levar em conta a dependência temporal (BRODERSEN et
al., 2015) e, portanto, fornecem uma previsão contrafactual flexível do período pós-
intervenção.
No entanto, ITS e DRM exigem que se façam várias observações antes e depois da
política para avaliar o impacto de forma robusta e, portanto, são aplicadas com mais
frequência em análises retrospectivas (ou seja, avaliação do impacto na saúde).
Avalia-se o efeito da política comparando-se a variação nas inclinações da série
temporal contrafactual. Se a mudança na inclinação devido à política em estudo for
conhecida, a análise de Série Temporal pode ser usada para prever os impactos na
saúde de uma proposta de política.
3.2 Modelos compartimentais
Modelo compartimental (MC) é geralmente utilizado para a modelagem de doenças

infecciosas para se prever o desenvolvimento de uma epidemia, o comportamento
de doenças endêmicas ou a eficácia de estratégias de intervenção, como a de
vacinas. O principal pressuposto do MC é que os indivíduos que compõem a
população do estudo sejam separados em compartimentos de estado de saúde
mutuamente exclusivos e que possam se deslocar de um para outro com base em
parâmetros específicos. Os MCs geralmente são executados com um sistema de
equações diferenciais ordinárias e podem ser desenvolvidos como modelos
determinísticos ou estocásticos. Um dos MCs mais simples é o modelo SIR
(Suscetível, Infectado e Recuperado). No início da epidemia, todos os indivíduos são
suscetíveis à doença e há um ou mais casos iniciais de infecção. A progressão de S
para I, em cada passo de tempo, é geralmente definida pela lei de ação das massas
(EDELSTEIN-KESHET, 2005), resultando no produto entre indivíduos suscetíveis e
infectados multiplicado pela taxa efetiva de contatos (𝛽𝛽), que é a proporção de
contatos que podem transmitir efetivamente a doença. O outro parâmetro
fundamental em um modelo SIR simples é a taxa de recuperação (𝛾𝛾), cujo valor
inverso representa o tempo médio para o indivíduo se recuperar do estágio
infeccioso. Essas hipóteses podem ser descritas pelo seguinte sistema de equações
que ilustra como as três variáveis (S, I e R) se comportam ao longo do tempo (𝑡𝑡).

𝑑𝑑𝑑𝑑
⎧ = −𝛽𝛽𝛽𝛽𝛽𝛽
⎪ 𝑑𝑑𝑑𝑑
𝑑𝑑𝑑𝑑
= 𝛽𝛽𝛽𝛽𝛽𝛽 − 𝛾𝛾𝛾𝛾
⎨𝑑𝑑𝑑𝑑
⎪ 𝑑𝑑𝑑𝑑
⎩ 𝑑𝑑𝑑𝑑 = 𝛾𝛾𝛾𝛾
Apesar da simplicidade do modelo SIR, os MCs costumam ser mais complexos, pois
são customizados de acordo com a doença infecciosa específica em estudo e a
dinâmica populacional, como incluir características demográficas (nascimento,
mortalidade natural do indivíduo, movimento migratório etc.) ou outras heterogêneas.
Como resultado, a mesma doença pode ser modelada por meio de diferentes MCs,
a depender de quais aspectos e parâmetros estão incluídos no modelo (SIETTOS;
RUSSO, 2013).
Embora os MCs tenham longa tradição e existam para quase todas as doenças
infecciosas existentes, esses se tornaram particularmente populares durante a atual
pandemia de COVID-19 (LAVIELLE et al., 2021), devido aos esforços sem
precedentes de modeladores matemáticos para se prever a propagação da doença.
Os MCs têm sido amplamente utilizados nas estratégias de intervenção voltadas

para doenças infecciosas, com tradição consolidada na modelagem de estratégias
de vacinação (OJAL et al., 2019), mas também – mais recentemente – intervenções
não farmacêuticas, como o uso de máscaras faciais para prevenção da
disseminação do COVID-19 (XIANG et al., 2021. O contrafactual, por exemplo,
estratégia de vacinação ou outra intervenção não farmacêutica, é introduzido e
modelado pelo modo como os indivíduos progridem de compartimento para
compartimento em contraste com a situação de referência. A diferença observada
na evolução das doenças infecciosas pode ser entendida como o impacto na saúde
da estratégia de intervenção.
3.3 Microssimulações
Microssimulações (MS) têm sido cada vez mais utilizadas na pesquisa em saúde
pública devido à sua capacidade de avaliar os efeitos da intervenção considerando-
se as heterogeneidades da população (ABRAHAM, 2013). Essas são capazes de
simular os efeitos diferenciais das políticas em subpopulações específicas e,

183
portanto, também fornecem informações sobre as implicações da equidade em
saúde (RASELLA et al., 2018, 2019). O processo de modelagem de
microssimulações é baseado na simulação de cada unidade (ou seja, indivíduos,
municípios, regiões etc.) que compõe a população em estudo, segundo estados de
saúde mutuamente excludentes e coletivamente exaustivos (KRIJKAMP et al.,
2018). Microssimulações representam uma abordagem bottom-up (de baixo para
cima) para se obterem resultados em nível populacional: MS simulam as trajetórias
de todas as unidades (ou uma amostra representativa que compõe a população) e
resumem os resultados de unidades individuais para se conseguirem informações
agregadas em nível populacional.
Durante a simulação, cada unidade muda seu estado, no caso de uma variável
categórica, ou seus valores, no caso de uma variável contínua, com base nas
probabilidades de transição específicas da unidade. Essas probabilidades podem
seguir a suposição de Markov, de que a probabilidade de transição depende apenas
do estado atual da unidade, considerando-se os estados ou valores de outras
variáveis demográficas e socioeconômicas da unidade ou outras regras de
transição mais complexas (ROBERTS et al., 2012). Uma distinção útil das MS é
entre modelos estáticos ou dinâmicos: os estáticos procuram reproduzir o impacto
de uma política nas unidades em determinado momento, enquanto os
dinâmicos rastreiam trajetórias e transições de unidades ao longo do tempo
(RUTTER; ZASLAVSKY; FEUER, 2011).
Embora as MS representem uma ferramenta poderosa para simular o impacto de

políticas com um alto nível de precisão não alcançável com outros modelos, também
exigem grande quantidade de dados para representar de forma holística a
heterogeneidade dos parâmetros populacionais. Além disso, as MS geralmente
requerem a construção de códigos complexos que usam computação paralela e
demandam tempo e capacidade de processamento (KRIJKAMP et al., 2018).
Algumas plataformas amigáveis foram criadas para facilitar e agilizar a execução das
MS (RICHIARDI; RICHARDSON, 2017). Apesar dessas limitações, MS podem ser
consideradas um dos modelos mais flexíveis para se avaliar políticas contrafactuais
sobre diferentes resultados populacionais e de saúde. Embora seu uso no campo da
saúde pública seja relativamente novo, essas já foram usadas para fins de HIA em
contextos políticos muito diversos – desde o impacto da tributação de bebidas
açucaradas na obesidade na Índia (BASU et al., 2014) aos efeitos das políticas

fiscais sobre a mortalidade prematura na Escócia (RICHARDSON et al., 2020) e,
mais recentemente, para a avaliação de custo-benefício das estratégias de controle
da COVID-19 na África do Sul (REDDY et al., 2021).
3.4 Modelos baseados em agentes
Modelos baseados em agentes – Agent-Based Models (ABM) – são aqueles de

simulação computacional que reproduzem sistemas complexos. Ou seja, sistemas
em que as interações não-lineares entre agentes heterogêneos produzem resultados
agregados que não podem ser atingidos pela simples soma das partes (STERMAN,
2006). Tal tipo de modelagem é utilizada em diversos campos da ciência, mas tem
tido crescente uso com o aumento da capacidade computacional que potencializa
sua utilização (HEATH; HILL, 2010).
Em um sistema, os agentes são definidos como indivíduos/unidades que se

comportam de acordo com determinadas regras em uma configuração inicial e
interagem uns com os outros e com o seu ambiente ao longo do tempo (HAMMOND,
2015). A aplicação pode assumir diferentes estruturas espaciais, no espaço e no
tempo, difíceis de representar em outras abordagens que dependem de
aproximações e agregações (HAMMOND, 2015). ABMs podem considerar a
adaptação de agentes, os quais podem ser biológicos (por exemplo, alterações
fisiológicas) ou comportamentais (por exemplo, aprendizagem) (MACAL, 2016).
Os diferentes elementos do ABM podem ser organizados de acordo com o

framework PARTE (Propriedades, Ações, Regras, Tempo, Ambiente)2 (HAMMOND,
2015). Propriedades, ações e regras definem os agentes enquanto o tempo e o
ambiente definem o contexto.
Propriedades são características individuais dos agentes. Ações definem o

comportamento específico dos agentes e podem levar a uma mudança nas suas
propriedades, de outros agentes, do ambiente e/ou das próprias regras do agente.
Para cada ação incluída, o pesquisador deve definir regras sob as quais a ação é
acionada, e cada ação deve ter consequências definidas. As regras definem como
os agentes escolhem ações, alteram propriedades e interagem entre si e com seu
ambiente. O tempo é a unidade na qual são definidas regras, ações e mudanças nas
2
Do inglês Properties, Actions, Roles, Time, Enviroment.

185
propriedades ou no ambiente. O ambiente fornece os limites e o contexto para os
agentes e suas interações e pode mudar ao longo do tempo como resultado da ação
do agente (isto é, mudança endógena) ou como resultado de uma intervenção ou
política (ou seja, mudança exógena).
Embora o ABM seja uma ferramenta poderosa para simular sistemas complexos,
sua construção não é trivial. Escolhas específicas de funções e/ou algoritmos podem
afetar sensivelmente seus resultados e sua formulação pode ficar complexa demais,
a ponto criar dificuldades para sua compreensão e interpretação e, assim, tomar o
sentido contrário aos seus objetivos. É desafiador combinar simplicidade e realismo
nos modelos. Suposições sobre propriedades, ações, regras, tempo e ambiente
precisam ser bem fundamentadas em dados e evidências empíricas – ou teóricas.
Contudo, há um esforço de tornar as aplicações mais acessíveis com o
desenvolvimento de softwares específicos (ABAR et al., 2017), valendo sempre a
premissa de inserir complexidade aos modelos, sem torná-los complexos demais.
Um exemplo disso ocorreu no início das propostas de intervenção para o

enfrentamento da Covid-19. Em meio às discussões sobre as políticas de
distanciamento social, um artigo do Washington Post trouxe uma aplicação
simplificada para demonstrar o efeito do distanciamento social na redução da
propagação da Covid-19 (STEVES, 2020). Ao demonstrar que diminuindo as
interações entre as pessoas achatavam-se as curvas de infecção, a simulação,
mesmo simplista, proporcionou maior clareza sobre como aquela política afetaria a
população como um todo. Outros exemplos de aplicações podem ser encontrados
para o HIV (TULLY; COJOCARU; BAUCH, 2013; MARSHALL et al., 2012),
estratégias de vacinação (FERGUSON et al., 2005) e mesmo Covid-19 (SILVA et
al., 2020). A flexibilidade da abordagem ainda permite a sua utilização em outros
problemas complexos em saúde (GALEA; RIDDLE; KAPLAN, 2010), como a
interação entre epidemiologia social (LINK; PHELAN, 1995) com doenças não
infecciosas (NIANOGO; ARAH, 2015; ELLIOTT; KIEL, 2004): por exemplo, a relação
entre status social e tabagismo (CHAO; HASHIMOTO; KONDO, 2015) ou dieta
nutricional e desigualdades de renda (AUCHINCLOSS et al., 2011).

É preciso considerar que cada metodologia possui seus pressupostos e uma extensa
literatura por trás e também que é necessário um aprofundamento maior da metodologia
elegida para a projeção de impacto em saúde. Este capítulo buscou apresentar,
brevemente, quatro dentre as mais utilizadas para esse fim. Identificamos em um quadro
síntese (Quadro 1), uma caracterização geral dessas e destacamos softwares e linguagens
comumente utilizados nessas aplicações. O uso dessas metodologias não é restrito a esses
softwares e linguagens, pelo contrário, o desenvolvimento de aplicações específicas que
buscam tornar mais acessível a utilização dessas metodologias é cada vez maior. Ao
mesmo tempo, equipes transdisciplinares têm investido no desenvolvimento de modelos
em linguagens de programação tradicionais, como C++ e JavaScript, otimizando sua
capacidade de processamento e complexidade.
Quadro 1 - Síntese das metodologias apresentadas para projeção de impactos em saúde

Softwares/
Metodologia Síntese
Linguagens *
Método estatístico baseado em série histórica de
dados. Pressupõe que o futuro é uma representação Stata, R,
Série Temporal
aproximada do passado. É um método consolidado Python
em diversos campos da ciência.
Método matemático de ampla utilização na
Modelos epidemiologia. Divide população em compartimentos R, Python,
Compartimentais de análise que interagem a partir de equações Matlab
diferenciais e apontam a evolução do fenômeno.
Método computacional baseado em indivíduos.
Reproduz trajetórias heterogênas das unidades de
Microssimulações R, Python
análise e produzem sucesivamente informações
agregadas para análise.
Método computacional que reproduz fenômenos a
Modelo
partir da interação de agentes individuais. Possui R, Python,
Baseados em
flexibilidade de aplicação, mas requer tempo de Netlogo
Agentes
desenvolvimento e capacidade computacional.
Fonte: Elaboração própria. *A aplicação dessas metodologias não é restrita aos softwares/linguagens
sugeridos aqui. Esses são apenas indicações de softwares comumente utilizados na área da saúde que
também podem ser utilizados para essas metodologias.

187
Para além das características das metodologias, a sua utilização depende de fatores
diversos. De recursos computacionais e humanos – capacidade de processamento,
softwares específicos e know-how da equipe disponível – a prazos de execução e grau de
detalhamento do problema a ser explorado. Esses elementos se relacionam com aquilo que
os gestores de projetos chamam de a tripla restrição (Van WYNGAARD; PRETORIUS J;
PRETORIUS L; 2012): escopo, tempo e custo.
O processo – que não é necessariamente linear nem restrito a um único ponto de partida –
pode se iniciar com a política/fenômeno a ser observada(o) e a identificação dos recursos
disponíveis para análise (ROBERTS et al., 2012). Por recursos, entende-se uma
diversidade de fatores que podem variar de projeto para projeto. Contudo, alguns
elementos são mais recorrentes: tempo de execução, expertise da equipe, conhecimento
sobre o fenômeno/política, capacidade computacional e disponibilidade de recursos
financeiros. São elementos que acabam delimitando o que é possível fazer dentro das
condições disponíveis.
A expertise da equipe em relação à política e as metodologias afetam o tempo de
desenvolvimento e, caso não seja um recurso disponível, demandará a contratação de
consultores ou de novos membros para a equipe. É necessário identificar quais são os
prazos para execução da avaliação e qual seu escopo para identificar quais metodologias
são mais viáveis. Por exemplo, todos os modelos aqui apresentados podem ter diferentes
níveis de complexidade e detalhamento, mas modelos baseados em indivíduos (individual-
Based Models, IBM) (WILLEM et al., 2017), como microssimulações e baseados em
agentes, usualmente necessitam mais tempo de desenvolvimento. Como esses modelos
são bastante flexíveis, demandam mais tempo para concepção e programação. Apesar de
também serem flexíveis, modelos compartimentais e de séries temporais possuem uma
literatura consolidada e uma estrutura básica que permitem avançar mais rapidamente no
desenvolvimento das avaliações.
Sempre haverá trade-offs na adoção de um modelo específico e limitações nas projeções

realizadas. Isso aponta para, mais do que identificar um modelo-chave de projeção de
impacto das políticas, a importância de um exercício constante de projeção, utilizando-se
diferentes metodologias e tornando essa prática comum e rotineira na política pública. Por
consequência, aumentando-se os recursos disponíveis para o refinamento da prática,
contribuindo para o desenvolvimento de políticas baseadas em evidências e construindo
um capital científico para atuações emergenciais como a vivenciada pela Covid-19.

Referências
ABAR, S. et al. Agent based modelling and simulation tools: a review of the state-of-art
software. Computer Science Review, v. 24, p. 13-33, 2017.
ABRAHAM, J. M. Using microsimulation models to inform U.S. health policy making.

Health Services Research, v. 48, (2 pt. 2), p. 686-695, 2013.
AUCHINCLOSS, A. H. et al. An agent-based model of income inequalities in diet in the

context of residential segregation. American Journal of Preventive Medicine, v. 40, n. 3,
p. 303-311, 2011.
BASU, S. et al. Averting obesity and type 2 diabetes in India through sugar-sweetened
beverage taxation: an economic-epidemiologic modeling study. PLoS Medicine, v. 11, n.
1, p. e1001582, 2014.
BRODERSEN, K. H. et al. Inferring causal impact using bayesian structural time-series

models. Annals of Applied Statistics, v. 9, n. 1, p. 247-74, 2015.
CHAO, D.; HASHIMOTO, H.; KONDO, N. Dynamic impact of social stratification and social
influence on smoking prevalence by gender: an agent-based model. Social Science
Medicine, v. 147, p. 280-287, 2015.
EDELSTEIN-KESHET, L. Mathematical models in biology. Philadelphia: Society for

Industrial and Applied Mathematics, 2005. 586 p. (Classics in applied mathematics).
ELLIOTT, E.; KIEL, L. D. Agent-based modeling in the social and behavioral sciences.
Nonlinear Dynamics, Psychology and Life Sciences, v, 8, n. 2, p. 121-130, 2004.
FERGUSON, N. M. et al. Strategies for containing an emerging influenza pandemic in

Southeast Asia. Nature, v. 427, n. 7056, p. 209-214, 2005.
GALEA, S.; RIDDLE, M.; KAPLAN, G. A. Causal thinking and complex system approaches
in epidemiology. International Journal of Epidemiology, v. 39, n. 1, p. 97-106, 2010.
GIBERT, K. et al. Which method to use? An assessment of data mining methods in

environmental data science. Environmental Modelling Software, v. 110, p. 3-27, 2018.
HAMILTON, J. D. Time series analysis. Princeton -New Jersey: Princeton University

Press, 1994. (Time Series Analysis).
HAMMOND, R. A. Considerations and best practices in agent-based modeling to inform

policy. In: WALLACE, R.; GELLER, A.; OGAWA, V. A. (ed.). Assessing the use of
agent-based models for tobacco regulation. Washington DC: The National Academy of
Sciences, 2015. p. 161-193.
HEATH, B. L.; HILL, R. R. Some insights into the emergence of agent-based modelling.
Journal of Simulation, v. 4, n. 3, p. 163-169, 2010.
JOFFE, M.; MINDELL, J. Health impact assessment. Occupational Environmental

Medicine, v. 62, n. 12, p. 907-912, 2005.

189
KHANDKER, S. B.; KOOLWAL, G.; SAMAD, H. Handbook on impact evaluation:
quantitative methods and practices. Washington DC: The World Bank, 2009.
Disponível em: http://elibrary.worldbank.org/doi/book/10.1596/978-0-8213-8028-4. Acesso
em: 6 set. 2022.
KRIJKAMP, E. M. et al. Microsimulation modeling for health decision sciences using R: a

tutorial. Medical Decision Making, v. 38, n. 3, p. 400-422, 2018.
LAVIELLE, M. et al. Predicting the propagation of COVID-19 at an international scale:

extension of an SIR model. BMJ Open, v. 11, n. 5, p. 1-7, 2021.
LINK, B. G.; PHELAN, J. Social conditions as fundamental causes of disease. Journal

Health Social Behavior, p. 80-94, 1995. N. spec.
MACAL, C. M. Everything you need to know about agent-based modelling and simulation.
Journal of Simulation, v. 10, p. 144-156, 2016.
MARSHALL, B. D. L. et al. A complex systems approach to evaluate HIV prevention in

metropolitan areas: preliminary implications for combination intervention strategies. PLoS
ONE, v. 7, n. 9, p. 1-16, Sep. 2012. Disponível em:
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0044833. Acesso em: 6
set. 2022.
MURRAY, C. et al. Comparative quantification of health risks: conceptual framework and

methodological issues. In: EZZATI, M. (ed.). Comparative quantification of health risks
global and regional burden of disease attributable to selected major risk factors.
Geneva: WHO, 2004. v.1. Disponível em: https://apps.who.int/ iris/ handle/10665/42770.
NIANOGO, R. A.; ARAH, O. A. Agent-based modeling of noncommunicable diseases: a

systematic review. American Journal of Public Health, v. 105, n. 3, p. 20-31, Jan. 2015.
.
NIEUWENHUIJSEN, M. J. et al. Participatory quantitative health impact assessment of
urban and transport planning in cities: A review and research needs. Environment
International, v. 103, p. 61-72, 2017.
OJAL, J. et al. Sustaining pneumococcal vaccination after transitioning from gavi support:
a modelling and cost-effectiveness study in Kenya. Lancet Global Health, v. 7, n. 5, p.
644-654, 2019.
RASELLA, D. et al. Child morbidity and mortality associated with alternative policy
responses to the economic crisis in Brazil: a nationwide microsimulation study. PLoS
Medicine, v. 15, n. 5, p. 1-20, 2018.
RASELLA, D. et al. Mortality associated with alternative primary healthcare policies: a

nationwide microsimulation modelling study in Brazil. BMC Medicine, v. 17, n.1, p. 1-11,
2019.
REDDY, K. P. et al. Cost-effectiveness of public health strategies for COVID-19 epidemic

control in South Africa: a microsimulation modelling study. Lancet Global Health, v. 9, n.
2, p. 120-129, 2021.

REMAIS, J. V. et al. Estimating the health effects of greenhouse gas mitigation strategies:
addressing para metric, model, and valuation challenges. Environmental Health
Perspectives, v. 122, n. 5, p. 447-455, 2014.
RICHIARDI, M. G.; RICHARDSON, R. E. JAS-mine: a new platform for micosimulaton and

agent-based modelling. International Journal of Microsimulation, v. 10, n. 1, p.
106-134, 2017.
RICHARDSON, E. et al. The effect of income-based policies on mortality inequalities in

Scotland: a modelling study. The Lancet Public Health, v. 5, n. 3, p. 150-156, 2020.
ROBERTS, M. et al. Conceptualizing a model: a report of the ISPOR-SMDM modeling

good research practices task force-2. Medical Decision Making, v. 32, n. 5, p. 678-689,
2012.
RUTTER, C. M.; ZASLAVSKY, A.; FEUER, E. Dynamic microsimulation models for health
outcomes: a review. Medical Decision Making, v. 31, n. 1, p. 10-18, 2011.
SIETTOS, C. I.; RUSSO L. Mathematical modeling of infectious disease dynamics.

Virulence, v. 4, n. 4, p. 295-306, 2013.
STEVENS, H. Why outbreaks like coronavirus spread exponentially, and how to

“flatten the curve”. The Washington Post, 2020. Disponível em:
https://repository.gheli.harvard.edu/repository/collection/teaching-pack-covid-19-
collegegraduate-resources/resource/13305. Acesso em: 14 set. 2022.
SILVA, P. C. L. et al. COVID-ABS: an agent-based model of COVID-19 epidemic to

simulate health and economic effects of social distancing interventions. Chaos Solitons
and Fractals, v. 139, p. 1-16, Oct. 2020. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7340090/. Acesso em: 6 set. 2020.
STERMAN, J. D. Learning from evidence in a complex world. American Journal of

Public Health, v. 96, n. 3, p. 505-514, Mar. 2006.
TULLY, S.; COJOCARU, M.; BAUCH, C. T. Coevolution of risk perception, sexual

behaviour, and HIV transmission in an agent-based model. Journal of Theoretical
Biology, v. 337, p. 125-132, 2013.
VAN WYNGAARD, C. J.; PRETORIUS, J. H. C.; PRETORIUS, L. Theory of the triple

constraint - A conceptual review. In: IEEE INTERNATIONAL CONFERENCE
ON INDUSTRIAL ENGINEERING AND ENGINEERING MANAGEMENT, 2012. Hong
Kong. Anais [...]. Hong Kong: IEEE, 2012. p. 1991-1997. Disponível em:
http://ieeexplore.ieee.org/document/6838095/. Acesso em: 6 set. 2022.
XIANG, Y. et al. COVID-19 epidemic prediction and the impact of public health
interventions: a review of COVID-19 epidemic models. Infectious Disease Modelling, v.
6, p. 324-342, 2021.
WILLIAMS, M. J. et al. External validity and policy adaptation: from impact evaluation to
policy design. World Bank Research Observer, v. 35, n. 2, p. 158-191, 2020.
WISMAR, M. et al. (ed.). The effectiveness of health impact assessment: scope and
limitations of supporting decision-making in Europe. World Health Organization. European
Observatory on Health Systems and Policies, 2007.

191
WILLEM, L. et al. Lessons from a decade of individual-based models for infectious disease
transmission: a systematic review (2006-2015). BMC Infectious Diseases, v. 17, p. 1-16,
2017. Disponível em: https://bmcinfectdis.biomedcentral.com/track/pdf/10.1186/
s12879-017-2699-8.pdf. Acesso em: 6 set. 2022.

Capítulo 7
Causalidade e sobredeterminação:
abordagem translacional-
transdisciplinar na avaliaçao em saúde
Naomar de Almeida-Filho1
Denise Coutinho2
1
2
Instituto de Psicologia, Universidade Federal da Bahia
RESUMO:
Problematiza-se aqui a ideia clássica de determinação causal e apresenta-se o conceito de
sobredeterminação, visando à construção de modelos de avaliação tecnológica de interesse
dos gestores em saúde. Para isso, inclui-se a proposta de ‘redes de sobredeterminação’ como
possibilidade de aplicação das epistemologias do Sul aos temas da saúde e correlatos. Em uma
dimensão pragmático-crítica, argumenta-se que a articulação transdisciplinar de estratégias de
pesquisa permite uma abordagem translacional capaz de dar conta de problemas complexos no
campo da saúde.
PALAVRAS-CHAVE:
Sobredeterminação. Causalidade. Ciência translacional. Transdisciplinaridade. Avaliação tecnológica
em saúde.

193
A partir de um enfoque socio-histórico das ciências da saúde, temos buscado examinar o
papel crucial da série semântica determinante-determinação-determinismo para uma
hermenêutica própria da epidemiologia (ALMEIDA-FILHO; COUTINHO, 2007; COUTINHO;
ALMEIDA-FILHO; CASTIEL, 2011). Particularmente no que diz respeito à prática científica
no campo da saúde coletiva, argumentamos que uma determinação causal e linear omite
ou encobre a complexidade das relações entre matéria (substrato físico-químico-biológico
da fisiologia-patologia), forma (contexto ecológico-econômico-social-político) e imaginário
social da saúde-doença-cuidado (o sistema de signos, significados e práticas de saúde)
(ALMEIDA-FILHO, 2000; ALMEIDA-FILHO; COUTINHO, 2007; COUTINHO; ALMEIDA-
FILHO; CASTIEL, 2011). Em um primeiro esforço de desconstrução do determinismo
epidemiológico clássico, postulou-se que pressupostos pré-teóricos da lógica causal
cultivada pela ciência epidemiológica compreendem basicamente três metáforas: evento,
nexo e fluxo (ALMEIDA-FILHO, 1992; ALMEIDA-FILHO, 2000). A metáfora de evento
pressupõe um universo composto por entidades individuais (chamados fatos) que podem
ser incluídas ou excluídas de agregados chamados “conjuntos”. A operação mais
fundamental e de fato indispensável para começar a desconstruir a ideia de causalidade
consiste em explicitar que essa se sustenta na relação binária causa-efeito, base do modelo
mínimo de determinação inscrito no referencial ideológico do causalismo. Essa distinção se
constrói por meio de um processo de produção do conhecimento, no qual a noção de nexo
expressa uma conexão necessária entre eventos. A noção de fluxo, no sentido de
assimetria, direcionalidade, temporalidade, representação espacial ou linear do tempo,
fundante da lógica conjuntista do pensamento ocidental, completa essa série metafórica
(CASTORIADIS, 1982).
Neste capítulo, pretende-se avaliar debates teóricos recentes na linhagem conceitual

causa-causalidade-causalismo, visando à superação dos limites desse referencial na
construção de modelos de avaliação de interesse para planejadores e gestores em saúde.
Para isso, em primeiro lugar, analisa-se criticamente modelos de determinação que têm
desafiado a capacidade das ciências de produzir conhecimento no referencial do
causalismo clássico (PEARL, 2009), o qual designamos como neocausalismo pós-
empiricista. Em segundo lugar, rediscute-se a noção da ‘sobredeterminação’, assinala-se
sua presença original na psicanálise freudiana e, em seguida, no marxismo althusseriano,
além de revisar brevemente alguns de seus desdobramentos pela perspectiva
descolonizadora das epistemologias do Sul (SOUSA-SANTOS, 2018). Em terceiro lugar,
submete-se uma proposta de aplicação da ideia de ‘redes de sobredeterminação’
específica para o campo da saúde, cobrindo vetores e fatores que podem ser referenciados

por processos determinantes de fenômenos do campo da saúde e correlatos. Por último,
com a pretensão de articular essa cadeia conceitual na dimensão pragmático-crítica de
Baskhar (1978; 1986) e Samaja (1987; 1994), argumenta-se que a articulação de
estratégias de pesquisa capazes de resolver problemas complexos e processos
determinantes requer explorar desafios e possibilidades de uma abordagem translacional
transdisciplinar no campo da saúde.
1 Neocausalismo pós-empiricista
O neocausalismo tem alcançado grande difusão na comunidade científica e nas redes

institucionais da saúde pública, especialmente nos países do hemisfério norte. Essa
abordagem parte de rigorosa formalização estatística, subsidiada principalmente pela
reflexão de três especialistas em lógica matemática aplicada: Patrick Suppes (1970),
Wesley Salmon (1970) e Judea Pearl (1988). O princípio fundamental dessa abordagem é
o de que as suposições causais não podem ser verificadas – mesmo de modo provisório
ou parcial – a menos que se recorra ao controle experimental, com desenhos de estudos
que incorporam o que Pearl (2009) chama “sensibilidade a pressupostos causais”. No plano
metodológico, neocausalistas têm desenvolvido soluções derivadas da path analysis
clássica e dos modelos de equação estrutural da econometria que rapidamente se tornaram
influentes na reconfiguração da análise epidemiológica nas últimas décadas
(GREENLAND; PEARL; ROBINS, 1999). Tais estratégias analíticas, articuladas, incluem
diagramas chamados DAGs (Directed Acyclic Graphs) (VANDERWEELE; ROBINS, 2007),
equações estruturais (AMORIM et al., 2010) e modelos gráficos contrafactuais (PEARL,
2010).
Pearl (2009; 2010) postula a explicitação das bases epistemológicas dos pressupostos
estatísticos dos modelos causais e destaca as categorias de linearidade e normalidade
(além de outras premissas que ele chama de “funcionais-distributivas”), especialmente
quando variáveis categóricas estão envolvidas. Como fundamento para uma definição
intuitiva de causalidade contrafactual, Pearl (2009, p. 332) adverte que
nada numa função de distribuição nos diz como essa distribuição seria
diferente se as condições externas mudassem – digamos, da configuração
observacional para a experimental – porque as leis da teoria da
probabilidade não ditam como uma propriedade de uma distribuição deve
mudar quando outra propriedade é modificada.

195
Pearl (2010) insiste que os modelos estruturais – graças à evolução da computação
eletrônica e dos métodos não paramétricos – não apenas permitem codificar informações
de variância; conseguem também testar suposições estatísticas, dada uma amostra
suficientemente grande e medidas com maior grau de precisão. Assim, o desenho do
estudo experimental funciona como fonte de formulação contrafactual, à medida que
permite avaliar suposições causais significativas para que se possa inequivocamente (pelo
menos dentro dos limites tecnológicos disponíveis) verificar a plausibilidade ou
inevitabilidade das hipóteses causais.
Na epidemiologia, toda uma geração com formação matemática competente e base lógica
sólida como Paul Holland (1986), Sander Greenland (1990) e James Robins (2001),
reforçados por Olli Miettinen – em sua fase recente – acorre em defesa dessa linha teórica.
Como fundamentação epistemológica do neocausalismo contrafactual nesse campo,
Miettinen (2013) propõe o que chama três gnoses (diagnose, etiognose, prognose),
distinção necessária para a produção de modelos causais baseados em estimativas
probabilísticas individualizadas. Seu objetivo declarado é a formalização de uma nova
teoria da pesquisa em saúde com foco em “investigação metaepidemiológica” (MIETTINEN;
KARP, 2012). Recentemente, Miettinen, Steurer e Hofman (2019) dedicaram um apêndice
à inteligência artificial como apoio diagnóstico, mesmo como alternativa à avaliação clínica,
em um projeto ambicioso de promoção de uma “medicina gnóstica”, dita “baseada em
conhecimento científico” – para se distinguir da medicina baseada em evidências –
supostamente mais adequada aos novos contextos de cuidado em saúde.
Não obstante seu apelo pragmático e sua fundamentação acadêmica e científica

conceitualmente integradora, essa versão avant-garde do causalismo suscita debates.
Maldonado (2016) analisa criticamente o uso da teoria contrafactual como parâmetro de
validade para produção de evidência na epidemiologia. Argumenta que a abordagem
intervencionista do neocausalismo meramente recupera o desenho do ensaio clínico
randomizado como padrão-ouro para uma definição empírica de causalidade, não distante
do que pregava a epidemiologia clínica convencional. Krieger e Davey-Smith (2016)
formulam uma crítica devastadora à moda das redes causais bayesianas, dos DAGs e do
raciocínio contrafactual na epidemiologia do século 21. Para eles, a abordagem
neocausalista se arrisca a reduzir o escopo do campo da pesquisa em saúde, ao delimitar
o que pode ser considerado uma 'causa' a partir de parâmetros definidos por
pressuposições biológicas e sociais sem estatuto teórico. Grafos e equações estruturais
podem ser instrumentalmente úteis, mas não substituem conceitos de uma teoria

consistente. Em suma, argumentam que nenhuma abordagem metodológica de inferência
causal estaria epistemologicamente autorizada a estabelecer o que deve ser definido como
evidência relevante.
Morabia (2005) defende que a epidemiologia tem uma concepção própria, sui generis, de
causalidade. Em suas palavras, “a inferência causal na epidemiologia consiste em verificar
a coerência lógica de uma declaração de causalidade e determinar se o que foi encontrado
grosseiramente contradiz o que achamos que já sabemos” (MORABIA, 2005, p. 1). Em
ensaio mais recente, Morabia (2013) analisa que a ideia de inferência causal pode ser
rastreada até os filósofos ingleses Hume e Mill, bem antes de justificar os critérios de Hill.
Por outro lado, o modo de estabelecer causalidade estabelecido nos postulados de Henle-
Koch – oriundos da bacteriologia e que ainda prevalecem na abordagem clínica
convencional – em todos os casos exige que o efeito específico siga uma dada causa, tão
específica quanto o efeito esperado.
As propostas de retorno à causalidade atualmente vigentes são muito diferentes entre si.
Uma, de orientação biomédica, apresenta-se como alternativa viável de volta de uma noção
de determinação causal aberta, uma suposta causalidade empírica, de retorno à causa
necessária de Galileu, que toma o termo de Aristóteles. Outra tenta recuperar a causalidade
como um “causalismo atenuado”, uma forma de representar causalidade baseada em uma
referência probabilística pós-bayesiana. A primeira se mostra causalista sem disfarces; a
segunda, ao fazer justiça à sua sofisticação teórica, seria um causalismo pós-empiricista.
No entanto, no nível interpretativo, ambas as propostas de retorno à causalidade
permanecem lineares, deterministas, monótonas (todos os nexos entre seus elementos são
da mesma natureza) e desconsideram a variedade de relações encontradas no complexo
espaço das funções de ocorrência de doenças.
Enfim, pode-se supor que o mundo não se rege apenas por modalidades estáveis e
unívocas de nexos entre eventos (SAMAJA, 2004). Vários fenômenos com características,
ponderações, potencialidades diferentes, mas que têm a capacidade de atuar
conjuntamente para provocar desfechos não obrigatoriamente indesejáveis, dependem de
condições e circunstâncias específicas e fortuitas como determinantes ou condicionantes
dos seus efeitos. Mais: seres biológicos – mesmo dentro da própria espécie – podem sofrer
variações que lhes conferem capacidades diferentes de reação/resposta a determinados
fenômenos que os afetam. Em geral, é difícil separar efeitos de contextos (ecossociais e
culturais) em relação às dimensões físicas e biológicas de indivíduos e populações.

197
Se houver aceitação e concordância com (a) as críticas ao neocausalismo com as quais
lidamos nesta seção, particularmente as de Krieger e Davey-Smith (2016); (b) a sugestão
de Morabia (2005) de que a determinação epidemiológica se afasta do determinismo
convencional; (c) a demarcação de fenômenos de cuidado para com a saúde como
processos biológicos-sociais integrais; (d) a proposição de Samaja (1994) de que
processos sociais são, por definição, objetos históricos, complexos, fragmentados,
conflitantes, dependentes e incertos; então, modelos causais, os quais implicam estruturas
de determinação efeito-específicas, considerando-se todos os avanços e atualizações,
seriam dispositivos heurísticos inadequados para indexar o objeto complexo da saúde-
enfermidade-cuidado.
Portanto, na atual fase de maturação do campo epidemiológico, as formas de apresentação

dos nexos (de associação, causais, preditivos), fluxos (processos, transições) e eventos
relativos à saúde-doença na sociedade moderna necessitam de um reexame crítico das
suas bases lógicas e históricas à luz de recentes transformações epistemológicas nas
ciências contemporâneas. Nesse sentido, ao se acolherem propostas recentes de
renovação epistemológica, nas seções seguintes apresenta-se uma elaboração do conceito
freudiano de sobredeterminação.
2 Sobredeterminação: raízes na psicanálise
A problemática teórica da ideia de ‘sobredeterminação’, ainda sem o termo com o qual

Freud cunharia o conceito, foi pioneiramente estabelecida por Karl Marx, em seu projeto de
superação crítica da dialética hegeliana. Ficou famosa uma citação da Introdução à Crítica
da Economia Política – intrigante esboço metodológico do que seria o plano de análise de
O Capital: “o concreto é concreto porque é a síntese de muitas determinações, isto é,
unidade do diverso” (MARX, 1974[1857]). Para Marx, a totalidade compreende
contradições materiais, algumas determinantes, outras determinadas, todas
compreendidas no conjunto das outras determinações.
Como conceito, o termo ‘sobredeterminação’ foi criado por Sigmund Freud, para se referir
à série articulada de causas e fatores desencadeantes de sintomas psíquicos e das
diversas formações do inconsciente. Em estudo pioneiro, Luiz David Castiel (1988, p. 8)
informa que em A Herança e a Etiologia das Neuroses (1896) Freud introduziu uma nova
classificação de “influências etiológicas” em função do efeito produzido: condições, causas
concorrentes, causas específicas e causas provocativas. Castiel (1988) também menciona

a proposta freudiana de sobredeterminação do aparelho psíquico e sugere en passant sua
correlação com a ideia de multicausalidade. Coutinho (2004, p. 198) indica que “o
mecanismo da sobredeterminação situa o tipo de determinismo que está em jogo na
elaboração freudiana, em sua natureza polissêmica”. Dentre as características que
compõem a sustentação do termo sobredeterminação como conceito, a autora destaca
multideterminação causal; impossibilidade de predição, pois suas determinações
apresentam-se em efeitos, isto é, são reconstruídas a posteriori; a lógica em questão não
é indutiva; é demonstrável, embora seja indecidível (p. 198).
Nos primórdios da sua obra (1893-1895), Freud introduz o conceito de Überdeterminierung

– sobredeterminação – concebido especialmente para designar a série articulada de fatores
desencadeantes dos sintomas das neuroses (FREUD, 1973[1893/5], p. 142). No clássico
A Interpretação dos sonhos (1900) afirma: “cada um dos elementos do conteúdo do sonho
revelou ter sido ‘sobredeterminado’, ter sido representado muitas vezes nos pensamentos
do sonho.” Adiante, refere-se ao “conteúdo material da interconexão dos pensamentos
oníricos” e afirma que para a sobredeterminação dos sintomas “não há limite para que
outros determinantes possam estar presentes.” Em um ensaio intitulado “Sobre os sonhos”,
Freud apresenta o conceito de forma muito clara e ressalta seu caráter seriado e reticulado:
cada elemento do conteúdo do sonho é “sobredeterminado” pelo material dos pensamentos
oníricos; não decorre de único elemento dos pensamentos oníricos e sua origem pode
remontar a toda uma série deles; esses elementos não precisam necessariamente ter
estreita relação mútua nos próprios pensamentos oníricos; a trama desses pensamentos
pode pertencer às mais distantes e diversas regiões. No Caso Dora, Freud (1973[1901])
esclarece que “a regra é a complicação dos motivos, a acumulação e a combinação do
material inconsciente – em suma, a sobredeterminação”.
Nesse conjunto de textos, Freud destaca três mecanismos centrais de constituição dos
sonhos: a condensação, o deslocamento e a sobredeterminação. Ao definir o novo conceito
como vinculado à contingência, afirma, de modo surpreendentemente preciso, que o tipo
de determinação que constrói os sonhos “parece artificial porque não está ligada a fatores
fortes, mas secundários que, ao se multiplicarem, ganham força”. Elementos de “baixo valor
psíquico” e de reduzida importância isolada nos processos inconscientes adquirem novos
valores ao se articularem como sobredeterminação.
Em outro texto (ALMEIDA-FILHO; COUTINHO, 2007) observa-se que o conceito de

sobredeterminação tal como criado por Freud seria vinculado à ideia de contingência, por

199
se tratar de um tipo de determinação definida por causas múltiplas, diversas e de baixa
intensidade, incluída juntamente com a condensação e o deslocamento como um dos
mecanismos centrais da constituição dos sonhos e da gênese dos sintomas psíquicos. No
regime da sobredeterminação, forças fracas, elementos de pouca expressão etiológica,
com reduzido “valor psíquico” ganham potência, criam vetores novos e mutantes de
produção de efeitos, adquirem novos valores, convergem para se tornar forças fortes.
Constata-se o valor antecipatório do pensamento freudiano, que operava referenciais
lógicos contraditórios com os modelos de sua época.
Em meados do século 20, a problemática da sobredeterminação foi recuperada por

formuladores de teorias críticas do conhecimento, sobretudo na linhagem francesa. Gaston
Bachelard, talvez o mais influente epistemólogo do seu tempo, não mostrava qualquer
simpatia pelo conceito de sobredeterminação. No primeiro momento, declara que a
sobredeterminação é uma característica definidora da mentalidade pré-científica, uma
crença ingênua na “unidade harmônica do Mundo”. Destaca, com desdém, que a “astrologia
é um caso particular dessa sobredeterminação” (BACHELARD, 1972[1938], p. 103). Para
Bachelard, a sobredeterminação se opõe à causalidade à medida que seria “pura e
simplesmente” uma determinação qualitativa de nível inferior, um dispositivo retórico no
plano das crenças, sem referência a experiências da prática científica; como se a
sobredeterminação implicasse “propriedades heteróclitas”, próprias de “espíritos confusos”,
responsáveis por “vagas articulações”. Na concepção bachelardiana, a única opção
cientificamente válida seria a determinação quantitativa de unidades parcelares, típicas dos
“fenômenos bem definidos, bem isolados”. Nessa posição há frontal rejeição de uma visão-
de-mundo holística, dialética e integradora – ironizada por Bachelard como disparate ou
demência. Em outras oportunidades, especialmente em Le nouvel esprit scientifique
(1968[1934]), em um capítulo intitulado Determinisme et Indéterminisme, Bachelard deixa
clara sua posição de que o princípio da causalidade deve se subordinar às exigências do
pensamento objetivo, que o vínculo causal tem efeito de realidade – apesar de sujeito a
desfigurações parciais – e que somente o determinismo quantitativo tem valor explicativo.
Assim, Bachelard denega propriedades heurísticas às categorias de contingência,
incerteza, interação, indeterminação, as quais classifica como casos particulares de
“determinações recíprocas”, “características do espírito pré-científico”. Conforme pontifica
Bachelard (1972[1938], p. 247), o paradigma de ciência válida e verdadeira seria o da física
que, de muitos modos, evitaria o sobredeterminismo, “padrão de pensamento de povos
primitivos e tempos arcaicos”, antes do advento da ciência moderna, “qui passe pour

indiscutable dans la période préscientifique” [que passa por indiscutível no período pré-
científico].
Em posição contrária, Paul Ricoeur (2006[1965]) abre a conclusão de sua obra De

l’interprétation, essai sur Freud, com uma seção intitulada La surdétermination. Para
Ricoeur, pela natureza dialética de seus conceitos, a psicanálise tem como referência uma
teleologia implícita, como uma “hermenêutica redutora e desmistificante”. Ao buscar ir além
do “conflito de interpretações” (RICOEUR, 1969), propõe que a sobredeterminação
freudiana se viabiliza em uma dialética peculiar cujos polos opostos compreendem uma
hermenêutica arqueológica e uma hermenêutica teleológica. Afirma Ricoeur (2006[1965],
p. 479): “É o símbolo que, através de sua sobredeterminação, realiza a identidade concreta
entre a progressão das figuras da mente e a regressão em direção aos significantes-chave
do inconsciente”. Em outras palavras (RICOEUR, 2006[1965], p. 518), “A tese que
proponho é a seguinte: o que a psicanálise chama de sobredeterminação não é entendido
fora de uma dialética entre duas funções que se pensa estar em oposição, mas que o
símbolo coordena em uma unidade concreta”.
Em uma série de textos elaborados entre 1955-1957, reunidos nos Écrits, Jacques Lacan
(2009) recupera a ideia de sobredeterminação como central na teoria freudiana original. Ao
reafirmar a autoria desse conceito em Freud, Lacan (2009, p. 56) identifica uma lacuna
crucial na obra freudiana, como “apercepção da função simbólica”, na qual um “vislumbre
iluminador” pode ser identificado na ordem da linguagem: “a determinação do signatário ao
do significado, [...] essa sobredeterminação que é a única em questão”. Em vários
momentos de sua análise, Lacan (2003; 2009) reitera que a causalidade psíquica implica
"uma cadeia simbólica" de sujeição a um “jogo intersubjetivo” (LACAN, 2009, p. 412), e que
"as leis da linguagem são as únicas capazes de sobredeterminação" ou, dito de outro modo,
“a sobredeterminação é estritamente concebível somente na estrutura da linguagem”
(2003, p. 606). Em um horizonte crítico abertamente antiessencialista, Lacan afirma que
propriedades causais ou etiogenéticas dos fenômenos psíquicos somente operam “nos
registros da linguagem: de onde vem a sobredeterminação, o que não faz sentido senão
nesta ordem” (LACAN, 2009, p. 281). Em síntese, para Lacan (2009, p. 439) “o que Freud
chama de sobredeterminação, deve ser considerado acima de tudo como um fato de
sintaxe, onde seus efeitos da analogia devem ser apreendidos”.

201
3 Sobredeterminação, totalidade e complexidade
Diretamente influenciado por Lacan, em uma série de dois artigos, Louis Althusser
introduziu a noção de sobredeterminação no estruturalismo marxista. No primeiro, intitulado
Contradicción y sobredeterminación (notas para una investigación), publicado en La
Pensée, em dezembro de 1962, declarava-se “convencido de que el desarrollo filosófico
del marxismo depende de esta tarea” (ALTHUSSER, 1967a, p. 75). No segundo artigo,
publicado na mesma revista em agosto de 1963, intitulado Sobre la dialéctica materialista
(de la desigualdad de los orígenes), apresenta sua proposta como nada menos que “uma
nueva teoría de la sociedad y de la historia” (ALTHUSSER, 1967b, p. 188).
Como fundamento, a abordagem althusseriana contrapõe a dialética hegeliana, cuja

unidade é metafísica, fundada em um tipo linear de contradição à dialética marxista, na qual
o princípio da determinação múltipla e da indeterminação permitiria ao materialismo
histórico maior rigor heurístico. A partir dessa questão fundamental, Althusser redefine a
totalidade marxista como um todo complexo que incorpora a unidade do diverso, como uma
estrutura dinâmica articulada, na qual um elemento desempenha o papel dominante e
outros elementos a esse estão subordinados. Na dialética marxista, múltiplas
determinações não são isoladas umas das outras, mas constituem-se em unidade a partir
da relação que estabelecem entre si. A totalidade é inseparável das próprias instâncias que
a compõem e às quais determina e por essas é determinada. As instâncias da base
econômica e da superestrutura do político-ideológico integram-se a uma nova concepção
da relação das instâncias determinantes no complexo estrutura-superestrutura “que
constitui a essência de toda a formação social” (ALTHUSSER, 1967a, p. 91). A base
econômica, em última instância, determina qual elemento da formação social será
dominante em estruturas regidas por “la contradicción, que representa su
sobredeterminación”.
Althusser postula que o conceito de contradição em Marx supõe forças e fatores

provenientes das diversas instâncias da estrutura social que precisariam de uma
causalidade multifatorial para o entendimento da determinação de sua base econômica e
de sua dinâmica histórica. Althusser (1967a, p. 81) argumenta que
la ‘contradicción’ es inseparable de la estructura del cuerpo social todo

entero, [...] determinante pero también determinada en un solo y mismo
movimiento, y determinada por los diversos niveles y las diversas instancias
de la formación social que ella anima; podríamos decir: sobredeterminada
en su principio.

A partir desse conjunto de pressupostos gerais, Althusser (1967a, p. 92) assim define o
conceito de sobredeterminação: “una acumulación de determinaciones eficaces salidas de
las superestructuras y de circunstancias particulares sobre la determinación en última
instancia por la economía”. A categoria de sobredeterminação cumpriria, dessa forma, um
papel de elemento epistemológico crucial para a sustentação filosófica da forma de
contradição proposta por Marx frente àquela conceituada por Hegel, que, “en efecto, no
está jamás realmente sobredeterminada aunque, a menudo, parezca tener todas las
apariencias de ello”. Dessa maneira, para atualizar a proposta de Marx de inverter o método
dialético hegeliano – substituindo a visão idealista e dando-lhe racionalidade – Althusser
encontra na sobredeterminação a possibilidade de reverter uma lógica linear, contrapondo-
a à lógica complexa, na qual o processo coincide com a produção e as instâncias de
determinação são, a um só tempo, determinantes e determinadas, em constante
retroalimentação (ALTHUSSER, 1967a, p. 87). Portanto, a totalidade complexa estruturada
e suas contradições não podem ser pensadas isoladamente. As condições são apenas a
existência atual do todo complexo, juntamente com suas contradições, nas quais se reflete
a estrutura dominante, a relação com as outras contradições. Nessa linha, argumenta
Althusser (1967b, p. 173), “la sobredeterminación designa la calidad esencial siguiente en
la contradicción: la reflexión, en la contradicción misma, de sus condiciones de existencia,
es decir, de su situación en la estructura dominante del todo complejo”.
Com base no exame dessas referências, Althusser recorre ao conceito freudiano de

sobredeterminação para resolver uma questão crucial, historicamente latente, na teoria
marxista: como a estrutura social da economia capitalista se sustenta e se reproduz em
uma contradição imanente entre forças produtivas e relações sociais de produção. Para
Althusser, a parte contraditória de um sistema é sobredeterminada pelo todo desse sistema,
no qual o processo coincide com a produção e em que as instâncias de determinação são,
a um só tempo, determinantes e determinadas, em constante feedback. A
sobredeterminação é definitivamente um tipo muito particular de determinação, no qual
"fenômenos orgânicos de deslocamento e condensação" constituem a própria existência
da "identidade dos opostos", uma dialética especial (ALTHUSSER, 1967b, p. 173-174).
Destaca ainda que a relação entre forças produtivas e relações de produção nunca se
apresenta em sua forma mais pura, mas sempre determinada pelas superestruturas e por
contingências, referidas como “circunstâncias”. Conforme Althusser (1967b, p. 173):
Si así es, es necesario admitir que la contradicción deja de ser unívoca (las
categorías dejan de tener de una vez por todas un papel y un sentido fijos),
ya que refleja en sí, en su misma esencia, su relación con la estructura

203
desigual del todo complejo. [...] dejando de ser unívoca, por lo tanto
determinada de una vez para siempre, en su papel y su esencia, se revela
determinada por la complejidad estructurada que le asigna su papel, como
(y perdónese esta espantosa expresión) compleja-estructural-
desigualmente-determinada... Preferí, lo confieso, una palabra más corta:
sobredeterminada.
Vale ressaltar a compreensão de Althusser acerca do caráter não binário e antiessencialista

do conceito de sobredeterminação, para superar concepções dualistas, essencialistas e
hierárquicas de determinação, estranhas à base teórica do marxismo histórico. Como indica
Althusser (1967b, p. 194), o conceito de sobredeterminação também se mostra pertinente
como “expresión de la relación de los hombres con su ‘mundo’, es decir, la unidad
(sobredeterminada) de su relación real y de su relación imaginaria con sus condiciones de
existencia reales”.
É possível considerar a singularidade do projeto althusseriano de construir uma teoria da

ideologia na encruzilhada entre uma teoria marxista do Estado e uma teoria do inconsciente
oriunda da psicanálise. Conceitos de extração ou inspiração freudiana (leitura sintomática,
inconsciente, sobredeterminação) e histórico-estrutural (causalidade estrutural, formação
social, reprodução social) foram integrados na conhecida noção de “aparelhos ideológicos
de Estado”. Essa teoria da ideologia, articulada com uma teoria da práxis científica, seria
potencialmente útil para preencher uma lacuna no pensamento de Marx, atualizando-o e
ampliando seu horizonte para tratar da problemática original da questão do sujeito –
“indispensable a toda sociedad para formar a los hombres, transformarlos y ponerlos en
estado de responder a las exigencias de sus condiciones de existência” (ALTHUSSER,
1967b, p. 195).
Enfim, ciente dos limites impostos pelo economicismo, com sua concepção de sociedade
enquanto “conjunto estruturado complexo”, para distanciar-se do conceito hegeliano de
“totalidade” Althusser recupera o conceito freudiano de sobredeterminação. Aqui,
identificam-se duas formas de pensar a sobredeterminação que se articulam com
implicações diferentes: a primeira refere-se à relação do todo com suas partes, sendo essas
diversas e múltiplas e sendo a primeira definida por elas, ao mesmo tempo em que as
condiciona; a segunda refere-se à questão da “última instância” em que a estrutura
econômica determina as formas da superestrutura que, em um movimento de retroação,
seria também sobredeterminada.

Não obstante seu valor, a releitura althusseriana da sobredeterminação sofreu reparos de
vários autores, sobretudo em seus aspectos políticos e simbólicos. Como plataforma
epistemológica para uma teoria do sujeito, Ernesto Laclau e Chantal Mouffe focalizaram o
que consideram importante problema teórico que o marxismo clássico não pôde expor, que
é “determinar cuál es la lógica específica de la contingência” (LACLAU; MOUFFE, 2004, p.
27). Observam que a teoria althusseriana sustenta importante postulado: “no hay realidad
que no sea sobredeterminada” (2004, p. 135). Com Althusser, argumentam que toda
configuração social concreta pode ser considerada como totalidade estruturada por
elementos articulados, do que deriva um segundo postulado fundamental para sua teoria:
“o social é constituído como uma ordem simbólica” (LACLAU; MOUFFE, 2004, p. 134).
Entretanto, superando Althusser, propõem a sobredeterminação como forma discursiva,
que gradualmente se desloca para priorizar as ideias de indeterminação e contingência.
Em sua leitura da sobredeterminação althusseriana, considerando que a totalidade
althusseriana e seu conceito de “contradição sobredeterminada” não se inscrevem no
campo da discursividade, avaliam “que el campo de la sobredeterminación es sumamente
limitado: es el campo de la variación contingente frente a la determinación essencial”
(LACLAU; MOUFFE, 2004, p. 136). Daí concluírem que, a fim de salvar a ideia de
sobredeterminação da simplicidade – seja cartesiana, hegeliana, positivista ou marxista –
deve-se buscar entendê-la não como uma contradição estrutural e, sim, pensá-la em termos
de um complexo histórico-social mais amplo, de natureza conjuntural-contextual, ao qual,
inspirados na teoria gramsciana, referem como “hegemonia”. Dessa maneira, pretendem
entender mais profundamente a constituição simbólica das relações sociais e a
configuração de matrizes culturais, formas sociais, identidades políticas e processos
emancipatórios em contextos de descolonização. Em busca de um marco teórico original
capaz de recuperar o potencial político do conceito de sobredeterminação, Laclau e Mouffe
recorrem à afirmação lacaniana do caráter contingencial do signo linguístico na ordem
significante. Nesse sentido, afirmam que “Si toda posición de sujeto es una posición
discursiva, el análisis no puede prescindir de las formas de sobredeterminación de unas
posiciones por otras, del carácter contingente de toda necesidad que, según hemos visto,
es inherente a toda diferencia discursiva” (2004, p. 134).
Em uma linha paralela ao estruturalismo althusseriano, porém bastante distinta quanto ao

referencial teórico, e ao buscar construir uma sociologia das práticas, Pierre Bourdieu
ensaia um retorno ao conceito freudiano original da sobredeterminação como
multicausalidade. Em La distinction (1988) – estudo de dispositivos sociais ligados ao estilo
e ao gosto – o conceito de sobredeterminação é interpretado como “sobreposição de

205
determinações biológicas ou psicológicas e determinações sociais na formação da
identidade sexual socialmente definida (dimensão fundamental da personalidade social)”
(BOURDIEU, 1988, p. 121). Essa visão retrocedida revela-se na afirmação de que “El efecto
de sobredeterminación que resulta de estas redundancias es experimentado con tanta
mayor fuerza cuanto más fuertemente interpenetradas están, para la percepción ordinaria,
las diferentes características que la observación o la medición obligan a aislar”
(BOURDIEU, 1988, p. 167). O conceito de sobredeterminação, tal como recuperado por
Bourdieu para o estudo de sistemas de reconversão das diversas espécies de capital
(econômico, cultural, social etc.), resulta, enfim, em uma compreensão da determinação
como redundância, sobreposição e saturação de determinantes e efeitos.
Nessa mesma linha, Néstor Garcia-Canclini toma a sobredeterminação simbólica da

realidade social como tema de investigação em chave descolonizadora. Garcia-Canclini
(2004, p. 123) assinala que, “puesto que son indisociables lo económico y lo simbólico, la
fuerza y el sentido, es imposible que uno de esos elementos se sustraiga de la unidad social
y determine privilegiadamente, por sí solo, a la sociedad entera”. Propõe uma “tradução
cultural” da interpretação bourdieusiana sobre as múltiplas determinações que, para
problemas de fundamento e princípio das ciências sociais, revelam sobredeterminação e
não indeterminação. Não obstante, García-Canclini mostra-se crítico da ideia de
sobredeterminação como convergência de determinantes de natureza distinta. Em
complemento, afirma que a “causalidade estrutural de uma rede de fatores” seria irredutível
à eficiência aditiva de cada um desses fatores, o que não implica negar que fatos sociais
existem, operam nos espaços simbólicos das sociedades e estão sobredeterminados de
muitas maneiras.
4 Sobredeterminação em saúde
O modo como tem sido usada a ideia de ‘sobredeterminação’, proposta por Freud como
expressão do aparelho psíquico e das formações do inconsciente, mostra que o conceito
se atualiza em Lacan como sobredeterminação simbólica e se redefine em Althusser para
análise dialética das formações sociais. Propostas articuladoras entre psicanálise e
marxismo permitem a aproximação com a ideia de sistemas complexos, nos quais
processos sobredeterminados coincidem com desfechos, contradições e contingências e
têm possibilidade de existência e espaço de operação. São instâncias de
sobredeterminação, mediante retroação, simultaneamente determinantes e determinadas.

Para organizar e articular as contribuições avaliadas neste capítulo, visando aplicá-las aos
temas/problemas do campo da saúde, propomos três usos articulados para o termo
‘sobredeterminação’:
I. Como categoria mais geral em uma taxonomia de processos determinantes;
II. Para designar trajetórias de determinação por contingência ou emergência;
III. Como dispositivo de rede heurística em modelos de complexidade.
Como ilustração, mais importante do que formalizar rigorosamente métodos para descrever
e medir os objetos da saúde-doença-cuidado certamente será compreender raízes e
determinações e aplicar uma abordagem pluralista em termos metodológicos.
Sobredeterminação como categoria geral de processos determinantes
Pode-se falar de sobredeterminação primeiro como uma categoria geral das

determinações, das quais as modalidades seriam múltiplas. Essa abertura permite acolher
– por exemplo, a tipologia geral da causalidade de Bunge (1969) – e dar como exemplo
determinação causal, determinação dialética e determinação estrutural, entre outras.
Porém, será mais interessante pensar em uma aplicação específica para o campo da saúde
e cobrir processos e vetores de desigualdades que podem ser referenciados por categorias
particulares de processos determinantes de fenômenos do campo da saúde e seus
correlatos.
Como formas desse modo de sobredeterminação em saúde, vê-se as seguintes

modalidades:
Causação // Determinação // Produção // Construção // Invenção
Nessa plataforma conceitual, indicando as diferentes modalidades particulares de

determinação, pode-se formular a questão geral da sobredeterminação em saúde, segundo
o Quadro 1.

207
Quadro 1 - Modalidades da sobredeterminação tipo I em saúde
Categorias Planos Temas

Causação Biológico Clínico Patologia Enfermidade
Determinação Social Ecológico Situação de saúde

Condições de saúde
Produção Societal Cultural Práticas de saúde
Modos de saúde
Construção Política Institucional Políticas de saúde
Instituições de saúde
Invenção Ideológica Simbólica Sentidos de saúde
Narrativas de saúde
Fonte: (ALMEIDA FILHO; CASTIEL; AYRES, 2009).
Desde a causação nos planos biológicos e clínicos e a determinação social da situação e

das condições de saúde até as questões importantes da produção de práticas e modos de
saúde, a construção de políticas e instituições de saúde e a invenção dos sentidos e
narrativas da saúde. O diferencial semântico – sugerido para os termos causação biológica,
determinação social, produção cultural, construção política e invenção simbólica –
corresponde, em uma visada epistemológica, a diferentes planos da realidade e diferentes
efeitos ou temas. Nesse caso, a partir do plano biológico e clínico até o ideológico e/ou
simbólico, passando pelos planos ecossociais, político-institucional e societal-cultural. Do
ponto de vista da sobredeterminação na atenção à saúde-enfermidade, pode-se dizer que
o campo da saúde resulta da sobredeterminação da complexa estrutura das desigualdades
as quais, no cotidiano das sociedades contemporâneas, tornam-se fonte permanente de
injustiça e de iniquidades.
Sobredeterminação designando trajetórias de determinação por contingência ou

emergência
Em outro texto (ALMEIDA-FILHO; CASTIEL; AYRES, 2009), são identificadas e avaliadas

as formas distintas de apresentação do conceito de risco como um perigo latente ou oculto
no discurso social comum; risco individual como conceito prático da clínica; risco
populacional como conceito epidemiológico no sentido estrito. Acrescenta-se mais uma
modalidade de apresentação do risco, em bases dedutíveis: “risco estrutural” nas áreas de
saúde ambiental/ocupacional. Essa proposição determina a integração teórica e filosófica
da rede de conceitos correspondentes (saúde, vida, risco, doença, cuidado etc.) ao
conjunto de práticas discursivas e operacionais em novos campos de conhecimento e

práticas, com maior intensidade e frequência, formadas em torno do objeto saúde. Para
isso, os conceitos de risco e as práticas que lhe dizem respeito no campo da saúde podem
ser agrupados em três grupos:
1) Risco como indicador de causalidade (ou resíduo de probabilidade). Esse ponto
inclui modelos de risco como um resíduo de probabilidade com intenções preditivas
e consequências. Também a noção de controle etiológico, como na concepção
individualizada de risco da epidemiologia clínica. Trata-se, então, de reconhecer e
reafirmar sua base indutiva frequentista. Esse conceito particular de risco subsidia
modelos de prevenção de doenças ou eventos mórbidos, com as seguintes
variantes:
1. modelos individuais de prevenção (conceito clínico de risco);
2. modelos de prevenção populacional (risco epidemiológico).
2) Risco como dano estruturado. Tal conceito subsidia modelos de intervenção para
proteção da saúde nas áreas de saúde ambiental e ocupacional, com
fundamentação dedutiva, descritiva e estrutural.
3) Risco como emergência. Em tal proposta, processos emergenciais ou de

contingência articulam eventos e objetos – dos quais somente se pode verificar seus
efeitos – e dada a impossibilidade de propor medidas de ação retroativas, pode-se
indicar formas de precaução de base analógica.
Para incorporar a dimensão contingente dos processos de ocorrência de problemas de

saúde nas populações humanas, propôs-se incorporar mais uma definição à lista de
conceitos de risco mencionados: “risco contingencial”; nesse caso, como operador do
campo de práticas denominada Promoção da Saúde (ALMEIDA-FILHO; COUTINHO,
2007).
Nos referenciais epistemológicos estruturantes do raciocínio epidemiológico, diante de uma

hipótese etiológica estável e demonstrada, não resta dúvida quanto à possibilidade de
intervenção em dada realidade, no sentido de prevenir algum evento ou retificar uma
situação indesejável. Exemplos triviais em tempos de pandemia: equipamentos de proteção
individual para profissionais de saúde, medidas de distanciamento físico ou vacinação em
massa. Exemplos ainda mais triviais da vida cotidiana: colocar muretas ou grades de
proteção em terraços, abismos, pontes e outros locais elevados para evitar quedas é uma
iniciativa óbvia diante da ameaça à vida; em regiões frias, calefação nas habitações e

209
vestes protetoras, por não haver dúvida de que baixas temperaturas representam ameaça
à saúde/vida humana. Elementos pragmáticos dessa natureza definem indiscutíveis
medidas de proteção. No âmbito da prevenção em saúde, quando se estabelece um nexo
de causa e efeito de caráter necessário ou se deduz uma condição de possibilidade,
justificam-se duas ações: a definição de algo (coisa-fenômeno-processo-evento) como
perigoso/arriscado e a tomada de medidas de proteção/prevenção em relação a tal
perigo/risco (COUTINHO; ALMEIDA-FILHO; CASTIEL, 2011).
A estratégia de Prevenção em Saúde encontra-se há muito tempo sob o regime da

necessidade, baseada no causalismo e nos modelos de causalidade, cuja intervenção mais
específica seria a modelagem da realidade. Aristóteles define o real como o que está e é.
Se o real se caracteriza como o que estava posto, as realidades são construídas para tentar
dar conta do real que é mostrado como um limite para a simbolização. O regime de
necessidade é solidário com o registro simbólico, de acordo com as proposições modais
aristotélicas. A necessidade humana encontra-se ligada a esses eventos essenciais ao
mundo da linguagem, pois ao constituir-se como um ser de linguagem, o ser humano
estabelece um movimento peculiar: o simbólico (discurso humano) separa a realidade do
real ao promover uma divisão entre coisa e símbolo por meio da mediação da palavra.
Por outro lado, a partir de vários ângulos de análise, a Proteção à Saúde – como estratégia
– logicamente se posiciona no registro do impossível, apesar de historicamente ter sido
construída como um campo de prática plausível. Protege-se a saúde pela indução de uma
impossibilidade, tornando-se impossível (como pretensão) o dano à integridade,
funcionalidade ou existência dos seres humanos. Seu modelo é o controle e o experimento
a intervenção necessária. Tal modalidade – o impossível – deve ser considerada em sua
estrutura lógica, o que não significa que essa não exista. Apenas esse controle e
experimento não são realidades em si, mas realidades linguísticas que produzem efeitos
reais e não são encontradas nas condições efetivas de pesquisa ou intervenção; como
eventos circunstanciais, somente são reconhecidos por seus efeitos. Rigorosamente, um
experimento nunca pode ser reproduzido, é único, e pode, sim, quando replicado, constituir
uma série. Além disso, a replicação jamais ocorre como planejado, uma vez que a situação
do laboratório não tem outra relação com a vida além da plausibilidade. A realidade do
experimento nunca corresponde à realidade do evento. No caso da prevenção de riscos à
saúde, diante das imponderabilidades que envolvem a determinação e geração de danos
à saúde, mesmo que se tomem medidas preventivas não se tem certeza de que os
resultados de proteção serão garantidos, a depender das medidas tomadas.

A possibilidade, modo lógico incorporado à estratégia de precaução, compreende o registro
referente ao imaginário, o qual, longe de ter um caráter negativo de algo imaginado ou
ilusório, como se diz comumente, somente pode ser pensado em seu entrelaçamento com
os níveis simbólico e real. O uso de estratégias de precaução no campo da saúde, como
construção de possíveis cenários antecipatórios aos danos existentes ou projetados,
desempenha papel indesejável de antecipação. Os princípios de prevenção e precaução
são cada vez mais dominantes em tempos nos quais a consideração de cenários futuros é
uma constante nas propostas de gestão de vários aspectos da vida. A prevenção de riscos
tem suas ambivalências e de acordo com julgamentos possivelmente imponderáveis
podem envolver medidas procrastinatórias ou intervenções urgentes. Nesses casos, o
princípio da prevenção ou precaução pode ser manipulado de acordo com as circunstâncias
e, também, com base nos interesses envolvidos. No registro da contingência, a constatação
da insuficiência das provas de ocorrência de dado evento somente pode ser confirmada a
posteriori (COUTINHO; ALMEIDA-FILHO; CASTIEL, 2011); ou seja, somente depois que o
futuro se tornar presente é possível saber se as especulações antecipatórias foram
confirmadas.
Por fim, associa-se a estratégia de Promoção da Saúde aos modelos de imprevisibilidade

dos eventos, incorporados à ciência como emergência e na filosofia como contingência. De
todas as modalidades lógicas, essa é certamente a que mais resiste a uma apreensão
direta de seu significado. Ou seja, é a ocorrência de um evento que causa cessação,
interrompe abruptamente um estado anterior, mas que, de acordo com o real, não está
inscrito como fato. Pode ser, retroativamente, integrado à cadeia significante como apoio a
estratégias que promovam ações globais de monitoramento e vigilância, como as práticas
atualmente denominadas Promoção da Saúde, com o objetivo de detectar, compreender e
significar emergências-ocorrências-contingências para, a partir daí, reconhecer (para
cessar efeitos) eventos futuros semelhantes (COUTINHO; ALMEIDA-FILHO; CASTIEL,
2011).
O Quadro 2 ilustra comparativamente os principais elementos conceituais envolvidos nessa

articulação de estratégias.

211
Quadro 2 - Conceitos para articular estratégias de ação em saúde
Estratégias Modelos Modais Ações
Prevenção Probabilidade Necessidade Modelagem
Proteção Causalidade Impossibilidade Intervenção
Precaução Estrutura Possibilidade Regulação
Promoção Emergência Contingência Vigilância em Saúde

Fonte: (ALMEIDA FILHO; COUTINHO, 2007).
Em uma visada pragmática, o conceito de risco como contingência subsidia e permite

operar modelos restritos de Vigilância em Saúde e modelos gerais de Promoção da Saúde.
Trata-se, nesse caso, de explicitar a base filosófica da contingência (ALMEIDA-FILHO;
COUTINHO, 2007), articulada como processos emergentes em modelos de complexidade.
Conceitos de emergência-contingência articulam eventos inesperados e, na
impossibilidade de propor medidas de ação retroativas, indicam formas de precaução
baseadas na analogia. Em geral, são eventos desencadeados por fatores múltiplos e
interligados, estruturados em redes abertas ou que impossibilitam o estabelecimento de
relações causais lineares entre eles.
Sobredeterminação como dispositivo de rede heurística em modelos de complexidade
Para lidar com objetos complexos e singulares em saúde, considerados como totalidades
sobredeterminadas, compostas por eventos sobre os quais as ciências devem considerar
um efeito sintetizador para preservar sua integridade heurística, Samaja (2003, p. 115-116)
reitera a sobredeterminação como conceito-chave para melhor se compreender a
reprodução social de processos saúde-enfermidade e fenômenos correlatos a tais objetos
complexos, regidos por lógicas plurais:
Estas totalidades procesuales, a su turno, pueden pasar a formar parte de

totalidades mayores, lo que supone que sus determinaciones propias son
susceptibles de dirección o sobredeterminación, y lo que implica la
supresión de su autonomía con conservación de su propio fundamento
entitativo.
Sabemos que o objeto saúde-enfermidade-cuidado é plural e multifacetado e a

‘enfermidade’ simultaneamente defeito, lesão, alteração, patologia, doença, risco, dano; a

saúde um conjunto interarticulado de valores, medidas, temas e fenômenos; o cuidado
resultante de atos, modos e práticas de atenção à saúde. Tal complexo fenomênico em
saúde é sobredeterminado por uma lógica de complexidade; pode ser construído sob a
forma de uma ‘rede de sobredeterminação’ em planos distintos de existência.
O esquema aqui proposto implica um dispositivo de síntese ainda preliminar e esquemático,

a partir de duas alternativas de modelagem teórica: cartesiana ou pascalina.
Considere-se, primeiro, a enfermidade E como objeto cartesiano. O modelo mais

parcimonioso possível para a compreensão de sua gênese considera o único e exclusivo
fenômeno ou evento como causa C. Portanto, C ® E (leia-se: “uma dada causa C produz
a enfermidade E”). Há duas possibilidades de torná-lo mais complicado como modelo
explicativo:
(a) Desmembrar C como processo causal; portanto, C [c1 ® c2 ® c3] ® E.
(b) Decompor C como conjunto de causas; portanto, C [c1 + c2 + c3] ® E.
Em qualquer caso, a formulação de C como causa (processo causal, conjunto de causas

etc.) de E implica (ou pretende) conhecimento pleno do mecanismo genético de E e permite
predição acurada (ou com graus mensuráveis de precisão relativa) das condições de
produção de E. Em termos práticos, o conhecimento etiológico de E propicia o
desenvolvimento de tecnologias e a proposição de práticas para controle de C e intervenção
na sua dinâmica de ocorrência. O modelo explicativo resultante pode ser expresso
idealmente como um mecanismo ou sistema mecânico de causalidade, bastante fiel ao
conceito cartesiano de autômato. Observe-se ainda que aqui a ocorrência de E é
compreendida como causa eficiente em um registro modal de necessidades (no sentido
original concebido por Aristóteles).
Considere-se agora a enfermidade E como objeto pascalino de incerteza.
A primeira aproximação dessa ordem ao problema da determinação de E pode incorporar

a noção de ocorrência relativa ou probabilidade de ocorrência (pE) em vez de ocorrência
absoluta, unívoca e certa de E. Nesse caso, a causa C pode ser traduzida e operada como
proporção de intensidade ou frequência de atribuição de C, ou seja, como fator de
exposição relativa C implica maior probabilidade de ocorrência de E. Portanto, pC ® pE.
Assim, o chamado raciocínio epidemiológico constrói e consolida essa estratégia de
formulação determinística.

213
A segunda aproximação pascalina ao problema da determinação de fenômenos da saúde-
enfermidade-cuidado permite radicalizar na abertura da determinação epidemiológica a
modelos sob condições reduzidas de certeza e previsibilidade. Trata-se de incorporar a
categoria contingência aos modelos explicativos de ocorrência de E, os quais podem ser
ampliados em escopo e graus de complexidade para modelos de compreensão de
situações/estados de saúde S, mediante três opções:
(a) Considerar no modelo a possibilidade de retroação ou recorrência, onde o efeito
E ou o estado S retorna ao sistema como condição inicial. Portanto, C ® E ® C1 ®
E1 ® ... Ct ® Et ... ou, alternativamente, C ® S ® C1 ® S1 ® ... Ct ® St ..., onde 1
e t representam distintos momentos no tempo em ciclos recorrentes de
determinação.
(b) Considerar a possibilidade de interação ou emergência na dinâmica dos fatores

determinantes de S ou E. Nesse caso, contemplam-se as resultantes de C > [c1 +
c2 + c3] e C < [c1 + c2 + c3]. Como se poderá verificar, trata-se de interação (sinergia
e anulação) ou modificação de efeito, fenômenos bastante conhecidos e explorados
na análise epidemiológica convencional.
(c) Considerar redes de sobredeterminação (RSD) e indicar trajetórias de

determinação de dada enfermidade E ou de situações/estados de saúde S,
desencadeados por emergências-contingências e não por fatores causais.
Essa última opção constitui a novidade possível no presente esforço de exploração das
bases epistemológicas da epidemiologia visando à modelagem ou concretização de
situações de saúde ou à avaliação de intervenções sobre realidades de saúde. Para melhor
compreender sua dinâmica e operar metodologicamente seus efeitos como estratégia de
produção de conhecimento, recorre-se ao dispositivo heurístico da “rede de
sobredeterminação” (que eventualmente se conforma como matrizes).
Em muitos pontos de sua obra, Freud tratava então o fenômeno psíquico como uma rede.
Em A Interpretação dos sonhos (1973[1900]) fala explicitamente do aparelho psíquico como
“cadeia de pensamentos” ou “tecido reticular”. No glossário que subsidia a noção freudiana
de sobredeterminação, o termo ‘determinante’ implica invariavelmente uma cadeia de
pensamentos. Cada elemento da cadeia de pensamentos é sobredeterminado no sentido
de que sua origem pode remontar a toda uma série desses. Esses elementos não precisam
necessariamente ter estreita relação mútua nos próprios pensamentos; podem pertencer

às mais distantes e diversas regiões de sua trama, pois “os fios da associação não
convergem dos pensamentos oníricos para o conteúdo do sonho, mas se cruzam e
entrelaçam muitas vezes no curso de sua jornada” (FREUD, 1973[1900], p. 666).
Ao elaborar os anexos dos Écrits, Jacques-Alain Miller propôs reinterpretar a leitura

lacaniana da ideia freudiana de sobredeterminação à luz da teoria dos grafos. Nessa
proposta, Miller esboça uma metodologia correlata à noção de sobredeterminação
simbólica e reafirma a centralidade desse conceito no pensamento lacaniano. E mais: ao
indicar que “Las propiedades de la sobredeterminación simbólica explican que el tiempo
lógico de esta historia no sea lineal” (MILLER, 2009, p. 856), destaca o caráter de não-
linearidade e complexidade das proposições lacanianas a partir do modelo original de
Freud. Nesse movimento indica que essa seria a única das construções teóricas da
psicanálise em estreita correlação com a ordem significante, para além de funções retórica,
didática, estética, demonstrativa ou meramente alusiva a imagens, metáforas e metonímias
estruturantes das formações do inconsciente. Essa posição se apresenta sob a forma de
uma advertência técnica a respeito da topologia lacaniana (MILLER, 2009, p. 865), em que
reformula a ideia freudiana de redes de sobredeterminação, da seguinte maneira:
En todo caso, esta precaución pone de manifiesto la inadecuación de

principio de la representación gráfica respecto a su objeto (el objeto del
psicoanálisis), en el espacio de la intuición (definido, si se quiere, por la
estética kantiana). Por eso todas la construcciones aquí recogidas (con
excepción de las redes de la sobredeterminación, que funcionan en el orden
del significante) no tienen más que una función didáctica y mantienen con la
estructura una relación de analogía.
Miller (2009, p. 869) complementa o texto dos Écrits com uma tabela comentada das
representações gráficas concebidas por Jacques Lacan. Segundo ele, a montagem
progressiva das redes traz à tona algumas das propriedades da sobredeterminação, em
três modalidades: (i) Rede – surgimento de simples antecipação por distribuição
dissimétrica, na qual a memória aparece como a lei elementar da repetição (gráfico
relacionado e pseudossimétrico); (ii) “Repartitório” e tabela – para representar a
emergência, por meio de uma segunda distribuição dissimétrica, de uma antecipação
complexa concluída pelo feedback; (iii) Representação de rede – transformação do
precedente em rede. Finalmente, a montagem de dispositivos heurísticos como
representação gráfica de objetos sobredeterminados se viabiliza sob a forma de “redes de
sobredeterminação” que revelam grande potencial para uma hermenêutica epidemiológica

215
– baseada na emergência – na retroação e na complexidade, conforme se mostrará a
seguir.
Redes de sobredeterminação (RSD) compreendem o conjunto articulado de elementos do

sistema de determinação de E ou de situações/estados de saúde S, tendo como nós ou
vértices da rede todos os determinantes, vetores ou fatores de algum modo articulados ou
implicados na sobredeterminação da enfermidade. Uma RSD é um modelo heurístico geral
de determinação. O destaque visual e a posição central de uma enfermidade em foco, na
rede de conexões de determinação, constituem artefatos gráficos, arbitrários, que podem
ser posicionados em qualquer ponto da rede. Como se verificou, em uma rede complexa,
a sobredeterminação opera mediante trajetórias de determinação desencadeadas,
disparadas ou provocadas por acidente (contingência). O mecanismo da
sobredeterminação considera o tipo de determinismo que está em jogo, como se viu na
elaboração freudiana, em sua natureza polissêmica, multideterminada, não preditiva.
Finalmente, no registro da RSD a lógica em questão não é indutiva; é dedutiva – ou
demonstrável – e indecidível.
Em uma epidemiologia convencional, todos os elementos componentes dessa rede

poderiam ser considerados como fatores de risco para dada enfermidade ou condição de
saúde. Nessa abordagem, a investigação do seu efeito sobre a ocorrência de transtornos
em populações levaria em consideração cada efeito em isolamento ou, no máximo, em
interação com outro fator da mesma ordem de determinação, tomando-se a depressão
como desfecho do processo causal. Esse modelo cartesiano linear se mostra limitado e
incompleto em dois sentidos. Por um lado, se se tomar a representação reticular da RSD
(como na concepção freudiana) como mais próxima da realidade epidemiológica, não faz
sentido investigar magnitude e direção de efeitos puros de fatores isolados. Por outro lado,
também não faz sentido se tomar o desfecho (outcome) como finalização de um processo
linear suposto como etiológico que gera (ou determina), em indivíduos, em populações e
na sociedade, o fenômeno complexo chamado saúde (ou enfermidade).
5 Sobredeterminação e ciência translacional transdisciplinar

A partir dessas explorações conceituais, visando superar dualismos, lógicas simplificadoras
e epistemologias datadas, propõe-se ampliar o escopo dessas intervenções e focalizar
soluções integradoras e articuladas para produção e incorporação do conhecimento
científico no campo da saúde. Para isso, faz-se necessário avaliar propostas recentes de
integração metodológica as quais, a partir da ideia de medicina baseada em evidências

orientada pelas contribuições de Cochrane e Sackett (FARIA; OLIVEIRA-LIMA; ALMEIDA-
FILHO, 2021), convergem para o movimento contemporâneo da Ciência Translacional.
O termo “pesquisa translacional” (PT) surgiu em 1993 e substituiu a noção de

“extrapolação” de resultados científicos na pesquisa laboratorial. Dische e Saunders (2001)
atribuem-no a Julie Denekamp, biofísica britânica reconhecida por suas contribuições à
oncologia de radiação (DENEKAMP, 2001). Durante toda a década de 1990, relativamente
poucas referências a esse termo foram encontradas na literatura, em geral oriundas da
pesquisa sobre câncer e da então nascente farmacogenômica (EVANS; RELLING, 1999).
Porém, a partir de 1999, a expressão from-bench-to-bedside (da bancada ao lado do leito)
é recuperada pelo National Institutes of Health (NIH), dos Estados Unidos, como
fundamento, justificativa e slogan para nova política científica. Em 2003, o NIH inicia um
grande programa institucional de fomento da pesquisa, o Clinical and Translational Science
Awards (CTSA), financiando a formação dos National Center for Advancing Translational
Sciences (NCATS) (ZERHOUNI, 2003). Em 2007, os Estados Unidos adotam oficialmente
a estratégia da Pesquisa Translacional (PT) como eixo da política de financiamento da
pesquisa em saúde (CURRY, 2008).
Conforme Feldman (2015), o financiamento para CTSAs e NCATS aumentou

exponencialmente na década de 2010, resultou em incremento da produção científica e
abarcou praticamente todos os campos de investigação em saúde. Desde 2012 o
financiamento desse programa alcançou o montante anual de meio bilhão de dólares. Em
2020, mais da metade das escolas médicas norte-americanas tinham implantado CTSAs
e/ou centros médicos acadêmicos chamados Institutos de Ciência Clínica e Translacional.
Cunhou-se o termo “medicina translacional” e seu ensino tornou-se um componente
obrigatório do currículo das escolas médicas dos EUA. Em outubro de 2011 foi realizada a
primeira International Conference of Translational Medicine (ICTM) na cidade de Wenzhou,
China (CHEN et al., 2012). Entre 2010 e 2020 inúmeras revistas foram criadas com o
objetivo de publicar resultados de pesquisa clínica e translacional, incluindo o Clinical and
Translational Science Journal e pelo menos cinco novas revistas com o adjetivo
translacional em seus títulos. A revista Science recentemente lançou uma extensão
especial intitulada Science Translational Medicine.
Esse movimento e seus desdobramentos foram analisados criticamente por Reinaldo

Guimarães (2013, 2019, 2019a). A partir do resgate de origens e vetores históricos de sua
evolução institucional, Guimarães (2013) realiza cuidadoso estudo da reconfiguração da

217
política científica norte-americana, ocorrida nas primeiras décadas deste século, com base
na noção de pesquisa translacional e seus vínculos com um novo empreendedorismo
acadêmico. Nessa análise, encontram-se interpretações de especial interesse por seu
grande potencial explicativo sobre o papel dos investimentos públicos em pesquisa
translacional na recuperação da indústria biofarmacêutica mundial, que na época enfrentou
profunda crise provocada pelo “aumento exponencial de custos para o desenvolvimento de
novas moléculas, em particular em suas fases mais tardias de pesquisa clínica e a queda
da proteção patentária de medicamentos de grande retorno financeiro” (GUIMARÃES,
2013, p. 1738). Guimarães (2019) analisa questões éticas relativas ao modelo translacional
de pesquisa, particularmente em países com sistemas de saúde desiguais e tendentes à
privatização, em contextos incipientes de inovação científica e tecnológica, como o Brasil,
uma vez que essa abordagem estimula o empreendedorismo acadêmico e a competividade
por financiamento privado.
Recentes reflexões produzidas por Austin (2018, 2021) postulam uma designação aberta
de ciência translacional e ampliam a noção original de pesquisa translacional. Essa
ampliação-abertura propicia compreensão epistemológica mais ampla e sistêmica desse
paradigma de produção e aplicação de conhecimento científico, extrapolando os limites do
campo da saúde. A relevância dessas reflexões recomenda a transcrição dos argumentos
principais (AUSTIN, 2021, p. 1632):
Inerente à abordagem empírica encontra-se uma aceitação tácita da

realidade histórica de que o processo translacional tem sido imutavelmente
imprevisível, uma ‘zona de caos’ ou complexidade irredutível nas palavras
de um cientista farmacêutico experiente e calejado. Em contraste, a ciência
translacional afirma que, embora altamente complexo, o processo
translacional é regido por leis gerais que até hoje resistiram à
caracterização, e que a eficiência translacional só aumentará quando essas
leis forem definidas. Muitos campos de pesquisa, da física à engenharia e à
genética, passaram da observação para a compreensão e para a previsão,
elucidando os princípios científicos e operacionais fundamentais que regem
o comportamento de sistemas em suas áreas. Esta é a transição necessária
para a translação e o objetivo da disciplina da ciência translacional.
Aqui se distingue entre a noção de “abordagem translacional” aplicada ao campo das

ciências e o processo de tradução/translação de uma intervenção terapêutica específica

para um alvo ou doença determinada, nesse caso referido como “pesquisa translacional”.
Para Austin (2021, p. 1629), a ciência translacional se define como
um campo de investigação que busca compreender os princípios científicos

fundamentais subjacentes a cada etapa do processo translacional, a fim de
torná-lo mais previsível e eficiente; é tão diferente da translação quanto, por
exemplo, a ciência de dados se distingue dos próprios dados.
Nessa recuperação e atualização de fundamentos e conceitos, os fenômenos da translação

não mais se configuram como processo linear e unidirecional, em etapas sucessivas, na
ideia simplista “da bancada ao leito”, tal como preconizado pelos primeiros esforços de
desenvolvimento tecnológico nesse paradigma, expresso na metáfora do continuum do
modelo do NIH, conforme analisado por Curry (2008). Postula-se a diversidade e
complexidade de sistemas e processos dinâmicos que conformam o ciclo de produção de
saberes-conhecimentos-tecnologias. Para Austin (2021, p. 1641),
A translação é, por natureza, uma atividade transversal [cross-stage] e

transdisciplinar [cross-discipline], e muitas vezes uma atividade transcultural
[cross-culture] e multivalorada [cross-value]. A própria tradução da palavra
– que significa ‘transportar através’ – implica um abismo entre os
participantes que devem ser superados. As muitas disciplinas científicas,
médicas e pacientes diferentes que compõem a equipe translacional podem
levar à falha de comunicação e desalinhamento de prioridades que
regularmente impedem o progresso de projetos translacionais, ou causam
fracasso total.
O aspecto da transdisciplinaridade (TD) é valorizado por Austin (2021, p. 1642) ao afirmar

que o desenvolvimento translacional de uma intervenção do laboratório para ensaios
clínicos, daí à prática médica individual e depois para a saúde pública, “requer nada menos
que 20 disciplinas científicas distintas, cada uma com seu próprio vocabulário, estruturas
de incentivo e resultados valorizados”. A interação-translação entre disciplinas mostra-se
pertinente para traduzir conhecimentos produzidos por um tipo de pesquisa para outro
formato na dimensão concreta de aplicação tecnológica (por exemplo, transpor uma
descoberta da ciência básica ao plano da prática clínica, diagnóstica ou terapêutica). Por
outro lado, projetos translacionais promovem a transposição do setor público para o setor
industrial privado, às vezes retornam à esfera pública na aplicação com objetivos de
cuidado e promoção da saúde e envolvem pesquisadores, clínicos, pacientes, gestores e
políticos, com distintas prioridades, interesses e estruturas institucionais.

219
Begerowski e colaboradores (2021) apresentam uma revisão integrativa da pesquisa
translacional com quatro objetivos: 1) fornecer uma visão geral do papel das equipes de
ciência na PT; 2) discutir barreiras contra a eficácia do trabalho em equipe na prática
científica; 3) avaliar limites e deficiências nas intervenções vigentes baseadas em PT; e 4)
apresentar recomendações para melhorar as intervenções nas equipes de ciência
translacional, aplicando-se as melhores práticas da literatura produzida sobre equipes
científicas. Em paralelo, destacam o papel dos translational science teams, que combinam
diferentes abordagens entre disciplinas diversas, visando à tradução de achados de
pesquisa básica laboratorial para estudos em ambientes clínicos e, na sequência, em redes
assistenciais e sistemas de saúde. Finalmente, definem o movimento da PT como
desencadeador de transformações profundas no modo de produção das ciências na
contemporaneidade, proporcionando a construção de um novo campo de formalização e
investigação fundamentado na reflexividade da pesquisa, uma certa “ciência das equipes
de ciência” [Science of Team Science]. Conforme proposto por Curry (2008), trata-se de
uma “ciência da pesquisa translacional”.
Enfim, em sua evolução mais recente, o caráter transdisciplinar da pesquisa translacional

tem se tornado cada vez mais evidente e convergido inicialmente para uma Ciência
Translacional Transdisciplinar (Transdisciplinary Translational Science), a qual, em um ciclo
seguinte de grau de complexidade pode ser mais bem compreendida no registro da
pluralidade como “ciências translacionais transdisciplinares”. Uma década após o
surgimento da Ciência Translacional no campo biomédico, emergem propostas de
adaptação a outros campos científicos e respectivas aplicações tecnológicas, como a
Translational Ecology (ENQUIST et al., 2017) na Psicologia, então como Implementation
Science (STIRMAN; BEIDAS, 2020), na Educação (NORMAN; LOTRECCHIANO, 2021) e
nas Engenharias, sob o rótulo Technoscientific Research (NARAYANAMURTI, 2022).
A compreensão de questões fundamentais, testagem de novas hipóteses, elaboração de

modelos explicativos, cultivo de novas ideias, desenvolvimento de soluções de problemas
relevantes são metas primordiais da PT nos campos das ciências translacionais
transdisciplinares. Modelos possíveis de formação podem pavimentar o caminho
acadêmico para o atendimento desses objetivos com rapidez e eficiência suficientes para
acelerar o ritmo de incorporação de descobertas científicas às práticas terapêuticas da
clínica – no plano assistencial – e preventivas – no campo da saúde coletiva – nas
dimensões social, ecológica e política. Tudo isso se viabiliza a partir da formação de
cientistas translacionais, certamente o maior desafio no processo de implementação das

inovações, as quais, articuladas em programas e projetos, representam a mudança
paradigmática geradora da ciência translacional. De fato, inicialmente o interesse das
ciências translacionais pela educação se limitou ao ensino médico e ao ensino de ciências,
com o objetivo de formar futuros pesquisadores e clínicos de modo integrativo, para
compreender, interagir e intervir em uma dimensão translacional efetiva para atender às
demandas do campo da saúde. No lugar de from bench to bedside pode-se dizer, de modo
geral, from problem to solution e from politics/policy to implementation & change.
6 Comentário sintético
A configuração das ciências contemporâneas como parte de um modo de produção de

conhecimento cada vez mais coletivamente institucionalizado e organizado amplifica a
relevância da transdisciplinaridade na ciência translacional. Não obstante, Begerowski e
colaboradores (2021) reconhecem, nas iniciativas atuais de concretização e
institucionalização da PT, certa ingenuidade epistemológica e mesmo “pobreza teórica”.
Em sua crítica acima mencionada, Guimarães (2013, p. 1739) apontava então a fragilidade
dos fundamentos teórico-conceituais da proposta da pesquisa translacional:
Por um lado, há uma visão linear e unidirecional (da bancada para a beira
do leito) que é utilizada pela maioria da bibliografia; outro modelo seria uma
translação bidirecional e ainda linear (da bancada para a beira do leito e, por
vezes, daí novamente para a bancada); finalmente, uma visão mais
complexa, na qual o processo de translação seria um processo dinâmico e
de sentido variado.
Nessa última, a proposta de uma ciência translacional orientada para a complexidade se

configura como inevitavelmente transemântica, transdisciplinar, transetorial e transversal.
Assim, o termo-chave ‘translação’ desdobra-se nos sentidos de “tradução” (do inglês
translation) – para indicar efeitos (e defeitos) de comunicação intercientífica e
interdisciplinar; de “transposição” – de achados, métodos e modelos interpretativos; de
“transversalidade” – nos diferentes planos de ocorrência; e de transdisciplinaridade – no
sentido da integração entre as distintas formas ou modos de produção do conhecimento
(FELDMAN, 2015).
Para uma interpretação mais bem contextualizada da proposta da pesquisa translacional,

Guimarães (2019a) recorre à concepção de “modos de produção do conhecimento
científico” de Michael Gibbons e colaboradores (1994). Entretanto, a ideia dos modos de

221
produção científica antes havia sido formulada por Roy Bhaskar (1978; 1986) ao propor
uma teoria realista-crítica dos modelos explicativos na ciência, designados como teorias
científicas. A partir da crítica ao modo dedutivo-nomológico, que assume a teoria como
estrutura organizada de leis empíricas, Bhaskar (1986) identifica um modo de produção
científica definido por uma abordagem contextual-histórica, no qual a explicação consiste
em uma interação no domínio da linguagem, um intercâmbio (essencialmente não-
dedutivo) de proposições dependente de formas semânticas e sintáticas, em um contexto
paradigmático no qual operações de tradução ou transposição supostamente se viabilizam.
De acordo com Bhaskar (1986, p. 60), o realismo científico busca incorporar os pontos
positivos de ambos os modos de explicação – especialmente a sua experiência, com alta
“eficácia transfactual” – de construção de artefatos heurísticos denominados ‘modelos’.
Para Bhaskar (1986, p. 30), a categoria da indução deve ser entendida em dois
componentes: a ‘transdução’ (ou seja, a suposição de que as leis da natureza se aplicam
fora dos sistemas fechados – laboratórios, sistemas teóricos etc. – em que foram criadas)
e a ‘edução’ (expectativa de que as leis gerais inferenciais se aplicam a casos individuais).
Entretanto, a construção teórica de estruturas explicativas “transfactualmente eficazes”
(quer dizer, capazes de elucidar questões em geral, não somente eventos singulares) das
ciências de dado campo problemático se dá por ‘retrodução’, categoria que se refere ao
uso de analogias e estabelece a posteriori modelos metafóricos e metonímicos
propiciadores de uma análise realista da produção de sentidos. O que se tem designado
como ‘translação’, no sentido de transversalidade de planos de ocorrência, corresponde
diretamente à categoria bhaskariana de ‘transdução’. Por outro lado, o ‘translacional’
referido às operações de tradução transdisciplinar pode ser considerado como aplicação
direta da categoria de ‘retrodução’ referida à teoria do conhecimento de Peirce.
Também influenciado pela epistemologia peirciana, Juan Samaja (1987; 1994) formula uma
teoria dos modos de produção do conhecimento científico e traz uma concepção original
de planos de ocorrência e interfaces hierárquicas. Para Samaja (2004), qualquer tratamento
conceitualmente eficiente da questão da saúde deve basear-se em modelos explicativos
de maior complexidade e espectros conceituais mais amplos: do molecular-subindividual-
sistêmico-ecológico na dimensão biológica à dimensão individual-grupo-social-cultural na
dimensão histórica. Para aplicar tais categorias, conceitos e estratégias na modelagem de
objetos complexos e singulares da ordem dos eventos críticos da saúde, com significativo
grau de eficiência heurística, é preciso identificar subespaços ou planos de ocorrência,
introduzir formas de determinação, descrever objetos intermediários e delimitar interfaces
estruturantes dos processos de totalização desses objetos. Objetos desse tipo tendem a

maior grau de abstração para se tornarem objetos metassintéticos totalizados – o que
ocorre após serem interpretados – tomando-se como referência distintas camadas de
realidade concretizadas (ou imaginadas) pelas diversas ciências da saúde. Em outro texto
(ALMEIDA-FILHO, 2020), propôs-se designar essa propriedade de objetos complexos
samajianos como “multiplanidade”, no sentido de ocorrência simultânea em múltiplos
planos de realidade.
A conclusão, provisória, é a de que categorias como ‘contingência’ e ‘sobredeterminação’

se mostram cruciais para abordar a compreensão estrutural de totalidades complexas como
uma pandemia, um território, uma rede institucional ou um sistema de saúde, em
perspectiva metodológica translacional. Tem-se na ideia de sobredeterminação’, portanto,
uma modalidade de determinismo; na verdade, uma determinação que não é mecânica,
nem linear, nem preditiva, nem estatística (para usar a classificação de Bunge) mas
dinâmica, múltipla e complexa, plural, aberta e mutante. No campo dos eventos
contingentes e modelos de sobredeterminação, pensa-se no uso da teoria de redes como
mapa conceitual não apenas explicativo – nesse caso, como modelagem da
sobredeterminação – mas também prático, como programa metodológico geral, com
tipologias mais adequadas de intervenção para transformação, em um paradigma
translacional ampliado da pesquisa no campo da saúde.
Em termos estritamente epistemológicos, as modalidades da sobredeterminação

pertinentes compreenderiam “causação” nos planos biológicos e clínicos,
“sobredeterminação” da situação de saúde e das condições de vida, “produção” de práticas
e modos de saúde, “construção” de políticas e instituições de saúde e “invenção” de
sentidos e narrativas em saúde. O diferencial semântico sugerido entre os termos
“causalidade biológica”, “determinação social”, “produção cultural”, “construção política” e
“invenção simbólica” corresponde a diferentes planos da realidade e distintas interfaces, do
biológico-clínico ao ideológico-simbólico, passando pelos planos social, político-
institucional e sociocultural. Resta-nos indicar alguns eixos epistemológicos para articular
o papel da sobredeterminação frente a modos de produção do conhecimento científico, em
chave translacional, transdisciplinar, transversal e intersetorial. O “translacional-
transdisciplinar-transversal” é tomado aqui como um conjunto que implica
sobredeterminação capaz de integrar/articular efeitos de causação biológico-clínica,
determinação social, construção política, produção cultural e invenção simbólica dos
fenômenos, processos, eventos e objetos complexos da saúde.

223
Trata-se, nesse momento, de avançar na incorporação e aplicação desses elementos
teóricos, metodológicos e analíticos no campo amplo das ciências da saúde, com base na
ideia de Ciência Translacional Transdisciplinar. As estratégias de modelagem de estudos
capazes de dar conta de todo o processo – da causação à invenção – devem ser
estabelecidas com precisão e rigor para viabilizar modelos de integração metodológica. A
integração de disciplinas por meio de colaboração translacional entre equipes
interdisciplinares, formadas por pesquisadores/as transdisciplinares os quais atuam em
contextos e arranjos institucionais, sem dúvida facilita a elaboração de conceitos e
abordagens sobre questões de saúde, particularmente na avaliação tecnológica de
medicamentos, novos procedimentos, equipamentos e dispositivos de cuidado em saúde
destinados, em última instância, ao uso amplo na sociedade em geral.

Referências
ALMEIDA-FILHO, N. Modelagem da pandemia Covid-19 como objeto complexo (notas

samajianas). Estudos Avançados, v. 34, n. 99, p. 97-117, 2020. Disponível em:
https://www.scielo.br/j/ea/a/PYKMh83rMm77yFnjxCWzLMy/abstract/?lang=en. Acesso
em: 22 out. 2022.
ALMEIDA-FILHO, N. La ciencia tímida: ensayos de deconstrucción de la epidemiologia.

Buenos Aires: Lugar Editorial, 2000.
ALMEIDA-FILHO, N. A clínica e a epidemiologia. Rio de Janeiro: Apce/Abrasco, 1992.
ALMEIDA FILHO, N.; CASTIEL, L. D.; AYRES, J. R. M. Riesgo: concepto básico de la

epidemiología. Salud Colectiva, v. 5, p. 323-344, 2009. Disponível em:
https://www.scielosp.org/pdf/scol/2009.v5n3/323-344/es. Acesso em: 20 ago. 2022.
ALMEIDA-FILHO, N.; COUTINHO D. Causalidade, contingência, complexidade: o futuro

do conceito de risco. Physis: Revista Saúde Coletiva, v. 17, n. 1, p. 95-137, 2007.
Disponível em: https://www.scielo.br/j/physis/a/PNJtnDSwzyQGYL6Rc7Wygjh/?lang=pt.
Acesso em: 22 out. 2022.
ALTHUSSER, L. Contradicción y sobredeterminación (notas para una investigación). In:

ALTHUSSER, L. La revolución teórica de Marx. Buenos Aires: Siglo XXI, 1967a. p. 71-
106. (El artículo apareció en La Pensée de diciembre de 1962).
ALTHUSSER, L. Sobre la dialéctica materialista (de la desigualdad de los orígenes). In:

ALTHUSSER, L. La revolución teórica de Marx. Buenos Aires: Siglo XXI, 1967b. p. 132-
180. (El artículo apareció en La Pensée de agosto de 1963).
AMORIM, L. et al. Structural equation modeling in epidemiology. Cadernos de Saúde

Pública, v. 26, n. 12, p. 2251-2262, 2010. Disponivel em:
https://www.scielo.br/j/csp/a/xGHvqnRBJdR4hHDCGsKMP9M/?lang=en. Acesso em: 22
out. 2022.
AUSTIN, C. P. Opportunities and challenges in translational science. Clinical

Translational Science, v. 14, n. 5, p. 1629–1647, 2021. Disponível em:
https://ascpt.onlinelibrary.wiley.com/doi/full/10.1111/cts.13055. Acesso em: 22 out. 2022.
AUSTIN, C. P. Translating translation. Nature Reviews Drug Discovery, v. 17, p. 455-

456, 2018. Disponível em: https://www.nature.com/articles/nrd.2018.27. Acesso em: 22
out. 2022.
AYMERICH, M. et al. Translational research: aconcept emerged from health sciences and
exportable to education sciences. Annals of Translational Medicine Epidemiology, v. 1,
n. 1, p. 1005, 2014. Disponível em: https://austinpublishinggroup.com/translational-
medicine/fulltext/atme-v1-id1005.pdf. Acesso em: 22 out. 2022.
BACHELARD, R. La formation de I’esprit scientifique. 8th ed. Paris: Vrin, 1972. (1re
édition, 1938).
BACHELARD, R. Le nouvel espirit scientifique. 10th ed. Paris: Press universitaires de

France, 1968. 181p. (1re édition, 1934. Collection Nouvelle encyclopédie philosophique).

225
BHASKAR, R. Scientific realism and human emancipation. London: Verso, 1986.
BHASKAR, R. A realist theory of science. Hassocks: Harvester Press, 1978.
BEGEROWSKI, S. et al. An integrative review and practical guide to team development

interventions for translational science teams: one size does not fit all. Journal of Clinical
and Translational Science, v. 5, n. 1, p. 1-10, 2021. DOI:10.1017/cts.2021.832.
BOURDIEU, P. La distinción: criterios y bases sociales del gusto. Madrid: Taurus, 1988.
BUNGE, M. El principio de la causalidad en la ciencia moderna. Buenos Aires:

Eudeba, 1969.
CASTIEL, L. D. Freud: um epidemiologista? Cadernos de Saúde Pública, v. 4, n. 3, set.

1988. Disponível em: http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-
311X1988000300006&lng=en&nrm=iso. Acesso em: 20 ago. 2022.
CASTORIADIS, C. A instituição imaginária da sociedade. Tradução: Guy Reynaud.

São Paulo: Paz e Terra, 1982.
CHEN, X. et al. The international effort: building the bridge for Translational Medicine:
Report of the 1st International Conference of Translational Medicine (ICTM). Clinical
Translation Medicine, v. 1, n. 1, p. 1-10, 2021. Disponível em:
https://clintransmed.springeropen.com/articles/10.1186/2001-1326-1-15. Acesso em: 22
out. 2022.
COUTINHO, D. Tempo perdido e reinventado: memória e contingência em literatura e

psicanálise. 2004. Tese (Doutorado em Letras) - Universidade Federal da Bahia, Instituto
de Letras, Salvador, 2004.
COUTINHO, D.; ALMEIDA-FILHO, N.; CASTIEL, L. D. Epistemologia da epidemiologia. In:

ALMEIDA-FILHO, N.; BARRETO, M. L. Epidemiologia & saúde: fundamentos, métodos,
aplicações. Rio de Janeiro: Guanabara Koogan, 2011. p. 29-42.
CURRY, S. H. Translational science: past, present, and future. BioTechniques, v. 44, n.

2, Pii-Pviii, 2008. Disponível em: https://pubmed.ncbi.nlm.nih.gov/18422489/. Acesso em:
22 out. 2022.
DENEKAMP, J. Translational research: autobiographical highlights of a 36-year-long

journey in cancer research. Sweden: Library of the University Umea, 2001.
DISCHE, S.; SAUNDERS, M. Translational research: a new entity? Acta Oncologica, v.

40, n. 8, p. 995-999, 2001. Disponível em: https://doi.org/10.1080/02841860152708297.
ENQUIST, C. et al. Foundations of translational ecology. Frontiers Ecology

Environment, v. 15, n. 10, p. 541-550, 2017. Disponível em: https://esajournals.online
library.wiley.com/doi/10.1002/fee.1733. Acesso em: 22 out. 2022.
EVANS, W. E.; RELLING, M. V. Pharmacogenomics: translating functional genomics into

rational therapeutics. Science, v. 286, n. 5439, p. 487-491, 1999. Disponível em:
https://pubmed.ncbi.nlm.nih.gov/10521338/. Acesso em: 22 out. 2022.

FARIA, L.; OLIVEIRA-LIMA, J. A.; ALMEIDA-FILHO, N. Medicina baseada em evidências:
breve aporte histórico sobre marcos conceituais e objetivos práticos do cuidado. História
Ciências Saúde-Manguinhos, v. 28, n. 1, p. 59-78, mar. 2021. Disponível em:
https://www.scielo.br/j/hcsm/a/R8z4HdFLyXTRWk6dmxBgvkK/. Acesso em: 22 out. 2022.
FELDMAN, A. M. Bench-to-Bedside; Clinical and Translational Research; Personalized

Medicine; Precision Medicine - What’s in a Name? Clinical and Translational Science, v.
8, n. 3, p. 171-173, 2015. Disponível em: https://ascpt.onlinelibrary.wiley.com/doi/ 10.1111
/cts.12302. Acesso em: 22 out. 2022.
FREUD, S. El mecanismo psíquico de los fenómenos histéricos (comunicación

preliminar). Estudios sobre la histeria. In: OBRAS completas de Sigmund Freud.
Tradução: Luis Lopez-Ballesteros y de Torres. Madrid: Biblioteca Nueva, 1973 [1893-5]. t.
I.
FREUD, S. La interpretación de los sueños. In: OBRAS completas de Sigmund Freud.

Tradução: Luis Lopez-Ballesteros y de Torres. Madrid: Biblioteca Nueva, 1973 [1900]. t. I.
FREUD, S. Analisis fragmentario de una histeria “Caso Dora”. In: OBRAS completas de
Sigmund Freud. Tradução: Luis Lopez-Ballesteros y de Torres. Madrid: Biblioteca Nueva,
1973 [1901-1905]. t. I.
GARCÍA-CANCLINI, N. Diferentes, desiguales o desconectados. Revista CIDOB d’Afers

Internacionals, n. 66-67, p.113-133, 2004.
GIBBONS, M. et al. The new production of knowledge: the dynamics of science and
research in contemporary societies. London: Sage Publications, 1994.
GREENLAND, S. Randomization, statistics, and causal inference. Epidemiology, v. 1, p.

422-429, 1990.
GREENLAND, S.; PEARL, J.; ROBINS, J. M. Causal diagrams for epidemiologic research.
Epidemiology, v. 10, p. 7-48, 1999.
GUIMARÃES, R. Os desafios éticos da razão empreendedora. Ciência & Saúde

Coletiva, v. 24, n. 9, p. 3583-3594, 2019. Disponível em: https://www.scielo.br /j/csc/a/
8tnrJSMMJbnNZ9 skc3Qg6tH/abstract/?lang=pt. Acesso em: 26 ago. 2022.
GUIMARÃES, R. A razão empreendedora na pesquisa em saúde. Ciência & Saúde

Coletiva, v. 24, n. 9, p. 3571-3582, 2019a. Disponível em:
https://www.scielo.br/j/csc/a/rTh6qTf3FHDVnWBfn7t5z9r/?lang=pt. Acesso em: 22 out.
2022.
GUIMARÃES, R. Pesquisa translacional: uma interpretação. Ciência & Saúde Coletiva,

v. 18, n. 6, p. 1731-1744, 2013. Disponível em: http://www.scielo. br/pdf/csc/v18n6/24.pdf.
HERNÁN, M. A.; ROBINS, J. M. Causal inference: what if. Boca Raton: Chapman &
Hall/CRC Press, 2020. 302p. Disponível em: https://cdn1.sph.harvard.edu/wp-content/
uploads/sites/1268/2020/02/ci_hernanrobins_21feb20.pdf. Acesso em: 20 ago. 2022.
HOLLAND, P. W. Statistics and causal inference. Journal of the American Statistical

Association, v. 81, n. 396, p. 945-960, 1986.

227
KRIEGER, N.; DAVEY-SMITH, G. The tale wagged by the DAG: broadening the scope of
causal inference and explanation for epidemiology. International Journal of
Epidemiology, v. 45, n. 6, p. 1787-1808, 2016. Disponível em:
https://academic.oup.com/ije/article/45/6/1787/2617188. Acesso em: 26 ago. 2022.
LACAN, J. Escritos. Tradução: Tomás Segovia. 3 ed. rev. y corr. México: Siglo XXI, 2009.
t. I e II.
LACAN, J. Seminário XIX ... Ou pior. [1971-1972]. Tradução: Denise Coutinho et al.
Salvador: Espaço Moebius de Psicanálise, 2003.
LACLAU, E.; MOUFFE, C. Hegemonía y estrategia socialista. Buenos Aires: Fondo de

Cultura Económica, 2004.
MALDONADO, G. The role of counterfactual theory in causal reasoning. Annals of

Epidemiology, v. 10, p. 681-682, 2016. DOI: 10.1016/j.annepidem.2016.08.017.
MARX, K. Introducción general a la crítica de la economía política / 1857. Buenos

Aires: Siglo XXI, 1974.
MIETTINEN, O. S. Toward scientific medicine. Dordrecht: Springer International

Publishing, 2013.
MIETTINEN, O. S.; KARP, I. Epidemiological research: an introduction. New York:

Springer Science, 2012.
MIETTINEN, O. S.; STEURER, J.; HOFMAN, A. Clinical research transformed. Cham:

Springer Nature, 2019.
MILLER, J. A. Tabla comentada de las representaciones gráficas. In: LACAN, J. Escritos.

Tradução: Tomás Segovia. México: Siglo XXI, 2009. t. I e II.
MORABIA, A. Hume, Mill, Hill, and the sui generis epidemiologic approach to causal
inference. American Journal of Epidemiology, v. 178, n. 15, p. 1526-1532, 2013. DOI:
10.1093/aje/kwt223.
MORABIA, A. Epidemiological causality. History and Philosophy of the Life Sciences,

v. 27, n. 3-4, p. 365-379, 2005.
NARAYANAMURTI, V. Techno scientific research: a missing term in R&Ddiscourse.

Washington, DC: National Academy of Engineering, 2022. Disponível em:
https://www.belfercenter.org/publication/technoscientific-research-missing-term-rd-
discourse. Acesso em: 22 ago. 2022.
NORMAN, M. K.; LOTRECCHIANO, G. R. Translating the learning sciences into practice:

a primer for clinical and translational educators. Journal of Clinical and Translational
Science, v. 5, n. 1, p. 1-11, 2021. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/
articles/ PMC85 32184 /pdf/S2059866121008402a.pdf. Acesso em: 20 ago. 2022.
PEARL, J. An introduction to causal inference. International Journal of Biostatistics, v.

6, n. 2, 2010. DOI: 10.2202/1557-4679.1203, 2010.
PEARL, J. Causality: models, reasoning, and inference. 2nd New York: Cambridge

PEARL, J. Probabilistic reasoning in intelligent systems. San Mateo: Morgan
Kaufmann, 1988.
RICOEUR, P. De l’interprétation, essai sur Freud (1965). Paris: Seuil, 2006.
RICOEUR, P. Le conflit des interpretations. Paris: Seuil, 1969.
ROBINS, J. Data, design, and background knowledge in etiologic inference.

https://pubmed.ncbi.nlm.nih.gov/11338312/. Acesso em: 26 ago. 2022.
SALMON, W. C. Statistical explanation and statistical relevance. Pittsburgh: University

of Pittsburgh Press, 1970.
SAMAJA, J. Epistemología de la salud. Buenos Aires: Lugar Editorial, 2004.
SAMAJA, J. Desafios a la epidemiologia (pasos para uma epidemiologia ‘Miltoniana’).

Revista Brasileira Epidemiologia, v. 6, n. 2, p.105-20, 2003. Disponível em:
https://www.scielo.br/j/rbepid/a/s7qmXcKCZp5NKbxdgcczmfS/?lang=es. Acesso em: 26
ago. 2022.
SAMAJA, J. Dialectica de la investigación cientifica. Buenos Aires: Helguero, 1987.
SAMAJA, J. Epistemología y metodología: elementos para una teoría de la

investigación científica. Buenos Aires: Eudeba, 1994.
SOUSA-SANTOS, B. Introducción a las epistemologías del sur. In: MENESES, M. P.;

BIDASECA, K, (coord.). Epistemologías del sur. Buenos Aires: CLACSO, 2018. p. 25-
64.
STIRMAN, S.; BEIDAS, R. S. Expanding the reach of psychological science through

implementation science: introduction to the special issue. American Psychologist, v. 75,
n. 8, p. 1033-1037, 2020. Disponível em: https://pubmed.ncbi.nlm.nih.gov/33252942/.
SUPPES, P. A probabilistic theory of causality. Amsterdam: North Holle Press, 1970.
VANDERWEELE, T. J.; ROBINS J. M. Directed acyclic graphs, sufficient causes, and the
properties of conditioning on a common effect. American Journal of Epidemiology, v.
166, n. 9, p. 1096-1104, 2007. Disponível em:
https://academic.oup.com/aje/article/166/9/1096/88564. Acesso em: 26 ago. 2022.
ZERHOUNI, E. The NIH roadmap. Science, v. 302, n. 5642, p. 63-72, 2003. DOI:
10.1126/ science.1091867.

229
PARTE 3:
MÉTODOS DE INFERÊNCIA CAUSAL

Capítulo 8
Diagramas causais e equações

estruturais na avaliação de políticas
públicas
Marcelo M. Taddeo1
Leila Denise Amorim1
Rosana Aquino2
1
Instituto de Matemática e Estatística, Universidade Federal da Bahia
2
RESUMO:
Este capítulo destina-se a gestores e pesquisadores envolvidos em projetos de avaliação de impacto
de políticas públicas. O seu objetivo é apresentar o uso de diagramas causais como ferramenta
para compreensão dos mecanismos causais de intervenções, considerando-se possíveis fatores
contextuais e individuais que possam afetar a mensuração de seus efeitos e destacar sua relevância
e aplicabilidade para construção de investigações rigorosas. Os conceitos e terminologias da teoria
de grafos são sumarizados e ilustram a sua implementação por meio do uso de funções disponíveis
em software estatístico.
PALAVRAS-CHAVE:
Inferência causal. Diagramas causais. Grafo Direcionado Acíclico (DAG, do inglês Directed Acyclic
Graph).

231
1 Introdução
Nas últimas décadas, em contraste com o observado até a década de 1990, organismos e
instituições de pesquisa têm promovido o aumento acelerado do uso de avaliações do
impacto de intervenções e políticas públicas. Disso resultou uma mudança de foco,
particularmente dos processos de implementação das intervenções para seus efeitos sobre
as populações (CAMERON et al., 2016; WHITE, 2010). A avaliação do alcance de
iniciativas globais como os Objetivos de Desenvolvimento do Milênio (ODM), os Objetivos
do Desenvolvimento Sustentável (ODS) e de grandes investimentos em programas
setoriais – saúde, educação, proteção social e outros – tornou prioridade o desenvolvimento
teórico e metodológico das avaliações de impacto de intervenções sociais na agenda de
instituições não governamentais e governamentais de diversos países (CDG, 2006)1.
A estimação do efeito causal de uma intervenção sobre um desfecho é a principal

característica das avaliações de impacto, portanto, a que determina a escolha das
estratégias metodológicas a serem utilizadas. Um dos seus maiores desafios é separar o
efeito da intervenção do efeito devido a outros fatores, os quais também contribuem para
as mudanças observadas no desfecho de interesse. A estimação de efeitos causais requer
a definição exata do que entendemos por causa e efeito e o uso de ferramentas que vão
além das técnicas estatísticas usuais. É conhecida, por exemplo, a afirmação de que
correlação não implica causação (HOLLAND, 1986). De fato, medidas de associação, como
correlação ou coeficientes de regressão (entre outras), são per se incapazes de determinar
a direção e a magnitude do efeito causal. Por exemplo, no caso dos modelos de regressão
– mesmo havendo uma direção hipotética sobre os processos (e.g., 𝑌𝑌 = 𝑎𝑎𝑎𝑎 + 𝜀𝜀 em vez de
𝑋𝑋 = 𝑏𝑏𝑏𝑏 + 𝛿𝛿) – os dados, por si, não revelam qual a direção correta. Hoover (2008) chama
a isso de problema de equivalência observacional. Por outro lado, relações de causa e
efeito possuem uma direção natural, a qual reflete os mecanismos causais que geram os
dados. Assim, as relações causais são assimétricas, de modo que alterações em certos
componentes (exposições) afetam outros componentes (desfechos) e o oposto não é
verdadeiro. Tal efeito pode se dar pela modificação da distribuição de probabilidade
conjunta que descreve os dados, deslocando-a para nova distribuição. Essa característica
é o maior diferencial entre as análises estatísticas usuais e a inferência causal. Nesse
sentido, a inferência estatística padrão refere-se unicamente à distribuição conjunta
(observada), enquanto a inferência causal envolve a comparação entre distintas
distribuições de probabilidade relacionadas à variável resposta, considerando-se que certas
1
CGD. 2006. When Will We Ever Learn? Improving Lives through Impact Evaluation. Washington, DC: Center
for Global Development, Evaluation Gap Working Group.

intervenções poderiam ter sido impostas em variáveis do diagrama causal (distribuições
contrafactuais). Assim, se baseadas unicamente nos dados, proposições sobre
associações estatísticas são tudo o que se pode estabelecer, enquanto a inferência causal
depende de premissas estabelecidas a priori, isto é, anteriores às observações,
possivelmente não testáveis e embasadas nos mecanismos teóricos do fenômeno de
interesse.
Em suma, a operacionalização das noções de causa e efeito demanda (i) uma definição –
ao mesmo tempo aceitável e quantificável – do que é efeito causal e (ii) métodos
matemáticos apropriados que permitam sua estimação, se possível, em termos da Teoria
da Probabilidade. Atualmente, há alguns enfoques para se lidar com esses problemas. Em
linhas bastante genéricas, pode-se dividi-los em duas categorias principais: uma baseada
em respostas potenciais (RUBIN, 1974; NEYMAN, 1923) e outra baseada em diagramas
causais e equações estruturais (PEARL, 2009; ROBINS, 1986). Embora concorrentes,
essas possuem diversas interseções e podem muitas vezes ser utilizadas conjuntamente
em problemas de inferência causal. Neste capítulo, será abordada apenas a metodologia
baseada em diagramas causais.
2 O que se entende por causalidade

A ideia de causalidade, embora familiar, é carregada de controvérsias. O tema vem
evoluindo desde Aristóteles, passou por muitos outros pensadores, incluindo Hume, e
encontrou eco em debates mais recentes e não apenas no âmbito da filosofia. A relação de
causa e efeito como um objeto legítimo da ciência nunca foi unanimidade. Tanto é assim
que a estatística – ciência da análise e interpretação dos dados obtidos empiricamente –
não dedicou muito espaço ao assunto, ao menos no que se refere a estudos observacionais
(não experimentais). Para ilustrar, pode-se citar Pearson, para quem a categoria de causa
e efeito é um fetiche da ciência moderna (PEARSON, 1911, p. 12); isto é, a relação de
causa e efeito é o mero resultado da experiência de eventos recorrentes, de modo que sua
demonstração está além da capacidade da ciência. Nesse particular, Pearson não é
original, pois, muito antes dele, Hume havia estabelecido a impossibilidade de justificá-la
unicamente por meio da razão: “nosso conhecimento dessa relação [causa e efeito] deriva-
se inteiramente da experiência” (HUME, 1748, p. 65) e, portanto, da presunção de que o
futuro se comportará em conformidade com o passado. Ou seja, aquela conexão
necessária entre os eventos, a qual caracteriza relação de causa e efeito, simplesmente
não pode ser determinada, apenas inferida pelos sentidos a partir de elementos como

233
contiguidade temporal e espacial, precedência temporal (da causa em relação ao efeito) e
conjunção constante. Historicamente, a maior parte da pesquisa em estatística concentra-
se em métodos e modelos associativos, assim como ocorre em outras áreas mais recentes,
a exemplo do aprendizado de máquinas. Apesar disso, os debates e as contribuições
metodológicas sobre inferência causal têm se tornado cada vez mais comuns. Em outras
áreas, como economia2 e epidemiologia, no entanto, o tema sempre se fez mais presente.
Aqui, assim como em Salmon3 (1977), considera-se que a explicação de um fenômeno

qualquer – em oposição à sua mera descrição – consiste na apresentação de um
mecanismo causal que o justifique. Como consequência, modelos causais devem ser
capazes de prever o desfecho (i) em função da configuração das variáveis (mecanismo)
que compõem o sistema e (ii) caso se modifique, isto é, se intervenha sobre as variáveis
que o afetam (análise contrafactual). Previsões dessa natureza não apenas buscam
identificar padrões ocultos em um banco de dados por meio dos instrumentos estatísticos
usuais, mas se valem das relações intrínsecas (causais) entre as variáveis assumidas a
priori. Por essa razão, modelos causais –ou, mais precisamente, as proposições
contrafactuais – são, em princípio, falseáveis. Posto de outra maneira, o efeito causal de
uma variável sobre outra – devido a intervenções impostas no sistema que compõe o
mecanismo causal – pode ser estimado e atuar como uma predição testável empiricamente.
3 Diagramas causais e equações estruturais
Diagramas (ou grafos) causais e equações estruturais são ferramentas úteis para
identificar, visualizar e quantificar as relações de causa e efeito entre
intervenções/exposições e desfechos/variáveis resposta em um sistema de interesse, bem
como para determinar os fatores de confusão (confundimento) que podem enviesar as
relações causais dentro da estrutura assumida pelo investigador. O uso de diagramas
causais também permite identificar e avaliar quais variáveis são relevantes nessa relação
e quais devem ser controladas em eventuais modelos. Indica ainda a possibilidade de
caminhos e estratégias de identificação do efeito causal por meio de critérios específicos
ou pela indicação de variáveis instrumentais. Além disso, ajuda a identificar os mediadores
entre a exposição e o desfecho e a avaliar se o efeito total do primeiro sobre o segundo
pode ou não ser decomposto em efeitos diretos e indiretos. Na sequência, esses objetos e
seu uso no contexto de inferência causal serão descritos mais detalhadamente. Exposições
2
Um resumo interessante sobre a relação entre economia e causalidade é de Hoover (2008).
3
“To give scientific explanations is to show how events […] fit into the causal structure of the world.”

mais extensas podem ser encontradas, por exemplo, em Pearl (2009) e Spirtes et al. (2001).
Outras referências mais elementares incluem Koller e Friedman (2009), Pearl et al. (2016)
e Rothman et al. (2008).
Diagramas causais baseiam-se na terminologia e notação básica da teoria de grafos, cujos

elementos básicos serão descritos a seguir. Essencialmente, um grafo 𝒢𝒢 é um objeto
matemático composto de dois tipos de elementos: vértices e arestas. Os vértices
representam os elementos de interesse em um dado sistema e as arestas as conexões
entre tais elementos. Uma aresta pode ser direcionada (caso em que é representada por
uma seta) ou não direcionada (Figura 1 (a)). Uma aresta direcionada indica o sentido
“natural” das relações entre as variáveis e, portanto, passa uma ideia de precedência
(temporal, espacial etc.) entre elas. Quando todas as arestas em 𝒢𝒢 são direcionadas,
dizemos que 𝒢𝒢 é um grafo direcionado (Figura 1 (b) e (c)).
Os grafos são objetos bastante intuitivos e se adaptam muito bem à linguagem cotidiana.
Por exemplo, um caminho entre 𝑋𝑋 e 𝑌𝑌 é um conjunto de vértices 𝑊𝑊! , 𝑊𝑊" ,..., 𝑊𝑊# ligados
entre si por arestas que conectam 𝑋𝑋 e 𝑌𝑌. As arestas de um caminho não necessitam apontar
todas no mesmo sentido, mas quando isso ocorre, diz-se tratar de um caminho
direcionado. Um caminho direcionado que começa e termina no mesmo vértice é
denominado ciclo (ou ciclo direcionado). Um grafo 𝒢𝒢, ao mesmo tempo direcionado e sem
ciclos, como na Figura 1 (c), é um grafo direcionado acíclico (DAG4).
No contexto deste capítulo, os vértices representam as variáveis do mecanismo de

interesse, as quais denotam-se por letras e podem ser observadas ou não; as arestas
(quando direcionadas) representam as relações causais diretas entre elas. Em outras
palavras, uma seta partindo de 𝑋𝑋 e apontando para 𝑌𝑌 em 𝒢𝒢 indica que 𝑋𝑋 é causa de 𝑌𝑌. Nos
grafos em que existem arestas não direcionadas (como aquelas entre 𝑌𝑌, 𝑊𝑊" e 𝑊𝑊$ na Figura
1(a)), essas são mais comumente interpretadas como uma potencial relação de causa e
efeito.
4
Do inglês Directed Acyclic Graph.

235
Figura 1 - Tipos de grafos
𝑋𝑋 𝑊𝑊" 𝑊𝑊# 𝑋𝑋 𝑊𝑊" 𝑊𝑊#
𝑊𝑊! 𝑊𝑊!
𝑌𝑌 𝑊𝑊$ 𝑌𝑌 𝑊𝑊$
(a) Grafo não-direcionado (b) Grafo direcionado com ciclo.
𝑋𝑋 𝑊𝑊" 𝑊𝑊# 𝑊𝑊"
𝑊𝑊!
𝑌𝑌 𝑊𝑊$ 𝑊𝑊! 𝑋𝑋 𝑊𝑊#
(c) Grafo direcionado acíclico (d) Pais de 𝑋𝑋.

(DAG).
De modo semelhante, a ausência de arestas (setas) é interpretada como a inexistência de

uma relação causal entre as variáveis. Observe-se que a ausência de setas é uma hipótese
extremamente forte acerca da relação causal (direta) entre duas variáveis, visto que exclui
qualquer possibilidade de um efeito (direto) não nulo de uma sobre a outra. Grafos cujas
arestas denotam relações de causa e efeito entre variáveis são denominados grafos (ou
diagramas) causais.
Neste capítulo, discutem-se apenas os grafos do tipo DAG (Figuras 1(c) e 1(d)). Sob a
perspectiva causal, DAGs representam fenômenos em que não há causação mútua
(mesmo que indireta, via ciclos). Vértices que apontam para uma variável 𝑋𝑋, como na
Figura 1 (d), são chamados pais5 de 𝑋𝑋 e denotados por 𝑝𝑝𝑎𝑎% ou 𝑝𝑝𝑎𝑎& (quando 𝑋𝑋 for indexado
pelo índice 𝑖𝑖). Por definição, os pais de uma variável representam o conjunto de todas suas
causas diretas. Analogamente se há um caminho “totalmente” direcionado partindo de 𝑋𝑋
até 𝑌𝑌, isto é, um caminho do tipo 𝑋𝑋 → 𝐴𝐴! → ⋯ → 𝐴𝐴# → 𝑌𝑌, diz-se que 𝑋𝑋 é um ancestral de 𝑌𝑌
ou que 𝑌𝑌 é um descendente de 𝑋𝑋. Uma variável 𝑋𝑋 com 𝑝𝑝𝑎𝑎% = ∅, ou seja, sem pais, é
chamada exógena. Caso contrário, é endógena. Por fim, vale notar que embora um DAG
exclua a possibilidade de causação mútua, não é impossível que um elemento do
mecanismo seja afetado de forma recorrente ao longo do tempo. Nesses casos, vale
observar, tal elemento é representado por mais de uma variável e é normalmente indexado
pelo tempo, como, por exemplo, na situação 𝑅𝑅' → 𝑈𝑈' → 𝑅𝑅'(! (e.g. 𝑅𝑅 é renda e 𝑈𝑈
escolaridade). O ponto relevante aqui é observar que 𝑅𝑅' e 𝑅𝑅'(! – embora representem o
5
Do inglês Parents.

mesmo elemento (e.g. renda) – não são a mesma variável, de modo que a condição de
inexistência de ciclos nos DAGs permanece válida.
Diagramas causais são representações gráficas das relações causais em um sistema de

interesse, mas não as especificam completamente. Sua descrição completa se dá por meio
de relações funcionais denominadas equações estruturais: 𝑋𝑋 causa 𝑌𝑌 (𝑋𝑋 → 𝑌𝑌) se existir
uma função 𝑓𝑓, linear ou não linear, tal que 𝑌𝑌 = 𝑓𝑓(𝑋𝑋, 𝜀𝜀), na qual a variável aleatória latente
exógena 𝜀𝜀 representa fatores externos secundários e perturba a relação entre 𝑋𝑋 e 𝑌𝑌. Note-
se que a recíproca também é verdadeira, isto é, se existir 𝑓𝑓 tal que 𝑌𝑌 = 𝑓𝑓(𝑋𝑋, 𝜀𝜀), então o
“fluxo causal” entre 𝑋𝑋 e 𝑌𝑌 é graficamente representável pelo grafo 𝑋𝑋 → 𝑌𝑌. Neste ponto, é
importante ressaltar que a relação 𝑌𝑌 = 𝑓𝑓(𝑋𝑋, 𝜀𝜀) indica mais do que uma identidade
matemática e somente faz sentido efetivo na direção estabelecida, de modo que, embora
matematicamente possível, a igualdade 𝑋𝑋 = 𝑔𝑔(𝑌𝑌, 𝜀𝜀 ∗ ) é desprovida de significado causal. A
generalização para um mecanismo causal com mais do que duas variáveis, digamos,
𝑋𝑋! , … , 𝑋𝑋# , é trivial. Um diagrama 𝒢𝒢 associado às variáveis 𝑋𝑋! , … , 𝑋𝑋# é causal se e somente
se as equações estruturais forem da forma 𝑋𝑋& = 𝑓𝑓& (𝑝𝑝𝑎𝑎& , 𝜀𝜀& ), para 𝑖𝑖 = 1, … , 𝑘𝑘.
Figura 2 - Grafo causal G e as equações estruturais associadas
O termo ‘estrutural’ é importado das ciências sociais – mais especialmente da economia –

e pode ser lido como um sinônimo de causal. Em um modelo estrutural, as equações (e,
portanto, seus parâmetros) refletem certos pressupostos teóricos e têm significado causal
(SIMON, 1953; PEARL, 1998; HOOVER, 2008). Por exemplo, se duas variáveis não estão
conectadas em um DAG, a estrutura gráfica que representa os determinantes causais
implica a independência estatística entre essas variáveis. A Figura 2 ilustra um diagrama
causal e suas respectivas equações estruturais. Note-se que variáveis latentes (não
observadas) 𝜀𝜀! , … , 𝜀𝜀# não são representadas explicitamente em 𝒢𝒢, embora nada impeça de
fazê-lo. A relação dessas com as variáveis observadas é descrita pelas equações
estruturais. Em particular, quando as variáveis latentes são independentes entre si, diz-se
que o modelo é markoviano. Até aqui, tratamos o diagrama causal 𝒢𝒢 e as equações

237
estruturais como intrinsicamente conectados entre si. No entanto, dadas as variáveis
𝑋𝑋! , … , 𝑋𝑋* , elementos de um mecanismo qualquer, um diagrama 𝒢𝒢 e um conjunto de
equações estruturais podem ser independentemente propostos para descrever a relação
entre essas. Nesse caso, dir-se-á que o sistema de equações estruturais e o diagrama 𝒢𝒢
são compatíveis se os pais do grafo (𝑝𝑝𝑎𝑎& ) forem iguais ao do sistema de equações
estruturais (𝑝𝑝𝑎𝑎&∗ ), ou seja, 𝑝𝑝𝑎𝑎& = 𝑝𝑝𝑎𝑎&∗ , para todo 𝑖𝑖 ∈ {1, … , 𝑛𝑛}. Por 𝑝𝑝𝑎𝑎&∗ entende-se o conjunto
de variáveis usadas para explicar 𝑋𝑋& no sistema de equações estruturais, de modo que 𝑋𝑋& =
𝑓𝑓& (𝑝𝑝𝑎𝑎&∗ , 𝜀𝜀& ), para todo 𝑖𝑖 ∈ {1, … , 𝑛𝑛}.
A distribuição conjunta de probabilidade induzida pelas equações estruturais que

representa um fenômeno qualquer corresponde à sua distribuição conjunta “natural”, isto é,
ao mecanismo gerador de dados em seu estado natural e livre de qualquer ação externa.
Essa distribuição, denominada distribuição observada, assim como outras quantidades
derivadas (esperanças, momentos, correlações etc.), pode ser estimada pelos métodos
usuais da estatística. No entanto, aqui o interesse é avaliar o impacto de uma ação exercida
sobre esse mecanismo. O problema é que a tal ação corresponde nova distribuição, a qual
se designará distribuição contrafactual, que (potencialmente) difere da distribuição
observada, pois as variáveis sob efeito direto da ação exercida não mais se comportam
conforme sua distribuição “natural”. Dessa forma, a avaliação do impacto de uma ação
sobre um mecanismo qualquer consiste em inferir o contraste entre as distribuições
observada e contrafactual. Uma ação sobre um mecanismo pode ser uma intervenção,
exposição ou tratamento imposto por um agente externo. Para se uniformizar a
nomenclatura, ações externas exercidas sobre um dado mecanismo serão chamadas de
intervenção ou exposição. Por intervenção, portanto, entende-se qualquer alteração
arbitrária de uma variável (ou conjunto de variáveis) em um DAG 𝒢𝒢, da qual resulta a
alteração das equações estruturais correspondentes.
Figura 3 - Grafo "amputado" para incorporar a intervenção do (X=x)

A Figura 3 ilustra uma intervenção sobre 𝑋𝑋 tornando-a igual a 𝑥𝑥 – a despeito do estado
“corrente” da natureza. Em outras palavras, substitui-se a função original 𝑓𝑓% (veja Figura 2)
pela função constante que sempre atribui a 𝑋𝑋 o valor 𝑥𝑥. Graficamente, isso corresponde à
amputação de todas as setas em 𝒢𝒢 a apontar para 𝑋𝑋, o que altera completamente o
mecanismo. Matematicamente, essa intervenção é denotada por meio da expressão
𝑑𝑑𝑑𝑑 (𝑋𝑋 = x) ou mais simplesmente 𝑑𝑑𝑑𝑑 (𝑥𝑥) (PEARL, 2009). Como se observa, da intervenção
resulta um novo diagrama causal em um “universo modificado”, ao qual está associada a
distribuição de probabilidades denominada distribuição contrafactual e que se denotará
𝑃𝑃E⋅ |𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥)H. Note-se que o termo 𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥) em 𝑃𝑃E⋅ |𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥)H não significa que se
está condicionando sobre um evento “𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥)”. Esse termo indica apenas que se está
lidando com uma nova distribuição de probabilidade (proveniente da intervenção
𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥)). Uma notação alternativa poderia perfeitamente ser, por exemplo, 𝑃𝑃+,(%./) (⋅).
Dado que 𝑃𝑃E⋅ |𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥)H caracteriza completamente o mecanismo de interesse sob o
efeito da intervenção, o efeito causal é definido como sendo essa distribuição de
probabilidade.
O desafio consiste em resolver o problema fundamental da inferência causal, chamado

identificação causal, que é a determinação das condições sob as quais se pode inferir o
efeito causal usando-se métodos usuais da estatística. Nesse particular, os diagramas
causais são uma ferramenta bastante poderosa e, em muitos dos casos de interesse, os
diagramas causais são suficientes para a identificação do efeito causal, mesmo sem o
auxílio das equações estruturais.
Considere-se inicialmente o problema de identificação do efeito de X sobre Y na situação

mais simples da Figura 4(a), na qual 𝑊𝑊 representa o conjunto de confundidores da
relação entre X e Y, ou seja, o conjunto de causas em comum de 𝑋𝑋 e 𝑌𝑌. Ignorar a presença
de 𝑊𝑊 pode enviesar a estimativa do efeito de 𝑋𝑋 sobre 𝑌𝑌 (veja o Exemplo 1). Dada a
intervenção 𝑑𝑑𝑑𝑑(𝑥𝑥) ≡ 𝑑𝑑𝑑𝑑(X = x), obtém-se o novo grafo da Figura 4 (b). O fato a se destacar
é que, se 𝑊𝑊 for observável, então a identificação do efeito causal 𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H é, na verdade,
bastante simples.

239
Figura 4 – Grafo causal com confundidores observáveis
(a) (b) (c)
De fato, da Figura 4 (b) vê-se que, após a intervenção, 𝑋𝑋 e W tornam-se independentes,

de modo que
𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H = O 𝑃𝑃E𝑦𝑦M𝑤𝑤, 𝑑𝑑𝑑𝑑(𝑥𝑥)H ∙ 𝑃𝑃(𝑤𝑤) = O 𝑃𝑃(𝑦𝑦|𝑤𝑤, 𝑥𝑥) ∙ 𝑃𝑃(𝑤𝑤). (1)

1 1
Tecnicamente, a substituição do operador 𝑑𝑑𝑑𝑑(𝑥𝑥) por 𝑥𝑥 foi possível, pois 𝑃𝑃E𝑦𝑦, 𝑥𝑥 2 |𝑑𝑑𝑑𝑑(𝑥𝑥)H = 0,
se 𝑥𝑥′ ≠ 𝑥𝑥, e 𝑃𝑃E𝑥𝑥|𝑑𝑑𝑑𝑑(𝑥𝑥)H = 1. Porém, aqui o fato realmente relevante é a representação da
quantidade contrafactual 𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H em termos das quantidades estimáveis 𝑃𝑃(𝑦𝑦|𝑤𝑤, 𝑥𝑥) e
𝑃𝑃(𝑤𝑤), se 𝑊𝑊 for observável. Caso alguns dos componentes de 𝑊𝑊 sejam não observáveis, a
situação se complica, pois não se pode estimar 𝑃𝑃(𝑦𝑦|𝑥𝑥, 𝑤𝑤). Uma possibilidade seria
incrementar o diagrama causal (desde que respaldados pela teoria) de forma a tornar o
efeito identificável utilizando-se outros critérios, a exemplo dos que serão vistos mais
adiante neste capítulo. Por fim, observa-se que a fórmula anterior é um caso particular de
um resultado mais geral: basta que os pais de 𝑋𝑋 sejam observáveis para que o efeito causal
𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H seja identificável de acordo com a fórmula.
𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H = O 𝑃𝑃E𝑦𝑦|𝑥𝑥, 𝑝𝑝𝑝𝑝(𝑋𝑋)H ∙ 𝑃𝑃E𝑝𝑝𝑝𝑝(𝑋𝑋)H.

34(%)
O exemplo 1 apresentado a seguir ilustra o uso dessa fórmula em um contexto hipotético.

Os resultados desse exemplo são particularmente úteis em estudos observacionais. Em um
ensaio aleatorizado6, todo confundimento é eliminado (em princípio) devido ao processo de
atribuição de tratamento, a qual é determinada aleatoriamente por meio de um sorteio. Em
termos dos diagramas causais aqui estudados, isso significa remover a seta 𝑊𝑊 → 𝑋𝑋 e, no
6
Randomized Controlled Trial (RCT)

lugar de 𝑑𝑑𝑑𝑑(𝑥𝑥), considerar uma intervenção “estocástica” 𝑑𝑑𝑑𝑑E𝑋𝑋~𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵(𝑝𝑝)H, na qual 𝑝𝑝
indica a probabilidade de se atribuir o tratamento em vez do placebo, conforme indicado na
Figura 4 (c).
Exemplo 1: A Tabela 1 (Simpson, 1951) refere-se a um estudo hipotético para avaliar o

efeito de um tratamento baseado em 52 indivíduos, dos quais 40 são do grupo ‘Tratamento’
e 12 do grupo ‘Controle’. O sexo dos indivíduos é considerado um confundidor. A relação
entre ‘Tratamento’ (𝑋𝑋 = 1: Tratamento / 𝑋𝑋 = 0: Controle), ‘Desfecho’ (𝑌𝑌 = 1: Sucesso / 𝑌𝑌 =
0: Fracasso) e ‘Sexo’ (𝑊𝑊 = 1: Homens / 𝑊𝑊 = 0: Mulheres) é definida conforme o grafo da
Figura 4 (a).
Tabela 1 - Distribuição dos pacientes segundo o grupo de tratamento, desfecho e sexo

em estudo hipotético
Grupo Homens Mulheres

Total
Sucesso Fracasso Total Sucesso Fracasso Total
Tratamento 8 5 13 12 15 27 40
Controle 4 3 7 2 3 5 12
Total 12 8 20 14 18 32 52
Fonte: adaptado de Simpson (1951).
Ignorar o sexo do indivíduo na avaliação do efeito do tratamento resultaria em uma taxa

estimada de sucesso do tratamento de 50%. Ocorre, no entanto, que ao se fazer isso está-
se enviesando o resultado, pois a variável Sexo atua aqui como uma confundidora. De fato,
ao se olhar dentro de cada grupo, nota-se, entre os homens, a taxa de sucesso de 61%
(Tratamento) vs. 53% (Controle), e, entre as mulheres, 44% (Tratamento) vs. 40%
(Controle). Ou seja, embora aparentemente ineficaz quando se considera toda a população,
o tratamento é superior (em relação ao controle) quando se observa cada grupo
separadamente. Essa contradição é conhecida por paradoxo de Simpson e resulta, nesse
caso, do fato de que os homens se recuperam melhor da doença (e são mais suscetíveis
ao tratamento) do que as mulheres, embora a incidência entre as mulheres seja maior
(desbalanceando a amostra).
O viés (causal) induzido pela variável Sexo é eliminado aplicando-se a fórmula derivada
acima, da qual se obtém
8 20 12 32
𝑃𝑃(𝑌𝑌 = 1|𝑑𝑑𝑑𝑑(𝑋𝑋 = 1)) = ∙ + ∙ = 51,02%,
13 52 27 52
e, analogamente, 𝑃𝑃(𝑌𝑌 = 1|𝑑𝑑𝑑𝑑(𝑋𝑋 = 0)) = 46,56%, do que resulta que o tratamento é mais
eficaz do que o controle.

241
4 Padrões básicos de dependência7
Na próxima seção, veremos dois critérios bastante poderosos para a identificação de efeitos
causais em situações consideravelmente mais complexas do que a descrita nos parágrafos
anteriores. Esses critérios são elaborados em termos de estruturas ou padrões de
dependência (cadeias, bifurcações e colisoras) extremamente simples e que podem ser
visualizadas considerando-se três variáveis quaisquer (W , V e T) em um DAG, tais como
ilustradas na Figura 5 e descritas com mais pormenores na sequência.
Figura 5 - Padrões básicos de dependência
𝑊𝑊 𝑉𝑉 𝑇𝑇 𝑊𝑊 𝑉𝑉 𝑇𝑇
(a) Cadeia (b) Bifurcação
𝑊𝑊 𝑉𝑉 𝑇𝑇
(c) Colisor
4.1 Cadeia
Quando W causa V e esse, por sua vez, causa T, como na Figura 5(a), diz-se que formam
uma cadeia. Por exemplo, de modo simplificado, o Programa Mais Médicos (W) afeta o
número de consultas pré-natal (V), que, por sua vez, afeta a mortalidade materna (T). Se
a distribuição conjunta de W, V e T é compatível8 com o grafo da Figura 5(a), há
dependência entre todas as variáveis. No entanto, condicionadas em V, as variáveis W e 𝑇𝑇
tornam-se independentes. Em outras palavras, W e T são condicionalmente
independentes dado V e escreve-se 𝑊𝑊 ⊥ 𝑇𝑇𝑇𝑇𝑇. Alguns autores utilizam o termo overcontrol
bias para se referirem à situação em que um viés causal é introduzido por se condicionar a
distribuição de duas variáveis em uma cadeia causal pela variável mediando-as (isto é, no
meio da cadeia) (ELWERT, 2013; ELWERT et al., 2014; CINELLI et al., 2021). No exemplo
anterior, ilustrado na Figura 5(a), ao se fixar determinado número de consultas pré-natal, o
efeito do PMM na mortalidade materna (Z) não pode ser mais capturado.
7
Chain, Fork & Collider.
8
A distribuição conjunta 𝑃𝑃(𝑥𝑥! , … , 𝑥𝑥" ) das variáveis (𝑋𝑋! , … , 𝑋𝑋" ) que compõem um grafo causal 𝒢𝒢 e o referido
grafo são compatíveis se 𝑃𝑃(𝑥𝑥! , … , 𝑥𝑥" ) admitir a decomposição 𝑃𝑃(𝑥𝑥! , … , 𝑥𝑥" ) = ∏"#$! 𝑃𝑃(𝑥𝑥# |𝑝𝑝𝑎𝑎# ).

4.2 Bifurcação / Confundimento
Quando W e T possuem V como causa em comum, como na Figura 5(b), diz-se que essas
formam uma bifurcação. Um exemplo típico dessa estrutura poderia ser definido pelo
papel da renda familiar (V) que afeta a alocação no Programa Bolsa Família (W) e também
o número de infecções por sífilis (T). Assim como no caso anterior, há dependência entre
todas variáveis envolvidas nas relações expressas pelo grafo da Figura 5(b), contudo, as
variáveis W e 𝑇𝑇 são condicionalmente independentes dado V, isto é, 𝑊𝑊 ⊥ 𝑇𝑇|𝑉𝑉.
4.3 Colisor
Se W e T são causas de V, como na Figura 5(c), diz-se que W e T estão em colisão e que
𝑉𝑉 é uma variável colisora. Para ilustrar, suponha-se que 𝑊𝑊 indique infecção por H1N1, T
infecção por Covid-19 e 𝑉𝑉 admissão hospitalar (por infecção respiratória). Diferentemente
dos casos anteriores, W e 𝑇𝑇 são (marginalmente) independentes. Porém, uma correlação
espúria entre W e 𝑇𝑇 é induzida quando se condiciona em 𝑉𝑉.
Exemplo 2: Quando 𝑋𝑋 e 𝑍𝑍 não são marginalmente independentes como na Figura 6,
Figura 6 - Viés induzido por um colisor condicionar em 𝑌𝑌 pode induzir um viés (positivo ou
negativo) no efeito de 𝑋𝑋 sobre 𝑌𝑌. Greenland et al.
(1999a), por exemplo, consideram o caso em que 𝑌𝑌
representa o sangramento uterino, 𝑋𝑋 o nível de
estrogênio e 𝑍𝑍 o câncer de endométrio. Eles observam
Fonte: eleboração própria.
que a associação entre estrogênio e câncer de endométrio é “drasticamente reduzida”
quando avaliada em níveis distintos de sangramento uterino. No entanto, como se observa
no mesmo artigo, o mais plausível é que, em vez de remover um potencial viés causal entre
𝑋𝑋 e 𝑍𝑍 ao condicionar em 𝑌𝑌, o que se observou foi uma redução enviesada da associação
entre essas. Como se verá mais adiante, sendo a Figura 6 a representação correta do
fenômeno, o ideal seria modelar a incidência de câncer do endométrio apenas em função
do nível de estrogêncio sem condicionar nos níveis de sangramento uterino. A relação entre
sangramento e uso de estrogênio aumenta a taxa de detecção de câncer (bias de
detecção).

243
5 Critérios para identificação do efeito causal
Os critérios apresentados a seguir descrevem técnicas de identificação causal baseadas

no “bloqueio” de todo o confundimento entre X e Y, de modo que alterações na distribuição
de Y possam ser efetivamente creditadas a eventuais intervenções em X.
5.1 d-Separação
O critério da d-separação identifica se dois conjuntos de covariáveis (𝑋𝑋 e 𝑌𝑌, por exemplo)
são condicionalmente independentes, dado um terceiro conjunto de variáveis 𝒁𝒁. A letra d
em d-separação refere-se à palavra “direcionado”. Formalmente, um caminho 𝑐𝑐 em 𝒢𝒢 é dito
bloqueado ou d-separado por um conjunto de variáveis 𝒁𝒁 se ao menos uma das seguintes
condições se verificar:
(D1) 𝑐𝑐 contém uma cadeia 𝑊𝑊! → 𝑍𝑍! → 𝑊𝑊" ou uma bifurcação 𝑊𝑊! ← 𝑍𝑍! → 𝑊𝑊" com 𝑍𝑍! em 𝒁𝒁;
ou (D2) 𝑐𝑐 contém um colisor 𝑊𝑊, tal que 𝑊𝑊 e nenhum dos seus descendentes estão contidos
em 𝒁𝒁.
De modo geral, dizemos que um par de variáveis X e Y em 𝒢𝒢 é bloqueado ou d-separado

se todos os caminhos que os conectam e que não partem de X são d-separados por 𝒁𝒁
(GREENLAND et al., 1999a; PEARL, 2009; WILLIAMSON et al., 2014).
Na Figura 2, por exemplo, há dois caminhos que conectam X e Y que não partem de X, a
saber, 𝑐𝑐! : X ← W! → 𝑊𝑊" ← 𝑊𝑊$ → 𝑌𝑌 e 𝑐𝑐" : X ← W" ← 𝑊𝑊$ → 𝑌𝑌. Pelo critério da d-separação,
𝒁𝒁 = {𝑊𝑊$ } é suficiente para bloquear ambos os caminhos, pois ambos são bloqueados por
𝑊𝑊$ , pois contêm uma bifurcação na qual 𝑊𝑊$ é a causa comum. Note-se que, além disso, o
caminho 𝑐𝑐! é naturalmente bloqueado por 𝑊𝑊" , que atua como variável colisora. Em outras
palavras, se o grafo da Figura 2 descreve o mecanismo de interesse, ao se condicionar em
𝑊𝑊$ , faz-se com que toda dependência entre 𝑋𝑋 e 𝑌𝑌 se dê exclusivamente através do caminho
“direto” 𝑋𝑋 → 𝑌𝑌. Aplicando-se o critério de d-separação, a única variável de ajuste para
controlar o confundimento para a relação entre 𝑋𝑋 e 𝑌𝑌 é W3. Observe-se, em particular, que
𝑊𝑊" intercepta tanto 𝑐𝑐! quanto 𝑐𝑐" e que uma abordagem mais ingênua poderia usá-la para
tentar controlar o confundimento entre 𝑋𝑋 e 𝑌𝑌. No entanto, ao se fazer isso, o caminho 𝑐𝑐! ,
que estava bloqueado por W3, seria “desbloqueado” e se induziria, dessa forma, uma
correlação espúria entre a exposição e o desfecho.

Exemplo 3: A Figura 7 representa um grafo causal equivalente ao apresentado na Figura
2, referente ao efeito da qualidade da atenção primária à saúde (APS) sobre a mortalidade
infantil, considerando-se que o mecanismo inclui relações como o porte populacional do
município, despesa com APS per capita (R$) e percentual da população vivendo em
extrema pobreza.
Figura 7 - Relacionando a qualidade da APS à mortalidade infantil
Usando-se os critérios de d-separação conforme os argumentos anteriores, verifica-se que

o caminho causal entre qualidade da APS e mortalidade infantil pode ser identificado
ajustando-se apenas pela variável 𝒁𝒁 = {𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃ção 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃}, suficiente para
bloquear todos os caminhos e confundir a relação entre a qualidade da APS e a mortalidade
infantil.
6 Critério da porta dos fundos9
Um conjunto de variáveis 𝒁𝒁 satisfaz o critério da porta dos fundos em relação à X e 𝑌𝑌 se:

(a) nenhum elemento de 𝒁𝒁 é descendente de X e
(b) 𝒁𝒁 d-separa todos os caminhos entre X e 𝑌𝑌 que não partem de X.
Assim, controlando-se por 𝒁𝒁, garante-se que toda dependência residual entre X e 𝑌𝑌 se dê
unicamente pelo caminho partindo de X. De fato, se 𝒁𝒁 satisfaz o critério da porta dos fundos
em relação a X e 𝑌𝑌, então o efeito causal de 𝑋𝑋 sobre 𝑌𝑌 é identificável e dado por10.
𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H = ∑5 𝑃𝑃(𝑦𝑦|𝑥𝑥, 𝑧𝑧)𝑃𝑃(𝑧𝑧).
No exemplo da Figura 2, o critério em relação a X e 𝑌𝑌 é satisfeito por 𝒁𝒁 = {𝑊𝑊$ }, de modo

que o efeito causal de 𝑋𝑋 sobre 𝑌𝑌 é dado por 𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H = ∑1% 𝑃𝑃(𝑦𝑦|𝑥𝑥, 𝑤𝑤$ )𝑃𝑃(𝑤𝑤$ ).
9
Do inglês Backdoor criterion.
10
Teorema 3.3.2, Pearl (2009, p. 79).

245
Exemplo 4: O grafo causal na Figura 8 relaciona o tabagismo passivo de jovens entre 3 e
19 anos e sua capacidade pulmonar (volume
Figura 8 - Tabagismo passivo vs.
capacidade pulmonar expiratório forçado – VEF1). Sendo adequado o
mecanismo descrito pelo grafo, o critério da porta dos
fundos informa que a variável altura é desnecessária
para estimar a relação entre tabagismo indireto e
capacidade pulmonar, segundo as condições (a) e (b)
anteriores, uma vez que sexo e idade bloqueiam todos
os caminhos que confundem a relação entre a
exposição e o desfecho. Desse modo, o efeito da exposição indireta à fumaça (X=0/1) sobre
a capacidade respiratória (Y) pode ser identificado ao se ajustar o modelo pelas variáveis
idade e sexo (M/F). Cummiskey et al. (2020) apresentam resultados das análises desse
diagrama através do uso de modelo de regressão linear simples e de PSM. Os efeitos
estimados do tabagismo passivo sobre a capacidade pulmonar é de -0,08 (regressão linear
simples) e -0,15 (PSM). Considerando-se os respectivos intervalos de confiança11, nota-se
um efeito negativo ou nulo: a exposição indireta à fumaça tende a reduzir ou, na melhor das
hipóteses, não afetar a capacidade respiratória. A título de ilustração, observa-se que, no
entanto, o ajuste da capacidade respiratória em termos da exposição indireta à fumaça
desconsiderando-se o confundimento por idade e sexo resulta em um efeito positivo
significativo, a saber, 0,71 com I.C.95%= (0,49;0,93).
No entanto, esse critério de identificação causal não é infalível. Se 𝑊𝑊$ é não-observável

como na Figura 2, por exemplo, o critério não se aplica, pois não se pode condicionar em
𝑊𝑊" (variável colisora) e ao se condicionar em 𝑊𝑊! bloqueia-se apenas um dos caminhos (𝑐𝑐! ),
deixando o outro (𝑐𝑐" ) desbloqueado. Uma possível maneira de se contornar o problema é
através do próximo critério.
7 Critério da porta da frente12

Ao contrário do critério da porta dos fundos, serão explorados os caminhos partindo-se
de 𝑋𝑋 para identificar o efeito causal de 𝑋𝑋 sobre 𝑌𝑌. Para tanto, deve-se antes estabelecer
sob quais condições isso é viável. O método a seguir baseia-se no seguinte conceito: um
11
No ajuste via regressão, o IC para o efeito de interesse com nível de confiança de 95% é (-0,22;0,08) e no
ajuste via PSM é (-0,31;0,00).
12
Do inglês Frontdoor criterion.

conjunto de variáveis 𝑽𝑽 satisfaz o critério da porta da frente relativamente às variáveis X
e 𝑌𝑌 em 𝒢𝒢 se:
(a) 𝑽𝑽 intercepta todos o caminhos entre X e 𝑌𝑌 partindo de X;
(b) todos caminhos de X para 𝑽𝑽 não partindo de 𝑋𝑋 são bloqueados; e
(c) todos os caminhos de 𝑽𝑽 para 𝑌𝑌 apontando para 𝑽𝑽 são bloqueados por 𝑋𝑋.
Sob esse critério, vale a seguinte forma de identificação do efeito de 𝑋𝑋 sobre 𝑌𝑌: se 𝑽𝑽 satisfaz
o critério da porta da frente em relação a X e 𝑌𝑌 e P(𝑥𝑥, 𝑣𝑣) > 0, então o efeito causal de 𝑋𝑋
sobre 𝑌𝑌 é identificável e dado por13
𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H = O 𝑃𝑃(𝑣𝑣|𝑥𝑥) O 𝑃𝑃(𝑦𝑦|𝑥𝑥′, 𝑣𝑣) ∙ 𝑃𝑃(𝑥𝑥 2 ). (2)

6 /&
Note-se que a variável 𝑉𝑉 atua como um mediador na relação entre a exposição e o

desfecho, de modo que o ajuste de 𝑌𝑌 em função de 𝑋𝑋 e 𝑉𝑉 pode levar a um enviesamento
das estimativas do efeito causal de 𝑋𝑋 sobre 𝑌𝑌 (overcontrol bias). A Eq. (2), no entanto, indica
a forma correta (e mais complicada) de como se usar a variável “mediadora” 𝑉𝑉 para se
identificar o efeito causal de 𝑋𝑋 sobre 𝑌𝑌.
Exemplo 5. O grafo da Figura 9, uma variação do grafo da Figura 2, é utilizado para ilustrar
o critério da porta da frente, com a diferença de que (i) a variável 𝑊𝑊$ foi renomeada para 𝑁𝑁
para ressaltar o fato de que agora está se assumindo não-observável e (ii) uma nova
variável 𝑉𝑉 entre 𝑋𝑋 e 𝑌𝑌 foi incluída. Em princípio, a variável 𝑉𝑉 mediando 𝑋𝑋 e 𝑌𝑌 poderia ser
algum elemento inicialmente desprezado pelo investigador, dado que seu interesse
primordial é o efeito total de 𝑋𝑋 sobre 𝑌𝑌, a despeito de qualquer possível mediação entre
elas.
Figura 9 - Grafo causal identificável pelo critério da porta da frente
13
Teorema 3.3.4, Pearl (2009, p. 83).

247
Como se nota, 𝑉𝑉 intercepta o único e, portanto, todos os caminhos partindo de 𝑋𝑋 e
alcançando 𝑌𝑌. Além disso, como não há nenhum caminho de 𝑋𝑋 para 𝑉𝑉 a apontar para 𝑋𝑋,
ou caminho de 𝑉𝑉 para 𝑌𝑌 a apontar para 𝑉𝑉, pode-se concluir que as condições (a), (b) e (c)
do critério da porta da frente são satisfeitas, de modo que o efeito causal de 𝑋𝑋 sobre 𝑌𝑌 é
dado pela Eq. (2).
Em qualquer critério de identificação causal é necessário um conhecimento a priori do

mecanismo causal. Deve-se, em especial, ser capaz de declarar todas as variáveis
confundidoras entre o tratamento e o desfecho, inclusive as não-observáveis. Essas últimas
são particularmente desafiadoras, pois estão ausentes do conjunto de dados. A exclusão
de um ou mais confundimentos do mecanismo causal pode enviesar o efeito estimado.
Ficam, assim, evidentes os seguintes pontos cruciais:
(a) toda inferência causal depende fortemente do conhecimento do especialista –
somente ele pode garantir a completude do mecanismo causal apresentado; e
(b) conclusões retiradas da análise são sempre relativas às premissas assumidas e,
consequentemente, dependentes das suas qualidades.
Portanto, respeitadas as condições dos critérios de identificação causal, as estimativas

correspondentes têm, de fato, valor causal, contanto que as suposições do modelo causal
sejam aceitas.
8 Breve paralelo com o modelo de Rubin
Na introdução deste capítulo destacamos que diagramas causais e equações estruturais

representam um enfoque específico para lidar com o problema da inferência causal, porém,
não o único. Outro enfoque bastante utilizado, o modelo baseado em respostas potenciais
(RUBIN, 1974; NEYMAN, 1923), embora independente dos diagramas causais, pode ser
usado conjuntamente de forma bastante proveitosa. Nesse contexto, define-se o efeito
causal contrastando-se os valores que o desfecho poderia assumir para diferentes valores
da exposição. Para simplificar, assume-se que 𝑋𝑋 é binária, i.e., 𝑋𝑋 ∈ {0,1}, com 𝑋𝑋 = 0 a
indicar ausência de tratamento, por exemplo, e 𝑋𝑋 = 1 a indicar atribuição de tratamento e
denote por 𝑌𝑌/ a resposta potencial a representar o valor que o desfecho assumiria caso a
exposição fosse fixada (arbitrariamente) em 𝑥𝑥. A relação com o operador 𝑑𝑑𝑑𝑑(∙) se dá pelo
fato de que 𝑌𝑌/ ~𝑃𝑃E𝑦𝑦|𝑑𝑑𝑑𝑑(𝑥𝑥)H. Nesse sentido, contrastam-se os possíveis desfechos em

termos das diferentes exposições e toma-se a diferença (ou qualquer outra medida de
contraste, e.g., a razão) entre as respostas potenciais correspondentes, i.e., 𝑌𝑌! − 𝑌𝑌7 .
Obviamente, somente uma dessas respostas potenciais é observável (visto que apenas
uma exposição é possível para cada indivíduo isoladamente), e, portanto, uma delas, 𝑌𝑌7 ou
𝑌𝑌! , é obrigatoriamente contrafactual. Para contornar esse problema, é usual se considerar
contrastes baseados em quantidades populacionais em vez de individuais. Por exemplo,
poder-se-ia avaliar o efeito causal médio 𝐸𝐸 [𝑌𝑌! − 𝑌𝑌7 ] ou ainda 𝐸𝐸 [𝑌𝑌! − 𝑌𝑌7 |𝑐𝑐 ] quando na
presença de confundimento. Na linguagem dos diagramas causais, isso equivale à
diferença 𝐸𝐸 [𝑌𝑌|𝑑𝑑𝑑𝑑(𝑋𝑋 = 1)] − 𝐸𝐸 [𝑌𝑌|𝑑𝑑𝑑𝑑(𝑋𝑋 = 0)].
Como em qualquer problema de inferência causal, um dos principais objetivos aqui é

também o da identificação do efeito causal. E, de fato, sob determinadas condições, é
possível escrever o efeito causal médio em termos de quantidades populacionais. Para
ilustrar, considere o caso mais simples delineado acima e suponham-se válidas as
seguintes premissas: (A1) 𝑌𝑌 = 𝑥𝑥𝑌𝑌! + (1 − 𝑥𝑥)𝑌𝑌7 , (A2) princípio da não interferência entre as
unidades contrafactuais e (B) 𝑌𝑌/ ⊥ 𝑋𝑋|𝐶𝐶. A premissa (A1) é chamada condição de
consistência (ROBINS, 1986) e basicamente impõe que o desfecho observado deve ser
igual à resposta potencial correspondente à exposição factual. A condição (A2) impõe que
o tratamento aplicado a uma unidade amostral não afete outras unidades amostrais (COX,
1958). As condições (A1) e (A2) juntas são usualmente conhecidas pelo acrônimo SUTVA
(Stable Unit Treatment Value Assumption) (RUBIN, 1974). A premissa (não testável por se
tratar, em geral, de quantidades contrafactuais) (B), por outro lado, impõe que não deve
haver confundimento não observado entre a exposição e o desfecho. Nesse caso, é
possível mostrar que 𝐸𝐸 [𝑌𝑌! − 𝑌𝑌7 |𝑐𝑐 ] = 𝐸𝐸[𝑌𝑌|𝑋𝑋 = 1, 𝑐𝑐 ] − 𝐸𝐸 [𝑌𝑌|𝑋𝑋 = 0, 𝑐𝑐 ]. Se se quiser remover o
confundimento do efeito causal médio, devem-se ponderar os efeitos definidos por
𝐸𝐸 [𝑌𝑌! − 𝑌𝑌7 |𝑐𝑐 ] pelas probabilidades correspondentes, isto é,
𝐸𝐸[𝑌𝑌! − 𝑌𝑌7 ] = O{𝐸𝐸 [𝑌𝑌|𝑋𝑋 = 1, 𝑐𝑐 ] − 𝐸𝐸 [𝑌𝑌|𝑋𝑋 = 0, 𝑐𝑐]}𝑃𝑃(𝑐𝑐).

8
Convém notar, em particular, a semelhança ou relação dessa expressão com a equação

(1), o que ilustra a correspondência entre os diversos enfoques para avaliar o efeito causal.
9 Mediação causal
A análise de mediação causal é mais um passo adicional na exploração do mecanismo

causal. Até então, o foco do capítulo foi a avaliação do efeito total de uma exposição sobre

249
um desfecho. Porém, ao explorar os modos pelos quais a exposição influencia o desfecho,
surge a pergunta de como essa influência se dá por diferentes caminhos. Havendo uma
variável mediadora, i.e., um elemento intermediário e o desfecho 𝑌𝑌, podemos nos
perguntar de que modo ela afeta o efeito de 𝑋𝑋 sobre 𝑌𝑌, ou seja, se ela o amplifica ou o
reduz. Pode-se também mensurar qual a contribuição individual de cada um dos caminhos
entre a exposição e o desfecho para o efeito total. Em outras palavras, quanto do efeito
total se deve aos efeitos indiretos (com mediação) e quanto se deve aos diretos (sem
mediação).
Figura 10 - Grafo causal com mediação
A Figura 10 representa o mecanismo básico com o qual se quer lidar. Para que uma
variável se qualifique como mediadora, é preciso que exista uma precedência temporal, ou
seja, M deve ocorrer posteriormente a 𝑋𝑋 e anteriormente a 𝑌𝑌. Porém, na realidade, o que
determina um mediador é a teoria científica que respalda o mecanismo causal escolhido
(IMAI et al., 2010). Um exemplo de análise de mediação na avaliação de políticas públicas
em saúde é descrito por Anselmi e colaboradores (2017), no qual se faz a avaliação de
impacto de um programa de pagamento por desempenho (P4P=payment for performance)
(exposição, X) conduzido na Tanzânia, sobre a atenção à saúde materna (Y), mediado pela
cobertura dos serviços de saúde (mediador M).
Normalmente o interesse primordial é o efeito de 𝑋𝑋 sobre 𝑌𝑌, porém, no caso ilustrado pela
Figura 10, há dois caminhos pelos quais essa influência “flui”: um direto 𝑋𝑋 → 𝑌𝑌 e outro
indireto ou mediado 𝑋𝑋 → 𝑀𝑀 → 𝑌𝑌. A influência direta de 𝑋𝑋 sobre 𝑌𝑌 é mais fácil de se
identificar. Por exemplo, pode-se fixar 𝑀𝑀 em um nível 𝑚𝑚 e estimar o chamado efeito direto
controlado (EDC), que é definido por
𝐸𝐸𝐸𝐸𝐸𝐸(𝑚𝑚) = 𝐸𝐸 [𝑌𝑌/9 − 𝑌𝑌/ & 9 ] = 𝐸𝐸 [𝑌𝑌𝑌𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥𝑥 𝑀𝑀 = 𝑚𝑚𝑚] − 𝐸𝐸 [𝑌𝑌𝑌𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥𝑥𝑥 𝑀𝑀 = 𝑚𝑚𝑚].

A resposta potencial 𝑌𝑌/9 representa o valor que o desfecho assumiria caso 𝑋𝑋 e 𝑀𝑀 fossem
fixados nos valores 𝑥𝑥 e 𝑚𝑚 respectivamente. Ao fixar 𝑚𝑚 bloqueia-se o caminho indireto 𝑋𝑋 →
𝑀𝑀 → 𝑌𝑌 e garante-se que diferenças nas distribuições de 𝑌𝑌, associadas a diferentes
intervenções em 𝑋𝑋 (𝑑𝑑𝑑𝑑(𝑥𝑥) e 𝑑𝑑𝑑𝑑(𝑥𝑥′)), dão-se pelo caminho direto 𝑋𝑋 → 𝑌𝑌. Se não houver
confundimento algum, a fórmula de identificação é definida facilmente por
𝐸𝐸𝐸𝐸𝐸𝐸(𝑚𝑚) = 𝐸𝐸[𝑌𝑌|𝑥𝑥, 𝑚𝑚] − 𝐸𝐸 [𝑌𝑌|𝑥𝑥′, 𝑚𝑚].
Na presença de confundidores, a identificação do efeito causal é um pouco mais delicada,

pois deve-se levar em conta que 𝑋𝑋 age como um confundidor de 𝑀𝑀. Utilizando-se de
técnicas como as discutidas anteriormente, verifica-se que se o conjunto de confundidores
𝐶𝐶 é observável, então
𝐸𝐸𝐸𝐸𝐸𝐸(𝑚𝑚) = O(𝐸𝐸 [𝑌𝑌|𝑥𝑥, 𝑚𝑚, 𝑐𝑐 ] − 𝐸𝐸 [𝑌𝑌|𝑥𝑥′, 𝑚𝑚, 𝑐𝑐 ])𝑃𝑃(𝑐𝑐).

8
A estratégia acima é inviável para a identificação do efeito indireto de 𝑋𝑋 sobre 𝑌𝑌, pois não
há maneira óbvia de se bloquear o “fluxo causal” pelo caminho direto 𝑋𝑋 → 𝑌𝑌. Um enfoque
menos intuitivo, baseado em intervenções pontuais, tanto sobre o tratamento quanto sobre
a mediação, foi sugerido por Robins e Greenland (1992) e Pearl (2001). Chama-se de efeito
direto natural a quantidade14 𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) = 𝐸𝐸 Å𝑌𝑌/:'& − 𝑌𝑌/ & ('& |𝑐𝑐Ç e de efeito indireto natural
𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) = 𝐸𝐸 Å𝑌𝑌/:' − 𝑌𝑌/: & |𝑐𝑐Ç. O NDE reflete a diferença esperada nos desfechos quando se
'
contrastam os níveis de tratamento 𝑥𝑥 e 𝑥𝑥 2 mantendo-se a mediação fixada no nível em que

essa “naturalmente” estaria se o tratamento fosse fixado em 𝑥𝑥 2 . O NIE, contrariamente,
mantém o tratamento fixado em 𝑥𝑥 e contrasta os valores esperados das respostas
potenciais quando somente a mediação é afetada por diferentes níveis de tratamento. A
identidade 𝑌𝑌/ = 𝑌𝑌/:' implica que o efeito total 𝑇𝑇𝑇𝑇(𝑐𝑐) = 𝐸𝐸 Å𝑌𝑌/:' − 𝑌𝑌/2:'& |𝑐𝑐Ç é exatamente
igual à soma dos efeitos naturais direto e indireto, i.e., 𝑇𝑇𝑇𝑇(𝑐𝑐) = 𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) + 𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐).
A presença de contrafactuais encaixados, em que a resposta potencial de interesse

depende também de outra “resposta” potencial como em 𝑌𝑌/:'& , no NDE e no NIE impede o
uso do operador 𝑑𝑑𝑑𝑑(∙), pois demanda intervenções distintas referentes à mesma variável e,
além disso, uma das intervenções é sobre a variável mediadora. Mais do que isso, o uso
14
Em inglês utilizam-se as nomenclaturas Natural Direct Effect e Natural Indirect Effect, daí os acrônimos
NDE e NIE. Por serem bastante difundidos, esses serão mantidos no texto em vez dos correspondentes em
português EDN e EIN. Isso também vale para o efeito total.

251
de contrafactuais encaixados impede que os efeitos naturais direto e indireto sejam
identificados mesmo se a exposição for aleatorizada (ROBINS; GREENLAND, 1992).
Também por causa dos contrafactuais encaixados, a identificação dos efeitos direto e
indireto é um pouco mais complicada. No entanto, sob as condições de identificabilidade
(A1) – (A4) descritas abaixo15 (PEARL, 2001) os efeitos naturais direto e indireto são
identificáveis
(A1) 𝑌𝑌/9 ⊥ 𝑋𝑋|𝐶𝐶

(A2) 𝑌𝑌/9 ⊥ 𝑀𝑀|𝑋𝑋, 𝐶𝐶
(A3) 𝑌𝑌/ ⊥ 𝑋𝑋|𝐶𝐶
(A4) 𝑌𝑌/9 ⊥ 𝑀𝑀/2 |𝐶𝐶
Em particular, as condições (A1) – (A2) são também necessárias para a identificação do

efeito direto controlado discutido anteriormente. Transcrevendo-se essas condições de
identificabilidade, conclui-se, usando a Figura 10, que as condições (A1) – (A3) implicam,
respectivamente, a inexistência de confundimento não mensurável entre a exposição e o
desfecho, entre o mediador e o desfecho e entre a exposição e o mediador. A condição
(A4), por outro lado, implica a inexistência de confundimento entre o mediador e o desfecho
que seja ao mesmo tempo afetado pela exposição (VANDERWEELE, 2015). Como
consequência, se (A1) – (A4) valem, os efeitos naturais direto e indireto são dados por
𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) = O{𝐸𝐸 [𝑌𝑌|𝑥𝑥, 𝑚𝑚, 𝑐𝑐 ] − 𝐸𝐸 [𝑌𝑌|𝑥𝑥 2 , 𝑚𝑚, 𝑐𝑐]}𝑃𝑃(𝑚𝑚|𝑥𝑥 2 , 𝑐𝑐),

9
𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) = O 𝐸𝐸 [𝑌𝑌|𝑥𝑥, 𝑚𝑚, 𝑐𝑐 ]{𝑃𝑃(𝑚𝑚|𝑥𝑥, 𝑐𝑐) − 𝑃𝑃(𝑚𝑚|𝑥𝑥 2 , 𝑐𝑐)}.

9
Por fim, vale observar que o conceito de mediação acima apresentado, embora bastante
geral, possui suas limitações. Possivelmente, a principal é o fato de que 𝑀𝑀 deve ser tratado
como um elemento único (porém, não necessariamente escalar). Em aplicações nas quais
os efeitos de múltiplos mediadores devem ser avaliados individualmente, outras
considerações precisam ser levadas em conta. Além disso, pode-se desejar avaliar o efeito
da mediação em escalas diferentes das apresentadas acima. Diversos trabalhos são
15
A condição (A4) pode ser ignorada se se garantir que a inexistência de confundimento pós-tratamento, isto
é, todo confundimento (exposição/mediador, exposição/desfecho e mediador/desfecho) é devido a
covariáveis basais (IMAI et al., 2010).

dedicados a esses temas e a outros semelhantes, incluindo-se múltiplos mediadores
(DANIEL et al., 2015; VANDERWEELE; VANSTEELANDT, 2014), modelos não lineares,
como em análise de sobrevivência (FULCHER et al., 2017; TADDEO; AMORIM, 2022) ou
variáveis tempo-dependentes (ROBINS et al., 2000; DIDELEZ, 2019), considerando-se
premissas mais rigorosas para a identificabilidade dos efeitos mediados em tais contextos.
10 Softwares estatísticos para diagramas causais
Uma vez identificadas todas as variáveis relevantes (exposição, desfecho, confundidores

mensuráveis e não mensuráveis) para definição do mecanismo causal, softwares podem
ser utilizados para a construção dos grafos. Aplicações populares e gratuitas para
desenhar, editar e analisar DAGs incluem os pacotes dagR (BREITLING, 2010), dagitty
(TEXTOR et al., 2016) e ggdag (BARRETT, 2021) no software R. No STATA existe o
módulo DAG proposto para implementação de diagramas causais acíclicos (WU, 2019).
DAGitty.net é um ambiente virtual que fornece ferramentas para construir, editar e analisar
diagramas causais e pode ser usado diretamente no R por meio dos pacotes dagitty e
ggdag, os quais foram usados para a construção das Figuras 11- 14. Os primeiros passos
incluem a criação do DAG usando linguagem simbólica do DAGitty, com especificação das
variáveis ou nós (nodes, na nomenclatura do dagitty) e das arestas, incorporando a
definição de pais, filhos, ancestrais e descendentes dos nós. Por exemplo, a Figura 11(a)
ilustra um DAG que representa uma bifurcação, enquanto a Figura 11(b) ilustra a utilização
de cores e legenda para discriminar confundidores (pais) de tratamento (filhos), na qual a
e b denotam os confundidores da relação entre x e y. Todas as variáveis/vértices são
representadas por círculos nos diagramas causais construídos pelo daggity no R.
Figura 11 - Exemplos de diagramas causais no daggity (R)
(a)
(a) (b) (b)

253
Na etapa seguinte é possível se avaliar os caminhos entre quaisquer duas variáveis, com
a possibilidade da identificação dos caminhos d-separados (denominados “open” no
daggity) e da implementação de testes para avaliar independência condicional entre as
variáveis (TEXTOR et al., 2016). Para ilustrar esse procedimento, considere-se o DAG da
Figura 12 para avaliar a relação causal entre utilização da APS de forma continuada, como
fonte usual do cuidado (exposição), e hospitalização por doenças crônicas não
transmissíveis - DNCT (desfecho), em que a adesão ao tratamento da hipertensão é uma
variável mediadora dessa relação. Considere-se ainda que o conhecimento sobre a doença
e suas complicações é um fator que afeta a adesão ao tratamento e que, por sua vez,
aumenta o risco de hospitalização por doença crônica. Assim, há duas cadeias no DAG:
“APS à Adesão à Hospitalização” e “Conhecimento à Adesão à Hospitalização”. Além
disso, assume-se que a escolaridade do usuário impacta tanto o uso da APS de forma
continuada (em vez de buscar atendimento de emergência quando se tem uma
complicação) quanto o conhecimento sobre a doença e suas complicações. Isso implica a
presença de uma bifurcação (Conhecimento ß Escolaridade à APS) no mecanismo causal
e indica uma associação entre conhecimento e uso da APS.
Figura 12 - DAG para avaliar relação causal entre APS como fonte usual do cuidado e
hospitalização por doenças crônicas
Para estudar o efeito causal do uso da APS sobre a hospitalização por doenças crônicas,
deve-se avaliar todos os caminhos backdoor e produtores de confundimento na relação
entre as variáveis de interesse. Cadeias e bifurcações são caminhos abertos em um DAG
e todos os caminhos abertos entre a exposição e o desfecho podem ser listados com o uso
da função ggdag_paths() do pacote ggdag do R, conforme mostrado na Figura 13 (a).

Figura 13 - Critérios de d-separação para avaliar relação causal entre uso da APS e
hospitalização por doença crônica
(a) (b)
(c)
Diferentes estratégias podem ser adotadas para bloquear esse caminho backdoor. No
entanto, o ajuste por colisores ou mediadores pode introduzir um viés. Considerando-se um
determinado DAG, existem ferramentas computacionais para testar implicações de
suposições implícitas no diagrama causal e sugerir conjuntos de variáveis a serem
controladas para identificação do efeito causal (ANKAN et al., 2021). Nesse sentido podem
ser definidos conjuntos de variáveis minimamente suficientes, ou seja, conjuntos de
variáveis que, quando controladas, bloqueiam todos os caminhos backdoor. Quando
variáveis importantes do DAG são não-mensuradas/latentes, pode não ser possível
produzir esses conjuntos suficientes para bloquear esses caminhos. No exemplo da Figura
12 esse conjunto é constituído por uma única variável, a saber, o conhecimento sobre a
doença. Em outras palavras, se o mecanismo causal descrito pelo DAG estiver correto,
pode-se obter uma estimativa não enviesada do efeito causal do uso da APS sobre as
hospitalizações por doenças crônicas simplesmente controlando (ajustando) pelo
conhecimento sobre a doença. O conjunto minimamente suficiente de variáveis a ser
incluído no ajuste pode ser encontrado com auxílio da função ggdag_adjustment_set() do

255
pacote ggdag do R, como ilustrado na Figura 13 (b). Nesse exemplo especificamente não
se pode controlar pela variável adesão ao tratamento porque essa é uma variável
mediadora entre a exposição e o desfecho e, ao controlar por essa variável bloqueia-se o
caminho entre uso da APS e hospitalização, o que resulta em estimativas enviesadas. A
Figura 13 (c), obtida com o uso da função ggdag_dseparated(), ilustra o efeito da inclusão
da variável adesão no ajuste, torna exposição e desfecho d-separados e,
consequentemente, os faz parecer não associados. Obviamente, a depender da pergunta
de investigação, o interesse central pode estar na decomposição do efeito total de X em Y
em efeitos direto e indireto, casos em que a variável mediadora deve ser considerada
explicitamente, de modo que o pesquisador deve proceder com a análise de mediação e
usar as metodologias apropriadas, como aquelas descritas em seção anterior.
Figura 14 - D-separação em relação incluindo um colisor
(a) (b)
(c) (d)
Considere-se agora um segundo exemplo para ilustrar o viés que pode resultar em análises
com um colisor, conforme a Figura 5(c). Para essa discussão considere novamente a
relação entre H1N1, COVID-19 e admissão hospitalar (por infecção respiratória) como
ilustrada pelo DAG da Figura 14(a). H1N1 e COVID-19 são independentes, pois são

causados por vírus distintos. No entanto, é possível induzir uma correlação espúria entre
essas se se condicionar na variável colisora hospitalização (por infecção respiratória). Ou
seja, em um eventual estudo que busque avaliar o efeito (hipotético) do H1N1 sobre a
COVID-19, não se deve ajustar pela hospitalização, conforme ilustrado pela Figura 14(b).
De fato, se hospitalização for incluída como uma variável de ajuste na relação entre H1N1
e COVID-19, esses se tornam associados dentro dos estratos do colisor (Figura 14(c)).
Outra forma menos óbvia de viés devido à estratificação pela presença do colisor ocorre
quando se faz o ajuste por um descendente de colisor. Para ilustrar, considere a Figura
14(d), em que se acrescentou uma medicação (ibuprofeno) que poderia ser usada durante
a hospitalização por quaisquer das duas viroses. Nesse caso, a inclusão de ibuprofeno no
ajuste do modelo torna H1N1 e COVID-19 associados (d-conectados). Esse tipo de
avaliação pode se tornar ainda mais difícil em DAGs muito complexos porque algumas
vezes colisores são também confundidores. Os caminhos contendo colisores estão
naturalmente bloqueados. Porém, um colisor em um caminho pode não ser colisor em outro
caminho e confundir a relação entre exposição e desfecho. Assim, é perfeitamente possível
que eventualmente o investigador julgue necessário ajustar pela variável colisora. Nesses
casos, deve-se adotar uma estratégia para remover o viés resultante da inclusão da variável
colisora.
Exemplos de sintaxe usando o software R estão disponíveis em material suplementar on-

line associado a este capítulo.
Os DAGs, além de fornecerem uma representação gráfica que permite compreender os

complexos mecanismos causais entre uma intervenção e o desfecho de interesse, são
especialmente úteis em situações em que múltiplos fatores de confusão são considerados
simultaneamente, o que nem sempre é adequadamente abordado pelos métodos
tradicionais de controle de confundimento, pois a inclusão de certas covariáveis no modelo
de regressão múltiplo, por exemplo, pode introduzir, muitas vezes, associações
condicionais (GREENLAND; PEARL; ROBINS, 1999b). Esse cenário corresponde à
maioria das situações de avaliações de políticas públicas, as quais devem considerar amplo
leque de fatores contextuais e individuais que afetam a mensuração dos seus efeitos sobre
os problemas sociais. Nesse contexto, ressalta-se a relevância e aplicabilidade das

257
ferramentas descritas neste capítulo para construção de investigações causais mais
rigorosas.
Apesar do aumento da divulgação, sistematização e recomendações a respeito do uso dos

diagramas causais para identificação de confundimento nos últimos anos (SHRIER; PLATT,
2008; CORTES et al., 2016; FERGUSON et al., 2020; TENNANT et al., 2021), poucos
estudos especificam claramente os DAGs propostos e os utilizam para identificar o conjunto
de covariáveis suficientes para o ajuste na estimação de efeito causal. Os métodos de
análise descritos neste capítulo podem ser usados na identificação do efeito causal,
permitindo que conclusões a respeito do efeito de uma exposição/intervenção sobre um
desfecho sejam feitas sem viés de confundimento (confounding bias). Desse modo,
potenciais conclusões espúrias, devido à escolha inadequada das variáveis de ajuste,
podem ser minimizadas, sobretudo durante a análise de dados em estudos observacionais
(SHRIER; PLATT, 2008; WILLIAMSON et al., 2014; DIGITALE et al., 2022). Importante
ressaltar, entretanto, que os DAGs representam as relações estruturais entre as variáveis
de interesse estabelecidas via suposições causais qualitativas do processo de geração de
dados na população, de modo que o DAG não reduz ou elimina outras fontes de
variabilidade ou de viés, como, por exemplo, aquelas relacionadas a erros de mensuração
em quaisquer das variáveis (GREENLAND; PEARL; ROBINS, 1999a; ELWERT; WINSHIP,
2014).
O uso de diagramas causais também auxilia no estudo de variáveis mediadoras entre a

exposição/intervenção e o desfecho, possibilitando orientar as decisões e as estratégias
para a estimação do efeito total da intervenção ou de sua decomposição em efeitos diretos
e indiretos. Desse modo, vale relembrar que, se o objetivo for a estimação do efeito total da
intervenção sobre o desfecho, a variável mediadora usualmente não deve ser considerada
no ajuste, a menos que se faça uso de critérios específicos, tal como o critério da Porta da
Frente, pois, caso contrário, pode-se induzir um viés (overcontrol bias). Por outro lado,
quando o objetivo central da análise for relacionado à estimação do efeito causal mediado
deve-se recorrer ao uso de outras métricas, como efeito direto controlado ou efeito indireto
natural.
As relações causais descritas com auxílio dos diagramas causais e equações estruturais
empregam conceitos e terminologia da teoria de grafos sumarizados neste capítulo e outros
critérios importantes para avaliação de d-separação, tendo sua implementação sido
ilustrada por meio do uso de funções disponíveis em software estatístico que facilitam a

aplicação desses critérios gráficos. No Quadro 1 apresenta-se uma sistematização do
processo de identificação causal. Um glossário com alguns conceitos fundamentais
relacionados ao uso de diagramas causais e equações estruturais é apresentado no
Apêndice deste capítulo.
Quadro 1 - DAG Passo-a-Passo
1. A criação do diagrama causal requer a especificação:

a) de todos os caminhos causais de acordo com o mecanismo hipotetizado, incluindo o
reconhecimento de pais/filhos; ancestrais/descendentes; variáveis observadas/latentes, que
incorporam suposições sobre as relações entre as variáveis;
b) a exposição (X) e do desfecho (Y).
2. Na identificação causal para estimação de efeito total (X à Y), as conclusões seguem

considerando-se:
a) o uso de critérios como d-separação, porta dos fundos e porta da frente, que necessitam
da identificação de padrões envolvendo colisores, mediadores e bifurcações. Desse modo:
b.1) o conjunto das variáveis minimamente suficientes devem ser incluídas em conformidade
com o critério escolhido;
b.2) os descendentes de X não devem ser usados no ajuste;
b.3) variáveis que não sejam pais de X, Y e das covariáveis do ajuste devem ser excluídas da
análise;
b.4) deve-se prestar atenção às variáveis colisoras.
A estimação do efeito causal total pode ser feita usando a Eq.1 ou outro método, como os
descritos nos capítulos 11-14. Para tal:
a) todos os caminhos não causais devem estar bloqueados para obtenção de estimativa sem
viés, conforme sintetizado no passo (2);
b) a identificação do efeito causal depende da validade do diagrama causal postulado, ou
seja, assume-se que o DAG corretamente retrata o fenômeno.
Se o objetivo envolver análise de mediação (X à M à Y), em que o foco é decompor o efeito

total em efeito direto e indireto, deve-se considerar o uso de outros métodos e a verificação de
suposições adicionais para estimação do efeito mediado.
O pesquisador deve explicitar e justificar todas as suposições necessárias para validação da

interpretação do efeito causal da intervenção sobre o desfecho. Caso contrário, as conclusões
não possuem valor causal.
A qualidade ou magnitude da influência de um confundidor ou mediador não é mensurada

pelo DAG, o qual apenas identifica o(s) fator(es) de confusão. Assim, após a criação do
DAG e o uso das ferramentas descritas neste capítulo, o pesquisador pode realizar a

259
estimação do efeito causal usando alguma das metodologias descritas nos capítulos 11-
14. Pode haver situações mais complexas em que parece haver uma relação bidirecional
entre duas variáveis. No entanto, algumas situações podem ser simplificadas quando o
componente tempo é incorporado ao diagrama, de modo que o mesmo conceito/variável
em diferentes pontos do tempo representa variáveis distintas e devem ser tratados como
tal (SHRIER; PLATT, 2008; CORTES et al., 2016). Uma questão adicional refere-se ao
controle de múltiplas variáveis e considera os critérios de porta dos fundos ou porta da
frente. Mesmo que algumas dessas variáveis não sejam colisoras ou mediadoras, pode
haver problemas em usá-las no ajuste, a depender do modelo estatístico utilizado devido à
propriedade de colapsibilidade de alguns estimadores (GREENLAND et al., 1999b). Outros
contextos que merecem avaliações mais cuidadosas referem-se à forma de representação
de modificadores de efeito em DAGs, uma vez que cada nó representa uma variável
(VANDERWEELE; ROBINS, 2007; NILLSON et al., 2021).
Exercícios de fixação
1) Considerando-se os padrões de dependência 𝑌𝑌 ← 𝑋𝑋 ← 𝑍𝑍, 𝑈𝑈 → 𝑉𝑉 ← 𝑊𝑊 e 𝐴𝐴 ← 𝐶𝐶 → 𝐵𝐵,

responda às questões abaixo:
a. Denomine cada um dos padrões acima conforme nomenclatura definida no texto;
b. Para cada um dos padrões de dependência acima ilustrados, determine se há pelo menos
um par de variáveis independentes. Identifique-as, se houver;
c. Se não as houver, verifique se há a possibilidade de tornar duas das variáveis
condicionalmente independentes. Identifique o papel de cada variável.
2) Em relação ao diagrama causal abaixo representado, responda às questões a seguir.
a. Identifique todos os pais e os ancestrais de C;

b. Identifique todos os filhos e os descendentes de A;
c. Considerando 𝑋𝑋 e 𝑌𝑌 exposição e desfecho, respectivamente, identifique os caminhos
causais entre esses. Use o critério da Porta dos Fundos para identificar o conjunto mínimo
de covariáveis necessárias para minimizar o viés do efeito causal de 𝑋𝑋 sobre 𝑌𝑌. Justifique
por que cada uma das condições assumidas pelo critério é válida aqui;
d. Assuma todas as variáveis como binárias e descreva a fórmula do efeito causal identificado
no item anterior;
e. Repita os itens (c) e (d); agora, porém, use o critério da Porta das Frente.

Referências
ANKAN, A.; WORTEL, I. M. N.; TEXTOR, J. Testing graphical causal models using the R
package “dagitty”. Current Protocols, v. 1, p. 1-22, 2021. DOI: 10.1002/cpz1.45.
ANSELMI, L.; BINYARUKA, P.; BORGHI, J. Understanding causal pathways within health
systems policy evaluation through mediation analysis: an application to payment for
performance (P4P) in Tanzania. Implementation Science, v. 12, n. 10, p. 1-18, 2017.
DOI:10.1186/s13012-016-0540-1.
BARRETT, M. ggdag: an R Package for visualizing and analyzing causal directed acyclic
graphs. 2021. Disponível em: https://github.com/malcolmbarrett/ggdag. Acesso em: 20
ago. 2022.
BREITLING, L. P. dagR: a suite of R functions for directed acyclic graphs. Epidemiology,

v. 21, n. 4, 586-587, 2010. DOI: 10.1097/EDE.0b013e3181e09112.
CAMERON, D. B.; MISHRA, A.; BROWN, A. N. The growth of impact evaluation for
international development: how much have we learned? Journal of Development
Effectiveness, v. 8, n. 1, p. 1-21, 2016. DOI: https://doi.org/10.1080/19439342.2015.
1034156.
CINELLI, C.; FORNEY, A.; PEARL, J. Crash course in good and bad controls: technical
report R-493. 2021. Disponível em: https://ftp.cs.ucla.edu/pub/stat_ser/r493.pdf. Acesso
em: 20 ago. 2022.
CORTES, T. R.; FAERSTEIN, E.; STRUCHINER, C. J. Utilização de diagramas causais

em epidemiologia: um exemplo de aplicação em situação de confusão. Cadernos de
Saúde Pública, v. 32, n. 8, p. 1-13, 2016. Disponível em: https://www.scielo.br/j/csp/a/
Jhxhtwdf3nnqcsFtJHC3Z7y/?lang=pt. Acesso em: 20 ago. 2022.
COX, D. R. Planning of experiments. New York: John Wiley & Sons, 1958.
CUMMISKEY, K. et al. Causal inference in introductory statistics courses. Journal of

Statistics Education, v. 28, n. 1, p. 2-8, 2020. DOI: https://doi.org/10.1080/10691898.
2020.1713936
DANIEL, R. et al. Causal mediation analysis with multiple mediators. Biometrics, v. 71, n.
1, p. 1-14, 2015. Disponível em: https://onlinelibrary.wiley.com/doi/epdf/ 10.1111/biom.
12248. Acesso em: 20 ago. 2022.
DIDELEZ, V. Defining causal mediation with a longitudinal mediator and a survival

outcome. Lifetime Data Analysis, v. 25, n. 4, p. 593-610, 2019. DOI: 10.1007/s10985-
018-9449-0.
DIGITALE, J. C.; MARTIN J. N.; GLYMOUR, M. M. Tutorial on directed acyclic graphs.

Journal of Clinical Epidemiology, v. 142, p. 264-267, 2022. Disponível em:
https://www.sciencedirect.com/science/article/pii/S0895435621002407. Acesso em: 20
ago. 2022.
WERT, F.; WINSHIP, C. Endogenous selection bias: the problem of conditioning on a

collider variable. Annual Review Sociology, v. 40, p. 31-53, 2014. DOI: 10.1146/annurev-
soc-071913-043455.

261
ELWERT, F. Graphical causal models. In: MORGAN, S. L. (edit.). Handbook of causal
analysis for social research. Dordrecht: Springer, 2013. p. 245-273.
FERGUSON, K. D. et al. Evidence synthesis for constructing directed acyclic graphs

(ESC-DAGs): a novel and systematic method for building directed acyclic
graphs. International Journal of Epidemiology, v. 49, n. 1, p. 322-329, 2020. Disponível
em: https://academic.oup.com/ije/article/49/1/322/5536330. Acesso em: 20 ago. 2022.
FULCHER, I. R.; TCHEGEN, E. J. T.; WILLIAMS, P. L. Mediation analysis for censored

survival data under an accelerated failure time model. Epidemiology, v. 28, n. 5, p. 660-
666, 2017. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5756668/pdf/
nihms879681.pdf. Acesso em: 20 ago. 2022.
GREENLAND, S.; PEARL, J.; ROBINS, J. M. Causal diagrams for epidemiological

research. Epidemiology, v. 10, n. 1, p. 37-48, 1999a.
GREENLAND, S.; PEARL, J.; ROBINS, J. M. Confounding and collapsibility in causal

inference. Statistical Science, v. 14, n. 1, p. 29-46, 1999b. DOI: 10.1214/ss/1009211805.
HOLLAND, P. W. Statistics and causal inference. Journal of the American Statistical

Association, v. 81, n. 396, p. 945-960, 1986.
HOOVER, K. D. Causality in economics and econometrics. In: DURLAUF, S. N.; BLUME,

L. E. (ed.). The new palgrave dictionary of economics. 2nd New York: Palgrave
Macmillan, 2008.
HUME, D. Investigações sobre o entendimento humano e sobre os princípios da

moral. São Paulo: UNESP, 1748. 2003. (Tradução em 2003 pela Fundação Editora
UNESP).
IMAI, K.; KEELE, L.; YMAMOTO, T. Identification, inference and sensitivity analysis for
causal mediation effects. Statistical Science, v. 25, n. 1, p. 51-71, 2010. DOI:
10.1214/10-STS321.
KOLLER, D.; FRIEDMAN, N. Probabilistic graphical models: principles and techniques.

Cambridge: MIT Press, 2009.
NEYMAN, J. On the application of probability theory to agricultural experiments. Essay on

principles. Section 9. Partial translation from the original Frenc. Statistical Science, v. 5,
p. 465-480, 1923.
NILSSON, A. et al. A direct acyclic graph for interactions. International Journal of

Epidemiology, v. 50, n. 2, p. 613-619, Apr. 2021. Disponível em:
PEARL, J. Graphs, causality and structural equation models. Sociological Methods and
Research, v. 27, n. 2, p. 226-284, 1998. Disponível em: https://ftp.cs.ucla.edu/pub/stat_
ser/r253-reprint.pdf. Acesso em: 20 ago. 2022.
PEARL, J. Direct and indirect effects. In: CONFERENCE ON UNCERTAINTY IN

ARTIFICIAL INTELLIGENCE, 17., San francisco. Proceedings [...]. San Francisco:
Morgan Kaufmann, 2001. p. 411-420.

PEARL, J. Causality: models, reasoning, and inference. 2nd ed. New York: Cambridge
PEARL, J.; GLYMOUR, M.; JEWELL, N. P. Causal inference in statistics. New York:
Wiley, 2016.
PEARSON, K. The grammar of science. New York: Cosimo, 1911.
ROTHMAN, K. J.; GREENLAND, S.; LASH, T. L. Modern epidemiology. 3rd Philadelphia:

Lippinicott Williams & Wilkins, 2008.
ROBINS, J. M. A new approach to causal inference in mortality studies with sustained

exposure period – application to control of the healthy worker survivor effect.
Mathematical Modelling, v. 7, n. 9-12, p. 1393-1512, 1986. DOI:
https://doi.org/10.1016/0270-0255(86)90088-6.
ROBINS, J. M.; GREENLAND, S. Identifiability and exchangeability for direct and indirect
effects. Epidemiology, v. 3, p. 143-155, 1992. DOI: 10.1097/00001648-199203000-
00013.
ROBINS, J.; HERNÁN, M.; BRUMBACK, B. Marginal structural models and causal
inference in epidemiology. Epidemiology, v. 11, p. 550-560, 2000.
RUBIN, D. B. Estimating causal effects of treatments in randomized and nonrandomized

studies. Journal of Educational Psychology, v. 66, p. 688-701, 1974.
SALMON, W. A third dogma of empiricism. In: BUTTS, R.; HINTIKKA, J. (ed.). Basic
problems in methodology and linguistics. Dordrecht: D. Reidel, 1977. p. 149-166.
SHRIER, I.; PLATT, R. W. Reducing bias through direct acyclic graphs. BMC Medical
Research Methodology, v. 8, n. 70, p. 1-15, 2008. Disponível em:
https://bmcmedresmethodol.biomedcentral.com/articles/10.1186/1471-2288-8-70. Acesso
em: 20 ago. 2022.
SIMON, H. A. Causal ordering and identifiability. In: HOOD, C.; KOOPMAN, T. C. (ed.).
Studies in econometric methods. New York: Wiley and Sons Inc, 1953. p. 49-74.
SIMPSON, E. H. The interpretation of interaction in contingency tables. Journal of the

Royal Statistical Society: Series B (Methodological), v. 13, n. 2, p. 238-241, 1951.
SPIRTES, P.; GLYMOUR, C.; SCHEINES, R. Causation, prediction and search. 2nd ed.
Cambridge: MIT Press, 2001.
TADDEO, M. M.; AMORIM, L. D. Causal mediation for survival data: a unifying approach
via GLM. Revista Colombiana de Estadística, v. 45, n. 1, p. 161-191, 2022. DOI:
http://doi.org/10.15446/rce.v45n1.94553.
TENNANT, P. W. G. et al. Use of directed acyclic graphs (DAGs) to identify confounders in

applied health research: review and recommendations. International Journal of

263
TEXTOR, J. et al. Robust causal inference using directed acyclic graphs: the R package
'dagitty'. International Journal of Epidemiology, v. 45, n. 6, p. 1887-1894, 2016.
Disponível em: https://academic.oup.com/ije/article/45/6/1887/2907796?login=false.
VANDERWEELE, T. J. Explanation in causal inference: methods for mediation and

interaction. New York: Oxford University Press, 2015.
VANDERWEELE, T. J.; ROBINS, J. M. Four types of effect modification: a classification

based on direct acyclic graphs. Epidemiology, v. 18, n. 5, p. 561-568, 2007. DOI:
10.1097/EDE.0b013e318127181b.
VANDERWEELE, T. J.; VANSTEELANDT, S. Mediation analysis with multiple mediators.

Epidemiology Methods, v. 2, n. 1, p. 95-115, 2014. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4287269/pdf/nihms-633002.pdf. Acesso
em: 20 out. 2022.
WHITE, H. A contribution to current debates in impact evaluation. Evaluation, v. 16, n. 2,

p. 153-164, 2010. DOI: https://doi.org/10.1177/1356389010361562.
WILLIAMSON, E. J. et al. Introduction to causal diagrams for confounder selection.

Respirology, v. 19, n. 3, p. 303-311, Apr. 2014. Disponível em:
https://onlinelibrary.wiley.com/doi/epdf/10.1111/resp.12238. Acesso em: 20 ago. 2022.
WU, C. DAG: Stata module to provide utilities for directed acyclic graphs. 2019. Disponível
em: https://EconPapers.repec.org/RePEc:boc:bocode:s458467. Acesso em: 20 ago. 2022.

Glossário de Termos
Ancestral Uma causa direta (ou seja, pai) ou causa indireta (por exemplo,
avô) de uma variável específica.
Causa em Uma variável que causa duas ou mais outras variáveis. No
comum contexto de um DAG, uma variável que é, ao mesmo tempo, uma
ancestral de duas outras variáveis.
Colisor Variável que é ao mesmo tempo o efeito direto de outras duas
variáveis.
Condicionar em Uso de restrição amostral ou estratificação/regressão para
uma variável examinar a associação de exposição e desfecho dentro dos
níveis da variável condicionada.
Confundidor O confundidor é uma causa em comum para duas variáveis
(ou viés de distintas. Pode-se também considerar ancestrais de duas
confundimento) variáveis como um elemento de confundimento entre elas.
Correlação Ocorre quando duas ou mais variáveis são correlacionadas,
espúria porém, sem uma relação causal entre si. Especificamente em
estruturas com colisores, correlações espúrias são induzidas ao
se condicionar na variável colisora.
Critério da Critério de identificação causal baseado em d-separação que faz
Porta da Frente uso de variáveis intermediárias entre a exposição e o desfecho.
Critério da Critério de identificação causal baseado em d-separação que faz
Porta dos uso das variáveis confundidoras.
Fundos
d-separação Critério usado para decidir se um determinado conjunto de
variáveis (X) é condicionalmente independente de outro (Y)
quando condicionamos em um terceiro conjunto de variáveis (Z).
Descendente Efeito direto (ou seja, filho) ou efeito indireto (por exemplo, neto)
de uma determinada variável.
Efeito direto Na presença de uma variável mediadora, o efeito direto
controlado controlado é efeito direto da exposição sobre o desfecho em
níveis (estratos) fixados do mediador.
Efeito direto Ao se comparar a discrepância no efeito de dois tratamentos
natural (NDE) distintos (sendo um deles considerado o tratamento “natural”)
sobre um desfecho e na presença de uma variável mediadora, o
efeito direto natural é o efeito da exposição sobre o desfecho

265
quando assumimos a variável mediadora no nível em que ela
“naturalmente” se encontraria caso a exposição fosse sempre
igual ao tratamento “natural”.
Efeito Indireto Ao se comparar a discrepância no efeito de dois tratamentos
Natural (NIE) distintos (sendo um deles considerado o tratamento “natural”)
sobre um desfecho e na presença de uma variável mediadora, o
efeito direto natural é o efeito da exposição sobre o desfecho
quando assumimos que a resposta é sujeita somente ao
tratamento “natural”, enquanto a variável mediadora assume os
valores nos quais se encontraria em ambos os casos
considerados para a exposição.
Independência Relação em que duas ou mais variáveis tornam-se
Condicional independentes quando condicionadas em um outro conjunto de
variáveis.
Mediador Variável que age como interveniente entre duas variáveis em
uma cadeia causal.
Modelo Modelo em que todas as variáveis exógenas são independentes
Markoviano entre si.
Pais Conjunto de todas as causas diretas de uma variável.
Variável Uma variável 𝑋𝑋 com 𝑝𝑝𝑎𝑎! = ∅, ou seja, sem pais.
exógena.
Viés de “Erro” na estimativa do efeito causal em função do efeito de
confundimento causas em comum à exposição e ao desfecho que não foram
devidamente controladas pelo modelo considerado.
Viés de seleção Ocorre quando se condiciona a um efeito comum (isto é, variável
colisora).

Capítulo 9
Introdução aos modelos

experimentais e não-experimentais
aplicados à avaliação de políticas
públicas em saúde
Aléssio Tony Cavalcanti de Almeida1

Antonio Vinícius Barros Barbosa1
Laboratório de Economia e Modelagem Aplicada (LEMA), Universidade Federal da Paraíba

1
RESUMO:
Este capítulo tem o objetivo de fornecer um guia prático sobre os diferentes modelos utilizados na
avaliação de impacto. De forma geral, são discutidos os fundamentos dos modelos experimentais e
não-experimentais aplicados à avaliação de programas ou políticas públicas em saúde. Além disso,
apresenta uma árvore de decisão metodológica, cujo foco consiste em discutir os desafios e subsidiar
o pesquisador em saúde a respeito da escolha da metodologia mais adequada.
PALAVRAS-CHAVE:
Métodos experimentais e não-experimentais. Avaliação em saúde. Árvore de decisão.

267
1 Introdução
A escolha de um desenho apropriado para a avaliação de impacto está fundamentalmente

associada às características do programa ou da política em saúde. Entender o problema a
ser investigado, os objetivos e as condições nas quais a política foi implementada são
cruciais para se estabelecer o método que capture, de maneira confiável, a relação de
causa e efeito. O desafio para a elaboração da avaliação de impacto consiste em
estabelecer critérios objetivos para a escolha do método e a estratégia de identificação,
dadas as características do público-alvo, da cobertura do programa e da forma de seleção
dos indivíduos para a participação no programa (GERTLER et al., 2016)
Este capítulo tem como objetivo fornecer um guia prático para a escolha da metodologia
mais adequada de avaliação de impacto. Para isso, serão discutidos os fundamentos a
respeito do uso de modelos experimentais e não-experimentais aplicados à avaliação de
programas ou políticas públicas em saúde. De forma geral, serão discutidos os critérios
básicos para a definição lógica da escolha da metodologia frente aos diversos desafios da
avaliação. Tais desafios envolvem, por exemplo, a forma de seleção dos beneficiários para
o tratamento, a disponibilidade e estrutura de dados disponíveis e a influência de fatores
externos e não observados pelo avaliador.
A necessidade de se realizar avaliações de impacto tem aumentado substancialmente nos

últimos anos (BOUERI et al., 2015). Impulsionada pela crescente governança e
transparência de instituições públicas e privadas, é uma importante ferramenta de fomento
na discussão sobre a eficiência dos gastos, por permitir inferir – com rigor científico – os
efeitos de políticas e programas de saúde sobre a população. Ainda permite avaliar os
resultados obtidos em relação aos objetivos propostos e evidenciar suas potencialidades e
fragilidades. Os resultados da avaliação são úteis ao produzir informações sobre a relação
causal entre a intervenção e as variáveis de interesse e, assim, contribuir para melhoria
e/ou expansão do programa em questão.
A literatura de avaliação de impacto para a área de saúde é extensa (BHALOTRA et al.,

2016; CARRILLO; FERES, 2019; MADEIRA, 2014). O conhecimento teórico e as práticas
em saúde têm possibilitado a integração cada vez maior entre pesquisadores e tomadores
de decisão com o objetivo de trazer evidências precisas sobre a eficácia das políticas.
Nesse cenário, é importante para os profissionais de saúde entenderem os fundamentos
da avaliação de impacto como importante ferramenta de gestão.

O primeiro elemento necessário para se iniciar a avaliação de impacto consiste em delimitar
o problema de investigação. Isso envolve a definição do grupo de pessoas beneficiadas, os
indicadores de impacto escolhidos para mensurar o efeito e o entendimento de como a
política estabelece os critérios de participação. Em seguida, é necessário discutir quais os
objetivos da política, ou seja, qual problema identificado busca-se resolver por intermédio
de ações específicas. Por fim, o pesquisador deve coletar dados confiáveis para estimar o
efeito gerado. Por meio da construção de uma árvore de decisão metodológica, busca-se
auxiliar os diversos profissionais e pesquisadores na área de saúde na escolha do modelo
adequado para se identificar os impactos de interesse.
Além de apresentar breve descrição dos métodos experimentais e não-experimentais,

neste capítulo discute-se como a forma de seleção dos indivíduos ao tratamento traz
diferentes interpretações em relação aos efeitos estimados. Um experimento controlado
randomizado, por exemplo, é capaz de definir de maneira bastante precisa quais indivíduos
irão compor o grupo que sofreu a intervenção (grupo de tratamento) e o grupo que não
sofreu intervenção (grupo de controle). Como veremos, a média das diferenças dos
resultados potenciais para cada indivíduo permite a estimação do efeito médio do
tratamento, medida que informa qual o efeito esperado da intervenção quando considerada
grande quantidade de indivíduos. Em algumas situações, no entanto, não é possível se
observar com certeza como os indivíduos reagem quando são elegíveis ou não ao
tratamento. Tal situação é bastante comum em políticas de saúde de grandes dimensões,
nas quais o avaliador não consegue observar quem, de fato, aderiu ou não ao programa.
Nesse cenário, empregam-se diversas técnicas estatísticas a fim de possibilitar a estimação
do efeito. Cada método é baseado em hipóteses específicas e a escolha do mais apropriado
depende das características da política.
Na próxima seção discutem-se os elementos para a avaliação de impacto em sáude e

indicam-se as etapas básicas para o seu desenvolvimento. Em seguida discute-se como a
forma de seleção para o tratamento gera diferentes interpretações aos efeitos estimados.
Por fim, a seção 3 apresenta o guia completo de decisão para os modelos de avaliação,
além da introdução dos métodos que serão discutidos nos capítulos subsequentes.
2 Elementos necessários para avaliação de impacto na área da saúde
Questões iniciais sobre os elementos necessários para a avaliação de políticas públicas

em saúde:

269
• Por onde iniciar a avaliação de impacto de uma política pública?
• E se a política for da área da saúde, existe alguma diferença?
Vale ressaltar que uma avaliação de impacto bem conduzida é composta de oito etapas
básicas. A Figura 1 exibe uma sequência conceitual para o desenvolvimento de um estudo
avaliativo focado na identificação de efeitos causais de uma intervenção, partindo-se da
delimitação do problema de avaliação da comunicação e disseminação das evidências
encontradas. Destaca-se que não necessariamente o desenvolvimento do estudo precisa
seguir a sequência definida na Figura 1, mas via de regra essa seria a ordem esperada.
Independentemente do tipo de política pública, a primeira etapa fundamental para o

processo avaliativo, como em qualquer investigação científica, é a delimitação do
problema a ser investigado. Geralmente uma intervenção na área de saúde pode gerar
múltiplos efeitos – além dos relacionados diretamente à saúde dos indivíduos – e pode
trazer repercussões econômicas e sociais.
Após a determinação da questão fundamental de avaliação, a próxima etapa é a de

definições claras acerca dos objetivos pretendidos da avaliação. Uma sugestão para
realizar as duas etapas iniciais (problema e objetivos) é buscar informações nas
legislações, portarias e outros documentos técnicos que dispõem sobre a política pública
de saúde de interesse. Com base nessas informações, pode-se identificar o escopo, ações
e público-alvo da intervenção e, por conseguinte, o avaliador pode ter uma maior clareza
acerca dos encaminhamentos que serão dispostos na avaliação de impacto.
Figura 1 - Etapas básicas para o desenvolvimento de uma avaliação de impacto

Dessa forma, é importante na delimitação da avaliação não confundir ação com metas,
metas com objetivos ou ação com objetivos da política ou programa de saúde. Se o
interesse é avaliar o impacto de um programa de distribuição gratuita de medicamentos
para tratar hipertensão arterial, faz-se necessária a capacidade de se identificar
adequadamente o escopo da avaliação do programa. Exemplos:
• Aumentar o número de medicamentos distribuídos para tratamento de

hipertensão arterial. Esse é um exemplo de ação de um programa de distribuição de
medicamentos.
• Atingir 50% da população elegível com medicamentos distribuídos gratuitamente.

Nesse exemplo tem-se a descrição de uma meta.
• Reduzir a taxa de hospitalização e mortalidade por hipertensão arterial, pode ser

a descrição que demarca o objetivo desse programa de distribuição de
medicamentos.
A revisão da literatura especializada é uma etapa importante para verificar o que existe
acerca de estudos sobre a política de interesse, as variáveis utilizadas, as estratégias de
identificação e os principais resultados, bem como mapear como a avaliação de impacto
que será desenvolvida pode dar sua contribuição sobre o tema.
Do ponto de vista técnico, a avaliação de impacto na área da saúde não possui diferenças
específicas no que tange às etapas iniciais, mas provavelmente a depender da natureza do
problema e do nível de desagregação da análise, será necessário um conjunto de dados
individualizados (microdados) que podem estar sujeitos às restrições da Lei Geral de
Proteção de Dados Pessoais (LGPD)1, do sigilo médico e outros dados sensíveis,
sobretudo pelo fato de algumas estratégias metodológicas requererem dados longitudinais
dos indivíduos beneficiados e não beneficiados pela política em saúde.
Como destacado, os dados para uma avaliação de impacto precisam ser obtidos para
grupos de indivíduos tratados e não tratados, em que é obrigatória a identificação da
condição de tratamento e dos indicadores que mensuram impactos atribuíveis direta ou
indiretamente às ações da política ou programa de interesse. Além desse conjunto

1
Lei nº 13.709, de 14 de agosto de 2018, que versa sobre a proteção de dados pessoais. No capítulo 15
deste livro, inclusive, há uma discussão sobre dados pessoais e sensíveis a partir da LGPD.

271
informacional, a depender da estratégia metodológica serão necessárias outras variáveis
que podem afetar o indicador de impacto e a decisão de tratamento.
A elaboração da estratégia de identificação é a parte central de uma avaliação de impacto,

considerando-se o escopo de estimar relações causais entre a intervenção e o indicador
de impacto. Nessa etapa, as características do programa de saúde relativas à seleção dos
beneficiários, como público-alvo, critérios de elegibilidade, período e abrangência da
intervenção e a disponibilidade de dados são elementos que vão guiar a escolha do
modelo. Na seção 3, apresenta-se um guia para subsidiar a escolha metodológica de uma
avaliação de impacto, contudo, em um estudo sobre uma avaliação é preciso que estejam
claros a seleção para o tratamento do programa ou política de saúde e os diferentes tipos
de efeitos que podem ser estimados.
2.1 Seleção ao tratamento e efeitos estimados
Um importante ponto dentro da definição da estratégia de identificação de avaliação

de uma política é entender como o comportamento de alguns indivíduos podem levar
a diferentes conclusões sobre o efeito de uma intervenção. Isso ocorre porque o
efeito do tratamento difere entre indivíduos: o que pode ser efetivo para alguns pode
não gerar qualquer efeito sobre outros. Considere-se, por exemplo, um estudo sobre
um novo medicamento para combater a dor de cabeça. Muito provavelmente o
medicamento será efetivo para os indivíduos que apresentarem dor de cabeça com
certa frequência e reduzirá consideravelmente a taxa de incidência para esse grupo.
No entanto, pode ser inefetivo para pessoas que raramente são afetadas pelo
sintoma, de forma que o medicamento não reduzirá a incidência para esse grupo.
Consequentemente isso poderá gerar conclusões imprecisas sobre a sua verdadeira
eficácia.
Mesmo considerando-se apenas o primeiro grupo (o dos indivíduos que têm dor de
cabeça com regularidade), o efeito do medicamento pode ser ambíguo. O efeito
poderia ser observado apenas para os participantes com perfil específico, enquanto
para os demais a redução da incidência seria observada mesmo na ausência do
tratamento (tomar o medicamento). Tais situações levantam algumas questões
importantes sobre como o tratamento pode ser diferente entre indivíduos, seja por
fatores relacionados à idade, sexo, hábitos saudáveis de saúde ou a incidência de
outras doenças preexistentes. Uma possível abordagem quando o tratamento é
heterogêneo, ou seja, varia para cada indivíduo, é observar a distribuição dos efeitos

e inferir sobre o efeito médio dos efeitos observados. O impacto estimado depende,
portanto, da população na qual a intervenção ocorreu.
Para se entender qual tipo de efeito está sendo estimado, considere-se um cenário
em que o pesquisador consiga observar os resultados potenciais para um grupo de
quatro indivíduos que compõem o experimento. Suponha-se que as unidades são
designadas de forma aleatória ao grupo de tratamento ou de controle.
Tabela 1 - Resultados potenciais dos participantes
Indivíduo Sexo Tratado? Y(1) Y(0) Efeito
1 M Sim 2 1 1
2 F Não 5 1 4
3 F Sim 5 2 3
4 M Não 4 2 2
Cada linha da tabela apresenta informações para um indivíduo, sendo a amostra total
composta por dois indivíduos do sexo masculino e dois do sexo feminino. A terceira coluna
indica o status da intervenção: tratado ou não tratado. As colunas seguintes (4 e 5) indicam
os resultados potenciais de cada indivíduo, ou seja, os resultados que seriam observados
caso o indivíduo fosse tratado – Y(1) – e caso não fosse tratado – Y(0). Como se sabe, não
é possível observar ambas as situações simultaneamente para cada indivíduo. Portanto,
nos dados reais, observamos apenas Y(1) para as unidades que foram tratadas, enquanto
observamos apenas Y(0) para os indivíduos não tratados. No entanto, tal exemplo é útil
para se entender como diferentes efeitos são obtidos de acordo com a configuração dos
grupos.
2.1.1 Efeito Médio do Tratamento (Average Treatment Effect - ATE)
Considerando-se que sejam observados os resultados potenciais para cada

indivíduo participante do experimento, o efeito causal individual é calculado
como a diferença entre os seus resultados potenciais, conforme apresentado
na última coluna da tabela xx. Por exemplo, o efeito do tratamento para o

273
indivíduo 1 é dado por Y(1) - Y(0) = 2 - 1 = 1. Em termos de programas ou
políticas de saúde, mais interessante do que calcular o efeito sobre um
indivíduo é saber o efeito médio do tratamento sobre uma amostra de
participantes. Nesse sentido, o efeito médio do tratamento (ATE) é o efeito
médio estimado da intervenção sobre toda a população elegível. Para os
dados da tabela, calculou-se a média aritmética simples dos efeitos causais
individuais, ou seja, ATE = (1 + 4 + 3 + 2)/4 = 2,5. Interessante notar que
quando a aleatorização é possível, o efeito médio do tratamento é obtido
como a diferença do efeito médio dos tratados e do grupo de controle, ATE =
[(2 + 5) /2] - [(1 + 2) /2] = 3,5 - 1,5 = 2, o mesmo resultado obtido anteriormente.
2.1.2 Efeito Médio Condicional do Tratamento (Conditional Average

Treatment Effect - CATE)
Caso o interesse seja calcular o efeito médio apenas para um subgrupo da
amostra com uma determinada característica, podemos estimar o efeito
médio condicional do tratamento (CATE). Por exemplo, podemos estar
interessados se o efeito médio difere entre homens e mulheres. De forma
simplificada, o efeito médio condicional do tratamento para o sexo feminino é
o efeito médio do tratamento calculado apenas para a subpopulação das
mulheres (indivíduos 2 e 3), com CATEF = (4 + 3)/2 = 3,5. Da mesma forma,
o efeito para os homens é igual a CATEM = (1 + 2)/2 = 1,5. Podemos concluir,
portanto, que o efeito do tratamento é maior para as mulheres quando
comparado ao dos homens.
2.1.3 Efeito Médio do Tratamento para os Tratados e para os Não-

Tratados (Average Treatment Effect on the Treated - ATT and on the
Untreated - ATUT)
Além do efeito médio do tratamento condicionado a uma característica dos
indivíduos, podemos pensar no grupo das pessoas tratadas como um
subgrupo específico de interesse. O efeito médio do tratamento para os
tratados (ATT) é definido como o efeito médio do tratamento condicionado
aos indivíduos que efetivamente receberam o tratamento. No exemplo
anterior, apenas os indivíduos 1 e 3 são tratados e, portanto, ATT = (1 + 3)/2
= 2. Note que o mesmo resultado pode ser obtido utilizando-se os dados reais.
Ou seja, o ATT é obtido pela diferença das médias dos resultados observados
para o grupo de tratados – (2 + 5)/2 = 3,5 – e do grupo dos não tratados – (1

+ 2)/2 = 1,5. Esse é um resultado importante porque possibilita o cálculo do
efeito mesmo quando a aleatorização não é possível.
De maneira análoga, podemos calcular o efeito médio do tratamento para os

não-tratados (ATUT), ou seja, o efeito médio do tratamento resultado dos
indivíduos que não sofreram a intervenção do programa. O ATUT é
importante, por exemplo, para estimar efeitos de transbordamento (spillover)
de uma política ou programa para além do público elegível ao tratamento. Do
exemplo anterior, temos que ATUT = (1 + 2)/2 = 1,5.
2.1.4 Efeito de Intenção do Tratamento (Intention-to-treat Effect - ITT)
Admita-se, agora, que exista um mecanismo utilizado pelos avaliadores para

designar os indivíduos que farão parte dos grupos de tratamento e controle.
Tal mecanismo, também chamado de instrumento, delimita critérios objetivos
e observáveis para definir a elegibilidade para o tratamento. Caso o indivíduo
seja elegível pode participar do grupo de tratamento; caso não seja elegível
deverá participar do grupo de controle. Um desafio para se avaliar algumas
políticas públicas é que, normalmente, o acesso ao tratamento não é restrito,
de forma que não é possível observar quem de fato aderiu ou não ao
programa. Ou seja, o pesquisador não consegue identificar se, de fato, os
indivíduos elegíveis ao tratamento sofreram intervenção ou se indivíduos não
elegíveis acabaram sendo tratados.
Considere-se novamente o programa de subsídios na compra de

medicamentos por parte da população que apresenta algum tipo de
comorbidade. Nesse cenário, é pouco provável que todas as pessoas
elegíveis estejam sendo beneficiadas pelo programa ou que os indivíduos não
elegíveis possam ser favorecidos pelo acesso aos medicamentos. Nessa
situação, a interpretação do resultado tem significado um pouco distinto. Ao
se comparar as unidades elegíveis com as não elegíveis estima-se o efeito
de intenção do tratamento (ITT), o qual, no entanto, tende a ser menor do que
o efeito do tratamento sobre os tratados, dado que apenas uma fração de
pessoas no grupo de tratamento foram de fato tratadas.
As três últimas etapas básicas para o desenvolvimento de uma avaliação de

impacto, conforme a Figura 1, são as seguintes:

275
• Análise e discussão de resultados;
• Elaboração de testes de robustez e heterogeneidade;
• Comunicação e disseminação dos achados.
Dentre essas etapas, chamamos atenção para a parte de testes de robustez,

que visam garantir a confiabilidade das relações causais estimadas a partir
da análise de sensibilidade dos resultados à inclusão adicional de variáveis
de controle, falseamento de tratamento ou outras variações no modelo de
avaliação (técnicas de pareamento alternativas, combinação de métodos
etc.). A última etapa para finalizar a avaliação de impacto diz respeito à
comunicação e disseminação dos resultados, sobretudo para ampliar as
chances de as evidências serem, de fato, utilizadas para contribuir para com
o processo de tomada de decisão na formulação de políticas e programas de
saúde – os capítulos 24 e 25 trazem maiores informações.
3 Guia para auxiliar a escolha de metodologia de avaliação
De maneira geral, os métodos de avaliação buscam mensurar o impacto de uma

intervenção sobre um grupo de indivíduos para um conjunto definido de indicadores
(ANGRIST; PISCHKE, 2008). Por exemplo, um pesquisador em saúde pode se interessar
por medir a eficácia de uma nova vacina ou avaliar o efeito de um programa de subsídios
para a compra de medicamentos para uma população específica. No primeiro caso, as
possíveis variáveis de interesse são a taxa de anticorpos presentes em uma amostra de
sangue ou o número de participantes que apresentam sintomas da doença após serem
vacinados. No segundo exemplo, pode-se pensar como variáveis de interesse o número de
internações registradas em dado período ou um indicador subjetivo do bem-estar da
população beneficiada pelo programa. Em ambas as situações a avaliação consiste em
comparar os resultados de um grupo beneficiado com o resultado de outro grupo não
beneficiado pela intervenção.
A escolha de um grupo de comparação, no entanto, envolve algumas questões sensíveis

para a viabilidade da avaliação de impacto. Conforme discutido no capítulo 4, o problema
fundamental da inferência causal consiste em encontrar o contrafactual do grupo de
tratamento, ou seja, a situação hipotética que releva o que teria acontecido caso o grupo
tratado não tivesse sofrido a intervenção. Como se sabe, não é possível observar os dois
cenários simultaneamente dado que, em cada momento do tempo, uma unidade de

observação é ou não tratada. A ideia dos desenhos de avaliação consiste em buscar a
melhor estratégia para a construção do grupo de controle.
Existem dois tipos de desenhos de avaliação de impacto de programas ou políticas

públicas: os modelos experimentais e os modelos não-experimentais. Conceitualmente,
ambos têm o mesmo objetivo de investigar o efeito causal de uma intervenção, mas diferem
na forma pela qual o grupo de controle é estabelecido. Como se verá a seguir, alguns
critérios de elegibilidade em relação à participação no tratamento são importantes para
entender o tipo de desenho de avaliação.
Do ponto de vista metodológico existem diferentes modelos que buscam identificar e

mensurar os impactos de um programa ou política pública. Para iniciantes na área de
avaliação de impacto pode parecer desafiante escolher a modelagem indicada para um
trabalho. Dessa forma, esta seção objetiva apresentar orientações básicas para subsidiar
a escolha do método de avaliação de impacto, usando uma abordagem lógica e sequencial
para essa finalidade.
Antes de iniciarmos, é válido destacar que esse tipo de abordagem usada neste capítulo
tem limitações, contudo é uma tentativa de facilitar, sobretudo, para aqueles pesquisadores
que estão iniciando na área de avaliação de impacto. A Figura 2 apresenta uma árvore de
decisão metodológica em avaliação de impacto, cujo processo de escolha é guiado por
questões balizadoras com resposta binária (sim ou não). A primeira questão balizadora é:
a atribuição de tratamento para participação no programa foi por meio de um sorteio
(escolha aleatória)?

277
Figura 2 - Esquematização para subsidiar a escolha metodológica de uma avaliação de impacto

3.1 Modelo experimental
Como apresentado na seção anterior, existem dois tipos básicos de linhas de

modelo: experimental e não-experimental. Dessa maneira, para uma resposta
afirmativa para a questão 01, isto é, a seleção dos tratados e não tratados de um
programa de saúde ocorreu de forma aleatória, a abordagem de modelos
experimentais seria a indicada para mensuração dos impactos do programa sobre
os indicadores de interesse.
O ponto central dessa abordagem consiste na definição de participação (grupo de

tratamento – GT) e não participação (grupo de controle – GC) em um programa com
base em sorteio dentre os indivíduos elegíveis (idealmente, o sorteio deveria ser
duplamente cego2). Nesse cenário, a decisão de tratamento é ortogonal a fatores
não observáveis, em que a medida sobre a magnitude do efeito do programa sobre
os tratados seria não tendenciosa. Essa ortogonalidade/independência basicamente
garante que os resultados do grupo de controle representam de forma satisfatória os
resultados do grupo tratado na ausência do programa.
3.1.1 Randomized Controlled Trials (RCT)
A principal abordagem de modelos experimentais são os estudos

controlados randomizados (Randomized Controlled Trials ou RCT),
considerados o padrão-ouro para inferir o impacto de uma intervenção.
Bastante difundidos na área de saúde, são também conhecidos
como ensaios clínicos randomizados e consiste na atribuição aleatória
dos pacientes que recebem e dos que não recebem o tratamento. Ou seja,
dentre os indivíduos elegíveis ao tratamento, o fato de sofrer ou não a
intervenção depende exclusivamente de fatores aleatórios, a exemplo da
participação por intermédio de sorteio ou do lançamento de uma moeda.
Desse modo, garante-se que os dois grupos são, na média, bastante
semelhantes em termos de características observáveis (idade, sexo,
raça, condições preexistentes) e não-observáveis (disposição,
suscetibilidade a doenças), de tal maneira que a única diferença entre os
grupos é a exposição à intervenção.
2
Tanto os indivíduos quanto a equipe de avaliação não deveriam saber quais pessoas integrariam o grupo
de tratamento nem as que integrariam o grupo de controle até que o experimento terminasse, a fim de garantir
melhor identificação das relações de causa e efeito do programa (CONNERS et al., 1976; KERSHNER;
HAWKE, 1979).

279
Considere-se, por exemplo, um laboratório farmacêutico que deseja testar a
eficácia de novo medicamento. Dentre o grupo de indivíduos aptos a participar
do experimento, a aleatorização permite a formação de dois grupos: o grupo
de tratamento – composto por aqueles que efetivamente receberam o
medicamento; e o grupo de controle – formado pelos indivíduos que
receberam o placebo. Observando-se que os dois grupos possuem
características balanceadas, o efeito do medicamento é obtido comparando-
se as médias dos indicadores de impacto para os dois grupos. O capítulo 11
traz uma discussão geral sobre RCT e mostra os benefícios e os desafios da
aleatorização.
Para que o padrão ouro de avaliação seja obtido é necessário se observar a

existência de falhas de implementação na condução do desenho
experimental, as quais são causadas, por exemplo, por problemas de atrito,
quando indivíduos do GT e/ou GC não são localizados para se obter
informações. Ainda, problemas causados pelo não comparecimento ou
desistência dos tratados ao longo da execução do programa ou pela presença
de indivíduos sorteados para não serem tratados participando do programa.
Outra fonte de falhas de implementação é a existência de indivíduos do GC
participando de programas substitutos ou de indivíduos do GT participando
de um programa complementar. Por isso a importância da questão 02: houve
alguma falha na execução do desenho experimental?
3.1.2 Regressão linear simples
Para a resposta da questão 02, é necessário que se faça uma análise

exploratória dos dados a fim de verificar se existe diferenças estatísticas, em
média, entre atributos observáveis do grupo de tratados comparativamente
com o grupo de controle, bem como uma análise acerca de evasão do
programa e do processo de amostragem da base de dados construída para
avaliação.
Caso a resposta para a questão 02 seja não, ou seja, não houve falhas na
execução do desenho experimental do programa, enfim haveria como definir
o método estatístico para mensuração do efeito médio de tratamento sobre
os tratados (ATT): teste de diferença de médias entre o GT e GC ou modelo

de regressão linear simples. Sob um modelo de regressão linear simples, se
teria a seguinte especificação para mensuração do impacto:
𝑦𝑦𝑖𝑖 = 𝛼𝛼 + 𝛿𝛿𝑇𝑇𝑖𝑖 + 𝑢𝑢𝑖𝑖 , (1)
onde 𝑦𝑦𝑖𝑖 é o indicador de impacto para o i-ésimo indivíduo, 𝑇𝑇𝑖𝑖 representa uma
variável binária indicadora de tratamento e 𝑢𝑢𝑖𝑖 é o termo de erro aleatório do
modelo. Os termos 𝛼𝛼 e 𝛿𝛿 são os parâmetros a serem estimados e o ATT seria
dado pelo o coeficiente 𝛿𝛿. Os resultados da eq. (1) se equivaleriam a um teste
de diferença de média.
Para fins de aumento de precisão das estimativas, uma regressão linear

múltipla (incluindo outras variáveis explicativas) pode ser usada para estimar
o impacto de um programa cujo tratamento ocorreu de forma randomizada
(DUFLO; DUPAS; KREMER, 2015). Dessa forma, além da variável indicadora
de tratamento (𝑇𝑇𝑖𝑖 ), a Eq. (1) se poderia ter a adição de um conjunto de
variáveis explicativas 𝑋𝑋 = (𝑥𝑥1 , 𝑥𝑥2 , . . . , 𝑥𝑥𝑘𝑘 ) para reduzir o erro do modelo e,
consequentemente, reduzir a variância dos coeficientes estimados.
3.1.3 Variáveis instrumentais
Se, por outro lado, fosse identificada alguma possível falha de implementação
no desenho experimental, ou seja, uma resposta positiva para a questão 02,
a escolha do método estatístico geralmente usada nesses casos poderia ser
a do modelo de regressão com variáveis instrumentais (VI).
Essa estratégia, por exemplo, foi adotada por Barros et al. (2011), os quais
constataram uma falha na execução do desenho experimental para avaliação
do impacto do acesso às creches gratuitas sobre o mercado de trabalho das
mulheres na cidade do Rio de Janeiro. Como foram identificados problemas
nas atribuições aleatórias3 entre os sorteados para vagas nas creches entre
GT e GC, os autores fizeram uso do método de Variável Instrumental (VI) para
estimar o Efeito Médio Local do Tratamento (LATE). A Equação 2 apresenta
o estimador de Wald para a estimação do impacto, usando o sorteio como
variável instrumental (Z) do modelo.
3
94% das crianças sorteadas para compor o GT estavam sendo tratadas, enquanto 51% das sorteadas para
o GC também estavam sob algum tratamento.

281
𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿 = (𝐸𝐸[𝑦𝑦𝑖𝑖 │𝑇𝑇𝑖𝑖 = 1] − 𝐸𝐸[𝑦𝑦𝑖𝑖 │𝑇𝑇𝑖𝑖 = 0])/(𝐸𝐸[𝑍𝑍𝑖𝑖 │𝑇𝑇𝑖𝑖 = 1] − 𝐸𝐸[𝑍𝑍𝑖𝑖 │𝑇𝑇𝑖𝑖 = 0] )
(2)
Onde: 𝐸𝐸[⋅] representa a esperança condicional; 𝑦𝑦𝑖𝑖 é a variável de

resultado/impacto para o i-ésimo indivíduo; 𝑇𝑇𝑖𝑖 indicação de tratamento; 𝑍𝑍𝑖𝑖 é
uma variável dummy que indica se o indivíduo foi sorteado ou não para
participar do programa.
3.2 Modelos não-experimentais
Diferentemente dos métodos experimentais, os modelos não-experimentais são

adequados quando a formação aleatória dos grupos de tratamento e controle não é
possível. Diversos fatores podem contribuir para a inviabilidade de se conduzirem
estudos controlados randomizados. Por exemplo, existem fatores econômicos que
podem encarecer a realização de experimentos quando aplicados a um número
elevado de participantes. Em outras situações é possível que uma política de saúde
pública seja direcionada para determinado grupo da população, mas nem todos os
elegíveis ao tratamento são de fato tratados. Além disso, não é possível restringir o
acesso de indivíduos ao tratamento, influenciando o resultado do grupo de controle.
Tais limitações, no entanto, não restringe a possibilidade da avaliação de impacto,

mas requerem do avaliador ou pesquisador mais cautela para mensurar o verdadeiro
efeito causal. Existem basicamente duas abordagens para desenhos de avaliação
não-experimentais: experimentos naturais e quase-experimentos.
Uma forma de avaliar os resultados de uma intervenção quando não é possível ao

pesquisador aleatorizar diretamente os participantes entre o grupo de tratamento e
de controle é por meio do uso de experimentos naturais. Tal método consiste em
utilizar-se de condições naturais, leis, intervenções ou outro tipo de fenômeno que
possibilita dividir um grupo homogêneo entre os grupos de tratamento e controle.
Portanto, experimentos naturais oferecem a oportunidade de se analisar um
programa ou política como se os participantes fizessem parte de um experimento.
Um dos exemplos mais conhecidos de experimentos naturais em estudos de saúde

foi conduzido pelo médico inglês John Snow ainda no século XIX. Seu estudo tinha
como objetivo entender as causas do surto de cólera que vitimizou centenas de
moradores de Londres no ano 1857. Na época, a cidade possuía duas empresas de
abastecimento de água, mas uma delas não realizava adequadamente o tratamento
de água. Por intermédio de uma amostra de residências, Snow mostrou que os
moradores abastecidos pela empresa que não realizava o tratamento de esgoto
tinham 10 vezes mais chances de morrer de cólera comparativamente com os
residentes abastecidos pela empresa concorrente. Esse estudo apresentou
importante aspecto para se conduzir experimentos naturais: embora o avaliador não
consiga intervir diretamente nos experimentos, a existência de fatores exógenos que
formam dois grupos distintos permite a comparação e a obtenção de conclusões
confiáveis sobre o efeito causal.
Bastante comum nas ciências sociais para avaliação programas e políticas públicas,
os métodos quase-experimentais (o termo quase, derivado do latim quasi pode ser
traduzido por “como se fosse”, “de certa maneira”) utilizam técnicas estatísticas para
obterem o melhor grupo de comparação possível para as unidades tratadas.
Diversas metodologias têm sido desenvolvidas ao longo do tempo para encontrar o
contrafactual do grupo de tratamento, ou seja, um grupo com características
parecidas e que representa o que teria acontecido às unidades tratadas se não
fossem sujeitas à intervenção. Os principais métodos não-experimentais serão
apresentados a seguir, tendo por base a sequência lógica disposta na Figura 2 para
auxiliar o pesquisador na escolha do modelo.
3.2.1 Pareamento
E se a resposta for negativa para a questão 01 na Figura 2? Será necessário

conduzir a definição da metodologia da avaliação de impacto para uma
abordagem não-experimental, considerando-se que a seleção dos indivíduos
beneficiados pelo programa não ocorreu de forma aleatória.
Para a definição do método dentro da abordagem não-experimental, será

preciso responder acerca da disponibilidade de dados na questão 03.
Existem dados para indivíduos tratados e não tratados pelo programa para
pelo menos dois períodos de tempo, incluindo-se necessariamente um
período ex ante (período anterior ao início da intervenção)?
Caso a resposta seja negativa, faz-se necessário responder também à

questão 04, ou seja, apenas fatores observáveis importam para a definição
dos critérios de seleção para participar do programa? Imagine-se um

283
programa de saúde destinado a estudantes do sexo feminino entre 15 e 17
anos de idade de escolas estaduais da região norte do país.
Se sim, a alternativa metodológica para avaliação de impacto seria o modelo

de pareamento (matching). Essa abordagem geralmente é executada em
duas etapas: na primeira, é preciso se criar um grupo de controle formado por
indivíduos não tratados pelo programa, mas que se assemelham entre si em
termos de características observáveis. Para tanto, haveria algumas opções
de métodos de matching para essa finalidade, a saber: pareamento simples,
propensity score matching (PSM), Mahalanobis matching, balanceamento por
entropia.
O modelo de pareamento é usado recorrentemente de forma isolada (ou

combinado com o modelo de diferenças em diferenças) para a avaliação de
políticas públicas na área de saúde no país, em decorrência da
disponibilidade de dados e do desenho dos programas (atribuição de
tratamento não aleatória).
3.2.2 Desenho de Regressão Descontínua (RDD)
E se fatores não observáveis importarem? Nesse caso, haveria uma resposta

negativa para a questão 04 e, consequentemente, seria necessário seguir
para uma nova pergunta que alteraria o tipo de método recomendado para a
avaliação de impacto. A questão 05 diz respeito às características dos
critérios observáveis para participação de um programa, especificamente
sobre a existência de pontos de corte (cut-off) para definir a condição de
tratamento.
Caso exista um cut-off para participação no programa, então se poderia

utilizar uma regra para a determinação dos grupos de tratamento e controle.
Como exemplo, considere-se um programa em que o participante somente
será tratado se tiver um nível de renda familiar per capita inferior a um salário
mínimo. Caso o indivíduo atenda ao critério, então será designado ao grupo
de tratamento; caso contrário (renda per capita superior ao salário mínimo),
será designado ao grupo de controle. Dessa forma, a existência de um ou
mais pontos de corte na chamada forcing variable, possibilitaria a utilização
do método RDD.

O RDD, que será detalhado no capítulo 13; pode ser do tipo sharp ou fuzzy,
em que a sua definição dependerá de se a atribuição de tratamento for
determinística (mandatória) a partir de dado ponto de corte, para o caso do
sharp, ou não determinística, para o caso fuzzy.
3.2.3 Variáveis instrumentais

Em um cenário de inexistência de uma forcing variable com cut-off definido
(resposta negativa para a questão 05), necessário se faz avaliar a questão
06. Existe uma ou mais variáveis instrumentais para a decisão endógena de
participação no programa?
Caso a resposta seja positiva, seria possível fazer uso do modelo de variáveis
instrumentais (VI). Como destacado por Angrist (1990), a utilização de VI tem
como grande desafio a escolha de um bom instrumento. Ademais, a forma de
interpretar os efeitos de tratamento fica mais restrita, ou seja, teríamos um
Efeito Médio de Tratamento Local (Local Average Treatment Effect – LATE).
O capítulo 14 apresenta maiores detalhamentos sobre o modelo de variáveis
instrumentais.
O efeito médio local do tratamento (LATE) consiste de estimar o efeito médio

do tratamento apenas para um subgrupo específico da população elegível, os
compliers. Para entender o conceito de compliers, suponha-se um
instrumento binário que defina a elegibilidade para o tratamento. Ou seja, se
o valor do instrumento é igual a 1, o indivíduo é elegível para o grupo de
tratamento. Caso o instrumento seja igual a 0, então esse será elegível para
o grupo de controle. Isso não garante, no entanto, que indivíduos elegíveis
para o tratamento irão, de fato, receber a intervenção e nem que o grupo não
elegível não receberá o tratamento. Isso torna a avaliação um pouco mais
complicada, pois não há um mecanismo de randomização que garanta
perfeita observância (compliance) do instrumento.
Considere-se que existam quatro grupos distintos, formados em relação a

como os indivíduos reagem à elegibilidade para o tratamento. O primeiro
grupo é chamado de always-takers, formado por indivíduos que sempre
recebem o tratamento, independentemente de estarem ou não elegíveis para
o receberem. O segundo grupo é chamado de never-takers, formado por

285
indivíduos que nunca recebem o tratamento, independentemente de estarem
ou não elegíveis para o tratamento. Um terceiro grupo é chamado de
compliers, o qual consiste nos indivíduos que recebem o tratamento se, e
somente se, estiverem elegíveis para o tratamento. Ou seja, é o grupo
formado por aqueles indivíduos que seguem o instrumento e obedecem
estritamente ao critério de elegibilidade. O último grupo é chamado defiers,
formado pelos indivíduos que fazem o oposto do indicado pelo instrumento.
Em outras palavras, esses não recebem o tratamento caso estejam elegíveis
e o recebem caso não estejam designados pelo instrumento.
Portanto, cada indivíduo estará em apenas um dos grupos especificados. O

LATE é o efeito causal calculado para os compliers, o qual considera o efeito
apenas para os indivíduos que respeitam o critério de elegibilidade. Veremos
mais adiante que o LATE é um conceito importante também para o método
de regressão descontínua tipo fuzzy (capítulo 13).
3.2.4 Análise de sensibilidade dos não observáveis

Caso a resposta seja negativa para a questão 06 e esgotada todas as
possibilidades anteriores, uma alternativa seria retornar para o modelo de
pareamento, sendo altamente recomendado fazer testes de sensibilidade dos
resultados a fatores não observados. Como se está assumindo que fatores
não observáveis para o pesquisador influenciam a decisão de tratamento,
logo o modelo de pareamento geraria estimativas inconsistentes
(tendenciosas).
Nesse contexto, a avaliação da sensibilidade dos resultados, em relação aos

desvios da premissa de identificação do modelo de pareamento, é importante
para mensurar a influência de possíveis fatores não observáveis na atribuição
de tratamento. Por exemplo, Rosenbaum (2002) examina o tamanho do viés
omitido na atribuição de tratamento usando os limites de Rosenbaum
(Rosenbaum bounds – RB), de modo que se existe um viés omitido, dois
indivíduos com idênticas características observáveis têm diferentes chances
de serem tratados.
O RB é uma das abordagens mais utilizadas para essa finalidade, por

informar o quanto de fatores não observáveis podem alterar a inferência

acerca do efeito médio de tratamento. De modo que seria possível estimar o
grau de afastamento que uma estimativa feita por PSM estaria livre de fatores
não-observados.
3.2.5 Controle sintético

Admitindo-se a existência de um painel de dados (voltando para a questão
03), com informações de unidades tratadas e não tratadas para múltiplos
períodos, a questão 07 da Figura 2 precisaria ser respondida: existem muitas
unidades tratadas?
Imagine-se uma intervenção de um programa, como uma academia de saúde,

em um único bairro de uma cidade (em um programa cuja atribuição de
tratamento não é aleatória). Dessa forma, como haveria nesse exemplo única
região tratada em uma cidade, a resposta para a questão 07 seria negativa.
Uma forma de mensurar o impacto em cenários com poucas unidades
tratadas e disponibilidade de dados ao longo do tempo seria a utilização do
método de controle sintético (MCS), proposto por Abadie e Gardeazabal
(2003).
O MCS é um método transparente para seleção do grupo de controle em que

se constrói um cenário contrafactual hipotético, tendo por base combinações
de múltiplas unidades não tratadas. Um pressuposto básico desse modelo é
que uma combinação de unidades de controle pode fornecer uma
comparação para a unidade tratada, dado que anterior ao tratamento as
unidades seguiam a mesma trajetória e qualquer diferença posterior entre a
unidade tratada e o seu controle sintético é atribuída ao tratamento.
Os pesos do modelo são calculados de forma a minimizar a diferença entre o

controle sintético e a unidade de tratamento em termos de um vetor de fatores
observáveis pré-tratamento. Os resultados pós-intervenção para a unidade de
controle sintético são então usados para estimar os resultados que teriam sido
observados para a unidade tratada na ausência da intervenção.
3.2.6 Diferença em diferenças

Caso a resposta para a questão 07 seja positiva e a hipótese das trajetórias
paralelas sejam respeitadas (questão 08) na Figura 2, um método

287
recomendado para avaliação de impacto seria o modelo de diferença em
diferenças (diff-in-diff ou DD).
O DD é um método extremamente popular, sendo utilizado com recorrência

para avaliação de diferentes programas de saúde, como a legislação de
direitos de maternidade (GRUBER, 1994), o Programa de Saúde da Família
(ROCHA; SOARES, 2010) e o Programa Farmácia Popular do Brasil
(ALMEIDA et al., 2019).
Na abordagem de DD, a seleção ao tratamento pode ser realizada tanto com

base em características observáveis ou não-observáveis invariantes no
tempo. Tem como hipótese central de identificação o fato de que, na ausência
de tratamento, os grupos de tratamento e controle evoluiriam paralelamente,
ou seja, possuiriam trajetórias parecidas. Portanto, a trajetória temporal da
variável de interesse para GC representa o que ocorreria com GT caso não
houvesse a intervenção. O método de diferença em diferenças será
apresentado em detalhes no capítulo 12.
3.2.7 Combinação de métodos

E se a condição de identificação central do método DD não for respeitada
(questão 08), ou seja, os grupos de tratamento e não tratamento não
apresentam trajetórias paralelas? Uma alternativa seria fazer a combinação
do modelo de diferenças em diferenças com o modelo de pareamento.
Algumas das hipóteses usadas em cada um dos métodos seriam

flexibilizadas, de modo que o efeito médio oriundo da combinação do DD com
pareamento (DD condicional) possibilitaria uma estratégia recomendada de
identificação dos impactos do programa de saúde.
Destaca-se que as combinações de métodos não se esgotam com o DD e

pareamento, bem como a esquematização disposta na Figura 2 é uma das
possíveis sequências para auxiliar a tomada de decisão acerca da
metodologia de avaliação de impacto.

Referências
ABADIE, A.; GARDEAZABAL, J. The economic costs of conflict: a case study of the
Basque Country. American Economic Review, v. 93, n. 1, p. 113-132, 2003.
ALMEIDA, A. T. C. et al. Impacts of a Brazilian Pharmaceutical Program on the health of

chronic patients. Revista de Saúde Pública, v. 53, p. 1-11, 2019.
ANGRIST, J. D. Lifetime earnings and the Vietnam era draft lottery: evidence from social
security administrative records. The American Economic Review, v. 80, n. 3, p. 313-336,
1990.
ANGRIST, J. D.; PISCHKE, J. Mostly harmless econometrics: an empiricist´s

companion. Princeton: Princeton University Press, 2008.
BHALOTRA, S. R.; ROCHA, R.; SOARES, R. R. Does universalization of health work?

Evidence from health systems restructuring and maternal and child health in Brazil.
Institute for Social and Economic Research, 2016. (ISER Working Paper Series, 2016).
Disponível em: https://www.iser.essex.ac.uk/research/ publications/working-papers/iser/
2016-16.pdf. Acesso em: 7 set. 2022.
BARROS, R. P. et al. The impact of access to free childcare on women's labor market
outcomes: evidence from a randomized trial in low-income neighborhoods of Rio de
Janeiro. In: WORLD BANK ECONOMISTS’ FORUM, Mar. 2011, Rio de Janeiro. Prepared
for [...]. Rio de Janeiro, 2011. Disponível em: https://citeseerx.ist.psu.edu/viewdoc
/download?doi=10.1.1.258.5722&rep=rep1&type=pdf. Acesso em: 7 set. 2022.
BOUERI, R.; ROCHA, F.; RODOPOULOS, F. (org.). Avaliação da qualidade do gasto

público e mensuração da eficiência. Brasília: Secretaria do Tesouro Nacional, 2015.
Disponível em: https://sisweb.tesouro.gov.br/apex/f?p=2501:9::::9:P9_ID_PUBLICACAO:
28263. Acesso em: 7 set. 2022.
CARRILLO, B.; FERES, J. Provider supply, utilization, and infant health: evidence from a
physician distribution policy. American Economic Journal: Economic Policy, v. 11, n. 3,
p. 156-196, 2019.
CONNERS, C. K. et al. Food additives and hyperkinesis: a controlled double-blind

experiment. Pediatrics, v. 58, n. 2, p. 154-166, 1976.
DUFLO, E.; DUPAS, P.; KREMER, M. Education, HIV, and early fertility: experimental
evidence from Kenya. American Economic Review, v. 105, n. 9, p. 2757-2797, Sep. 2015.
KERSHNER, J.; HAWKE, W. Megavitamins and learning disorders: a controlled double-

blind experiment. The Journal of Nutrition, v. 109, n. 5, p. 819-826, May 1979.
GERTLER, P. J. et al. Impact evaluation in practice. Washington DC: World Bank

Publications, 2016.
GRUBER, J. The incidence of mandated maternity benefits. The American Economic

Review, v. 84, n. 3, p. 622-641, 1994.
MADEIRA, L. M. (org.). Avaliação de políticas públicas. Porto Alegre: UFRGS, 2014.

(CEGOV. Capacidade Estatal e Democracia). Disponível em: https://www.ufrgs.br/cegov/
files/pub_37.pdf. Acesso em: 7 set. 2022.

289
ROCHA, R.; SOARES, R. R. Evaluating the impact of community-based health
interventions: evidence from Brazil's Family Health Program. Health Economics, v. 19, p.
126-158, 2010.
ROSENBAUM, P. R. Observational studies. 2nd. New York: Springer, 2002.
SNOW, J. Cholera, and the water supply in the south districts of London. British Medical
Journal, v. 1, n. 42, p. 864-865, 1857.

Capítulo 10
Randomized Controlled Trials:

os experimentos aleatórios em
políticas públicas
André Portela Souza1

Lycia Lima1
Caio Castro1
1
Fundação Getúlio Vargas (FGV), Escola de Economia de São Paulo (EESP), Centro de
Aprendizagem em Avaliação e Resultados para a África Lusófona e Brasil (CLEAR)
RESUMO:
O objetivo deste capítulo é discutir a importância dos experimentos aleatórios para políticas
públicas em saúde e expor os aspectos técnicos necessários para que o leitor possa implementar
experimentos na prática. Mostram-se também os aspectos conceituais do método experimental para
avaliar o impacto causal de uma intervenção, bem como alguns exemplos de seu uso. Dessa maneira,
o capítulo apresenta uma ferramenta de avaliação que fornece resultados que podem direcionar
futuras políticas e expansões de programas existentes, ou seja, embasar e solidificar a tomada de
decisões do gestor público.
PALAVRAS-CHAVE:
Experimentos aleatórios. Avaliação de políticas públicas. Impacto causal.

291
1 Introdução
Cada vez mais o uso de experimentos aleatórios vem se tornando mais usual para a
avaliação de políticas públicas. Isso também vem se tornando cada vez mais comum na
área de saúde. Trata-se de uma forma de dimensionamento dos impactos de uma
intervenção, por meio da randomização daqueles que recebem o tratamento e daqueles
que não o recebem. Na linguagem desse tipo de experimento trata-se, respectivamente,
dos grupos de tratamento e de controle. A principal ideia é ter dois grupos que teriam
desfechos semelhantes na ausência do tratamento ou política (DUFLO et al., 2007)
Esse é o ponto fundamental da análise experimental: quando se tem dois grupos

selecionados de forma aleatória, esses são estatisticamente iguais, tanto com relação a
população da qual foram extraídos quanto entre si (GIBSON; SAUTMANN, 2021). Dessa
forma, aleatorizar é a melhor forma de garantir que a comparação entre os dois grupos de
fato reflita os impactos de determinada política: ao expor somente um dos dois grupos a
essa política, a única diferença existente é justamente a intervenção. É claro que essa
aleatorização pode ser feita de diversas formas e algumas serão discutidas no decorrer
deste capítulo.
Assim, a aleatorização gera duas importantes vantagens quando se trata da avaliação de

políticas. A primeira vem justamente da mencionada criação de grupos que podem ser
comparados. Chama-se validade interna o impacto estimado do programa, por ser livre de
todos os outros fatores potenciais externos que afetam os resultados, considerando-se que
o grupo de comparação fornece uma estimativa válida do contrafactual. A validade externa
é a amostra de avaliação que representa corretamente a população de unidades elegíveis
para a política. Dessa maneira, os resultados da avaliação podem ser generalizados para
essa população. Utiliza-se uma amostragem aleatória para garantir que a amostra de
avaliação seja representativa da população de elegíveis e que os impactos observados na
amostra possam ser extrapolados para essa população
Com isso, a aleatorização tem uma série de vantagens como tornar a avaliação do
programa mais robusta, além de garantir que os indivíduos elegíveis tenham a mesma
chance de participar do programa. Trata-se de uma maneira justa de alocar os recursos da
política quando a população elegível é igualmente apta para receber determinada
intervenção. Adicionalmente, é extremamente fácil de ser explicada para as pessoas se
comparada a outros métodos mais complicados de alocação de beneficiários, o que permite

maior transparência e facilita a comunicação com o público em geral (GERTLER et al.,
2018).
O restante deste capítulo irá se organizar da seguinte maneira. Primeiro vai se abordar
conceitos fundamentais relacionados ao que é de fato um contrafactual e como se dá a
estimação dos efeitos usando o método de experimentos aleatórios. Em seguida, tratar-se-
á especificamente de aleatorização em políticas públicas, além de possíveis problemas. Na
próxima seção, serão trazidos alguns exemplos ligados a políticas públicas especificamente
na área de saúde. Para concluir, será realizada uma reflexão sobre o uso dos resultados
de uma avaliação para orientar ações com relação a política pública de fato.
2 Conceitos
O primeiro elemento fundamental é o chamado contrafactual – o que teria acontecido na

ausência do tratamento. Gerar um bom contrafactual é justamente o principal objetivo de
uma aleatorização bem-feita. Agora se apresentará um conceito a ser utilizado no decorrer
do capítulo – o de resultado potencial. Seja 𝑇𝑇! uma variável binária que indica o tratamento,
isto é, que é igual a 1 se o indivíduo 𝑖𝑖 recebeu o tratamento analisado e igual a 0 se não o
recebeu. Os resultados potenciais do indivíduo 𝑖𝑖, então, podem ser descritos da seguinte
maneira:
𝑌𝑌!" : resultado potencial do indivíduo quando ele não recebe o tratamento (𝑇𝑇! = 0)
𝑌𝑌!# : resultado potencial do indivíduo quando ele recebe o tratamento (𝑇𝑇! = 1)
Na prática, o efeito da política em determinada pessoa seria dado pela diferença entre
esses dois resultados potenciais. Assim, o impacto causal em cada um dos indivíduos
poderia ser calculado como:
β! = 𝑌𝑌!# − 𝑌𝑌!"
Note-se, no entanto, que no mundo real se observa apenas um deles, pois a pessoa é
tratada ou não é tratada. Assim, toda a questão gira em torno de encontrar o contrafactual
ideal e esse é justamente o papel da aleatorização. Ao se aleatorizar o tratamento, criam-
se dois grupos que podem concretamente ser comparados.

293
De maneira formal, vamos seguir a notação de Angrist e Pischke (2009). A aleatorização
do tratamento garante que 𝑇𝑇! seja independente dos resultados potenciais, criando-se,
assim, o contrafactual ideal. Podemos escrever isso como:
(𝑌𝑌!# , 𝑌𝑌!" ) ⊥ 𝑇𝑇!
É interessante notar que essa propriedade faz com que as esperanças condicionais sejam
iguais às esperanças não condicionais. Assim tem-se:
𝔼𝔼[𝑌𝑌!" |𝑇𝑇! = 1] = 𝔼𝔼[𝑌𝑌!" |𝑇𝑇! = 0] = 𝔼𝔼[𝑌𝑌!" ]
𝔼𝔼[𝑌𝑌!# |𝑇𝑇! = 1] = 𝔼𝔼[𝑌𝑌!# |𝑇𝑇! = 0] = 𝔼𝔼[𝑌𝑌!# ]
Como não se observam os efeitos para cada indivíduo, estimam-se efeitos médios na
amostra. Matematicamente, pode-se escrever isso como sendo função das esperanças
condicionais e estimar dois efeitos sobre um resultado de interesse 𝑌𝑌: o Efeito Médio de
Tratamento (ATE) e o Efeito Médio de Tratamento sobre os Tratados (ATT).
ATE: 𝔼𝔼[𝑌𝑌!# − 𝑌𝑌!" ]
ATT: 𝔼𝔼[𝑌𝑌!# − 𝑌𝑌!" |𝑇𝑇! = 1]
A próxima etapa seria, então, como estimar essas quantidades. Para isso utiliza-se o
método de Mínimos Quadrados Ordinários (MQO), que indicará a diferença da média
observada para um desfecho de interesse entre os grupos de tratamento e controle. O MQO
segue a seguinte equação:
𝑌𝑌! = 𝛼𝛼 + 𝛽𝛽𝑇𝑇! + 𝑒𝑒!
Como se tem a hipótese de aleatorização, a média condicional dos erros é igual a 0

(𝐸𝐸(𝑒𝑒! |𝑇𝑇! ) = 0 ). Com isso, nesse caso, o coeficiente 𝛽𝛽 é não-enviesado. Além disso, para
o caso da aleatorização, a esperança desse beta indica tanto o ATE quanto o ATT. Isto é:
𝐸𝐸7𝛽𝛽8$%& 9 = 𝐴𝐴𝐴𝐴𝐴𝐴 = 𝐴𝐴𝐴𝐴𝐴𝐴
Para saber se efetivamente a política teve impacto na variável de interesse, é necessário

utilizarmos a chamada inferência estatística. Para isso, realizamos um teste de hipótese de
se o coeficiente associado à variável 𝑇𝑇! é igual a 0. Caso se rejeite essa hipótese nula, tem-
se que há, na amostra em questão, impactos de que a política analisada teve, sim, efeito
sobre a população.

Além disso, antes de realizar concretamente a análise de possível impacto da política, é
fundamental entender se o processo de aleatorização gerou de fato grupos de tratamento
e controle comparáveis, ou seja, estatisticamente similares, condição a que Duflo et al.
(2007) se refere como teste de balanceamento. O objetivo desse teste é garantir que em
características observáveis medidas antes da intervenção (idade, escolaridade, sexo)
sejam estatisticamente iguais entre os grupos de tratamento e controle.
Para tal, o seguinte modelo é estimado por MQO:
𝑋𝑋! = ρ + γ𝑇𝑇! + 𝑣𝑣!
onde 𝑋𝑋! é uma característica observável. Aqui, o desejado é que o coeficiente associado à
variável que indica tratamento seja estatisticamente não significante, isto é, igual a zero.
Além do ATE e do ATT, existe um terceiro parâmetro que pode ser de interesse do
pesquisador e esse é estimado quando a participação na intervenção que está sendo
analisada depende da escolha do indivíduo, mas há uma aleatorização que depende da
oferta da participação ou de algum tipo de encorajamento. É o chamado Efeito da Intenção
de Tratar (ITT).
A interpretação do ITT é um pouco diferente: esse revela o efeito no desfecho de interesse

ao ofertar a participação na política para os indivíduos – e não da política em si. Note-se
tratar de um estimador importante, pois em muitos programas o governo consegue oferecer
o programa – e não necessariamente fazer com que todos participem dele. O ITT também
é obtido por intermédio de uma regressão linear, mas agora usa-se uma variável binária 𝑍𝑍! ,
que indica se o indivíduo foi ou não sorteado para receber o convite para participar do
programa. A equação abaixo gera efeito causal de ofertar o tratamento.
𝑌𝑌! = 𝛼𝛼 + 𝛽𝛽'(( 𝑍𝑍! + 𝑒𝑒!
Por fim, vai-se falar dos tipos de aleatorização mais comuns de serem encontrados. Um
importante fator é o chamado mecanismo de designação, o qual determina quais unidades
(indivíduos, grupos, municípios etc.) realmente receberão a política a ser estudada.
Segundo Imbens e Rubin (2015), um experimento clássico é aquele cujo mecanismo de
designação atende a três critérios.

295
O primeiro é a chamada designação individual: a chance de uma unidade ser ou não tratada
não deve depender de características de outras unidades. A segunda é que todas as
unidades devem ter probabilidades positivas de serem i) tratadas ou ii) controle (designação
probabilística). Por fim, deve haver independência do mecanismo de designação com
relação a resultados potenciais, a chamada designação independente. Seguindo-se essas
três características, pode-se elencar alguns experimentos clássicos (IMBENS; RUBIN,
2015).
Os experimentos de Bernoulli são aqueles em que a designação de tratamento de cada

unidade é independente da dos demais. Aqui, ao se falar sobre experimento de saúde que
testa o efeito de uma nova droga, por exemplo, as probabilidades de um indivíduo receber
o remédio ou receber um placebo são independentes. Algumas situações negativas podem
acontecer: existe a probabilidade positiva de que todos os indivíduos sejam designados
para único grupo. Além disso, pode acontecer que subgrupos dentro da sua amostra
estejam desbalanceados entre os grupos de tratamento ou controle. No exemplo do
remédio, pode ocorrer que entre os tratados a proporção de mulheres seja maior do que a
de homens, enquanto no controle o contrário acontece.
Os experimentos completamente aleatórios têm como principal característica a

determinação prévia do tamanho do grupo de tratamento. O mais usual é a definição de
grupos de mesmo tamanho. Aqui, apesar de haver um sorteio aleatório no qual as pessoas
podem integrar ou o grupo de tratamento ou o grupo de controle, pode ocorrer o problema
de se gerarem grupos (tratamento ou controle) desbalanceados em características pré-
experimentais.
O terceiro tipo são os chamados experimentos com aleatorização estratificada. Antes da

designação do status de tratamento por meio de um experimento completamente aleatório,
a população para a qual serão designados os indivíduos a serem tratados é dividida em
grupos (estratos), tomando-se como base características observáveis consideradas
importantes pelo pesquisador, com o objetivo garantir o balanceamento entre os diferentes
estratos. Em seguida, faz-se um sorteio a partir de cada estrato, para garantir que os
grupos de tratamento e controle sejam representativos em termos das características
consideradas relevantes para a determinação dos estratos.
Por fim, há os experimentos com aleatorização por pares. Trata-se do caso extremo do tipo
de experimento anterior, no qual cada estrato é composto de duas unidades. Uma será

tratada e a outra será controle. O pareamento é feito com base em características
observáveis consideradas relevantes pelo pesquisador.
3 Aleatorização em políticas públicas
Muitas políticas públicas tendem a gerar oportunidades de aleatorização, inclusive no

campo da saúde. Essas oportunidades podem surgir tanto para aquelas que ainda estão
em processo de desenvolvimento e não foram implementadas, quanto para outras que
estão em processo de implementação. Apresentam-se, então, 4 possibilidades: a)
aleatorização por excesso de demanda; b) aleatorização na ordem de entrada; c)
aleatorização estratificada; e d) aleatorização de encorajamento (DUFLO et al., 2007).
A primeira é aleatorizar em contextos nos quais há excesso de demanda pela política

pública. Ou seja, não há recursos suficientes para atender a todos aqueles que estão
demandando a política, apesar de atenderem aos critérios de elegibilidade. Quando há
esse excesso de demanda, uma forma de alocação possível (e justa) é realizar uma
aleatorização entre os elegíveis.
A limitação de recursos pode gerar outro tipo de aleatorização no ambiente de uma política
pública: a aleatorização na ordem de entrada, o chamado phase-in. Pode-se estar falando
de uma política pela qual toda a população deva receber a intervenção, não devendo haver,
ao fim da política, um grupo de controle. Assim, pode-se usar um processo de aleatorização
para a entrada gradual dos participantes, ou seja, há uma expansão gradual ao longo do
tempo, na qual a ordem de participação é aleatorizada e, no fim, todos serão eventualmente
tratados.
Essa forma de aleatorização permite avaliar aqueles programas dos quais não se pode
excluir uma parte da população, por exemplo, uma política de acesso ao saneamento
básico. Além disso, o fato de todos serem tratados aumenta a chance de os grupos de
controle também contribuírem para a pesquisa, considerando-se que eventualmente
também receberão tratamento. No entanto, essa expectativa do tratamento pode também
gerar impactos negativos, por poder influenciar o comportamento do grupo de controle.
Esse tipo de aleatorização também dificulta a estimação de resultados no longo prazo, pois
o grupo de controle eventualmente não terá mais nenhum componente. Por fim, caso a
expansão do programa aconteça em ritmo mais acelerado do que o tempo para que essa
surta efeito, não é possível estimar o efeito médio do tratamento.

297
Outra possibilidade é utilizar a aleatorização estratificada, a qual pode suprir possíveis
limitações das anteriores. Além disso, também garante a participação de mais indivíduos
na política. É necessário, no entanto, considerar que foram utilizados estratos na hora de
se estimar os impactos da política, utilizando-se o que se chama efeitos fixos de estrato.
Por fim, pode-se ter a aleatorização de encorajamento: aqui fala-se de uma situação na
qual aleatorizar o acesso a um programa não é possível, seja por questões práticas ou
éticas. Assim, toda a população tem acesso ao programa. Em situações desse tipo, uma
possibilidade é aleatorizar não a parcela que recebe o tratamento, mas sim a parcela da
população que irá receber encorajamento para participar do programa, aumentando a
probabilidade de que o grupo de tratamento efetivamente receba a política. Podemos
pensar em uma campanha na qual pessoas são sorteadas para receber mensagens via
SMS para receberem a vacina contra a COVID-19.
4 Efeito mínimo detectável
Ao se analisarem os impactos de uma política pública, o pesquisador também precisa

entender qual a magnitude do impacto do tratamento que ele é capaz de estimar. Esse é o
chamado Efeito Mínimo Detectável (MDE): quanto o tratamento precisa afetar o resultado
de interesse para que se tenha capacidade de estimar o impacto. Por exemplo, caso o MDE
seja pequeno, isso quer dizer que a política precisaria ter um impacto pequeno para esse
fosse detectado.
Os fatores que afetam o MDE são: o tamanho da amostra, a proporção de tratados, o nível
de significância e de poder e a variância do termo de erro. A sua fórmula é a seguinte:
1
𝑀𝑀𝑀𝑀𝑀𝑀 = 𝜎𝜎 ∗ (𝑡𝑡#)* + 𝑡𝑡+ ) ∗ E
𝑁𝑁𝑁𝑁(1 − 𝑃𝑃)
Vamos aos termos: 𝜎𝜎 é o desvio padrão do erro populacional, valor esse desconhecido, que
precisa ser estimado pelo pesquisador. Quanto maior for, maior é o MDE; 𝑡𝑡#)* e 𝑡𝑡+ são os
valores da distribuição t-student associados a, respectivamente, o nível de poder 𝑘𝑘 e 𝛼𝛼.
Esses valores são de escolha do pesquisador e essa escolha envolve um trade-off: maior
poder e significância implicam também maior MDE; 𝑁𝑁 é o tamanho da sua amostra e 𝑃𝑃 é a
proporção de tratados. Note-se que para esse último termo, quanto mais próximo de 0,5
for, menor será o MDE.

Trata-se de uma estatística cujo cálculo é importante, uma vez que a não identificação de
algum impacto por uma adequação pode estar ligado ao fato de que o pesquisador não
está usando os níveis adequados de amostra e a proporção correta de tratados para
determinado MDE. É interessante que a partir da equação do MDE, tenha-se a definição
implícita do tamanho amostral necessário para atingir determinado efeito mínimo
detectável, dado um nível de significância, poder e uma proporção de unidades tratadas:
(𝑡𝑡#)* + 𝑡𝑡+ ), 𝜎𝜎 ,
𝑁𝑁 =
𝑃𝑃(1 − 𝑃𝑃) 𝑀𝑀𝑀𝑀𝑀𝑀 ,
Com isso, é essencial considerar os valores de MDE ao se planejar uma avaliação

experimental, haja vista que questões como tamanho de amostra e proporção de indivíduos
tratados não podem ser alteradas após a aleatorização dos indivíduos ter acontecido.
Ressalte-se que existem algumas situações nas quais o cálculo do MDE se torna mais
complexo. Primeiro, nos desenhos de avaliação em que o sorteio é realizado em blocos
(estratos) ou de forma agregada (com o uso de clusters). Também existe um refinamento
do cálculo nas situações em que o sorteio não é seguido à risca, ou seja, nem todos os
indivíduos sorteados para o grupo de tratamento recebem o benefício e/ou alguns
indivíduos sorteados para o grupo de comparação o recebem. Alguns desses problemas
serão, inclusive, tratados na próxima seção. E, por fim, quando são incluídas variáveis
dependentes na análise de regressão. Esses casos especiais são detalhados por Duflo et
al. (2007) e por Djimeu e Houndolo (2016).
5 Problemas possíveis
Apesar das suas vantagens, uma avaliação por si só pode gerar incentivos
comportamentais nos indivíduos envolvidos no estudo (GERTLER et al., 2018). O primeiro
desses é o chamado Efeito Hawthrone: as unidades envolvidas na avaliação alteram seus
comportamentos simplesmente porque estão sendo observadas. Outro é o Efeito John
Henry: as unidades de controle exercem um esforço maior uma vez que não foram
selecionadas para o grupo de tratamento.
Outro comportamento negativo que a avaliação pode gerar é a chamada antecipação: as
unidades do grupo de controle mudam seu comportamento por terem uma expectativa de
receber o programa no futuro. Por fim, há também o chamado viés de substituição: as
unidades que não foram selecionadas para receber o programa podem ser capazes de
encontrar programas substitutos por iniciativa própria.

299
O cumprimento parcial é outro problema da avaliação experimental e esse diz respeito a
situações nas quais unidades que foram designadas para o grupo de tratamento não o
recebem de fato, enquanto há unidades no controle que recebem o tratamento. Diversas
podem ser as causas para isso: impossibilidade de enforcement para que haja cumprimento
por parte dos tratados ou para garantir que indivíduos do controle não sejam tratados. Erros
práticos e administrativos podem também ser responsáveis por isso.
Há também o chamado transbordamento, o qual acontece quando uma intervenção afeta

um não participante do programa, seja de forma positiva ou negativa. Um exemplo clássico
de transbordamento (externalidade) positivo é a vacinação: quanto mais pessoas são
vacinadas, menor a probabilidade de que os não vacinados sejam afetados pela doença
combatida pela vacina em questão. Efeitos de transbordamento para o grupo de controle
podem levar ao viés do estimador de impacto do programa, uma vez que os indivíduos
designados para esse grupo foram contaminados pelo tratamento.
O problema do atrito ocorre quando partes da amostra não são encontradas ao longo do
tempo ou se recusam a participar do processo de coleta de dados. Se o atrito for aleatório
(não-correlacionado com a designação do tratamento), então perde-se apenas precisão na
estimação. Entretanto, o atrito levará ao viés do estimador de impacto se as unidades que
decidem abandonar o tratamento são sistematicamente diferentes daquelas que
permanecem.
Por fim, destaca-se que o método não é inquestionável e está sob constante escrutínio por
parte da comunidade científica. Deaton (2020) ressalta que como qualquer outro método,
o uso de experimentos aleatórios deve ser feito com cautela. Não se trata de um padrão
ouro à prova de questionamentos e que é mais fácil ou menos problemático do que outros.
Além disso, o autor afirma que as questões mais preocupantes dizem respeito à ética,
especialmente quando pessoas muito pobres são experimentadas. Heckman (2020)
também afirma que os experimentos aleatórios possuem uma série de limitações que são
ignoradas e levam ao questionamento dos resultados apresentados, tanto em estudos mais
antigos quanto em estudos mais recentes.
6 Exemplos de aleatorização em políticas públicas de saúde
i) “Primary School Deworming Project” - Quênia

Um exemplo de política pública na área de saúde que fez uso de aleatorização foi o Primary
School Deworming Project, na cidade de Busia, Quênia, na qual drogas de desparasitação
foram distribuídas aleatoriamente nas escolas (e não para os indivíduos) o que permitiu a
estimativa dos efeitos gerais do programa. As 75 escolas do projeto consistem em quase
todas as escolas primárias nessa área e contavam com o total de matrículas de 30.000
alunos entre seis e dezoito anos.
Em janeiro de 1998, as 75 escolas do PSDP foram divididas aleatoriamente em três grupos

de vinte e cinco escolas: as escolas foram primeiramente estratificadas por subunidade
administrativa (zona), por seu envolvimento em outros programas de assistência não
governamentais e, então, foram listadas por ordem alfabética e cada terço (25 escolas) foi
designado para determinado grupo de projeto. Devido a problemas administrativos e
restrições financeiras, a intervenção de saúde foi implementada ao longo de vários anos.
As escolas do Grupo 1 receberam tratamento de vermifugação gratuito em 1998 e 1999;

escolas do Grupo 2 em 1999; enquanto as escolas do Grupo 3 começaram a receber
tratamento em 2001. Assim, em 1998, as escolas do Grupo 1 eram escolas de tratamento,
enquanto as escolas do Grupo 2 e do Grupo 3 eram escolas de comparação e, em 1999,
as escolas do Grupo 1 e do Grupo 2 eram de tratamento e as do Grupo 3 eram de
comparação.
Miguel e Kremer (2004) referem que o programa reduziu o absenteísmo escolar nas escolas
de tratamento em um quarto. A desparasitação melhorou substancialmente a saúde e a
participação escolar das crianças não tratadas nas escolas de tratamento e nas escolas
vizinhas, implicando que o programa gerou externalidades. Além disso, foram grandes o
suficiente para justificar o tratamento totalmente subsidiado. No entanto, os autores não
encontraram evidências de que a desparasitação melhorou os resultados dos testes
acadêmicos.
O mesmo experimento também foi estudado por outros trabalhos. Aiken et al. (2015) e
Davey et al. (2015) fazem uma reanálise de Miguel e Kremer (2004). Ambos os trabalhos
de reanálise apresentam evidências que continuam sustentando fortemente os resultados
de externalidades positivas do tratamento de desparasitação e impactos da participação
escolar. Além disso, Kremer tem uma série de outros trabalhos que indicam outras políticas
de desparasitação em outros países desenvolvidos

301
ii) “Reach Up and Learn” – Jamaica
O Reach Up and Learn foi desenvolvido pelo governo jamaicano e tratava-se de uma
intervenção na primeira infância com foco no desenvolvimento físico e intelectual das
crianças. Envolveu 129 crianças com crescimento estagnado entre 9 e 24 meses de idade.
Os participantes poderiam receber um dos seguintes tratamentos: (i) no tratamento

conhecido como estímulo psicossocial a criança receberia, em domicílio, a visita de um
profissional de saúde da comunidade que instruiria as famílias sobre como brincar e sobre
como lidar com as crianças; (ii) a família receberia suplementação alimentar, de modo a
suprir a necessidade energética e de vitaminas das crianças com crescimento estagnado
(a família também receberia leite e cereal para evitar o consumo do suplemento por outros
familiares); (iii) visitas e suplementação juntas. As visitas seriam semanais e durariam uma
hora. O grupo ao qual a criança pertenceria foi determinado de forma aleatória.
Walker et al. (2006) estudam os impactos de longo prazo dessa intervenção. Das 129
crianças identificadas entre 9 e 24 meses, 103 foram acompanhadas até os 17-18 anos. As
principais variáveis estudadas foram: ansiedade, depressão, autoestima e comportamento
antissocial avaliado por questionários administrados por entrevistadores; déficit de atenção,
hiperatividade e comportamento avaliado por entrevistas com os pais.
A análise primária indicou que os participantes que receberam os estímulos psicossociais

tiveram pontuações gerais significativamente diferentes daqueles que não o fizeram. A
suplementação não teve efeito significativo. Os participantes que receberam os estímulos
relataram menos ansiedade, menos depressão e maior autoestima e os pais relataram
menos problemas de atenção. Com isso, o artigo concluiu que a estimulação na primeira
infância tem sustentado benefícios para os resultados emocionais de crianças atrofiadas.
iii) StayingFit – caso do Brasil
O programa StayingFit é on-line e tem por objetivo incentivar e orientar o controle de peso
e hábitos alimentares saudáveis. Originário dos Estados Unidos, foi desenvolvido para os
padrões dessa realidade. No entanto, Barrera et al. (2013) e Castro et al. (2015) fizeram
uma série de adaptações para adequá-lo para a realidade brasileira, levando em conta
cultura, hábitos e valores.
Silva et al. (2019) fizeram a análise de um experimento envolvendo esse programa na

realidade brasileira. Tratou-se de uma intervenção de 12 meses, realizada de setembro de

2016 a setembro de 2017. Participaram dessa pesquisa alunos do 7º ao 9º ano dos sexos
masculino e feminino, matriculados em 12 escolas públicas de médio porte da rede pública
de ensino integral de Salvador. Essas escolas foram distribuídas aleatoriamente no grupo
intervenção e no grupo controle. O primeiro contém 4 instituições de ensino e o segundo 8.
Dos 1.800 alunos elegíveis para esse estudo, 895 forneceram um documento de
consentimento e concordaram com participar do estudo.
A intervenção foi composta de 16 sessões independentes. O pré-requisito para realizar a

sessão subsequente era concluir a sessão anterior. O StayingFit Brasil foi entregue por
meio de um ambiente virtual de aprendizagem sem custo algum para os alunos. Dados
sobre consumo alimentar, antropometria, nível de atividade física e comportamento
sedentário foram coletados de todos os alunos no início e após os 12 meses de estudo.
Dados demográficos e socioeconômicos foram coletados no baseline.
Os resultados de Silva et al. (2019) indicam que os alunos do grupo de intervenção tiveram
uma chance 43% maior de consumir feijão regularmente e uma chance 35% menor de
consumir refrigerantes regularmente. Não foram encontradas diferenças entre os grupos
de tratamento e controle quanto aos parâmetros antropométricos. Apesar desses
resultados modestos, a implementação de uma intervenção na web parece gerar benefícios
e ajudar a promover mudanças positivas nos hábitos em relação a alimentação dos jovens.
7 Uso dos resultados da avaliação na decisão de política pública
Por fim, pode-se ressaltar como aspecto relevante o modo pelo qual se pode usar os
resultados de avaliações de programas para direcionar futuras políticas e expansões de
programas existentes. Ou seja, é importante que o estudo das respostas a um tratamento
seja capaz de embasar e solidificar a tomada de decisões.
Um importante aspecto para auxiliar nessa tomada de decisão é a chamada análise de

custo-efetividade, na qual se selecionam os impactos estimados na avaliação e compara-
se individualmente cada um desses aos custos totais da política pública. Assim, é calculada
uma razão entre os custos e os benefícios e isso se faz de duas formas: (i) a partir da razão
entre o custo total da política e o seu impacto também total ou (ii) a partir da razão entre o
custo da política por beneficiário e o impacto individual estimado.

303
Para calcular os valores dos custos da política, deve-se incorporar todos os custos
efetivamente investidos em cada uma das etapas da política. Vale destacar que os custos
da política não necessariamente geram desembolsos, mas, ainda assim, devem ser
contabilizados. Em particular, devem-se considerar os custos de oportunidade envolvidos
na política. Entende-se custo de oportunidade como o valor que poderia ser obtido pelo uso
alternativo de um recurso empregado na política em questão.
Outro conceito importante para a tomada de decisão na política pública, tendo como base
a avaliação de impacto, é a chamada análise custo-benefício. Novamente compara-se os
custos aos benefícios trazidos pela política em questão, no entanto, nesse caso os
benefícios necessariamente devem corresponder ao valor monetário dos impactos da
política que foram obtidos na etapa anterior de avaliação.
Caso o indicador de impacto não seja medido em unidades monetárias, será preciso
transformá-lo em tal unidade de medida para o cômputo dos benefícios em valores
monetários. Note-se que o procedimento de monetização se baseia na adoção de hipóteses
para converter o valor do impacto de sua unidade de medida original para unidades
monetárias e esse processo de conversão deve ser explícito e embasado por valores de
referências consolidados na literatura.
Um autor que discute isso em alguns artigos é Charles F. Manski, o qual tem diversos
trabalhos em que analisa de que maneira o tomador de decisão com relação a uma política
pública pode decidir, por exemplo, acerca da expansão de um programa existente em um
novo contexto, tendo como base uma avaliação experimental.
Manski (2007) apresenta fundamentalmente três importantes critérios que um planejador

avesso ao risco pode utilizar para embasar uma decisão de expansão de programa
existente em um novo contexto. O primeiro é baseado em uma Regra de Bayes, que leva
em consideração a distribuição de probabilidade subjetiva do planejador e compara a taxa
de sucesso esperada do novo programa com a do antigo. O segundo é o critério maxmin,
o qual considera o pior cenário possível de taxa de sucesso do novo programa com a taxa
do programa anterior. Por fim, tem-se o critério de minimizar o máximo de arrependimento,
que leva em consideração as perdas das possíveis escolhas alternativas.

Referências
AIKEN, A. M. et al. Re-analysis of health and educational impacts of a school-based
deworming programme in western Kenya: a pure replication. International Journal of
Epidemiology, v. 44, n. 5, p. 1572-1580, 2015.
ANGRIST, J.; PISCHKE, J, S. Mostly harmless econometrics: an empiricists guide.

Princeton: Princeton University Press, 2009.
BARRERA JÚNIOR, M. et al. Cultural adaptations of behavioral health interventions: a

progress report. Journal of Consulting and Clinical Psychology, v. 81, n. 2, p. 196-205,
2013.
CASTRO, Y. et al. Adaptation of a counseling intervention to address multiple cancer risk

factors among overweight/obese Latino smokers. Health Education & Behavior, v. 42, n.
1, p. 65-72, 2015.
DAVEY, C. et al. Re-analysis of health and educational impacts of a school-based

deworming programme in western Kenya: a statistical replication of a cluster quasi-
randomized stepped-wedge trial. International Journal of Epidemiology, v. 44, n. 5, p.
1581-1592, 2015.
DEATON, A. Randomization in the tropics revisited: a theme and eleven variations.

Cambridge: National Bureau of Economic Research, 2020 (NBER Working Paper No.
27600). Disponível em: https://www.nber.org/system/files/working_papers/w27600/w27
600.pdf. Acesso em: 14 set. 2022.
DJIMEU, E. W.; HOUNDOLO, D. G. Power calculation for causal inference in social

science: sample size and minimum detectable effect determination. Journal of
Development Effectiveness, v. 8, n. 4, p. 508-527, 2016.
DUFLO, E.; GLENNERSTER, R.; KREMER, M. Using randomization in development

economics research: A toolkit. Handbook of Development Economics, v. 4, p. 3895-
3962, 2007.
GERTLER, P. J. et al. Avaliação de impacto na prática. 2. ed. Washington D.C: World

Bank Publications, 2018. Disponível em: https://openknowledge.worldbank.org/bitstream/
handle/10986/25030/9781464808890.pdf. Acesso em: 14 set. 2022.
GIBSON, M.; SAUTMANN, A. Introduction to randomized evaluations. Cambridge: J-

PAL- Abdul Latif Jameel Poverty Action Lab, 2021. Disponível em:https://www.poverty
actionlab.org/resource/introduction-randomized-evaluations. Acesso em: 14 nov. 2022.
HECKMAN, J. J. Randomization and social policy evaluation revisited. Bonn: IZA –

Institute of Labor Economics, 2020. (IZA Discussion Papers, n. 12882). Disponível em:
https://www.econstor.eu/bitstream/10419/215278/1/dp12882.pdf. Acesso em: 14 set.
2022.
IMBENS, G. W.; RUBIN, D. B. Causal inference in statistics, social, and biomedical

sciences. Cambridge: Cambridge University Press, 2015.
MANSKI, Charles F.; TETENOV, Aleksey. Admissible treatment rules for a risk-averse
planner with experimental data on an innovation. Journal of Statistical Planning and
Inference, v. 137, n. 6, p. 1998-2010, 2007.

305
MIGUEL, E.; KREMER, M. Worms: identifying impacts on education and health in the
presence of treatment externalities. Econometrica, v. 72, n. 1, p. 159-217, 2004.
SILVA, K. B. B. da et al. Evaluation of the computer-based intervention program stayingfit

Brazil to promote healthy eating habits: The results from a school cluster-randomized
controlled trial. International Journal of Environmental Research and Public Health, v.
16, n. 10, p.1-18, 2019.
WALKER, S. P. et al. Effects of psychosocial stimulation and dietary supplementation in

early childhood on psychosocial functioning in late adolescence: follow-up of randomised
controlled trial. BMJ, v. 333, n. 7566, p. 1-5, 2006. Disponível em:
https://www.bmj.com/content/bmj/333/7566/472.full.pdf. Acesso em: 14 nov. 2022.

Capítulo 11
Métodos baseados em escore de

propensão e suas aplicações em
avaliação de políticas de saúde
Dandara de Oliveira Ramos1,2

Rosemeire Leovigildo Fiaccone2,3
1
2
Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS-Fiocruz Bahia)
3
Departamento de Estatística, Universidade Federal da Bahia
RESUMO:
Objetivo: Introduzir o leitor aos pressupostos e a aplicação de técnicas baseadas em escores de
propensão. Público-alvo: pesquisadores envolvidos em projetos de avaliação de impacto, gestores em
saúde e comunidade acadêmica em geral. Mensagem principal do capítulo: Os métodos de avaliação
baseados em escores de propensão são de aplicação relativamente fácil em estudos observacionais.
PALAVRAS-CHAVE:
Escores de propensão. Pareamento. Ponderação. Kernel. Iptw.

307
1 Introdução
Os métodos apresentados neste capítulo se baseiam em um conjunto de técnicas que

envolvem o uso de escores de propensão. Em estudos observacionais, em virtude da não
aleatorização da alocação dos grupos de intervenção e não intervenção, as distribuições
das covariáveis (de exposição ou confundidoras) podem ser desequilibradas e produzir
estimativas tendenciosas do verdadeiro impacto do programa que se pretende avaliar. Por
exemplo, entre beneficiários e não-beneficiários de um programa de transferência de renda,
é muito provável que os beneficiários sejam mais pobres e vivam sob piores condições de
habitação que os não-beneficiários; nesse sentido, para compará-los de forma correta e
então analisar o impacto da transferência de renda em seus desfechos de saúde será
necessário recuperar a comparabilidade desses grupos e reduzir o chamado viés de
seleção. Aqui será apresentado o uso de escores de propensão como um método que pode
auxiliar nesses cenários.
1.1 Breve histórico das análises baseadas em escores de propensão
Na primeira metade do século XX houve um grande desenvolvimento de métodos

relacionados à análise de experimentos aleatorizados com o objetivo de controlar
confundimento. Entretanto, quando a designação aleatória a uma intervenção não é
possível, existem métodos baseados na teoria do contrafactual como forma de se
construírem grupos similares na tentativa de simular um experimento randomizado. Em
particular, os métodos de escores de propensão representam uma das possíveis
estratégias para se corrigir a estimação do efeito de uma intervenção controlando por
fatores de confundimento, baseado na ideia de que quanto maior for similaridade das
covariáveis entre os grupos de intervenção e não intervenção menor será o viés.
Somente no início da década de 1970, com a publicação dos artigos Cochran e Rubin
(1973) e Rubin (2012) introduziram-se discussões relacionadas à estratificação e
pareamento na avaliação do efeito de intervenções em estudos observacionais. Os
métodos de pareamento são usados em duas situações: naquela que se refere à seleção
das unidades de análise em um determinado desenho de estudo e na outra, quando os
dados foram coletados e o objetivo é reduzir o viés de seleção no processo de estimação
(STUART, 2010). Vale ressaltar que o pareamento pode ser realizado diversas vezes antes
da estimação do efeito de interesse e o diagnóstico de cada pareamento pode ser realizado
de modo a selecionar aquele que produz menor viés. Um importante avanço ocorreu em

1983, quando Rosenbaum e Rubin introduziram a técnica envolvendo escores de
propensão para realização de pareamentos como forma de corrigir o desbalanceamento
das distribuições das covariáveis em estudos observacionais (ROSENBAUM; RUBIN,
1983).
Por definição, o escore de propensão é a probabilidade de um indivíduo ser alocado ao

grupo de intervenção, condicionada a um conjunto de covariáveis que se acredita
influenciarem a chance de receber a intervenção (ROSENBAUM; RUBIN, 1983; AUSTIN,
2011). Esse escore é um valor único, que varia de 0-1 e sintetiza as características
observadas dos indivíduos participantes do estudo. Seu uso para reduzir o viés de seleção
pode ser bem sucedido porque indivíduos dos grupos de intervenção e não intervenção que
tenham valores iguais (ou muito similares) no escore de propensão também terão as
mesmas distribuições nas variáveis associadas (por exemplo, condições de domicílio) e,
assim, recuperarão a comparabilidade entre esses grupos e melhorarão as condições para
a estimativa do efeito.
1.2 Como estimar escores de propensão?
Estimar escores de propensão é uma tarefa relativamente simples, que consiste em

selecionar um conjunto de variáveis como preditoras da alocação ao grupo de intervenção
e incluí-las como variáveis de exposição (variáveis independentes), geralmente, em um
modelo de regressão logística em que se tem a variável binária do status de intervenção
como desfecho (1 para participantes no grupo de intervenção e 0 para não intervenção).
Extraindo-se os valores preditos desse modelo para cada observação tem-se os escores
de propensão dos participantes, uma "pontuação" (score) que representa sua probabilidade
estimada de receber o tratamento condicionada ao conjunto de variáveis de exposição
utilizadas.
Por exemplo, nos estudos observacionais que envolvem situações nas quais a intervenção
é representada por uma variável binária, T, onde Ti =1 representa que a i-ésima unidade
de análise tenha recebido a intervenção e Ti = 0, caso não o tenha recebido, e X denota
um conjunto de p variáveis observadas, o modelo logístico pode ser utilizado para estimar
o escore de propensão, de modo que
! !"#$%
ei(X) =
"# ! !"#$%

309
Outros métodos podem ser utilizados para estimar escores de propensão para além do
método clássico baseado em regressão logística, tais como árvores de decisão, redes
neurais e análise discriminante (LEE; LESSLER; STUART, 2011; SETOGUCHI et al.,
2008). Para os casos em que a variável que determina a atribuição da intervenção tem mais
de duas categorias o modelo multinomial com funções de ligação logit ou probit é indicado
(SPREEUWENBERG et al., 2010).
O uso de escores de propensão, no geral, envolve várias etapas de implementação

incluindo-se a estimação dos escores, a seleção de uma metodologia para o uso dos
escores de propensão, a estimação do efeito da intervenção e a avaliação da qualidade do
modelo e adequação dos pressupostos.
Na primeira etapa, a seleção do conjunto de variáveis para estimação do escore de

propensão é de grande importância e o pesquisador precisa estar seguro dos critérios e
justificativas utilizados para sua decisão. Essa seleção deve se basear no conhecimento
prévio do pesquisador acerca da natureza das relações entre as variáveis envolvidas em
seu estudo (ALI; GROENWOLD; KLUNGEL, 2016). Diferentes tipos de variáveis podem ser
classificadas com base em sua relação com a intervenção (T) e com o desfecho de
interesse (Y) e serem consideradas variáveis de confundimento (ou variáveis de confusão)
- aquelas que influenciam o status de intervenção (tratado ou não tratado) e também estão
relacionadas ao desfecho (Figura 1.1); variáveis instrumentais - as que estão fortemente
relacionadas ao status de intervenção mas não ao desfecho de interesse, a não ser por
meio de sua relação com a intervenção (Figura 1.2); fatores de risco - variáveis associadas
ao desfecho de interesse que podem ou não estar associadas ao status de intervenção
(Figura 1.3); variáveis intermediárias - variáveis pós-tratamento influenciadas pela
intervenção e que se encontram no caminho causal entre a intervenção e o desfecho
(Figura 1.4); e colisores - variáveis consideradas "efeitos de duas causas" (Figura 1.5).

Figura 1 - Diagramas causais (A-E) que demonstram as diferentes associações entre a
intervenção (A), desfecho (Y), variáveis de confundimento (X), fatores de risco (R), variáveis
instrumentais (IV), variáveis intermediárias (I) e colisores (C)
Fonte: Traduzido e adaptado de Ali, Groenwold e Klungel (2016).
É boa prática que variáveis de confusão sempre sejam incluídas como variáveis preditoras
dos escores de propensão e que variáveis colisoras ou intermediárias não sejam incluídas
(ALI et al., 2014; BROOKHART et al., 2006; PATRICK, 2011; MYERS et al., 2011; ALI et
al., 2019). No entanto, na literatura há controvérsias acerca da inclusão de fatores de risco,
considerando-se a introdução de viés e o quanto contribuem ou não para a precisão das
estimativas do impacto da política sobre o desfecho (GREENLAND, 2011). Em uma revisão
da literatura, identificam-se três principais abordagens quanto à seleção de variáveis
preditoras de escores de propensão: a) uso de variáveis associadas apenas com a
intervenção; b) uso de variáveis de confundimento e; c) uso de variáveis de confundimento
somadas a fatores de risco para o desfecho.
A abordagem baseada em variáveis instrumentais, ou seja, variáveis fortemente

correlacionadas ao status de intervenção e não associadas ou fracamente associadas ao
desfecho de interesse é baseada em argumentos similares aos de Ralph B. D'Agostino
Júnior e Ralph B. D'Agostino (2007) a favor da seleção de preditores para EP com base em
critérios de significância estatística (p-valor) (D’AGOSTINO JÚNIOR; D’AGOSTINO, 2007).
No entanto, estudos de simulação têm demonstrado que EPs estimados a partir de
variáveis instrumentais não têm boa performance na redução do viés de seleção, o que
resulta em estimativas do efeito final com baixa precisão e que essas inconsistências

311
aumentam conforme a força da associação entre as variáveis instrumentais e a intervenção
(MYERS et al., 2011; BHATTACHARYA; VOGT, 2007).
A segunda abordagem propõe que escores de propensão devem ser estimados a partir de
variáveis de confundimento, aquelas associadas tanto ao status de intervenção quanto ao
desfecho de interesse. Essa pode ser considerada a abordagem mais tradicional,
recomendada pela maioria dos manuais de avaliação de impacto (GERTLER et al., 2018;
KHANDKER; KOOLWAL; SAMAD, 2009) e por pesquisadores líderes na área de
metodologias quase experimentais (ROSENBAUM; RUBIN, 1983; AUSTIN;
GROOTENDORST; ANDERSON, 2007; AUSTIN et al., 2007). Os benefícios de uma
abordagem de escores de propensão estimados com base em variáveis de confundimento
são a boa performance para reduzir o viés associado a variáveis de confundimento e a
estabilidade de seus resultados mesmo em cenários de forte viés de seleção
(desbalanceamento das covariáveis entre indivíduos tratados e não tratados). Em uma
estratégia como a de pareamento, que será detalhada mais adiante, a comparação do
desfecho de interesse entre indivíduos tratados e indivíduos não tratados, suficientemente
pareados em seu escore de propensão, produz o impacto estimado da política/programa
analisada.
A terceira abordagem propõe que os escores de propensão devem ser condicionados a um

conjunto de variáveis de confundimento acompanhadas de variáveis fortemente associadas
ao desfecho de interesse, ainda que essas sejam fracamente ou até não associadas ao
status de intervenção. Com base em estudos de simulação, evidências indicam que essa
abordagem beneficia a precisão das estimativas finais do impacto da política sobre o
desfecho de interesse (BROOKHART et al., 2006; ROBINS; MARK; NEWEY, 1992) sem
enviesar fortemente os escores de propensão (RUBIN; THOMAS, 1996). Em cenários nos
quais fatores de risco continuam desbalanceados entre tratados e não tratados, mesmo
após serem incluídos como preditores dos escores de propensão, também pode se
considerar o duplo ajuste, inserindo-se novamente os fatores de risco como variáveis de
ajuste no modelo final (exemplo: variável fator de risco Z incluída como preditora no modelo
logístico para estimativa dos escores de propensão e incluída novamente, como variável
de ajuste, no modelo de regressão para estimar o efeito do tratamento sobre o desfecho de
interesse após pareamento ou ponderação pelos escores de propensão).
Recentemente, alternativas vêm sendo propostas para a seleção de variáveis preditoras de

escores de propensão, tais como árvores de decisão, LASSO, metaclassificadores, support

vector machines, entre outros (SETOGUCHI et al., 2008; SHORTREED; ERTEFAIE, 2017;
SCHNEEWEISS et al., 2017), no entanto, o conhecimento acerca da relação entre as
variáveis utilizadas continua apontado como uma necessidade fundamental para o êxito na
condução das análises.
2 Principais métodos de avaliação de impacto baseados em escores de propensão
Existem quatro principais métodos para o uso de escores de propensão na avaliação de

impacto (AUSTIN; STUART, 2015): estratificação, ajuste em modelos de regressão,
pareamento e ponderação pelo inverso da probabilidade de tratamento (do inglês Inverse
Probability of Treatment Weighting - IPTW). A estratificação usando o escore de propensão
envolve a subdivisão das unidades de análise em conjuntos disjuntos baseada no escore
de propensão estimado (AUSTIN, 2010). Espera-se que a distribuição das variáveis seja
similar dentro de cada estrato, desde que o escore de propensão tenha sido especificado
corretamente. O ajuste pelo escore de propensão é caracterizado pela sua inclusão
juntamente com o indicador de intervenção como variáveis independentes no ajuste de
modelos de regressão.
Dentre os procedimentos de pareamento utilizando o escore de propensão destacam-se:

• Pareamento por vizinhos mais próximos, que consiste em procurar uma ou mais
unidades de análise que não recebem intervenção/tratamento com um escore de
propensão mais próximo de uma unidade tratada. Existem variações desse algoritmo
que incluem o pareamento um para um, sem e com reposição (a unidade controle
pode ser usada mais de uma vez no pareado com a unidade tratada). A reposição
de unidades amostrais durante o pareamento resulta em maior qualidade no
pareamento e menor viés (STUART, 2010). Por outro lado, esse tipo de pareamento
pode não ser o melhor, uma vez que para algumas unidades tratadas o vizinho mais
próximo pode ter um escore de proporção muito diferente.
• Pareamento por raio ou calibre define uma distância máxima entre os escores de
propensão das unidades de análise pertencentes aos grupos intervenção/tratado e
não tratado. Ou seja, cada unidade tratada somente será pareada com uma unidade
do grupo controle se esse possuir um valor de escore de propensão que se encontra
em uma distância pré-definida (raio) do escore de propensão. Nessa abordagem não
há consenso a respeito do valor da distância máxima que deve ser utilizada. Austin

313
(2011) sugere usar 0,2 vezes do desvio padrão do logito do escore de propensão
como distância limite (AUSTIN, 2011).
2.1 Estratégias de ponderação e estratégias mistas
A ponderação pelo inverso do escore de propensão é uma metodologia proposta

primeiramente por Rosenbaum (1987) e muitas vezes é empregada por alguns autores
como alternativa ao pareamento de forma que os grupos representem melhor a população
(ROBINS; HERNAN; BRUMBACK, 2000; IMBENS, 2004). Nessa abordagem, cada
observação individual recebe um peso correspondente ao inverso do valor obtido do escore
de propensão de pertencer ao grupo no qual foi alocada. Uma limitação importante da
ponderação é que se as estimativas dos escores estiverem próximas de zero ou de um, os
pesos terão magnitude muito grande e, consequentemente, a variabilidade do efeito de
tratamento estimado será aumentada.
Pareamento pelo kernel, por sua vez, pode ser considerado uma técnica mista que envolve
pareamento e ponderação. Consiste em um método de pareamento não-paramétrico que
usa médias ponderadas de todos os indivíduos no grupo de controle para construir o
resultado contrafactual. Com base em um parâmetro de largura de banda (h), o método
determina o quão estreita deve ser uma banda de valores em torno dos escores de
propensão dos participantes para considerá-los "pareáveis". Essa distância é definida com
base em uma função de densidade de kernel a ser definida pelo pesquisador dentre
diversas opções disponíveis (Epanechnikov, função retangular ou uniforme, triangular,
biweight, triweight, cosine trace ou Parzen). Uma vez definido o parâmetro de distância h,
o método define um esquema de ponderação para todas as unidades não tratadas e atribui
maiores pesos às unidades mais próximas daquelas unidades tratadas, as quais serão
pareadas.
Estudos de simulação têm indicado que o Kernel Matching (KM) pode ser mais vantajoso
quando comparado aos métodos tradicionais de pareamento por escores de propensão
(nnm, caliper, multivariate distance matching); há evidências de redução significativamente
maior de vieses nos erros padrão a favor do Kernel Matching (HANDOUYAHIA; HADDAD;
EATON, 2013; NAIMI et al., 2014). Outras vantagens são a possibilidade de ajuste para
diferentes formas funcionais, o que torna o método mais flexível, e a imposição de um
parâmetro h, que restringe a janela de valores possíveis para pareamento e censura valores
ou pesos extremos. No entanto, a tarefa de encontrar um valor ideal para h é

computacionalmente intensiva por envolver uma rotina de busca iterativa, o que pode ser
uma barreira para sua implementação em cenários de grandes bases de dados ou de
recursos computacionais restritos.
2.2 Pesos baseados no suporte comum
Conforme mencionado, a abordagem da ponderação pelo inverso do escore de propensão

pode não ser eficiente nos casos de valores extremos do escore de propensão (valores
próximos de zero ou um), uma vez que algumas estratégias para lidar com esse problema
resulta em uma diminuição substancial do número de observações. Como alternativa, Li e
colaboradores (LI; MORGAN; ZASLAVSKY, 2018) propuseram uma estratégia de
ponderação (do inglês overlap weighting) baseada na área de suporte comum, isto é,
baseada na população alvo (grupos de pessoas para o qual se quer estimar o efeito causal
de uma exposição), que representa a melhor área de suporte comum onde as observações
possuem escores de propensão próximos a 0.5. Ou seja, a ideia é ponderar as observações
que recebem a intervenção pela probabilidade de não recebê-la (representado aqui pelo
valor: 1-escore de propensão) e ponderar aqueles que não recebem a intervenção pela
probabilidade de receber a intervenção (escore de propensão).
3 Pressupostos para a análise com escores de propensão
Para a aplicação de métodos que utilizam o escore de propensão é necessário atender a

uma série de condições, em que algumas dessas estão relacionadas aos pressupostos da
identificação dos parâmetros da medida de efeito causal na ótica do modelo de respostas
potenciais de Rubin (RUBIN, 1974); as mais importantes estão listadas abaixo:
1. Se a intervenção/tratamento e o desfecho esperado são independentes condicionais às

variáveis de pré-intervenção/tratamento, esses também serão independentes condicionais
à probabilidade de receber a intervenção dadas as características observáveis, isto é,
condicional ao escore de propensão.
2. Suporte comum – requer que para cada indivíduo no grupo intervenção exista um par no
grupo que não recebe a intervenção com valores similares nas características observadas
(representada por X). Dessa forma, assegura-se que os indivíduos possuem probabilidade
de fazerem parte do grupo de intervenção ou não intervenção sempre positiva, a qual varia

315
entre 0 e 1. Ou seja, existe uma sobreposição na distribuição do escore de propensão entre
os grupos de intervenção/tratamento e não intervenção/controle. Essa suposição permite
que as unidades dentro do suporte comum sejam comparáveis e pode ser avaliada
graficamente por meio de histogramas sobrepostos, por exemplo. A figura 2 ilustra a área
de suporte comum dos escores de propensão obtidos no estudo de Ramos e colaboradores
(RAMOS et al., 2021) e avalia o impacto do programa Bolsa Família na mortalidade de
crianças de 1 a 4 anos.
Figura 2 - Área de suporte comum do estudo de Ramos e colaboradores (2021)
Fonte: Ramos e colaboradores (2021).
3. A terceira condição diz respeito à avaliação da qualidade do método de pareamento por

meio do balanceamento das covariáveis, ou seja, a similaridade da distribuição das
covariáveis nos dois grupos. Existem várias métricas para verificação do balanceamento
que na sua grande maioria, dependem da forma como se utiliza o escore de propensão.
Por exemplo, no pareamento por escore de propensão esse balanceamento é avaliado nos
grupos de observações pareadas. No procedimento de estratificação do escore de
propensão, o balanceamento pode ser realizado dentro de cada estrato. Uma medida

numérica bastante utilizada é a diferença padronizada, em termos da diferença de médias
ou proporções a depender da escala de mensuração da variável confundidora. Ainda como
alternativas, distância de Kolmogorov-Smirnov e distância de Levi. Alguns estudos de
simulação (SETOGOUCHI et al., 2008; ALI et al., 2014) apontam que a diferença
padronizada absoluta tem boa performance independentemente do tamanho amostral na
avaliação do balanceamento. Entretanto, nem sempre esse equilíbrio ocorre
completamente, o que torna necessário restringir a inferência para a subpopulação em que
foi possível alcançar o balanceamento (ROSENBAUM; RUBIN, 1983).
4 Escalas da estimativa de efeito
Define-se o efeito causal comparando-se os valores que o desfecho pode assumir para
diferentes valores do tipo de intervenção ou exposição. O problema básico para se
identificar o efeito causal é que o desfecho de interesse é observado em único grupo, ou
seja, no grupo de intervenção ou no grupo que não recebeu a intervenção, mas nunca sob
as duas situações ao mesmo tempo. Ou seja, em uma avaliação de impacto não se observa
o evento de interesse nos indivíduos alocados no grupo de intervenção, caso esses
tivessem sido alocados no grupo de não intervenção, referido como contrafactual. Dessa
forma, um grupo de comparação é utilizado para identificar o contrafactual do que teria
acontecido sem a intervenção. Esse grupo de comparação deve ser representativo do
grupo de intervenção, com a diferença de que o primeiro não participou do programa.
Portanto, deve-se sempre depender de uma etapa de substituição ao estimar o efeito causal
e, assim, a validade dessa estimativa dependerá da validade dessa substituição.
O termo população alvo será usado para o grupo de indivíduos sobre o qual nossa pergunta
científica deseja estimar o efeito causal de uma intervenção. A população alvo pode ser
composta por um grupo de pessoas (como na maioria dos estudos epidemiológicos), por
vários grupos de pessoas (como em um estudo de intervenção em várias comunidades) ou
por uma pessoa. Além disso, vamos considerar para cada unidade dessa população um
valor yi associado à variável desfecho Y e uma variável binária T que possui o valor 1 se
essa unidade participa do programa/intervenção e o valor 0 caso não participe. Em geral
há dois parâmetros comumente utilizados para estimar o efeito causal: o efeito médio do
tratamento na população alvo ou elegível para o programa de intervenção (average
treatment effect ou ATE) e o efeito médio do tratamento entre os tratados (average
treatment effect on the treated ou ATT), ou seja, condicionado aos indivíduos ou a uma

317
subpopulação que efetivamente receberam o tratamento/intervenção. Essas medidas são
definidas respectivamente como:
ATE=E [Y1i - Y0i] e ATT=E(Y1i -Y0i |Ti=1)
onde o operador E(⋅) representa a média ou o valor esperado na população alvo.
Sabe-se que E (Y1i - Y0i | Di =1) = E (Y1i | Di =1) - E (Y0i | Di =1). Como mencionado, o resultado
contrafactual de um indivíduo sob intervenção/tratamento E (Y0i | Di =1) não pode ser
observado, uma vez que um indivíduo somente pode estar no grupo de intervenção ou não
intervenção em um ponto específico do tempo. Portanto, alguns métodos podem ser
adotados para lidar com esse problema. Cada um desses métodos tem premissas e
requisitos específicos e tem como procedimento comparar as unidades com características
semelhantes nos grupos. Por exemplo, de acordo com a hipótese de independência
condicional, o processo de seleção ocorre segundo características observadas
(representadas pelo vetor X) e indivíduos com essas características idênticas possuem a
mesma probabilidade de serem alocadas como tratamento ou controle.
Portanto, para introduzir esses estimadores nos procedimentos que envolvem métodos
com escores de propensão, o pressuposto de independência deve ser alcançado.
Considera-se que a população de interesse seja dividida em dois subconjuntos com NT
unidades e NC unidades, em que T denota o subconjunto dos que recebem o
tratamento/intervenção e C o subconjunto daqueles que não o recebem. Seja C(i) o conjunto
de controles da unidade i e ei o escore de propensão estimado para essa unidade. Assim,
quando se realiza o pareamento pelo método do vizinho mais próximo, C(i) = { min || ei – ej
||}, ou seja, fazem parte desse conjunto as unidades da subpopulação C que apresentam
as menores diferenças absolutas dos escores de propensão com a unidade tratada i.
Quando o pareamento é por raio, o conjunto C(i) é composto por todas as unidades j que
têm diferença absoluta dos escore de propensão menor do que um raio(r) pré-estabelecido
no pareamento. Dessa forma, C(i) = { ej , min || ei – ej || < r }. Tanto para o pareamento por
vizinho mais próximo quanto para o pareamento por raio tem-se que NCi representa o
número de controles pertencentes a C, o qual é pareado com o indivíduo tratado i
pertencente à subpopulação T. O estimador para ATT para esses dois tipos de pareamento
pode ser definido como
" "
τM = ∑i∈T Yi1 - ∑j∈C Wj Yjo
%& %&
"
onde Wj = ∑i Wij com peso Wij = se j pertence C(i) ou Wij =0 caso contrário
%'%

Quando se utiliza a ponderação pelo inverso da probabilidade de tratamento (IPTW), os
pesos baseados nos escores de propensão26 são diretamente incorporados à estimação
do ATE e do ATT. Dessa forma, genericamente, os pesos usados para a estimação do
(% "*( !& ("*(% )
ATE são definidos por 𝑊𝑊&'() = !%
+ "* !% e para estimação do ATT, 𝑊𝑊&'(( = 𝑇𝑇& + .
% "* !%
Esses parâmetros não são os únicos que podem ser estimados. Ou seja, o efeito causal
pode ser calculado em uma escala linear (por exemplo ATT e ATE) e não linear (AUSTIN;
STUART, 2017). No contexto da epidemiologia é muito comum que o desfecho de interesse
tenha uma escala de mensuração categórica e, dessa forma, outros parâmetros causais
podem ser estimados como a razão de chances (do inglês odds ratio), risco relativo,
diferença de riscos nos procedimentos que envolvem o uso de escore de propensão. Como
mencionado anteriormente, há necessidade de se encontrar um substituto para a
frequência/chance da doença contrafactual. Na prática, esse substituto pode ser
mensurado de uma população diferente da população alvo durante o período etiológico
(período definido pela pergunta de investigação) ou ainda da população alvo observada em
um momento diferente do período etiológico. Entretanto, vale ressaltar que a presença de
viés em qualquer escala da medida de efeito causal pode estar relacionada à má
especificação do modelo de escore de propensão e consequentemente à baixa
performance do balanceamento, como também à não verificação do pressuposto de
independência condicional (a participação no programa independe da resposta potencial
condicional às variáveis pré-tratamento).
5 Uso de EP em grandes bases de dados
Comumente a avaliação de impacto de políticas de saúde se desenvolve a partir de

registros administrativos e/ou dos sistemas de informação em saúde – bases de dados em
escala populacional que reúnem um grande volume de observações e também um vasto
conjunto de variáveis. No cenário do Brasil, em virtude de nossa grande escala
populacional, os conjuntos de dados produzidos pelos sistemas de informação em saúde,
registros administrativos, censos e de alguns inquéritos de saúde, poderiam ser
considerados grandes bases de dados a envolver centenas de milhares a centenas de
milhões de registros. Dessa forma, o desafio de avaliar impacto de políticas em big data
está posto.

319
No contexto de grandes bases de dados com um número vasto de variáveis confundidoras,
o uso de escores de propensão oferece uma vantagem computacional ao reduzir a
dimensionalidade dos dados e facilitar a operabilidade dos modelos de análise, visto que
as observações dos grupos de intervenção e controle serão comparadas a partir de única
variável – o escore de propensão. No entanto, isso é válido somente para as aplicações
baseadas em ponderação ou pareamento com reposição; para estratégias de pareamento
sem reposição ou pareamento exato, o cenário de grandes bases de dados se torna
dificultoso devido ao uso de algoritmos iterativos e de grande complexidade em sua
matemática computacional.
Estudos baseados em modelos para dados de alta dimensionalidade (high dimensional

propensity scores - hdps), em que há muitas variáveis de confundimento com grau
considerável de correlação entre elas, sugerem o uso de técnicas automatizadas de
seleção de variáveis para a estimação dos escores de propensão e indicam boa
performance desse método em comparação com os métodos convencionais de seleção de
covariadas (ISHIMARU, 2020; GUERTIN et al., 2016); além disso, a vantagem de
possibilitar ao pesquisador a descoberta de variáveis confundidoras anteriormente
desconhecidas. Desenvolvimentos recentes expandem a técnica de escores de propensão
em alta dimensionalidade e incorporam o uso de aprendizado de máquinas para a seleção
de covariadas (RIM; PANG; PLATT, 2018) e técnicas LASSO (TIAN; SCHUEMIE; SUCHARD,
2005).
6 Vantagens e limitações do uso de EPs
O escore de propensão permite definir claramente a população de estudo sem impor

restrição quanto ao delineamento no contexto de estudos observacionais. Além disso, outra
vantagem é a possibilidade de se verificar seu desempenho por intermédio do
balanceamento (equilíbrio) das covariáveis (necessário para remoção do confundimento)
entre os grupos após pareamento, estratificação ou ponderação pelo escore de propensão.
É uma estratégia que tem vantagem em relação ao modelo de regressão multivariado, uma
vez que a heterogeneidade do efeito do tratamento pode ser considerada por meio da
definição da população de estudo. A metodologia de escores de propensão pode ser
utilizada em situações que envolvam dados com estrutura de dependência, ou seja, dados
provenientes de pesquisas que possuem estrutura hierárquica com indivíduos agregados

em áreas geográficas, pacientes em hospitais, estudos multicêntricos ou ainda pesquisas
que utilizam o procedimento de amostragem por conglomerado. Nesse caso, a estimação
dos escores de propensão pode levar em consideração os efeitos das variáveis dos
diferentes níveis na probabilidade de atribuição ao tratamento como também no
procedimento de estimação do efeito do tratamento.
De acordo com Leite e colaboradores (LEITE et al., 2015), o efeito do conglomerado sobre
a probabilidade de atribuição ao tratamento pode ser abordado por meio de um modelo
para o escore de propensão em cada conglomerado separadamente e, como
consequência, seria preciso combinar as estimativas e ponderar pelo tamanho de cada
conglomerado. Outra opção para o escore de propensão seria incorporar tanto os efeitos
das variáveis ao nível individual, quanto ao nível do conglomerado, diretamente no modelo
ou por intermédio de um modelo de efeitos aleatórios (ou modelo multinível).
Uma das críticas mais frequentes ao uso de escores de propensão se refere a sua
performance limitada no contexto de confundidores não mensurados (FU et al., 2019) e
pode inclusive apresentar resultados mais viesados que modelos convencionais de
regressão multivariada (BIONDI-ZOCCAI et al., 2011). Em alguns contextos específicos, o
uso de escores de propensão não é recomendado. No caso de intervenções raras, por
exemplo, os dados das variáveis confundidoras observadas e disponíveis para o estudo
podem não ser suficientes para modelar a probabilidade de receber a intervenção e resultar
em prejuízos significativos na validade dos escores estimados. Uma vez que o modelo para
o escore esteja mal especificado, consequentemente o balanceamento esperado das
variáveis de confusão não será atingido (FU et al., 2019). O uso de escores de propensão
também encontra limitações importantes e não é recomendado em contextos de grandes
disparidades entre o grupo de intervenção e controle quanto à prevalência ou incidência do
desfecho de interesse na linha de base. Estudos de simulação indicam maior probabilidade
de erro do tipo 1 em tais cenários, especialmente na performance do pareamento por
escores de propensão (SCHONBERGER; GILBERTSEN; DAI, 2014).
Intervenções não dicotômicas (grupo de tratados X grupo controle), em uma escala

contínua, ordinal ou categórica com mais de dois níveis representam um desafio para o uso
de escores de propensão. No entanto, existem diversos desenvolvimentos metodológicos
disponíveis para dados dessa natureza, como escores de propensão generalizados com
função dose-resposta (NAIMI et al., 2014; MOODIE; STEPHENS, 2012; KLUVE et al., 2012;
AUSTIN, 2018; HIRANO; IMBENS, 2004) e o uso de redes neurais para intervenções em

321
escala contínua (COLLIER; LEITE; KARPYN, 2021); as principais dificuldades para o uso
desses métodos se concentram em respeitar os pressupostos clássicos da regressão
linear, necessários para a estimação dos escores nesses cenários.
7 Conclusões
As técnicas com EP são bastante flexíveis e de aplicação relativamente fácil em

comparação com outras técnicas quase-experimentais e é possível adaptar sua utilização
para dados com diversas estruturas (exemplo: dados hierarquizados, agregados, em
clusters etc).
Havendo a disponibilidade de um conjunto de dados administrativos e/ou de saúde com
covariadas suficientes e de boa qualidade se está em um cenário propício para a aplicação
dos EP e, considerando-se os dados nacionais, são diversas as possibilidades de uso a
partir do acervo de dados do Datasus, Cadastro Único, PNADs, entre outros. São diversos
os exemplos na literatura nacional de estudos que utilizaram EP para avaliar políticas como
o Programa Bolsa Família (RAMOS et al., 2021; PESCARINI et al., 2020; MACHADO et al.,
2022; ANDRADE et al., 2012; OLIOSI et al., 2019), por exemplo. Além disso, esse
procedimento pode ser utilizado de forma isolada ou combinada com o modelo de
diferenças em diferenças para avaliações de políticas públicas.
Em conclusão, os métodos baseados em EP são ferramentas valiosas para se estimar

impacto a partir de dados observacionais de forma prática e transparente, sem se esquecer
de considerar o delineamento epidemiológico gerador dos dados para escolher o modelo
adequado. Seu uso pode ser útil para equilibrar a distribuição das variáveis preditoras entre
os grupos e consequentemente obter uma estimativa não viesada do impacto da
intervenção sobre o desfecho. Por outro lado, vale ressaltar que os estimadores baseados
no escore de propensão não são consistentes para estimativa do efeito da intervenção na
presença de fatores não observáveis que afetam o processo de atribuição ao tratamento.
Como sugestão, a análise de sensibilidade (ROSENBAUM, 2005) pode ser utilizada para
testar a robustez dos resultados na presença de viés devido à omissão de covariável.
Neste capítulo, o foco foi apresentar os fundamentos e também as questões relacionadas

à seleção de covariáveis para o modelo de escore de propensão, escalas das estimativas
do efeito e medidas para avaliação do equilíbrio das covariáveis com o objetivo de

sistematizar e sumarizar a referida metodologia no âmbito de avaliações de políticas de
saúde.
Recursos úteis para análise com EPs
Principais pacotes disponíveis para análise com EP:

No R - Matchit, Matching, twang
No Stata - psmatch2, pscore, kmatch
Páginas utéis:
Professor Bruno Arpino (Universidade de Firenze, Itália)

https://sites.google.com/site/brunoarpino/home?authuser=0 - Contém exemplos de bancos
de dados, rotinas em R e Stata para análises com escores de propensão e materiais
explicativos.
Econometrics Academy https://sites.google.com/site/econometricsacademy/econometrics-

models/propensity-score-matching - Contém rotinas completas em R e Stata, exemplos de
bancos de dados e material explicativo sobre procedimentos de avaliação de impacto via
escores de propensão.

323
Referências
ALI, M. S. et al. Propensity score balance measures in pharmacoepidemiology: a

simulation study. Pharmacoepidemiology Drug Safety, v. 23, n. 8, p. 802-811, Aug.
2014. Disponível em: http://dx.doi.org/10.1002/pds.3574. Acesso em: 18 set. 2022.
ALI, M. S. et al. Propensity score methods in health technology assessment: principles,

extended applications, and recent advances. Frontiers in Pharmacology, v. 10, p. 1-19,
Sep. 2019. Disponível em: http://dx.doi.org/10.3389/fphar.2019.00973. Acesso em: 18 set.
2022.
ALI, M. S.; GROENWOLD, R. H.; KLUNGEL, O. H. Best (but oft-forgotten) practices:

propensity score methods in clinical nutrition research. The American Journal of Clinical
Nutrition, v. 104, n. 2, p. 247-258, Aug. 2016. Disponível em:
http://dx.doi.org/10.3945/ajcn.115.125914. Acesso em: 18 set. 2022.
ANDRADE, M. V. et al. Income transfer policies and the impacts on the immunization of
children: the Bolsa Família Program. Cadernos de Saude Publica, v. 28, n. 7, p. 1347-
1358, jul. 2012. Disponível em: http://dx.doi.org/10.1590/s0102-311x2012000700013.
AUSTIN, P. C. An Introduction to Propensity Score Methods for Reducing the Effects of

Confounding in Observational Studies. Multivariate Behavioral Research, v. 46, n. 3, p.
399-424, 2011. Disponível em: http://dx.doi.org/10.1080/00273171.2011.568786. Acesso
em: 18 set. 2022.
AUSTIN, P. C. Assessing the performance of the generalized propensity score for

estimating the effect of quantitative or continuous exposures on binary outcomes.
Statistics Medicine, v. 37, n. 11, p. 1874-1894, May 2018. Disponível em:
http://dx.doi.org/10.1002/sim.7615. Acesso em: 18 set. 2022.
AUSTIN, P. C. et al. Conditioning on the propensity score can result in biased estimation
of common measures of treatment effect: a Monte Carlo study. Statistics in Medicine, v.
26, n. 4, p. 754-768, Feb. 2007. Disponível em: http://dx.doi.org/10.1002/sim.2618.
AUSTIN, P. C. The performance of different propensity-score methods for estimating

differences in proportions (risk differences or absolute risk reductions) in observational
studies. Statistics in Medicine, v. 29, n. 20, p. 2137-2148, Sep. 2010. Disponível em:
https://onlinelibrary.wiley.com/doi/10.1002/sim.3854. Acesso em: 18 set. 2022.
AUSTIN, P. C.; GROOTENDORST, P.; ANDERSON, G. M. A comparison of the ability of

different propensity score models to balance measured variables between treated and
untreated subjects: a Monte Carlo study. Statistics in Medicine, v. 26, n. 4, p. 734-753,
Feb. 2007. Disponível em: http://dx.doi.org/10.1002/sim.2580. Acesso em: 18 set. 2022.
AUSTIN, P. C.; STUART, E. A. Estimating the effect of treatment on binary outcomes

using full matching on the propensity score. Statistical Methods in Medical Research, v.
26, n. 6, p. 2505-2525, Dec. 2017. Disponível em:
http://dx.doi.org/10.1177/0962280215601134. Acesso em: 18 set. 2022.
AUSTIN, P. C.; STUART, E. A. Moving towards best practice when using inverse
probability of treatment weighting (IPTW) using the propensity score to estimate causal

treatment effects in observational studies. Statistics in Medicine, v. 34, n. 28, p. 3661-
3679, Dec. 2015. Disponível em: http://dx.doi.org/10.1002/sim.6607. Acesso em: 18 set.
2022.
BHATTACHARYA, J.; VOGT, W. B. Do instrumental variables belong in propensity

scores? Cambridge: National Bureau of Economic Research, 2007. (NBER Technical
Working Paper Series). Disponível em: http://www.nber.org/papers/t0343. Acesso em: 18
set. 2022.
BIONDI-ZOCCAI, G. et al. Are propensity scores really superior to standard multivariable

analysis? Contemporary Clinical Trials, v. 32, n. 5, p. 731-740, Sep. 2011. Disponível
em: http://dx.doi.org/10.1016/j.cct.2011.05.006. Acesso em: 18 set. 2022.
BROOKHART, M. A. et al. Variable selection for propensity score models. American

Journal of Epidemiology, v. 163, n. 12, p. 1149-1156, Jun. 2006. Disponível em:
http://dx.doi.org/10.1093/aje/kwj149. Acesso em: 18 set. 2022.
COCHRAN, W. G.; RUBIN, D. B. Controlling bias in observational studies: a review.

Sankhyā. The Indian Journal of Statistics, Series A (1961-2002), v. 35, n. 4, p. 417-446,
1973. Disponível em: http://www.jstor.org/stable/25049893. Acesso em: 18 set. 2022.
COLLIER, Z. K.; LEITE, W. L.; KARPYN, A. Neural networks to estimate generalized

propensity scores for continuous treatment doses. Evaluation Review, n. 3, Mar. 2021.
Disponível em: http://dx.doi.org/10.1177/0193841X21992199. Acesso em: 18 set. 2022.
D’AGOSTINO JÚNIOR, R. B.; D’AGOSTINO, R. B. Estimating treatment effects using

observational data. JAMA, v. 297, n. 3, p. 314-316, Jan. 2007. Disponível em:
http://dx.doi.org/10.1001/jama.297.3.314. Acesso em: 18 set. 2022.
FU, E. L. et al. Merits and caveats of propensity scores to adjust for confounding.
Nephrology Dialysis Transplantation, v. 34, n. 10, p. 1629-1635, Oct. 2019. Disponivel
em: http://dx.doi.org/10.1093/ndt/gfy283. Acesso em: 18 set. 2022.
GERTLER, P. J. et al. Avaliação de impacto na prática. 2. ed. Washington DC: Banco

Internacional para Reconstrução e Desenvolvimento/Banco Mundial, 2018. Disponível em:
https://play.google.com/store/books/details?id=HG5WDwAAQBAJ. Acesso em: 18 set.
2022.
GREENLAND, S.; PEARL, J. Adjustments and their consequences-collapsibility analysis

using graphical models. International Statistical Review, v. 79, n. 3, p. 401-426, Dec.
2011. Disponível em: https://onlinelibrary.wiley.com/doi/10.1111/j.1751-
5823.2011.00158.x. Acesso em: 18 set. 2022.
GUERTIN, J. R. et al. Head to head comparison of the propensity score and the high-
dimensional propensity score matching methods. BMC Medical Research Methodology,
v. 16, p. 1-10, Feb. 2016. Disponível em: http://dx.doi.org/10.1186/s12874-016-0119-1.
HANDOUYAHIA, A.; HADDAD, T.; EATON, F. Kernel matching versus inverse probability
weighting: a comparative study. International Journal of Mathematical and
Computational Sciences, v. 7, n. 8, p. 1218-1233, Aug. 2013. Disponível em:
http://publications.waset.org/16101/kernel-matching-versus-inverse-probability-weighting-
a-comparative-study. Acesso em: 18 set. 2022.

325
HIRANO, K.; IMBENS, G. W. The propensity score with continuous treatments. In:
GELMAN, A.; MENG, X. L. (eds.). Applied bayesian modeling and causal inference
from incomplete-data perspectives. Nova Jersey: John Wiley & Sons, 2004. p. 73-84.
(Wiley Series in Probability and Statistics). Disponivel em:
https://www.math.mcgill.ca/dstephens/PSMMA/Articles/HIrano-Imbens-2004.pdf. Acesso
em: 18 set. 2022.
IMBENS, G. W. Nonparametric estimation of average treatment effects under exogeneity:

A review. The Review of Economics and Statistics, v. 86, n. 1, p. 4-29, 2004. Disponível
em: https://direct.mit.edu/rest/article-abstract/86/1/4/57476. Acesso em: 18 set. 2022.
ISHIMARU, M. Introduction to high-dimensional propensity score analysis. Annals of

Clinical Epidemiology, v. 2, n. 4, p. 85-94, 2020. Disponível em:
http://dx.doi.org/10.37737/ace.2.4_85. Acesso em: 18 set. 2022.
KARIM, M. E.; PANG, M.; PLATT, R. W. Can we train machine learning methods to
outperform the high-dimensional propensity score algorithm? Epidemiology, v. 29, n. 2, p.
191-198, Mar. 2018. Disponível em: http://dx.doi.org/10.1097/EDE.0000000000000787.
KHANDKER, S. R.; KOOLWAL, G. B.; SAMAD, H. A. Handbook on impact evaluation:

quantitative methods and practices. Washington DC: World Bank Publications; 2009. 260
p. Disponível em: https://play.google.com/store/books/details?id=vVOQUUZmNqMC.
KLUVE, J. et al. Evaluating continuous training programmes by using the generalized

propensity score. Journal of the Royal Statistical Society: Series A (Statistics in
Society), v. 175, n. 2, p. 587-617, Apr. 2012. Disponível em:
https://onlinelibrary.wiley.com/doi/10.1111/j.1467-985X.2011.01000.x. Acesso em: 18 set.
2022.
LEE, B. K.; LESSLER, J.; STUART, E. A. Weight trimming and propensity score weighting.
PLoS One, v. 31, n. 6, p. 1-6, 2011. Disponível em:
http://dx.doi.org/10.1371/journal.pone.0018174. Acesso em: 18 set. 2022.
LEITE, W. L. et al. An evaluation of weighting methods based on propensity scores to

reduce selection bias in multilevel observational studies. Multivariate Behavioral
Research, v. 50, n. 3, p. 265-284, 2015. Disponível em:
http://dx.doi.org/10.1080/00273171.2014.991018. Acesso em: 18 set. 2022.
LI, F.; MORGAN, K. L.; ZASLAVSKY, A. M. Balancing covariates via propensity score
weighting. Journal of American Statistical Association, v. 113, n. 521, p. 390-400, Jan.
2018. Disponível em: https://doi.org/10.1080/01621459.2016.1260466. Acesso em: 18
set. 2022.
MACHADO, D. B. et al. Relationship between the Bolsa Família national cash transfer
programme and suicide incidence in Brazil: a quasi-experimental study. PLoS Medicine,
v. 19, n. 5, p. 1 - 17, May 2022. Disponível em:
http://dx.doi.org/10.1371/journal.pmed.1004000. Acesso em: 18 set. 2022.
MOODIE, E. E. M.; STEPHENS, D. A. Estimation of dose-response functions for

longitudinal data using the generalised propensity score. Statistical Methods in Medical
Research, v. 21, n. 2, p. 149-166, Apr. 2012. Disponível em:
http://dx.doi.org/10.1177/0962280209340213. Acesso em: 18 set. 2022.

MYERS, J. A. et al. Effects of adjusting for instrumental variables on bias and precision of
effect estimates. American Journal of Epidemiology, v. 174, n. 11, p. 1213-1222, Dec.
2011. Disponível em: http://dx.doi.org/10.1093/aje/kwr364. Acesso em: 18 set. 2022.
NAIMI, A. I. et al. Constructing inverse probability weights for continuous exposures: a

comparison of methods. Epidemiology, v. 25, n. 2, p. 292-299, Mar. 2014. Disponível em:
http://dx.doi.org/10.1097/EDE.0000000000000053. Acesso em: 18 set. 2022.
OLIOSI, J. G. N. et al. Effect of the Bolsa Familia Programme on the outcome of

tuberculosis treatment: a prospective cohort study. The Lancet Global Health, v. 7, n. 2,
p. e219-e226, Feb. 2019. Disponível em: http://dx.doi.org/10.1016/S2214-109X(18)30478-
9. Acesso em: 18 set. 2022.
PATRICK, A. R. et al. The implications of propensity score variable selection strategies in

pharmacoepidemiology: an empirical illustration. Pharmacoepidemiology Drug Safety, v.
20, n. 6, p. 551-559, Jun. 2011. Disponível em: http://dx.doi.org/10.1002/pds.2098. Acesso
em: 18 set. 2022.

treatment adherence and cure in patients from the nationwide 100 Million Brazilian Cohort:
a quasi-experimental study. Lancet Infectious Diseases, v. 20, n. 5, p. 618-627, May
2020. Disponível em: https://www.thelancet.com/action/showPdf?pii=S1473-
3099%2819%2930624-3. Acesso em: 18 set. 2022.
RAMOS, D. et al. Conditional cash transfer program and child mortality: A cross-sectional
analysis nested within the 100 Million Brazilian Cohort. PLoS Medicine, v. 18, n. 9, p. 1-
20, Sep. 2021. Disponível em: http://dx.doi.org/10.1371/journal.pmed.1003509. Acesso
em: 18 set. 2021.
ROBINS, J. M.; HERNÁN, M. A.; BRUMBACK, B. Marginal structural models and causal
inference in epidemiology. Epidemiology, v. 11, n. 5, p. 550-560, Sep. 2000. Disponível
em: http://dx.doi.org/10.1097/00001648-200009000-00011. Acesso em: 18 set. 2022.
ROBINS, J. M.; MARK, S. D.; NEWEY, W. K. Estimating exposure effects by modelling the
expectation of exposure conditional on confounders. Biometrics, v. 48, n. 2, p. 479-495,
Jun. 1992. Disponível em: https://www.ncbi.nlm.nih.gov/pubmed/1637973. Acesso em: 18
set. 2022.
ROSENBAUM, P. R. Model-based direct adjustment. Journal of the American

Statistical Association, v. 82, n.398, p. 387-394, Jun. 1987. Disponível em:
https://www.tandfonline.com/doi/abs/10.1080/01621459.1987.10478441. Acesso em: 18
set. 2022.
ROSENBAUM, P. R.; RUBIN, D. B. The central role of the propensity score in

observational studies for causal effects. Biometrika, v. 70, n. 1, p. 41-55, 1983. Disponível
em: https://academic.oup.com/biomet/article-abstract/70/1/41/240879. Acesso em: 18 set.
2022.
ROSENBAUM, P. Sensitivity analysis in observational studies. In: EVERITT, B. S.;

HOWELL, D. C. (ed.). Encyclopedia of statistics in behavioral science. Chichester:
John Wiley, 2005. p. 1809-1814. v. 4.

327
RUBIN, D. B. Estimating causal effects of treatments in randomized and nonrandomized
studies. Journal of Educational Psychology, v. 66, n. 5, p. 688-701, Oct. 1974.
Disponível em: https://psycnet.apa.org/fulltext/1975-06502-001.pdf. Acesso em: 18 set.
2022.
RUBIN, D. B. Using multivariate matched sampling and regression adjustment to control

bias in observational studies. In: RUBIN, D. B. Matched sampling for causal effects.
Cambridge: Cambridge University Press, 2012. p. 142–59. Disponível em:
http://dx.doi.org/10.1017/cbo9780511810725.013. Acesso em: 18 set. 2022.
RUBIN, D. B.; THOMAS, N. Matching using estimated propensity scores: relating theory to
practice. Biometrics, v. 52, n. 1, p. 249-264, Mar. 1996. Disponível em:
https://www.ncbi.nlm.nih.gov/pubmed/8934595. Acesso em: 18 set. 2022.
SCHNEEWEISS, S. et al. Variiable selection for confounding adjustment in high-

dimensional covariate spaces when analyzing healthcare databases. Epidemiology, v.
28, n. 2, p. 237-248, Mar. 2017. Disponível em:
http://dx.doi.org/10.1097/EDE.0000000000000581. Acesso em: 18 set. 2022.
SCHONBERGER, R. B.; GILBERTSEN, T.; DAI, F. The problem of controlling for

imperfectly measured confounders on dissimilar populations: a database simulation study.
Journal of Cardiothoracic and Vascular Anesthesia, v. 28, n. 2, p. 247-254, Apr. 2014.
Disponivel em: http://dx.doi.org/10.1053/j.jvca.2013.03.014. Acesso em: 18 set. 2022.
SETOGUCHI, S. et al. Evaluating uses of data mining techniques in propensity score

estimation: a simulation study. Pharmacoepidemiology Drug Safety, v. 17, n. 6, p. 546-
555, Jun. 2008. Disponível em: http://dx.doi.org/10.1002/pds.1555. Acesso em: 18 set.
2022.
SHORTREED, S. M.; ERTEFAIE, A. Outcome-adaptive lasso: variable selection for causal

inference. Biometrics, v. 73, n. 4, p. 1111-1122, Dec. 2017. Disponivel em:
https://onlinelibrary.wiley.com/doi/10.1111/biom.12679. Acesso em: 18 set. 2022.
SPREEUWENBERG, M. D. et al. The multiple propensity score as control for bias in the
comparison of more than two treatment arms: an introduction from a case study in mental
health. Medical Care, v. 48, n. 2, p. 166-174, Feb. 2010. Disponivel em:
http://dx.doi.org/10.1097/MLR.0b013e3181c1328f. Acesso em: 18 set. 2022.
STUART, E. A. Matching methods for causal inference: a review and a look forward.
Statistical Science, v. 25, n. 1, p. 1-21 . 2010. Disponível em:
http://dx.doi.org/10.1214/09-sts313. Acesso em: 18 set. 2022.
TIAN, Y.; SCHUEMIE, M. J.; SUCHARD, M. A. Evaluating large-scale propensity score

performance through real-world and synthetic data experiments. International Journal of
Epidemiology, v. 47, n. 6, p. 2005-2014, Dec. 2018. Disponível em:
http://dx.doi.org/10.1093/ije/dyy120. Acesso em: 18 set. 2022.

Capítulo 12
O método diferenças-em-diferenças
Bladimir Carrillo Bermudez1

Danyelle Santos Branco2
1
Escola de Economia de São Paulo, FGV-SP, e licenciado do PIMES-UFPE
Escola de Economia de São Paulo, FGV-SP, e licenciada da UFPE
2
RESUMO:
O objetivo deste capítulo é fornecer um guia prático do uso do método de diferenças-em-diferenças
na avaliação de políticas públicas em saúde. O público-alvo são gestores interessados em avaliar
o desempenho de dada política pública ou programa usando informação antes, durante e após a
sua implementação. A principal mensagem é ser possível avaliar políticas públicas utilizando-se
dados observacionais quando existe um grupo de tratamento e controle bem definidos e quando
existe informação antes e depois da implementação do programa. A orientação chave é levar
particularmente em consideração a importância das condições sob as quais os resultados obtidos
poderiam ser válidos e quando não.
PALAVRAS-CHAVE:
Diferenças-em-diferenças. Políticas públicas. Avaliação de impacto.

329
1 Introdução
Como discutido anteriormente, os experimentos aleatórios podem ser custosos, não serem
fatíveis devido a questões éticas e geralmente focam nos impactos de curto prazo. De fato,
existem questões difíceis de responder usando-se um experimento aleatorizado sem
enfrentar questões morais. Por exemplo, se um pesquisador tivesse interesse em avaliar
os efeitos da poluição do ar durante a gravidez sobre a saúde dos bebês ao nascerem, teria
que aleatoriamente expor algumas mães a um ambiente poluído.
Contudo, esses tipos de questões podem ser estudados no contexto de experimentos

naturais ou quase-experimentais, o qual aproxima tanto quanto possível o experimento
ideal. Neste capítulo, será vista uma das ferramentas quase-experimentais mais
amplamente usadas para avaliar algumas teorias econômicas ou sociais, mas para avaliar
políticas públicas com um grupo de tratamento bem definido. O modelo de diferenças-em-
diferenças é popular em análise de quase-experimentos porque permite identificar efeitos
causais ainda se os grupos de tratamento e controle diferirem em dimensões relevantes
antes da intervenção em si. Ou seja, o modelo pode recuperar o parâmetro de interesse
ainda se a alocação ao tratamento é determinada endogenamente. Abaixo, serão
discutidas detalhadamente as condições sob as quais isso é possível e como se avaliar, na
prática, a plausibilidade dessa condição com os dados disponíveis.
Na parte final deste capítulo, será aplicado o método de diferenças-em-diferenças ao

relativamente recente Programa Mais Médicos (PMM), o qual gerou ricas discussões na
esfera acadêmica e política sobre a sua eficácia.
2 O modelo diferenças-em-diferenças
Em experimentos naturais, o processo que cause a alocação de dado tratamento não é

perfeitamente aleatório. Portanto, é provável que existam diferenças entre os grupos de
tratamento e controle em dimensões que poderiam afetar a variável dependente de
interesse ou outcome. Por isso, é importante levar em consideração essas diferenças
preexistentes quando se estimar o efeito do tratamento. O motivo é que a diferença na
variável dependente de interesse entre os grupos de tratamento e controle após a
implementação da política poderia estar capturando em parte diferenças nas condições
iniciais. Por exemplo, considere-se um programa que constrói unidades básicas de saúde
em diferentes municípios. Se os municípios mais organizados, com maiores investimentos

em saúde de forma geral, são mais propensos a aderir a esses programas, então, qualquer
diferença futura em indicadores de saúde entre municípios tratados e não tratados vai
capturar não apenas o efeito do programa, mas também as diferenças iniciais no
investimento em saúde. O modelo de diferenças-em-diferenças é uma forma de controlar
por essas diferenças iniciais.
O modelo diferenças-em-diferenças é simplesmente a mudança esperada na variável de

interesse Y entre o período antes e depois do tratamento no grupo de tratamento, menos a
mesma mudança esperada no grupo de controle. Esse estimador requer dados em painéis
da unidade que está sendo tratada. Por exemplo, se a unidade tratada é município, então
seria preciso observações para cada município tratado e controle para diferentes momentos
no tempo. Por exemplo, considere-se um programa que promove práticas saudáveis
durante a gravidez em alguns municípios, mas não em outros, com o objetivo de melhorar
o peso dos bebês ao nascerem. Embora os dados de peso ao nascer sejam medidos de
forma individual e para um momento dado no tempo, seria possível gerar um painel de
municípios com informações do peso ao nascer médio em cada ano. O modelo recuperaria
o parâmetro de interesse ainda nesse caso e esse parâmetro é idêntico àquele que se
obteria caso a pesquisadora usasse os dados de forma individual. A linha de fundo é que a
estrutura painel deve ser com referência à unidade em que o tratamento é alocado
(pessoas, município, estado etc.). Isso é uma grande vantagem porque muitas vezes
existem dados disponíveis de uma forma mais agregada. A Tabela 1 descreve o modelo
básico de forma simples:
Tabela 1 - Modelo básico simplificado

Tratamento Controle
𝑡𝑡 = 1 (período base) 𝑌𝑌! |𝐷𝐷 = 1 𝑌𝑌! |𝐷𝐷 = 0
𝑡𝑡 = 2 (período de seguimento) 𝑌𝑌" |𝐷𝐷 = 1 𝑌𝑌" |𝐷𝐷 = 0
Onde 𝑡𝑡 = 1 é o período antes da implementação da política, enquanto 𝑡𝑡 = 2 representa o período após a

introdução da política. O subíndice de 𝑌𝑌 indica o período da variável dependente de interesse. Por último, o
termo |𝐷𝐷 indica se a unidade pertence ao grupo de tratamento ou controle.
O estimador de diferenças-em-diferenças seria dado por:

𝛽𝛽#$%% = [𝔼𝔼(𝑌𝑌" |𝐷𝐷 = 1) − 𝔼𝔼(𝑌𝑌! |𝐷𝐷 = 1)] − [𝔼𝔼(𝑌𝑌" |𝐷𝐷 = 0) − 𝔼𝔼(𝑌𝑌! |𝐷𝐷 = 0)] (1)

331
É possível aproximar a expressão teórica acima substituindo-se as esperanças
condicionais acima pelas médias amostrais para os grupos de tratamento e controle antes
e depois da implementação da política ou programa. Por exemplo, seria possível estimar
𝔼𝔼(𝑌𝑌" |𝐷𝐷 = 1) como a média amostral do 𝑌𝑌 no grupo de tratamento no período após a
intervenção.
Note-se que a primeira parte do lado direito da equação (1) é a mudança de 𝑌𝑌 entre o
período 1 e 2 no grupo de tratamento. A segunda parte do lado direito representa a análoga
mudança para o grupo de controle. Portanto, o estimador de diferenças-em-diferenças são
diferenças entre essas mudanças no 𝑌𝑌 entre ambos os grupos.
Para resumir, o modelo básico de diferenças-em-diferenças pode ser aplicado nos

seguintes passos.
I. Calcular as médias amostrais do 𝑌𝑌 para tratados e controles antes e depois da
intervenção;
II. Calcular a mudança no 𝑌𝑌 entre o período inicial e final para tratados e controles
separadamente;
III. Calcular a diferença nas mudanças calculadas no passo 2 entre tratados e
controles.
Como um exemplo, considere-se o PMM, o qual alocou médicos de atenção primária em

municípios considerados prioritários em 2013. O objetivo do programa era melhorar o
acesso a serviços básicos de saúde pela população. A Figura 1 mostra a evolução no
número de médicos em unidades básicas de saúde por 100 mil habitantes em municípios
tratados e não tratados. A linha tracejada representa a evolução do grupo tratado
assumindo-se que esse teria seguido a mesma trajetória do grupo de controle na ausência
do PMM.
Antes da implementação do PMM, a taxa de médicos era 0.19 no grupo tratado e 0.27 no
grupo de tratamento, uma diferença de 30% em contraposição aos municípios tratados. No
período após a intervenção, a taxa de médicos passou a 0.30 tanto nos municípios tratados
quanto nos de controle, o que implica aumento de 0.11 e 0.03 em ambos os grupos
respetivamente. O aumento de 0.11 no grupo de tratados pode refletir o efeito do PMM,
mas também outros fatores que levaram ao aumento no número de médicos de forma geral.
Calculando a diferença da diferença, pode-se eliminar o aumento devido a outros fatores
sob o pressuposto de que esses afetam ambos os grupos similarmente, pressuposto esse

que também permite eliminar as diferenças iniciais no Y. O estimador de diferenças-em-
diferenças é, portanto, 0.08 aproximadamente.
Figura 1 - Estimador diferenças-em-diferenças do PMM
Fonte: cálculos próprios usando dados do Datasus.
3 Condição de identificação
Como mostrado até aqui, o estimador de diferenças-em-diferenças é intuitivo e

extremamente simples de calcular. Contudo, esse simples cálculo não necessariamente
implica que se está recuperando o parâmetro de interesse. A questão importante, portanto,
é: sob quais condições pode-se interpretar diferenças-em-diferenças como o efeito da
política ou programa sobre Y? A condição chave de identificação pode ser resumida como
a seguir:
Pressuposto 1. O estimador de diferenças-em-diferenças capture o efeito causal de

um programa ou política sobre dada variável de interesse se na ausência da
intervenção tanto o grupo de tratamento quanto o de controle teriam seguido
tendências similares na variável dependente de interesse.
Observe-se que esse pressuposto não implica que os grupos de tratados e controles sejam
similares em condições iniciais. O modelo precisa simplesmente que se tais diferenças
iniciais existem, essas permaneçam constantes ao longo do tempo. No exemplo do PMM,
observou-se que a taxa de médicos em UBS era mais baixa nos municípios tratados, uma

333
diferença de 0.08 médicos por 100 mil habitantes. O pressuposto 1 assume que na
ausência do PMM, a diferença no grupo de tratados e controles teria continuado a ser
aproximadamente 0.08. Obviamente é impossível saber o que teria acontecido com os
municípios tratados caso o PMM não tivesse sido implementado porque esse mundo
contrafactual não é observável. Portanto, o simples cálculo do estimador de diferenças-em-
diferenças por si só não revela se concretamente se está estimando o efeito causal de um
programa ou política. O pressuposto 1 pode ser facilmente violado em várias circunstâncias:
I) Grupos tratados podem ter diferenças preexistentes nas suas trajetórias. Por
exemplo, a taxa de médicos poderia ter aumentado de forma diferente em
municípios tratados antes do PMM devido a outros fatores.
II) Outro determinante do Y poderia mudar somente no grupo tratado no período pós-
tratamento. Por exemplo, as prefeituras poderiam ter decidido aumentar os
incentivos para atrair médicos qualificados nas áreas tratadas. Isso poderia causar
aumento na oferta de médicos ainda na ausência do PMM.
Se o pressuposto de tendências paralelas não pode ser testado empiricamente, então o

que se pode fazer e, mais geralmente, qual o ponto dos modelos diferenças-em-diferenças?
É impossível testar a condição identificação, mas pode-se, sim, testar a plausibilidade
desse pressuposto. Isso envolve ter conhecimento dos eventos mais importantes ao longo
do tempo, os quais poderiam ter afetado o Y e mudado de forma diferente no grupo de
tratamento. Isso também envolve ter dados mais históricos sobre Y e examinar como era a
sua trajetória antes da intervenção de interesse. Depois de introduzir a equivalência com o
modelo de regressão voltar-se-á a essa discussão.
4 A equivalência com regressão
O estimador de diferenças-em-diferenças (1) também pode ser obtido com base na análise
de regressão. Seja Post uma variável a indicar o período pós-intervenção e ε um erro
aleatório idiossincrático, então, o parâmetro de interesse pode ser obtido como a seguir:
𝑌𝑌$& = 𝛼𝛼' + 𝛼𝛼! 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃& + 𝛼𝛼" 𝐷𝐷$ + 𝛽𝛽#$%% 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃& 𝑥𝑥 𝐷𝐷$ + 𝜀𝜀$& (2)
O subscrito i indicam a unidade de análise (por exemplo pessoas, municípios), enquanto o

subscrito t representa o tempo (por exemplo ano, mês). O coeficiente sobre o termo de
interação 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃& 𝑥𝑥 𝐷𝐷$ é o parâmetro de diferenças-em-diferenças. O modelo (2) pode ser
estimado pelo método de Mínimos Quadrados Ordinários (MQO). Sob o pressuposto 1, o

estimador MQO de 𝛽𝛽#$%% pode ser interpretado como o efeito causal do programa ou
intervenção objeto de estudo.
Variáveis de controles. O modelo de diferenças-em-diferenças pode ser estendido para

incluir outras variáveis explanatórias, particularmente aquelas que medem as
características das unidades antes da intervenção e que por conseguinte não podem ser
afetadas pelo tratamento. Se algumas dessas variáveis afetam a variável Y de interesse,
essas são parte do termo de erro na equação (2). Portanto, o modelo pode ser modificado
para incorporar o vetor 𝑍𝑍 de variáveis explanatórias. Se existem diferenças em
características observáveis antes do tratamento, o vetor Z deve incorporar tais variáveis
interagidas com variáveis indicadores de tempo. Se existem diferenças nas tendências de
𝑌𝑌$& relacionadas a características iniciais, é importante incluir essas variáveis interagidas
com variáveis indicadores de tempo para reduzir o risco de que o pressuposto de
identificação seja violado.
Além da necessidade de controlar por diferenças em tendências relacionadas a condições

iniciais, outro motivo para incluir variáveis explanatórias exógenas no modelo de diferenças-
em-diferenças é melhorar a precisão do estimador. Se uma variável é um importante
determinante do Y, incorporar essa variável ao modelo reduzirá a variância de 𝜀𝜀$& . Como a
variância do estimador de 𝛽𝛽#$%% é proporcional à variância do termo erro, o erro padrão do
estimador será significativamente mais baixo.
É importante notar também que o pressuposto de identificação pode depender da forma

funcional. Por exemplo, é possível que o pressuposto seja satisfeito quando a variável
dependente é medida em níveis, mas não em logaritmos e vice-versa. Nesses casos, a
pesquisadora deve argumentar, baseada em teoria, qual forma funcional é a mais
adequada e justificar a escolha final.
Regressão generalizada. Em alguns casos, a base de dados contém vários períodos antes
e depois do tratamento. Por exemplo, depois de iniciar o PMM, é possível monitorar a
evolução da oferta de médicos todos os anos após o tratamento porque o ministério de
saúde está sempre a coletar esses dados. Desse modo, é possível avaliar os efeitos de
longo prazo do programa usando-se esses dados.
Mais geralmente, o modelo de diferenças-em-diferenças pode ser estimado usando-se o

modelo de regressão de efeitos fixos e pode ser descrito como a seguir:

335
𝑌𝑌$& = 𝛼𝛼' + 𝜇𝜇& + 𝜃𝜃$ + 𝛽𝛽#$%% 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃& 𝑥𝑥 𝐷𝐷$ + 𝜀𝜀$& (4)
Onde os termos 𝜇𝜇& e 𝜃𝜃$ representam efeitos fixos de tempo e unidade. Esse modelo pode
ser estimado por MQO em que se incluem variáveis indicadoras para cada unidade de
seção cruzada e para cada unidade temporal. Nesse caso, é importante omitir um grupo de
referência para evitar problemas de colinearidade. A inclusão de efeitos fixos de indivíduos
controla de forma flexível por características que diferem por indivíduos, mas que não
mudam ao longo do tempo. Por sua vez, os efeitos fixos de tempo capturam qualquer
choque que afete todos os indivíduos de forma semelhante, tais como condições
macroeconômicas ou reformas nacionais de saúde.
5 Avaliando a plausibilidade do pressuposto de identificação
Como mencionado na seção 3, o pressuposto de identificação não pode ser testado

explicitamente porque o resultado contrafactual não é observável. Contudo, pode-se
implementar testes que indiretamente avaliam a plausibilidade do pressuposto.
Pré-tendências. Se ambos os grupos apresentarem tendências semelhantes e começarem

a divergir logo depois de o programa ser implementado, isso forneceria forte evidência em
favor do pressuposto de identificação.
Para implementar esse teste de maneira formal, é necessário modificar o modelo (3) da
seguinte forma:
𝑌𝑌$& = 𝛼𝛼' + 𝜇𝜇& + 𝜃𝜃$ + < 𝛽𝛽( 1[𝑡𝑡 = 𝑘𝑘]𝑥𝑥 𝐷𝐷$ + 𝜀𝜀$& (5)
Aqui os parâmetros 𝛽𝛽( estimadores de diferenças-em-diferenças para cada período,

incluindo-se tanto o período pré- e pós-intervenção. Esses estimadores usam como
referência um período pré-tratamento, tipicamente o período anterior à implementação da
política. Isso seria uma generalização da Figura 1. No exemplo do PMM, Carrillo e Feres
(2019) avaliam os efeitos do programa, usam dados bimensais e utilizam como referência
o bimestre anterior à implementação do programa, com 𝑡𝑡 normalizado, de modo que 𝑡𝑡 = 0
denota o bimestre em que o PMM foi implementado. Assim, por exemplo, o coeficiente 𝛽𝛽*"
é estimador de diferenças-em-diferenças que compara a evolução do Y no tratamento e

controle entre os bimestres -2 e -1. Similarmente, o coeficiente 𝛽𝛽+ representa a diferença
na mudança do Y entre tratado e controle dos bimestres -1 a 2.
Se o pressuposto de identificação é válido, esperaria-se que os coeficientes 𝛽𝛽( para o

período pré-tratamento sejam próximos de zero e estatisticamente insignificantes.
Coeficientes significativos implicariam que o grupo de tratamento estaria experimentando
uma trajetória diferente mesmo antes da implementação do programa e essa trajetória
diferencial provavelmente teria continuado na ausência do programa. Isso implica que
improvavelmente o pressuposto de identificação 1 seria válido.
Olhar as tendências pré-tratamento fornecem a forma mais atrativa e direta de julgar o

quanto plausível é que o pressuposto de tendências paralelas seja satisfeito. Uma
implicação imediata é: quanto mais observações se tem do período pré-tratamento, mais
forte e crível é o teste. Imagine-se que uma pesquisadora examine mês a mês a trajetória
de Y durante 50 anos antes do programa analisado e encontre que os grupos de tratado e
controle seguem as mesmas tendências durante todo esse tempo e comecem a divergir
logo após o programa. Nesse caso, é muito provável que essa divergência na trajetória
tenha sido ocasionada pelo programa e não por um fator inobservável. Seria muita
coincidência que um fator não observado aparecesse exatamente no mês em que o
programa foi implementado e não nos 50 anos precedentes à política. Nunca se saberá ao
certo se o pressuposto é de fato satisfeito, mas se inclinaria a acreditar que nesse caso
esse é provavelmente satisfeito.
Choques coincidentes. Embora olhar as tendências antes do tratamento forneça

evidência importante sobre a plausibilidade do pressuposto de identificação, há casos em
que isso não será suficiente. Isso é particularmente certo em casos em que a pesquisadora
pode somente olhar para um período relativamente curto de pré-intervenção. Ainda que os
grupos de tratados e controles exibam tendências similares no período pré-tratamento, o
pressuposto poderia ainda ser violado se houver mudanças no grupo de tratado ou de
controle que coincidam com a adoção do programa. Por exemplo, o governo federal poderia
ter alocado não somente o PMM para os municípios tratados, mas poderia também ter
realizado outros investimentos que poderiam atrair mais médicos e melhorar o uso de
serviços médicos ainda na ausência do PMM.
De forma geral, a pesquisadora deveria atentar para fatores que poderiam ter mudado
juntamente com o programa em questão e ver se houve diferenças significativas nessa

337
dimensão. No caso do PMM, o pesquisador poderia estimar o modelo (3) usando como
variável dependente medidas de infraestrutura, tais como número de UBSs, hospitais ou
médicos trabalhando em unidades de emergência. Nenhuma dessas dimensões foram
objetivos do PMM. Portanto, estimativas significativas de 𝛽𝛽#$%% quando esses fatores são
variáveis dependentes sugeririam que houve outras mudanças as quais coincidiram com o
PMM e que afetaram as áreas tratadas de forma diferente. Nesse caso, o pressuposto de
identificação é improvável de ser satisfeito. Note-se que controlar via esses fatores não
necessariamente resolveria o problema porque poderiam existir mudanças em outras
dimensões que não são observadas pela pesquisadora.
6 Aplicação ao Programa Mais Médicos
Para esse exemplo, usamos os dados extraídos diretamente do artigo publicado por Carrillo
e Feres (2019). O PMM foi implementado em setembro de 2013 em municípios
considerados prioritários. Os objetivos do programa são amplos. Para simplificar, o foco
será em estimar seus efeitos sobre a oferta de médicos. Como o tratamento varia em nível
municipal, o modelo será estimado usando-se um painel de dados municipais. Como os
efeitos sobre a oferta de médicos não deveriam levar muito tempo para aparecer, a unidade
de tempo empregada foi o bimestre, focalizando-se nos 20 bimestres anteriores e
posteriores ao programa. O bimestre em que o programa é adotado é normalizado a zero,
de modo que a variável tempo toma os valores 𝑡𝑡 = −20, −19, . . .0, 1, 2, . . .20.
Ao se observarem as estatísticas descritivas, percebe-se que existiam diferenças entre

tratados e controles antes do programa. Além da diferença na oferta de médicos, municípios
tratados apresentam menor renda per capita, maior taxa de analfabetismo e maior
desigualdade de renda. Tais diferenças são significativas e de considerável magnitude em
alguns casos. Por exemplo, a diferença na renda per capita é de aproximadamente 12%
em favor dos municípios no grupo de controle. Essas diferenças confirmam que as áreas
prioritárias não foram escolhidas aleatoriamente. Se as diferenças em fatores observados
e não observados entre municípios tratados e não tratados permanecem constantes ao
longo do tempo, o modelo diferenças-em-diferenças conseguiria identificar o efeito causal
do PMM sobre as variáveis de interesse.

. ttest log_renda_cpta, by(Treatment)
Two-sample t test with equal variances
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
0 1,497 1.491501 .018014 .6969799 1.456165 1.526836

1 4,067 1.364745 .0108699 .6932079 1.343434 1.386056
combined 5,564 1.398848 .0093366 .6964347 1.380545 1.417152
diff .1267558 .0209868 .0856136 .1678981
diff = mean(0) - mean(1) t = 6.0398

Ho: diff = 0 degrees of freedom = 5562
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000
. ttest analfabetismo_taxa, by(Treatment)
0 1,498 15.11469 .2453418 9.495712 14.63344 15.59594

1 4,067 16.07261 .1541753 9.832224 15.77034 16.37488
combined 5,565 15.81475 .130715 9.751199 15.5585 16.07101
diff -.9579226 .2944584 -1.535176 -.3806691
diff = mean(0) - mean(1) t = -3.2532


Pr(T < t) = 0.0006 Pr(|T| > |t|) = 0.0011 Pr(T > t) = 0.9994
. ttest gini2010 , by(Treatment)
0 1,498 .4837218 .0016957 .0656287 .4803956 .4870479

1 4,067 .5101749 .0010217 .065156 .5081718 .512178
combined 5,565 .5030542 .0008891 .0663239 .5013112 .5047971
diff -.0264531 .0019731 -.0303211 -.0225851
diff = mean(0) - mean(1) t = -13.4071


Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000
Estimou-se o modelo (4) com adicionais variáveis explanatórias para as nossas variáveis
dependentes de interesse. As variáveis explanatórias são interações entre variáveis
demográficas medidas em 2010 interagidas com a tendência linear de tempo. Essas
variáveis incluem: taxa de médicos, renda per capita, logaritmo da população, taxa de
analfabetismo, taxa da população indígena, índice de Gini, taxa de desemprego, taxa da
população urbana, área total do município, altitude, distância da capital do estado, uma

339
variável indicadora para semiárido, uma variável indicadora para Amazônia legal e as
médias históricas de temperatura e precipitação.
Iniciou-se com um modelo que não incluiu nenhuma dessas variáveis, mas somente os
efeitos fixos de tempo e município. O coeficiente estimado é idêntico àquela diferença-em-
diferença bruta implicada pela Figura 1. O PMM está associado a um aumento de 0.08
médicos por 100 mil residentes, um efeito estimado com muita precisão e altamente
significante em pelo menos 5%.
. reghdfe physician_BHU_cpta c.Post#c.Treatment, a(date codigo ) cluster(codigo)

(converged in 3 iterations)
HDFE Linear regression Number of obs = 213,603

Absorbing 2 HDFE groups F( 1, 5476) = 225.35
Statistics robust to heteroskedasticity Prob > F = 0.0000
R-squared = 0.7315
Adj R-squared = 0.7244
Within R-sq. = 0.0164
Number of clusters (codigo) = 5,477 Root MSE = 0.1483
(Std. Err. adjusted for 5,477 clusters in codigo)
Robust
physician_BHU_cpta Coef. Std. Err. t P>|t| [95% Conf. Interval]
c.Post#c.Treatment .0854798 .0056942 15.01 0.000 .0743169 .0966427
Neste ponto, o controle se deu pela interação entre uma tendência linear e as
características iniciais dos municípios. Se as diferenças entre municípios tratados e não
tratados não estão associadas a diferenças em tendências na oferta de médicos, a inclusão
desses controles não deveria alterar significativamente o coeficiente de interesse. Quando
se incluem esses controles, o coeficiente de interesse de fato é maior, sugerindo que se
existe qualquer viés devido a diferenças iniciais essas não são responsáveis pelos
resultados obtidos.

. reghdfe physician_BHU_cpta c.date#c.(${basic}) c.Post#c.Treatment, a(date codigo ) clu
> ster(codigo)
(converged in 3 iterations)
HDFE Linear regression Number of obs = 206,856

Absorbing 2 HDFE groups F( 15, 5303) = 31.85
Statistics robust to heteroskedasticity Prob > F = 0.0000
R-squared = 0.7391
Adj R-squared = 0.7322
Within R-sq. = 0.0352
Number of clusters (codigo) = 5,304 Root MSE = 0.1442
(Std. Err. adjusted for 5,304 clusters in codigo)
Robust
physician_BHU_cpta Coef. Std. Err. t P>|t| [95% Conf. Interval]
c.date#c.GDP_cpta .0001051 .0002645 0.40 0.691 -.0004134 .0006235
c.date#
c.lnPopulation2010 -.001513 .0001447 -10.46 0.000 -.0017966 -.0012293
c.date#
c.Iliteracy_rate2010 -.0000402 .000019 -2.12 0.034 -.0000773 -3.01e-06
c.date#
c.indigenous_share2010 .0000221 .0000196 1.12 0.261 -.0000164 .0000605
c.date#c.gini2010 -.001339 .0024789 -0.54 0.589 -.0061987 .0035206
c.date#
c.unemployment_rate2010 -.0000542 .0000309 -1.75 0.079 -.0001148 6.36e-06
c.date#
c.
rural_population_s~2010 2.43e-06 6.98e-06 0.35 0.728 -.0000113 .0000161
c.date#
c.municipality_area 7.55e-09 1.06e-08 0.71 0.476 -1.32e-08 2.83e-08
c.date#c.altitude_100 .0000572 .0000487 1.17 0.240 -.0000383 .0001526
c.date#
c.distance_to_capital 8.54e-07 6.70e-07 1.28 0.202 -4.58e-07 2.17e-06
c.date#c.temperature .0001936 .0000674 2.87 0.004 .0000614 .0003257
c.date#c.rainfall .0001445 .0005129 0.28 0.778 -.000861 .0011501
c.date#c.amazonia_legal -.0009653 .0003752 -2.57 0.010 -.0017008 -.0002298
c.date#c.semiarido -.0004872 .0003628 -1.34 0.179 -.0011986 .0002241
c.Post#c.Treatment .1100497 .0058661 18.76 0.000 .0985498 .1215497
Pode-se interpretar os resultados acima de forma causal? Para responder a essa questão
precisamos avaliar a plausibilidade do pressuposto de identificação (1). Para isso,
estimamos o modelo flexível (5), o qual basicamente estima o modelos diferenças-em-
diferenças para cada bimestre antes e depois do programa. A Figura 2 mostra esses
resultados. Como se pode observar, a taxa de médicos em UBS começa a aumentar
somente depois que o programa é implementado e não antes. Os coeficientes para o
período pré-tratamento são muito próximos de zero e geralmente estatisticamente
insignificantes e, o mais importante, nenhuma clara tendência apresentam. Dada a alta

341
frequência dos dados, esses resultados fornecem forte evidência de que na ausência do
PMM áreas tratadas e não tratadas provavelmente teriam experimentado as mesmas
tendências.
Figura 2 - Estimação do efeito do PMM sobre médicos em UBS por 100 mil residentes
Fonte: cálculos próprios dos autores.
7 Conclusão
O método de diferenças-em-diferenças é particularmente útil na avaliação de políticas
públicas, dado que muitas dessas políticas não são alocadas de forma aleatória e o modelo
não requer que indivíduos tratados e não tratados sejam similares. Para isso, os
pesquisadores deveriam ter informações sobre as variáveis dependentes de interesse
vários períodos antes e depois da intervenção. Metodologicamente é relativamente simples
implementar esse método. Embora o pressuposto chave de identificação não possa ser
testado formalmente, é ainda possível avaliar a sua plausibilidade usando-se dados durante
o período pré-tratamento.
Neste capítulo, o foco foi o programa Mais Médicos, mas existem muitos programas que
podem ser diretamente avaliados pelo método de diferenças-em-diferenças. Outros
exemplos incluem os programas Saúde da Família, Farmácia Popular e os Centros de
Atenção Psicossocial (CAPS), entre outros. Alguns desses têm sido avaliados
rigorosamente, mas certamente algumas lacunas ainda existem e precisam ser
preenchidas para informar o desenho de política de saúde pública no Brasil.

Referências
CARRILLO, B.; FERES, J. Provider supply, utilization, and infant health: evidence from a
physician distribution policy. American Economic Journal: Economic Policy, v. 11, n. 3,
p. 156-196, 2019. Disponível em: https://www.aeaweb.org/articles?id=10.1257/pol.201706
19. Acesso em: 19 set. 2022.

343
Capítulo 13
Regressão descontínua e aplicações

na área de saúde
Breno Sampaio1
Giuseppe Trevisan1
1
Universidade Federal de Pernambuco, Grupo de Avaliação de Políticas Públicas e Econômicas - Gappe
RESUMO:
Este capítulo tem por objetivo apresentar o método de regressão descontínua a pesquisadores
e formuladores de políticas interessados em avaliar políticas públicas na área da saúde. Além de
fornecer explicação intuitiva acerca do funcionamento do método, oferece-se um guia prático para
sua implementação e discutem-se formas de testar a validade de suas hipóteses e a robustez dos
resultados obtidos quando se avalia uma intervenção. Por fim, apresentam-se os mais recentes e
relevantes avanços metodológicos acerca da técnica e exploram-se aplicações na área de saúde.
PALAVRAS-CHAVE:
Regressão descontínua. Avaliação de políticas públicas. Guia prático.

1 Introdução
A impossibilidade de realizar experimentos aleatorizados para responder a diversas

perguntas na área da saúde, que se dá principalmente por questões éticas, exige que o
avaliador seja perspicaz na identificação de quase-experimentos ocasionados por
intervenções públicas para estimação de efeitos de interesse. Diversas formas de variações
podem ser exploradas para estimar efeitos causais, a exemplo do modelo de diferença-em-
diferenças apresentado no capítulo anterior. Bastante popular e de fácil aplicação, a
estimação de efeitos causais via modelos de diferença-em-diferenças requer a existência
de condições institucionais adequadas para sua implementação, as quais muitas vezes não
são atendidas. Isso pode decorrer, por exemplo, da falta de dados longitudinais ou mesmo
da não existência de variação entre grupos em momentos heterogêneos. Há outras
oportunas situações, no entanto, em que uma intervenção gera um experimento natural e
proporciona variação suficiente para estimação de efeitos de tratamento. Este capítulo
pretende, ao introduzir o método de inferência causal de regressão descontínua (RDD ou
RD), proporcionar ao avaliador meios práticos para perceber situações em que essa técnica
pode ser empregada. Aborda-se de maneira intuitiva a operacionalização do método e as
formas de testar tanto a validade do desenho quanto a robustez dos resultados. Ao final,
discutem-se várias aplicações do modelo de RD no contexto de saúde, bem como se
introduzem evoluções metodológicas do método.
O desenho de regressão descontínua é um método de inferência causal que vem ganhando

bastante popularidade no âmbito da avaliação de políticas públicas. Curiosamente, a
técnica foi utilizada na década de 1960 por psicólogos da área de educação interessados
em estimar o efeito de um prêmio por mérito na performance futura de estudantes
universitários (THISTLETHWAITE; CAMPBELL, 1960); foi “redescoberto” apenas há 25
anos aproximadamente. De maneira intuitiva, o método explora mudanças abruptas na
chance de receber determinado tratamento, que se dá a partir de valor específico de um
índice quantitativo, variação tal comumente provocada por uma regra institucional bem
definida. Por exemplo, pacientes cuja determinada taxa está acima de certo valor podem
ser expostos a tratamento, enquanto aqueles cuja taxa ficou abaixo não recebem qualquer
tipo de intervenção. Consequentemente aqueles indivíduos que estão bem próximos do
valor de corte cuja alocação de tratamento se baseia, podem ser considerados como grupos
de tratamento e controle (devido às suas similaridades) e permitem assim a estimação de
efeitos do tratamento.

345
2 O que é descontinuidade? Como formar grupos de tratamento e controle?
O universo que compreende o desenho de regressão descontínua é recheado de jargões

amplamente empregados nos trabalhos de avaliação e tem ainda algumas expressões com
pouca margem de tradução – como running variable, cutoff, RD fuzzy, RD sharp, entre
outros. Um termo de destaque e que configura um ponto de partida para o entendimento
do método é a descontinuidade. Afinal, o que é descontinuidade? Para assimilar esse
jargão, tome-se um exemplo. Imagine-se que exista uma política de âmbito nacional que
visa instalar unidades de saúde para aumentar/acelerar a vacinação contra COVID-19, cujo
objetivo seja diminuir o número de casos da doença. Contudo, por questões de demanda,
a transferência dos recursos federais para instalação das unidades somente é direcionada
para municípios a partir de 25,7 mil habitantes (número atualmente próximo do 25o percentil
de população). Nesse caso, todos os municípios que receberam os recursos instalaram as
unidades. Para um leigo, a primeira ideia que ocorreria à mente, como forma de medir o
impacto das unidades de saúde, seria comparar a média do número de casos (por 100 mil
habitantes) de COVID-19 dos municípios elegíveis com a dos não-elegíveis. Contudo, tal
comparação seria ingênua, uma vez que o grupo de todos os municípios maiores que 25,7
mil habitantes (elegíveis) tendem a diferir drasticamente do grupo de cidades abaixo desse
limite (não-elegíveis). A começar, diferem-se pela própria população média, a qual, por sua
vez, está associada a uma série de fatores de natureza econômica e social. Portanto, essa
comparação estaria capturando o efeito de interesse conjuntamente com a influência de
todas as características que tornam os dois grupos diferentes em decorrência da
elegibilidade para a política.
Sob a perspectiva do avaliador, essa intervenção cria um interessante experimento natural.

Para aquelas cidades que possuem população muito próxima ao limite de 25,7 mil
habitantes, a condição de elegibilidade é um evento que simula a situação mais próxima
possível de um sorteio aleatório. Dessa forma, o limite de população, estipulado
exogenamente à escolha do ente municipal, gerou descontinuidade na probabilidade de
tratamento: enquanto a chance de as cidades com população inferior a 25,7 receberem as
unidades de vacinação é nula, a chance pula abruptamente para 100% para aquelas
localidades com população a partir desse limite. Logo, as cidades que se enquadram em
um entorno próximo a esse ponto de corte (cutoff) no número de habitantes podem ser
utilizadas como grupos de tratamento e controle. Nesse exemplo, o número de habitantes
configura a running variable. De modo geral, o efeito médio de tratamento pode ser obtido
a partir da diferença das médias de casos de COVID-19 entre os municípios sujeitos ao

quase-experimento. Se houver (estatisticamente) essa diferença, também se notará
descontinuidade no indicador de impacto. Vale ressaltar que a interpretação do efeito
estimado funciona apenas para um subgrupo da população de elegíveis – ou seja, para
aquelas localidades próximas ao cutoff.1
Em suma, a aplicação do desenho de regressão descontínua necessita de uma variação

exógena em uma variável quantitativa (running variable) que, por conseguinte, gera cutoff
e viabiliza a definição dos grupos de tratamento e controle devido a descontinuidade na
probabilidade de receber tratamento. Maiores detalhes acerca da estimação do efeito de
interesse serão apresentados na seção abaixo.
3 Estimador de regressão descontínua (caso sharp)
O exemplo anterior retrata o caso mais simples de descontinuidade, conhecido como caso
sharp. Note-se que a chance de receber o tratamento salta de 0% para 100% em torno do
cutoff e indica que todos os municípios elegíveis são tratados e todos os não-elegíveis não
recebem o tratamento.2 Logo, o termo sharp sugere a descontinuidade mais “acentuada”
possível nessa probabilidade. A demonstração do estimador de RD será iniciada utilizando-
se esse contexto.
Considere-se 𝑌𝑌! um indicador de impacto qualquer, para um indivíduo i, e denote 𝑥𝑥! a

running variable. A princípio, consideraremos 𝑥𝑥! uma variável contínua. O ponto 𝑐𝑐
representa o cutoff, de modo que as unidades observacionais situadas acima desse ponto
(𝑥𝑥! ≥ 𝑐𝑐) são tratadas (𝑇𝑇! = 1) e aquelas que estão abaixo (𝑥𝑥! < 𝑐𝑐) não recebem o tratamento
(𝑇𝑇! = 0). Em outras palavras, a variável binária 𝑇𝑇! é uma função determinística da variável
𝑥𝑥! . Agora, defina-se um número positivo tão pequeno quanto a mente possa conceber, o
qual se denominará 𝜖𝜖. Como o objetivo é comparar a média dos indicadores de impacto
das observações próximas do ponto 𝑐𝑐 (ou seja, médias condicionais a valores de 𝑥𝑥! , ou
ainda 𝐸𝐸 [𝑌𝑌! |𝑥𝑥! ]), precisa-se intuitivamente aproximar esse número imaginário 𝜖𝜖 o mais
próximo possível de 0. A expressão matemática que auxiliará a representação desse passo
1
Evoluções recentes do método buscam expandir interpretações de efeitos de tratamento para pontos
distantes do cutoff. Ver, por exemplo, Angrist e Rokkanen (2015).
2
A depender do contexto, a probabilidade de receber o tratamento a partir do ponto de corte pode ir de
100% para 0%. Isso aconteceria se a intervenção fosse direcionada às unidades localizadas abaixo do
cutoff.

347
é o “limite de uma função”, denotado por lim. Dessa forma, obtém-se o parâmetro de
interesse no desenho de regressão descontínua (𝛽𝛽"# ) por meio da seguinte função:
𝛽𝛽"# = lim 𝐸𝐸 [𝑌𝑌! |𝑥𝑥! = 𝑐𝑐 + 𝜖𝜖 ] − lim 𝐸𝐸[𝑌𝑌! |𝑥𝑥! = 𝑐𝑐 − 𝜖𝜖]

$→& $→&
Ou seja, o efeito de interesse é obtido pela diferença das médias do indicador de impacto
entre o grupo tratado e o grupo de controle para as observações próximas do ponto 𝑐𝑐. O
efeito para essa subpopulação é denominado de Efeito Médio Local de Tratamento (Local
Average Treatment Effect, LATE). Similarmente, pode-se dizer que esse é um efeito médio
local de tratamento sobre os tratados. Perceba-se que, quanto mais 𝜖𝜖 se aproxima de 0,
menos observações tendem a ser usadas na estimação de 𝛽𝛽"# , uma vez que se está cada
vez mais próximo do cutoff.
Empiricamente, a grande questão está na escolha do valor de 𝜖𝜖 que, portanto, define a

banda (bandwidth) usada na estimação do parâmetro de interesse. Os procedimentos
empíricos de determinação dessa banda vão desde a escolha ad hoc do avaliador quanto
a aplicação de métodos de validação-cruzada para se obter uma “banda ótima”. Dentre tais
procedimentos metodológicos, o mais usualmente aplicado é o de Calonico et al. (2014),
que determina um valor de 𝜖𝜖 de forma a minimizar o viés na estimação de 𝛽𝛽"# . Nesse caso,
a estimação é feita de forma não-paramétrica, utilizando-se “regressões locais”.
É também possível estimar o parâmetro em um desenho de RD utilizando-se o método dos

Mínimos Quadrados Ordinários. Considere-se uma variável binária 𝐷𝐷! , que assume o valor
1 se 𝑥𝑥! ≥ 𝑐𝑐, e 0, em caso contrário. O modelo empírico assume a seguinte forma:3
𝑌𝑌! = 𝛽𝛽& + 𝛽𝛽"# 𝐷𝐷! + 𝛽𝛽' 𝑥𝑥! + 𝛽𝛽( 𝐷𝐷! 𝑥𝑥! + 𝑢𝑢! ,
onde 𝑢𝑢! é um termo de erro aleatório e os termos 𝑌𝑌! e 𝑥𝑥! são os mesmos definidos
anteriormente. No modelo econométrico, o parâmetro de interesse aparece multiplicando-
se a variável indicadora 𝐷𝐷! . Seguindo-se a mesma ideia da Equação (1), essa especificação
estima a descontinuidade 𝛽𝛽"# em 𝑌𝑌! o mais próximo possível de 𝑥𝑥! = 𝑐𝑐. Vale ressaltar que
nas aplicações empíricas é bastante comum se normalizar o cutoff para zero, facilitando-
se assim a interpretação do efeito causal advindo do modelo acima.
3
Polinômio de grau superior que pode ser utilizado na busca de especificação mais flexível. Ver Gelman e Imbers
(2019) para maiores detalhes sobre especificações.

A exibição gráfica em um contexto de RD é um artifício bastante poderoso por simplificar
para o leitor tanto a relação entre a variável 𝑥𝑥! e o indicador de impacto quanto a relação
da primeira com o status de tratamento. A representação é feita em um plano cartesiano,
conforme ilustrado na Figura 1. No painel esquerdo, os pontos pretos representam as
médias do indicador de impacto (variável resposta 𝑌𝑌! ) para grupos de valores de 𝑥𝑥! (eixo
horizontal). As curvas em cada lado do cutoff suavizam as médias desse indicador. O
gráfico destaca a descontinuidade nesse indicador a partir do ponto 𝑐𝑐. O painel direito
mostra como a probabilidade de receber o tratamento varia com valores da running variable.
Nesse caso, os pontos pretos denotam as médias da condição de tratamento para as
unidades observacionais. Note-se que, por ser uma função determinística de 𝑥𝑥! , a
probabilidade salta de 0 para 1 a partir do cutoff.
Figura 1 - Exemplo de sharp RD
O caso sharp envolve um cenário ideal em que todos os indivíduos sujeitos a uma
intervenção respeitam a regra que define o tratamento. Na prática, muitas vezes não se
observa tal situação. Por exemplo, é possível encontrar indivíduos que recebem o
tratamento – quando não deveriam ser tratados e, quando deveriam receber o tratamento,
negam-se à oportunidade. Esse contexto deixa claro a possibilidade de comportamento
endógeno do indivíduo, o que não significa que não se pode explorar interessantes efeitos
a partir do quase-experimento originado ao redor de um cutoff. A seguir, apresenta-se como
recuperar o efeito médio local nesse contexto.

349
4 Estimador de regressão descontínua (caso fuzzy)
Como mencionado, há contextos em que a conformidade com o recebimento do tratamento

não é perfeita. Tome-se novamente o exemplo hipotético sobre a instalação de unidades
de saúde para vacinação e suponha-se um cenário um pouco diferente: verificou-se que
existem municípios elegíveis ao tratamento que não utilizaram o recurso para operar tais
unidades (ou mesmo negaram o recebimento), enquanto outros não-elegíveis
conseguiram, de alguma maneira, receber os recursos e instalaram as unidades. Nesse
caso, a probabilidade de receber o tratamento não é mais uma função determinística da
população.
A Figura 2 representa como essa probabilidade se comportaria para diferentes níveis

populacionais. Note-se que a descontinuidade em relação à probabilidade de receber o
tratamento ao redor do ponto de corte de população (25,7 mil habitantes) não é mais
abrupta como no caso sharp. Chama-se fuzzy o desenho de regressão descontínua em
que a mudança na probabilidade de receber o tratamento é menor do que 1. Nesse caso,
o estimador do parâmetro de interesse assume forma diferente.
Figura 2 - Salto na probabilidade de tratamento ao redor do cutoff (fuzzy RD)
Intuitivamente espera-se que o estimador deva levar em consideração essa

descontinuidade na probabilidade de tratamento. Utilizando-se notação apresentada, irá se
denotar, então, a descontinuidade da Figura 2 em termos de valores esperados:

𝛼𝛼"# = lim 𝐸𝐸 [𝑇𝑇! |𝑥𝑥! = 𝑐𝑐 + 𝜖𝜖] − lim 𝐸𝐸[𝑇𝑇! |𝑥𝑥! = 𝑐𝑐 − 𝜖𝜖].
$→& $→&
Como se observa, 𝛼𝛼"# representa a diferença de probabilidade de tratamento entre as

unidades do lado direto e do lado esquerdo do cutoff – tomando-se observações em uma
vizinhança desse ponto. Para finalmente se obter o estimador de regressão descontínua
em um desenho fuzzy, deve-se apenas dividir o 𝛽𝛽"# obtido na Equação (1) por 𝛼𝛼"# :
lim 𝐸𝐸[𝑌𝑌! |𝑥𝑥! = 𝑐𝑐 + 𝜖𝜖] − lim 𝐸𝐸[𝑌𝑌! |𝑥𝑥! = 𝑐𝑐 − 𝜖𝜖] 𝛽𝛽"#

$→& $→&
𝛿𝛿"# = =
lim 𝐸𝐸[𝑇𝑇! |𝑥𝑥! = 𝑐𝑐 + 𝜖𝜖] − lim 𝐸𝐸[𝑇𝑇! |𝑥𝑥! = 𝑐𝑐 − 𝜖𝜖] 𝛼𝛼"#
$→& $→&
O parâmetro 𝛿𝛿"# representa o LATE. Como se pode perceber, o estimador do caso sharp
apresentado na Equação (1) configura um caso especial do estimador em (5), no qual a
descontinuidade 𝛼𝛼"# no ponto 𝑐𝑐 é igual a 1. O momento é também oportuno para se
apresentar mais dois novos jargões. Diz-se que o numerador é o estimador da “forma
reduzida”, modelo de regressão que mostra a relação entre a descontinuidade em 𝑥𝑥! e o
indicador de impacto, 𝑌𝑌! . O denominador representa o estimador de “primeiro estágio”,
modelo que mostra a relação entre a descontinuidade em 𝑥𝑥! e o status do tratamento4, 𝑇𝑇! .
Mesmo que não haja conformidade perfeita com o tratamento, o estimador da forma
reduzida pode ser bastante informativo. Particularmente, a estimação de 𝛽𝛽"# em um
desenho fuzzy traz uma interpretação de relevante interesse para o responsável pelo
desenho de política pública, uma vez que denota um Efeito de Intenção do Tratamento
(Intention-to-Treat Effect, ITT). Se retomarmos o exemplo fictício das unidades de saúde, o
governo federal poderia estar interessado apenas em saber se a política de transferência
de recursos para instalação das unidades de vacinação impactou o número de casos de
COVID-19 nas localidades, independentemente de serem tratados ou não (instalarem ou
não as unidades de saúde). Portanto, o estimador traduz o efeito da elegibilidade para o
tratamento. Não obstante, ainda é necessário haver descontinuidade na probabilidade de
tratamento (ou seja, a estimativa de 𝛼𝛼"# deve ser estatisticamente significante), que ainda
é uma condição necessária para a identificação.
4
Conforme será detalhado no capítulo seguinte, a variável binária que indica a descontinuidade na
probabilidade (ou seja, 𝐷𝐷! ) é utilizada como um instrumento para a variável de tratamento.

351
5 Validade do desenho de regressão descontínua
Para que os estimadores apresentados – LATE e ITT – tenham suas interpretações válidas,
é necessário atender a uma condição de identificação que, até o momento, ficou implícita.
Antes de apresentar essa importante hipótese, lembre-se do arcabouço de resultados
potenciais. Existe uma situação efetivamente observada pelo avaliador (factual) e aquela
que é impossível de ser observada (contrafactual). Essa última representa o que teria
acontecido com o grupo de tratados caso não tivessem recebido o tratamento. Com isso
em mente, a hipótese que viabiliza a recuperação do parâmetro de interesse é:
Hipótese de identificação: A média condicional da variável de interesse para o grupo
contrafactual apresenta uma transição suave no cutoff.
Em outras palavras, a hipótese significa que não se deveria observar descontinuidade

alguma no indicador de impacto se não existisse a intervenção exógena no ponto 𝑐𝑐. A
questão é: uma vez que esse é um mundo impossível de ser observado pelo avaliador,
como certificar a validade de tal pressuposto? Infelizmente, não é possível testar
diretamente esse pressuposto. Há, no entanto, possíveis caminhos para se testar a
plausibilidade dessa hipótese.
O primeiro teste de validade do desenho é conhecido como “teste de balanceamento”. O

procedimento consiste em verificar se outras características predeterminadas sofrem
mudança descontínua em torno do cutoff. Se a intervenção efetivamente gera impacto em
um indicador de interesse, faz-se necessário convencer o leitor (e a nós!) de que outros
fatores relacionados aos indivíduos não sejam diferentes entre os grupos de tratamento e
controle. Outra interessante estratégia é utilizar informações do próprio indicador de
impacto (𝑌𝑌! ) antes da intervenção e testar a similaridade entre os grupos, condicionado, é
claro, à existência de série histórica dessa variável.
A operacionalização do teste é bem simples. No exemplo fictício das unidades de

vacinação, imagine-se possuir informações, em nível municipal, de: gastos com saúde;
transferências do FPM; índice de gini; nível de escolaridade da população; taxa de
vacinação do período anterior, entre outros. Considerando-se que cada uma dessas
características representa uma variável 𝑊𝑊! , pode-se utilizar, por exemplo, o estimador
apresentado na Equação (1) para checar se existe descontinuidade no ponto 𝑐𝑐. Ou seja, a
característica 𝑊𝑊! se torna a variável dependente do modelo. Usando-se como exemplo a
notação de limites, tem-se:

𝛾𝛾 = lim 𝐸𝐸[𝑊𝑊! |𝑥𝑥! = 𝑐𝑐 + 𝜖𝜖] − lim 𝐸𝐸 [𝑊𝑊! |𝑥𝑥! = 𝑐𝑐 − 𝜖𝜖],
$→& $→&
onde 𝛾𝛾 representa a diferença média da característica 𝑊𝑊! entre os lados direito e esquerdo
da vizinhança próxima ao cutoff. Para haver validade interna do desenho, deseja-se que 𝛾𝛾
seja estatisticamente igual a zero para cada uma das características, indicando-se que os
fatores estão igualmente balanceados em torno do cutoff. Dessa forma, torna-se mais
plausível afirmar que a intervenção causou impacto e se exclui a possibilidade de outras
características influenciarem a descontinuidade observada no indicador de impacto.
Outro procedimento amplamente utilizado para checagem de validade interna é o teste de

manipulação da running variable. O teste proposto por McCrary (2008) propõe uma análise
da frequência de observações ao redor do cutoff e proporciona assim uma solução
inteligente para verificar a presença de comportamento endógeno. No exemplo das
unidades de vacinação, considere-se que, por causas fortuitas, a transferência de recursos
para instalação das unidades começará apenas um semestre depois de anunciada a
política e que será considerada a população observada nesse futuro para critério de
distribuição do recurso. Esse atraso pode fazer com que os municípios próximos do limite
de elegibilidade tentem se autosselecionar para entrarem no critério de recebimento dos
recursos, uma vez que o governo utilizará a população mensurada posteriormente. Por
exemplo, pode-se fazer manipulações no registro do número de habitantes do município de
forma que se aumente marginalmente a população (erro de mensuração) para atender ao
critério de elegibilidade. Por mais que a situação exemplificada possa ser improvável de
ocorrer empiricamente, essa oferece uma forma de se imaginar alternativas em que as
localidades podem manipular o valor da running variable. Qualquer que seja a razão, qual
seria a consequência que se veria nos dados? Uma concentração desigual no número de
municípios ao redor do cutoff (haveria mais municípios ao lado direito em relação ao lado
esquerdo).
O histograma à esquerda da Figura 3 exemplifica como seria essa frequência

desbalanceada de observações. Visualmente, pode-se perceber que a quantidade relativa
é maior do lado direito do ponto c. O teste de McCrary oferece uma maneira de testar
estatisticamente se há quebra no número de observações nesse ponto, estimando-se então
a descontinuidade na frequência relativa. O painel direito da Figura 3 ilustra a execução do
teste. Os pontos pretos representam a frequência de observações condicionada a valores
da running variable e as curvas suavizam essas médias. O exemplo fictício sugere haver

353
manipulação das unidades observacionais, uma vez que o teste apresenta p-valor
significativo em níveis convencionais (menor do que 5% de nível de significância), a indicar
a existência de descontinuidade na distribuição da running variable. Esse resultado
colocaria em descrédito a existência de efeito causal da intervenção analisada, por não se
ter evidências que garantam a não interferência da autosseleção no parâmetro estimado.
Figura 3 - Histograma e teste de McCrary
Tanto o teste de balanceamento quanto o de manipulação são considerados procedimentos

importantes para garantir a validade interna dos resultados. Vale lembrar que, uma vez que
se está identificando um efeito de tratamento válido apenas para os indivíduos no entorno
do ponto de corte, não é garantida a validade externa dos resultados em um desenho de
RD.
6 Robustez e uso de covariadas
Adicionalmente à verificação de plausibilidade da hipótese de identificação, é importante

demonstrar robustez dos resultados. Os testes de robustez são abordagens alternativas
que colocam à prova as estimativas obtidas e procuram demonstrar certa estabilidade no
valor do coeficiente estimado. Embora existam algumas estratégias usualmente
empregadas para averiguar robustez no contexto de regressão descontínua, vale ressaltar
que essa checagem pode assumir as mais variadas formas e dependerá da perspicácia e
experiência do avaliador – por exemplo, é possível pensar em maneiras de checar robustez

que vão desde o emprego de subamostras até a utilização de outros indicadores em que
se espera não encontrar resposta alguma à intervenção analisada.
A primeira maneira de checar a robustez dos resultados se dá por meio da utilização de

diferentes bandwidths no momento da estimação. Como previamente mencionado, é
comum se utilizar bandwidth ótimo na estimação do parâmetro de interesse. Por mais que
o procedimento não-paramétrico busque a melhor banda possível para minimizar o viés,
espera-se que o resultado não seja demasiadamente responsivo à utilização de outros
tamanhos de banda. Nesse sentido, pode-se implementar bandas de tamanho tanto maior
quanto menor em relação à banda ótima, realizando-se assim diferentes estimações para
cada amplitude de banda. A ideia é que, quanto menor a banda, menor será o viés na
obtenção da estimativa – uma vez que as observações mais próximas do cutoff tendem a
ser mais parecidas. Contudo, existe um trade-off aqui: quanto menor a banda utilizada,
menor será a quantidade de observações para o cálculo e, consequentemente, a variância
do estimador tende a ser maior. Em outras palavras, isso pode afetar a inferência e
penalizar, portanto, a significância estatística do efeito. O importante nesse teste é observar
a estabilidade da magnitude nas sucessivas estimativas, mesmo que se sacrifique a
significância estatística.
Outra estratégia usual para checar a sensibilidade dos resultados é utilizar diferentes
polinômios da running variable. O exemplo ilustrado na equação apresentada na seção 3
utiliza polinômio de primeiro grau. No entanto, é possível o uso de diferentes ordens na
variável 𝑥𝑥! , como polinômios quadráticos, cúbicos, entre outros. O artigo recente de Gelman
e Imbens (2019) recomenda o uso de polinômios lineares ou quadráticos, uma vez que
ordens maiores podem comprometer o não-viés na estimação do parâmetro. Da mesma
forma, visa-se aqui a não-sensibilidade da estimativa ao emprego de diferentes polinômios
da running variable. Vale destacar que, ao se utilizarem métodos não-paramétricos de
estimação, pode-se também alternar o peso atribuído às unidades observacionais para o
cálculo do efeito de tratamento conforme suas frequência e distância em relação ao cutoff
(IMBENS; LEMIEUX, 2008).
Uma vez que a identificação do efeito de tratamento no desenho de RD vem de um choque

em um valor específico da running variable, é plausível se imaginar que, existindo uma
descontinuidade no indicador de impacto nesse ponto, esse mesmo indicador não deve
apresentar resposta em outros pontos da distribuição da running variable. De acordo com
Imbens e Lemieux (2008), pode-se testar a não existência de descontinuidade no indicador

355
de impacto em “cutoffs falsos” e esses valores são selecionados de maneira ad hoc pelo
avaliador. Na prática, são escolhidos pontos equidistantes em relação ao verdadeiro cutoff,
a representar porcentagens do valor do verdadeiro cutoff (por exemplo, 80% e 120%, 70%
e 130% e assim por diante).
Por fim, o uso de covariadas (variáveis explicativas) pode ser excelente alternativa para
melhorar a eficiência do estimador. Em outras palavras, o uso de variáveis de controle no
desenho de regressão descontínua pode gerar ganhos de inferência estatística ao reduzir
a variância do estimador. Uma vez que essas características não são correlacionadas com
o tratamento (fato que deve ter sido checado anteriormente no teste de balanceamento), o
coeficiente estimado não deve alterar significativamente sua magnitude e ainda ganha
precisão – o que proporciona robustez. O artigo recente de Calonico et al. (2019) demonstra
um estimador não-paramétrico alternativo, ajustado para a inclusão de covariadas, de
forma a aumentar a precisão da estimativa.
7 Avanços metodológicos
A abordagem com uma running variable contínua e único cutoff, em ambos os casos sharp
e fuzzy, configura a formatação padrão do desenho de RD e, por conseguinte, é a mais
corriqueiramente observada nas avaliações de políticas. A literatura traz ainda situações
empíricas um tanto quanto particulares, as quais demandam certos ajustes no método para
a identificação de efeito causal. As últimas duas décadas são marcadas por grandes
avanços no arcabouço metodológico de RD e aplicáveis aos mais variados contextos. Nesta
seção, traz-se algumas das contribuições metodológicas mais relevantes com o intuito de
fornecer ponto de partida para a leitura de artigos científicos e inspiração para futuros
desenhos de avaliação de políticas públicas de saúde5.
O uso de RD não está limitado ao caso de uma running variable de natureza contínua. Ou
seja, é possível pensar em uma variável quantitativa que realiza valores discretos para
funcionar como running variable. Como ilustração, pode-se pensar em um caso no qual
uma legislação separa grupos de tratamento e controle baseando-se na idade do indivíduo
(definida em meses, por exemplo): indivíduos que têm pelo menos 20 anos de idade (240
5
Outros métodos não abordados neste material incluem: difference-in-discontinuity (GREMBI; TROIANO,
2016), RDD dinâmico (CELLINI et al., 2010) e extrapolação de efeitos de tratamento além do cutoff
(CATTANEO et al., 2021). É possível também haver outras combinações de métodos. Recomenda-se essas
referências como um ponto de partida para o aprofundamento do leitor.

meses) recebem determinado tratamento. Nota-se, então, que a running variable apresenta
saltos em seus valores e configuram uma situação em que assume característica discreta.
Nos desenhos que envolvem uso de running variable discreta, pode ocorrer que muitas
unidades observacionais estejam concentradas em pontos específicos de sua distribuição
(por exemplo, vários indivíduos com idade 239 meses, 240 meses, 241 meses e assim por
diante), a configurar uma massa de valores nesses pontos. Por isso, nesses contextos,
recomenda-se utilizar formas paramétricas para estimação do efeito local de tratamento
(DONG, 2015), similarmente como apresentado na Seção 3 deste material. Além disso, é
necessário realizar uma correção na estimação dos intervalos de confiança (KOLESÁR;
ROTHE, 2018)6.
Em certas ocasiões pode ocorrer de uma política configurar mais de um cutoff para definir
a elegibilidade para um tratamento. As situações que empregam múltiplos cutoffs,
geralmente, abordam diferentes tratamentos ou intensidades do mesmo tratamento.
Utilizando-se nosso caso hipotético de instalação de unidades de saúde para vacinação, a
política poderia aumentar o montante de transferência de recursos de acordo com o
tamanho da população, além do cutoff de 25,7 mil habitantes anteriormente estabelecido.
Por exemplo, cidades a partir de 100 mil habitantes receberiam o dobro de recursos e, a
partir de 300 mil habitantes, o triplo. Esse cenário permitiria, então, que cidades maiores
pudessem instalar mais unidades de vacinação. Ao redor de cada um dos três cutoffs,
podem se configurar grupos de tratamento e controle e, então, estimarem-se os LATEs em
um desenho de regressão descontínua com múltiplos cutoffs. Uma vantagem desse tipo de
desenho é poder trazerem-se evidências e discussões acerca da validade externa da
política, uma vez que subgrupos diferentes da população podem ter repostas heterogêneas
ao tratamento. Como exemplo, Bertanha (2020) propõe formas paramétricas e não-
paramétricas para estimação do LATE para cada cutoff7.
Por vezes, é necessário que o indivíduo atenda a mais de um critério bem definido para
garantir elegibilidade para uma política pública. Imagine-se que, no caso da política
ilustrativa de vacinação, além de ter de superar o limite populacional de 25,7 mil habitantes
para configurar o tratamento, o município deve ter uma razão despesa/receita menor do
6
Durante muito tempo, o procedimento comumente utilizado para estimação dos erros-padrões era realizar
uma clusterização pela própria running variable. Os autores mostram que essa prática gera intervalos de
confiança viesados e propõe uma correção “honesta” do estimador. Como uma solução simplificada, pode-
se empregar erros-padrões robustos à heterocedasticidade.
7
Uma abordagem utilizada anteriormente à solução proposta pelo autor era agregar as observações dos
diferentes cutoffs e normalizá-las para a utilização de um único cutoff. Apesar de ser uma solução prática,
essa mascara a heterogeneidade do tratamento para os diferentes subgrupos.

357
que 0,6. Esse cenário introduz dois critérios para que um município receba os recursos da
política, em que cada um deles impõe um cutoff. É possível, então, utilizar um desenho de
regressão descontínua multidimensional, com duas running variables (população e razão
despesa/receita, respectivamente), para a identificação do efeito local de tratamento8. É
importante destacar que, conforme se aumenta a dimensão na análise (quantidade de
running variables), maior a necessidade de observações para se poder performar o método.
Isso decorre do fato de necessitar de maior variação para a estimação do parâmetro,
especialmente nos entornos dos cutoffs. Como uma referência, Choi e Lee (2018) propõem
uma forma não-paramétrica de estimar o LATE.
A elegibilidade a uma política pública, definida a partir de um ponto de corte, pode não gerar
descontinuidade sobre a variável de interesse. Contudo, isso não necessariamente significa
que essa não produza um efeito local de tratamento. Em vez de provocar descontinuidade
local, pode gerar mudança de comportamento no indicador de maneira a alterar a sua
tendência. Visualmente, um gráfico que represente a relação entre o indicador de impacto
e a running variable em um plano cartesiano mostraria mudança clara de trajetória do
indicador de impacto (ou seja, na inclinação da reta) a partir do cutoff, em vez de
descolamento abrupto em sua média como denotado na Figura 1. Portanto, o desenho de
regressão descontínua pode se estender para o que se denomina de Desenho de
Regressão Kink (RKD), termo cunhado por Nielsen, Sorensen e Taber (2010). Essa
situação ressalta ainda mais a importância da análise gráfica em estudos que pretendem
utilizar choques exógenos bem definidos (que impõem pontos de corte) sobre uma variável
quantitativa. Similar ao RDD, o RKD também incorpora os casos sharp e fuzzy, a depender
da conformidade das unidades observacionais com o tratamento. Card et al. (2015)
discutem diferentes maneiras de se estimar o parâmetro de interesse no contexto de RKD.
8 Aplicações em saúde
Esta seção explora artigos científicos publicados em periódicos de alto impacto acadêmico
que implementam a estratégia de RD para avaliação de políticas ou de intervenções de
outras naturezas com implicações em indicadores de saúde. Aborda-se um breve contexto
institucional para a implementação da análise e apresentados os principais indicadores
8
Outra possibilidade de avaliação utilizando RDD pode surgir a partir de descontinuidades geográficas
(latitude e longitude), nas quais a oferta de uma política é restrita a certas localidades. Nesses casos,
havendo informação georreferenciada, talvez seja possível utilizar os indivíduos próximos aos limites
geográficos que determinam a elegibilidade como grupos de tratamento e controle.

utilizados e resultados encontrados. Não se discutem testes de falsificação e
balanceamento, contudo, todos os estudos listados implementam testes discutidos no
presente capítulo para validação de resultados.
8.1 Consumo de álcool e mortalidade: Carpenter e Dobkin (2009)
O trabalho de Carpenter e Dobkin (2009) avalia efeitos do consumo de álcool sobre

mortalidade e utiliza a lei de idade mínima para consumo de bebidas
alcoólicas, promulgada nos Estados Unidos em 1984. Uma vez que a lei proíbe o
consumo de álcool para adultos menores de 21 anos de idade, os autores
exploram esse ponto de corte para identificar o efeito da política sobre indivíduos
que estão à margem de 21 anos de idade, utilizando assim um desenho de RD
sharp. Os autores utilizam dados confidenciais da National Health Interview
Survey (NHIS), que contêm amostra estratificada e representativa da
população, e fazem uso da informação exata da data de nascimento de
indivíduos com idade entre 19 e 22 anos para mapear elegibilidade, além de
uma série de informações sobre o comportamento de consumo de álcool dos
indivíduos. Os dados sobre mortalidade vêm da base National Center for
Health Statistics (NCHS).
Tabela 1 - Resultados principais, Carpenter e Dobkin (2009)
Fonte: Carpenter e Dobkin (2009).

359
A Tabela 1 mostra os principais resultados do artigo e explora os indicadores de
mortalidade por qualquer causa, por causas externas (acidentes de motocicleta,
suicídio, homicídio, mortes com menção ao consumo de álcool e outras drogas) e
causas internas (demais causas que não externas). Na parte superior da tabela,
estima-se um aumento estatisticamente significante de cerca de 9% na mortalidade
(Coluna 1) sobre os indivíduos com idade a partir de 21 anos. Os resultados mostram
que esse efeito é inteiramente conduzido pelas causas externas, como pode se
observar no painel central da tabela, com coeficiente estimado de 0,11 (efeito de
11%, aproximadamente). A especificação principal dos autores inclui apenas
polinômio de segunda ordem da running variable e o efeito é estimado de forma
paramétrica. As outras colunas apresentam robustez das estimativas, incluindo-se,
respectivamente, variáveis de controle, polinômios de terceira ordem e regressão
linear local, para reforçar o mecanismo do impacto da lei sobre a mortalidade. Os
autores também documentam aumento de 21% no número de dias de consumo de
bebidas alcoólicas ao redor do cutoff, a reforçar a interpretação de que o aumento
na mortalidade advém do aumento do consumo de bebidas. Os achados do trabalho
sugerem que políticas que objetivam redução de consumo de álcool entre jovens e
adultos podem gerar importantes benefícios para saúde pública.
8.2 Aposentadoria e saúde: Muller e Shaik (2018)
Ao explorar regras de aposentadoria baseadas em cortes de idade em países

europeus (60 e 65 anos de idade, a depender do país), Muller e Shaik (2018) avaliam
os impactos da aposentadoria sobre indicadores de saúde. Os autores utilizam
microdados do Survey of Health, Ageing and Ret;/.rement in Europe (SHARE),
survey realizado com amostra representativa de vários países europeus, que contém
informações detalhadas no nível do indivíduo sobre histórico econômico familiar,
situação empregatícia, indicadores de saúde e identificação de cônjuges. Exploram
tanto o “efeito de pares” – que no contexto se refere aos “efeitos da aposentadoria
do cônjuge” – quanto o efeito da aposentadoria do próprio indivíduo sobre a
intensidade e frequência do consumo de bebidas alcoólicas, bem como sobre a
prática de atividades físicas. O caráter fuzzy adotado no artigo advém do fato de a
aposentadoria não ser compulsória, nem para o indivíduo e nem para seu parceiro,
o que torna necessário verificar a existência de um primeiro estágio ao redor do cutoff
de elegibilidade para a aposentadoria (se a regra de aposentadoria aumenta a
probabilidade de se aposentar). Como mostra a Figura 4, tanto a probabilidade do

cônjuge se aposentar (gráfico superior) quanto a do próprio indivíduo se aposentar,
apresenta descontinuidade a partir da idade de elegibilidade para a aposentadoria
(em torno de 24 a 35 pontos percentuais maior).
Figura 4 - Primeiro estágio, Muller e Shaik (2018)
Fonte: Muller e Shaik (2018).
A Tabela 2 reporta os resultados principais da análise. A variável “partner retired” se

refere aos efeitos de aposentadoria do parceiro sobre indicadores do indivíduo
enquanto a variável “retired” se refere aos efeitos da própria aposentadoria. Os
resultados mostram efeitos significativos positivos / negativos da própria
aposentadoria sobre realização de atividades físicas moderadas e intensas
(consumo de álcool). Por outro lado, quando o cônjuge se aposenta, há redução na
prática de atividades físicas e aumento no consumo de bebidas alcoólicas e de
cigarro por parte do indivíduo. As estimativas, obtidas de forma paramétrica, são
robustas para a utilização de polinômio alternativo da running variable. Portanto, a
aposentadoria pode trazer tanto efeitos positivos quanto adversos sobre a saúde de
pessoas mais velhas por meio de mudanças de comportamento nas práticas de
atividades físicas e no consumo de álcool. Uma grande contribuição do trabalho é
trazer evidência causal acerca de uma externalidade na saúde do indivíduo oriunda
da aposentadoria do seu parceiro, fato antes nunca explorado pela literatura e que
traz novos insights sobre os efeitos da política de aposentadoria.

361
Tabela 2 - Resultados principais, Muller e Shaik (2018)
Fonte: adaptado de Muller e Shaik (2018).
8.3 Efeitos do acesso a seguro de saúde: Bernal et al. (2017)

Bernal et al. (2017) avaliam os efeitos de acessibilidade a seguro público de saúde
sobre a utilização de serviços de saúde. Para identificar o efeito causal, os autores
exploraram uma regulação no Peru que fornece cobertura de saúde a indivíduos
não-formalmente empregados que não ultrapassam limite específico do índice
chamado Índice de Focalización de Hogares (IFH). O IFH consiste em um índice
quantitativo formado a partir de uma série de indicadores econômicos e sociais ao
nível da família: quanto menor for o seu valor, maior a situação de vulnerabilidade
em que a família se encontra. Os dados são provenientes do National Household
Survey of Peru (ENAHO), que contém informações socioeconômicas diversas e
permitem aos autores recalcularem o IFH para cada família. Uma vez que os autores
não observam se o indivíduo aciona o seguro público de saúde, propõe-se a
estimação do efeito ITT9 da política em um desenho de RD sharp.
9
Para outras evidências que exploram efeitos de elegibilidade para políticas públicas sobre indicadores de
saúde, consultar Ludwig e Miller (2007) e Fujiwara (2015).

Tabela 3 - Resultados principais, Bernal et al. (2017)
Fonte: adaptado de Bernal et al. (2017).
A Tabela 3 mostra os impactos sobre os principais indicadores na coluna 1, enquanto

a coluna 2 mostra as médias dos indicadores (útil para a compreensão da magnitude
dos impactos). A especificação principal utiliza polinômios de primeira ordem na
running variable, bem como inclui variáveis de controle do indivíduo (para aumentar
precisão do estimador). Os resultados mostram que a elegibilidade para o seguro
saúde aumenta as consultas a médicos (8,9 pontos percentuais), compra de
remédios (14,5 pontos percentuais) e a quantidade de análises e exames de raio-X
em centros de atendimento de saúde. Em serviços ofertados em hospitais, há
impacto positivo sobre uso de serviços relacionados a cirurgias. Resultados
adicionais constatam que o aumento de consultas a médicos leva ao aumento na
ciência de problemas de saúde.
8.4 Elegibilidade ao Medicaid e indicadores de saúde: De La Mata (2012)
Utilizando-se de dados do Panel Study of Income Dynamics (PSID) e do Child

Development Study (CDS) com detalhadas informações acerca de características
socioeconômicas e do uso de serviços de saúde por crianças entre 1-12 anos de
idade, De La Mata (2012) avalia os efeitos de elegibilidade para a maior política de
cobertura de seguro saúde público para crianças nos Estados Unidos, conhecida
como Medicaid. Diferentemente do estudo apresentado na seção anterior, a
elegibilidade em De La Mata (2012) ocorre a partir de diferentes cutoffs da running
variable e configura um desenho de RD com múltiplos cutoffs. A running variable é

363
definida como a distância da renda familiar para a linha de pobreza, em termos
percentuais e cada estado pode estipular essa linha diferentemente. Portanto, a
elegibilidade ao Medicaid dá-se para crianças em que as famílias estão abaixo da
linha de pobreza. Ademais, o autor observa que os maiores thresholds (aqueles em
que os mais ricos estariam em torno no cutoff) podem apresentar alguns
desincentivos ao uso da cobertura de saúde, uma vez que se estaria sujeito a filas
de espera mais longas do que no caso dos cutoffs menores (o que vem a favorecer
os mais vulneráveis em termos de renda). Para o cálculo do efeito ITT, utilizam-se
especificações com polinômios de primeira e segunda ordem e realiza-se estimação
de forma paramétrica.
A Figura 5 mostra que, de fato, a elegibilidade ao Medicaid provoca o aumento na

cobertura de saúde para as crianças (gráfico superior à esquerda), especialmente
nos menores cutoffs (gráficos inferiores). O gráfico superior à direita revela que o
uso de cobertura de saúde privada aumenta entre os não elegíveis (efeito crowd out
ou de substituição). O autor documenta ausência de impacto sobre indicadores de
saúde infantis, como obesidade e apresentação de alguma doença. Contudo, há
significante aumento das visitas a médicos, o que sugere impacto positivo sobre o
comportamento preventivo.
Figura 5 - Resultados principais, De La Mata (2012)
Fonte: adaptado de De La Mata (2012).

8.5 Efeitos do seguro privado de saúde no Brasil, Menezes-Filho e Politi (2020)
No Brasil, é possível deduzir do imposto de renda para fins de gastos de saúde, o
que inclui gastos com seguro saúde privado. Menezes-Filho e Politi (2020) exploram
esse contexto institucional e argumentam que essa possibilidade de dedução gera
uma mudança na trajetória da relação entre a renda do indivíduo e o preço pós-
tributação do seguro saúde particular. Isso permite o uso do desenho fuzzy RD kink
para estimar o efeito do seguro saúde privado sobre a demanda por serviços de
saúde. Para execução da pesquisa, os autores utilizam dados da PNAD (Pesquisa
Nacional por Amostra de Domicílios) e POF (Pesquisa de Orçamentos Familiares),
explorando informações de renda (para construção da running variable), gastos
destinados ao uso de serviços de saúde, visita a médicos, realização de exames
médicos e uma série de características individuais.
A Figura 6 traz evidência de que há, concretamente, mudança na demanda por

seguro saúde privado a partir do cutoff de renda (note-se que há mudança de
inclinação na reta), que aumenta conforme a o crescimento da renda. Ao utilizarem
estimadores não-paramétricos e explorarem o primeiro estágio, os autores
documentam um efeito positivo do uso de seguro saúde privado sobre o número de
visitas a médicos, realização de exames de mamografia e Papanicolau, conforme
resultados reportados na Tabela 4. Os achados são robustos para o uso de
diferentes polinômios, vide parte inferior da tabela. Os impactos mostram que, via
dedução de imposto de renda, o plano de saúde privado provoca uma resposta
positiva no comportamento preventivo dos usuários.
Figura 6 - Primeiro estágio, desenho kink
Fonte: Menezes-Filho e Politi (2020).

365
Tabela 4 - Resultados principais, Menezes-Filho e Politi (2020)
Fonte: Menezes-Filho e Politi (2020).
O desenho de regressão descontínua é poderosa ferramenta para a identificação de efeitos

causais, seu uso é bastante promissor no âmbito das políticas públicas de saúde e
apresenta-se como alternativa interessante em relação a outras técnicas quase-
experimentais de avaliação. Como visto neste capítulo, para sua implementação é
necessário haver mudança exógena e abrupta na probabilidade de tratamento a partir de
um ponto específico de uma variável quantitativa. O método apresenta como grandes
vantagens o fato de não depender exclusivamente de dados longitudinais para realizar a
avaliação – como no caso do modelo de diferença-em-diferenças – e a sua execução ser
relativamente fácil. Existem vários pacotes e códigos de programação disponíveis para os
softwares Stata e R que implementam a técnica e que são de amplo acesso ao público. Em
contrapartida, o método enfrenta limitações relacionadas à validade externa dos resultados,
uma vez que o efeito médio de tratamento é generalizável apenas para um subconjunto do
público-alvo.
Por mais que haja uma oferta considerável de trabalhos que utilizam desenho de regressão
descontínua para avaliar políticas públicas diversas, as quais têm implicações sobre
indicadores de saúde, não é comum encontrar avaliações de políticas específicas de
saúde que utilizam essa ferramenta – especialmente no contexto brasileiro. Isso pode estar

refletindo a escassez de choques exógenos relacionados ao contexto de saúde que
viabilizam o seu uso e/ou mesmo o desconhecimento por parte dos avaliadores de regras
institucionais na área de saúde que remontam ao desenho de RD. Nesse sentido,
esperamos que este material seja um subsídio e uma inspiração valiosos para a formulação
de políticas públicas de saúde que permitam a utilização da ferramenta para a avaliação,
além de servir como guia prático para a implementação da técnica e proporcionar insights
para avaliação de políticas de saúde existentes.

367
Referências
ANGRIST, J. D.; ROKKANEN, M. ‘Wanna get away? regression discontinuity estimation of

exam school effects away from the cutoff’. Journal of the American Statistical
Association, v. 110, n. 512, p. 1331-1344, 2015.
BERNAL, N.; CARPIO, M. A.; KLEIN, T. J. The effects of access to health insurance:
evidence from a regression discontinuity design in Peru. Journal of Public Economics, v.
154, p. 122-136, 2017.
BERTANHA, M. Regression discontinuity design with many thresholds. Journal of

Econometrics, v. 218, n. 1, p. 216-241, 2020.
CARD, D. et al. Inference on causal effects in a generalized regression kink design.

Econometrica, v. 83, n. 6, p. 2453-2483, 2015.
CALONICO, S. et al. Regression discontinuity designs using covariates. Review of

Economics and Statistics, v. 101, n. 3, p. 442-451, 2019.
CALONICO, S.; CATTANEO, M. D.; TITIUNIK, R. Robust nonparametric confidence

intervals for regression-discontinuity designs. Econometrica, v. 82, n. 6, p. 2295-2326,
2014.
CARPENTER, C.; DOBKIN, C. The effect of alcohol consumption on mortality: regression

discontinuity evidence from the minimum drinking age. American Economic Journal:
Applied Economics, v. 1, n. 1, p. 164-182, 2009.
CATTANEO, M. D. et al. Extrapolating treatment effects in multi-cutoff regression

discontinuity designs. Journal of the American Statistical Association, v. 116, n. 536,
p. 1941-1952, 2021.
CELLINI, S. R.; FERREIRA, F.; ROTHSTEIN, J. The value of school facility investments:
Evidence from a dynamic regression discontinuity design. The Quarterly Journal of
Economics, v. 125, n. 1, p. 215-261, 2010.
CHOI, J. Y.; LEE, M. J. Regression discontinuity with multiple running variables allowing
partial effects. Political Analysis, v. 26, n. 3, p. 258-274, 2018.
DONG, Y. Regression discontinuity applications with rounding errors in the running

variable. Journal of Applied Econometrics, v. 30, n. 3, p. 422-446, 2015.
De La MATA, D. The effect of Medicaid eligibility on coverage, utilization, and children’s

health. Health Economics, v. 21, n. 9, p. 1061-1079, 2012.
FUJIWARA, T. Voting technology, political responsiveness, and infant health: evidence

from Brazil. Econometrica, v. 83, n. 2, p. 423-464, 2015.
GELMAN, A.; IMBENS, G. Why high-order polynomials should not be used in regression
discontinuity designs. Journal of Business & Economic Statistics, v. 37, n. 3, p. 447-
456, 2019.
GREMBI, V.; NANNICINI, T.; TROIANO, U. Do fiscal rules matter? American Economic
Journal: Applied Economics, v. 8, n. 3, p. 1-30, 2016.

IMBENS, G. W.; LEMIEUX, T. Regression discontinuity designs: a guide to practice.
Journal of Econometrics, v. 142, n. 2, p. 615-635, 2008.
KOLESÁR, M.; ROTHE, C. Inference in regression discontinuity designs with a discrete

running variable. American Economic Review, v. 108, n. 8, p. 2277-2304, 2018.
LUDWIG, J.; MILLER, D. L. Does head start improve children's life chances? Evidence
from a regression discontinuity design. The Quarterly Journal of Economics, v. 122, n.
1, p. 159-208, 2007.
McCRARY, J. Manipulation of the running variable in the regression discontinuity design:

A density test. Journal of Econometrics, v. 142, n. 2, p. 698-714, 2008.
MENEZES-FILHO, N.; POLITI, R. Estimating the causal effects of private health insurance
in Brazil: Evidence from a regression kink design. Social Science & Medicine, v. 264, p.
1-9, 2020.
MULLER, T.; SHAIKH, M. Your retirement and my health behavior: Evidence on retirement
externalities from a fuzzy regression discontinuity design. Journal of Health Economics,
v. 57, p. 45-59, 2018. Disponível em: https://www.sciencedirect.com/science/article/pii/
S0277953620304779?via%3Dihub. Acesso em: 15 set. 2022.
NIELSEN, H. S.; SORENSEN, T.; TABER, C. Estimating the effect of student aid on
college enrollment: Evidence from a government grant policy reform. American
Economic Journal: Economic Policy, v. 2, n. 2, p. 185-215, 2010.
THISTLETHWAITE, D. L.; CAMPBELL, D. T. Regression-discontinuity analysis: an

alternative to the ex post facto experiment. Journal of Educational Psychology, v. 51, n.
6, 309-317, 1960. Disponível em: https://psycnet.apa.org/fulltext/1962-00061-001.pdf.

369
Capítulo 14
O Método de Variáveis Instrumentais

e Aplicações em Políticas de Saúde
Rudi Rocha1
1
Fundação Getúlio Vargas - FGV, Escola de Administração de Empresas de São Paulo- EAESP
RESUMO:
Este capítulo tem como objetivo apresentar um panorama conceitual e aplicado sobre o uso de
variáveis instrumentais (VI) em avaliações de impacto e destina-se a gestoras/es e pesquisadoras/
es com interesse na implementação de técnicas de econometria aplicada para avaliação de impacto
de políticas públicas. O capítulo pode ser utilizado como um guia sobre os fundamentos da técnica,
conjugado com livros-texto mais completos sobre o tema, recomendados ao final do capítulo.
PALAVRAS-CHAVE:
Identificação causal. Endogeneidade. Variáveis instrumentais.

1 Introdução
O método de variáveis instrumentais (VI) é um dos mais importantes e versáteis em
econometria aplicada. Por um lado, quando o seu uso é adequado, nos permite resolver
uma série de problemas de endogeneidade, como aqueles decorrentes de variável omitida
e relacionados à seleção em não observáveis e correlatos, como causalidade reversa e
erro de medida. Por outro lado, pode nos permitir também identificação causal em dados
de corte seccional. Esta versatilidade é bastante única em meio às ferramentas que temos
em econometria aplicada, incluídas aqui as técnicas de dados em painel. Além da
versatilidade, podemos utilizar o método de VI de modo conjugado com as demais técnicas
– por exemplo, como apoio a estudos aleatorizados, a métodos de regressão com
descontinuidade do tipo fuzzy e em modelos de painel com efeitos-fixos.
À primeira vista, portanto, nos parece que temos em mãos algo realmente eficaz para
resolver nossos problemas em avaliação de impacto. Muito embora isso seja verdade em
contextos específicos, como veremos neste capítulo, nem sempre conseguimos utilizar o
método de VI. Em última instância, é relativamente difícil encontrar uma variável
instrumental válida, peça central do método.
Neste capítulo veremos inicialmente uma base conceitual simplificada que nos ajudará a
compreender a validade e o uso adequado de uma variável instrumental. Uma vez claras
as definições e intuições por trás do método de VI, passaremos então a questões mais
técnicas relacionadas à estimação. Na sequência, discutiremos questões práticas e
essenciais em trabalhos aplicados que fazem uso de VI. Como nos demais métodos de
inferência causal, existe um protocolo de pesquisa a ser seguido ao se utilizar o VI, o qual
requer considerações específicas. Discutiremos também a combinação das demais
técnicas com VI. Por fim, encerraremos este capítulo com aplicações de VI já realizadas
em avaliação de políticas de saúde no Brasil.
2 Base conceitual
Vamos utilizar um esquema conceitual para ilustrar um problema muito comum de
endogeneidade relacionado à variável omitida, e a partir disso definir uma VI e métodos de
estimação. A Figura 1 a seguir ilustra esquematicamente um caso no qual queremos
identificar o impacto da variável X sobre Y, muito embora exista uma variável não observada
U correlacionada simultaneamente com ambas as variáveis de interesse e resultado.

371
Figura 1 – Variável omitida e VI: esquema conceitual
Por exemplo, vamos supor que X define uma política de saúde introduzida ao nível
municipal cujo objetivo é diminuir as taxas de mortalidade infantil Y. Essa política pode ter
sido direcionada a municípios de determinadas regiões socioeconomicamente mais
vulneráveis de acordo como indicador U. Nesse caso, portanto, podemos ter U
correlacionado positivamente relacionado com a alocação da política X e com taxas de
mortalidade infantil Y mais altas, por se tratarem de locais mais vulneráveis. Como
resultado, eventualmente encontraremos uma relação negativa entre X e Y, ou seja, quanto
mais alocamos recursos em X, mais altas se apresentam as taxas de mortalidade infantil.
Uma conclusão descuidada pode levar ao corte de uma política que eventualmente era
efetiva no combate à mortalidade infantil.
Vamos então definir uma variável instrumental ou instrumento Z como aquela que afeta X,
porém sem relação com U. Ou seja, se existe alguma relação entre Z e Y, isso ocorre
exclusivamente através de variações em X. Dito de outra forma, a única relação entre
variações em Z e em Y se dá via variações em X, tudo o mais constante. Notem que existem
por trás dessa definição duas condições bastante importantes e que deverão ser válidas na
prática. Em primeiro lugar, Z deverá afetar X. Ou seja, precisamos ter uma correlação entre
o instrumento Z e a variável de interesse endógena X. Chamamos essa relação entre X e
Z de primeiro estágio. Em segundo lugar, Z deverá afetar Y apenas através de X. O
instrumento não deverá ter relação com quaisquer outras variáveis potencialmente
relacionadas com a variável de resultado Y. Chamamos essa condição de restrição de
exclusão. Um instrumento válido, portanto, precisará respeitar as duas condições acima.
Muito embora existam outras questões técnicas que devem ser consideradas, como
veremos à frente, o primeiro estágio e a restrição de exclusão deverão valer.
Notem, entretanto, que o primeiro estágio é uma condição observável. Basta definirmos um
instrumento Z para verificarmos empiricamente em que medida existe uma relação entre
as variáveis Z e X. Em última instância, essa é uma questão operacional. O desafio muito
frequentemente recai sobre a restrição de exclusão, cuja validade requer condições
bastante únicas e que não pode ser testada – afinal, existem inúmeras variáveis
observáveis ou não que podem estar contidas em U e, portanto, simultaneamente
relacionadas com Z e Y. A validade da restrição de exclusão, nesse sentido, depende de
características muito específicas do contexto empírico e de um convencimento
eventualmente baseado em teoria ou discussão conceitual, já que é uma hipótese não
verificável. É comum encontrarmos na literatura científica variáveis instrumentais
estranhas. Não à toa, um instrumento válido Z não tem relação direta com Y a não ser
através de X. Essa alavanca é bastante específica.
No caso ilustrado na Figura 1, suponha por exemplo que Z é resultado de um sorteio

aleatório e que implica na adesão dos municípios sorteados para receber a política X. Por
construção, por ser resultado de um sorteio, Z deverá ser independente das variáveis
observáveis ou não que podem estar contidas em U. Por outro lado, Z afeta adesão à
política X e quaisquer variações em Y induzidas por variações em Z devem ocorrer via
variações em X. Esta alavanca é específica do contexto empírico em questão.
3 Estimação
Como então utilizar um instrumento válido para a identificação de impactos causais? Um
dos estimadores de VI mais intuitivos e utilizados em econometria aplicada é o estimador
de Mínimos Quadrados Ordinários em 2 Estágios (MQO2E) – utilizamos como jargão a
sigla 2SLS, que se refere à expressão em inglês two-stage least squares. De modo
simplificado, como o nome sugere, esse estimador é baseado em um sistema de duas
equações lineares. A primeira equação refere-se ao primeiro estágio, quando regredimos a
variável endógena X no instrumento Z e nas demais variáveis exógenas do modelo em
questão – para simplificação, podemos denotá-las por X-k. Ou seja, se válido o fato de que
as demais variáveis do modelo – como, por exemplo, variáveis de controle ou efeitos-fixos
– são exógenas, devemos incluí-las juntamente com Z no lado direito de nossa equação de
primeiro estágio. Por ser uma projeção ortogonal, dadas as propriedades do MQO, nesse
primeiro estágio conseguiremos decompor variações de X em duas partes.
A primeira parte consiste em variações em 𝑋𝑋̂, ou na parte de X predita por variações no

instrumento e nas demais variáveis exógenas. Nesse caso, recuperamos uma variação em
X que é supostamente exógena a Y e ortogonal a U. Dito de outra forma, estamos
identificando e coletando a parte de X que é exógena e descartando a sua parte endógena.

373
′
𝑋𝑋 = 𝛼𝛼 + 𝛾𝛾1 𝑍𝑍 + 𝑋𝑋−𝑘𝑘 𝛾𝛾2 + 𝜀𝜀
𝑌𝑌 = 𝜋𝜋 + 𝛽𝛽1 𝑋𝑋̂ + 𝑋𝑋−𝑘𝑘

′
𝜃𝜃 + 𝑢𝑢
Podemos então seguir para o segundo estágio, em que regredimos finalmente a nossa
variável de resultado Y sobre 𝑋𝑋̂ e as demais variáveis exógenas do modelo. Notem que, se
de fato temos um instrumento Z válido, podemos assumir que a variação remanescente em
𝑋𝑋̂ é exógena e ortogonal a U. Quebramos então a relação endógena entre X e U ao utilizar
no segundo estágio em lugar de X o seu componente exógeno 𝑋𝑋̂. Intuitivamente, utilizamos
a alavanca Z para gerar uma variação exógena em X e independente de U. Devemos notar
também, no entanto, que a variação remanescente em X contida em 𝑋𝑋̂ é apenas uma parte
da variação total em X. Isso significa que temos menos informação nos dados para a
identificação dos nossos parâmetros e que a variação utilizada tem como origem as
observações que responderam ao instrumento. Voltaremos a esse ponto mais adiante.
Caso o instrumento Z seja válido, portanto, o estimador 𝛽𝛽̂2𝑠𝑠𝑠𝑠𝑠𝑠 por 2SLS pode ser
considerado consistente. Com relação à eficiência e estimação do seu erro padrão, muito
embora pareça intuitivo tratar ou estimar as duas equações acima separadamente,
devemos sempre considerar que temos um sistema de equações em mãos e que a
inferência correta deve levar em consideração este fato e a estrutura de covariância entre
os componentes de erro idiossincrático do primeiro e do segundo estágios. Felizmente,
códigos já prontos no Stata ou no R resolvem estas questões mais técnicas para nós e nos
entregam estimativas para os parâmetros de interesse e erros-padrão corretamente
estimados. No Stata, por exemplo, a sintaxe abaixo ilustra como usar o comando no caso
em que temos y variável de resultado, x variável de interesse endógena, z variável
instrumental e um conjunto de variáveis de controle c 1, c2 ... ck. Notem que o comando
destaca entre parênteses os termos x endógeno e z instrumento.
ivregress 2sls y (x=z) c1 c2 … ck, first
No R, após carregarmos as bibliotecas necessárias para a estimação e definirmos as

variáveis, podemos utilizar o código abaixo onde C consiste no conjunto de variáveis de
controle:
iv_reg = ivreg(y ~ x + C | C + z)

Nos dois casos podemos trabalhar com diferentes opções relacionadas à inclusão de
controles (por exemplo, efeitos-fixos) e à estimação adequada de erros-padrão (por
exemplo, robustos à heterocedasticidade ou autocorrelação serial).
4 Questões práticas
Instrumentos fracos. Nesta seção discutimos uma série de questões práticas que
devemos considerar ao utilizarmos o método de VI. Em primeiro lugar, devemos reforçar o
fato de que é relativamente difícil encontrar um instrumento válido em aplicações. Como já
discutido, isso decorre em grande medida da restrição de exclusão. Ainda assim, mesmo
que a restrição de exclusão seja válida, podemos ter o problema de instrumentos fracos.
Vimos que, em última instância, o instrumento pode ser interpretado como uma alavanca
que nos permite gerar uma variação exógena em X e utilizá-la para a identificação do efeito
causal de X sobre Y no segundo estágio. Como discutimos também, a variação
remanescente em X contida em 𝑋𝑋̂ é apenas parte da variação total em X, o que significa
que temos menos informação nos dados para a identificação dos nossos parâmetros.
Quanto menos variação é gerada pela alavanca, menos informação carregamos para o
segundo estágio.
É possível demonstrar que, no limite, se temos um primeiro estágio fraco e eventualmente

uma pequena correlação entre o instrumento e o erro, podemos chegar a uma grande
inconsistência. Muito frequentemente temos também erros-padrão muito grandes no
segundo estágio, afinal estamos usando menos variação em nossa variável de interesse
para identificar o parâmetro de interesse. Felizmente existem algumas regras de bolso que
nos permitem detectar situações sob as quais instrumentos fracos podem resultar em
eventuais problemas de consistência e inferência. Um protocolo frequentemente utilizado é
a estimação e análise da estatística F do primeiro estágio – esta é a estatística que obtemos
de um teste F de significância sobre o instrumento ou conjunto de instrumentos utilizados
no primeiro estágio, no caso de estarmos utilizando mais de um. Como regra de bolso, uma
estatística F inferior a 10 sugere que podemos ter problemas relacionados a instrumentos
fracos.
Sempre podemos adicionar outros instrumentos à nossa estimação, naturalmente desde

que válidos. Em realidade, precisamos de pelo menos uma variável instrumental para cada
variável endógena de nosso modelo estrutural. Isso significa que se trabalhamos com duas
variáveis endógenas (por exemplo, a nossa variável de interesse sozinha e a mesma

375
interagida com alguma característica observável para fins de análise de heterogeneidade)
precisamos entrar no 2SLS com pelo menos dois instrumentos. Eventualmente temos
apenas uma variável endógena X, mas incluímos dois ou mais instrumentos em uma
tentativa de gerar mais variação exógena em X no primeiro estágio. O risco, por outro lado,
consiste em adicionar instrumentos com pouco poder preditivo no primeiro estágio e,
portanto, eventualmente fracos. Isso pode nos levar a uma estatística F pequena e um viés
alto sobre o estimador de 2SLS.
O que a alavanca move: LATE. O método de VI permite que utilizemos um instrumento,

uma fonte de variação exógena para X, de modo a avaliarmos o impacto de X sobre Y. No
entanto, o que exatamente essa alavanca move? Quais são as unidades de observação
que variam em X devido a variações em Z?
Para essa questão ficar mais clara, voltemos ao exemplo no qual o instrumento Z com
origem em um sorteio aleatório cujo resultado implica na adesão dos municípios sorteados
à política X. Por ser resultado de um sorteio, Z deverá ser independente das variáveis
observáveis ou não que podem estar contidas em U. Por outro lado, esperamos que Z afete
a adesão à política X, logo, quaisquer variações em Y induzidas por variações em Z devem
ocorrer via variações em X. Agora vamos separar duas situações. Na primeira delas, uma
vez sorteado, o município necessariamente adere à política X. Na segunda delas, uma vez
sorteado, o município pode ou não aderir à política X. Mas especificamente, suponha que
nesse segundo caso apenas os municípios de determinada macrorregião do país tende a
aderir à política. Considere também que temos efeitos heterogêneos, por exemplo, o efeito
da política neste grupo de municípios é diferente do efeito nos municípios do restante do
país (pode ser maior ou menor). Ao compararmos as duas situações, percebemos que no
primeiro caso a alavanca é mais transversal a todos os municípios, enquanto no segundo
ela tende a mover um grupo específico de municípios.
Se existem efeitos heterogêneos e estamos na segunda situação, então a variação

exógena na política X induzida por Z nos ajuda a identificar apenas parte do efeito causal
de X em Y, efeito esse válido para o grupo de municípios que se moveu devido a Z e que
não necessariamente reflete como X afeta Y nos demais municípios. O método de VI
apenas identifica o efeito causal das unidades de observação cujo comportamento variou
devido ao instrumento. Utilizando mais uma vez um jargão em inglês, chamamos essas
unidades de compliers – como apenas um grupo de municípios se moveu ao serem
sorteados, conseguimos recuperar o efeito de X sobre Y pelo método de VI apenas para

esse grupo de municípios. Nesse caso, se o instrumento é válido, podemos considerar que
nossos resultados têm validade interna, mas perdemos validade externa: nossas
conclusões referem-se a um grupo específico de municípios e não a todos os municípios.
Importante também mencionar que quando temos efeitos heterogêneos em nosso contexto
empírico, precisamos de algumas hipóteses adicionais para identificação, para além do
primeiro estágio e da restrição de exclusão como antes enunciados. Destaca-se a condição
de monotonicidade. Essa condição impõe que o instrumento afete o comportamento das
unidades de observação no mesmo sentido. Embora o instrumento possa ser incapaz de
mover algumas unidades (por exemplo, tenha efeito zero sobre a adesão de municípios à
política X no restante do país), quando ele induz mudança ele o faz no mesmo sentido:
todas as unidades afetadas movem-se no mesmo sentido, ou positivamente ou
negativamente. Essa condição é bastante técnica e sem ela não conseguimos garantir que
o parâmetro estimado recupere uma média ponderada do efeito causal no grupo das
unidades afetadas.
O respeito às condições para que o instrumento seja válido mesmo sob efeitos
heterogêneos, no entanto, não nos garante que tal alavanca nos entregue o resultado que
o faria sob efeitos homogêneos. Sob efeitos heterogêneos, o método de VI nos entrega um
efeito de tratamento médio local de X sobre Y, mais uma vez recorrendo a jargões, um
LATE (local average treatment effect): o parâmetro LATE é o efeito causal médio de X sobe
Y para aquelas unidades cujo comportamento foi alterado pelo instrumento Z.
Discussão de hipóteses e forma reduzida. Como já deve estar claro neste ponto,
trabalhar com variáveis instrumentais requer uma série de reflexões sobre condições
técnicas e interpretações que são próprias do contexto empírico. Importante enfatizar que
muito temos o que refletir e discutir sobre a restrição de exclusão, uma vez que essa é não
apenas condição fundamental para a validade do método como também uma hipótese não
testável. Em última instância, essa condição refere-se à relação entre o instrumento e as
demais variáveis não observáveis que podem afetar Y. Por ser uma condição não testável
empiricamente, a defesa ou o escrutínio da restrição de exclusão se dá no campo da teoria
e da lógica, sempre aplicadas ao contexto empírico no qual se dá a análise em questão.
Uma parte importante de um estudo que utiliza variáveis instrumentais, portanto, refere-se
à discussão sobre as hipóteses que garantem a validade da restrição de exclusão e sobre
as possíveis histórias alternativas que poderiam conectar Z a outros determinantes de Y
que não X.

377
Ao apresentarmos os resultados de primeiro e segundo estágios, portanto, o fazemos em
conjunto com outros resultados que nos informem – mesmo que indiretamente – se é válida
ou sob que hipóteses é válida a restrição de exclusão. Muito frequentemente reportamos
os resultados da chamada forma reduzida, ou seja, da relação direta entre o instrumento Z
e o resultado Y. A regressão de Y em Z tem também interpretação causal (do efeito direto
de Z sobre Y) caso Z seja de fato exógeno para Y: variações em Z afetam Y apenas via X,
não ocorrendo através de nenhum outro canal.
Combinação de técnicas. Como mencionado na introdução deste capítulo, o método de

VI é extremamente versátil e pode ser conjugado com outras técnicas – por exemplo, como
apoio a estudos aleatorizados, junto com métodos de regressão com descontinuidade e em
modelos de painel com efeitos-fixos. O método de VI combinado com outras técnicas pode
ser necessário por inúmeras razões. Por um lado, o uso do instrumento pode ser necessário
como complemento em estratégias empíricas baseadas em estudos experimentais, a
depender de como a aleatorização de determinado tratamento induz participação nesse
tratamento, e em descontinuidades, como é o caso de regressões descontínuas do tipo
fuzzy. Por outro lado, muito frequentemente encontramos estratégias que combinam VI e
dados em painel, onde o uso de efeitos-fixos de tempo e ao nível da unidade de observação
absorve a influência desses fatores e pode contribuir para a validade da restrição de
exclusão quando temos um instrumento com variação seccional e temporal. Naturalmente,
a combinação de técnicas depende da disponibilidade de dados e tende a ser bastante
específica a cada contexto empírico.
Aplicações de VI em pesquisa e avaliação de políticas públicas de saúde

Nesta seção descrevemos brevemente o uso do método de VI em uma aplicação sobre
saúde populacional e políticas de saúde no Brasil e discutiremos a avaliação de impacto do
programa Aqui Tem Farmácia Popular (ATFP) sobre hospitalizações e óbitos por doenças
crônicas. Nesse caso o uso de VI foi combinado com modelos em painel com base em
dados para municípios brasileiros.
O Programa Aqui Tem Farmácia Popular. O programa ATFP tem como objetivo ampliar
o acesso da população a medicamentos, principalmente de uso contínuo e para doenças
crônicas, através da participação de farmácias privadas. Américo e Rocha (2020)
examinaram em que medida a expansão do programa afetou taxas de hospitalização e
óbitos por doenças crônicas. Em particular, relacionaram o número per capita de farmácias
acreditadas pelo programa com taxas de mortalidade e hospitalizações por diabetes em

nível municipal, ao longo do tempo. Para tanto, montaram um painel anual de dados
municipais cobrindo um período de tempo longo o suficiente para incluir alguns anos antes
da introdução do programa bem como alguns anos depois que o programa já havia
consolidado a sua expansão. Nessa base de dados, portanto, estão relacionadas uma
medida que marca a penetração do programa no município (o número de farmácias
privadas acreditadas per capita) e medidas que indicam desfechos em saúde (taxas de
mortalidade e hospitalizações por diabetes). Os autores se concentram em diabetes com o
objetivo de analisar separadamente efeitos sobre diabetes tipo I e tipo II. Uma das hipóteses
examinadas refere-se a um efeito diferencial entre pacientes com um ou outro tipo de
diabetes já que a adesão ao tratamento de diabetes tipo II pode variar e depender
relativamente mais de facilidade de acesso e dos preços de medicamentos, enquanto
pacientes que tratam de diabetes tipo I não têm margem de escolha e devem aderir ao
tratamento.
Apesar da importância do ATFP, ainda não havia nenhuma avaliação realizada sobre os
efeitos do programa sobre a saúde da população e os desafios para a identificação de
quaisquer efeitos causais eram bastante claros. Como o programa se difundia através da
adesão de farmácias privadas, esperava-se que essa difusão ocorresse inicialmente em
lugares com maior demanda por medicamentos e onde a rede privada era maior – por
exemplo, em lugares com renda mais alta ou onde o perfil etário da população era mais
envelhecido. Nesse caso, o programa poderia estar seguindo endogenamente em direção
a locais com taxas mais altas de óbitos e hospitalizações por condições crônicas. Se esse
fosse o caso, uma análise de regressão mais superficial do programa poderia resultar em
estimativas com viés de subestimação.
Américo e Rocha (2020) definiram então um modelo em painel com efeitos-fixos de tempo
e municípios relacionando desfechos de saúde e presença do ATFP em combinação com
uma variável instrumental – algo que pudesse gerar uma variação exógena no ritmo de
acreditação de farmácias ao longo do tempo, condicional a controles observáveis,
características municipais fixas no tempo e a tendências de tempo comuns a todos os
municípios. De acordo com o desenho do programa, as farmácias teriam que comprovar
vínculo empregatício de um farmacêutico no momento de submissão dos documentos para
acreditação. No entanto, isso representou uma restrição de facto para muitas farmácias,
que não contavam com a presença de farmacêutico em seus contratos e tiveram
dificuldades de contratação. Os autores definem como instrumento o produto entre uma
tendência de tempo (variando, portanto, no tempo para todos os municípios) e o número

379
de farmacêuticos per capita no primeiro ano do programa (variando, portanto, entre
municípios, mas fixo no tempo). A hipótese por trás desse instrumento é a de que o
programa expandiu mais rapidamente em locais que contavam com maior oferta de
farmacêuticos em seu ano inicial. Espera-se que os efeitos-fixos de município absorvam a
influência de vários outros determinantes de saúde potencialmente relacionados à oferta
de farmacêuticos no primeiro ano do programa – por exemplo, é o caso de presença de
universidades, hospitais e outros serviços de saúde que variem lentamente no tempo.
Os dois gráficos a seguir nos ajudam a refletir sobre validade da restrição de exclusão. O
gráfico da esquerda mostra os coeficientes de uma regressão que relaciona o número de
farmácias acreditadas ao programa a interações entre dummies de ano e da oferta de
farmacêuticos per capita no município em 2006, primeiro ano do ATFP. Vemos que o
número de farmácias responde positivamente à oferta de farmacêuticos em 2006 ao longo
do tempo. O gráfico da direita realiza o mesmo exercício, mas agora utilizando a oferta de
funcionários de farmácia exceto farmacêuticos. Como podemos observar, não vemos
nenhuma relação sistemática entre a difusão do programa com a presença destes
funcionários. Esse padrão sugere que de fato a oferta inicial de farmacêuticos foi relevante
para a difusão do programa. Note que o instrumento não é definido como esta oferta, algo
que seria correlacionado com inúmeras outras características municipais relevantes e que
é absorvido por efeitos-fixos municipais, mas como a interação entre essa oferta e uma
tendência linear de tempo. Por hipótese, é essa variação bastante específica que induziria
exogenamente a difusão diferencial do programa entre municípios ao longo do tempo. Para
uma descrição de outros testes e uma discussão mais detalhada sobre a validade da
restrição de exclusão, ver a Seção 4 de Américo e Rocha (2020).
Figura 2 – Determinantes da difusão do Programa ATFP
Fonte: Americo e Rocha (2020).
Por fim, a Tabela 1 abaixo mostra os principais resultados econométricos do artigo para
taxas de hospitalização e mortalidade por tipo de diabetes. Cada célula da tabela refere-se

a uma regressão diferente – a depender da variável de desfecho e especificação. Nas
colunas variamos a especificação; na primeira delas reportamos os resultados de MQO
enquanto na seguinte mostramos os resultados de segundo estágio do 2SLS. Na última
coluna mostramos os resultados da forma reduzida, ou seja, quando a variável dependente
é regredida diretamente no instrumento. O desfecho utilizado varia entre linhas e painéis,
por tipo de desfecho e tipo de diabetes. Em todas as células reportamos o coeficiente (e
respectivo erro-padrão) que nos informa a relação entre ATFP e o desfecho.
Tabela 1 – Impactos do ATFP
Fonte: Americo e Rocha (2020).
Vamos nos concentrar na comparação entre os resultados de MQO e 2SLS. Observamos

no primeiro painel da Tabela 1 que os coeficientes para mortalidade por diabetes tipo 1 são
parecidos e bastante pequenos, próximos de zero. De fato, quando nos movemos do MQO
para o 2SLS, o coeficiente chega a diminuir de magnitude e torna-se insignificante. De
modo geral, os resultados sugerem não haver impacto do ATFP sobre mortalidade por
diabetes tipo I. No caso das taxas de hospitalização, verificamos que o coeficiente da
especificação de 2SLS é quase quatro vezes maior (em módulo) que o obtido pelo MQO.
Esses resultados sugerem que o parâmetro estimado por MQO estava viesado. Como
discutido acima, haveria um viés potencial de atenuação no MQO (ou seja, em direção a
zero ou eventualmente positivo, contra o programa) uma vez que variáveis omitidas (como
é o caso da demanda por medicamentos) poderiam estar positivamente correlacionadas ao
mesmo tempo com a difusão do programa e com desfechos piores de saúde. Ao utilizarmos
o método de VI encontramos um efeito maior em módulo, ou seja, o programa foi ainda

381
mais efetivo para a diminuição da taxa de hospitalização por diabetes tipo I em comparação
ao que nos foi informado pelo resultado do MQO.
No segundo painel encontramos um padrão similar para diabetes tipo II. Com relação aos
coeficientes de mortalidade, nota-se que o sinal chega a se inverter. Na primeira coluna, o
MQO nos informa uma associação positiva entre o programa e o desfecho. Ao nos
movermos para o 2SLS, vemos que o coeficiente se torna negativo e significativo a 10%.
No caso da hospitalização, verificamos que o coeficiente aumenta mais de 10 vezes (em
módulo) quando nos movemos do MQO para o 2SLS. Mais uma vez, encontramos que o
ATFP foi ainda mais efetivo para a diminuição da taxa de hospitalização por diabetes tipo
II em comparação ao que nos foi informado pelo resultado do MQO.
A comparação entre os painéis é bastante interessante. Na primeira coluna observamos

que, de acordo com o MQO, os efeitos do programa sobre hospitalizações são
relativamente parecidos nos casos de diabetes tipo I e II. Já na coluna de 2SLS,
observamos que o efeito do ATFP sobre hospitalizações por diabetes tipo II é três vezes
maior que o encontrado para o tipo I. Esses resultados reforçam a hipótese de que o
programa teve impactos mais fortes sobre a adesão ao tratamento de diabetes tipo II. Nesse
caso, o comportamento dos pacientes pode estar mais sujeito a questões relacionadas à
facilidade de acesso e aos preços de medicamentos, enquanto pacientes que tratam de
diabetes tipo I não têm margem de escolha e devem aderir ao tratamento – e assim o fariam
independentemente do programa.
O método de VI nos oferece uma ferramenta importante e versátil para desenhos empíricos
de identificação de impactos causais e avaliação de políticas públicas. Como discutimos
neste capítulo, no entanto, é fundamental termos claro que existem limitações. Em primeiro
lugar, a tarefa de encontrar uma variável instrumental válida é difícil e devemos ter sempre
em mente a validade da restrição de exclusão, além de outras questões técnicas relevantes.
Mesmo que essas questões sejam resolvidas, e são muitas, devemos lembrar também que
o método de VI nos permite identificar um parâmetro local (LATE) quando temos efeitos
heterogêneos – o que é muito comum em aplicações.
Isso dito, muitas vezes o uso desse recurso pode fazer a diferença. É importante termos
uma caixa de ferramentas completa e preparada para uso, e sem dúvida alguma o método

de VI deve fazer parte dessa caixa. Como mencionamos, às vezes como apoio a outras
técnicas (em estudos experimentais ou em regressão com descontinuidade do tipo fuzzy),
às vezes tomando o protagonismo e combinado com outras técnicas.
Por fim, é fundamental ter em vista que o uso adequado do método de VI deve respeitar
protocolos, dentre eles a discussão cuidadosa da restrição de exclusão. Por sua vez, a
restrição de exclusão não é verificável empiricamente e é muito contingente ao contexto
empírico em questão. Por esse motivo, é sempre muito importante que as aplicações com
VI tragam consigo uma descrição detalhada e bem refletida sobre o contexto empírico e, a
partir disso, a definição bem fundamentada do instrumento. Acredito que seja exatamente
isso que faça com que as aplicações com VI sejam tão interessantes, o uso adequado do
método requer algo para além do método: requer discussão conceitual e teórica, conectada
à construção da base de dados e definição das variáveis, e domínio sobre o que se passa
no contexto empírico.

383
Referências
AMÉRICO, P.; ROCHA, R. Subsidizing access to prescription drugs and health outcomes:
The case of diabetes. Journal of Health Economics, v. 72, p. 102347, 2020.
ANGRIST, J. D.; KRUEGER, A. B. Instrumental variables and the search for identification:
From supply and demand to natural experiments. Journal of Economic Perspectives, v.
15, n. 4, p. 69-85, 2001.
ANGRIST, J.; PISCHKE, J, S. Mostly harmless econometrics: an empiricists guide.

CUNNINGHAM, S. Causal inference: the mixed tape. New Haven: Yale University Press,
2021.
WOOLDRIDGE, J. Introdução à econometria: uma abordagem moderna. São Paulo:

Cengage Learning, 2010.

PARTE 4:
CIÊNCIA DE DADOS COM
FOCO NO DATASUS

385
Capítulo 15
Um debate sobre dados pessoais

e dados pessoais sensíveis para
pesquisa científica e para pesquisa
em saúde pública a partir da Lei Geral
de Proteção de Dados Pessoais
Bethânia Almeida1
1
Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS/Fiocruz)
RESUMO:
A pesquisa acadêmica e a pesquisa em saúde pública são contextos específicos de processamento
de dados pessoais na Lei Geral de Proteção de Dados (LGPD). No caso da pesquisa em saúde
pública, além dos devidos padrões éticos relacionados a estudos e pesquisas, será necessária a
regulamentação por parte da Autoridade Nacional de Proteção de Dados e das autoridades da área
da saúde para o adequado estabelecimento de procedimentos. O Brasil precisa envidar esforços para
construir um ecossistema de gestão e governança de dados para pesquisa que abarque a vinculação
de dados administrativos governamentais para pesquisa em saúde pública, com o intuito de subsidiar
a geração de conhecimento científico e de evidências para melhorar as condições de vida e de saúde
da população brasileira.
PALAVRAS-CHAVE:
Dados pessoais. Dados pessoais sensíveis. Pesquisa científica. Pesquisa em saúde pública. LGPD.

1 Introdução
No Brasil, a Lei Geral de Proteção de Dados Pessoais (LGPD), Lei nº 13.709/2018,
aprovada e sancionada em 2018, com vigência a partir de 2020, é um marco na
regulamentação de dados pessoais no país. Essa lei define dado pessoal como “informação
relacionada a pessoa natural, identificada ou identificável” e dado pessoal sensível como
“dado sobre origem racial ou étnica, convicção religiosa, opinião política, filiação a sindicato
ou a organização de caráter religioso, filosófico ou político, dado referente à saúde ou à
vida sexual, dado genético ou biométrico, quando vinculado a uma pessoa natural” (art.5º,
I e II).
A LGPD prevê que dados pessoais e dados pessoais sensíveis devem ser tratados de
forma legal, justa e transparente em relação aos titulares dos dados para mitigar potenciais
riscos em relação aos seus direitos e liberdades. O consentimento do titular dos dados ou
de seu responsável legal é requerido para coleta, processamento e utilização de dados
pessoais e dados pessoais sensíveis conjuntamente com garantias de transparência,
segurança e minimização no uso desses tipos de dados.
O art. 5º, inciso XII da lei define consentimento como “manifestação livre, informada e
inequívoca pela qual o titular concorda com o tratamento de seus dados pessoais para uma
finalidade determinada”. Entretanto, na LGPD existem situações em que a utilização de
dados pessoais e de dados pessoais sensíveis são permitidas sem o consentimento do
titular, desde que existam salvaguardas e proporcionalidade no uso dos dados para alcance
das finalidades. Dentre essas situações estão a pesquisa acadêmica e a pesquisa em
saúde pública.
No Brasil, todo protocolo de pesquisa que envolve seres humanos requer aprovação do
Sistema CEP/Conep com o objetivo de proteger o participante do estudo e assegurar que
esse seja conduzido de acordo com princípios éticos, a partir de resoluções e normativas
deliberadas pelo Conselho Nacional de Saúde1.
A sigla CEP se refere a Comitê de Ética em Pesquisa, instância institucional e local dos
órgãos de pesquisa. A sigla Conep faz referência à Comissão Nacional de Ética em
Pesquisa, instância nacional responsável por analisar projetos de pesquisa que possuem
cooperação internacional propostos pelo Ministério da Saúde e os de áreas temáticas
1
Para obter informações sobre as normativas deliberadas pelo Conselho Nacional de Saúde, acesse:
http://conselho.saude.gov.br/normativas-conep?view=default.

387
consideradas especiais, dentre as quais os estudos em genética humana e os que
envolvam populações indígenas.
Os Comitês de Ética em Pesquisa são colegiados situados em instituições de pesquisa,

que devem ser independentes e ter composição interdisciplinar. Para que funcionem bem
suas composições devem contar com pesquisadores e especialistas, membros da
sociedade e representantes de grupos sociais diversificados com o intuito de representar
perspectivas voltadas para os interesses dos participantes das pesquisas.
Nas resoluções e normativas do Sistema CEP/Conep, o consentimento para participar de

uma pesquisa se dá com base na autonomia e vontade do participante com garantias de
transparência, segurança e minimização no uso de informações e dados fornecidos para
atingir uma finalidade específica. Em geral, dados coletados de forma direta para responder
aos objetivos de um projeto de pesquisa possuem Termo de Consentimento Livre e
Esclarecido (TCLE) do participante do estudo ou Termo de Assentimento Livre e
Esclarecido (TALE) do seu responsável legal.
Existem situações em que o uso de dados pessoais e dados pessoais sensíveis para
pesquisa científica poderá ocorrer sem o consentimento do titular dos dados ou de seu
responsável legal. Tais situações precisam ser justificadas e seguir algumas condições em
termos de responsabilidades assumidas pelo coordenador do estudo para mitigar riscos e
assegurar os direitos dos participantes. Na LGPD, o tratamento desses tipos de dados para
pesquisa científica e para pesquisa em saúde pública sem o consentimento do titular
também poderá ocorrer, com base legal no interesse público, desde que seguidos os
requisitos e as recomendações estabelecidos nessa lei.
2 A pesquisa científica e a pesquisa em saúde pública na LGPD
Na LGPD, o respeito a padrões éticos é parte da legalidade do processamento de dados

pessoais, que deverá ser consistente com normatização específica do setor. Por essa
perspectiva, em maio de 2022, a Autoridade Nacional de Proteção de Dados (ANPD) 2
2
A ANPD é o órgão da administração pública federal responsável por zelar, implementar e fiscalizar o
cumprimento da LGPD no Brasil. Informações sobre a consulta pública intitulada “A LGPD e o tratamento de
dados pessoais para fins acadêmicos e para a realização de estudos por órgão de pesquisa” poderão ser
encontradas pelo link: https://www.gov.br/anpd/pt-br/assuntos/noticias/anpd-publica-estudo-tecnico-a-lgpd-
e-o-tratamento-de-dados-pessoais-para-fins-academicos-e-para-a-realizacao-de-estudos-por-orgao-de-
pesquisa.

colocou em discussão um estudo técnico intitulado “A LGPD e o tratamento de dados
pessoais para fins acadêmicos e para a realização de estudos por órgão de pesquisa”. O
principal objetivo da consulta pública pautou-se na coleta de subsídios para a adequada
interpretação da lei visando o estabelecimento de parâmetros, tanto para instituições de
ensino e pesquisa quanto para entidades e órgãos públicos responsáveis por analisar
pedidos de acesso e disponibilização de dados pessoais para fins de pesquisa científica.
No item 46 do documento em consulta pública consta:
É importante ressaltar que eventual dispensa do consentimento para os fins

da LGPD, em razão da incidência de outra base legal no caso concreto, não
afasta a necessidade de obtenção do consentimento dos participantes de
pesquisa quando assim exigido pelas normas e padrões éticos aplicáveis.
Portanto, é plenamente possível que o consentimento seja dispensável do
ponto de vista da legislação de proteção de dados pessoais e necessário do
ponto de vista ético. Nesse sentido, o art. 13 da LGPD é expresso quanto à
necessidade de que se considerem “os devidos padrões éticos relacionados
a estudos e pesquisas”, reconhecendo, dessa maneira, a existência de uma
relação complementar entre os campos legal e ético de regulação das
atividades de pesquisa (BRASIL, 2018).
Na LGPD, o tratamento de dados pessoais e de dados pessoais sensíveis para pesquisa

acadêmica e pesquisa em saúde pública é de responsabilidade institucional, pois a lei
refere-se exclusivamente a órgãos de pesquisa definidos como
[...] órgão ou entidade da administração pública direta ou indireta ou pessoa

jurídica de direito privado sem fins lucrativos legalmente constituída sob as
leis brasileiras, com sede e foro no País, que inclua em sua missão
institucional ou em seu objetivo social ou estatutário a pesquisa básica ou
aplicada de caráter histórico, científico, tecnológico ou estatístico (BRASIL,
2019, art. 5º, XVIII).
Ressalta-se ainda que nessa lei a pesquisa acadêmica e a pesquisa em saúde pública são
consideradas contextos específicos de processamento de dados pessoais e de dados
pessoais sensíveis, desde que busquem equilibrar os direitos individuais e a busca pelo
interesse público a partir da aplicação de medidas técnicas e organizacionais suficientes e
adequadas para garantir a proteção dos dados e o mínimo possível de processamento para
alcance dos objetivos das pesquisas e redução dos riscos relacionados à sua utilização
(DONEDA; BARRETO; ALMEIDA, 2019).
No artigo 4º, a LGPD estabelece seu escopo e define que não se aplica ao tratamento de
dados pessoais realizado para fins exclusivamente jornalístico, artístico e também
acadêmico. Para fim acadêmico remete para os artigos 7º e 11.

389
O artigo 7º define as condições para uso dos dados pessoais, entre as quais, no inciso IV,
“para a realização de estudos por órgão de pesquisa”, com a ressalva de que deve ser
“garantida, sempre que possível, a anonimização”. O artigo 11 veda o uso de dados
pessoais sensíveis sem o consentimento específico do titular. No entanto, estabelece
algumas exceções, entre as quais para a “realização de estudos por órgão de pesquisa,
sendo garantida, sempre que possível, a anonimização”.
Destaca-se ainda que a LGPD tem um artigo específico que dispõe sobre estudos em
saúde pública, o art. 13, o qual estabelece:
Na realização em estudos de saúde pública, os órgãos de pesquisa poderão

ter acesso a bases de dados pessoais, que serão tratados exclusivamente
dentro do órgão e estritamente para a finalidade de realização de estudos e
pesquisas e mantidos em ambiente controlado e seguro, conforme práticas
de segurança previstas em regulamento específico e que incluam, sempre
que possível, a anonimização ou pseudoanonimização dos dados, bem
como considerem os devidos padrões éticos relacionados a estudos e
pesquisas (BRASIL, 2018).
Nota-se que além da técnica de anonimização, a pseudonimização também é mencionada

no art. 13. A lei define anonimização como a “[...] utilização de meios técnicos razoáveis e
disponíveis no momento do tratamento, por meio dos quais um dado perde a possibilidade
de associação, direta ou indireta, a um indivíduo” (BRASIL, 2019, art. 5º, XI). Portanto, a lei
não se aplica aos dados anonimizados.
O conceito de pseudonimização é definido como “[...] o tratamento por meio do qual um

dado perde a possibilidade de associação, direta ou indireta, a um indivíduo, senão pelo
uso de informação adicional mantida separadamente pelo controlador em ambiente
controlado e seguro” (BRASIL, 2019, art. 13º, § 4.º). Na lei, dados pseudoanonimizados
são considerados dados pessoais pela possibilidade de rastrear os dados de volta ao
indivíduo por meio do código-chave.
Ainda sobre o art. 13, é dito que “o órgão de pesquisa será o responsável pela segurança
da informação prevista no caput desse artigo, não permitida, em circunstância alguma, a
transferência dos dados a terceiro” (BRASIL, 2019, art. 13, § 2.º). E que “o acesso aos
dados de que trata esse artigo será objeto de regulamentação por parte da autoridade
nacional e das autoridades da área da saúde e sanitárias, no âmbito de suas competências”
(BRASIL, 2019, art. 13, § 3º).

A particularidade da pesquisa em saúde pública também é reconhecida pelo Sistema
CEP/Conep ao considerar a Resolução CNS nº 580/2018, voltada para as especificidades
éticas das pesquisas de interesse estratégico para o Sistema Único de Saúde (SUS).
Pesquisas que contribuam para saúde pública, a justiça, a redução das desigualdades e
das dependências tecnológicas, bem como emergências de saúde pública.
Ao considerar que dados são imprescindíveis para geração de conhecimento científico e

de evidências para subsidiar políticas públicas, a seguir se abordarão alguns aspectos
éticos, legais e sociais relacionados à emergência de novos sistemas de produção de
conhecimento científico, a partir do fenômeno denominado Big Data e da gestão de dados
recomendada internacionalmente pelo movimento da ciência aberta.
3 Big Data, Ciência Aberta e LGPD
Preocupações acerca de como os dados são processados para avaliação de sua qualidade
e aderência a marcos éticos e regulatórios estão presentes na LGPD. Aspectos de suma
importância ao se considerar que a produção e reutilização de dados de distintas fontes em
um mundo cada vez mais digitalizado subsidiam a geração de conhecimento científico,
recorte do texto aqui apresentado.
A LGPD estabelece que os responsáveis pelo tratamento dos dados pessoais organizem e
mantenham registros sobre qualquer atividade relacionada ao processamento de dados
pessoais e de dados pessoais sensíveis. Além disso, institui que os titulares dos dados
possuem o direito de acesso facilitado às informações sobre qualquer tratamento pelos
quais seus dados sejam submetidos. Adicionalmente, a qualquer momento a ANPD poderá
solicitar relatórios e informações específicas sobre o tratamento dos dados para averiguar
se estão sendo seguidos princípios previstos na lei, como proporcionalidade no uso dos
dados para alcance da finalidade que embasou a coleta, transparência e não discriminação
(BRASIL, 2018).
Até então, os titulares dos dados não tinham o direito de saber sobre as formas de coleta e
organização de seus dados, inclusive para criação de seus perfis. Na LGPD, o titular dos
dados poderá pedir revisão do procedimento em decisões baseadas em análises
automatizadas.
O titular dos dados tem direito a solicitar a revisão de decisões tomadas
unicamente com base em tratamento automatizado de dados pessoais que
afetam seus interesses, incluídas as decisões destinadas a definir o seu

391
perfil pessoal, de consumo e de crédito ou os aspectos de sua personalidade
(BRASIL, 2018, art.20).
Em virtude do crescente volume de dados produzidos em diferentes formatos e utilizados

nos mais diversos setores da sociedade (Big Data) e da viabilidade de correlações entre
esses dados, apoiadas em aprendizagem de máquina também conhecida por inteligência
artificial (IA)3, inferências estatísticas sobre indivíduos, grupos e populações passam a ser
cada vez mais frequentes.
Algoritmos se baseiam em modelos criados para levar em consideração algumas

características, variáveis em detrimento de outras no conjunto de dados (WILLIAMS;
BROOKS; SHMARGAD, 2018). Um bom exemplo é o uso de IA acompanhado de melhoria
da representatividade de dados de minorias étnicas em uma pesquisa no sistema de saúde
do Reino Unido, o National Health Service (NHS), que visa evitar desigualdades de
atendimento que impactam no diagnóstico e mortalidade dos pacientes (GREGORY, 2021).
A gestão de dados é central na LGPD, aqui concebida como a administração de todo o ciclo
de vida dos dados, desde a coleta, tratamento, acesso e preservação destes.
Questões e implicações éticas devem ser levantadas em cada etapa da

pesquisa feita em Big Data, tornando-se assim um componente fundamental
da formação e do trabalho de quem cuida dos dados e dos métodos usados
para visualizá-los e analisá-los. Julgamentos e escolhas éticas estão ocultos
em todos os aspectos do gerenciamento de dados, incluindo escolhas que
a primeira vista, parecem puramente técnicas e, portanto, neutras do ponto
de vista social (LEONELLI, 2022, p. 81).
Destaca-se que a gestão de dados também é de suma importância para reutilização de

dados na perspectiva ciência aberta. Ao se considerar que a produção de conhecimento
científico se faz a partir de uma comunidade científica global, nos últimos anos os princípios
segundo os quais os dados devem ser Encontráveis (Findable), Acessíveis (Accessible),
Interoperáveis (Interoperable) e Reutilizáveis (Reusable) (FAIR) passaram a ser
considerados o padrão internacional para gestão de dados pela perspectiva da ciência
aberta para viabilizar a reutilização de dados, principalmente de dados de pesquisas
financiadas com recursos públicos.
3
Por meio de modelos analíticos automatizados, conhecidos por algoritmos, identificam-se padrões para
tomada de decisões a partir dos dados disponibilizados.

Esses princípios delineiam características, ferramentas, vocabulários e infraestruturas para
descoberta e reutilização de dados em aderência a marcos éticos e regulatórios. Assim, os
dados poderão ser fechados; acessados sob determinados termos e condições; e abertos,
acessados livremente sem restrições (ALMEIDA et al., 2021).
Outro aspecto a ser considerado é que a LGPD se refere exclusivamente aos direitos dos
indivíduos sobre seus dados e que dados anonimizados não são considerados dados
pessoais. Porém, mesmo sem fazer referência a uma pessoa identificada ou identificável,
informações como localidade, condições de saúde, raça/etnia e status socioeconômico
podem identificar grupos, comunidades e mesmo populações inteiras. Situações que
requerem escrutínio ético sobre os potenciais benefícios e riscos acerca das condições de
tratamento e das finalidades de uso desses dados.
A depender da finalidade da pesquisa, variáveis sobre raça/etnia, condições de saúde,

predisposições genéticas e status socioeconômico, por exemplo, precisam ser levadas em
consideração nas metodologias de coleta e análise dos dados para geração de
conhecimento científico. Aspectos que justificam as especificidades de processamento de
dados pessoais e de dados pessoais sensíveis para finalidades de pesquisa acadêmica e
de pesquisa em saúde pública na LGPD (Arts. 7º, 11º e 13º), desde que seguidos os
requisitos e as recomendações estabelecidas na lei.
Nessa perspectiva, análises estatísticas também devem se apoiar em pesquisas das

ciências sociais e humanas acerca de experiências e contextos dos grupos em questão
para mitigar riscos de invisibilização das suas especificidades nas decisões baseadas
estritamente em médias estatísticas (WILLIAMS; BROOKS; SHMARGAD, 2018).
Direitos de grupos sobre seus dados passaram a fazer parte de discussões e orientações
voltadas para a gestão de dados pela perspectiva da ciência aberta. Notadamente a
governança de dados baseada nos princípios Collective Benefit, Authority to Control,
Responsability, Ethics (CARE), acrônimo do inglês para Benefício Coletivo, Autoridade para
Controlar, Responsabilidade, Ética.
Os princípios voltados à proteção de direitos e soberania de povos indígenas sobre seus
dados; gestão e governança de dados pautada no consentimento e acompanhamento dos
usos e reusos de dados individuais, coletivos, ambientais, sociais, religiosos, ancestrais e
culturais a esses relacionados, devem estar em consonância com os valores e interesses
desses povos (GLOBAL INDIGENOUS DATA ALLIANCE, 2022). Os princípios CARE

393
buscam dialogar com os princípios FAIR para viabilizar a localização, acesso e
interoperabilidade e (re)uso de dados de forma ética, responsável e equitativa (VIDOTTI;
TORINO; CONEGLIAN, 2021).
A gestão de dados articula aspectos técnicos com aspectos sociais – por buscar manter a
segurança e confidencialidade dos dados em respeito aos direitos de indivíduos e de grupos
– e a transparência acerca da proveniência e tratamento aplicado para avaliação da
qualidade e da adequação dos dados às finalidades de (re)utilização.
Ao reconhecer algumas preocupações éticas, legais e sociais em torno dos usos e reusos
de dados pessoais e de dados pessoais sensíveis de indivíduos e grupos a partir da
utilização e Big Data e da gestão de dados pela perspectiva da ciência aberta, a seguir se
abordará a utilização de dados administrativos governamentais para pesquisa científica e
para pesquisa em saúde pública.
4 Dados administrativos para pesquisa científica e para pesquisa em saúde pública
Dados administrativos são coletados por instituições governamentais no exercício de suas

atividades para execução de políticas, administração de programas e prestação de serviços
à sociedade. Dados que podem incluir informações pessoais sobre os cidadãos quando
esses interagem com o governo em suas distintas instâncias, como condições de saúde,
local de residência, vínculos familiares, participação em programas sociais, dentre outras.
Por exemplo, dados coletados nos serviços de saúde alimentam sistemas de informação
sobre doenças, agravos e mortalidade utilizados para gerar indicadores sobre as condições
de saúde da população.
Destaca-se que dados administrativos não são uma amostra de toda a população, mas
representativos de um segmento populacional que tem um ou mais atributos em comum.
Dentre as vantagens de se utilizarem estes tipos de dados, destacam-se os grandes
tamanhos das amostras, populações bem caracterizadas e informações coletadas ao longo
do tempo, que possibilitam a realização de estudos longitudinais retrospectivos e
prospectivos (BRAVEMAN; GOTTLIEB, 2014; SANCHEZ et al., 2021; PAIXÃO et al., 2021).
Tradicionalmente dados administrativos são utilizados de forma isolada. Na pesquisa

científica, comumente são usados de-identificados ou agregados em nível municipal,

estadual ou federal. Nos últimos anos, a integração de dados administrativos em nível
individual passou a ser um recurso importante para estudos de base populacional.
A integração (linkage) de informações contidas em diferentes bases de dados, como bases

administrativas, epidemiológicas e clínicas, tem sido uma abordagem utilizada para
responder a questões científicas complexas e para produzir evidências com alto nível de
validade externa e, portanto, com maior aplicabilidade para elaboração de políticas
públicas. A despeito da necessidade de dados individualizados para viabilizar a aplicação
de técnicas de vinculação de registros de uma pessoa em diferentes bases de dados
(Record Linkage), esses processos não buscam informações em nível individual, mas
padrões, regularidades estatísticas que emergem das correlações entre os dados. Os
resultados são divulgados de maneira agregada, em forma de tabelas, gráficos, sem
necessitar fazer referência a qualquer indivíduo em particular (DONEDA; BARRETO;
ALMEIDA, 2019).
Dados administrativos são um tipo de Big Data, cujo acesso e integração entre bases
apresentam desafios éticos, legais e metodológicos. Pesquisadores em saúde pública
precisam levar em consideração uma série de desafios que visam assegurar direitos de
indivíduos e grupos; e a avaliação dos benefícios e potenciais riscos causados pelo uso de
Big Data de modo a ter um conjunto de medidas que viabilizem o uso dos dados para
melhorar as condições de saúde da população (SALERNO et al., 2017).
A transformação de dados administrativos em fonte de informações para pesquisa científica

e para pesquisa em saúde pública apresenta um conjunto de desafios relacionados à
privacidade, ética, regulação do acesso, pré-processamento das bases originais (seleção,
limpeza, padronização e harmonização das variáveis) e utilização de algoritmos adequados
aos tipos e tamanhos das bases de dados para serem adequadamente vinculadas com
qualidade e acurácia (BARRETO et al., 2019).
O uso de dados pessoais e dados pessoais sensíveis em conformidade com a LGPD,

requer, portanto, investimentos em tecnologia, infraestrutura e pessoal especializado para
que os dados sejam tratados de forma lícita, justa e responsável em relação aos seus
titulares, além de prever o princípio da responsabilização por meio de acompanhamento
das atividades de processamento pelas autoridades designadas, as quais poderão aplicar
sanções quando houver descumprimento da lei (ALMEIDA et al., 2020).

395
Alguns países passaram a contar com centros voltados para a integração de dados
administrativos para pesquisa científica, geralmente estabelecidos a partir de parcerias
entre governos e órgãos de pesquisa4 Centros que possuem arranjos físicos, virtuais e
organizacionais, bem como pessoal especializado para prover dados integrados,
anonimizados ou agregados com qualidade e acurácia e que, portanto, viabilizam a gestão
e a governança de dados administrativos integrados para pesquisa, de forma segura e
responsável, de maneira aderente às recomendações preconizadas na LGPD para o
tratamento de dados pessoais e dados pessoais sensíveis para pesquisa acadêmica e
pesquisa em saúde pública.
No Brasil, ainda não existem iniciativas nesses moldes institucionais, apesar de estudos
que utilizam técnicas de vinculação de dados para pesquisa em saúde ocorrerem desde a
década de 1990. Em 2014, houve uma iniciativa intitulada Seminário sobre a Vinculação de
Bases de Dados na Saúde, na cidade do Rio de Janeiro, organizado pelo Departamento de
Informática do Sistema Único de Saúde (Datasus)/Ministério da Saúde, com a participação
de atores nacionais e convidados de países reconhecidamente desenvolvidos nessa área.
Foram discutidos princípios para orientar a normatização e padronização da utilização de
bancos de dados identificados e vinculados para gestão e pesquisa em saúde e incentivar
o Brasil a adotar um modelo nacional de vinculação de bases de dados populacionais
(COELI; PINHEIRO; CAMARGO JÚNIOR, 2015).
Outra experiência brasileira é o Centro de Integração de Dados e Conhecimentos para

Saúde (Cidacs), vinculado à Fiocruz Bahia. Inaugurado em dezembro de 2016, com a
missão de realizar pesquisas sobre os determinantes sociais da saúde para contribuir com
a ampliação de conhecimentos e evidências científicas para melhorar as condições de vida
e de saúde da população brasileira a partir da integração de dados populacionais.
Desde então, o Cidacs estruturou um complexo sistema de gerenciamento de dados com
dispositivos de segurança da informação, ética e privacidade. A integração das bases de
dados e o acesso aos dados integrados e anonimizados ocorrem em ambiente controlado
e seguro sob determinados termos e condições, em conformidade com a finalidade da
4
Alguns exemplos no Reino Unido, Canadá, Estados Unidos e Austrália: SAIL Databank.
https://saildatabank.com/; Administrative Data Research UK. https://www.adruk.org/; Population Data BC.
https://www.popdata.bc.ca/; Massive Data Institute. https://mdi.georgetown.edu/; Population Health
Research. Network (https://www.phrn.org.au/); Center for Health Services Research
https://chsr.centre.uq.edu.au/research/administrative-data-analytics.

cessão das bases de dados que se relacionam a estudos de saúde pública (BARRETO et
al., 2019).
No contexto do trabalho desenvolvido no Cidacs e da entrada em vigor da LGPD, entre

2020 e 2021 foi realizado um estudo exploratório de caráter qualitativo sobre percepções e
experiências de titulares de dados, pesquisadores e gestores governamentais sobre usos
e reusos de dados pessoais como fonte de informação para pesquisa científica e para
políticas públicas.
Dentre os achados, apontou-se como uma necessidade a viabilização de um ecossistema

de governança de dados administrativos no país com ética, transparência e segurança da
informação, que inclua a institucionalização da vinculação de dados administrativos com
finalidade de pesquisa. Ações voltadas para a literacia sobre dados e direitos de seus
titulares e a criação de mecanismos de engajamento da população nas decisões sobre seus
dados também foram indicadas como necessárias (ALMEIDA; PIMENTA, 2021).
A LGPD é um marco importante na proteção de dados pessoais no país por estabelecer

base legal, segurança jurídica para os titulares dos dados e seus agentes de tratamento.
No que tange ao tratamento de dados pessoais e dados pessoais sensíveis para pesquisa
científica e pesquisa em saúde pública, a lei determina que devem estar em consonância
com os devidos padrões éticos relacionados a estudos e pesquisas. No caso da pesquisa
em saúde pública, além da normatização ética em pesquisa, estabelece a necessidade de
regulamentação por parte da autoridade nacional e das autoridades da área da saúde e
sanitárias, no âmbito de suas competências.
Sendo, portanto, necessário o diálogo entre a ANPD, o Sistema CEP/Conep, a comunidade

acadêmica e os órgãos governamentais responsáveis por analisar pedidos de acesso e
disponibilização de dados pessoais para fins de pesquisa científica para adequada
interpretação da lei, com vistas ao adequado estabelecimento de procedimentos.
Adicionalmente ao estabelecimento de normatização específica para o tratamento de dados
pessoais para fins acadêmicos e para a realização de estudos por órgão de pesquisa em
consonância com a LGPD, serão necessários esforços, estratégias e investimentos
nacionais para se estabelecer um ecossistema de dados para pesquisa, particularmente de

397
vinculação de dados para pesquisa em saúde pública, os quais incluem pesquisas
estratégicas e de interesse para o SUS.
Ressalta-se ainda que a LGPD poderá dinamizar processos de literacia sobre direitos
individuais e coletivos sobre seus dados que incluam a sensibilização e o provimento de
informações sobre direitos, finalidades de uso, possíveis exceções para uso de dados
secundários sem o consentimento do titular e salvaguardas previstas na lei.
A participação e o engajamento de diferentes segmentos da sociedade civil nos

mecanismos de governança de dados, principalmente de dados administrativos para
pesquisa científica e para pesquisa em saúde pública, também poderão ser delineados e
implementados para estabelecer relações de confiança e de transparência entre as partes
envolvidas e interessadas.
Dados pessoais e dados pessoais sensíveis são tradicionalmente utilizados na pesquisa

científica e na pesquisa em saúde pública. Em virtude da crescente produção e utilização
de dados apoiados por tecnologias cada vez mais especializadas para processar,
correlacionar e visualizar grandes volumes de dados nos diferentes segmentos da
sociedade, regulamentações são imprescindíveis para enfrentar os desafios éticos, legais
e sociais para garantir privacidade, confidencialidade, segurança da informação e direitos
humanos em países democráticos, pois dados pessoais e dados pessoais sensíveis podem
ser utilizados como mercadorias ou como bens públicos, a depender dos atores e
interesses envolvidos.

Referências
ALMEIDA, B. A. et al. Preservação da privacidade no enfrentamento da COVID-19: dados

pessoais e a pandemia global. Ciência & Saúde Coletiva, v. 25, supl. 1, p. 2487-2492,
2020. Disponível em:
https://www.scielo.br/j/csc/a/T6rwdhnTNzp5vYr84w9xthB/abstract/?lang=pt. Acesso em:
27 set. 2022.
ALMEIDA, B.; PIMENTA, D.; BARRETO, M. Compartilhamento e abertura de dados na

Ciência Aberta e a pesquisa em saúde pública na Lei Geral de Proteção de Dados. Bahia
Análise & Dados, v. 31, p. 78-92, 2021.
ALMEIDA, B.; PIMENTA, D. Percepções e experiências sobre compartilhamento e

vinculação de dados para pesquisa e avaliação de políticas públicas na área da
saúde. Salvador: Cidacs/Fiocruz, 2021.
BARRETO, M. L. et al. The Centre Data and Knowledge Integration for Health (CIDACS):
linking health and social data in Brazil. International Journal of Population Data
Science, v. 4, n. 2, p. 1-11, 2019. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8142622/pdf/ijpds-04-1140.pdf. Acesso em:
27 set. 2022.
BRASIL. Lei nº 13.709, de 14 de agosto de 2018. Lei Geral de Proteção de Dados

Pessoais (LGPD). Diário Oficial da União: seção 1, Brasília, DF, 15 ago. 2018.
Disponível em: http://www.planalto.gov.br/ccivil_03/_ato2015-2018/2018/lei/L13709.htm.
BRASIL. Lei nº 13.853 de 8 de julho de 2019. Altera a Lei nº 13.709, de 14 de agosto de

2018, para dispor sobre a proteção de dados pessoais e para criar a Autoridade Nacional
de Proteção de Dados; e dá outras providências. Brasília, DF: Presidência da República,
2019. Disponível em: http://www.planalto.gov.br/ccivil_03/_ato2019-2022/2019/lei/l13853
.htm. Acesso em: 27 set. 2022.
BRAVEMAN, P.; GOTTLIEB, L. The social determinants of health: it’s time to consider the
causes of the causes. Public Health Reports, v. 129, supl. 2, p. 19-31, 2014. Disponível
em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3863696/. Acesso em: 27 set. 2022.
COELI, C. M.; PINHEIRO, R. J.; CAMARGO JÚNIOR, K. R. Conquistas e desafios para o

emprego das técnicas de record linkage na pesquisa e avaliação em saúde no Brasil.
Epidemiologia Serviços de Saúde, v. 24, n. 4, p. 795-802, out./dez 2015. Disponível em:
https://www.scielo.br/j/ress/a/zH4GSZzP9DNZRxwGz3wpMTL/?lang=pt. Acesso em: 27
set. 2022.
DONEDA, D.; BARRETO, M. L.; ALMEIDA, B. A. Uso e proteção de dados pessoais na

pesquisa científica. Revista Direito Público, v. 16, n. 90, p. 20-40, 2019. Disponível em:
https://www.portaldeperiodicos.idp.edu.br/direitopublico/article/view/3895. Acesso em: 27
set. 2022.
GLOBAL INDIGENOUS DATA ALLIANCE. Promoting indigenous control of

indigenous data. 2022. Disponível em: https://www.gida-global.org/. Acesso em: 27 set.
2022.

399
GREGORY, A. Al projects to tackle racial inequality in UK healthcare, says Javid.
Exclusive: health secretary signs up to hi-tech schemes countering health disparities and
reflecting minority ethnic groups’ data. The Guardian, 20 de out. 2021. Disponível em:
https://www.theguardian.com/technology/2021/oct/20/ai-projects-to-tackle-racial-inequality-
in-uk-healthcare-says-javid. Acesso em: 27 set. 2022.
LEONELLI, S. A pesquisa científica na era do Big Data: cinco maneiras que mostram
como o Big Data prejudica a ciência e como podemos salvá-la. Tradução de Carla Cristina
Munhoz Xavier. Rio de Janeiro: Fiocruz, 2022.
PAIXÃO, E. S. et al. Associations between cesarean delivery and child mortality: a

national record linkage longitudinal study of 17.8 million births in Brazil. PloS Medicine, v.
18, n. 10, p. 1-18, 2021. Disponível em: https://pubmed.ncbi.nlm.nih.gov/34637451/.
SALERNO, J. et al. Ethics, big data and computing in epidemiology and public health.
Annals of Epidemiology, v. 27, n. 5, p. 297-301, 2017. Disponível em:
https://pubmed.ncbi.nlm.nih.gov/28595734/. Acesso em: 27 set. 2022.
SANCHEZ, M. N. et al. Physical disabilities caused by leprosy in 100 million cohort in
Brazil. BMC Infectious Diseases, v. 21, n. 1, p. 1-11, 2021. Disponível em:
VIDOTTI, S. A. B. G.; TORINO, E.; CONEGLIAN, C. S. #SejaJUSTOe CUIDADOSO:

princípios FAIR e CARE na gestão de dados de pesquisa. In: SALES, L. F. et al. (orgs.).
Princípios FAIR aplicados à gestão de dados de pesquisa. Rio de Janeiro: IBICT,
2021. p. 201-214. Disponível em: https://ridi.ibict.br/bitstream/123456789/1182/2/IBICT_
Principios%20FAIR%20aplicados%20a%20gest%C3%A3o%20de%20dados%20de%20p
esquisa_2021.pdf. Acesso em: 27 set. 2022.
WILLIAMS, B. A.; BROOKS, C. F.; SHMARGAD, Y. How algorithms discriminate based on

data they lack: challenges, solutions, and policy implications. Journal of Information
Policy, v. 8, n. 78, p. 78-115, 2018. Disponível em: https://www.jstor.org/stable/10.5325/
jinfopoli.8.2018.0078#metadata_info_tab_contents. Acesso em: 27 set. 2022.

Capítulo 16
Segurança no uso dos dados sensíveis

para pesquisa em saúde: Repositório
de dados
Marcio Natividade1
Samilly Silva Miranda1
Alberto Sironi1
Evandro Mota Lopes Neto1
Juracy Bertoldo1
1
RESUMO:
Com o crescimento exponencial da produção de dados, cada vez mais os pesquisadores têm se
apropriado da análise de grandes bancos de dados (Big Data), embora sejam necessários muitos
requisitos que envolvem a ética, a segurança, o armazenamento e a gestão. Este capítulo, de forma
sintética, discorre sobre a segurança e gestão da informação, a partir de dados sensíveis (identificados)
no campo da saúde, apresentando a infraestrutura necessária para garantir a salvaguarda desses
dados com segurança, bem como discutindo aspectos que viabilizem as pesquisas em saúde no
contexto da Lei de Geral de Proteção de Dados (LGPD) de 13.709/2018.
PALAVRAS-CHAVE:
Produção de dados. Big Data. Ética, segurança e gestão da informação.

401
1 Introdução
A produção da informação em saúde fundamenta-se na obtenção de dados e sua posterior

análise. Os dados podem ser gerados 1) de forma contínua, como aqueles produzidos a
partir do preenchimento das declarações de nascimentos e óbitos ou das fichas de
notificação compulsória; 2) de forma periódica, como no recenseamento da população; ou
3) podem ser levantados de forma eventual, por meio de pesquisas que visam atender
objetivos específicos. Independentemente da origem do dado, o essencial para uma
pesquisa científica é garantir acesso a dados fidedignos e completos que possibilitem
responder a determinada pergunta de investigação.
Os dados são produzidos com a finalidade de descrever, comparar, analisar ao longo do

tempo mudanças no estado de saúde das populações, mensurar possíveis associações
entre eventos, bem como levantar fatores que favorecem a ocorrência e distribuição de
doenças e agravos em saúde, de modo a contribuir com a tomada de decisão. As fontes
podem ser primárias – obtidas de indivíduos participantes das investigações, quando
examinados ou entrevistados, como é o caso dos inquéritos e dos estudos observacionais
– ou por meio de fontes secundárias – as que se referem, por exemplo, àqueles registrados
nos sistemas de informação. É preciso compreender que qualquer dado que direta ou
indiretamente contribua para revelar o quadro sanitário da população tem sua relevância
tanto para a produção do conhecimento, quanto para o planejamento e gestão em saúde.
No Brasil, diversas ações, planos e projetos visando a estruturação e a organização da área

de informação no âmbito nacional foram desenvolvidas nas últimas décadas. O país possui
Sistemas de Informações em Saúde (SIS) continuamente alimentados, os quais são
capazes de gerar grandes bancos de dados nacionais, tais como o Sistema de Informação
sobre Mortalidade (SIM); o Sistema de Informação sobre Nascidos Vivos (Sinasc); o
Sistema de Informação sobre Agravos de Notificação (Sinan); o Sistema de Informações
Ambulatoriais do Sistema Único de Saúde (SIA/SUS), o Sistema de Informações
Hospitalares do Sistema Único de Saúde (SIH/SUS), dentre outros.
Os principais avanços dos SIS consistem no fato de ser organizado de forma

descentralizada nos estados e municípios, com ampla cobertura nacional, e de haver
facilidade no acesso aos dados – por meio do Departamento de Informática do Sistema
Único de Saúde (Datasus) – o que facilita a utilização de dados de distintas bases, mediante
o uso das ferramentas disponíveis como o TabWin e TabNet. Embora haja grandes
avanços, a desagregação e a falta de unicidade ou intercomunicação entre os sistemas

impossibilitam se responder a muitas perguntas. Não é possível, por intermédio de dados
públicos não identificados, que os indivíduos sejam acompanhados ao longo do tempo em
diferentes sistemas, de modo a compreender possíveis causas de alguns desfechos. Para
tal, o acesso a dados sensíveis (identificados e individualizados) possibilita que se realizem
vinculações (linkage1) de bancos de dados de diferentes sistemas de informação. A
possibilidade de se realizar o linkage entre o SIA-SUS e o SIM, por exemplo, pode permitir
a identificação de fatores de risco de determinados óbitos e, por consequência, orientar a
implementação de ações com vistas à redução e/ou controle das taxas de mortalidade.
A aplicação de técnicas de Big Data nas pesquisas e avaliações em saúde é realidade no

Brasil e em grande parte do mundo durante algum tempo. Embora existam inúmeros
desafios (metodológicos, várias linguagens de programação, dados faltantes etc.), depara-
se com a barreira da ética, uma vez que a maioria dos processos demanda o acesso a
dados pessoais. Diversos países apresentam legislações em conformidade com a proteção
de dados individuais, inclusive no campo dos estudos em saúde (COELI; PINHEIRO;
CAMARGO JÚNIOR, 2015). No Brasil, foi publicada a Lei Geral de Proteção de Dados
Pessoais (LGPD) - nº 13.709/2018, de 14 de agosto de 2018, com redação atual, dada pela
Lei nº 13.853, de 2019. Essa lei dispõe sobre o tratamento de dados pessoais, inclusive
nos meios digitais, por pessoa natural ou por pessoa jurídica de direito público ou privado,
com o objetivo de proteger os direitos fundamentais de liberdade e de privacidade e o livre
desenvolvimento da personalidade da pessoa natural (BRASIL, 2019). A legislação
brasileira, além de buscar garantir o direito à privacidade, permite que se utilizem os dados
identificados para fins de pesquisa, desde que garantido, quando possível, a anonimização
dos dados pessoais. É possível, dessa maneira, assegurar tanto a proteção dos dados
individuais quanto os ganhos para a população com os resultados das investigações.
Ao compreender a importância do acesso a dados secundários de forma individualizada e

identificada, este capítulo objetiva discorrer sobre a segurança e gestão da informação, a
partir de dados sensíveis no campo da saúde. Desse modo, pretende-se apresentar a
infraestrutura necessária para garantir a salvaguarda desses dados com segurança, pela
perspectiva de um Repositório Seguro de Dados, bem como discutir aspectos que
viabilizem as pesquisas em saúde no contexto da LGPD.
1
Linkage consiste na ligação de dois ou mais bancos de dados independentes, com a característica de
possuírem variáveis em comum (SILVA; LEITE; ALMEIDA, 2009).

403
2 Big Data e repositório
O termo Big Data concebe os conceitos de volume, velocidade e variedade de dados

provenientes de diferentes origens. Diante de um contexto em que muitos dados são
produzidos diariamente, muitas informações foram construídas e muitas respostas ainda
precisam ser dadas, ampliam-se os esforços para utilizar o grande volume de dados
existente para explicar fenômenos em diversos campos do saber (SAETRA, 2018; CORSI
et al., 2020). O Big Data tem o grande desafio de detectar nós críticos que possam favorecer
melhorias na saúde das populações, por meio da identificação de estratégias que permitam
a melhoria no acesso aos cuidados de saúde, bem como de ações de prevenção, promoção
e recuperação da saúde, considerando-se inclusive as desigualdades sociais.
Para Zhang et al. (2017), existem três possibilidades que a ciência do Big Data pode
oferecer para minimizar as disparidades em saúde: incorporar informações padronizadas
sobre determinantes demográficos e sociais nos registros eletrônicos de saúde; vincular
variáveis geográficas e determinantes sociais da saúde a dados clínicos e resultados de
saúde; e levar à melhor compreensão da etiologia das disparidades de saúde. Essas ações
tendem a contribuir para o melhor direcionamento das políticas públicas e das práticas em
vigilância, bem como orientar o desenvolvimento de intervenções prioritárias e adequadas
a cada grupo populacional.
Em certo sentido, o Big Data é dependente da existência de equipamentos e programas

informatizados que possibilitem processar o grande volume de dados em velocidade cada
vez maior, com capacidade de armazenamento e transmissão de dados com qualidade e
segurança. Não se pode esquecer que a quantidade de dados pode não indicar a qualidade
desses. Ainda, a grande quantidade de variáveis utilizadas em Big Data pode aumentar o
número de associações espúrias, o que é uma limitação importante (CHIAVEGATTO
FILHO, 2015). É fundamental, portanto, que alinhada com o interesse crescente de
pesquisadores e cientistas em várias aplicações no uso de grandes bancos de dados, haja
a preocupação com a integridade e preservação desses dados, recolhendo-os, zelando
pela sua manutenção e colocando-os à disposição de quem desses necessita, sem se
esquecer da privacidade das pessoas.
Os repositórios seguros de dados são, nesse contexto, espaços destinados à curadoria de

dados científicos, recolhidos e produzidos durante atividades de pesquisa. O bom
desempenho de um repositório está associado não apenas à existência de adequada
infraestrutura técnica – como sistemas, normas, protocolos e equipamentos – que permita

o adequado armazenamento, preservação, organização e análise dos dados; também é
necessário contar com profissionais capacitados para a gestão dos dados com
responsabilidade para com a ciência e para com os dados pessoais dos indivíduos incluídos
em cada investigação (RODRIGUES et al., 2010). Portanto, a utilização de Data Lake (DL)
pode ser benéfica em variados aspectos discutidos a seguir.
3 Visão geral Data Lake
A geração de dados cresce de maneira exponencial, o que impõe a necessidade de se

dispor de tecnologias capazes de armazenar, categorizar, processar e analisar o acentuado
número de dados produzidos ao longo do tempo, o que se pode traduzir na engenharia de
dados. Dentre as tecnologias existentes para compor repositórios de Big Data, está o Data
Lake (RAU, 2021), um tipo de repositório que armazena conjuntos grandes e variados de
dados brutos em formato nativo – não modelados e não transformados.
O termo Data Lake (lago de dados em português) foi criado em 2010 por James Dixon e
sua equipe da Pentaho (software de business intelligence) (DIXON, 2015). Essa
nomenclatura faz analogia a um corpo d'água que não foi filtrado ou contido, o que
representaria um repositório capaz de armazenar dados em seu estado natural/original.
Pela sua potencial capacidade de armazenamento de dados oriundos de diversas fontes,

estruturas e modelagens (OLIVEIRA; ALMEIDA, 2020), o DL permite que esses sejam
utilizados para atender a diversos objetivos de pesquisas. Nesse repositório, os dados são
transformados apenas quando se deseja realizar determinada análise, com o intento de se
obter informações específicas. Não é necessário, portanto, que se tenha uma estruturação
prévia dos dados, os quais são incluídos em seu formato de origem: Estruturado,
Semiestruturado ou Não Estruturado (figura 1). Por sua vez, quando os dados são obtidos
e armazenados apenas de maneira estruturada, a reutilização se torna limitada, por terem
sido enquadrados em esquemas pré-definidos (Data Warehouse).

405
Figura 1 - Principais diferenças entre os dados estruturados,
semiestruturados e não-estruturados
Fonte: https://www.salesforce.com/br/blog/2020/10/data-warehouse-e-data-lake.html.
Os Data Lakes (DLs) exigem governança, segurança e manutenção contínuas para que os
dados possam ser usados e acessados. De acordo com Miloslavskaya e Tolstoy (2016)
alguns requisitos devem ser considerados para o devido suporte aos DLs: uma arquitetura
escalável; governança e aplicação de políticas de retenção, disposição, identificação de
dados; catalogação e indexação centralizada do inventário de dados (e metadados)
disponíveis, incluindo fontes, versionamento, veracidade e precisão; capacidade de
relacionamento de um banco de dados relacional; informações sobre o que foi feito com o
dado, quando e sua origem; facilidade de acesso, gerência e análise, dentre outros.
Embora o DL tenha atraído mais atenção das áreas de negócios do que das áreas de
pesquisa acadêmica (KHINE; WANG, 2018), pode ser empregado nos estudos de
diferentes áreas, como da saúde, genoma, meio ambiente etc. Ter acesso a grandes
volumes de dados possibilita a produção de informações mais confiáveis, que tendem a
facilitar o monitoramento, controle e erradicação de doenças e agravos em saúde. No
entanto, para que os benefícios desse repositório de dados sejam de fato alcançados é
imprescindível que as instituições de pesquisa possuam infraestrutura mínima para
armazenar e garantir a gestão dos dados científicos de maneira fácil, rápida e segura.
4 Infraestrutura
A infraestrutura de Tecnologia da Informação (TI) está diretamente relacionada com a

combinação entre os seus componentes e o tipo de infraestrutura. Os componentes são

formados por seis elementos: hardware, software, gestão de dados, redes, serviços de
tecnologia e recursos humanos, enquanto o tipo de infraestrutura pode ser dividido em
dois: tradicional e em nuvem, comumente chamada de cloud.
No que se refere aos componentes, pode-se destacar que:

• O hardware representa os equipamentos físicos e pode se dividir em interno e
externo. As partes internas de um computador, como processador, placa-mãe e
memória RAM, por exemplo, são exemplos de hardwares internos, enquanto
monitor, teclado e mouse são exemplos de hardwares externos;
• O software refere-se à parte lógica dos equipamentos, ou seja, aos programas,

aplicativos e sistemas operacionais, a exemplo de Microsoft Word, Linux e Windows.
Assim como o hardware, o software é fundamental para a infraestrutura de TI, por
fornecer as instruções para o funcionamento do hardware;
• A gestão dos dados também é um aspecto importante e corresponde à forma

como os dados são geridos e tratados; envolve etapas que vão desde a coleta até a
utilização dos dados estruturados;
• A infraestrutura de redes é responsável por conectar os aparelhos de tecnologia

da organização e possibilitar a comunicação entre as pessoas, processos e
operações. Roteadores, switches e computadores são alguns dos exemplos de
equipamentos que compõem uma infraestrutura de redes.
• Os serviços de tecnologia representam todas as atividades que a infraestrutura

de TI pode oferecer, como armazenar e gerenciar os dados, por exemplo;
• Toda a infraestrutura é operacionalizada por meio dos recursos humanos,

compostos pelos profissionais de TI.

407
Figura 2 - Componentes da infraestrutura de TI
Além dos componentes de infraestrutura, tradicionalmente se requer um espaço físico

apropriado para a instalação dos computadores, servidores de alta performance e
equipamentos de armazenamento, o que permite aos profissionais de TI consiguirem
organizar/gerir os dados em espaço físico específico. Para a infraestrutura em cloud não
existe obrigatoriedade de espaço físico, por permitir que os usuários acessem aos recursos
via rede de forma remota (internet). Esse acesso pode ser feito por intermédio de serviços
oferecidos por empresas como: Google, Amazon e Microsoft, por exemplo. Não se pode
esquecer de considerar uma fonte alternativa de energia com alta capacidade de carga
como nobreak, para se prevenirem perdas com quedas de energia elétrica.
De maneira geral, as tecnologias de Big Data requerem uma estrutura que possibilite
aumentar o desempenho da manipulação de grandes volumes de dados. Para se instalar
um repositório de dados é importante verificar a capacidade de cada equipamento que será
utilizado, considerando-se a eficiência de processar e armazenar os dados. Segundo
Taurion (2013), a qualidade dos dados é um ponto crucial do Big Data. Metodologicamente
é fundamental estruturar o processo operacional e os constantes atributos relacionados à
validade, volatilidade, regras de transformação, processo de uso dentro da organização e
como esses dados podem gerar um fator de diferenciação.
De acordo com Hu et al. (2014), o armazenamento de dados é aspecto primordial de um

sistema de infraestrutura e pode ser dividido em infraestrutura de hardware e gestão de

dados, em que o hardware é responsável pelo armazenamento físico das informações
obtidas e a gestão dos dados é realizada por meio de software implementado na
infraestrutura de hardware com o objetivo de guardar dados em larga escala.
Hu et al. (2014) também destacam que as tecnologias de armazenamento envolvem, mas

não são limitadas aos seguintes componentes:
• Memória RAM – é um tipo de armazenamento volátil, ou seja, não armazena os
conteúdos de forma permanente e perde as informações quando o computador é
desligado. A RAM considerada moderna engloba a RAM estática (SRAM), a RAM
dinâmica (DRAM) e a de mudança de fase (PRAM);
• HDD – comumente conhecido como disco rígido, o hard disk drive é considerado
a parte principal em sistemas de armazenamento. É um tipo de armazenamento
não volátil, ou seja, retém os dados mesmo quando são desligados. Matrizes de
discos podem ser montadas com vários HDs com o objetivo de alcançar maior
capacidade de armazenamento e gerar alto rendimento de acesso e alta
disponibilidade a custos mais baixos;
• SSD – o solid state drive, mais conhecido como SSD, é um tipo de armazenamento
que não tem componentes mecânicos e é considerado mais rápido e silencioso
quando comparado ao HD; possui taxas de transferência maiores e geram menos
latência (tempo até acessar um arquivo).
Ainda segundo Hu et al. (2014), as categorias de matrizes de discos também são um fator
importante para ser considerado na infraestrutura e podem ser entendidas como
subsistemas de armazenamento e organizadas de diferentes maneiras, nas quais se
destacam:
• Armazenamento de conexão direta (DAS) – Direct Attached Storage consiste
no armazenamento local no qual dispositivos, como vários HDs, por exemplo, são
conectados diretamente a um computador ou servidor sem a utilização de rede entre
eles;
• Armazenamento em rede (NAS) – Network Attached Storages é um tipo de

armazenamento que contém vários discos rígidos estruturados de forma lógica,
fornece armazenamento e um sistema de arquivos e são destinados para conexão
em redes locais;

409
• Rede de área de armazenamento (SAN) – a Storage Area Network é uma
infraestrutura de rede que fornece armazenamento baseado em blocos a um grupo
de computadores e pode unificar diversos equipamentos de armazenamento, como
discos e matrizes de discos, por exemplo, de maneira que pareçam estar conectados
localmente.
O uso de tecnologias para o processamento dos dados também se constitui aspecto

importante. Nesse cenário, pode-se destacar o Spark como uma das tecnologias de
processamento de dados mais completas e eficientes; é executado em memória e no disco,
pois tem foco em Big Data. Outro ponto importante é ser uma estrutura de processamento
paralelo. Além disso, suporta diversos tipos de arquivos, como CSV e Parquet, por exemplo.
Uma das grandes vantagens do Spark é, de acordo com a necessidade e/ou preferência
do usuário, poder utilizar mais de uma linguagem de programação, como Python, R e Scala.
No momento presente, o Spark e o Python formam alternativa de grande relevância nas

análises de dados. Por meio de uma API chamada PySpark, o Spark pode ser usado com
o Python. O PySpark é considerado mais rápido quando comparado com outras
ferramentas, permite processar os dados de maneira mais eficiente, traz benefícios no nível
de análise e otimiza o tempo de processamento de grandes bases de dados.
Necessário mencionar que o R Software também merece destaque no cenário dos dados.
O R é uma linguagem de programação multiparadigma voltada para o campo da estatística,
a qual permite manipular, analisar e visualizar dados de forma concisa e eficiente. Além
das técnicas estatísticas, também fornece técnicas gráficas e é altamente extensível por
intermédio de pacotes. Os pacotes são conjuntos de funções extras que agregam
funcionalidades ao R. Pelo pacote Sparklyr, por exemplo, é possível utilizar os recursos do
Spark com o R e otimizar o processamento de grandes bases de dados.
Ambas as linguagens citadas possuem a grande vantagem de serem multiplataforma, ou

seja, podem ser utilizadas em diferentes sistemas operacionais, como Windows, Macintosh
e Linux. Além disso, são ferramentas gratuitas e podem ser obtidas livremente na internet
em suas fontes oficiais. Isso faz com que a implementação de ambas as linguagens e seus
ambientes de desenvolvimento possam ocorrer de maneira mais fácil, rápida e sem custos.

Em um exemplo prático, se um usuário comum quisesse utilizar 1 ano de microdados do
Sistema de Informação Ambulatorial do SUS para todo o Brasil, disponível para acesso via
R (ver capítulo 17), esse banco de dados consumiria mais de 60GB de memória RAM, o
que seria uma limitação para o usuário comum (não seria um problema para manipulação
desses dados em um servidor). No entanto, com o Spark, o usuário comum manipularia
esse banco de dados, mesmo com uma quantidade inferior de memória RAM, o que
democratiza o acesso e a utilização de grandes bancos em pesquisas na área de saúde
pública.
5 Integração de dados de saúde
No Brasil, pesquisadores, profissionais de saúde e gestores têm acesso e utilizam diversos

SIS diferentes no dia a dia e esses têm pouca ou nenhuma integração entre si, problema
identificado desde a década de 1980 e relacionado a diversos fatores como fragmentação
das estruturas burocráticas do estado, ausência de padronização semântica e tecnológica
e a baixa maturidade das políticas de governança de tecnologia da informação e
comunicação (TIC) nos serviços organizacionais (COELHO NETO; CHIORO, 2021).
Sistemas de notificação de doenças e agravo, controle e logística de insumos e

medicamentos, prontuário eletrônicos, produção de procedimentos, registros de
nascimento e óbitos, entre outros, são mais de 50 SIS em saúde no Brasil em utilização,
mapeados entre 2013 e 2018 (COELHO NETO; CHIORO, 2021). Entre os diversos
sistemas é possível encontrar chaves como Cartão Nacional do SUS (CNS) ou Cadastro
de Pessoa Física (CPF), entretanto, existem problemas de completude desses campos
e/ou baixa confiabilidade em razão de um indivíduo ter duas ou mais chaves nos sistemas
por motivos diversos, além de outras questões.
O Ministério da Saúde, por meio do Datasus e da Rede Nacional de Dados em Saúde
(RNDS), plataforma de interoperabilidade em saúde instituída pela portaria 1.434 de 28 de
maio de 2020, que entre os diversos objetivos está vincular diversos SIS por meio de chave
única, pode ajudar a resolver essa questão, em desenvolvimento e alavancada
principalmente pela pandemia da COVID-19. Com a falta de um órgão centralizador para a
vinculação dos dados dos diferentes SIS, observa-se aumento de custos e tempo nas
pesquisas científicas e a única forma de se trabalhar em nível individual é utilizar diversos
SIS na falta de identificador único de qualidade.
A partir da integração dos SIS abre-se a possibilidade para novas perguntas de pesquisa,
o que propicia acompanhar os indivíduos desde o nascimento até o óbito. Para unir

411
diferentes SIS utilizam-se técnicas de Record Linkage (RL). É importante mencionar que a
qualidade do RL é diretamente proporcional à qualidade dos dados, métrica que difere entre
os diversos sistemas e pode ser impactada por diferentes causas como localidade
geográfica, treinamento, entre outros. Maiores detalhes e teoria sobre RL podem ser
encontradas em Christen (2020) e Christen (2012).
6 Experiência do Instituto de Saúde Coletiva – o Repositório de Dados Seguros Prof.

Sebastião Loureiro
Para garantir a segurança dos dados que subsidiam diversas pesquisas, o Instituto de
Saúde Coletiva da Universidade Federal da Bahia (ISC/UFBA) conta com o repositório de
dados seguros Prof. Sebastião Loureiro2, local com alta capacidade de processamento,
armazenamento e estrutura de segurança como controle de acesso por biometria e
monitoramento por câmeras. O lugar conta com dois ambientes; o primeiro tem um servidor
com alta capacidade de processamento e armazenamento para vinculações de dados, seja
por métodos determinísticos, não determinísticos e probabilísticos, sem qualquer conexão
externa – local ou com internet. O segundo ambiente, cujo foco é a construção de datasets
e análises por meio de dados não identificados, conta também com servidores de alta
capacidade em relação a processamento, memória RAM e disco.
No decorrer dos projetos de pesquisa em que se utilizam dados secundários identificados

e ou dados primários observa-se o fluxo a seguir.
1º - Recebimento das bases de dados por meio de HD externo com os arquivos

criptografados, via hardware ou software e/ou envio de link para download dos dados
criptografados pelo gestor. Essa etapa está fora do controle do repositório,
entretanto, sempre se informa à instituição ofertante dos dados quais são as
melhores práticas para ocorrer o envio seguro dos dados sensíveis. Os dados
disponibilizados devem ser acompanhados dos seus respectivos metadados, tais
como dicionário de dados, modelo relacional se aplicável, outros documentos e ou
instruções que ajudem a manipulação e entendimento dos dados;
2
Prof. Sebastião Loureiro foi docente do Instituto de Saúde Coletiva da UFBA, médico, Ph.D. em
epidemiologia, fundador do grupo de pesquisa em economia da saúde e um incentivador da aquisição dos
servidores para uso intensivo de dados em pesquisas com foco no SUS.

2º - Os dados são transferidos para um servidor no Repositório de Dados Seguros
no ISC/UFBA que garante a segurança dos arquivos digitais por meio de servidor
desconectado da internet e de outras áreas do instituto; controle de acesso por meio
de biometria (digital, facial e senha); somente a equipe de cientistas de dados tem
acesso ao repositório; sistema de alarme contra incêndio; e monitoramento 24 horas
por câmeras de segurança;
3º - Os dados passam por um pipeline de Mineração de dados (Descritiva, Pré-

processamento, Transformação, Linkage, Integração) alinhados aos objetivos do
projeto;
4º - Os dados são anonimizados de forma que o indivíduo não possa ser identificado
de acordo com a LGPD;
5º - Os dados anonimizados passam por verificação da curadoria do repositório para

garantir a privacidade dos dados;
6º - Um dataset é gerado com foco nos objetivos da pesquisa e enviado para o

servidor de análise;
7º - O servidor de análise é acessível somente via Virtual Private Network (VPN) ou

via rede local com permissões restritas aos pesquisadores do projeto e aos bancos
específicos;
8º - Todo processo de entrada, saída e acessos dos respectivos dados são

documentados, para garantir a segurança e ética de proteção das informações.
7 Ética no uso dos dados
Tendo em vista a importância do uso de dados sensíveis para uso em pesquisas, torna-se
relevante assegurar sua segurança e proteção. Embora existam protocolos que orientam
àqueles envolvidos com a gestão de dados científicos, incluindo-se a formalização do
compromisso com as questões éticas e de privacidade, é imperiosa a aprovação em Comitê

413
de Ética em Pesquisa, de modo a garantir que a utilização dos dados seja exclusivamente
para fins científicos.
A Resolução no 466/2012 impõe que as pesquisas que envolvem seres humanos devem
atender aos fundamentos éticos e científicos pertinentes, os quais devem prever
procedimentos que assegurem a confidencialidade e a privacidade durante todas as fases
da pesquisa. Técnicas para anonimização dos dados, além de outras medidas de
segurança dos repositórios, discutidas anteriormente, são fundamentais para a proteção
dos dados pessoais, bem como amparam os pesquisadores responsáveis pela salvaguarda
dos dados de futuras complicações éticas.
8 Repositório de dados nas instituições de pesquisa
A produção de conhecimento gera benefícios para toda a sociedade. Fazer ciência é ser
capaz de produzir resultados utilizando-se de procedimentos, métodos e técnicas de forma
clara, objetiva e imparcial. Logo, uma política institucional de dados fortalece a possibilidade
de armazenar, gerir, compartilhar e analisar dados de diferentes fontes com segurança e
qualidade.
Como exemplo de projeto institucional que consolida e amplia as oportunidades de

desenvolver pesquisas no campo da saúde, o Repositório de Dados Seguros Prof.
Sebastião Loureiro se destaca como uma estrutura importante e inovadora do ISC/UFBA.
Criado em 2019, o repositório possui mais de 1 bilhão de registros armazenados com total
privacidade e segurança das informações. É resultado do esforço conjunto das equipes do
Programa Integrado de Pesquisa e Cooperação Técnica em Economia, Tecnologia e
Inovação em Saúde (PECS) e do Programa Integrado em Epidemiologia e Avaliação de
Impactos na Saúde das Populações, em parceria com a direção do ISC/UFBA.
Além de representar importante conquista para o desenvolvimento das pesquisas no

instituto, esse projeto também garante segurança às instituições parceiras e gestores da
guarda dos bancos de dados, à medida que as exigências trazidas pela Lei Geral de
Proteção de Dados Pessoais são atendidas com toda a responsabilidade requerida.
Uma das experiências exitosas foi o desenvolvimento do projeto Condições de vida de

comunidades tradicionais afro-brasileiras: uma análise geoespacial e socioeconômica, cujo
objetivo foi caracterizar os perfis sociodemográficos e a distribuição pelo território brasileiro
das famílias pertencentes a comunidades quilombolas e de terreiro. Para isso foi necessário
utilizar bases de dados de indivíduos e famílias registradas no Cadastro Único para
Programas Sociais do período de 2018 a junho/2020, com aproximadamente 76 milhões
de observações. Os dados foram cedidos pelo Ministério da Cidadania, em virtude da
segurança e estrutura do repositório de dados do ISC/UFBA.
Finalmente é preciso destacar que a qualidade e o rigor metodológico no tratamento dos

dados e a possibilidade de trabalhar com Big Data pode ser concretizado por meio de
investimentos das instituições de pesquisas em repositórios de dados seguros. No entanto,
não basta apenas indicar que existe capacidade estrutural para salvaguardar os dados;
acima de tudo, a ética profissional e o respeito à privacidade das pessoas devem estar à
frente de qualquer objeto de pesquisa.
Para o leitor que gostaria de elaborar um projeto para a construção de um repositório seguro
de dados, pode consultar o Data Management Expert Guide (DMEG) e o Guia de Gestão
de Dados de Pesquisa para Bibliotecários e Pesquisadores (SAYÃO; SALES, 2015), que
auxiliaram na construção e implementação deste projeto. Ambos falam sobre o ciclo de vida
dos dados de pesquisa e abordam desde o planejamento, manipulação, organização,
documentação, processamento, armazenamento e proteção dos dados até o
compartilhamento e publicação.

415
Referências
BRASIL. Lei nº 13.853, de 8 de julho de 2019. Altera a Lei nº 13.709, de 14 de agosto de

2018, para dispor sobre a proteção de dados pessoais e para criar a Autoridade Nacional
de Proteção de Dados; e dá outras providências. Brasília, DF: Presidência da República,
2019. Disponível em: http://www. planalto.gov.br/ccivil_03/_Ato2019-2022/2019/Lei/ L138
53.htm#art1. Acesso em: 16 mar. 2022.
CHIAVEGATTO FILHO, A. D. P. Uso de big data em saúde no Brasil: perspectivas para

um futuro próximo. Epidemiologia e Serviços de Saúde, v. 24, n. 2, p. 325-332, 2022.
Disponível em: http://scielo.iec.gov.br/scielo.php?script=sci_arttext&pid=S1679-49742015
000200015. Acesso em: 26 maio 2022.
CHRISTEN, P. Data matching: concepts and techniques for record linkage, entity
resolution, and duplicate detection. Berlim: Springer, 2012.
CHRISTEN, P.; RANBADUGE, T.; SCHNELL, R. Linking sensitive data: methods and
techniques for practical privacy-preserving information sharing. Berlim: Springer Nature,
2020.
COELI, C. M.; PINHEIRO, R. S.; CAMARGO, K. R. Conquistas e desafios para o

emprego das técnicas de Record linkage na pesquisa e avaliação em saúde no Brasil.
Epidemiologia e Serviços de Saúde, v. 24, n. 4, p. 795-802, 2015. Disponível em:
https://www.scielo.br/j/ress/a/zH4GSZzP9DNZRxwGz3wpMTL/?format=pdf&lang=pt.
COELHO NETO, G. C.; CHIORO, A. Afinal, quantos Sistemas de Informação em Saúde

de base nacional existem no Brasil? Cadernos de Saúde Pública, v. 37, n. 7, p. 1-15,
2021. Disponível em: https://www.scielo.br/j/csp/a/RzNmvjHqmLhPHZp6gfcdC6H/
abstract/?lang=pt. Acesso em: 5 nov. 2022.
CORSI, A. et al. Big data analytics as a tool for fighting pandemics: a systematic review of
literature. Journal of Ambient Intelligence and Humanized Computing, v. 12, n. 10, p.
9163-9180, 2021. Disponível em: https://pubmed.ncbi.nlm.nih.gov/33144892/. Acesso em:
30 set. 2022.
DIXON, J. Pentaho, Hadoop, and Data Lakes. 2015. Disponível em: https://jamesdixon.
wordpress.com/ 2010/10/14/pentaho-hadoop-and-data-lakes/. Acesso em: 15 maio 2022.
HU, H. et al. Toward scalable systems for big data analytics: a technology tutorial. IEEE
Access, v. 2, p. 652-687, 2014. Disponível em: https://ieeexplore.ieee.org/stamp/stamp.js
p ?tp=&arnumber=6842585. Acesso em: 29 set. 2022.
KHINE, P. P.; WANG, Z. S. Data lake: a new ideology in big data era. In: ITM WEB OF
CONFERENCES 17. Proceedings [...]. 2018. p. 1-11, ref. 03025. (WCSN 2017).
Disponível em: https://www.itm-conferences.org/articles/itmconf/pdf/2018/02/itmconf_
wcsn2018_03025.pdf. Acesso em: 29 set. 2022.
MILOSLAVSKAYA, N.; TOLSTOY, A. Big Data, Fast Data and Data Lake Concepts.
Procedia Computer Science, v. 88, p. 300-305, 2016. Disponível em:
https://www.sciencedirect.com/science/article/pii/S1877050916316957. Acesso em: 5 nov.
2022.

OLIVEIRA, M. G. de; ALMEIDA, E. C. Modelagens de um Data Lake: de dados brutos a
área de negócio. 2020. Trabalho de Conclusão de Curso (Especialização) - Programa de
Especialização em Data Science e Big Data, Universidade Federal do Paraná, 2020.
Disponível em: https://acervodigital.ufpr.br/bitstream/handle/1884/71070/R%20-
%20E%20-%20MARIANA%20GONCALVES%20DE%20OLIVEIRA.pdf?sequence=
1&isAllowed=y. Acesso em: 29 set. 2022.
RAU, I. A. C. V. Data Lake: uma nova abordagem para o armazenamento de dados.

2021. Trabalho de Conclusão de Curso (Bacharel em Sistemas de Informação) - Curso
de Sistemas de Informação, Universidade do Sul de Santa Catarina, Florianópolis, 2021.
Disponível em: https://repositorio.animaeducacao.com.br/bitstream/ANIMA/13790/1/
versao-final-tcc%20%281%29.pdf. Acesso em: 29 set. 2022.
RODRIGUES, E. et al. Os repositórios de dados científicos: estado da arte. 2010.

(Projecto RCAAP D24 - Grupo de trabalho conjunto da Universidade do Minho e da
Universidade do Porto) Disponível em: http://repositorium.uminho.pt/bitstream/1822
/10830/1/Relatório%20Estado%20da%20Arte%20dos%20Repositórios%20de%20Dados
%20Cient%C3%ADficos%20Versão%201.0_Final.pdf. Acesso em: 25 maio 2022.
SAETRA, H. S. Science as a vocation in the era of big data: the philosophy of science
behind big data and humanity's continued part in science. Integrative Psychological &
Behavioral Science, v. 52, n. 4, p. 508-522, 2018. Disponível em:
SAYÃO, L. F.; SALES, L. F. Guia de gestão de dados de pesquisa para bibliotecários

e pesquisadores. Rio de Janeiro: CNEN, 2015. Disponível em: http://www.icb.usp.br/~
sbibicb/images/guia%20gestaoPDF/Guia%20de%20gestao%20dados%20de%20pesquis
a.pdf. Acesso em: 29 ago. 2022.
SILVA, C. F. da; LEITE, A. J. M.; ALMEIDA, N. M. G. S. de. Linkage entre bancos de

dados de nascidos vivos e óbitos infantis em município do Nordeste do Brasil: qualidade
dos sistemas de informação. Cadernos de Saúde Pública, v. 25, n. 7, p. 1552-1558,
2009. Disponível em: https://www.scielo.br/j/csp/a/KSKjqJhXBPStWbdj8Mbmgnc/abstract/
?lang=pt. Acesso em: 29 set. 2022.
TAURION, C. Big Data. Rio de Janeiro: Brasport, 2013.
ZHANG, X. et al. Big data science: opportunities and challenges to address minority health
and health disparities in the 21st Century. Ethnicity & Disease, v. 27, n. 2, p. 95-106,
2017. Disponível em: https://pubmed.ncbi.nlm.nih.gov/28439179/. Acesso em: 29 set.
2022.

417
Capítulo 17
Acesso aos dados agregados e

microdados do SUS
Raphael de Freitas Saldanha1

Marcel de Moraes Pedroso1
Monica de Avelar F. M. Magalhães1
1
Fundação Oswaldo Cruz - Fiocruz
RESUMO:
O capítulo “Acesso aos dados agregados e microdados do SUS” apresenta um histórico sobre a
disseminação da informação em saúde no Brasil e a criação do DataSUS. Em seguida, apresenta alguns
Sistemas de Informação em Saúde, com detalhes sobre sua criação e finalidades. São apresentadas
as ferramentas de acesso aos dados TabWin e TabNet. Por fim, apresenta-se um pacote do R para a
finalidade de download e pré-processamento de microdados do DataSUS.
PALAVRAS-CHAVE:
Sistemas de Informação em Saúde. Processamento eletrônico de dados. Software.

1 Disseminação da informação em saúde e a criação do DataSUS
A disseminação da informação em saúde no Brasil apresenta um histórico marcante, com

aspectos revolucionários e inspiradores. Este capítulo se inicia apresentando breve revisão
de alguns marcos históricos e a criação do Departamento de Informática do SUS.
Pode-se afirmar que a coleta sobre informação em saúde começa de forma dispersa no
Brasil, ainda no início da colonização portuguesa, com registros de nascimentos e óbitos
em paróquias religiosas e registros ambulatoriais e hospitalares criados por instituições de
saúde e dispensários no começo do século XX. No final do mesmo século, os dados
populacionais de saúde eram muito atrelados ao trabalho formal, vinculados aos registros
trabalhistas e de aposentadoria.
Nesse cenário, a informação em saúde era distribuída em diversas instituições públicas e

particulares, segregada em diversos recortes, sem abranger toda a população. Talvez
apenas o censo demográfico apresentasse dados consistentes, com as poucas
informações sobre saúde e coletadas a grandes intervalos de 10 anos.
O grande marco para mudança desse cenário é a criação, em 1991, do Departamento de

Informática do SUS (DataSUS), três anos após a promulgação da Nova Constituição de
1988, quando se concluiu o processo de redemocratização que trouxe importantes ajustes
e reformas à estruturação da máquina pública brasileira e mesmo ano de criação do SUS.
Com o processo de universalização da saúde promovido pelo SUS, o processamento de

informações hospitalares do novo sistema de saúde não podia mais estar atrelado à
previdência social para poder abarcar toda a população brasileira. Dessa maneira, o
DataSUS herda, por meio da Fundação Nacional de Saúde (Funasa), o processamento das
contas hospitalares e ambulatoriais da Empresa de Tecnologia e Informações da
Previdência Social (Dataprev), com sistemas de informática existentes e servidores.
Pode-se destacar que nesse processo de transferência tecnológica e humana da Dataprev

para o DataSUS, foram recebidos apenas os equipamentos de uso individual,
computadores do tipo pessoal, na configuração processador Pentium 386. A estrutura de
processamento centralizado Unisys (mainframe) da Dataprev não foi transferida. Apenas
com posterior recebimento de recursos do Instituto Nacional de Assistência Médica da
Previdência Social (INAMPS) e compra de outros equipamentos é que o DataSUS passa a

419
processar plenamente as Autorizações de Internações Hospitalares (AIH), constituindo-se
assim o Sistema de Informações Hospitalares (SIH) (BRASIL, 2002).
Outros sistemas fundamentais de informações em saúde foram se estabelecendo no

DataSUS, como o Sistema de Informação de Nascidos Vivos (Sinasc), em 1994, e o
Sistema de Informação da Mortalidade (SIM), em 1996.
Cabe aqui ressaltar que o DataSUS é criado e estabelecido no mesmo momento em que o
Brasil passa a se informatizar mais amplamente, com a possibilidade de importação de
equipamentos possibilitada pela Lei da Informática (no 8.248/91 e no 8.387/91), na transição
de um modelo de mercado econômico fechado para aberto. Dessa forma, pode-se afirmar
que o DataSUS acompanhou o processo de informatização brasileiro em seu início, de
forma pioneira.
2 Sistemas de Informação em Saúde no Brasil
O Brasil conta com dezenas de Sistemas de Informação em Saúde, criados em diferentes

momentos para atender a diferentes necessidades.
Alguns foram criados inicialmente para dar conta de demandas administrativas, como o
pagamento de internações em instituições de saúde e serviços de profissionais. Outros
sistemas foram criados especificamente para finalidades epidemiológicas, visando prover
o Estado de informações sobre a saúde da população.
Em ambos os casos, à medida que um sistema de informação passa a não ser capaz de
responder a perguntas novas, esse pode ser reformado ou pode-se criar um sistema de
informação novo, visando atender àquela demanda específica.
Por esse motivo, o retrato atual dos Sistemas de Informação em Saúde é disperso em
vários componentes, com algumas sobreposições de finalidade entre seus sistemas e
estados transitórios na sua evolução.
Ao se trabalhar com dados advindos dos Sistemas de Informação em Saúde brasileiros, é

possível observar, após algum tempo, algumas inconsistências entre os sistemas,
repetições, erros e outros vieses e incômodos. Por essa razão, é sempre importante

lembrar da história desses sistemas, o que pode explicar algumas particularidades ainda
que parcialmente.
Importante também ressaltar que alguns dos Sistemas de Informação em Saúde cobrem
os processos registrados apenas nas instâncias públicas do SUS e devem ser
complementados por sistemas próprios de informação da Saúde Suplementar (serviços
privados de saúde prestador por instituições privadas e planos de saúde). A fonte apresenta
alguns dos Sistemas de Informação em Saúde do Brasil ilustra que esses visam dar conta
do ciclo de vida de um cidadão e cobrem aspectos desde o seu nascimento até o óbito.
Além desses, podem-se destacar os sistemas de informação estruturais, como o Cadastro
Nacional de Estabelecimentos e Profissionais de Saúde (CNES) e o Sistema de
Informações sobre Orçamentos Públicos em Saúde (SIOPS).
Figura 1 - Sistemas de Informação em Saúde e o ciclo de vida do cidadão
Fonte: elaborado pelos autores.
O Quadro 1 apresenta o detalhamento de alguns dos Sistemas de Informação em Saúde

mais consolidados no Brasil.

421
Quadro 1 - Características de alguns sistemas de informação em saúde
Sistema Ano de Objeto Unidade de Abrangênc Consolidação

criação análise ia e
(informatização) disponibilizaç
ão dos dados
SIM - Sistema de 1996 Informações Declaração de Nacional Consolidação
Informações de sobre o óbito e óbito (DO) anual,
Mortalidade suas disponibilizada
circunstâncias. com 1 a 2
anos de
defasagem.
SINASC - 1994 Informações o Declaração de Nacional Consolidação
Sistema de nascido vivo, Nascido Vivo anual,
Informações de sua mãe e (DNV) disponibilizada
Nascidos Vivos circunstâncias com 1 a 2
do anos de
nascimento. defasagem.
SIH - Sistema de 1984 Informações Autorização de Dimensão Consolidação
Informações de sobre a Internação pública do mensal,
Internações internação Hospitalar SUS disponibilizada
Hospitalares hospitalar (AIH) com 1 a 2
(morbidade). meses de
defasagem.
SIA - Sistema de 1994 Informações Autorização de Dimensão Consolidação
Informações sobre Procedimento pública do mensal,
Ambulatoriais atendimentos Ambulatorial SUS disponibilizada
ambulatoriais, (APA) e com 1 a 2
realizados ou Autorização de meses de
não com Procedimento defasagem.
internação de Alta
hospitalar. Complexidade
(APAC)
SINAN - Sistema 1993 Informações Fichas de Nacional Consolidação
de Informações sobre mais de notificação e anual, com
de Doenças e 30 doenças e acompanhame disponibilizaçã
Agravos de agravos, nto o de
Notificação acompanhado defasagem
Obrigatória s desde variada.
suspeita,
confirmação
ou descarte.
CNES - Cadastro 2015 Informações Fichas Nacional Consolidação
Nacional de sobre cadastrais mensal,
Estabelecimentos estabelecimentos disponibilizada
de Saúde de saúde, com 1 a 2
equipamentos meses de
e profissionais. defasagem.
Pode-se observar no Quadro 1 que alguns sistemas de informação apresentam

características bem distintas entre si; destaca-se o tempo de consolidação das informações
e defasagem de disponibilização.

O tempo de consolidação é o intervalo de tempo necessário para que o Ministério da Saúde
reúna as bases de dados provenientes de todos os estados, faça as correções e
integrações necessárias e produza um conjunto de dados confiável que possa ser utilizado
como referência em estudos e políticas públicas. O período de defasagem é o atraso
necessário para a disponibilização desses dados.
Por exemplo, os dados do SIM são disponibilizados anualmente, com defasagem de 1 a 2

anos. Isso significa que se sabe, hoje, o perfil dos óbitos no Brasil de até 1 ou 2 anos atrás
e que a próxima atualização deve ser disponibilizada no próximo ano ou depois.
Ainda que existam esses tempos típicos de consolidação e defasagem, cabe ressaltar que
alguns sistemas de informação em saúde disponibilizam dados antes do tempo previsto,
como preliminares do dado a ser disponibilizado no futuro, após correções e ajustes
necessários.
3 Acesso aos dados dos sistemas de informação em saúde

O acesso aos dados dos sistemas de informação em saúde geridos pelo Ministério da
Saúde pode ser realizado de algumas formas.
A forma mais tradicional é utilizar os sistemas disponibilizados pelo próprio MS: TabNet e
TabWin.
3.1 TabNet
O TabNet é um sistema de consulta aos dados dos sistemas de informação em saúde e
outros dados relacionados à saúde acessível diretamente pela internet; na página do
DataSUS1 existe um link para acessá-lo.
O sistema é estruturado por temas, conforme quadro abaixo (consulte a lista de siglas em
conjunto).
https://datasus.saude.gov.br
1

423
Quadro 2 - Temas e sistemas do TabNet
Tema Descrição
Indicadores de Contêm uma série de levantamentos de indicadores de saúde.
Saúde e Infelizmente, diversos desses deixaram de ser atualizados.
Pactuações
Assistência à Saúde Dados do SIH, SIA, SIPNI, Atenção Básica, SISVAN e CMD.
Epidemiológicos e Dados do SIH, SINAN, SCZ, PCE, SISVAN, HIPERDIA,
Morbidade SISCOLO, SISMAMA e SISCAN.
Rede Assistencial Dados do CNES e AMS.
Estatísticas Vitais Dados do SINASC e SIM.
Demográficas e Dados do Censo Demográfico do IBGE e de PIB.
Socioeconômicas
Inquéritos e Dados da PNS, PNAD, VIGITEL, VIVA e outros inquéritos.
Pesquisas
ANS Link para o TabNet da ANS.
Informações Dados do SIOPS e FNS.
financeiras
Estatísticas de Dados de acesso ao TabNet.
acesso ao TabNet
O TabNet disponibiliza dados de diversos Sistemas de Informações em Saúde de forma

agregada. Em geral, após escolher o sistema de informação de interesse, o usuário precisa
escolher um nível de abrangência geográfica para que os dados sejam agregados: Brasil
por municípios, Brasil por Região e Unidade da Federação ou por UF específica.
Na próxima tela, o usuário precisa configurar como a tabela de dados agregados será
construída. É possível especificar qual informação será utilizada para linhas, colunas e
conteúdo, bem como o período desejado. Também é possível configurar alguns filtros
referentes a especificidades dos agravos ou procedimentos, faixa etária, sexo, cor/raça,
entre outros.
Cabe destacar que filtro de período se refere à data de processamento do dado e não à
data de ocorrência em alguns sistemas. Por exemplo, a seleção de dezembro de 2019 nos
dados do SIH se refere às internações processadas nesse mês e ano e pode conter
internações realizadas em dezembro, novembro e outros meses.

Ao fim dessa página, existem opções para o ordenamento de valores e exibição da tabela.
O botão Mostra executa a consulta para a construção da tabela e exibe os resultados.
Após gerar a tabela de interesse, o usuário pode exportar os resultados, incluindo um

arquivo CSV que pode ser aberto em algum software editor de planilhas, como o Microsoft
Excel ou Libre Office Calc.
3.2 TabWin
As informações disponibilizadas de forma agregada pelo TabNet não atendem a todas as
necessidades de pesquisa, as quais algumas vezes demandam dados em outras
agregações ou individuais. Para essa finalidade, foi desenvolvido o TabWin.
O TabWin é a evolução de um sistema mais antigo, o TabDOS, e pode ser executado

nativamente no sistema operacional Windows; também pode ser baixado diretamente no
site do DataSUS.
Após sua instalação, a utilização do TabWin depende de dois tipos de arquivos: os arquivos
de dados (formato DBC) e os arquivos auxiliares de tabulação (formatos DEF e CNV), que
podem ser acessados no mesmo local de download do TabWin.
4 DataSUS no R: microdatasus
Com o advento da ciência de dados e Big Data, o acesso e uso dos dados se tornaram
mais intensos e variados e demandaram a utilização de novas plataformas que permitam o
uso mais livre dos dados, sem a dependência de programas elaborados pelo próprio MS.
Em geral, esse uso se dá com linguagens de programação e dentre as mais comuns para
este uso estão o R e o Python. Ambas as linguagens oferecem diversas vantagens para o
acesso, manipulação e análise de dados em qualquer sistema operacional. Enquanto no
Python é possível utilizar a biblioteca pysus2, no R pode-se utilizar a biblioteca
microdatasus3.
Em geral, o objetivo dessas bibliotecas é facilitar o acesso aos dados com o download
automático dos arquivos necessários e automatizar o pré-processamento dos dados, que
https://github.com/AlertaDengue/PySUS
2
https://github.com/rfsaldanha/microdatasus
3

425
consiste basicamente em rotular as variáveis categóricas e atribuir os formatos adequados
às variáveis de texto, número e data.
Para utilizar a biblioteca microdatasus no R, é necessário inicialmente fazer a sua

instalação. Para isso, o usuário também precisará de outra biblioteca instalada, chamada
remotes. Esse passo é necessário apenas uma vez.
install.packages("remotes")
remotes::install_github("rfsaldanha/microdatasus")
Após a instalação, é necessário avisar ao R que se pretende utilizar as funções da biblioteca

recém-instalada. Esse passo é necessário sempre que se utilizar as funções da biblioteca.
library(microdatasus)
A biblioteca microdatasus é dotada de duas funções principais: uma para o acesso aos
dados e outra para o pré-processamento desses.
Para o acesso aos dados, utiliza-se a função fetch_datasus. Atualmente, o pacote permite
o download de dados dos seguintes sistemas de informação:
Quadro 3 - Sistemas de informação e siglas no pacote microdatasus

Sistema de Informação Sigla no pacote
SIH, AIHs reduzidas SIH-RD
SIH, AIHs rejeitadas SIH-RJ
SIH, serviços profissionais SIH-SP
SIH, AIHs rejeitadas com código de erro SIH-ER
SIM, Declaração de Óbito SIM-DO
SIM, Declaração de Óbito, dados preliminares SIM-DO-PRELIMINAR
SIM, Declaração de Óbito Fetal SIM-DOFET
SIM, Declaração de Óbito Fetal, dados preliminares SIM-DOFET-PRELIMINAR
SIM, Declarações de Óbito por causas externas SIM-DOEXT
SIM, Declarações de Óbitos infantis SIM-DOINF
SIM, Declarações de Óbitos Maternos SIM-DOMAT
SINASC, Declarações de Nascidos Vivos SINASC
CNES, Leitos CNES-LT
CNES, Estabelecimentos CNES-ST
CNES, Dados Complementares CNES-DC
CNES, Equipamentos CNES-EQ
continua
conclusão
Sistema de Informação Sigla no pacote

CNES, Serviço Especializado CNES-SR
CNES, Habilitação CNES-HB
CNES, Profissional CNES-PF
CNES, Equipes CNES-EP
CNES, Regra Contratual CNES-RC
CNES, Incentivos CNES-IN
CNES, Estabelecimento de Ensino CNES-EE
CNES, Estabelecimento Filantrópico CNES-EF
CNES, Gestão e Metas CNES-GM
SIA, APAC de Acompanhamento a Cirurgia Bariátrica SIA-AB
SIA, APAC de Acompanhamento Pós-Cirurgia Bariátrica SIA-ABO
SIA, APAC de Confecção de Fístula Arteriovenosa SIA-ACF
SIA, APAC de Laudos Diversos SIA-AD
SIA, APAC de Nefrologia SIA-NA
SIA, APAC de Medicamentos SIA-AM
SIA, APAC de Quimioterapia SIA-AQ
SIA, APAC de Radioterapia SIA-AR
SIA, APAC de Tratamento Dialítico SIA-ATD
SIA, Produção Ambulatorial SIA-PA
SIA, Psicossocial SIA-OS
SIA, Atenção Domiciliar SIA-SAD
SINAN, Dengue SINAN-DENGUE-FINAL
SINAN, Dengue, arquivos preliminares SINAN-DENGUE-
PRELIMINAR
SINAN, Chikungunya SINAN-CHIKUNGUNYA-
FINAL
SINAN, Chikungunya, arquivos preliminares SINAN-CHIKUNGUNYA-
PRELIMINAR
SINAN, Zika SINAN-ZIKA-FINAL
SINAN, Zika, arquivos preliminares SINAN-ZIKA-PRELIMINAR
SINAN, Malária SINAN-MALARIA-FINAL
SINAN, Malária, arquivos preliminares SINAN-MALARIA-
PRELIMINAR
Novos sistemas são adicionados ao pacote esporadicamente, fruto do trabalho voluntário

de pessoas que contribuem para o desenvolvimento do pacote.
No exemplo abaixo se realizará o download de dados do SIM para o estado do Rio de

Janeiro nos anos 2018 e 2019.

427
dados_sim<- fetch_datasus(year_start = 2018, year_end = 2019,
uf = "RJ", information_system = "SIM-DO")
Após o download, podemos conferir o número de linhas e colunas obtidos.
>dim(dados_sim)
[1] 285306 88
Tem-se um objeto no R, do tipo data.frame, com 285.306 linhas e 88 colunas.
Outro exemplo: realizar o download de dados do SIH para o estado do Espírito Santo, entre
janeiro de 2018 e março de 2019. Como os arquivos do SIH são divididos entre ano e mês,
é necessário informar esses parâmetros para a função.
dados_sih<- fetch_datasus(year_start = 2018, month_start = 1,

year_end = 2019, month_end = 3,
uf = "ES", information_system = "SIH-RD")
Após o download, tem-se um objeto no R com 300.925 linhas e 113 colunas.
>dim(dados_sih)
[1] 300925 113
Ao se verificarem os dados obtidos, pode-se observar que se tem diversas variáveis

categóricas codificadas. Por exemplo, nos dados do SIM, a variável sexo é do tipo factor,
com os códigos 0, 1 e 2.
>unique(dados_sim$SEXO)
[1] 2 1 0
Levels: 0 1 2
Para atribuir os rótulos dessa variável e demais variáveis categóricas, pode-se utilizar as
funções do tipo process do pacote microdatasus. Tem-se as seguintes funções no pacote:

Quadro 4 - Sistemas de informação e funções no pacote microdatasus
Sistema de Informação Função no pacote
CNES-ST process_cnes
CNES-PF process_cnes
SIA-PA process_sia
SIH-RD process_sih
SIM-DO process_sim
SINASC process_sinasc
SINAN Chikungunya process_sinan_chikungunya
SINAN Dengue process_sinan_dengue
SINAN Zika process_sinan_zika
SINAN Malária process_sinan_malaria
Note-se que não há funções nos pacotes para todos os sistemas de informação e suas
variações. Essas funções são adicionadas ao pacote esporadicamente, com o trabalho
voluntário de pessoas que contribuem para a evolução e manutenção do pacote.
Abaixo, vai-se pré-processar os dados do SIM que foram baixados no exemplo anterior.
dados_sim<- process_sim(data = dados_sim)
Pode-se agora verificar a variável sexo novamente.
>unique(dados_sim$SEXO)
[1] "Feminino" "Masculino" NA
Os rótulos foram corretamente atribuídos à variável.
Após o download dos dados com a função fetch_datasus e o pré-processamento com a

função process*, haverá no R um data.frame com os dados do sistema de informação de
seu interesse prontos para serem analisados com os recursos da linguagem R e outros
pacotes.

429
No exemplo abaixo se realizará o download de dados do SINASC para Santa Catarina em
2019, o seu pré-processamento e, sem seguida, a análise dos nascimentos segundo o tipo
do parto e dia da semana.
library(tidyverse)
Sys.setlocale("LC_TIME","pt_BR")
dados_sinasc<- fetch_datasus(year_start = 2019, year_end = 2019,

uf = "SC", information_system = "SINASC")
dados_sinasc<- process_sinasc(data = dados_sinasc)
dados_sinasc %>%
select(PARTO, DTNASC) %>%
mutate(
dia_semana = format(as.Date(DTNASC), "%a")
) %>%
group_by(dia_semana, PARTO) %>%
summarise(freq = n()) %>%
ungroup() %>%
na.omit() %>%
mutate(
dia_semana = factor(
x = dia_semana, levels = c("Seg", "Ter", "Qua",
"Qui", "Sex", "Sáb", "Dom")
)
) %>%
ggplot(aes(fill = PARTO, x = dia_semana, y = freq)) +
geom_bar(position = "fill", stat = "identity") +
scale_y_continuous(labels = scales::percent) +
theme_bw() +
labs(title = "Tipo de parto por dia da semana", subtitle = "Santa Catarina, 2019",
fill = NULL, x = "Dia da semana", y = "Percentual") +
theme(legend.position = "bottom")
O código acima criará o gráfico seguinte:

Gráfico 1 - Tipo de parto por dia da semana
Com esse pequeno código, consegue-se realizar o download dos dados do SINASC, pré-
processar as suas variáveis e fazer uma análise rápida do dia do nascimento e tipo de
parto, evidenciando o comportamento anômalo de mais partos cesarianos em dias
comerciais e mais partos vaginais nos finais de semana.
5 Conclusões
O DataSUS tem papel essencial nas ações de saúde pública brasileira, executa desde a
coleta dos dados até a disseminação e passa pela estruturação e organização de
informações de saúde. Ainda que problemas possam ser evidenciados em seus Sistemas
de Informação em Saúde, a importância de sua manutenção e uso é indiscutível.
Destaca-se também o pioneirismo brasileiro em disponibilizar publicamente, para toda a

sociedade, o acesso a dados detalhados de saúde. Isso inclui a disponibilização de
sistemas de consulta a esses dados, como o TabNet e TabWin, assim como a
disponibilização dos microdados, o que permite a utilização integrada de outros, como o R
com o pacote microdatasus.

431
Frente aos Sistemas de Informação em Saúde tradicionais, existentes há décadas, o
DataSUS tem procurado atualizar suas tecnologias e conceitos e apresentar a Rede
Nacional de Dados em Saúde (RNDS). Em sua conceituação, a RNDS se propõe a resolver
antigas questões dos sistemas tradicionais e utiliza tecnologias mais modernas de
transmissão de dados, armazenamento, recuperação e consulta.
A evolução dos Sistemas de Informação em Saúde é contínua; criam-se novos sistemas,

outros são descontinuados e novas tecnologias são agregadas para atender aos problemas
da saúde pública brasileira. Nesses termos, os conceitos de integridade e transparência
devem ser sempre observados na discussão, para que os dados dos Sistemas de
Informação em Saúde nacionais continuem a ser vistos como referência nacional e
internacional.

Referência
BRASIL. Ministério da Saúde. Secretaria Executiva. Departamento de Informática do

SUS. DATASUS trajetória 1991-2002. Brasília, DF: Ministério da Saúde, 2002 (Série G.
Estatística e Informação em Saúde).
BRASIL. Lei nº 8.248, de 23 de outubro de 1991. Dispõe sobre a capacitação e

competitividade do setor de informática e automação, e dá outras providências. Brasília,
DF: Presidência da República, 1991. Disponível em: http://www.planalto.gov.br/ccivil_03/
leis/L8248compilado.htm. Acesso em: 27 set. 2022.

433
Lista de siglas
Sigla Descrição
AMS Pesquisa Assistência Médico Sanitária
ANS Agência Nacional de Saúde Suplementar
APAC Autorização de Procedimento de Alta Complexidade
CBO Classificação Brasileira de Ocupações
CMD Conjunto Mínimo de Dados
CNES Cadastro Nacional de Estabelecimentos de Saúde
COAP Contrato Organizativo da Ação Pública da Saúde
CSV Comma Separated Values
DATAPREV Empresa de Tecnologia e Informações da Previdência Social
DataSUS Departamento de Informática do SUS
FNS Fundo Nacional de Saúde
HIPERDIA Programa para a Melhoria do Controle dos Pacientes com Hipertensão e
Diabetes Mellitus
IBGE Instituto Brasileiro de Geografia e Estatística
IDB Indicadores e Dados Básicos
INAMPS Instituto Nacional de Assistência Médica da Previdência Social
PCE Programa de Controle da Esquistossomose
PIB Produto Interno Bruto
PNAD Pesquisa Nacional por Amostra de Domicílios
PNS Pesquisa Nacional da Saúde
RNDS Rede Nacional de Dados em Saúde
SCZ Síndrome Congênita associada à infecção pelo vírus Zika
SIA Sistema de Informações Ambulatoriais
SIH Sistema de Informações Hospitalares
SIM Sistema de Informação sobre Mortalidade
SINAN Sistema de Informação de Agravos de Notificação
SINASC Sistema de Informações de Nascidos Vivos
SIOPS Sistema de Informações sobre Orçamentos Públicos em Saúde
SIPNI Sistema de Informações do Programa Nacional de Imunizações
SISCAN Sistema de Informação do Câncer
SISCOLO Sistema de Informação do Câncer do Colo do Útero
SISMAMA Sistema de Informação de Câncer de Mama
SISVAN Sistema de Informações da Vigilância Alimentar e Nutricional
UF Unidade da Federação
VIGITEL Vigilância de Fatores de Risco e Proteção para Doenças Crônicas por
Inquérito Telefônico
VIVA Vigilância de Violências e Acidentes

Capítulo 18
Modelagem e gestão de banco de

dados com SQL e integração com o R
Felipe Ferré1
1
Conselho Nacional deSecretários de Saúde - Conass
RESUMO:
Este capítulo introduz a modelagem e gestão de dados, tendo como foco o gestor do SUS e
pesquisadores de saúde coletiva. Para isso, utiliza a integração de Sistema Gerenciador de Banco de
Dados (SGBD) com o R e linguagemestruturada de consulta SQL (Structured Query Language). Além
disso, aborda os conceitos de modelagem relacional e analítica e demonstra por meio de exemplos
com os dados do SUS, como armazenar e recuperar dados, elaborar estratégias de indexação e como
realizar a transposição e processamento de bases de dados massivas – Big Data.
PALAVRAS-CHAVE:
Linguagem R. Gestão de dados. Big Data. SQL.

435
1 Introdução
O objetivo do capítulo é introduzir o gestor do SUS ou o pesquisador em saúde coletiva

acerca da modelagem e gestão de dados com Sistema Gerenciador de Banco de Dados
(SGBD). O foco é a construção de bancos de dados a partir do material disseminado pela
Secretaria de Informação e Saúde Digital (SEIDIGI/MS) por intermédio do Departamento
de Informática do SUS do Ministério da Saúde (Datasus/SE/MS) e pelo Departamento de
Monitoramento e Avaliação do Sistema Único de Saúde (DEMAS/SE/MS).
O capítulo foi escrito com abordagem da prática para a teoria, isto é, são trazidos exemplos
práticos de dados disseminados via ftp://ftp.datasus.gov.br (no bojo da estratégia do
TabWin; para mais informações acesse https://datasus.saude.gov.br/transferencia-de-
arquivos/) e https://opendatasus.saude.gov.br/. Os exemplos são aplicados aos conceitos
das ciências da computação e informação acerca da modelagem relacional e introduzidos
aspectos do diagrama de entidade e relacionamento.
Os exemplos integram o ambiente de programação do projeto R com a linguagem

estruturada de consulta SQL (do inglês structured query language). Porém, ainda que o
sanitarista não queira implementar código-fonte (programar) nessas linguagens,
recomenda-se a leitura do capítulo para quem deseja obter vocabulário de informática em
saúde e ciência de dados, de modo a atuar em equipe com estatísticos, analistas de BI e
cientistas de dados.
Os exemplos foram codificados em R, versão 4.1.2 e PostgreSQL (psql) 14.2 (Ubuntu 14.2-
1.pgdg20.04+1). Pequenas adaptações podem ser necessárias caso o usuário possua
ambientes diferentes, contudo, sem prejuízo para a aprendizagem dos conceitos.
1.1 Bancos de dados
Banco de dados é uma coleção organizada de dados com regras de gestão

automatizadas. No sistema de saúde brasileiro existem centenas de aplicações de
coleta de dados de vigilância, atenção, logística, infraestrutura e força de trabalho.
O acesso mais comum aos dados, infelizmente, não ocorre diretamente ao banco
de dados, mas a dados em tabelas de disseminação. Dessa forma, para realizar
consultas e filtros os usuários devem baixar e organizar os dados, seja de forma
artesanal em planilhas de cálculo ou em estruturas organizadas e automatizadas
com algoritmos validados.

Em uma analogia com dados em planilhas de cálculo, pode-se supor que cada aba
do arquivo XLSX ou ODS seja uma tabela e que o arquivo inteiro contendo várias
tabelas relacionadas entre si possa se chamar de banco de dados, desde que a
primeira linha de cada tabela contenha o título da coluna, aqui
denominado campo ou atributo. O cruzamento de dados entre tabelas requer uma
forma específica para referenciá-los. No exemplo da gestão manual de dados em
planilha de cálculo, as referências para cruzar células são as respectivas linhas,
colunas e planilhas. Entretanto, a analogia para por aqui, uma vez que os bancos de
dados são formalmente geridos para assegurar integridade e o conteúdo das
informações.
O projeto R é poderoso para transformação de dados, porém, a gestão de

dados apresenta ferramenta específica, o Sistema Gerenciador de Banco de
Dados (SGBD). A manipulação constante e de forma compartilhada de dados que
crescem com o tempo requer a boa prática do uso de SGBD para evitar erros e
ofertar reprodutibilidade e segurança. Dentre as vantagens do SGBD destacam-se:
• baixa curva de aprendizado se comparada com a infinidade de recursos e

alternativas ofertadas por ferramentas estatísticas, uma vez que o conhecimento
da estrutura básica da sintaxe dos filtros do SGBD é suficiente para realizar
consultas ao banco de dados;
• organização do repositório de dados em bancos e tabelas, muitas vezes de forma

análoga à realizada de forma intuitiva em planilhas de cálculo;
• gerenciamento de usuários, incluída a permissão individualizada de apenas

leitura ou de leitura e escrita em cada tabela, o que viabiliza o uso compartilhado e
controlado na instituição;
• visões de dados com recortes de atributos ou dados de acordo com cada

necessidade específica, particularmente útil para cessão de dados anonimizados
do titular cuja base contém dados pessoais;
• integridade referencial, isto é, a adoção de chaves impede registros

inconsistentes e evita duplicidades;

437
• integridade do conteúdo, uma vez que podem ser aplicadas restrições
de domínios de dados que impedem o registro fora das especificações de faixas
numéricas, categorias ou tipos (por exemplo, datas, variáveis lógicas de verdadeiro
ou falso, restrição do tipo de caractere);
• escalabilidade em bases de dados com crescimento de milhões de registros ou

superior;
• desempenho para consulta devido aos recursos de indexação;
• interoperabilidade com outras ferramentas, visto que os mesmos dados podem

ser acessados por ferramentas estatísticas (por exemplo, projeto R, STATA, SPSS)
ou de inteligência de negócios BI (do inglês business intelligence), tais como
Metabase, PowerBI, MicroStrategy, Tableau, DataStudio, QlikView;
• gerenciamento com ferramentas de ETL (do inglês Extract Transform Load) -

Extração, Transformação e Carga (por exemplo, Pentaho Data Integration,
PowerCenter);
• ferramentas de cópia de segurança (backup) e exportação;
• arquitetura em camadas, cuja separação do manejo de dados, aplicação e

interface com o usuário permite o desenvolvimento e a especificação de servidores
dedicados e otimizados para dado fim;
• ambiente cliente-servidor, uma vez que os dados podem ser acessados pelas
máquinas dispostas no mesmo ambiente de rede ou por parceiros quando o acesso
externo à rede é configurado ou quando são armazenados em nuvem.
• comunicação com ferramentas de Big Data e gestão de dados com essas

ferramentas que são capazes de organizar dados massivos para consulta,
distribuição do processamento em diversas máquinas, disponibilizar dados para
interoperabilidade, viabilizar o processamento para o uso em técnicas específicas
de aprendizado de máquina ou ferramentas analíticas etc. Exemplos de recursos de
Big Data são Hadoop, Spark, Parquet, Storm, Cassandra, RapidMiner, Neo4j,
SAMOA, HPCC, GreenPlum, ElasticSearch, entre outros.

Existem bancos de dados estruturados e não estruturados. Os bancos de dados não
estruturados gerenciam dados de forma flexível, usualmente conteúdo em
linguagem natural de documentos e vídeos. Por sua vez, bancos de
dados estruturados apresentam estruturas rígidas, codificadas, usualmente com
tabelas relacionadas umas às outras cujo registro distinto é armazenado em uma
linha e cada atributo é disposto em uma coluna com domínio previamente
especificado.
Devido à estrutura em linhas e colunas é comum haver confusão entre dados

armazenados em planilhas de cálculo e banco de dados. Aqui assume-se que a
diferença entre um conjunto de dados (do inglês dataset) e o banco de dados, visto
que este apresenta uma gestão formal e automatizada de dados por uma aplicação
gerenciadora, embora ambos possam ser coleções de dados organizados se forem
formalizadas as regras de uso e interpretação.
Em organizações com dezenas de pessoas ou mais acessando constantemente o

mesmo banco de dados é estabelecido formalmente quem é (ou quais são)
o administrador de banco de dados (DBA) (do inglês data base administrator),
preferencialmente um profissional especializado na ferramenta gerenciadora
escolhida.
Porém, ainda que sua coordenação, departamento ou grupo de pesquisa contenha

menos que dez pessoas, o uso de gerenciador de dados viabiliza estabelecer uma
cultura de dados com processos e padrões de curadoria, ainda que existam
mudanças constantes nos quadros de colaboradores e parceiros.
1.2 Bancos de dados estruturados
O presente capítulo aborda bancos de dados estruturados, também chamados de

bancos de dados relacionais. A maioria das aplicações do SUS armazenam
informações em bancos de dados relacionais desenvolvidos sob o
modelo Entidade-Relacionamento. Cada entidade (por exemplo, usuário,
estabelecimento, procedimento, gestor) apresenta um dado relacionamento no
mundo real para realizar tarefas (a exemplo de diagnósticos, laudos, atendimentos,
dispensações) cuja comunicação deve ser organizada para satisfazer necessidades
reprodutíveis ao longo do tempo.

439
Os bancos de dados estruturados podem ser transacionais ou analíticos. Os bancos
de dados das aplicações (por exemplo para dados ambulatoriais, hospitalares, de
notificações de óbitos ou doenças, leitos, equipamentos, profissionais) são
transacionais, isto é, organizados para a transação, a memória do ato de
comunicação cujo processo administrativo é mediado por um Sistema de Informação
da Saúde (SIS). A partir de extrações dos bancos de dados transacionais são
gerados os bancos de dados analíticos, os quais alimentam as bases de
disseminação mais comuns do SUS voltadas para facilitar o Monitoramento e
Avaliação de políticas públicas.
O foco do capítulo é a modelagem de dados relacionais (estruturados)

e analíticos com sistemas gerenciadores de bancos de dados, o que abre o
caminho para técnicas de bancos de dados massivos (do inglês big data) para
consultas que alimentam relatórios gerenciais, a exemplo de indicadores de saúde
ou artifícios de logística, métodos estatísticos e epidemiológicos (por exemplo para
estudos observacionais) e de aprendizado de máquina (do inglês machine learning)
no universo da simulação in silico (métodos de descoberta de conhecimento não
trivial ou KDD - knowledge discovery in databases) e da automação de decisões com
inteligência artificial.
1.3 Sistema gerenciador de banco de dados
O Sistema Gerenciador de Banco de Dados (SGBD) é uma coleção de programas

para gestão de banco de dados, a qual requer a definição explícita das regras de
armazenamento, incluída a definição dos metadados, isto é, as características de
cada elemento mantido no banco.
Um banco de dados é constituído após serem formalizados:

• método de registro de dados (aplicações);
• métodos de recuperação de dados (ferramentas analíticas);
• tipo de dados;
• restrições;
• meio de armazenamento;
• estrutura de cópia de segurança;
• níveis de acesso e permissão de leitura e escrita.

A Figura 1 ilustra elementos do SGBD.
Figura 1 - Produção, gestão e análise de dados com SGBD
Com o SGBD decorre a separação da camada de aplicação (em geral a tela de

cadastro formada com técnicas chamadas front-end), da consulta (ferramentas
analíticas) e do banco de dados (cuja interação é realizada com técnicas chamadas
back-end); há ferramentas especializadas em cada uma dessas tarefas.
Da mesma forma, existem profissionais específicos cumprindo os diferentes papéis

de gestão de dados.
• Administrador de banco de dados ou database administrator (DBA):
gestão de hardware e software, gestão de acesso, monitoramento do uso e
segurança da informação.
• Engenheiro de dados: identifica requisitos, modelagem e otimização de

bancos de dados para o uso.
• Usuários: acesso ao banco de dados, usualmente com permissão de leitura.
• Analista de BI: acesso ao banco de dados para adoção em ferramentas de

inteligência de negócios, usualmente com foco na visualização.

441
2 Bases de dados analíticas a partir dos dados disseminados do SUS
Os dados disseminados pelo Datasus são detalhados no capítulo 17 – Acesso aos Dados
agregados e microdados do SUS. O interesse aqui é apenas sumarizar os dados
disponíveis para caracterizar o recorte escolhido. O conhecimento do conteúdo dos dados
disponibilizados pelo SUS, da estrutura e forma de disseminação, é fundamental para a
modelagem relacional e respectiva gestão dos bancos de dados resultantes.
A estratégia TabWin de disseminação utiliza arquivos em formato DBF, compactados em

formato DBC, os quais são descompactados e concatenados pelo programa eletrônico
TabWin. O Datasus disponibiliza o programa no arquivo dbf2dbc.exe, o qual é livre, porém
de código fechado, sem possibilidade de ser aprimorado pela comunidade, obrigando o
artifício da engenharia reversa (quebra do código) ou refatoração. O processo de
concatenação emprega domínios de dados (por exemplo, tabelas de diagnósticos, tabelas
de municípios) – usualmente em formato CNV – e metadados (definições dos rótulos dos
atributos, tipos e restrições) em formato DEF. A Tabela 1 resume o conteúdo disponível no
braço de disseminação via estratégia TabWin.

Tabela 1 - Sumário dos dados disseminados pelo Datasus/SE/MS (Departamento de
Informática do SUS/Secretaria Executiva/Ministério da Saúde) via estratégia TabWin
Sistema Arquivos Registros Mês Mês final No Endereço

inicial Mantenedor
Comunicação de 868 7.676.888 01/2008 04/2011 SAES/MS [url]CIH/200801_201

Internação Hospitalar 012/Dados
(CIH)
Comunicação de 3.437 188.116.504 01/2011 03/2022 SAES/MS [url]CIHA/201101_/D

Informação Hospitalar ados
e Ambulatorial (CIHA)
Cadastro Nacional de 63.841 932.550.889 08/2005 03/2022 SAES/MS [url]CNES/200508_/

Estabelecimentos de Dados/
Saúde (CNES)
Sistema de 40.228 6.269.311.422 01/2008 03/2022 SAES/MS [url]SIASUS/200801

Informações _/Dados/
Ambulatoriais do SUS
a partir de 2008 (SAI)
Sistema de 4.374 596.416.686 07/1994 12/2007 SAES/MS [url]SIASUS/199407

Informações _200712/Dados/
Ambulatoriais do SUS
de 1994 a 2007
(SIA*)
Sistema de 172 793.149 01/2008 04/2022 SAES/MS ftp://ftp2.datasus.gov

Gerenciamento da .br/pub/ sistemas/tup
Tabela de /downloads/
Procedimentos, TabelaUnificada_*
Medicamentos e
OPM do SUS (Sigtap)
Sistema de 17.251 1.917.030.286 01/2008 03/2022 SAES/MS [url]SIHSUS/200801

Informações _/Dados/
Hospitalares do SUS
a partir de 2008 (SIH)
Sistema de 9.132 853.529.012 01/1992 12/2007 SAES/MS [url]SIHSUS/19920

Informações 1_200712/Dados/
Hospitalares do SUS
de 1992 a 2007
(SIH*)
Sistema de 785 36.353.134 12/1996 12/2020 SVS/MS [url]SIM/CID10/DOR

Informações de ES/
Mortalidade (SIM)
Sistema de 804 38.435.335 12/2000 12/2020 SVS/MS [url]SINAN/DADOS/

Informação de FINAIS/
Agravos de
Notificação (Sinan)
continua

443
conclusão
Sistema Arquivos Registros Mês Mês final No Endereço

inicial Mantenedor
Sistema de 787 96.968.941 12/1994 12/2020 SVS/MS [url]SINASC/1996_/

Informações sobre Dados/DNRES
Nascidos Vivos
(Sinasc)
Sistema de 1.509 2.420.091.846 01/2017 04/2019 SAPS/MS [url]CMD/DadosSISA

Informação em B/
Saúde para a
Atenção Básica (-
conjunto mínimo de
dados (CMD) Sisab
Sistema de 944 5.591.213 01/2012 12/2014 SVS/MS [url]SISPRENATAL/2
Informação do Pré- 01201_/Dados
natal Sisprenatal
Fonte: adaptada de URL: ftp://ftp.datasus.gov.br/dissemin/publicos/.
Considerando-se apenas a estratégia TabWin, o DataSUS disponibilizou, em abril/2022,

13.362.865.305 de registros em 144.132 arquivos de formato DBC (dados entre 01/1992 e
04/2022. Um disco rígido de 4 terabytes é ainda suficiente para armazenar esse volume de
dados em um SGBD. Contudo, caso se apresente a necessidade de consolidar todos os
dados disseminados são necessários, ao menos, 10tb para download e extrações para uso
analítico.
Logo, para obter dados hospitalares nacionais entre 01/2008 e 03/2022 deverão ser
extraídos, transformados e carregados 17.251 arquivos DBC e organizado o
armazenamento de 1.917.030.286 registros. A Tabela 2 mostra características de arquivos
DBC sortidos.

Tabela 2 - Amostra de arquivos DBC disponíveis no repositório
mantido pelo Datasus/SE/MS (Departamento de Informática do
SUS/Secretaria Executiva/Ministério da Saúde)
Arquivo Subsistema Registros Data
ANIMBR14.dbc SINAN ANIM - Animais Peçonhentos 168.383 2021-11-08
BOTUBR07.dbc SINAN BOTU - Botulismo 26 2021-11-23
CHAGBR11.dbc SINAN CHAG - Doença de Chagas 190 2021-11-23
COLEBR16.dbc SINAN COLE - Cólera 1 2021-11-23
COQUBR09.dbc SINAN COQU - Coqueluche 3.131 2021-11-23
CRSC1001.dbc CIH CR - Sistema de Comunicação de Informação 7.665 2017-06-07

Hospitalar
CTPR1811.dbc CMD CT - Contatos Assistenciais 1.596.088 2019-03-22
DOEXT11.DBC SIM DOE - Declarações de Óbitos por causas externas 145.842 2020-01-31
DOINF14.dbc SIM DOI - Declarações de Óbitos Infantis 38.432 2020-01-31
DOMAT03.DBC SIM DOM - Declarações de Óbitos Maternos 1.584 2020-01-31
EEPE1810.dbc CNES EE - Estabelecimento de Ensino 8 2018-11-14
EFGO1507.dbc CNES EF - Estabelecimento Filantrópico 17 2016-08-11
FTIFBR15.dbc SINAN FTIF - Febre Tifóide 87 2021-11-23
GMAL1307.dbc CNES GM - Gestão e Metas 2 2016-08-09
HANTBR17.dbc SINAN HANT - Hantavirose 1.250 2021-11-23
IEXOBR13.dbc SINAN IEXO - Intoxicação Exógena 97.681 2021-10-08
LEIVBR12.dbc SINAN LEIV - Leishmaniose Visceral 9.417 2021-11-08
LEPTBR16.dbc SINAN LEPT - Leptospirose 16.420 2021-11-23
MALABR07.dbc SINAN MALA - Malária 3.521 2021-11-23
MENIBR08.dbc SINAN MENI - Meningite 35.161 2021-11-23
PAMG2002.dbc SIA PA - Produção Ambulatorial 4.427.238 2021-04-05
PESTBR10.dbc SINAN PEST - Peste 19 2021-11-23
PRDF1706.dbc CMD PR - Procedimentos Realizados 10.049 2019-03-22
RAIVBR09.dbc SINAN RAIV - Raiva Humana 2 2021-11-23
RCPI1405.dbc CNES RC - Regra Contratual 482 2016-08-09
RJPI1610.dbc SIH RJ - AIH Rejeitada 433 2018-01-08
SPAM1811.dbc SIH SP - Serviços Profissionais 144.067 2020-01-09
STPB1203.dbc CNES ST - Estabelecimentos 4.577 2014-06-05
TETNBR16.dbc SINAN TETN - Tétano Neonatal 1 2021-11-23
TUBEBR02.dbc SINAN TUBE - Tuberculose 94.518 2021-11-23

445
Usualmente os arquivos DBC disseminados a partir de sistemas de informação em saúde
mantidos pela Secretaria de Atenção Especializada à Saúde (SAES/MS) apresentam a
estrutura básica subsistema|UF|ano|mês. Os dados mantidos pela Secretaria de
Vigilância em Saúde (SVS/MS) frequentemente são nomeados de subsistema|UF ou
BR|ano. O formato de data apresentado na tabela 2 é o mesmo aceito pelos SGBD, a
saber, ano com quatro dígitos, mês com dois dígitos e dia com dois dígitos separados por
hífen ou yyyy-mm-dd.
A Tabela 3 exemplifica um sistema de informação – o Sistema de Informações

Ambulatoriais (SIA) – com os demais subsistemas. Para ilustrar a modelagem relacional
no decorrer do capítulo selecionou-se o subsistema laudo de medicamentos.
Tabela 3 - Sumário dos arquivos DBC segundo o

Sistema de Informações Ambulatoriais (SAI)
Subsistema Arquivos Registros Mês inicial Mês final
Produção Ambulatorial (PA) 4.766 8.019.664.200 01/2008 03/2022
Boletim Individual (BI) 4.617 1.818.430.965 01/2008 03/2022
Laudo de Medicamentos (AM) 4.571 237.557.759 01/2008 03/2022
PS - Psicossocial 2.991 95.153.771 11/2012 03/2022
AD - Laudos Diversos 4.588 42.624.440 01/2008 02/2022
AQ - Laudo de Quimioterapia 4.582 42.112.653 01/2008 03/2022
Laudo de Tratamento Dialítico 2.453 9.707.800 08/2014 02/2022

(ATD)
Laudo de Nefrologia (NA) 2.145 6.534.272 01/2008 10/2014
Atenção Domiciliar (SAD) 1.088 3.524.141 04/2012 10/2018
Laudo de Radioterapia (AR) 4.159 3.353.191 01/2008 03/2022
Laudo de Confecção de Fístula 2.357 249.500 08/2014 02/2022

(ACF)
Laudo de Acompanhamento à 544 211.252 01/2008 04/2017

Cirurgia Bariátrica (AB)
Laudo de Acompanhamento 327 19.578 03/2016 02/2022

Multiprofissional (AMP)
Quem desejar conhecer o número de usuários, a idade e sexo, o município de residência e

atendimento, e, finalmente, a composição das dispensações de medicamentos do

Componente Especializado da Assistência Farmacêutica (CEAF), Grupo 1A –
medicamentos com aquisição centralizada pelo MS – deverá lidar com dados entre 01/2008
e 03/2022, processar 4.571 arquivos DBC e organizar o armazenamento de 237.557.759
registros.
Contudo, os dados presentes no subsistema laudo de medicamento são relacionados aos

registros presentes nos arquivos SIA PA, os quais contêm o corpo da guia Autorização de
Procedimentos Ambulatoriais e Alta Complexidade/Custo (APAC). Dessa forma, é
necessário reunir informações de ambos os subsistemas.
A Tabela 4 aponta o volume anual de dados a serem processados para se obter um

conjunto de dados útil. O número de arquivos SIA PA pode ser maior, pois uma vez
excedido certo tamanho (por exemplo, um milhão de registros) esse é particionado em duas
ou três partes. Atualmente apenas os arquivos do estado de São Paulo apresentam essa
situação.
Tabela 4 - Arquivos DBC ao ano, segundo o Sistema de Informações Ambulatoriais (SAI)

de medicamentos (AM) e conjunto contemplando os dos demais procedimentos (PA)
Ano Arquivos AM Registros AM Arquivos PA Registros PA
2008 322 9.370.092 324 151.251.933
2009 319 10.939.550 324 174.550.989
2010 320 11.204.084 324 187.492.201
2011 320 12.254.573 325 216.549.358
2012 321 13.188.988 324 224.615.965
2013 323 13.840.326 336 244.920.784
2014 320 15.929.560 336 267.366.357
2015 324 17.366.565 336 281.996.872
2016 320 17.834.962 336 305.468.759
2017 320 18.869.561 336 365.332.874
2018 321 19.801.812 336 358.566.228
2019 321 21.409.138 346 389.240.109
2020 320 23.322.108 348 324.172.486
2021 321 25.685.917 348 411.834.580
2022 79 6.540.523 87 106.472.605

447
Complementando a informação anterior, quem desejar conhecer a totalidade de
dispensações de medicamentos do CEAF, incluídas as informações complementares como
quantidade aprovada para cada dispensação, deverá lidar adicionalmente com 4.766
arquivos PA e processar 4.009.832.100 registros PA. O total de processamentos
corresponde a 9.337 arquivos que contêm 4.247.389.859 registros.
3 Modelagem relacional de dados do SUS
Modelo é uma abstração estruturada de dado aspecto da realidade, aqui

denominada minimundo, com o objetivo de organizar a comunicação entre os atores
envolvidos e tornar atividades reprodutíveis.
A especificação é a construção de modelos precisos, sem ambiguidade e

completos (BOOCH; RUMBAUGH; IVAR, 2005). O desenvolvimento de programa
eletrônico ocorre entre o projetista – usualmente um analista de sistemas – e o cliente –
geralmente leigo em tecnologia da informação.
3.1 Modelagem de dados legados do SUS
O desenvolvimento de soluções na área da saúde pública é diferente do usual na

área de tecnologia de informação, pois os bancos de dados partem, com frequência,
de formulários estruturados por sanitaristas, antes mesmo de especialistas nas
ciências da comunicação e informação terem se consolidado no SUS. A ficha a
seguir (BRASIL, 2006b) é um dentre centenas de exemplos que levou à modelagem
de banco de dados ad hoc, isto é, formulados individualmente, sem uma estratégia
de saúde digital articulada para cada tipo de doença ou agravo de notificação. Como
resultado, existe uma dificuldade desnecessária para o cruzamento entre
notificações do mesmo sistema de informação com dados clínicos presentes em
sistemas de atenção à saúde, inclusive em prontuários eletrônicos e outros sistemas
de informação em saúde.
Ao contrário da orientação dos programas eletrônicos focada no serviço, a

modelagem adequada de bancos de dados administrativos em saúde deve partir do
prontuário eletrônico focado no usuário e no cuidado populacional, assumindo um
conjunto mínimo de dados de identificação e padrões para dados sociodemográficos
e clínicos.

O ponto de partida deve ocorrer de um modelo de dados comum para os diversos
prontuários eletrônicos e sistemas de informação administrativos, como ocorreu no
sumário de alta e Registro de Atendimento Clínico (RAC) elaborado de forma
tripartite para orientar o desenvolvimento e integração de programas eletrônicos.
Torna-se necessário, portanto, tanto na vigilância quanto na atenção à saúde, unir

esforços para a integração de dados históricos e interoperar os atuais sistemas de
informação desenvolvidos com finalidades específicas, os quais não contemplaram
– no ato da modelagem – a utilização fora da área gestora do dado.
Figura 2 - Ficha do Sistema de Informação de Agravos de Notificação (Sinan)
Fonte: Ministério da Saúde.

449
O exemplo a se trabalhar ao longo do capítulo é o da dispensação de medicamentos.
Na Figura 3 encontra-se a ficha de solicitação de medicamentos. A solicitação de
medicamentos de alto custo deve incluir o laudo que atesta o cumprimento dos
respectivos Protocolos Clínicos e Diretrizes Terapêuticas (PCDT) da doença em
tratamento.
A título de exercício, observe os formulários das figuras 2 e 3. Supondo-se que se

deseja conhecer as dispensações de medicamentos para a doença para qual se faz
vigilância em saúde: Como integraria os dois bancos? Os títulos dos campos são os
mesmos? Qual título se utilizaria? Existem campos afins como sexo, data de
nascimento? Existem campos diferentes? Como estão estruturados os atributos?
Consegue-se identificar domínios de atributos exclusivamente numéricos?
Consegue-se identificar domínios de atributos exclusivamente em formato de data?
Consegue-se identificar domínios de atributos delimitados por dada lista? Quais
outras bases de dados seriam necessárias para assegurar a referência ao usuário,
município, doença, medicamento?

Figura 3 - Ficha da Assistência Farmacêutica
Fonte: Ministério da Saúde.
Antes da Política Nacional de Informação e Informática em Saúde (PNIIS) (BRASIL,

2021), a modelagem de programa eletrônico partia de regras tradicionalmente
definidas à revelia de dada Estratégia de Saúde Digital, uma vez que se restringem
ao escopo da área gestora em função dos atos normativos ou de controle,
usualmente, do poder executivo (Secretarias Municipais de Saúde – SMS,
Secretarias Estaduais de Saúde – SES e Ministério da Saúde – MS).

451
3.1.1 Requisitos
O Sistema de Informação em Saúde (SIS) é uma ferramenta de comunicação

entre os diferentes atores envolvidos nas Ações e Serviços de Saúde para
garantir a execução e reprodutibilidade de processos de trabalho. O
desenvolvimento e a manutenção de programas eletrônicos requerem o uso
de boas práticas em desenvolvimento de software, incluídas as etapas de
modelagem (arquitetura), implementação (codificação) e implantação
(inserção no ambiente de trabalho). Por exemplo, o Registro Eletrônico em
Saúde (RES) apresenta como requisito fundamental a interoperabilidade, isto
é, a comunicação máquina-máquina entre diferentes sistemas de informação
da saúde, cuja tarefa é do especialista em informática em saúde, o qual define
com a equipe os padrões semânticos, modelos de informação e demais
artefatos. Outros profissionais de Tecnologia da Informação em Saúde (TIS),
por exemplo, engenheiros de software e o Project Owner (PO) aplicam
técnicas para definir os demais requisitos funcionais e não funcionais e
garantem que estejam de acordo com a visão do projeto, objetivos
pretendidos, escalabilidade (ampliação do uso ao longo do ciclo de vida do
programa eletrônico) entre outros itens elencados a seguir.
Requisitos funcionais são atribuições do que o programa eletrônico faz. Por

exemplo, todo valor de exame laboratorial deve ser acompanhado do
respectivo parâmetro clínico.
Requisitos não funcionais são formulações de qualidade e manutenção da

solução informatizada, isto é, definem parâmetros de desempenho,
segurança, confiabilidade e impõe restrições acerca do funcionamento do
programa eletrônico. Por exemplo, o programa eletrônico deve funcionar em
tablet e dispositivos móveis; o programa eletrônico deve apresentar camada
de interoperabilidade em HL7 FHIR.
Ao modelar os requisitos do programa eletrônico devem ser contemplados:

• usabilidade;
• eficiência (número de transações por unidade de tempo);
• confiabilidade (disponibilidade em 99% do tempo);
• portabilidade em dispositivos móveis ou computadores de mesa;
• implementação (linguagem, banco de dados);

• padrões (interoperabilidade, sistema operacional);
• éticos e
• legais.
A complexidade do sistema de saúde explica, em parte, a baixa qualidade de

muitos Sistemas de Informação em Saúde (SIS), a qual é vencida com os
métodos corretos de desenvolvimento. O desenvolvedor deve levar em
consideração a aplicação das normas e contemplar os ditames legais; a
finalidade (controle de gastos em detrimento das funcionalidades clínicas) e
compatibilizar a integralidade e resolubilidade do sistema de saúde com o
escopo fragmentado dos processos de trabalho particionados em i) níveis de
complexidade (atenção primária, média e alta complexidade), ii) ação em
saúde (atenção, vigilância e controle financeiro), iii) esferas de gestão
(municipal, estadual e federal) e iv) competição na prestação (público versus
privado) (FERRÉ, 2021).
As consequências da não aplicação das boas práticas de desenvolvimento

de software e dos dispositivos estabelecidos na Política Nacional de
Informação e Informática (PNIIS) são inúmeras, como o excesso de
informações coletadas, muitas vezes sem uso; a indisponibilidade de recursos
que completam automaticamente os dados, sobretudo para dados cadastrais
advindos do CADSUS; e a fragmentação que implica em dupla digitação.
Portanto, as decorrentes inconsistências dificultam o traçado da linha de
cuidado do usuário do sistema de saúde a partir de cada contato assistencial.
Um exemplo é a dificuldade da gestão municipal e estadual em monitorar

casos e óbitos por Covid-19, uma vez que os dados consolidados
nacionalmente são fragmentados em sistemas de informação não integrados,
como o Gerenciador de Ambiente Laboratorial (GAL), Notificações de
Síndromes Respiratórias Agudas Graves (SRAG, SIVEP - Gripe), Sistema de
Informação sobre Mortalidade (SIM) e Sistema de Informações do Programa
Nacional de Imunizações (SI-PNI). Embora os sistemas acima relacionados
sejam mantidos pelo mesmo setor – a Secretaria de Vigilância em Saúde e
Ambiente – as dinâmicas de preenchimento são diferentes e a mesma
informação (por exemplo óbito) não é disponibilizada de forma integrada e no
tempo oportuno. Ainda que os dados sejam consolidados no nível nacional,

453
pode haver inconsistência na identificação do usuário do SUS, o que implica
retificação dos registros diários, facilmente observados nas planilhas
disponíveis em https://covid.saude.gov.br/ e https://www.conass.org.br/pain
elconasscovid19/ (acesso em 25/08/2022) de casos e óbitos quando, em
determinada data, aparecem valores negativos. Além disso, para estudos
aprofundados, torna-se necessária a realização de técnicas complexas com
elevado custo computacional, como o pareamento probabilístico, uma vez
que não é garantida a identificação unívoca do usuário do SUS. Um processo
fragmentado fragiliza tanto o ato clínico, uma vez que o profissional de saúde
não tem acesso ao histórico de saúde completo, como a gestão, mediante
situações de saúde não detectadas via indicadores e demais estratégias de
monitoramento (FERRÉ et al., 2021).
Cada processo informatizado de trabalho deve compreender sua contribuição

no sistema de saúde para assegurar a integralidade no cuidado, a
regionalização e operação em redes e níveis de atenção, o acompanhamento
familiar assumindo-se a atenção primária como ponto de partida e ponto de
chegada para promoção, prevenção e recuperação da saúde.
3.2 O Modelo entidade-relacionamento
3.2.1 Entidades
Entidades são representações de algo existente no mundo real, as quais

podem ser atores, usuários, trabalhadores e gestores do SUS, bem como
objetos e operações, a exemplo de medicamentos, órteses, próteses,
estabelecimentos, procedimentos e diagnósticos. As entidades usualmente
terminam por serem expressas como tabelas nos bancos de dados e são
descritas por atributos, como os campos dos formulários das figuras 2 e 3.
As entidades são instâncias do mundo real que não se repetem. Logo,

estamos falando do conjunto de estabelecimentos, em que
cada tupla ou registro representa dado estabelecimento, por exemplo,
Santa Casa de Misericórdia no município X. Quando se fala da tabela de
medicamentos está-se referindo ao ácido acetil salicílico 100mg (atributos
princípio ativo, dosagem e unidade de medida). Nesse universo não são
diferenciados os medicamentos segundo a marca. Caso venha a ser
necessário, deve-se acrescentar a apresentação, itens por embalagem e
fabricante, por exemplo, a depender de se na modelagem foi definido o uso
do termo genérico (comum para prescrição no SUS) ou a marca e o fabricante
para fins logísticos e de rastreabilidade (controle da validade em uma
farmácia da atenção básica) sendo assegurada a univocidade e incluídos lote
e fabricante.
A garantia da univocidade – ou unicidade – isto é, que dado registro não

venha a se repetir, ocorre com a especificação dos atributos que definem o
objeto de dada classe a qual, na modelagem, pode ser derivada de uma
entidade ou de uma relação.
3.2.2 Atributos
Atributo é uma qualidade, uma característica que diferencia objetos da

mesma classe. Por exemplo, o atributo dosagem pode diferenciar
o medicamento se no minimundo for necessária a diferenciação do mesmo
objeto em contextos diferentes. No caso do ácido acetil salicílico, em um
sistema de avaliação de interações medicamentosas pode não ser necessário
diferenciar a apresentação, atendo-se apenas à denominação genérica ou
aos princípios ativos. Entretanto, se houver registro de dispensação no
estabelecimento será necessário outro atributo para separar a quantidade do
princípio ativo entre 100mg e 500mg. O atributo adicional pode ser a
apresentação ou forma farmacêutica (por exemplo gotas, comprimidos ou
cápsulas).
A formulação de bancos de dados a partir dos campos dos formulários das

figuras 2 e 3 culmina na transposição em linguagem de banco de dados de
modo a assegurar o correto registro e recuperação das informações. Cada
atributo deve ser avaliado e classificado conforme as seguintes categorias:
• Possibilidade de subdivisão:
o simples (por exemplo sexo, idade,);
o composto (por exemplo endereço, nome, composição de princípio ativo
do medicamento e data de internação).

455
• Número de valores admitidos:
o monovalorados (sexo, data de nascimento, fabricante, data de
internação);
o multivalorados (diagnósticos relacionados ao tratamento, títulos
acadêmicos, sintomas, números de telefone).
• Derivação:
o primários ou armazenados (data de nascimento);
o derivados, pois são obtidos a partir dos dados armazenados (por
exemplo idade calculada a partir data de nascimento, número de
atendimentos de dado usuário do SUS, dias entre o tratamento atual e
o anterior).
Na prática, os dados são armazenados em bancos de dados SQL na forma

de
• Datas, em geral no formato Ano-Mês-Dia (yyyy-mm-dd), 2002-12-25;
• Data e hora, por exemplo 2002-12-25 12:59:25;
• Números inteiros, por exemplo 53254;
• Números decimais, sempre separados por ponto, por
exemplo 53254.23;
• Booleanos, quando apenas duas opções são aceitas, por
exemplo false ou true, 0 ou 1;
• Caracteres, por exemplo Joana da Silva;
• Listas, quando é aceito apenas um dentre o conjunto delimitado de
valores, a exemplo de gestante, não gestante, trimestre 1, trimestre
2, trimestre 3, ignorado, não se aplica;
• Vetores, frequentemente para atributos multivalorados como
diagnóstico, como a psoríase é caracterizada pelos diagnósticos,
segundo a Classificação Internacional de Doenças (CID-10) L400 L401
L404 L408.
Em PostgreSQL, os tipos de dados mais comuns são apresentados na tabela

5. Usar os tipos de dados elencados ou consultar o manual quando for criar
tabelas (PostgreSQL 2022).

Tabela 5 - Tipos de dados do PostgreSQL
Tipo Nome Armazenamento Descrição Intervalo

Numérico Smallint 2 bytes Inteiro de menor intervalo -32.768 a +32.767
Numérico Integer 4 bytes Inteiro de intervalo -2.147.483.648 a
intermediário +2.147.483.647
Numérico Bigint 8 bytes Inteiro de maior intervalo -
9.223.372.036.854.775.808
a
9.223.372.036.854.775.807
Numérico Decimal Variável Exatidão decimal definida Até 131.072 dígitos após a
pelo usuário casa decimal; até 16.383
dígitos após a casa
decimal.
Character Varchar(n) Variável Texto com número máximo
de caracteres definidos
pelo usuário
Character Char(n) Variável Texto que armazena
sempre o número de
caracteres definidos pelo
usuário
Character Text Ilimitado Texto com possibilidade
ilimitada de armazenagem
Temporal Timestamp 8 bytes Data e hora sem fuso 4713 a.C.
horário definido
Temporal Date 4 bytes Data no formado ano-mes- 4713 a.C.
dia (yyyy-mm-dd)
Booleano Boolean 1 byte Estado verdadeiro ou falso
Fonte: adaptado de (THE POSTGRESQL GLOBAL DEVELOPMENT GROUP, 2012).
A motivação para se escolher tipos com escopo delimitado é moderar o

armazenamento e otimizar a busca. A gestão de dados implica definir
corretamente os tipos, cujo impacto na ocupação em disco e na velocidade
de recuperação das informações é proporcional ao volume de dados.
Logo, para idade, código de raça/cor, código de sexo, o atributo smallint é

suficiente. Para código de município, dotado de 6 ou 7 dígitos, o tipo integer é
adequado. Porém, para o documento de identificação do usuário com Cartão
Nacional de Saúde (CNS) ou Cadastro de Pessoa Física (CPF) deve ser
usado o tipo de dado bigint ou char (texto), se preferir manter o zero à
esquerda.
O byte é uma unidade de informação. Note-se que o primeiro tipo acima

consome 2 bytes, o segundo 4 bytes e o terceiro 8 bytes. Embora se possa
optar por utilizar bigint para os três atributos, o espaço consumido em disco
do valor armazenado duplicará ou quadruplicará. Para se conhecer mais

457
acerca do que significa a medida leia o verbete byte na enciclopédia
livre (BYTE, 2022).
Da mesma forma, para se armazenar a data em formato dia/mês/ano deve

ser usado o tipo CHAR(10) para valores fixos que sempre ocuparão dez
caracteres ou VARCHAR(10) para ocupar entre 0 e 10 caracteres, uma vez
que não está no formato de data ano-mês-dia padronizado no SGBD.
Observe-se que para cada casa da cadeia de caracteres são aceitos qualquer
elemento do alfabeto, número e caractere especial (por
exemplo $#@%()!,;[]]}{). Cada posição ocupa 8 bytes, portanto, teoricamente,
o total ocupado será 80 bytes para cada valor de data armazenada no formato
texto. Por essa razão, recomenda-se transpor a data para o formato DATE,
desse modo serão gastos apenas 4 bytes para cada valor.
A otimização será apresentada a seguir quando se tratar de índices, porém,

é possível intuir que uma busca de dado com intervalo esperado menor é mais
rápida que em um dado que ocupe maior espaço em disco.
3.2.3 Domínio
Além da restrição quanto ao tipo, é possível definir o domínio de

dados. Domínio é o conjunto de valores que um atributo pode assumir
segundo a modelagem do minimundo. Exemplos:
O domínio de sexo é {feminino, masculino, ignorado};
O domínio de idade corresponde aos valores de 0 a 130;
O domínio de código de diagnósticos corresponde aos códigos da
Classificação Internacional de Doenças (CID-10);
O domínio do nome do usuário do SUS compreende 50 caracteres, permitidos
o conjunto do alfabeto e espaço, hífen e apóstrofo;
O domínio do valor do procedimento deve ser registrado com até oito dígitos
antes da casa decimal e dois após.
Os domínios podem ser estabelecidos na determinação do tipo de dado, com

cláusulas SQL de restrição ou com referência mandatória a uma tabela de
domínio. No decorrer do capítulo serão ilustrados ambos os casos utilizando-
se a linguagem SQL e a ferramenta PostgreSQL.

Exercício: modelar de forma livre em papel ou usando um software editor de
lâminas de apresentação ou análogo apontando as entidades e atributos
derivados dos formulários das figuras 2 e 3. Desenhar um retângulo para cada
entidade e enumerar abaixo cada atributo que conseguir identificar, com o tipo
de dado e domínio respectivos.
3.2.4 Relacionamentos
Nesse ponto o leitor deve ter intuído que uma entidade é registrada no banco
de dados enquanto um conjunto específico de atributos (aqui também
chamado classe). Bancos de dados em saúde são comumente modelados
com conjuntos, a exemplo de usuário do
SUS, trabalhador, estabelecimento e procedimento. Cada objeto da classe é
relacionado em tabelas à parte. Em bancos de dados estruturados, o formato
mais comum é o de tabela – com linhas ou tuplas – representando cada
instância, isto é, o usuário do SUS x, o trabalhador y, o estabelecimento z e
o procedimento w e colunas representando cada atributo respectivo.
No SUS é preterida a denominação paciente pois a promoção e prevenção

são tão importantes quanto a recuperação da saúde, logo, a denominação
usuário do SUS é mais abrangente e, portanto, adequada, por nem todos os
beneficiários do SUS encontrarem-se doentes.
Relacionamento é a forma de registrar e controlar a interação entre as

entidades. Em outras palavras, um relacionamento ocorre quando um atributo
de dada entidade apresenta referência necessária a outra.
A relação trabalha para é um relacionamento entre trabalhador e

estabelecimento (Figura 4).

459
Figura 4 - Relacionamento entre trabalhador e estabelecimento
A prescrição é um relacionamento entre usuário do SUS, trabalhador,

procedimento e estabelecimento (Figura 5).
Figura 5 - Relacionamento entre trabalhador e usuário por meio da prescrição

Nota: Não utilizar acentos ou caracteres especiais
(e.g., $%&*çãẽõáéíó) ao nomear componentes de bancos de dados.
A dispensação é um relacionamento entre usuário do SUS, trabalhador,

procedimento e estabelecimento.
Note-se que a descrição de prescrição e dispensação implica modelar a

diferença entre trabalhador prescritor e trabalhador dispensador, bem
como estabelecimento de prescrição e estabelecimento de dispensação. Nas
leis brasileiras o estabelecimento de prescrição pode ser nulo, caso o médico
seja profissional independente. Da mesma forma, no minimundo a
dispensação deve ocorrer obrigatoriamente em dado estabelecimento e não
se aceitam valores nulos na restrição de domínio.
Na gestão de banco de dados também são definidas restrições de
relacionamento, conhecidas como cardinalidade ou grau da relação.

Cardinalidade é o máximo de instâncias que podem ocorrer em dado
relacionamento.
Por exemplo, na relação trabalha para é exigida dedicação exclusiva ao
estabelecimento, logo, a cardinalidade é 1:1 (um para um), pois
o trabalhador trabalha para um e apenas para um estabelecimento.
No caso do relacionamento entre trabalhador e usuário do SUS a

cardinalidade é N:M (lê-se N para M ou muitos para muitos). Em outras
palavras, um usuário do SUS pode se relacionar com um ou
mais trabalhadores e um trabalhador pode se relacionar com um ou
vários usuários do SUS.
Exercício: modelar de forma livre em papel ou usando um software editor

de slides ou análogo e acrescentar os relacionamentos identificados a partir
dos formulários das figuras 2 e 3. Traçar uma linha entre os retângulos
desenhados para cada relacionamento e intitular cada um.
A nomenclatura do SUS de usuário, trabalhador e gestor aqui adotada é

comum no ambiente do controle social, a exemplo de atos
normativos (BRASIL, 2006a; 2009).
Convém consultar os Modelos de Informação Registro de Prescrição de

Medicamentos e Registro de Dispensação de Medicamentos, publicados de
forma tripartite na portaria SAES/MS 50/2022 (BRASIL, 2022). Nesse
documento é possível identificar que o atributo nome completo é obrigatório
[1..1], enquanto o nome social é facultativo [0..1]. Os medicamentos, por sua
vez, podem ou não serem prescritos [0..1], porém, quando ocorre a
prescrição, o registro pode ser de um ou de muitos medicamentos [1..N].
Exercício: derivar tabelas e atributos dos modelos de informação de

prescrição e dispensação de medicamentos a partir das tabelas da portaria
SAES/MS 50/2022 (BRASIL 2022). Utilizar uma planilha de cálculo e
acrescentar pelo menos três registros em cada tabela.

461
Portanto, o universo de cardinalidades deriva da combinação de nenhum, i,
ou muitos para nenhum, um ou muitos (cuja notação usualmente é N ou M),
utilizando-se dois pontos: ou .. para colocar a relação a depender de em qual
direção é lida. Nos anos 1990 as notações 0, 1 e N eram representadas
por 0, | e <, respectivamente, presentes em alguns softwares de modelagem.
Por exemplo, um ou muitos podem ser representados como 1:N, 1..N e |<.
Quando houver o relacionamento muitos para muitos elabora-se uma tabela

intermediária chamada tabela relacional segmentando em duas ou mais
relações de um para muitos. Por exemplo, um trabalhador pode prescrever
para nenhum ou muitos usuários, bem como um usuário pode receber
prescrição de nenhum ou muitos trabalhadores. Logo, a relação trabalhador-
usuário é de muitos para muitos. Nesse caso, a prescrição se torna a tabela
relacional, visto que um usuário pode ter uma ou muitas prescrições e um
trabalhador.
Figura 6 - Relacionamento entre trabalhador e usuário por meio da prescrição
A relação de muitos para muitos é decomposta em relação de um para um ou

de um para muitos de modo a tornar viável a gestão de bancos de dados
estruturados. A relação entre trabalhador e usuário é sempre especificada
em dado contexto, a exemplo da relação prescreve para ou dispensa para.
Dessa forma, a classe dispensação e a classe prescrição torna-se
uma tabela relacional, a qual define a relação entre diferentes entidades. No
caso, a tabela relacional prescrição apresenta cardinalidade 1:1, pois
um trabalhador prescreve a um e somente um usuário. Na prescrição, a

relação entre trabalhador e procedimento é de um para muitos, pois em dada
prescrição um trabalhador pode prescrever um ou muitos procedimentos.
4 Prática de SQL com PostgreSQL e R
4.1 A Linguagem SQL
A sigla SQL vem do inglês Structured Query Language ou Linguagem de Consulta

Estruturada. A linguagem SQL viabiliza a consulta, manipulação, definição e controle
de acesso aos dados. Cada operação será descrita nas seções 4.4, 4.5, 4.6 e 4.7.
Fundamentalmente a linguagem SQL é utilizada para manipular dados registrados

em tabelas.
Planilhas de cálculo são utilizadas com frequência para operação artesanal de

conjunto de dados. No entanto, as ferramentas apresentam limitações quanto ao
número de registros quando esse ultrapassa um milhão de registros. Outro
inconveniente é a necessidade de carregar inteiramente na memória de
processamento temporário do computador (RAM), o que requer recursos cada vez
maiores de hardware, o que ocorre também no R se não forem utilizados pacotes
específicos como o comando fread do data.table.
Na linguagem SQL existem os mesmos elementos. Deve-se referenciar

o banco, tabela e campo para cada operação, para o que existem termos e sintaxe
específicos.
A estrutura básica da linguagem SQL requer que se informem:

1. O(s) banco(s) de dados relacionados à operação, quando mais de um são
tratados na mesma consulta;
2. A(s) tabela(s) relacionada(s) à operação;
3. Os campos que serão manipulados e a referência a qual tabela pertencem;
4. A operação, isto é, o que deseja fazer (inserir, atualizar, selecionar etc.);
5. A restrição dos campos, isto é, os filtros ou condições. Se nada for informado, a
operação será realizada em todos os registros das tabelas referenciadas;

463
O presente capítulo introduz os elementos básicos e oferta exemplo com dados do
SUS, contudo, existem materiais que ampliam o conteúdo, a exemplo do livro
aberto https://pt.wikibooks.org/wiki/SQL.
4.2 Configuração do ambiente PostgreSQL em R
Existem várias formas de se integrar R com outras linguagens. Aqui vai se atar os
códigos SQL e R para usar o melhor de ambos. Em um ambiente markdown utiliza-
se o chunk sql. Adote a ferramenta Rstudio para a melhor experiência de usuário na
edição de código-fonte.
Os códigos abaixo funcionarão se se acessar o PostgreSQL a partir de uma máquina

local ou remota. Para instalar o PostgreSQL procurar a versão mais recente no
buscador favorito.
Uma vez instalado e configurado o PostgreSQL, basta fornecer os parâmetros ao

cliente SQL. Alguns clientes (visualizadores de bancos de dados) foram
exemplificados na seção 5.1. Aqui se utilizará o próprio R como cliente
do PostgreSQL.
Utilizar o código-fonte abaixo, modificando-se os parâmetros que configuraram na

máquina. Os parâmetros são análogos aos demais SGBD listados na seção 5. Basta
identificar o respectivo pacote e driver para conectar o cliente.
library("RPostgreSQL") # pacote para a conexao com SGBD

conexao <- DBI::dbConnect(dbDriver(drvName = "PostgreSQL"),
dbname="teste", # nome do banco de dados
host="localhost", # servidor, podendo ser o IP, ex., 123.456.78.9
port=5432, # porta, pot padrao usa-se 5432 para o PostgreSQL
user = 'joana', # usuario que criou ao configurar o PostgreSQL
password = "S3nh4_123") # senha
Os principais comandos do pacote RPostgreSQL são:
• dbConnect – para realizar conexão com o SGBD, por

exemplo, conexao=dbConnect("PostgreSQL", "joana", "S3nh4_123", "teste").

• dbGetQuery – para ler uma tabela persistida no SGBD, podendo carregar como
variável no R, por exemplo, dataframe_r=dbGetQuery(conexao, "SELECT * from
bd_teste.tm_teste").
• dbWriteTable, para persistir uma tabela do R no SGBD, por

exemplo, dbWriteTable(conexao, "bd_teste.tm_teste2", dataframe_r).
Os três comandos do R acima são suficientes para a manipulação de dados geridos

em linguagem SQL. Cada SGBD apresenta um pacote específico.
4.3 Extração de dados do Sistema de Informação Ambulatorial ao SGBD
Aqui vai se realizar o exercício de carregar dados do Componente Especializado da

Assistência Farmacêutica, cujo gestor do sistema e responsável pela disseminação
é a Secretaria de Assistência Especializada à Saúde (SAES).
Utilizar-se-á o pacote do R microdatasus para carregar os dados. Consultar o

respectivo capítulo do livro acerca do pacote para mais informações e o link
https://github.com/rfsaldanha/microdatasus. O comando fetch_datasus baixa e
aloca os valores originais em uma variável. O comando process_sia substitui os
códigos pelos respectivos domínios de dados; por exemplo, os dígitos 1 e 3 da
variável PA_SEXO se tornam masculino e feminino respectivamente.
# cria um novo schema, caso não exista

dbGetQuery(conexao, "CREATE SCHEMA IF NOT EXISTS bd_medicamento")
O código abaixo importa os dados do estado de Alagoas referente ao mês de

competência janeiro de 2022. Adicionalmente, o comando substr filtra os
procedimentos realizados que iniciam com 06, isto é, os quais pertencem ao grupo
de medicamentos segundo o Sistema de Gerenciamento da Tabela de
Procedimentos (SIGTAP), Medicamentos e OPM do SUS pela SAES/MS. O
comando tolower muda caracteres em maiúsculo para minúsculo. O
comando colnames obtém o nome dos atributos do data.frame.
Baixar a última versão do manual em ftp://ftp.datasus.gov.br/dissemin/publicos/

SIASUS/200801_/Doc/Informe_Tecnico_SIASUS_2019_07.pdf. O link não funciona

465
em navegadores convencionais, como Firefox ou Google Chrome. Para baixar,
basta colar o link no navegador de arquivos.
# Extração e transformação do SIA PA

library (microdatasus)
dados <-
fetch_datasus(
year_start = 2022,
month_start = 01,
year_end = 2022,
month_end = 06,
uf = "AL",
information_system = "SIA-PA"
)
dados <- subset(dados, substr(PA_PROC_ID,1,2)=="06")
atributos=c('PA_GESTAO','PA_CMP','PA_AUTORIZ', 'PA_PROC_ID', 'PA_CIDPRI'
'PA_IDADE', 'PA_SEXO',
'PA_MUNPCN', 'PA_QTDAPR')
dados <- process_sia(dados)[,atributos]
colnames(dados) <- tolower(colnames(dados))
A Tabela 6 apresenta uma amostra dos registros obtidos do SIA PA. Os subsistemas
do SIA estão listados na Tabela 3.

Tabela 6 - Registros de dez de dispensações de medicamentos do
estado de Alagoas de jan/2022 com atributos selecionados
pa_ges pa_cmp pa_autoriz pa_proc_id pa_ci pa_ pa_sexo pa_mu pa_qt ap_cnspcn
tao dpri idade npcn dapr
270000 202203 2722200191304 0604650027 H401 74 Feminino 270430 1 <82>{}{{<82><83>|}{
270000 202203 2722200159085 0604660022 H401 46 Masculino 270130 1 <82>{<83>{{<83><84><82

><80><82><81>}~
270000 202201 2722200114359 0604740018 H401 90 Masculino 270430 0 <82>{<83>{|}<82>|<8

1><84><81><83>
270000 202202 2722200081084 0604660022 H401 86 Feminino 270310 1 <82>{<80>{{<81><81

><82><84><82><84>
~<80>{
270000 202201 2721201399433 0604660022 H401 77 Masculino 270780 0 <82>{~}{<83><81>}|<

83>}<80>}<84>}
270000 202203 2722200227065 0604650027 H401 57 Masculino 270430 1 <82>{{{{<81><81><8

2><82><84><80>{{{
270000 202202 2722200171581 0604660022 H401 38 Feminino 270550 1 <82>{<80>{{<83><82><

81>{<84>
270000 202203 2722200345876 0604660022 H401 63 Feminino 270430 1 <83><84><83>{{{{~<

83><81><82><84><8
4>
270000 202202 2721201423677 0604130058 G301 75 Masculino 270030 30 }{<81><84>{|<82><84

>}|~{{{{
270000 202201 2721201428220 0604780010 E109 28 Feminino 270430 0 }{{<83>~<82><82><8

4>}|<83>{{{<80>
O comando dbWriteTable persiste (grava) o data.frame contendo a tabela extraída a

partir da ferramenta microdatasus.
# Carga do SIA PA no SGBD

dbWriteTable(
conexao,
c("bd_medicamento","tm_sia_pa"),
dados,
overwrite= TRUE,
row.names = FALSE
)
rm(dados)

467
Verificar na Tabela 7 a descrição (metadados) dos atributos elencados da tabela SIA
AM.
Tabela 7 - Descrição dos atributos selecionados do SIA PA
Atributo Id Tipo e Tam Descrição

pa_gestao 2 CHAR (6) Código da Unidade da Federação7(IBGE) + Código do Município
(IBGE) do Gestor, ou UF0000 se o estabelecimento estiver sob Gestão
Estadual
pa_cmp 1 CHAR (6) Data da Realização do Procedimento / Competência (AAAAMM)
5
pa_proc_id 1 CHAR (10) Código do Procedimento Ambulatorial
6
pa_autoriz 2 CHAR (13) Número da APAC ou número de autorização do BPA-I, conforme o
1 caso. No BPA-I, não é obrigatório, portanto, não é criticado. Lei de
formação: UFAATsssssssd, onde: UF – Unid. da Federação, AA – ano,
T – tipo, sssssss – sequencial, d – dígito
pa_cidpri 3 CHAR (4) CID9 Principal (APAC ou BPA-I)
0
pa_idade 3 CHAR (3) Idade do paciente em anos
4
pa_sexo 3 CHAR (1) Sexo do paciente
8
pa_munpcn 4 CHAR (6) Código da Unidade da Federação + Código do Município de residência
0 do paciente ou do estabelecimento, caso não se tenha a identificação
do paciente, o que ocorre no (BPA)
pa_qtdapr 4 NUMERIC (11) Quantidade Aprovada do procedimento
2

A fim de se obter o identificador criptografado do usuário do SUS, o mesmo processo
deve ser aplicado ao subsistema SIA AM.
# Extração e transformação do SIA AM

dados <-
fetch_datasus(
year_start = 2022,
month_start = 01,
year_end = 2022,
month_end = 06,
uf = "AL",
information_system = "SIA-AM"
)
atributos=c('AP_GESTAO', 'AP_AUTORIZ', 'AP_CNSPCN',
'AM_PESO', 'AM_ALTURA', 'AM_TRANSPL')
dados <- dados[,atributos]
A Tabela 8 apresenta uma amostra dos registros obtidos do SIA AM.

469
Tabela 8 - Registros de dez de dispensações de medicamentos do estado de Alagoas
ap_gestao ap_autoriz ap_cnspcn am_peso am_ am_transpl
altura
270000 2722200103733 <82>{<80>{{<84>}<82>}}{<80>| 062 161 N
270000 2722200094086 <82>{{{{<83><82>|<83>{<80><83><81>{<84 056 180 N

>
270000 2722200135204 <82>{<83>{{<82><83><82><82><81><84>< 064 159 N

81><80>}~
270000 2721201403954 <82>{<80>{{<84>|}}<80><80>| 063 167 N
270000 2722200195891 <83><84><83>{{{|{<80><83><84><80><83> 075 167 N

{<83>
270000 2721201440782 <82>{<82>{<81><82>{<82><82><80>{~<80 060 160 N

>
270000 2722200028724 <82>{{<81>{|<84><82><83><81><84><81>< 075 173 N

81><81>}
270000 2722200042529 <83><84><83>{{|}{~<83><83><84><84> 065 145 N
270000 2721201387663 <82>{<80>{{<82><82><80><82>}<82>~<80 075 165 N

><82>
270000 2722200273860 }{<81>~<80>{|}{<80>|{{{<80> 060 160 N
Verificar na Tabela 9 a descrição (metadados) dos atributos elencados da tabela SIA

AM.
Tabela 9 - Descrição dos atributos selecionados do SIA AM
Id Tipo e Tam Descrição

ap_gestao 3 CHAR (6) Código da Unidade de Federação + Código do Município de Gestão, ou UF0000
se o estabelecimento está sob Gestão Estadual
ap_autoriz 5 CHAR (13) Número da APAC. Lei de formação: UFAATsssssssd, onde UF – Unid. da
Federação, AA – ano, T – tipo, sssssss – sequencial, d – dígito
ap_cnspcn 15 CHAR (15) Número do CNS (Cartão Nacional de Saúde) do paciente
am_peso 46 CHAR (3) Peso do paciente em kg
am_altura 47 CHAR (3) Altura do paciente em cm
am_transpl 48 CHAR (1) Indicador se o paciente fez transplante

Da mesma forma que ocorrido com o SIA PA, o comando dbWriteTable foi utilizado
para armazenar no banco de dados o data.frame do SIA AM obtido do repositório do
SUS a partir da ferramenta microdatasus.
# Carga do SIA AM no SGBD

dbWriteTable(
conexao,
c("bd_medicamento","tm_sia_am"),
dados,
overwrite=TRUE,
row.names = FALSE
)
rm(dados)
Agora tem-se duas tabelas no banco de dados no schema bd_ medicamento, bd_
_medicamento.tm_sia_am e bd_medicamento.tm_sia_pa.
A partir das duas tabelas se familiarizará com a sintaxe das operações em

linguagem SQL.
4.4 Consulta em SQL
A Linguagem de Consulta de Dados DQL, do inglês Data Query Language é

constituída por apenas um comando, o SELECT, associado às cláusulas dispostas
na seção 4.4.2.
A sintaxe básica envolve as palavras reservadas;

• SELECT sucedida dos atributos selecionados, utilizando-se asterisco * para
todos os atributos;
• FROM sucedido das tabelas cujos atributos pertencem; e
• WHERE, opcional, para estabelecer as condições.

471
4.4.1 Seleção de registros
SELECT atributos separados por vírgula

FROM tabelas separadas por vírgula
WHERE (opcional) condições encapsuladas por parênteses e
pelos operadoes AND e OR
GROUP BY (opcional) caso o usuário queria fazer agregações

ORDER BY (opcional) para ordernar respectivamente segundo os
atributos separados por vírgula
Por exemplo, a Tabela 8 foi obtida com o comando SELECT * FROM bd_
medicamento.tm_sia_am.
Quando não é apresentada a cláusula WHERE são selecionados todos os

registros.
Na Tabela 10, contudo, selecionou-se apenas o registro do sexo feminino dos

atributos referentes ao diagnóstico, idade, sexo, medicamento e quantidade,
respectivamente.
select pa_cidpri, pa_idade, pa_sexo,

pa_proc_id, pa_qtdapr
from bd_medicamento.tm_sia_pa
where pa_sexo = 'Feminino'
Tabela 10 - Registros de dez de dispensações de medicamentos

de usuárias do sexo feminino do estado de Alagoas
pa cidpri pa idade pa sexo pa proc id pa qtdapr

H401 57 Feminino 0604650019 0
H401 59 Feminino 0604650035 1
E109 8 Feminino 0604780010 1
H401 62 Feminino 0604740018 1
N180 42 Feminino 0604620039 60
K861 74 Feminino 0604580029 180
H401 64 Feminino 0604650035 1
H401 30 Feminino 0604740018 0
M321 45 Feminino 0604530013 90
H401 50 Feminino 0604660022 1

4.4.2 Cláusulas
As cláusulas são condições para restringir os registros que se deseja

selecionar ou dados que se deseja atualizar. As principais são listadas a
seguir.
• FROM especifica a tabela cujos registros serão selecionados;
• WHERE condição de seleção dos registros intercalada pelos
operadores lógicos apontados na seção 4.4.3;
• GROUP BY agrupa os registros segundo os atributos especificados;
• HAVING condição de seleção dos grupos, por exemplo HAVING
COUNT(*)>3;
• ORDER BY define o ordenamento dos registros com ASC para
ascendente e DESC para decrescente;
• DISTINCT seleciona tuplas (conjuntos de registros) sem repetição;
• UNION para se unir o resultado de duas consultas cujos registros
apresentam os mesmos atributos respectivamente.
Na Tabela 11 são mostrados o número de registros agrupados por sexo.
select pa_sexo, count(*)

group by pa_sexo
Tabela 11 - Contagem do número de registros da tabela de dispensação de

medicamentos segundo o sexo
pa sexo count
Feminino 96252
Masculino 68532
4.4.3 Operadores lógicos
• AND para o E lógico, conjunção ∧, ou seja, verdadeiro quando ambas as

condições devem ser satisfeitas;
• OR para o OU lógico, disjunção ∨, ou seja, verdadeiro quando ao menos
uma das condições é satisfeita;
• NOT para negação lógica ¬, ou seja, inverte o valor da expressão.

473
4.4.4 Operadores relacionais
A comparação de valores segue a notação a seguir:

• símbolos matemáticos igual =, diferente <>, menor <, maior >, menor ou
igual <= e maior ou igual >=;
• BETWEEN para valores em um dado intervalo;
• LIKE para consulta aproximada de texto, por exemplo, iniciando com silv%,
terminando com %estre ou contendo %silvestre% ao procurar no
campo nome_do_usuario;
• IN para busca em dada lista, por exemplo co_municipio_ibge in (334501,
521250).
Na Tabela 12 são mostrados o número de registros agrupados por sexo, cuja

idade encontra-se entre 0 e 17 anos.
select pa_sexo, count(*)

where pa_idade::int between 0 and 17
group by pa_sexo
Tabela 12 - Contagem do número de registros da tabela de dispensação de

medicamentos segundo o sexo
pa sexo count
Feminino 3552
Masculino 3457
Note-se que foi necessário informar que pa_idade trata-se de um número

inteiro. O R faz distinção de tipos dinamicamente, porém, os SGBD
mandatoriamente operam com definições de dados estáticas. Logo, os tipos
corretos de dados devem ser corrigidos para se obterem os resultados
esperados. Veja a seção 4.6 para compreender como os atributos são
definidos.

4.4.5 Operadores e funções matemáticas
• operadores: + adição, - subtração,* multiplicação ×,/divisão ÷,

exponenciação xˆn;
• ABS para o valor absoluto, isto é, remove o sinal negativo;
• ROUND(x, n) para arredondar o número xx com nn casas decimais;
• CEIL para arredondar para o próximo número inteiro;
• FLOOR para arredondar para o número inteiro anterior;
• SQRT para raiz quadrada;
• LOG para logaritmo na base 10.
4.4.6 Funções matemáticas e estatísticas
Existem funções que podem ser utilizadas para se avaliar a tabela inteira ou
associadas à cláusula GROUP BY, por exemplo:
• COUNT para frequência;

• SUM para somatório ∑;
• MIN para obter o valor mínimo;
• MAX para obter o valor máximo;
• AVG para média;
• STDDEV para o desvio padrão;
• VARIANCE para a variância.
Na Tabela 13 são mostrados - o número de registros COUNT -- a

média AVG arredondada ROUND, - o desvio padrão STDDEV arredondado
para o próximo número inteiro, agrupados por sexo cuja idade encontra-se
entre 0 e 17 anos.
select pa_sexo,
COUNT(*)*2+10 as frequencia,
ROUND(AVG(pa_idade::int)) as média,
CEIL(STDDEV(pa_idade::int)) as desvio
where pa_idade::int between 0 and 17
group by pa_sexo

475
Tabela 13 - Contagem, média e desvio padrão do número de registros da tabela de
dispensação de medicamentos segundo o sexo
pa sexo frequência média desvio
Feminino 7114 11 4
Masculino 6924 12 4
Observe-se o uso de funções compostas encapsuladas por parênteses nas

operações ROUND (AVG(pa_idade::int),1) e CEIL(STDDEV(pa_idade::int)).
Adicionalmente foram usados apelidos (alias) provisórios para cada atributo.

Os apelidos precedidos de AS não modificam o nome dos atributos nas
tabelas originais, sendo apenas artifício para facilitar a leitura dos dados,
apresentados em tempo de execução, da consulta SQL.
4.4.7 Junções
O cruzamento entre duas tabelas é realizado com comandos de junção, o

qual carrega provisoriamente na memória uma tabela derivada das tabelas
de origem.
Fundamentalmente, o cruzamento pode ser feito utilizando-se os campos das

respectivas tabelas na cláusula WHERE, separadas por vírgula, ou
utilizando-se as variantes JOIN.
Um exemplo de join é apresentado a seguir:
SELECT * FROM tb_usuario JOIN tb_municipio ON co_municipio_ibge = co_ibge;
Aqui, a tabela tb_município contém um campo co_ibge contendo os seis

dígitos do código de município da tabela mantida pelo Instituto Brasileiro de
Geografia e Estatística (IBGE).

• INNER JOIN, ou simplesmente JOIN, A⋂B, retorna os registros das tabelas
cuja condição de junção é atendida;
• LEFT OUTER JOIN, ou simplesmente LEFT JOIN, A−B=A⋂B, retorna

registros da tabela à esquerda cuja condição da junção é atendida;
• RIGHT OUTER JOIN, ou simplesmente RIGHT JOIN, B−A=B⋂A, retorna

todos os registros da tabela à direita cuja condição de junção é atendida;
• FULL OUTER JOIN, ou simplesmente FULL JOIN, B⋃A, retorna registros

das tabelas relacionadas apresentando valor nulo quando a condição de
junção não foi atendida.
Na Tabela 14 são mostrados atributos selecionados de ambas as tabelas SIA

AM e SIA PA.
Observe-se que foram colocados apelidos em ambas as tabelas. Note-se

também que para as palavras reservadas (select, from etc.) foram utilizadas
letras minúsculas, ou seja, para essas não é necessário ater-se à caixa (alta
ou baixa) da letra.
select pa_gestao,
pa_cmp,
pa_autoriz,
pa_proc_id,
pa_cidpri,
pa_idade,
pa_sexo,
ap_cnspcn
from bd_medicamento.tm_sia_pa as PA
join bd_medicamento.tm_sia_am as AM
on PA.pa_autoriz = AM.ap_autoriz
and PA.pa_gestao = AM.ap_gestao
order by ap_cnspcn, pa_cmp, pa_proc_id
limit 20

477
Tabela 14 - Contagem, média e desvio padrão do número de registros da
tabela de dispensação de medicamentos segundo o sexo
pa gestao pa cmp pa autoriz pa proc id pa pa pa sexo ap cnspcn

cidpri idade
270000 202201 2721201298915 0604260016 N180 55 Masculino |}}{|}{{{
270000 202201 2721201298915 0604770014 N180 55 Masculino |}}{|}{{{
270000 202201 2721201298915 0604770030 N180 55 Masculino |}}{|}{{{
270000 202202 2722200139791 0604260016 N180 55 Masculino |}}{|}{{{
270000 202202 2722200139791 0604260016 N180 55 Masculino |}}{|}{{{
270000 202202 2722200139791 0604770014 N180 55 Masculino |}}{|}{{{
270000 202202 2722200139791 0604770014 N180 55 Masculino |}}{|}{{{
270000 202202 2722200139791 0604770030 N180 55 Masculino |}}{|}{{{
270000 202202 2722200139791 0604770030 N180 55 Masculino |}}{|}{{{
270000 202203 2722200139791 0604260016 N180 55 Masculino |}}{|}{{{
270000 202203 2722200139791 0604260016 N180 55 Masculino |}}{|}{{{
270000 202203 2722200139791 0604770014 N180 55 Masculino |}}{|}{{{
270000 202203 2722200139791 0604770014 N180 55 Masculino |}}{|}{{{
270000 202203 2722200139791 0604770030 N180 55 Masculino |}}{|}{{{
270000 202203 2722200139791 0604770030 N180 55 Masculino |}}{|}{{{
270000 202201 2722200064485 0604040040 J450 35 Feminino }{|}{|{|}{{{
270000 202201 2722200064485 0604040040 J450 35 Feminino }{|}{|{|}{{{
270000 202201 2722200064485 0604040040 J450 35 Feminino }{|}{|{|}{{{
270000 202202 2722200064485 0604040040 J450 35 Feminino }{|}{|{|}{{{
270000 202202 2722200064485 0604040040 J450 35 Feminino }{|}{|{|}{{{
4.5 Manipulação de registros em SQL
A Linguagem de Manipulação de Dados DML (do inglês Data Manipulation Language)

constitui as operações de atualização, inserção de novo registro e remoção de registro,
respectivamente com UPDATE, INSERT e DELETE.

4.5.1 Atualização de registros
O comando UPDATE apresenta a seguinte estrutura mínima:
UPDATE tabela a ser atualizada

SET atributo = novo valor
FROM (opcional) tabela com os dados de origem
WHERE (opcional) condição;
No exemplo a seguir, a data de nascimento é atualizada para o usuário com

identificador 1.
UPDATE bd_teste.tm_teste
SET dt_nascimento = '1928-12-22'
WHERE id_usuariosus = 1;
Aqui é atualizado o sexo para uma sigla em vez do nome.
update bd_medicamento.tm_sia_pa
set pa_sexo = 'F'
where pa_sexo = 'Feminino';
Para se atualizar ambos os sexos em apenas uma consulta, utiliza-se o CASE

... WHEN ... THEN. Uma vez que todos os valores possíveis foram
contemplados, não é mais necessária a cláusula WHERE. Em outras
situações, se necessário, podem ser utilizados mais de dois WHEN.
update bd_medicamento.tm_sia_pa
set pa_sexo =
case
when pa_sexo = 'Feminino' then 'F'
when pa_sexo = 'Masculino' then 'M'
else 'NA'
end;
Quando a atualização envolve duas ou mais tabelas utiliza-se a

cláusula FROM, o que será exemplificado na seção 4.6.

479
UPDATE tabela_a_ser_atualizada
SET campo_atualizado1=valor_campo_origem1,
campo_atualizado2=valor_campo_origem2
FROM tabela_com_valor_de_origem
WHERE condição_1
AND/OR condição_2
As sintaxes variam conforme o SGBD. A sintaxe com FROM ocorre

no Oracle e no PostgreSQL. No MySQL as tabelas são elencadas sempre
após UPDATE, separadas por vírgula e não há a cláusula FROM. Portanto, é
importante compreender o conceito geral de cada operação e consultar
manuais e fóruns para a respectiva sintaxe da ferramenta adotada.
4.6 Definição de dados em SQL
A Linguagem de Definição de Dados (DDL), do inglês Data Definition Language,

apresenta os seguintes comandos:
• CREATE para criação de tabelas;
• DROP para eliminação de tabelas;
• ALTER para modificação ou inserção de atributos ou índices em tabelas;
• TRUNCATE para eliminar todos os registros da tabela.
4.6.1 Criar tabela
Uma vantagem da gestão de dados com SGBD é a definição do tipo de dados

que impede, por exemplo, que um texto seja armazenado em um campo
numérico ou um número em um campo de data.
A consulta a seguir é um exemplo de criação da estrutura de tabela vazia para

receber novos registros.
create table bd_medicamento.tf_dispensacao (

co_gestao integer,
nu_competencia integer,
nu_autorizacao bigint,
co_procedimento_sigtap bigint,
co_diagnostico_cid10 varchar(4),

qt_aprovada smallint ,
co_usuario_cns_criptografado varchar(100) default null
) ;
4.6.2 Alterar tabela
Com o comando ALTER TABLE um dado atributo pode ser adicionado

com ADD ou removido com DROP.
No caso abaixo é criada uma chave sequencial do tipo SERIAL a fim de

colocar um identificador primário do tipo PRIMARY KEY para cada
dispensação de medicamento.
-- SQL para acrescentar atributos

ALTER TABLE bd_medicamento.tf_dispensacao
ADD COLUMN co_seq_dispensacao SERIAL PRIMARY KEY;
-- SQL para remover atributos
ALTER TABLE bd_medicamento.tf_dispensacao DROP COLUMN co_seq_dispensacao;
No exemplo abaixo, a chave foi adicionada ao se criar a tabela.
create table bd_medicamento.tf_usuario (

co_seq_usuario_sus SERIAL PRIMARY key,
co_usuario_cns_criptografado varchar(100) default null,
st_sexo varchar(9),
nu_idade smallint,
co_municipio_residencia_ibge integer
) ;
Quando houver o cruzamento de tabelas com frequência ou quando são

envolvidos milhões de registros, recomenda-se indexar os atributos utilizados
como chave de consulta.
Abaixo foram criados quatro índices simples (com apenas um atributo),

porém, poderiam ser criados índices compostos (com mais de um atributo).
Pesquisar na internet sobre otimização de bancos de dados para se obterem
mais informações.

481
Os índices são importantes para se evitar a leitura completa do banco de
dados na busca por dado registro. O SGBD busca os registros de forma
semelhante ao que ocorre quando o leitor navega pelo livro utilizando o índice
ou folheia um dicionário em ordem alfabética, uma vez que é mais rápido ler
o índice e ir diretamente à página do que ler o livro inteiro em busca do
conteúdo desejado.
CREATE INDEX tf_dispensacao_nu_autorizacao_idx

ON bd_medicamento.tf_dispensacao (nu_autorizacao);
CREATE INDEX tf_dispensacao_co_gestao_idx
ON bd_medicamento.tf_dispensacao (co_gestao);
CREATE INDEX tm_sia_am_ap_autoriz_idx
ON bd_medicamento.tm_sia_am (ap_autoriz);
CREATE INDEX tm_sia_am_ap_gestao_idx
ON bd_medicamento.tm_sia_am (ap_gestao);
4.6.3 Estrutura básica para inserção de registros
Existem várias formas para fazer carga de dados no SGBD. A forma mais
comum é fazer a carga de um arquivo tabulado, usualmente com separador
de vírgula ou ponto e vírgula; em formato CSV.
A carga de grande quantidade de registros será vista mais adiante, contudo,

o mecanismo mais seguro é se utilizar o comando INSERT. A sintaxe básica
é
INSERT INTO bd_1.tabela_1 (campo1, campo2)

VALUES (valor_campo1, valor_campo2)
Exemplo:
INSERT INTO bd_teste.tm_teste

(id_usuariosus, no_usuariosus, sg_sexo,
dt_nascimento, co_municipio_ibge)
VALUES (3, 'Jussara Lemos', 'F','1999-02-28', 354850);

Note-se que, ao contrário da Figura 7, os campos foram elencados. Isso
significa que é possível suprimir os nomes dos campos na sintaxe, desde que
a ordem de inserção corresponda à ordem dos campos na tabela.
A variante a seguir, com campos suprimidos e ordenados de forma diferente,

funcionaria da mesma forma, desde que a posição dos nomes dos campos
correspondesse à posição dos valores.
INSERT INTO bd_teste.tm_teste

(sg_sexo, dt_nascimento,
co_municipio_ibge, no_usuariosus)
VALUES ('M','1971-05-19', 354850, 'Marcelo Moura');
Observe-se que nas tabelas SIA PA e SIA AM os atributos de usuário (como

sexo, peso, idade) estão misturados aos atributos de dispensação (gestor,
medicamento, quantidade).
Isso ocorre por se tratar de uma tabela analítica, isto é, desenvolvida para fins
estatísticos e estudos com dados secundários.
O processo de modelagem de dados também é chamado de normalização.

Logo, diz-se que os dados abertos disseminados são desnormalizados, por
sintetizar em única tabela todos os atributos.
Fazer um exercício de normalização para treinar o uso da linguagem SQL e

iniciar inserindo os registros na tabela de dispensação criada anteriormente.
insert into bd_medicamento.tf_dispensacao (

co_gestao,
nu_competencia,
nu_autorizacao,
co_procedimento_sigtap,
co_diagnostico_cid10,
qt_aprovada
)
select DISTINCT
pa_gestao::INTEGER,
pa_cmp::INTEGER,
pa_autoriz::BIGINT,
pa_proc_id::BIGINT,
pa_cidpri,
pa_qtdapr::SMALLINT

483
order by pa_gestao, pa_autoriz, pa_cmp;
Observe que se utilizou DISTINCT para assegurar que não há duplicidade de

registros. Utilizou-se ORDER BY para otimizar o índice das chaves relativas
à gestão (código do estado ou do município gestor) e da autorização (código
da guia APAC), os quais serão usados para se obter o código do usuário. Na
mesma consulta utilizou-se um terceiro recurso. A conversão de
tipos ::INTERGER, ::BIGINT e ::SMALLINT foi adotada no ato do INSERT,
uma vez que o R entendeu que os atributos seriam do tipo texto, quando, na
verdade, são numéricos.
Como se mostrou na Tabela 15, foram acrescentados automaticamente o

identificador de cada dispensação no campo co_seq_dispensacao e que se
encontra nulo o co usuario _ cns _criptografado.
Tabela 15 - Dez primeiros registros da tabela de dispensação de medicamentos
co nu nu co co qt co seq co seq
gestao competen autorizacao procedimen diagnostico aprova dispensa usuario sus
cia to sigtap cid10 da cao
270000 202201 27212005521 604600020 Q802 30 1 38774
36
270000 202201 27212008676 604650019 H401 1 2 7760
49
270000 202201 27212008676 604740018 H401 0 3 7760
49
270000 202201 27212008676 604660022 H401 1 4 7760
49
270000 202201 27212008708 604310056 G700 0 5 33886
72
270000 202201 27212008714 604650027 H401 0 6 13927
33
270000 202201 27212008729 604590024 L700 0 7 69
84
270000 202201 27212008737 604740018 H401 0 8 6517
87
270000 202201 27212008909 604090013 N041 0 9 17769
70
270000 202201 27212008909 604340036 N041 0 10 17769

70

Para completar o identificador do usuário vai se utilizar o UPDATE com as
tabelas de dispensação e a tm_sia_am original.
update bd_medicamento.tf_dispensacao
set co_usuario_cns_criptografado = ap_cnspcn
from bd_medicamento.tm_sia_am
where co_gestao = ap_gestao::integer
and nu_autorizacao = ap_autoriz::bigint;
Agora vai se gerar uma tabela unívoca de usuários para garantir integridade
referencial, isto é, que cada usuário ocupe apenas um registro, afinal, o
mesmo usuário não pode se repetir nessa tabela.
alter table bd_medicamento.tf_usuario

add vl_peso smallint default null,
add vl_altura smallint default null;
insert into bd_medicamento.tf_usuario (

co_seq_usuario_sus,
co_usuario_cns_criptografado,
vl_peso,
vl_altura
)
select DENSE_RANK () OVER (
ORDER BY ap_cnspcn
) co_seq_usuario_sus,
ap_cnspcn,
round(avg(am_peso::SMALLINT)),
round(avg(am_altura::SMALLINT))
from bd_medicamento.tm_sia_am
group by ap_cnspcn;
As duas consultas SQL acima acrescentam novas colunas e inserem

registros distintos de usuários respectivamente.
Como valor atômico de peso e altura foram utilizadas as respectivas médias.

No PostgreSQL e no Oracle existem funções nativas para obter a mediana;
por exemplo PERCENTILE_CONT(0.5) WITHIN GROUP(ORDER BY
am_peso). Em uma modelagem mais robusta, os parâmetros clínicos
deveriam ser colocados em tabela separada (por

485
exemplo, tf_parametro_clinico), uma vez que podem variar em cada mês de
competência. A título de exemplo optamos por colocar na tf_usuario.
Note-se que foi empregada a operação DENSE_RANK. Esse recurso é

utilizado para fazer um ranking segundo a ordem de atributos indicados
no ORDER BY. No caso, o RANK foi utilizado para atribuir um número
sequencial para utilizar no lugar do ap_cnspcn o identificador criptografado.
Falta completar os atributos de sexo, idade e município de residência. Vai se

utilizar o recurso de subconsulta para ilustrar como estabelecer qual é o valor
atributo que será contemplado.
alter table bd_medicamento.tm_sia_pa
add ap_cnspcn varchar(100);
update bd_medicamento.tm_sia_pa PA
set ap_cnspcn = AM.ap_cnspcn
from bd_medicamento.tm_sia_am AM
where pa_gestao = ap_gestao
and pa_autoriz = ap_autoriz;
update bd_medicamento.tf_usuario U
set st_sexo = pa_sexo,
nu_idade = pa_idade::smallint ,
co_municipio_residencia_ibge = pa_munpcn::INTEGER
from
select distinct *
from
select ap_cnspcn,
pa_idade,
pa_sexo,
pa_munpcn,
dense_rank () over (
partition by ap_cnspcn
order by pa_cmp
) co_seq_atendimento

) PA1
where co_seq_atendimento = 1
) PA2
Where
PA2.ap_cnspcn = U.co_usuario_cns_criptografado
Na primeira etapa acrescentou-se o atributo ap_cnspcn na tabela original de

dispensação. Na segunda etapa a entrada foi obtida a partir da tm_sia_am.
Na terceira etapa foram utilizadas duas subconsultas, enclausuradas pelos
parênteses PA1 e PA2, respectivamente. O PA1 obtém os valores do
identificador do usuário, idade, sexo e município e aponta
com dense_rank um código sequencial para cada atendimento por usuário,
assegurando-se com o partition by ap_cnspcn. O PA2 acrescenta apenas a
linha where co_seq_atendimento = 1 de modo a utilizar a idade, sexo e
município no primeiro atendimento. Uma vez que não é fornecida a tabela de
usuário do SUS com o valor correto de data de nascimento e sexo e o
município de residência pode mudar ao longo do tempo, um critério deve ser
proposto para atribuir tais valores. Evidentemente, trata-se de uma limitação
de estudos com dados abertos administrativos.
Observe-se na Tabela 16 que foram acrescentados automaticamente o

identificador de cada dispensação no campo co_seq_dispensacao.

487
Tabela 16 - Dez primeiros registros da tabela de usuários de medicamentos
co seq co usuario cns st sexo nu co municipio vl peso vl altura
usuario criptografado idade residencia ibge
sus
1 |}}{|}{{{ Masculino 55 270800 39 163
2 }{|}{|{|}{{{ Feminino 35 270430 70 160
3 }{{<80>|{{{ Feminino 78 270430 580 150
4 }{{<80>~~~{}|{{{} Feminino 36 270430 70 160
5 }{{<80>~~|}{{{| Masculino 42 270430 680 170
6 }{}{{{{~|{{{<80> Masculino 40 270030 70 165
7 }{}{}~}{{{<80> Feminino 52 270030 63 162
8 }|{|}<80>{{{{{} Feminino 59 270800 60 160
9 }{{<80>|<80>}|~{{{{} Masculino 64 270030 63 168
10 }{{<80>}|~}}{{{<80> Masculino 77 270030 69 161
4.6.4 Estrutura básica para restrição de domínio
Agora que se possui as tabelas de dispensação e de usuários pode-se

formalizar o vínculo entre essas com uma chave estrangeira. No caso, vai se
utilizar o atributo co_seq_usuario_sus como referência unívoca
da tf_usuario na tf_dispensacao. Não haveria problema algum utilizar
o co_usuario_cns_criptografado, porém, é mais prático utilizar um código
sequencial numérico do que uma chave de caracteres embaralhados.
alter table bd_medicamento.tf_dispensacao

add co_seq_usuario_sus integer default null;
update bd_medicamento.tf_dispensacao D
set co_seq_usuario_sus = U.co_seq_usuario_sus
from bd_medicamento.tf_usuario U
where D.co_usuario_cns_criptografado = U.co_usuario_cns_criptografado ;
drop co_usuario_cns_criptografado;

Nas três operações acima há a inserção de novo atributo, atualização e
exclusão do atributo anterior.
Na Tabela 17 é mostrada a chave co_seq_usuario_sus e no lugar

de D.co_usuario_criptografado.
Tabela 17 - Quinze primeiros registros da tabela modelada

de dispensação de medicamentos
cogestão nu nu autorização co co diagnóstico qt co seq co seq

competên procediment cid10 aprova dispensaç usuario sus
cia o sigtap da ão
270000 202201 2721201298915 604770014 N180 30 7860 1
270000 202201 2721201298915 604260016 N180 0 7859 1
270000 202201 2721201298915 604770030 N180 24 7858 1
270000 202202 2722200139791 604260016 N180 0 109560 1
270000 202203 2722200139791 604770030 N180 24 109564 1
270000 202203 2722200139791 604770014 N180 30 109563 1
270000 202202 2722200139791 604770030 N180 24 109561 1
270000 202203 2722200139791 604260016 N180 0 109562 1
270000 202202 2722200139791 604770014 N180 30 109559 1
270000 202202 2722200064485 604040040 J450 60 76135 2
270000 202201 2722200064485 604040040 J450 60 76134 2
270000 202203 2722200064485 604040040 J450 0 76136 2
270000 202203 2722200158634 604380100 M058 0 116276 3
270000 202202 2722200158634 604380100 M058 4 116275 3
270000 202201 2721201293745 604380011 M070 2 7060 4
Agora, basta adicionar a restrição CONSTRAINT e informar que apenas

serão aceitas dispensações de usuários quando o co_seq_usuário_sus
estiver presente na tabela de usuários.

489
add CONSTRAINT fk_co_seq_usuario_sus
FOREIGN KEY(co_seq_usuario_sus)
REFERENCES bd_medicamento.tf_usuario(co_seq_usuario_sus)
Assim como se fez para usuários, devem ser acrescentadas restrições de

domínio para diagnósticos, medicamentos etc. Logo, devem ser
acrescentadas as tabelas de domínios referentes à CID-1O, SIGTAP e
gestores, de modo a assegurar que apenas valores válidos estejam na tabela
de dispensação.
4.6.5 Estrutura básica para eliminar registros
A remoção de registros segue a estrutura DELETE FROM nome_da_tabela

WHERE condição. Todos os registros serão removidos caso não seja
utilizado WHERE.
No exemplo a seguir são eliminadas dispensações não concretizadas, isto é,

sem quantidade aprovada ou se sem identificação do usuário.
delete from bd_medicamento.tf_dispensacao

where qt_aprovada = 0
or co_seq_usuario_sus is null;
Agora que as tabelas temporárias não são mais necessárias, pode-se excluí-
las com o comando DROP.
DROP table if EXISTS bd_medicamento.tm_sia_am,

bd_medicamento.tm_sia_pa;
Crie visões de dadospara fazer subconjuntos de suas tabelas. No exemplo

abaixo foi criada uma visão dispensações apenas para glaucoma utilizando-
se a busca parcial LIKE, no caso, para CID-10 iniciado com H40.

CREATE VIEW bd_medicamento.vw_dispensacao_glaucoma AS
SELECT *
FROM bd_medicamento.tf_dispensacao
WHERE co_diagnostico_cid10 like like 'H40%';
select * from bd_medicamento.vw_dispensacao_glaucoma;
Persistam visões materializadas de dados para fazer subconjuntos

armazenados de suas tabelas. No exemplo abaixo foi criada uma visão
dispensações apenas para insuficiência renal e utilizou-se a busca
parcial LIKE, no caso, para CID-10 iniciado com N18.
CREATE MATERIALIZED VIEW bd_medicamento.vw_dispensacao_renal AS

SELECT * FROM bd_medicamento.tf_dispensacao
WHERE co_diagnostico_cid10 like 'N18%';
select * from bd_medicamento.vw_dispensacao_renal;
4.7 Controle
A Linguagem de Controle de Dados (DCL), do inglês Data Control Language é utilizada

para controle de leitura e escrita em bancos e tabelas.
CREATE USER para criar usuários. GRANT para conceder privilégios. REVOKE
para revogar privilégios.

491
Exemplos:
-- cria usuário e senha

create user joana with encrypted password 'senha123';
-- cria usuário e senha com data e hora de expiração

CREATE USER tiago WITH PASSWORD 'uma_senha_123'
valid until '2021-12-03 15:23:00.533249+00';
-- concede privilégios sobre um banco de dados
grant all privileges on database teste to joana;
GRANT USAGE ON SCHEMA bd_geral TO teste;
GRANT USAGE ON SCHEMA bd_teste TO tiago;
-- concede privilégios sobre todas as tabelas de banco de dados

GRANT select ON ALL TABLES IN SCHEMA bd_geograficos TO tiaho;
GRANT ALL PRIVILEGES ON ALL TABLES IN SCHEMA bd_documento TO mariana;
-- concede privilégios sobre uma tabela

GRANT ALL ON TABLE bd_teste.tm_teste TO mariana;
-- revoga privilégios sobre uma tabela

REVOKE TRUNCATE ON TABLE bd_teste.tm_teste FROM mariana;
5 Administração e utilização de bancos de dados
A linguagem SQL é comum em diversos Sistemas Gerenciadores de Banco de Dados

(SGBD).
Existem SGBD aptos a serem instalados em máquinas comuns ou servidores. Usualmente

os SGBD podem ser instalados nos sistemas operacionais Microsoft Windows®, macOS
da Apple ou nas diversas versões de Linux existentes. Basta procurar no buscador, baixar
e instalar uma das ferramentas MySQL, PostgreSQL, Firebird, Oracle e Microsoft SQL
Server. Todos os SGBD citados fazem parte do SUS com aplicações ligadas a essas
ferramentas.

Entretanto, nem todos os SGBD são gratuitos, portanto, recomenda-se a instalação
do MySQL ou PostgreSQL para uso pessoal ou na sua instituição, uma vez que ambos são
utilizados em grandes corporações e são capazes de lidar com milhões ou até bilhões de
registros, a depender dos recursos de armazenamento, memória e processador
disponíveis.
Existe plataforma de bancos de dados em nuvem, a qual basta ser contratada junto ao
fornecedor, por exemplo, a SQL Azure da Microsoft® e a google Cloud SQL.
Aprender SQL significa falar o mesmo idioma praticado em dezenas de lugares, porém,
com diversas variações. Assim como é possível aprender espanhol básico e falar em
diversos países, é desejável se especializar na variação praticada em Buenos Aires, Madri
ou Guadalajara, caso venha a se comunicar frequentemente com a linguagem local.
5.1 Ferramentas para interface com o usuário
Existem ferramentas chamadas cliente dos SGBD, as quais facilitam a interação com
o usuário. Assim como ocorre com R Commander, a interação padrão do usuário
com a linguagem é por meio de um terminal com interação praticamente exclusiva
via teclado, no qual são digitados e executados os comandos, mostrando-se o
resultado em forma de texto simples (Figura 7).

493
Figura 7 - Terminal do PostgreSQL
Da mesma forma que existe o RStudio, plataformas oferecem mais recursos,

inclusive com utilização on-line e diretamente do navegador, isto é, podem ser
acessadas remotamente sem que o SGBD e a plataforma estejam instaladas na
máquina em uso. As plataformas facilitam o gerenciamento e desobrigam o uso de
linhas de comando para tudo, contendo vários recursos abertos à interação com o
mouse.
Dentre as ferramentas que rodam em navegador, destacam-se:

• phpMyAdmin, com foco em MySQL;
• pgAdmin, mostrada na Figura 8, com foco em PostgreSQL;
• phpPgAdmin, com foco em PostgreSQL.

Figura 8 - pg Admin
Exemplos de ferramentas com plataforma visual própria que são baixadas e

instaladas na máquina (stand alone):
• MySQL Workbench, exclusivo para MySQL;
• DBeaver, mostrada na Figura 9, com suporte para diversos bancos de
dados.

495
Figura 9 - DBeaver
5.2 Treinamento em banco de dados
Para os exercícios a seguir recomenda-se instalar o PostgreSQL e o DBeaver. Se

não houver o PostgreSQL instalado, pode-se praticar na plataforma
https://pgexercises.com/ (Figura 10).

Figura 10 – Ilustração da ferramenta pgexercises
para aprendizado on-line de 62ostgreSQL

497
5.3 Nomenclatura
Atenção ao se nomear atributos e tabelas para evitar problemas ao referenciá-los.

Recomenda-se padronizar os atributos usando apenas letras minúsculas, sem
espaços, separados por underline _.
• Caracteres proibidos: @, #, ~, ^, <, >, =, !, espaço;
• Caracteres recomendados: de a a z de 0 a 9 e underline;
• Caracteres não recomendados: ç, á, é, ã, â, espaço etc.;
Caso se queira utilizar caracteres especiais ou espaço, deve-se conhecer como o

SGBD faz para identificar a referência à tabela ou atributo. No PostgreSQL são
utilizadas aspas duplas ", enquanto no MySQL é utilizada a crase ```.
Consultar e adotar a Norma de Padronização de Nomenclatura do DataSUS em

seus bancos de dados e datasets.
Segue abaixo um apanhado de prefixos para bancos e tabelas:

• bd_ - banco de dados
(por exemplo bd_medicamento, bd_obito, bd_covid19);
• td_ - tabela de dimensão ou domínio

(por exemplo td_cid10, td_municipio, td_estabelecimento);
• tf_ - tabela de fatos contendo transações

(por exemplo tf_dispensação, tf_notificacao_dengue);
• tm_ - tabelas provisórias (por exemplo tm_sia_am, tm_sia_aq);
• vw_ - tabela de fatos contendo visões de dados

(por exemplo vw_dispensação_homens, tf_notificacao_dengue_amazonas).
Segue abaixo um apanhado de prefixos para atributos:
• co_ - código (por exemplo co_cid10, co_procedimento_sigtap);

• co_seq_ - código sequencial
(por exemplo co_seq_usuario, co_seq_estabelecimento).
• dt_ - data (por exemplo dt_nascimento, dt_dispensacao);
• no_ - nome
(por exemplo no_usuário_sus, no_trabalhador, no_equipamento);
• ds_ - descrição (por exemplo ds_posologia, ds_relato_clinico).
• qt_ - quantidade, usualmente, discreta

(por exemplo qt_comprimido, qt_area, qt_população);
• vl_ - valor, usualmente, passível de ser decimal

(por exemplo vl_gasto, vl_densidade_demografica);
• nu_ - número, usualmente contado ou calculado (por exemplo nu_idade);
• tx_ - taxa ou fração (por exemplo tx_letalidade, tx_mortalidade);
• st_ - situação ou status (por exemplo st_ativo, st_gravida);
• sg_ - sigla (por exemplo sg_faixa_etaria, sg_sexo).
Veja mais na Metodologia de Administração de Dados (MAD)

[https://datasus.saude.gov.br/mad-norma-de-padronizacao-de-nomenclatura /#:~
:text= Esta%20%C3%A1rea%20tem%20como%20finalidade,qualquer%20SGBD%
20utilizado%20neste%20%C3%B3rg%C3%A3o.]
A presente abordagem ilustra os principais conceitos para modelagem e gestão formal de

bancos de dados. A familiaridade com os conceitos é fundamental para se vencerem os
inúmeros problemas trazidos quando a técnica dá lugar ao improviso ou a decisões ligadas
às ciências da computação e da informação baseadas no senso comum. Os profissionais
que lidam com dados – na produção, na manutenção do ambiente de processamento ou

499
na análise e tomada de decisão – não precisam deter o mesmo nível de conhecimento que
os administradores de bancos de dados. Contudo, espera-se que o material trazido seja útil
para aprimorar a comunicação entre o sanitarista e o cientista de dados, instando o primeiro
a adentrar o universo do segundo e, quem sabe, tornar-se híbrido, ou seja, um sanitarista-
cientista de dados.

Referências
BOOCH, G.; RUMBAUGH, J.; JACOBSON, I. UML: guia do usuário. Tradução Fábio
Freitas da Silva. Rio de Janeiro: Elsevier, 2005.
BRASIL. Decreto nº 5.839, de 11 de julho de 2006. Dispõe sobre a organização, as

atribuições e o processo eleitoral do Conselho Nacional de Saúde - CNS e dá outras
providências. Diário Oficial da União, Brasília, DF, 12 jul. 2006a.
BRASIL. Ministério da Saúde. Sistema de Informação de Agravos de Notificação (SINAN).

Ficha de notificação. Brasília, DF: Ministério da Saúde, 2006b. Disponível em:
http://portalsinan.saude.gov.br/images/documentos/Agravos/NINDIV/Notificacao_Individua
l_v5.pdf. Acesso em: 10 out. 2022.
BRASIL. Portaria nº 2.871 de 19 de novembro de 2009. Constitui o Comitê Nacional de

Promoção da Saúde do Trabalhador do Sistema Único de Saúde - SUS. Brasília, DF:
BRASIL. Portaria GM/MS nº 1.768, de 30 de julho de 2021. Altera o anexo XLII da

Portaria de Consolidação GM/MS nº 2, de 28 de setembro de 2017, para dispor sobre a
Política Nacional de Informação e Informática em Saúde (PNIIS). Brasília, DF: Ministério
da Saúde, 2021.
BRASIL. Portaria SAES nº 50, de 9 de fevereiro de 2022. Institui os Modelos de

Informação Registro de Prescrição de Medicamentos e Registro de Dispensação de
Medicamentos. Diário Oficial [da] República Federativa do Brasil: seção 1, Brasília,
DF, edição 30, p. 165, 11 fev. 2022.
BYTE. In: WIKIPEDIA: a enciclopédia livre. 2022. Disponível em:https://pt.wikipedia.org/w/

index.php?title=Byte&oldid=63073823. Acesso em: 10 out. 2022.
POSTGRESQL. Chapter 8: data types. The PostgreSQL Global Development Group,

2022. Disponível em: https://www.postgresql.org/docs/current/datatype.html. Acesso em:
10 out. 2022.

501
Capítulo 19
Manipulando dados no R
Wagner Hugo Bonat1
1
Universidade Federal do Paraná (UFPR)
RESUMO:
O capítulo apresenta e exemplifica as tarefas básicas de importação, arrumação, manipulação
e exportação de dados utilizando o software R. Em linguagem simples, demonstram-se as cinco
principais ações de manipulação de dados: filtrar, ordenar, selecionar, criar/transformar e resumir.
Além disso, mostram-se as tarefas usuais de arrumação de dados como disposição do formato longo
para o curto e vice-versa e união de diferentes conjuntos de dados via um código indexador. Para
ilustrar, ao final, apresenta-se um estudo de caso aplicando-se os conhecimentos apresentados no
decorrer do capítulo e utilizando-se dados da saúde.
PALAVRAS-CHAVE:
Linguagem R. Tidy Data. Manipulação de dados.

1 Introdução
Com a popularização da tecnologia da informação, todas as áreas do conhecimento vêm
passando por uma espécie de revolução na forma de abordar problemas – sejam esses
teóricos ou práticos. A ideia prevalente é a de que decisões devem ser tomadas baseadas
em evidências empíricas amparadas por métodos científicos. A área da saúde, em todas
as suas vertentes, tem historicamente usado dados para a melhor tomada de decisões. Um
exemplo é o esforço do Ministério de Saúde e seus parceiros na organização sistemática
de dados que, em sua última instância, pode ser vista no sistema DataSUS.
Por outro lado, essa mesma revolução vem trazendo cada vez mais desafios para a análise
de dados, uma vez que o volume e velocidade na qual somos capazes de gerar, coletar e
armazenar dados crescem vertiginosamente. De maneira geral, a forma como se coletam
e armazenam dados não é a ideal para analisá-los. Seja qual for a área ou a análise que
se deseja realizar, é crucial organizar a base de dados de forma adequada para análise.
Neste capítulo, serão discutidas técnicas e ferramentas computacionais para o que se
chama manipulação de dados.
A etapa de manipulação de dados está presente em qualquer análise de dados. Na

comunidade estatística e de ciência de dados existe certa crença de que essa etapa utiliza
cerca de 80% da carga horária total de um projeto de dados. Obviamente isso se trata
apenas de crença, mas evidencia a importância dessa etapa. Como ferramenta
computacional para acompanhar o capítulo será adotado o software R.
O R – como se chamará o software daqui em diante – é uma linguagem e ambiente para

computação estatística e gráficos. É um projeto da General Public License (GNU), de 1993,
cujos autores são Ross Ihaka e Robert Gentleman, do Departamento de Estatística da
Universidade de Auckland, Nova Zelândia. O R é um software livre e de código aberto sob
os termos da Free Software Foundation’s GNU. Pode ser facilmente instalado em grande
variedade de plataformas UNIX incluindo FreeBSD e Linux, Windows e MacOS.
Para o iniciante em programação e principalmente para pessoas com pouca maturidade

matemática essa é a melhor linguagem. Essa afirmação se justifica, uma vez que o R é
uma linguagem interpretada de fácil instalação na maioria dos sistemas operacionais e vem
equipado com uma série de ferramentas para análise de dados. Oferece um ecossistema
integrado para todas as principais tarefas de manipulação de dados e um arsenal incrível
de gráficos e métodos estatísticos. Além disso, conta com uma comunidade volumosa e

503
ativa, o que significa que é muito fácil encontrar ajuda para realizar praticamente qualquer
tarefa que envolva manipulação de dados utilizando-se o R.
Ao trabalhar com análise de dados lida-se com dados de todos os tipos e formatos. O R
nativamente apresenta um conjunto completo de ferramentas para importar, manipular e
exportar conjuntos de dados. Também existem pacotes especializados para essas tarefas,
tais como os pacotes do framework tidyverse: readr para leitura, tidyr para arrumação e o
dplyr para manipulação. Neste capítulo se discutirão os aspectos básicos da manipulação
de dados usando-se os princípios do tidy data ou dados arrumados. Esse termo ficou
famoso após o artigo Tidy Data. O chamado tidy data segue três princípios:
• Cada variável está em uma coluna;
• Cada observação está em uma linha;
• Cada tipo de unidade observacional está em uma célula.
A Figura @ref(fig:tidydata) mostra uma representação de um conjunto de dados em que os 3

princípios do tidy data são atendidos.
Figura 1 - Representação dos 3 princípios do tidy data
A ideia parece simples, mas na prática pode ser confusa. A melhor forma de entender esses
conceitos é por meio da prática e exemplos. Neste capítulo vai-se lidar com conjuntos de
dados simples para ilustrar os principais aspectos da importação, manipulação e
exportação de dados. A estrutura deste capítulo segue a ordem lógica de uma análise de
dados, a saber:
• Importação de dados: Etapa na qual o objetivo é a partir de uma fonte primária
de dados importá-los para o ambiente de programação R. Fontes de dados como o
DataSUS e similares são as mais populares. Em geral os arquivos serão obtidos por
meio de algum sítio eletrônico em um formato de texto pleno como .csv, .tsv, .txt,
entre outros. Outra forma usual é os dados serem disponibilizados em planilhas

eletrônicas. Por fim, a menos popular é a opção de acessar um banco de dados
relacional como MySQL, MariaDB e similares.
• Arrumação de dados: Após importar a base de dados é comum que essa não
esteja organizada como se deseja para análise. Assim, o objetivo dessa etapa é
fazer com que os três princípios do tidy data sejam respeitados.
• Manipulação de dados: Com os dados arrumados pode-se começar a conhecê-

los. Isso envolve uma série de tarefas, as quais podem ser assim resumidas:
ordenar, selecionar, filtrar, criar/transformar e resumir registros ou observações.
• Combinação de dados: Em situações mais complexas pode ser necessário lidar

com diferentes fontes de dados de forma conjunta. Assim, é muito importante ter
ferramentas para combinar diferentes conjuntos de dados.
• Exportação de dados: Por fim, realizada a análise, pode ser de interesse

exportar o conjunto de dados organizado ou mesmo diferentes versões com
diferentes resumos para serem consumidos por outros aplicativos. Exemplos
incluem softwares de visualização de dados e as populares planilhas eletrônicas.
Nas próximas seções se discutirá cada uma dessas etapas com mais detalhes e diversos
exemplos.
2 Importando dados
No universo da análise de dados existem diversos tipos de arquivos como: arquivos de
texto pleno, planilhas eletrônicas e banco de dados relacionais. Provavelmente, a forma
mais popular de armazenar um pequeno conjunto de dados é em uma planilha eletrônica.
Todas as planilhas eletrônicas podem facilmente exportar uma tabela no formato retangular
em um arquivo de texto pleno (plain text). Para salvar uma planilha em formato texto pleno,
na maioria das planilhas eletrônicas basta selecionar o Menu -> Arquivo (File) -> Salvar
como (Save as) e selecionar o formato desejado. Um cuidado importante é deixar a planilha
o mais simples possível, ou seja, sem formatações, cores, células mescladas etc. Lembre-
se: cada coluna deve ser uma variável e cada linha uma observação. Entre os diversos
formatos disponíveis os mais populares são: .csv (comma-separated value) e .tsv (tab
separated values) ou versões desses.

505
A principal diferença entre esses formatos é o caracter ou estratégia usada para separar as
colunas da base de dados. Os nomes são autoexplicativos; por exemplo, no formato .csv
as colunas são separadas pelo símbolo vírgula (,). Em português usa-se a vírgula para
representar decimais, por isso, para separar as colunas usa-se o ponto e vírgula (;). Na
prática, tanto faz o formato desde que se saiba qual é o caractere ou estratégia usada para
delimitar as colunas.
Pode-se pensar: por que não ler a planilha eletrônica diretamente? Essa é uma
possibilidade, porém, a extensão das planilhas está atrelada ao sistema operacional. Por
exemplo, não se terá planilhas do famoso Microsoft Excel em um sistema operacional Linux.
Da mesma forma, dificilmente haverá arquivos do tipo .odf do pacote OpenOffice, popular
em ambientes Linux, em sistemas operacionais Windows. Assim, opta-se por usar arquivos
de texto pleno porque são mais portáveis e, de certa forma, agnósticos ao sistema
operacional e/ou software fabricante.
Um arquivo no formato .csv quando visualizado em um editor de texto simples como o bloco
de notas, wordpad ou gedit tem o seguinte formato:
Sigla;Código;Município;idh;renda;alfab;
AC;1200013;Acrelândia;;136,539;73,309;
AC;1200054;Assis Brasil;;115,16;70,954;
AC;1200104;Brasiléia;;132,383;75,493;
AC;1200138;Bujari;;118,815;61,23;
AC;1200179;Capixaba;;108,164;62,283;
AC;1200203;Cruzeiro do Sul;;140,199;71,548;
AC;1200252;Epitaciolândia;;134,364;75,381;
Note-se que o caractere (;) separa as colunas. Isso significa que o ponto e vírgula é o
caractere delimitador de campos. De forma similar um arquivo .tsv tem a seguinte estrutura:
circuito data rank corredor equipe

Monza 03 September 1950 1 Giuseppe Farina Alfa Romeo
Monza 03 September 1950 2 Dorino Serafini Ferrari
Monza 03 September 1950 2 Alberto Ascari Ferrari
Monza 03 September 1950 3 Luigi Fagioli Alfa Romeo
Monza 03 September 1950 4 Louis Rosier Lago
Monza 03 September 1950 5 Philippe Etancelin Lago

Nesse caso o espaço em branco é quem delimita as colunas. Em R a função read.table()
oferece uma forma simples de importar a maioria dos formatos de dados em texto pleno.
Além dessa função nativa existem pacotes especializados na leitura de dados, tal como o
readr.
O objetivo do pacote readr é fornecer uma maneira rápida e amigável de ler dados
retangulares. Esse pacote foi criado para lidar com os mais diversos tipos de formatos de
dados encontrados na prática e dispõe das funções read_csv(), read_tsv(), read_delim(),
read_fwf(), read_table() e read_log(). Além de serem funções bastante simples do ponto de
vista do usuário, possuem um recurso interessante: por meio do argumento col_types é
possível fornecer uma lista que desde a leitura informa o tipo da variável, o que poupa
esforços na fase de tratamento dos dados para análise. Abaixo carregou-se o pacote readr
e visualizou-se a sua documentação.
library(readr)
help(readr)
Para leitura do conjunto de dados é importante saber qual é o diretório dentro do

computador em que o arquivo de interesse está gravado. Neste capítulo se considerará que
o arquivo de dados está no mesmo diretório de trabalho do arquivo .R. Porém, se não for o
caso, basta se especificar o caminho do arquivo no argumento file. Recomenda-se deixar
o conjunto de dados no mesmo diretório do arquivo .R. Assim, pode-se simplesmente fixar
o diretório de trabalho como o diretório atual usando-se a função setwd() e ler o arquivo
apenas especificando o nome. Caso se esteja usando o RStudio IDE na Guia Session ->
Set Working Directory -> To Source File Location fará esta tarefa.
Para começar, vai se importar um arquivo no formato .txt disponível como material
suplementar para este livro no endereço web www.avaliausus.org/livro Indica-se baixar o
arquivo e colocá-lo na mesma pasta em que está o arquivo de comandos R. Antes de
importar o arquivo aconselha-se abri-lo com algum editor de texto e observar que o
caractere separador nesse exemplo é um tab. Por esse motivo, vai se usar a função do
pacote readr destinada a conjuntos de dados separados por tabulação: a read_tsv(). Ao se
abrir o arquivo .txt nota-se que cada coluna tem um nome, por isso o argumento col_names
= TRUE deve ser usado. O código @ref(lem:lebd) ilustra como importar essa base de dados
para o R e mostra as primeiras seis linhas.

507
Importando um arquivo do tipo .txt usando a função `read_tsv()`.
library(readr)
dados <- read_tsv("anovareg.txt", col_names = TRUE)
## Rows: 72 Columns: 4
## ── Column specification
────────────────────────────────────────────────────────
## Delimiter: "\t"
## chr (2): cultivar, bloco
## dbl (2): dose, indice
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(dados)
## # A tibble: 6 × 4
## cultivar dose bloco indice
## <chr> <dbl> <chr> <dbl>
## 1 Ag-1002 0I 46
## 2 Ag-1002 0 II 48
## 3 Ag-1002 0 III 44
## 4 Ag-1002 0 IV 46
## 5 Ag-1002 60 I 48
## 6 Ag-1002 60 II 47
Outro conjunto de dados será importado, agora no formato .csv o qual está no mesmo
endereço web. Novamente pode-se abrir o arquivo em um editor de texto e verificar que o
caractere separador é um espaço em branco. Nesse caso, a função do pacote readr para
leitura é a read_table().
Importando um arquivo do tipo .csv usando a função `read_table()`.
dados <- read_table("reglinear.csv", col_names = TRUE)
##
────────────────────────────────────────────────────────
## cols(
## `"y"` = col_double(),
## `"x"` = col_double()
## )

head(dados)
## # A tibble: 6 × 2
## `"y"` `"x"`
## <dbl> <dbl>
## 1 207318. 55
## 2 250846. 69
## 3 165755. 46
## 4 219817. 61
## 5 268582. 73
## 6 229060. 63
Se a leitura foi executada com sucesso não se deverá receber mensagem alguma. O erro
mais comum nesse ponto é não se especificar o caminho de diretórios corretamente; nesse
caso se receberá uma mensagem similar a esta:
dados <- read_table("reglinear_errado.csv", col_names = TRUE)
## Error: 'reglinear_errado.csv' does not exist in current working directory ('/home/wagner/Dropbox

/My_book/MS_Livro/Wagner_Versao1').
O R está dizendo que não conseguiu encontrar o arquivo que se deseja ler no diretório que
se está procurando. Convém lembrar-se: para saber onde o R está trabalhando usa-se o
comando getwd().
Com a leitura bem sucedida, é hora de se inspecionar o que foi carregado. Recomenda-se
usar a função glimpse() para se ter uma visão geral do arquivo. Assim o pacote dplyr, que
contém a função glimpse, vai ser carregado e inspecionar o objeto dados.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':

##
## filter, lag
## The following objects are masked from 'package:base':

##
## intersect, setdiff, setequal, union
glimpse(dados)

509
## Rows: 20
## Columns: 2
## $ `"y"` <dbl> 207317.7, 250845.7, 165755.0, 219816.7, 268582.2, 229059.7, 1790…
## $ `"x"` <dbl> 55, 69, 46, 61, 73, 63, 50, 46, 69, 62, 63, 60, 55, 70, 66, 59, …
A função glimpse() começa por mostrar quantas observações (rows) e quantas colunas
(cols) a base de dados contém. Nesse caso temos 20 observações (linhas) e 2 variáveis
(colunas). Na sequência apresenta-se o nome de cada coluna e o tipo de dado que essa
representa. Nesse exemplo, tem-se variáveis do tipo dbl – abreviação para double. Com o
conjunto de dados disponível é o momento de arrumá-los para posterior análise.
3 Arrumando dados
Para se analisar um conjunto de dados é importante que esse esteja arrumado, ou seja,
cada coluna deve ser uma variável e cada linha uma observação. Na maioria das situações
práticas os dados não estarão nesse formato e se precisará trabalhar para deixá-lo dessa
forma. Um dos pacotes R mais famosos para arrumação de dados é o tidyr. O código abaixo
carrega o pacote tidyr e acessa sua documentação.
library(tidyr)
help(tidyr)
Uma situação comum é quando os dados vêm em muitas colunas. Isso ocorre muito na
tabulação de dados de experimentos nos quais se tem medidas realizadas ao longo do
tempo. Por exemplo, suponha-se que o conjunto de dados consiste no número de casos
de uma doença rara em seis grandes centros urbanos, nos anos 2011, 2012 e 2013.
tb1 <- data.frame("cidade" = c("Curitiba", "São Paulo", "Rio de Janeiro"),

'2011' = c(5, 7, 3),
'2012' = c(6, 2, 5),
'2013' = c(6, 9, 7), check.names = FALSE)
tb1
## cidade 2011 2012 2013

## 1 Curitiba 5 6 6
## 2 São Paulo 7 2 9
## 3 Rio de Janeiro 3 5 7

Apenas um pequeno esclarecimento; no código acima o argumento check.names = FALSE
é apenas para permitir que o R use números como nomes para colunas, o que não é uma
prática recomendável em R. Porém, optou-se por utilizar nesse momento por se acreditar
que o benefício didático é compensador.
Nesse exemplo as observações da variável de interesse estão em três colunas (2011, 2012
e 2013). Além disso, a variável ano, que deveria ser única coluna, está no título de três
outras colunas; esse é um exemplo típico de dados desorganizados que estão no formato
amplo (wide). O que se deseja é transformá-los para o formato longo (long), de modo que
cada variável esteja em uma coluna e cada observação em uma linha.
Pode-se realizar essa operação utilizando-se o pacote tidyr. Para o caso de empilhar
colunas existe a função pivot_longer().
library(magrittr)
tb1_long <- tb1 %>% pivot_longer(names_to = 'ano',

values_to = 'resposta',
cols = -cidade)
tb1_long
## # A tibble: 9 × 3
## cidade ano resposta
## <chr> <chr> <dbl>
## 1 Curitiba 2011 5
## 4 São Paulo 2011 7
## 5 São Paulo 2012 2
## 6 São Paulo 2013 9
## 7 Rio de Janeiro 2011 3
A sintaxe é bastante simples:
• O argumento names_to nomeia a coluna que vai converter os nomes das colunas
para um fator.

511
• O argumento values_to nomeia a coluna que vai receber os valores empilhados
das colunas de interesse.
• Por fim, especifica-se que nada deve ser feito com a coluna cidade por meio do
argumento cols = -cidade.
Note-se que se introduziu um novo operador: o %>%, chamado pipe, cujo objetivo é
encaminhar um valor para uma expressão ou chamada de função. Nesse caso, utiliza-se o
%>% para indicar que na função pivot_longer() o objeto de interesse é o data.frame tb1. É
importante ressaltar que dentro da função pivot_longer() pode-se especificar diretamente o
data.frame por meio do argumento data, contudo, o código fica mais organizado e elegante
quando usamos o %>%.
É possível também fazer a operação inversa, ou seja, desempilhar, caso seja de interesse.
Isso pode ser feito com a função pivot_wider() do tidyr.
tb1_long %>% pivot_wider(names_from = 'ano',

values_from = 'resposta')
## # A tibble: 3 × 4
## cidade `2011` `2012` `2013`
## <chr> <dbl> <dbl> <dbl>
## 1 Curitiba 5 6 6
## 2 São Paulo 7 2 9
## 3 Rio de Janeiro 3 5 7
Outra operação pode ser necessária – separar uma variável em várias outras, o que é
comum quando um campo de texto é a união de várias informações. Considere-se o
seguinte data.frame.
tb <- data.frame(US = c("US1", "US2", "US3"),
cidade_ano = c("Curitiba/2012", "Santos/2012", "Viçosa/2016"),
local = c("Curitiba-PR", "Santos-SP", "Viçosa-MG"))
tb
## US cidade_ano local
## 1 US1 Curitiba/2012 Curitiba-PR
## 2 US2 Santos/2012 Santos-SP
## 3 US3 Viçosa/2016 Viçosa-MG

A coluna cidade_ano é a mistura das variáveis cidade e ano. De forma similar, a coluna
local é a mistura de duas variáveis: município e unidade federativa (UF). Assim, precisa-se
separar essas informações. Note-se que o caractere (/) é quem separa as informações na
coluna cidade_ano enquanto na coluna local o caractere (-) é o separador.
Uma alternativa simples e que exige pouco tratamento para separação de variáveis é a
função separate() do pacote tidyr. Para essa função os argumentos são o data.frame, a
coluna de interesse, quais colunas novas serão criadas e qual o separador. Por exemplo,
o seguinte código
tb_nova1 <- tb %>% separate(col = cidade_ano,
into = c('Cidade', 'Ano'),
sep = '/')
tb_nova1
## US Cidade Ano local
## 1 US1 Curitiba 2012 Curitiba-PR
## 2 US2 Santos 2012 Santos-SP
## 3 US3 Viçosa 2016 Viçosa-MG
separa a coluna cidade_ano em outras duas colunas chamadas Cidade e Ano, usando-se
como caractere para separar as informações a /. De forma similar pode-se separar as
informações da coluna local.
tb_nova2 <- tb_nova1 %>% separate(col = local,
into = c('Município', 'UF'),
sep = '-')
tb_nova2
## US Cidade Ano Município UF
## 1 US1 Curitiba 2012 Curitiba PR
## 2 US2 Santos 2012 Santos SP
## 3 US3 Viçosa 2016 Viçosa MG
Da mesma forma que podemos separar variáveis que estão na mesma coluna pode ser
necessário criar novas variáveis unindo-se os valores de duas ou mais colunas. Por
exemplo, suponha-se que em um data.frame os campos dia, mês e ano estão cada um em
uma coluna. Porém, precisa-se de apenas uma coluna que represente a data da
observação. Assim, é necessário juntar essas três colunas em uma nova.
tb <- data.frame(dia = c(1, 5, 23, 16),

mes = c(3, 6, 2, 9),
ano = 2018)

513
Essa tarefa pode ser realizada com a função unite() do pacote tidyr em que se especifica o
data.frame, o nome da coluna que receberá a união das outras, o separador de interesse e
quais colunas serão unidas. Nesse caso, com o intuito de manter as variáveis originais
acrescentou-se o argumento remove = FALSE.
tb <- tb %>% unite(col = 'data',
sep = '/',
c('dia', 'mes', 'ano'),
remove = FALSE)
tb
## data dia mes ano
## 1 1/3/2018 1 3 2018
## 2 5/6/2018 5 6 2018
## 3 23/2/2018 23 2 2018
## 4 16/9/2018 16 9 2018
Pode-se ainda converter essa coluna para o tipo data.
tb$data <- as.Date(tb$data, format = "%d/%m/%Y")

tb
## data dia mes ano
## 1 2018-03-01 1 3 2018
## 2 2018-06-05 5 6 2018
## 3 2018-02-23 23 2 2018
## 4 2018-09-16 16 9 2018
Por fim, frequentemente se terá que lidar com dados faltantes. Algumas vezes pode-se
simplesmente querer remover todas as linhas que tenham algum NA. Outras vezes
preenchê-las com algum valor específico. O pacote tidyr dispõe de funções bastante úteis
para tratamento de dados ausentes. Veja o seguinte conjunto de dados:
tb <- data.frame(Paciente = 1:5,

N_consultas = c(0, 1, 3, 1, 2),
N_tratamentos = c(NA, 0, 0, 2, 1),
N_remedios = c(NA, 1, 1, 0, 0))
Para se excluírem todas as linhas que contenham pelo menos um NA tem-se a função
drop_na() do pacote tidyr.

drop_na(tb)
## Paciente N_consultas N_tratamentos N_remedios

## 1 2 1 0 1
## 2 3 3 0 1
## 3 4 1 2 0
## 4 5 2 1 0
Para se substituir os campos iguais a NA por algum valor, o pacote tidyr dispõe da função
replace_na(), a qual recebe como argumento o data.frame e uma lista com o nome da
variável no data.frame e qual o valor que um dado ausente encontrado naquela variável
deve assumir.
tb %>% replace_na(list(N_tratamentos = 0,
N_remedios = 0))
## Paciente N_consultas N_tratamentos N_remedios
## 1 1 0 0 0
## 2 2 1 0 1
## 3 3 3 0 1
## 4 4 1 2 0
## 5 5 2 1 0
É importante salientar que tratar dados ausentes de forma estatisticamente coerente nem
sempre é tarefa fácil. Assim, convém se pensar muito bem o que os dados faltantes
significam no contexto em que se está trabalhando e se faz sentido substituir por algum
número ou mesmo excluir da base de dados.
4 Manipulando dados
Uma vez que os dados estejam arrumados é a hora de começar a conhecê-los. Seguindo-
se os princípios do tidy data, para manipular um conjunto de dados há cinco ações
essenciais:
• Ordenar observações de acordo com os seus valores.
• Selecionar variáveis de acordo com o seu nome e/ou características.
• Filtrar observações de acordo com os seus valores.
• Criar/transformar variáveis a partir de variáveis existentes.

515
• Resumir ou sumarizar dados. Essa ação é a mais complexa e em geral envolve
o uso de medidas estatísticas como média, mediana, desvio-padrão, dentre outras,
para se criar resumo dos dados.
Existem diversas alternativas em R para manipulação de dados; uma delas é o pacote

dplyr. No código abaixo carregou-se o pacote dplyr e se acessou a sua documentação.
library(dplyr)
help(dplyr)
Para ilustrar o uso de cada uma das ações de manipulação convém considerar os dados
apresentados na Figura @ref(fig:tabelaexemplo). O exemplo consiste em um estudo
longitudinal composto por sete pacientes de duas unidades de saúde, avaliados em três
consultas com relação a severidade de alguma doença. A severidade foi avaliada como
uma nota entre 0 e 10. Por fim, a variável número de medicamentos que o paciente usou
durante o período avaliado é registrado na coluna medicamentos. Obviamente esse é um
exemplo simples e puramente didático. Porém, com base nesses dados é possível ilustrar
as principais tarefas da etapa de manipulação de dados.
Tabela 1 - Uma tabela com dados fictícios sobre um experimento longitudinal
Pode-se entrar com esses dados diretamente em R conforme abaixo:

df1 <- data.frame(
codigo = c(256, 487, 965,
125, 458, 874, 963),
paciente = c("João", "Vanessa", "Tiago",
"Luana", "Gisele", "Pedro",
"André"),
US = c("US1", "US1", "US2", "US2",
"US2", "US1", "US2"),

severidade1 = c(8, 7.5, 9.5, 7, 4.5, 5.5, 3),
severidade2 = c(9, 7.5, 8, 8.5, 5, 7.5, NA),
severidade3 = c(8, 7.5, 7.5, 5, NA, 9, 3),
medicamentos = c(4, 4, 0, 8, 2, 0, 5))
A ação mais simples é a de ordenação, que pode ser feita de acordo com os valores de
uma ou mais variáveis.
Por exemplo, pode-se ordenar os pacientes pelo seu código. No dplyr a função destinada
para ordenação é a arrange().
df1 %>% arrange(codigo)
## codigo paciente US severidade1 severidade2 severidade3 medicamentos

## 1 125 Luana US2 7.0 8.5 5.0 8
## 2 256 João US1 8.0 9.0 8.0 4
## 3 458 Gisele US2 4.5 5.0 NA 2
## 4 487 Vanessa US1 7.5 7.5 7.5 4
## 5 874 Pedro US1 5.5 7.5 9.0 0
## 6 963 André US2 3.0 NA 3.0 5
## 7 965 Tiago US2 9.5 8.0 7.5 0
Note-se que a variável código foi ordenada de forma crescente; para ordená-la de maneira
decrescente:
df1 %>% arrange(desc(codigo))

## 1 965 Tiago US2 9.5 8.0 7.5 0
## 2 963 André US2 3.0 NA 3.0 5
## 3 874 Pedro US1 5.5 7.5 9.0 0
## 4 487 Vanessa US1 7.5 7.5 7.5 4
## 5 458 Gisele US2 4.5 5.0 NA 2
## 6 256 João US1 8.0 9.0 8.0 4
## 7 125 Luana US2 7.0 8.5 5.0 8
Pode-se também ordenar por duas ou mais colunas.

517
df1 %>% arrange(US, severidade1)

## 1 874 Pedro US1 5.5 7.5 9.0 0
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 256 João US1 8.0 9.0 8.0 4
## 4 963 André US2 3.0 NA 3.0 5
## 5 458 Gisele US2 4.5 5.0 NA 2
## 6 125 Luana US2 7.0 8.5 5.0 8
## 7 965 Tiago US2 9.5 8.0 7.5 0
A próxima ação é a de seleção e pode ser feita de várias formas:

• Pelo nome das colunas.
• Pela posição das linhas ou das colunas.
• Condicional ao valor de uma ou mais variáveis.
• Por extremidades cabeça (head) e cauda (tail).
Suponha-se que se tem interesse apenas nas colunas paciente, US e medicamentos.

Pode-se selecionar as colunas pelos nomes. Utilizando-se a função select do dplyr, tem-
se:
df1 %>% select(c("paciente", "US", "medicamentos"))
## paciente US medicamentos
## 1 João US1 4
## 2 Vanessa US1 4
## 3 Tiago US2 0
## 4 Luana US2 8
## 5 Gisele US2 2
## 6 Pedro US1 0
## 7 André US2 5
Pelas posições das colunas,
df1 %>% select(c(2,3,7))
## paciente US medicamentos
## 1 João US1 4
## 2 Vanessa US1 4
## 3 Tiago US2 0
## 4 Luana US2 8

## 5 Gisele US2 2
## 6 Pedro US1 0
## 7 André US2 5
É possível selecionar apenas os pacientes que fazem uso mais de dois medicamentos
utilizando-se a função filter() do dplyr.
df1 %>% filter(medicamentos > 2 )

## 1 256 João US1 8.0 9.0 8.0 4
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 125 Luana US2 7.0 8.5 5.0 8
## 4 963 André US2 3.0 NA 3.0 5
Pode-se também selecionar pelo número das linhas usando a função slice() do dplyr.
df1 %>% slice(3:5)

## 1 965 Tiago US2 9.5 8.0 7.5 0
## 2 125 Luana US2 7.0 8.5 5.0 8
## 3 458 Gisele US2 4.5 5.0 NA 2
Além disso, pode-se selecionar apenas as extremidades – cabeça (head) ou cauda (tail).
O número de observações pode ser alterado pelo argumento n.
# Cabeça
df1 %>% slice_head(n = 3)

## 1 256 João US1 8.0 9.0 8.0 4
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 965 Tiago US2 9.5 8.0 7.5 0
# Cauda
df1 %>% slice_tail(n = 3)

## 1 458 Gisele US2 4.5 5.0 NA 2
## 2 874 Pedro US1 5.5 7.5 9 0
## 3 963 André US2 3.0 NA 3 5

519
Entre as diversas ações possíveis, uma das mais importantes é a de filtrar observações de
acordo com suas características. Viu-se a função filter() do dplyr, a qual permite fazer filtros
ou obter subconjuntos que tenham características de interesse. Similar a ação de seleção,
a ação de filtro pode ser realizada por uma ou mais características; por exemplo, pode-se
selecionar somente os pacientes da unidade de saúde US1.
df1 %>% filter(US == "US1")

## 1 256 João US1 8.0 9.0 8.0 4
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 874 Pedro US1 5.5 7.5 9.0 0
Outro exemplo é selecionar pacientes em que a soma das severidades das consultas 1, 2
e 3 seja maior que 18.
df1 %>% filter(US == "US1" & (severidade1 + severidade2 + severidade3) > 18)

## 1 256 João US1 8.0 9.0 8.0 4
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 874 Pedro US1 5.5 7.5 9.0 0
Pacientes que usam algum medicamento.
df1 %>% filter(medicamentos != 0)

## 1 256 João US1 8.0 9.0 8.0 4
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 125 Luana US2 7.0 8.5 5.0 8
## 4 458 Gisele US2 4.5 5.0 NA 2
## 5 963 André US2 3.0 NA 3.0 5
Pelo nome dos pacientes.
df1 %>% filter(paciente %in% c("Aline", "Vanessa"))

## 1 487 Vanessa US1 7.5 7.5 7.5 4
O operador %in% implica a seleção de qualquer um que se encaixe em c (Aline, Vanessa).

Como não há Aline alguma, a saída retornou apenas à linha da paciente Vanessa.

As operações de criar/transformar permitem, por exemplo, renomear as colunas do
conjunto de dados. Para renomear as colunas de um data.frame basta atribuírem-se novos
nomes. Para essa tarefa o dplyr possui a função rename().
df1 <- df1 %>% rename(cod = 'codigo',

pac = 'paciente',
US = 'US',
s1 = 'severidade1',
s2 = 'severidade2',
s3 = 'severidade3',
med = 'medicamentos')
Trocar a ordem das colunas para que as severidades apareçam primeiro pode ser feito
tanto pelo nome quanto pelos números associados às colunas.
df1[,c(4,5,6,1,2,3)]
## s1 s2 s3 cod pac US
## 1 8.0 9.0 8.0 256 João US1
## 2 7.5 7.5 7.5 487 Vanessa US1
## 3 9.5 8.0 7.5 965 Tiago US2
## 4 7.0 8.5 5.0 125 Luana US2
## 5 4.5 5.0 NA 458 Gisele US2
## 6 5.5 7.5 9.0 874 Pedro US1
## 7 3.0 NA 3.0 963 André US2
A ação de transformação consiste em criar novas variáveis a partir das variáveis existentes;
por exemplo, pode-se calcular a severidade média dos pacientes e, para isso, é possível
utilizar a função mutate() do dplyr.
df1 %>% mutate(media = (s1 + s2 + s3)/3)
## cod pac US s1 s2 s3 med media
## 1 256 João US1 8.0 9.0 8.0 4 8.333333
## 2 487 Vanessa US1 7.5 7.5 7.5 4 7.500000
## 3 965 Tiago US2 9.5 8.0 7.5 0 8.333333
## 4 125 Luana US2 7.0 8.5 5.0 8 6.833333
## 5 458 Gisele US2 4.5 5.0 NA 2 NA
## 6 874 Pedro US1 5.5 7.5 9.0 0 7.333333
## 7 963 André US2 3.0 NA 3.0 5 NA

521
Note-se que, onde os pacientes não têm severidade, o cálculo da média resultou em NA.
Supõe-se que se o paciente não realizou a consulta a severidade será zero.
df1 <- df1 %>% replace_na(list(s1 = 0,

s2 = 0,
s3 = 0))
df1
## cod pac US s1 s2 s3 med
## 1 256 João US1 8.0 9.0 8.0 4
## 2 487 Vanessa US1 7.5 7.5 7.5 4
## 3 965 Tiago US2 9.5 8.0 7.5 0
## 4 125 Luana US2 7.0 8.5 5.0 8
## 5 458 Gisele US2 4.5 5.0 0.0 2
## 6 874 Pedro US1 5.5 7.5 9.0 0
## 7 963 André US2 3.0 0.0 3.0 5
df1 <- df1 %>% mutate(media = (s1 + s2 + s3)/3)
df1
## cod pac US s1 s2 s3 med media
## 1 256 João US1 8.0 9.0 8.0 4 8.333333
## 2 487 Vanessa US1 7.5 7.5 7.5 4 7.500000
## 3 965 Tiago US2 9.5 8.0 7.5 0 8.333333
## 4 125 Luana US2 7.0 8.5 5.0 8 6.833333
## 5 458 Gisele US2 4.5 5.0 0.0 2 3.166667
## 6 874 Pedro US1 5.5 7.5 9.0 0 7.333333
## 7 963 André US2 3.0 0.0 3.0 5 2.000000
É possível criar uma coluna para classificar a severidade. Por exemplo, se o paciente tem
severidade (média > 7) classifica-se como alta; se (40 < média < 70) como média ou se
(média < 40) como baixa, usando-se a função cut().
breaks <- c(0, 4, 7, 10)
df1$classificacao <- cut(df1$media,

breaks = breaks,
labels = c("Baixa", "Média", "Alta"))
df1
## cod pac US s1 s2 s3 med media classificacao
## 1 256 João US1 8.0 9.0 8.0 4 8.333333 Alta
## 2 487 Vanessa US1 7.5 7.5 7.5 4 7.500000 Alta

## 3 965 Tiago US2 9.5 8.0 7.5 0 8.333333 Alta
## 4 125 Luana US2 7.0 8.5 5.0 8 6.833333 Média
## 5 458 Gisele US2 4.5 5.0 0.0 2 3.166667 Baixa
## 6 874 Pedro US1 5.5 7.5 9.0 0 7.333333 Alta
## 7 963 André US2 3.0 0.0 3.0 5 2.000000 Baixa
A última ação a discutir é a de resumo ou sumarização, a qual está muito ligada à ideia de
dados no formato amplo. No exemplo dos pacientes o conjunto de dados está no formato
amplo. Se se desejar calcular a média da severidade para cada consulta precisa-se
percorrer uma a uma as colunas severidade1, severidade2 e severidade3 e calcular a
média. Se os dados estiverem no formato longo seria mais facilmente possível usar a ideia
de resumir uma variável condicional aos valores de outra; nesse caso: a severidade.
Usando-se a função pivot_longer() pode-se facilmente passar um conjunto de dados do

formato amplo para longo. Vale notar que vai se remover as colunas cod, med, media e
classificação antes de se fazer a manipulação.
df1_temp <- df1 %>% select(-c(cod, med, media, classificacao))
df1_long <- df1_temp %>% pivot_longer(names_to = 'consulta',

values_to = 'valor',
cols = -c(pac, US))
df1_long
## # A tibble: 21 × 4
## pac US consulta valor
## <chr> <chr> <chr> <dbl>
## 1 João US1 s1 8
## 2 João US1 s2 9
## 3 João US1 s3 8
## 4 Vanessa US1 s1 7.5
## 7 Tiago US2 s1 9.5
## 8 Tiago US2 s2 8
## 9 Tiago US2 s3 7.5
## 10 Luana US2 s1 7
## # … with 11 more rows

523
Agora suponha-se que se quer saber qual é a severidade média por consulta; faz-se um
resumo da coluna valor, porém de acordo com os valores da coluna consulta.
Informalmente, diz-se que se está agrupando pela coluna consulta ou fazendo um group by
por consulta. Esse resultado pode ser obtido por meio da função summarise() do dplyr.
df1_long %>%
group_by(consulta) %>%
summarise(media = mean(valor))
## # A tibble: 3 × 2
## consulta media
## <chr> <dbl>
## 1 s1 6.43
## 2 s2 6.5
## 3 s3 5.71
Pode-se agrupar por mais de uma coluna; por exemplo, a severidade média de cada
unidade de saúde para cada consulta.
df1_long %>%
group_by(US, consulta) %>%
summarise(media = mean(valor))
## `summarise()` has grouped output by 'US'. You can override using the `.groups`
## argument.
## # A tibble: 6 × 3
## # Groups: US [2]
## US consulta media
## <chr> <chr> <dbl>
## 1 US1 s1 7
## 2 US1 s2 8
## 3 US1 s3 8.17
## 4 US2 s1 6
## 5 US2 s2 5.38
## 6 US2 s3 3.88
Outra opção é calcular mais de uma medida resumo. No caso da função summarise() basta
acrescentar uma linha e especificar que se tem interesse em obter outra medida.
df1_long %>%
group_by(US, consulta) %>%

summarise(media = mean(valor),
sd = sd(valor))
## `summarise()` has grouped output by 'US'. You can override using the `.groups`
## argument.
## # A tibble: 6 × 4
## # Groups: US [2]
## US consulta media sd
## <chr> <chr> <dbl> <dbl>
## 1 US1 s1 7 1.32
## 2 US1 s2 8 0.866
## 3 US1 s3 8.17 0.764
## 4 US2 s1 6 2.86
## 5 US2 s2 5.38 3.90
## 6 US2 s3 3.88 3.17
Esse tipo de tarefa é também chamada split-apply-combine. Primeiro divide-se (split) o

conjunto de dados pelas variáveis unidade de saúde e consulta. Para cada pedaço foram
calculadas as medidas resumo (apply). Finalmente, combina-se os resultados em um novo
data.frame (combine).
5 Combinando dados
Em algumas situações pode ser necessário combinar diversos conjuntos de dados. A

situação mais comum é quando se tem um conjunto de dados, como por exemplo o nosso
df1, e um novo conjunto de dados é disponibilizado. Assim, precisa-se combinar os dados
que se tem com o novo. Suponha-se que o novo conjunto de dados é o seguinte:
df2 <- data.frame(
codigo = c(505, 658, 713),
paciente = c("Bia", "Carlos", "Cris"),
unidade_saude = c("US3", "US3", "US3"),
severidade1 = c(6.5, 7.5, 7.5),
severidade2 = c(8.5, 8.0, 9.0),
medicamentos = c(0, 0, 2))

525
Para combinar o novo conjunto de dados com o antigo, a primeira coisa a fazer é deixá-los
compatíveis. Isso significa que devem ter os mesmos dados e as colunas devem ter os
mesmos nomes. Como se fez diversos cálculos com o df1, esse será recriado.
df1 <- data.frame(

codigo = c(256, 487, 965,
125, 458, 874, 963),
paciente = c("João", "Vanessa", "Tiago",
"Luana", "Gisele", "Pedro",
"André"),
unidade_saude = c("US1", "US1", "US2", "US2",
"US2", "US1", "US2"),
severidade1 = c(8, 7.5, 9.5, 7, 4.5, 5.5, 3),
severidade2 = c(9, 7.5, 8, 8.5, 5, 7.5, NA),
severidade3 = c(8, 7.5, 7.5, 5, NA, 9, 3),
medicamentos = c(4, 4, 0, 8, 2, 0, 5))
Note-se que no conjunto df2 não temos uma coluna chamada severidade3. Assim, primeiro
precisamos criá-la.
df2$severidade3 <- NA
Uma vez que os conjuntos de dados são compatíveis, pode-se simplesmente concatenar
suas linhas usando-se a função rbind().
df <- rbind(df1, df2)
df
## codigo paciente unidade_saude severidade1 severidade2 severidade3
## 1 256 João US1 8.0 9.0 8.0
## 2 487 Vanessa US1 7.5 7.5 7.5
## 3 965 Tiago US2 9.5 8.0 7.5
## 4 125 Luana US2 7.0 8.5 5.0
## 5 458 Gisele US2 4.5 5.0 NA
## 6 874 Pedro US1 5.5 7.5 9.0
## 7 963 André US2 3.0 NA 3.0
## 8 505 Bia US3 6.5 8.5 NA
## 9 658 Carlos US3 7.5 8.0 NA
## 10 713 Cris US3 7.5 9.0 NA
## medicamentos
## 1 4

## 2 4
## 3 0
## 4 8
## 5 2
## 6 0
## 7 5
## 8 0
## 9 0
## 10 2
Por fim, outra operação que aparece com frequência ao se analisarem dados é a de
juntar/parear duas tabelas que possuem uma chave primária. Essas operações são
geralmente chamadas junções (join) e existem diversas versões, as quais estão entre as
mais comuns:
• Junção por interseção (inner join).

• Junção por união (full join).
• Junção à esquerda (left join).
• Junção à direita (right join).
Para se praticar esse tipo de operação considere-se o seguinte conjunto de dados:
df_extra <- data.frame(

"codigo" = c(256, 965, 285, 125, 874, 321, 669, 963),
"paciente" = c("João", "Tiago", "Tiago", "Luana",
"Pedro", "Mia", "Luana", "André"),
"idade" = c(18, 18, 22, 21, 19, 18, 19, 20),
"assist_social" = c("S", "N", "N", "S", "N", "N", "S", "N"))
O pacote dplyr() possui funções específicas para cada tipo de junção.
# Left join
left_join(df1, df_extra, by = "codigo")
# Right join
right_join(df1, df_extra, by = "codigo")
# inner join
inner_join(df1, df_extra, by = "codigo")

527
# full join
full_join(df1, df_extra, by = "codigo")
A diferença entre os diferentes join é bastante simples:

• left join: mantém todos os registros da tabela da esquerda (df1) e completa com
os correspondentes da tabela da direita (df_extra).
• right join: mantém todos os registros da tabela da direita (df_extra) e completa
com os dados da tabela da esquerda (df1).
• inner join: mantém apenas os registros que estão em ambas as tabelas.
• full join: mantém todos os registros e preenche com NA onde não tem
correspondência entre as tabelas.
Assim, passa-se pelas principais tarefas de manipulação de dados. Com os dados

organizados e devidamente manipulados ou resumidos, o último passo é exportar para
consumo em alguma outra ferramenta computacional. Esse é o assunto da nossa próxima
seção.
6 Exportando dados
Após a realização das análises é bastante provável que se precise exportar um conjunto
de dados organizado ou uma tabela com estatísticas. O R tem uma longa lista de funções
para exportar dados. Assim como leitura, o pacote readr dispõe de uma série de funções
de escrita.
A forma mais comum é exportar um arquivo de texto pleno nos formatos .csv ou .txt. Para
essa tarefa as funções write_tsv() e write_csv() podem ser usadas. É possível exportar o
resultado da junção das tabelas df1 e df_extra como o resultado de nossa análise, conforme
ilustra o código @ref(lem:exporta).
Exemplo de uso da função `write_csv()` para exportar arquivos de texto pleno.
final <- inner_join(df1,
df_extra,
by = "matricula")
write_csv(final,
file = "Nome_do_arquivo.csv")

Os argumentos básicos são o data.frame, o qual se quer salvar em disco, e o nome
desejado. A maioria dos argumentos de escrita são iguais ou muito similares aos
argumentos de leitura. Assim, exportação de dados não gera mais complexidade e tudo
que se aprendeu para leitura aplica-se imediatamente.
Sem dúvida, exportar dados em texto pleno é muito fácil e simples, entretanto, existem
algumas desvantagens. A principal é que as classes das colunas podem ser perdidas ao
ler novamente o conjunto de dados em R. Por ser um texto pleno o arquivo não carrega
metadados que foram criados em R. Caso seja de interesse, é possível salvar o próprio
objeto R que contém o seu data.frame usando-se a função save().
save(final,
file = "Nome_do_arquivo.RData")
A principal vantagem é que tudo que se fez no objeto final será mantido. Outra vantagem é
que se pode salvar outros formatos de dados como listas, matrizes e arrays. Para carregar
novamente o data.frame deve-se usar a função load().
load("Nome_do_arquivo.RData")
Caso se tenha um objeto mais complicado, como por exemplo uma série de listas, a função
dput() é uma opção interessante, por permitir salvar um objeto R como um texto simples, o
qual pode ser copiado e colado.
dput(final)
É possível também escrever um arquivo com extensão .R que pode ser posteriormente
carregado no R.
dput(final,
file = "Nome_do_arquivo.R")
Para carregar os dados basta usar a função dget().
dget("Nome_do_arquivo.R")
Essa estratégia pode ser usada para múltiplos objetos usando-se a função dump(),

529
dump(c("final", "df1"),
file = "Nome_do_arquivo.R")
que agora deve ser carregado em R usando-se a função source().
source("Nome_do_arquivo.R")
Outro formato que o R exporta é o formato binário com a extensão .rda. As vantagens desse
formato são ocupar pouco espaço em disco e preservar as propriedades do objeto R.
save(final,
file = "Nome_do_arquivo.rda")
Nesse caso, pode-se usar novamente a função load() para fazer a leitura em R.
Por fim, é possível salvar todos os objetos e instruções que se usou em sua sessão R
usando-se a função save.image().
É importante lembrar-se: sempre que não se especificar o caminho de escrita

explicitamente, o R vai escrever no diretório de trabalho atual. Algumas funções úteis para
se ter controle de onde o R está escrevendo os arquivos são:
• file.info(): mostra o tamanho do arquivo, data de criação e outros detalhes do
arquivo.
• dir(): mostra todos os arquivos presentes em um diretório.
• file.exists(): verifica se um arquivo existe (TRUE) ou não (FALSE) no diretório de
trabalho.
• getwd() e setwd(): verifica e altera o diretório de trabalho respectivamente.
Agora que se tem todos os ingredientes para lidar com dados em R, mostra-se como
praticar em um exemplo com dados reais extraídos do site do DataSUS.
7 Praticando: mortalidade por causas externas

Para se fechar este capítulo, uma análise completa vai ser apresentada desde a leitura,
organização, manipulação e resumo de dados até a apresentação por meio de tabelas.
Esse exemplo corresponde a um conjunto de dados coletado do site [tabsus]
(http://tabnet.datasus.gov.br/cgi/menu_tabnet_php.htm), mantido pelo Ministério da Saúde.
Os dados referem-se à mortalidade por causas externas por faixa etária para todos os

municípios brasileiros no ano 2019. O conjunto de dados está disponível como um material
suplementar a este livro no formato .csv (comma-separated value).
Foram mantidos esses dados da forma mais crua possível para que se vivenciem todos os
desafios das etapas de importar, manipular, analisar e apresentar os resultados de uma
análise de dados.
8 Importando o conjunto de dados

O arquivo com a conjunto de dados que se deseja importar é chamado dados.csv. Sugere-
se que o leitor abra o arquivo no seu editor de texto preferido para identificar que o caractere
separador de colunas é o (;). Além disso, um aspecto interessante é que municípios em
que não houve eventos em determinada faixa etária apresenta o caractere (-). Assim, deve-
se minimamente informar ao R:
• Qual é o caractere separador de colunas, argumento delim = ";".
• Qual caractere indica dados ausentes, argumento na = "-".
• Se o conjunto de dados contém nomes das colunas, argumento col_names =
TRUE.
Novamente usa-se o pacote readr e a função read_delim que permite facilmente especificar
esses argumentos. O Código @ref(lem:lebasedados) ilustra como importar o conjunto de
dados para o R.
Importando o conjunto de dados.
dados <- read_delim("dados.csv", col_names = TRUE, delim = ";", na = "-")

────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (1): Município
## dbl (14): Menor 1 ano, 1 a 4 anos, 5 a 9 anos, 10 a 14 anos, 15 a 19 anos, 2...
##
Se a leitura foi executada com sucesso deve-se receber uma mensagem indicando a
especificação das colunas, bem como o tipo e nome de cada uma. Assim, é hora de

531
inspecionar o que foi carregado. Recomenda-se usar a função glimpse() para se ter uma
visão geral do arquivo de dados.
glimpse(dados)
## Rows: 5,598
## Columns: 15
## $ Município <chr> "110001 Alta Floresta D'Oeste", "110037 Alto Alegre d…
## $ `Menor 1 ano` <dbl> NA, NA, NA, NA, NA, NA, NA, NA, 1, NA, 2, NA, NA, NA,…
## $ `1 a 4 anos` <dbl> NA, NA, NA, NA, 3, NA, NA, NA, 4, NA, NA, NA, 1, NA, …
## $ `5 a 9 anos` <dbl> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, N…
## $ `10 a 14 anos` <dbl> 1, NA, 2, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 1, …
## $ `15 a 19 anos` <dbl> 2, 1, 2, 1, 7, 4, 1, NA, 3, NA, 2, NA, NA, 1, 1, NA, …
## $ `20 a 29 anos` <dbl> 4, 3, 5, NA, 26, 8, NA, NA, 15, NA, 3, NA, NA, NA, 3,…
## $ `30 a 39 anos` <dbl> 2, 3, NA, 5, 20, 3, NA, 2, 11, 1, 6, NA, 2, 1, 2, 2, …
## $ `40 a 49 anos` <dbl> 7, NA, 2, NA, 15, 6, 1, 1, 15, 3, 6, NA, NA, 1, 3, 1,…
## $ `50 a 59 anos` <dbl> 1, 1, 3, 3, 6, 3, NA, NA, 6, NA, 5, NA, 5, 1, 2, 1, 1…
## $ `60 a 69 anos` <dbl> NA, 1, 3, 1, 10, 4, NA, 1, 3, 1, 2, NA, 1, 1, 2, NA, …
## $ `70 a 79 anos` <dbl> 2, 1, NA, 1, 4, NA, 1, NA, 4, NA, NA, NA, NA, 2, NA, …
## $ `80 anos e mais` <dbl> 1, 1, NA, NA, 3, NA, 1, NA, 7, NA, NA, NA, 2, NA, 1, …
## $ `Idade ignorada` <dbl> NA, NA, NA, NA, NA, 1, NA, NA, 1, NA, 1, NA, NA, NA, …
## $ Total <dbl> 20, 11, 17, 11, 94, 29, 4, 4, 70, 5, 27, NA, 11, 8, 1…
A função glimpse() começa mostrando-se quantas observações e quantas colunas contém

a base de dados. Nesse caso, há 5598 observações (linhas) e 15 variáveis (colunas). Na
sequência apresenta-se o nome de cada coluna e o tipo de dado que essa representa.
Nesse exemplo, há variáveis do tipo chr e dbl –abreviações dos tipos de vetores character
e double. Apesar de o nome das colunas ser autoexplicativo é sempre interessante manter
um dicionário da base de dados. Um dicionário nada mais é do que uma lista com o nome
de cada coluna e o que essa representa. Por exemplo:
• Município: código e nome do município onde o evento ocorreu.
• Menor de 1 ano: Número de mortes por causas externas na faixa etária menor de
1 ano.
• 1 a 4 anos: Número de mortes por causas externas na faixa etária 1 a 4 anos.

• 80 anos e mais: Número de mortes por causas externas na faixa etária 80 anos e
mais.
• Idade ignorada: Número de mortes por causas externas em que a idade foi
ignorada.
• Total: Soma do número de mortes por causas externas em todas as faixas etárias.
Esse é um conjunto de dados bastante típico e ao se deparar com um conjunto de dados

como esse é necessário se perguntar o que se quer mostrar/saber. Nem sempre o objetivo
é claro e é preciso se investigar os aspectos dos dados para saber quais são as
possibilidades. Nesse momento precisa-se saber como arrumar e manipular a base de
dados para entendê-la e investigar possíveis análises.
9 Preparando a base de dados
Dada a estrutura da base de dados vemos claramente que os princípios do tidy data não
são respeitados em ao menos dois pontos:
1. A coluna Município contém duas informações, o código e nome do município.
Assim, precisa-se particionar essa informação.

2. A variável faixa etária está como nome de colunas em vez de em uma coluna.
Novamente é preciso arrumar essa informação para tê-la em apenas uma coluna. Nesse
sentido, tem-se um conjunto de dados no formato amplo.
Para começar, vamos particionar a informação da coluna Município. Note-se que nesse
exemplo há um desafio adicional, uma vez que o separador das informações código e nome
do município é o espaço em branco. Porém, para municípios com nome composto, a
exemplo de Alto Alegre dos Parecis, ao se usar o argumento sep = ' ' da função separate
não se obterá o resultado desejado.
Assim, vai ser preciso lidar com algumas operações relacionadas com strings. De forma
geral o termo strings será usado para se referir a campos com texto. O tidyverse tem um

533
pacote específico para se lidar com strings, o stringr. A ideia é simples: primeiro quebra-se
a string completa nos espaços em branco e depois especifica-se quantas partes retornar.
Nesse caso, queremos duas partes; a primeira será o código do município e a segunda o
nome do município.
A função str_split do pacote stringr é adequada para essa tarefa. Por default a função
retorna uma lista com os valores. Como se quer construir um novo data.frame com os
valores do código e nome do município vai se usar o argumento simplify = TRUE, uma
forma de em vez de retornar uma lista retornar os valores do código e nome do município
cada um em uma coluna.
Porém, o objeto retornado será da classe matrix. Assim, deve-se convertê-lo para
data.frame e renomear suas colunas para então juntá-lo com o conjunto de dados original.
O Código @ref(lem:separastring) faz a separação da coluna Município, guarda o resultado
em um objeto chamado dados_temp e renomeia as suas colunas.
Separando uma string em duas partes, criando um novo data.frame e renomeando

suas colunas.
library(stringr)
dados_temp <- data.frame(str_split(dados$Município, " ", 2, simplify = TRUE))
dados_temp <- dados_temp %>% rename("Codigo" = X1,
"Nome" = X2)
Por fim, pode-se juntar as colunas Código e Nome com o data.frame original. A função
bind_cols faz essa tarefa.
dados <- bind_cols(dados_temp, dados)

dados %>% slice_head(n = 5)
## Codigo Nome Município Menor 1 ano

## 1 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oeste NA
## 2 110037 Alto Alegre dos Parecis 110037 Alto Alegre dos Parecis NA
## 3 110040 Alto Paraíso 110040 Alto Paraíso NA
## 4 110034 Alvorada D'Oeste 110034 Alvorada D'Oeste NA
## 5 110002 Ariquemes 110002 Ariquemes NA
## 1 a 4 anos 5 a 9 anos 10 a 14 anos 15 a 19 anos 20 a 29 anos 30 a 39 anos
## 1 NA NA 1 2 4 2
## 2 NA NA NA 1 3 3
## 3 NA NA 2 2 5 NA

## 4 NA NA NA 1 NA 5
## 5 3 NA NA 7 26 20
## 40 a 49 anos 50 a 59 anos 60 a 69 anos 70 a 79 anos 80 anos e mais
## 1 7 1 NA 2 1
## 2 NA 1 1 1 1
## 3 2 3 3 NA NA
## 4 NA 3 1 1 NA
## 5 15 6 10 4 3
## Idade ignorada Total
## 1 NA 20
## 2 NA 11
## 3 NA 17
## 4 NA 11
## 5 NA 94
O próximo passo é transformar o conjunto de dados do formato amplo para longo e empilhar
as colunas relacionadas com as faixas etárias.
dados_long <- dados %>% pivot_longer(names_to = 'faixa_etaria',

values_to = 'contagem',
cols = -c(Codigo, Nome, Município))
dados_long %>% slice_head(n = 5)
## # A tibble: 5 × 5
## Codigo Nome Município faixa_etaria contagem
## <chr> <chr> <chr> <chr> <dbl>
## 1 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… Menor 1 ano NA
## 2 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 1 a 4 anos NA
## 3 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 5 a 9 anos NA
## 4 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 10 a 14 anos 1
Por fim, municípios onde a contagem de mortes por causas externas foi zero estão
registrados como NA. Assim, é interessante substituir os NAs por zero para facilitar a
obtenção de estatísticas descritivas e tabelas de frequência.
dados_long <- dados_long %>%

replace_na(list(contagem = 0))
dados_long %>% slice_head(n = 5)
## # A tibble: 5 × 5
## Codigo Nome Município faixa_etaria contagem

535
## <chr> <chr> <chr> <chr> <dbl>
## 1 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… Menor 1 ano 0
10 Manipulando e resumindo dados

Uma vez que se terá o conjunto de dados organizado pode-se começar a explorá-lo. É
muito importante ter objetivos claros ao se começar a analisar um conjunto de dados.
Suponha-se que o interesse inicial seja obter a soma de mortes por faixa etária. Essa é
uma tarefa de manipulação e resumo de dados, a qual se pode facilmente realizar usando-
se o pacote dplyr.
dados_long %>%
group_by(faixa_etaria) %>%
summarise("Total" = sum(contagem))
## # A tibble: 14 × 2
## faixa_etaria Total
## <chr> <dbl>
## 1 1 a 4 anos 2418
## 2 10 a 14 anos 3098
## 3 15 a 19 anos 23670
## 4 20 a 29 anos 64200
## 5 30 a 39 anos 50374
## 6 40 a 49 anos 37548
## 7 5 a 9 anos 1472
## 8 50 a 59 anos 29294
## 9 60 a 69 anos 22586
## 10 70 a 79 anos 18622
## 11 80 anos e mais 27670
## 12 Idade ignorada 2686
## 13 Menor 1 ano 1962
## 14 Total 285600
A tarefa foi realizada, mas tem alguns aspectos que podem ser melhorados:
1. A ordem das faixas etárias não está na ordem natural. Por exemplo, a faixa
Menor que 1 ano apareceu como antepenúltima.

2. Pode-se querer que as faixas com idade ignorada e total não sejam incluídas na
tabela.
Assim, precisa-se primeiro selecionar quais os níveis da coluna faixa_etária se quer manter
e depois especificar qual a ordem que se deseja que sejam exibidos. Usa-se a função filter
para selecionar quais faixas etárias se quer.
dados_long_faixa <- dados_long %>%
filter(faixa_etaria %in% c("Menor 1 ano", "1 a 4 anos" , "5 a 9 anos",
"10 a 14 anos", "15 a 19 anos" , " 20 a 29 anos" ,
"30 a 39 anos" , "40 a 49 anos", "50 a 59 anos" ,
"60 a 69 anos" , "70 a 79 anos" , "80 anos e mais"))
Nesse ponto verifica-se a classe da coluna faixa_etária.
class(dados_long_faixa$faixa_etaria)
## [1] "character"
Note-se que a classe é character. Assim, é necessário convertê-la para factor e informar
ao R qual é a ordem em que as faixas devem ser apresentadas.
faixa <- c("Menor 1 ano", "1 a 4 anos" , "5 a 9 anos",

"10 a 14 anos", "15 a 19 anos" , " 20 a 29 anos" ,
"30 a 39 anos" , "40 a 49 anos", "50 a 59 anos" ,
"60 a 69 anos" , "70 a 79 anos" , "80 anos e mais")
dados_long_faixa$faixa_etaria <- factor(dados_long_faixa$faixa_etaria,
levels = faixa)
Agora pode-se obter a tabela novamente.

dados_long_faixa %>%
group_by(faixa_etaria) %>%
summarise("Total" = sum(contagem))
## # A tibble: 11 × 2
## faixa_etaria Total
## <fct> <dbl>
## 1 Menor 1 ano 1962
## 2 1 a 4 anos 2418
## 3 5 a 9 anos 1472
## 4 10 a 14 anos 3098
## 5 15 a 19 anos 23670

537
## 6 30 a 39 anos 50374
## 7 40 a 49 anos 37548
## 8 50 a 59 anos 29294
## 9 60 a 69 anos 22586
## 10 70 a 79 anos 18622
## 11 80 anos e mais 27670
Outra forma de se resumirem os dados, a qual pode ser interessante, é por município.
Suponha-se que se quer saber quantas mortes por causas externas ocorreram na cidade
de Curitiba, porém independentemente da faixa etária. Nesse caso, os passos são: primeiro
filtrar apenas os dados de Curitiba e depois somá-los, conforme ilustrado no Código abaixo.
dados_long_faixa %>%
filter(Nome == "Curitiba") %>%
summarize("Total" = sum(contagem))
## # A tibble: 1 × 1
## Total
## <dbl>
## 1 905
Usando-se as operações de filtrar e resumir é possível fazer uma infinidade de análises

similares às apresentadas nesta subseção.
11 Combinando conjuntos de dados
Suponha-se agora que o interesse é obter uma tabela com o número absoluto e a taxa de
mortalidade por causas externas padronizada pela população residente para cada estado.
Nesse caso precisa-se de um conjunto adicional de dados com a população residente em
cada estado. Além disso, é preciso saber a qual estado cada município pertence. O IBGE
dispõe de bases de dados com a população residente por município com a informação
adicional de a qual estado cada município pertence. Um exemplo desse tipo de base de
dados é o arquivo Pop_2019.csv, disponível como material suplementar deste livro.
Recomenda-se ler essa base de dados em R e explorá-la.
pop2019 <- read_delim("Pop_2019.csv")

────────────────────────────────────────────────────────
## Delimiter: ","
## chr (3): UF, COD_MUNI, MUNICIPIO
## dbl (2): COD, POP
##
pop2019 %>%
slice_head(n = 5)
## # A tibble: 5 × 5
## UF COD COD_MUNI MUNICIPIO POP
## <chr> <dbl> <chr> <chr> <dbl>
## 1 RO 11 00015 Alta Floresta D Oeste 22945
## 2 RO 11 00023 Ariquemes 107863
## 3 RO 11 00031 Cabixi 5312
## 4 RO 11 00049 Cacoal 85359
## 5 RO 11 00056 Cerejeiras 16323
Ao se inspecionar o conjunto de dados nota-se que esse está em um formato organizado

com as colunas UF, COD, COD_MUNI, MUNICÍPIO e POP. Precisa-se juntar a base de
dados da população com a das mortes por causas externas, para o que é necessário uma
forma de pareamento, ou seja, um código que informe como se fazer a junção.
Comparando-se a coluna Código do conjunto de dados dados_long_faixa, vê-se que esse
é a combinação das colunas COD e COD_MUNI do conjunto de dados pop2019, porém, o
último dígito da coluna COD_MUNI deve ser ignorado. Será preciso criar uma coluna
Código no conjunto de dados pop2019 para então se poder fazer a junção com o conjunto
de dados dados_long_faixa, utilizando-se a seguinte estratégia: primeiro, juntam-se as
colunas COD e COD_MUNI em única string – usando-se a função str_c – e depois toma-
se apenas os seis primeiros dígitos com a função str_sub. Por fim, cria-se uma nova coluna
chamada Código com o resultado dessas operações.
pop2019 <- pop2019 %>%

mutate("Codigo" = str_sub(str_c(COD, COD_MUNI), 1, 6))
pop2019 %>%
slice_head(n = 5)
## # A tibble: 5 × 6
## UF COD COD_MUNI MUNICIPIO POP Codigo
## <chr> <dbl> <chr> <chr> <dbl> <chr>

539
## 1 RO 11 00015 Alta Floresta D Oeste 22945 110001
## 2 RO 11 00023 Ariquemes 107863 110002
## 3 RO 11 00031 Cabixi 5312 110003
## 4 RO 11 00049 Cacoal 85359 110004
## 5 RO 11 00056 Cerejeiras 16323 110005
Agora faz-se a junção usando-se a função left_join, que foi utilizada por se querer manter
apenas os códigos de municípios que estão no conjunto de dados pop2019. Pode-se
inspecionar a coluna Município do conjunto de dados dados_long_faixa para identificar que
existem alguns códigos para indicar que o município do óbito foi ignorado. Assim, não se
deseja pegar esses casos.
completo <- left_join(pop2019, dados_long_faixa, by = "Codigo")

completo %>%
slice_head(n = 5)
## # A tibble: 5 × 10
## UF COD COD_MUNI MUNICIPIO POP Codigo Nome Município faixa_etaria
## <chr> <dbl> <chr> <chr> <dbl> <chr> <chr> <chr> <fct>
## 1 RO 11 00015 Alta Floresta … 22945 110001 Alta… 110001 A… Menor 1 ano
## 2 RO 11 00015 Alta Floresta … 22945 110001 Alta… 110001 A… 1 a 4 anos
## # … with 1 more variable: contagem <dbl>
Para se atingir o objetivo de se ter uma tabela com as taxas de mortalidade por estado
precisa-se primeiro somar os óbitos por faixa etária dentro de cada município. Após isso
pode-se somar por estado e padronizar pela população.
municipio <- completo %>%
group_by(Codigo) %>%
summarize("Obitos" = sum(contagem),
"Nome" = unique(Nome),
"Populacao" = unique(POP),
"UF" = unique(UF))
Agora que se tem a base com a soma dos óbitos por município pode-se agregar por UF.

UF <- municipio %>%
group_by(UF) %>%
summarize("Obitos" = sum(Obitos),
"Populacao" = sum(Populacao))
UF %>%
slice_head(n = 5)
## # A tibble: 5 × 3
## UF Obitos Populacao
## <chr> <dbl> <dbl>
## 1 AC 426 881935
## 2 AL 1712 3337357
## 3 AM 1962 4144597
## 4 AP 421 845731
## 5 BA 9024 14873064
Finalmente, calcula-se a taxa de mortalidade por cem mil organizada em ordem

decrescente.
UF <- UF %>%
mutate("Taxa" = (Obitos/Populacao)*100000) %>%
arrange(desc(Taxa))
UF %>%
slice_head(n = 5)
## # A tibble: 5 × 4
## UF Obitos Populacao Taxa
## <chr> <dbl> <dbl> <dbl>
## 1 RR 456 605761 75.3
## 2 TO 1062 1572866 67.5
## 3 ES 2625 4018650 65.3
## 4 PE 6017 9557071 63.0
## 5 GO 4349 7018354 62.0
Para se visualizar a tabela completa no RStudio pode-se usar o seguinte código.
View(UF)
Neste capítulo passa-se por todas as principais etapas de uma análise de dados usando o
R e os pacotes do tidyverse. Para o leitor interessado indica-se um link com diversas folhas

541
de cola (cheat sheet) com funções úteis para todas as etapas de análise de dados em que
se usam os pacotes do tidyverse.

Referências
GROLEMUND, G.; WICKHAM, H. R for Data Science. California: O’Reilly Media, 2017.
WICKHAM, H. Tidy Data. Journal of Statistical Software, v. 59, n. 10, p. 1-23, 2014.
Disponível em: https://www.jstatsoft.org/index.php/jss/article/view/v059i10. Acesso em: 29
out. 2022.

543
Capítulo 20
Introdução à visualização de dados

com o R
Marcelo S. Perlin1
1
Universidade Federal do Rio Grande do Sul (UFRGS)
RESUMO:
Este capítulo tem como objetivo apresentar o tema de visualização de dados na plataforma R;
utilizando-se exclusivamente do pacote ggplot2 e seu sistema de camadas. O texto apresenta usos
específicos da ferramenta para dados de saúde pública obtidos junto ao DataSUS. O público-alvo são
analistas de dados de saúde e gestores. Todos os gráficos apresentados no capítulo são reproduzíveis
em seu próprio computador. Os arquivos fonte do texto e código estão disponíveis em https://github.
com/msperlin/chapter-dataviz-saude.gov. A principal mensagem é a de que o R e ggplot2 são ótimas
(e gratuitas) ferramentas que produzem gráficos de qualidade e fáceis de se utilizar. Uma sugestão
de uso do capítulo é buscar rodar o código apresentado e perceber, na prática, como a montagem de
uma figura no R + ggplot2 é acessível a todos
PALAVRAS-CHAVE:
R. Visualização de dados. ggplot2. Gráficos.

1 Introdução
Um dos grandes desafios do pesquisador científico é conseguir comunicar resultados de

forma clara e efetiva. Enquanto um artigo científico possui um público muito específico –
outros professores e pesquisadores – gráficos construídos a partir dos dados podem
sensibilizar e comunicar resultados de forma muito mais abrangente (BÖRNER; BUECKLE;
GINDA 2019; KOHLHAMMER et al., 2012). Na prática, poucos conseguem avaliar o
resultado de um modelo estatístico, enquanto uma representação gráfica de dados bem
elaborada pode ser avaliada pelo público com menor arcabouço técnico (FRANCONERI et
al., 2021).
Assim, a produção de gráficos baseada em dados se torna poderosa aliada do pesquisador

ao informar, de forma simples e direta, informações escondidas a olho nu. Indiscutivelmente
o principal objetivo de qualquer análise de dados é a comunicação. Gráficos e diagramas
facilitam esse processo ao apresentar lógicas espaciais e fáceis de entender porque o
argumento visual é forte e cria um memorável impacto. O trabalho do analista de dados de
saúde é facilitar essa análise para o seu público, criar gráficos instrutivos e que transmitam
uma mensagem direta e intuitiva.
O inquestionável sucesso de sites como Instagram, Twitter e Facebook mostram o extremo

grau de capilaridade digital que uma figura pode apresentar, por mais técnica que seja. Um
gráfico apresentado em um relatório técnico ou trabalho acadêmico pode facilmente se
popularizar, amplificar o alcance da mensagem e promover o autor em sua área de trabalho.
Na recente pandemia de 2020 (COVID 19), o cientista de dados Burn Murdoch criou um
gráfico mundialmente reconhecido e atualmente empregado pelo Financial Times, o qual
mostra a evolução do número de casos confirmados (média de sete dias) entre diversos
países.

545
Gráfico 1 – Evolução de casos de Covid no mundo
Fonte: Burn Murdoch (Financial Times).
A grande sacada do autor foi condensar informações de diferentes fontes na mesma

representação visual, por facilitar para o leitor entender a dinâmica da contaminação da
pandemia ao se observarem as curvas de diferentes países. Sem dúvida, cada elemento
do gráfico foi pensado estrategicamente, desde a formação da escala vertical e posição
dos elementos até as cores utilizadas para cada país. E, mais importante, o gráfico foi
construído na mesma plataforma que se estudará aqui – o R.
Neste capítulo vai se estudar a forma de construção de gráficos no R. Esse não é, de forma
alguma, um conteúdo completo sobre o tema. O objetivo aqui é apresentar um material
prático sobre como criar figuras com o ggplot2. Alguns atalhos serão tomados para
condensar o conteúdo e também não se discutirão usos avançados. Leitores que desejam
aprender mais sobre o pacote, o livro de Hadley é o melhor material disponível
gratuitamente na internet (WICKHAM et al., 2022a)
Em um primeiro passo, o código em si será deixado de lado para focar nos conceitos por
trás de uma figura bem construída e, passo seguinte, para o uso do pacote ggplot2 e sua
filosofia na criação de camadas da figura. Por fim, diversos exemplos de gráficos
construídos a partir dos dados do DataSUS serão apresentados.

Como se deve esperar, este capítulo assume conhecimento do leitor no uso do R e RStudio
para as seguintes operações:
• Instalação do R e RStudio;
• Instalação e carregamento de pacotes do R;
• Criação e execução de funções e scripts no R;
• Entendimento dos diferentes tipos de objetos no R;
• Manipulação de dataframes com pacote dplyr (WICKHAM et al., 2022b),
especificamente o uso das funções glimpse, group_by, count, summarise e o
operador nativo de pipeline (|>).
Todos os gráficos apresentados no capítulo são reproduzíveis em seu próprio computador.
Os arquivos fonte do texto e código estão disponíveis em

https://github.com/msperlin/chapter-dataviz-saude.gov. Para se reproduzirem os gráficos,
basta abrir o arquivo .Rmd no RStudio e compilar para pdf ou .docx.
2 Princípios e componentes
O que torna a figura de Burn Murdoch tão impactante? Qual foi o processo de criação da
figura? Neste capítulo vai se procurar responder a essas questões por meio da discussão
de princípios e componentes visuais de um gráfico de dados e se discutir os elementos
centrais e independentes da plataforma de programação.
Primeiro – e mais importante – é preciso reforçar que a razão da análise de dados é a

comunicação. O trabalho como analista de dados ou pesquisador acadêmico é traduzir
informações retiradas de um banco de dados e sugerir possíveis efeitos no mundo real. Um
relatório técnico – produto do seu trabalho – é nada mais que um parecer sobre um
problema, no qual um especialista apresenta sua opinião imparcial e técnica sobre o que
está sendo discutido, muitas vezes suportado por uma hipótese central que delimita a
pesquisa. Isso também é verdadeiro para um trabalho acadêmico, em que se discute uma
teoria baseada em dados, ou um trabalho profissional, no qual o problema se torna uma
decisão de política pública.
Nesse caso, um sólido parecer técnico terá seu impacto limitado pela capacidade de
comunicação do relatório. Perceba-se que de nada adiantará se realizar um trabalho
fantástico na análise de dados se a parte escrita e gráfica não conseguir transmitir a

547
mensagem de forma coerente e intuitiva. De fato, um dos frequentes erros encontrados na
produção de trabalhos acadêmicos é se focar mais na técnica do que na mensagem.
Mais próximo do tema do livro, gráficos são fortes elementos de comunicação e servem
para convencer o leitor de determinada ideia. Assim, o primeiro princípio da criação de
gráficos é: uma figura deve justificar a sua existência (SCHWABISH, 2014). Deve-se
remover todo o excesso. Um erro muito comum dos iniciantes é tentar criar os mais variados
gráficos sem se perguntar se esses adicionam novas informações à análise. Apenas porque
se pode fazer um gráfico não significa que se deve mostrá-lo ao leitor. O valor de um
conteúdo está diretamente relacionado às novas informações que esse traz para a análise;
é importante ater-se àquelas que ajudam a transmitir sua mensagem. Não se deve hesitar
em cortar elementos gráficos. Sempre que se encontrar uma figura que não seja discutida
em pelo menos dois parágrafos do texto principal, não se deve ter receio de retirá-la do
documento. Se não se conseguir escrever mais do que dois parágrafos sobre uma figura,
provavelmente isso não é importante.
O segundo elemento principal na visualização de dados é manipulação da atenção, isto

é, facilitar e direcionar a análise para o seu público. Importante verificar se os gráficos
produzidos indicam mensagem clara e direta. Destacar nos gráficos o que o público deve
procurar e como lê-lo. Não esperar que todos tenham o mesmo conhecimento técnico.
Entender o que o público espera e qual a motivação para ler o seu conteúdo. Por exemplo,
não apresentar para um grupo de executivos o mesmo material que se apresenta para um
orientador acadêmico. Cada um tem sua própria formação técnica, demandas e
características e avaliará o trabalho de forma diferente. Não é incomum um gráfico ser
elogiado pelo público geral, mas ser rechaçado pelo público técnico. Não se deve
menosprezar essa manipulação de atenção. Por exemplo, os autores de Bazley, Cronqvist
e Mormann (2017) estudaram o efeito do uso da cor vermelha em relatórios de investimento
e reportaram significativas mudanças de expectativa futura e aversão ao risco por parte dos
leitores. Pequenas mudanças, alto impacto.
O terceiro elemento é a independência do elemento gráfico. Todas as informações

técnicas, tais como origem e período de tempo dos dados, devem ser claramente indicadas
no título, subtítulo ou legenda do gráfico. Se o leitor precisar buscar informações sobre a
análise gráfica no próprio texto, existe um espaço para melhoria do conteúdo. Isso pode
ser mais fácil dizer do que fazer, mas pode-se tentar comunicar o máximo de informações

possíveis, desde que não poluam o gráfico. Lembre-se de que existe equilíbrio entre uma
estética elegante e os detalhes técnicos.
Por fim, o quarto elemento é herança e reproducibilidade. A ciência e a análise de dados

evoluem na forma de blocos de construção, um em cima do outro. É importante verificar
sempre os gráficos produzidos em suas referências porque esses guiarão a respeito da
expectativa do público. Da mesma forma, pode-se usar figuras de artigos anteriores para
comparar resultados. Isso é especialmente conveniente quando são usados os mesmos
conjuntos de dados ou similares. Por isso, informar sempre qual a origem dos dados
utilizados no gráfico facilitará que esse seja replicado – por outra pessoa ou por quem o
elaborou.
As diretrizes anteriores, embora resumidas, ajudarão a se criar material de maior impacto.

Ao longo deste e demais capítulos, o máximo possível se tentará acompanhar na criação
de todas as figuras. Agora entendida a teoria, vai-se para a prática com o R. A seguir se
buscará entender como os princípios anteriores se traduzem em elementos visuais em um
gráfico do pacote ggplot2 na plataforma R.
3 Componentes de uma figura

Os componentes de uma figura separam-se entre fixos e dinâmicos. Os fixos são aqueles
que não mudam com a inserção de novos dados; são como o esqueleto do gráfico e dão
suporte a toda a estrutura visual controlada pelos dados em si, tal como pontos e linhas.
Isso inclui textos dos eixos, títulos e subtítulos. Por exemplo, um elemento estático é o título
da figura, o qual não mudará com a entrada de novos dados. Os elementos dinâmicos
são aqueles que mudam de acordo com os dados, tal como a posição de um ponto ou linha.
Essa separação é importante pois o ggplot2 segue essa mesma lógica modular na criação
de figuras.
3.1 Componentes fixos

A figura a seguir apresenta os componentes fixos de um gráfico, incluindo-se títulos,
subtítulos e textos dos eixos horizontal e vertical. Por enquanto não se verá o código
que produz essa figura. Isso ficará para o próximo capítulo pelo simples uso da cor
vermelha em relatórios de investimento.

549
Figura 1 - Esqueleto de um gráfico
Esqueleto de um gráfico
Os componentes estáticos da figura anterior são:

Título da figura
Texto que inicia o gráfico e que provavelmente será o primeiro elemento a ser lido
pelo leitor. Imagine o título como uma simplificação do gráfico em no máximo oito
palavras. Convém usar poucas e informativas palavras, sem detalhes técnicos. Por
exemplo, o título “Evolução da Mortalidade para o RS” é melhor que “Número de
Mortes para o RS com Dados extraídos do SUS-RS entre 2010 e 2018”. Todo
conteúdo técnico extra do título pode ser colocado no subtítulo.
Texto eixo y
Texto explicativo no eixo vertical, definindo uma variável de interesse. Importante
relembrar que um gráfico de dispersão se lê como “variável y é afetada por variável
x”. Portanto, y é a variável que merece maior atenção nas explicações dos demais
componentes, tal como subtítulo.
Texto eixo x
Texto correspondente ao eixo horizontal. Geralmente utiliza-se algo como tempo ou
outra variável de interesse. Em um gráfico de barras, por exemplo, o eixo x pode ser
um tipo de grupo existente nos dados (por exemplo, solteiro/casado).

Subtítulo da figura
O subtítulo é um dos pontos mais importantes sobre um gráfico estático, no qual um
olhar técnico irá focar. O subtítulo pode, por exemplo, oferecer descrições do
tamanho e forma de coleta da amostra de dados. Saiba-se que, como avaliador, o
subtítulo é um ponto muito indicativo da capacidade e conhecimento do criador.
Sugere-se procurar não repetir informações disponíveis em outros locais e se buscar
sempre oferecer o máximo de informações para se entender o gráfico. Um exercício
interessante é imaginar que se apresenta o gráfico para uma sala cheia de outros
pesquisadores e se prever possíveis questões sobre esse. Se uma informação for
fácil de inserir, convém fazê-lo.
Texto inferior (caption)

É o texto que indica informações sobre a origem dos dados brutos ou sobre o autor.
Por exemplo, dados obtidos no Portal Brasileiro de Dados Abertos –
http://www.dados.gov.br/.
A seguir apresenta-se um exemplo mais trabalhado de elementos fixos de um

gráfico, porém ainda sem incluir elementos dinâmicos tais como pontos ou linhas.
Gráfico 2 - Esqueleto melhorado de um gráfico

551
Esqueleto melhorado de um gráfico
Note-se que mesmo sem adicionar os dados em si, o esqueleto revela quais
informações se pode esperar no gráfico: o número de cases de gripe infantil no
estado do RS ao longo dos anos. Como regra de bolso, é conveniente iniciar um
gráfico pela construção do esqueleto, para depois se inserir os dados em si. Isso
produzirá um feeling de qual a mensagem do gráfico e o que o leitor esperará ao ler
o título e subtítulo, antes mesmo de incluir no gráfico os dados em si.
3.2 Componentes dinâmicos

Os componentes dinâmicos são os canais visuais que iremos utilizar para
representar os dados. Estes são dependentes dos dados em si e incluem:
• Linhas;
• Formas (por exemplo, círculos ou triângulo);
• Cores;
• Tamanhos;
• Textos no gráfico.
Os mais comuns e fáceis de lidar são gráficos com linhas e formas. Ao se

adicionarem mais camadas ao gráfico esse fica mais complexo. Na prática, usa-se
a interação entre os canais para se mandar uma mensagem. Por exemplo, se
existem grupos dentro dos dados, pode-se usar um gráfico com tipos de linhas
diferentes (tracejada, sólida etc.) para separar cada grupo. Os melhores e mais
impactantes gráficos são aqueles em que se usa o conhecimento da área para
construir uma intuitiva relação entre os diferentes canais de representação.
Como primeiro exemplo se reconstruirá o gráfico anterior adicionando-se uma

camada dinâmica com linhas no gráfico.

Gráfico 3 - Esqueleto com linhas e pontos

Dados obtidos do Partla Brasileiro de Dados Abertos https://dados.gov.br.
Esqueleto com linhas e pontos
Observe-se que as linhas do gráfico são apenas uma nova camada sobre o
esqueleto formado anteriormente. Caso uma leva de dados seja importada, o
esqueleto se mantém o mesmo, porém as linhas mudarão. O entendimento desse
tipo de dinâmica – uso de camadas para construir o gráfico – é extremamente
importante pois o pacote ggplot2 se utiliza da mesma lógica.
Agora que se tem um gráfico básico com linhas, pode-se utilizar outros canais –
cores e formas – para facilitar a comunicação. Imagine-se que os dados de
mortalidade infantil também estão disponíveis para o estado do Paraná (PR). Para
visualizar os dados, pode-se separar as linhas por cores:

553
Gráfico 4 - Gráfico com diferentes estados

Gráfico para diferentes estados
Nesse caso, a escolha das cores foi automática pelo comando do ggplot2. Uma
possível implementação futura aqui seria se utilizar as cores predominantes da
bandeira de cada estado para representar cada linha. Indo além, se a análise é sobre
a diferença de casos de gripe infantil entre os estados, outro gráfico com as
diferenças mensais seria ainda mais intuitivo. Note-se como se utilizam diferentes
canais visuais para transmitir uma mensagem, moldando o gráfico de acordo com o
objetivo da pesquisa.
4 A escolha dos canais

Escolher a forma de apresentar dados não é tarefa simples. Cada componente é peculiar
e melhor utilizado em determinadas situações. Alguns gráficos fazem mais sentido com
linhas, enquanto outros com pontos ou colunas. O uso de cores no gráfico também é
discutível: enquanto um pouco de cor pode ajudar o leitor, o uso de muitas cores pode
confundi-lo, justamente o contrário do que se procura atingir com uma visualização de
dados. Como regra geral, deve-se procurar utilizar canais que facilitem e simplifiquem o

gráfico, mas que sejam efetivos em transmitir a mensagem (BÖRNER; BUECKLE; GINDA,
2019; FRANCONERI et al., 2021).
Partindo-se do caso mais simples, a primeira decisão para a construção de um gráfico

baseado em dados é sobre qual a forma de transformar uma tabela em imagem. Pode-se
usar linhas, pontos ou barras. As linhas fazem sentido quando os dados adjacentes têm
dependência entre si, tal como o próprio tempo. Por exemplo, imagine-se uma base de
dados de casos acumulados de gripe para determinada região. Um cálculo simples é
verificar a variação percentual entre um período e outro e visualizar os picos de novos
casos. A seguir serão apresentadas diferentes formas de se construir um gráfico para os
mesmos dados.
Gráfico 5 - Uso de pontos, barras e linhas para dados temporais
A primeira, usando-se pontos, é razoável e entendível. A segunda, painel B, é razoável e

entendível, mas semelhante a um código de barras de supermercado. Como esperado, o
terceiro gráfico, painel C, é o que tem a forma mais intuitiva – linhas para variações de
casos de gripe. Possivelmente uma combinação de linhas e pontos seria alternativa
interessante para o problema.
O uso de pontos e formas fazem mais sentido em gráficos nos quais cada ponto pode ser
entendido como independente dos demais. Esse é o caso clássico de gráficos de dispersão,
em que se busca explicar uma variável com base em outra. Por exemplo, considere-se

555
analisar o consumo de um carro em função do seu peso. Aqui, os dados de consumo/peso
para um Toyota Corolla, por exemplo, não têm relação direta com os dados de um Chevrolet
Cruze. Assim, não faz muito sentido ligar os dados com linhas, mas sim usar pontos.
Gráfico 6 - Uso de pontos, barras e linhas com dados independentes
Comparando-se os gráficos anteriores, note-se que barras e linhas resultam em algo sem
muita intuição – painéis B e C são difíceis de entender, enquanto painel A é mais simples
e intuitivo na transmissão da mensagem.
No último caso, gráficos de barras funcionam muito bem quando a variável explicativa é
uma categoria. Por exemplo, considere-se comparar o efeito de diferentes dietas sobre o
peso de uma galinha criada em cativeiro. Os grupos, nesse caso, são as diferentes dietas,
enquanto a variável de interesse é o peso final médio para cada galinha.

Gráfico 7 - Uso de pontos, barras e linhas para rankings
Gráficos de barra também funcionam bem quando se comparam os valores. Observe-se

que no painel B pode-se visualmente verificar as distâncias entre o peso final médio entre
dietas 1, 2, 3 e 4.
O uso de cores em um gráfico serve para direcionar a atenção do leitor para alguma
informação importante. Quando usado com parcimônia, as cores funcionam muito bem e
facilitam o entendimento e mensagem da análise. A cor vermelha, por exemplo, é
relacionada com calor ou perda financeira. Contudo, cuidado com excessos; o uso de
muitas cores pode dificultar a análise.
Além do uso de cores, pode-se também alterar os seguintes canais em um gráfico com
dados:
• formas (shapes): mudança do estilo da linha ou ponto. Exemplo: linhas tracejadas
simples ou duplas, pontos como triângulos ou quadrados;
• tamanho (size): tamanho dos pontos e linhas.
Atenção para o exemplo a seguir, no qual se visualizam os casos de gripes nos estados
Rio Grande do Sul e Paraná com os canais de formato de ponto (shape), tamanho (size) e
cor (color).

557
Gráfico 8 - Múltiplos canais no gráfico

Múltiplos canais no gráfico
Note-se como a adição de diferentes canais de visualização de dados polui a análise.

Ao se incluírem cores, formatos e tamanhos no mesmo gráfico, pode-se acabar
diminuindo o seu impacto pois exigirá maior tempo de análise por parte do leitor. Até
mesmo para um olho treinado, é impossível tirar uma conclusão do gráfico sem
perder no mínimo dez segundos tentando-se entender todos os diferentes
componentes. Aqui, tem-se os mesmos dados (Estado) impactando dois canais
diferentes: cores das linhas e forma do ponto. Certamente pode-se simplificar o
gráfico anterior para evitar redundâncias e facilitar a leitura pelo leitor.
5 Criando figuras com o ggplot2

Agora que se entendeu a diferença entre elementos fixos e dinâmicos de um gráfico
baseado em dados e o papel dos diferentes canais de representação (cor, tamanho,
formato), encaminha-se para a criação das figuras em si na plataforma R e com pacote
ggplot2.

6 Dados de entrada
Um dos pontos fundamentais, e onde muitos erram no início do uso da ferramenta, é o
formato de entrada dos dados no pacote ggplot2. Assim como outros pacotes do tidyverse
(WICKHAM et al., 2019) – conjunto de módulos interligados do RStudio – o ggplot2 espera
que se utilizem tabelas no formato longo.
Tabelas em formato longo são orientadas por linhas – não por colunas – em que cada ponto
de dados é representado por única linha da tabela. Assim, ao se incrementar a base com
novos pontos de dados, aumentam-se apenas as linhas da tabela. O importante aqui é
saber distinguir os formatos. Importante reiterar que o ggplot2 não trabalha com tabelas
no formato largo (ou gordo). A conversão entre uma e outra é sempre possível, porém não
entra no escopo deste capítulo. Para mais detalhes sobre o formato longo/large e
operações de conversão, ver o manual do pacote tidyr (WICKHAM; GIRLICH, 2022).
Para todos os exemplos dos capítulos, serão utilizados dados reais do DataSUS relativos
a mortalidades no estado do Rio de Janeiro entre 2015 e 2019. Os dados foram baixados
com o pacote microdatasus (SALDANHA, 2022) e manipulados para manter apenas a
colunas necessárias para a análise. Veja abaixo a sua descrição:
#> Rows: 689,048
#> Columns: 6
#> $ DTOBITO <date> 2015-06-03, 2015-02-17, 2015-09-13, 2015-06-09, 2015-10-0…
#> $ DTNASC <date> 1921-05-08, 1949-04-21, 1957-04-07, 1926-10-14, 1934-05-3…
#> $ SEXO <chr> "Feminino", "Feminino", "Masculino", "Feminino", "Masculin…
#> $ OCUP <chr> "Dona de Casa", "Auxiliar de escritório, em geral", "Admin…
#> $ munResNome <chr> "Rio de Janeiro", "Rio de Janeiro", "Rio de Janeiro", "Rio…
#> $ idade_obito <dbl> 94.1, 65.9, 58.5, 88.7, 81.4, 104.5, 44.6, 31.0, 91.7, 71.…
Note-se que a tabela retirada do DataSUS contém 689048 linhas, 6 colunas e é do tipo
longa, em que cada caso de mortalidade é representado por uma linha. Temos colunas
para a data de óbito (DTOBITO), gênero (SEXO), ocupação (OCUP) e outras. Para
visualizar esses dados, será necessário realizar algumas agregações temporais com
pacote dplyr (Wickham et al., 2022b). Todos os dados apresentados aqui estão disponíveis
como arquivo .rds no repositório do capítulo no Github.

559
Comando ggplot2
O comando ggplot2 é o inicializador de uma figura, o qual cria um canvas (tela) em

duas dimensões. Observe-se o exemplo a seguir, no qual se criou a primeira camada
de um gráfico:
library(ggplot2)
p <- ggplot()
print(p)
Gráfico 9 - Gráfico vazio do ggplot2
Gráfico vazio do ggplot2
Nada interessante, por enquanto, porém salientam-se algumas informações sobre o

código anterior:
• Carregou-se o módulo do ggplot2 com o comando library(ggplot2);

• Criou-se uma tela vazia com o comando ggplot() e indicou-se o
resultado para uma variável p;
• Mostrou-se o gráfico em si ao chamar print(p).
Esse é o ciclo de criação de gráficos com o ggplot2. Essas etapas serão repetidas
diversas vezes. Vale notar que, por default, o comando print manda a figura para
tela do RStudio, na aba direita inferior. Caso se queira ter mais controle do tamanho

da figura e não poluir a área de trabalho, pode-se usar o comando x11() para criar
uma janela externa e independente da interface principal do RStudio. Cada vez que
x11() é chamada, uma nova janela é criada. Após sua criação, a próxima chamada
para um código de gŕafico irá acomodar a figura na janela. Pode-se, portanto, utilizar
o x11() para criar diversas janelas de figuras.
7 O primeiro gráfico
O primeiro gráfico, então, será uma visualização dos óbitos mensais obtidos no DataSUS
para o estado do Rio de Janeiro. Para tal, será utilizado o pacote dplyr para agregar os
dados mensais e contar o número de óbitos:
library(ggplot2)
library(dplyr)
df_ano_mes <- df_sus |>

group_by(ano_mes = as.Date(format(DTOBITO, "%Y-%m-01")) ) |>
count() |>
ungroup()
glimpse(df_ano_mes)
#> Rows: 60
#> Columns: 2
#> $ ano_mes <date> 2015-01-01, 2015-02-01, 2015-03-01, 2015-04-01, 2015-05-01, 2…
#> $ n <int> 11779, 9623, 10160, 10687, 12616, 11531, 11291, 10684, 10679, …
Com o eixo x na coluna ano_mes e eixo y na coluna n, criou-se o gráfico com o seguinte
comando:
p <- ggplot(data = df_ano_mes,

mapping = aes(x = ano_mes, y = n)) +
geom_line()
print(p)

561
Gráfico 10 - Exemplo de gráfico de linha
No uso da função ggplot, o argumento data é o dataframe com os dados agregados por
ano. O mapeamento das colunas do dataframe para o gráfico em si é realizado via função
aes, a qual define a estética (aesthetics) do gráfico pela indicação das coordenadas x e y.
Em outras palavras, ao se usar o código ggplot(data = df_ano_mes, mapping = aes(x =
ano_mes, y = n)) equivale a dizer para o ggplot: “para os dados em df_ano_mes, use os
dados da coluna ano_mes para o eixo x, e os dados da coluna n para o eixo y”. Observe-
se que por si só essa definição não indica o tipo de gráfico (linha/barra etc.), apenas os
mapeamentos desejados.
Para indicar qual o tipo de gráfico a ser construído, usa-se o operador de soma (“+”) para
adicionar uma camada extra, nesse caso o geom_line(), o qual indica o uso de uma camada
de linha. Caso também se queira uma camada com o ponto em si indicado no gráfico, basta
adicionar geom_point() em outra linha:
geom_line() +
geom_point()
print(p)

Gráfico 11 - Exemplo de gráfico com linhas e pontos
Adicionalmente, insere-se título, subtítulo e texto para eixos com a função labs:
geom_line() +
geom_point() +
labs(title = "Mortes for Mês do Ano",
subtitle = "Dados para o estado do Rio de Janeiro, entre 2015 e 2019",
x = 'Mês do Ano',
y = "Número de Mortes",
caption = "Dados retirados do DataSUS")
print(p)

563
Gráfico 12 - Exemplo de gráfico com título, subtítulo e caption
Note-se que com um pouco de código se consegue chegar a um resultado promissor em

termos de visualização de dados. Como a criação de figuras por meio de camadas é
intuitiva: o usuário vai sequencialmente adicionando novas camadas ao gráfico e
verificando o resultado. Caso uma das camadas não fique visualmente aceitável no gráfico,
basta retirar (ou comentar com #) a linha de código que define a camada.
8 Mapeamento de canais com aes()

Ao se olhar para os resultados do gráfico, um olho mais treinado deve prontamente
observar uma sazonalidade mensal, ou seja, um padrão da série analisada para alguns
meses específicos. O meio do ano especificamente parece apresentar maiores números
de óbitos. Para avaliar esse efeito e apresentar um novo componente do ggplot2, o canal
de tamanho (size), novamente vão se agregar os dados e visualizar o resultado com um
gráfico de linhas e pontos em que o tamanho dos pontos será arbitrariamente definido como
3:
df_por_mes <- df_sus |>
group_by(mes = as.integer(format(DTOBITO, "%m") )) |>
count() |>
ungroup()
p <- ggplot(data = df_por_mes,

mapping = aes(x = mes, y = n)) +
geom_line() +
geom_point(size = 3) +
x = 'Mês do Ano',
caption = "Dados retirados do DataSUS",
size = 'Óbitos')
print(p)
Gráfico 13 – Mortes for mês do ano
Assim, comparando-se com o código anterior, muda-se o comando geom_point() para

geom_point(size = 3). Veja-se que essa é uma simples definição arbitrária do tamanho dos
pontos usando-se o argumento size, isto é, todos pontos do gráfico terão o mesmo
tamanho. Uma modificação mais interessante é mapear os tamanhos dos pontos aos
dados, ou seja, usar as informações de mortalidade para definir os tamanhos dos círculos.
Para isso, primeiro se define uma nova coluna representando a relação da mortalidade em
relação a sua própria média:
df_por_mes <- df_por_mes |>

mutate(perc_media = (n - mean(n))/mean(n)*100)

565
Neste ponto utiliza-se a nova coluna no gráfico e adiciona-se o comando
geom_point(mapping = aes(size = perc_media)) para mapear as novas informações no
tamanho dos pontos.
p <- ggplot(data = df_por_mes,

geom_line() +
geom_point(mapping = aes(size = perc_media)) +
x = 'Mês do Ano',
size = '% Variação de Óbitos\n em Relação a média')
print(p)
Gráfico 14 - Morte por mês do Ano, segunda versão
Adicionalmente, usa-se o argumento size na função labs para modificar o título da legenda.
Reforçando, a função aes() define um mapeamento entre os dados da tabela de entrada e
os canais do gráfico. Enquanto na primeira versão do gráfico definiu-se arbitrariamente o

tamanho dos pontos como 3, aqui foram utilizados os dados da coluna perc_media. O
resultado é claro: quanto menor a mortalidade do mês menor o tamanho do ponto.
A função aes pode ser utilizada em qualquer função de canal, tal como geom_line,
geom_point, geom_col, entre outras. Assim, há total liberdade para se mapear os
elementos gráficos da figura aos dados em si, o que permite enorme flexibilidade.
Quando se olha o resultado do gráfico criado, fica bastante claro que sim, existe
sazonalidade nos dados. Os meses janeiro, dezembro, maio, junho e julho são aqueles
com o maior número de óbitos. Especificamente, a legenda indica que maio possui
aproximadamente 5% mais de mortalidades do que a média de todos os meses, enquanto
fevereiro tem queda aproximada de menos de 10% da média de mortalidades. Note-se
como essa disparidade fica mais óbvia e intuitiva para o leitor quando se utiliza para o
mapeamento do tamanho dos pontos a mortalidade encontrada em cada mês.
9 Uso de temas
Os gráficos apresentados anteriormente possuem uma configuração bastante peculiar:
área sombreada e com grid no interior do gráfico, uso de fonte e tamanho de letras
específicas, entre outras. Essas escolhas fazem parte do tema padrão do pacote. O
ggplot2 possui outros temas pré-compilados tal como configurações do gráfico em preto e
branco, cinzento e tema light.
Para se utilizar um novo tema em um gráfico, basta adicionar a função do tema como uma
nova camada. Todos os temas possuem um nome de função tal como em theme_XXXX.
Exemplos: tema preto e branco: theme bw(), tema cinzento: theme_gray(). Vale salientar
que também é possível construir uma função de tema personalizado, com opções
específicas sobre cores, tamanhos e todos os demais componentes da figura. Assim, é
possível unificar a aplicação do mesmo tema para diferentes gráficos de forma bastante
eficiente. Esse tópico, porém, é mais avançado que a proposta deste capítulo. Para uma
comparação com os demais temas, abaixo apresenta-se uma seleção de temas para um
gráfico simples com base nos dados do SUS.

567
Gráfico 15 - Exemplo de temas do ggplot2
10 Visualizando distribuições
O pacote ggplot2 inclui diversos gráficos típicos de análise de dados como histogramas
(frequência e densidade) e gráficos de distribuição (QQ plots e boxplots). Com esses é
possível analisar as distribuições de variáveis, separados em grupos ou não.
Para se construir um histograma com o ggplot2, basta passar a coluna desejada e adicionar
a camada da função geom_histogram. A seguir um exemplo para o histograma das idades
das pessoas na base de mortalidade do SUS:
p_hist <- ggplot(df_sus, aes(x = idade_obito)) +

geom_histogram() +
labs(title = "Frequência de Mortalidade por Idade",
subtitle = "Dados para o estado do RJ, 2015 - 2019",
x = "Idade",
y = "Frequência",
print(p_hist)
#> `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Gráfico 16 - Frequência de mortalidade por idade
Como esperado, temos maior frequência de mortalidade para idades mais avançadas –
após 80 anos – e também os casos de mortalidade infantil no ano zero. Como curiosidade,
a maior idade encontrada no momento do óbito é 121 anos, para uma pessoa residente de
Angra dos Reis, do sexo masculino e nascida em 01/01/1897.
Enquanto um gráfico de frequência permite visualizar o formato da distribuição de uma

variável em particular, uma necessidade recorrente em pesquisa é verificar as diferenças
de distribuição entre grupos. Uma forma simples de realizar essa análise é calcular e
mostrar as diferentes densidades de distribuição (função geom_density) dos grupos. Para
isso, basta mudar a função construtora de geom_histogram para geom_density, adicionar
o canal color = SEXO, e outras modificações nos textos do gráfico.
p_hist <- ggplot(df_sus, aes(x = idade_obito, color = SEXO)) +

geom_density() +
labs(title = "Densidade de Mortalidade por Idade e Sexo",
x = "Idade",
y = "Densidade",
print(p_hist)

569
Gráfico 17 – Densidade de mortalidade por idade e sexo
O resultado é bastante claro: os homens tendem a viver menos que as mulheres.

Convém notar que o formato da distribuição também é bastante diferente, em que pessoas
do sexo masculino têm um pico de mortalidade perto dos 23 anos. Observe-se também que
as mortalidades infantis não são visualmente diferentes entre os gêneros masculino e
feminino.
Outra maneira de se visualizarem as distribuições entre os grupos é por meio de gráficos

do tipo boxplot. Ao contrário de histogramas de frequência ou densidade, esses mostram
uma visualização da distribuição de variáveis por intermédio dos quartis e medianas. Veja-
se o exemplo a seguir, no qual se apresenta um gráfico boxplot para analisar a diferenca
de distribuições de idade de morte entre os gêneros masculino e feminino.
p_boxplot <- ggplot(data = df_sus,

mapping = aes(x = SEXO, y = idade_obito)) +
geom_boxplot() +
labs(title = "Distribuição de Idade de Mortalidade entre Gêneros",
x = "Sexo",
y = "Idade de Óbito",
print(p_boxplot)

Gráfico 18 – Distribuição de idade de mortalidade entre gêneros
No caso do uso de geom_boxplot, definem-se os eixos x e y como colunas SEXO e

idade_obito. Internamente o ggplot2 separa os grupos de acordo com o eixo x e constrói o
boxplot calculando quartis e mediana para cada grupo. Ressalte-se também que
observações extremas (outliers) são representadas por pontos, enquanto o grosso da
distribuição é representada pela caixa branca que separa as observações entre os quartis.
Por exemplo, para o grupo masculino, 50% das observações situam-se entre as idades 50
e 76 anos aproximadamente.
Para reforçar, o resultado do gráfico é bastante claro: na média, homens tendem a viver
menos que as mulheres. Ao se observarem as diferenças entre as medianas, nota-se que
as mulheres tendem a falecer em idade próxima dos 75 anos, enquanto os homes falecem
aos 62 anos aproximadamente.
11 Utilizando facetas (facets)

Uma das inovações do ggplot2 é o uso de facetas (facets) para se construir gráficos
separados por grupos. Assim, imagine-se que se investiga o padrão de mortalidades entre
os meses do ano para os dados do DataSUS. Da análise anterior, sabe-se que existe
sazonalidade – alguns meses apresentam maior mortalidade que outros. Porém, uma
hipótese interessante é tentar entender se há diferença de tal sazonalidade entre homens

571
e mulheres. Observe-se que a figura é a mesma construída anteriormente, apenas com
separação entre homens e mulheres.
Uma maneira bruta de se resolver o problema é separar os dados manualmente entre

homens e mulheres e construir duas figuras separadas e cuidar sempre para que as escalas
dos eixos sejam idênticas. Porém, a solução do ggplot2 é muito mais elegante: basta indicar
que se quer diferentes facetas do gráfico de acordo com uma coluna do dataframe. Veja a
seguir:
# criar dataframe com numero de mortes por mes e sexo

df_por_mes_sexo <- df_sus |>
group_by(mes = as.integer(format(DTOBITO, "%m")),
SEXO) |>
count() |>
ungroup() |>
mutate(perc_media = (n - mean(n))/mean(n)*100)
p <- ggplot(data = df_por_mes_sexo,

geom_line() +
geom_point(mapping = aes(size = perc_media)) +
x = 'Mês do Ano',
size = '% Variação de Óbitos\n em Relação a média') +
facet_wrap(~SEXO)
print(p)

Gráfico 19 – Mortes for mês do ano
O primeiro passo para construir o gráfico foi calcular as mortalidades por mês e gênero
(coluna SEXO) utilizando-se o pacote dplyr, como também as diferenças percentuais da
média. O código do ggplot2 é exatamente igual ao anterior, exceto pela adição da nova
camada facet_wrap(~SEXO), a qual indica a criação das facetas de acordo com o gênero.
Perceba-se que os nomes dos grupos aparecem no topo de cada faceta, enquanto a
legenda e as escalas dos eixos são compartilhadas, para facilitar posterior análise.
Ao se focalizar o resultado, fica evidente que a dinâmica da sazonalidade anual de

mortalidade entre homens e mulheres é bastante próxima. Para o mês de maio (5), porém,
as mortalidades masculinas são consideravelmente mais elevadas do que as mortalidades
femininas. Não é parte do escopo deste capítulo, mas certamente uma investigação mais
aprofundada poderia explicar tal anormalidade.
12 Salvando figuras em arquivos

Após a criação de figuras, o último passo é a exportação e uso em um relatório. Aqui,
existem dois formatos comumente utilizados: png e jpg. A diferença é o tipo de tecnologia
e compressão para se armazenar a figura. Para o caso de figuras com dados, em que se
usam poucas cores, o formato mais recomendado é o .png. Entretanto, o formato .jpg

573
resulta em arquivos com tamanho menor e, por isso, é muito utilizado em páginas da
internet nas quais o tamanho total pode fazer diferença para a experiência positiva do
usuário com menor tempo de carregamento.
A nomenclatura do arquivo resultante também é passível de análise. Sugere-se como regra

sempre colocar o texto fig no início do arquivo, tal como em fig-MortalidadeSUS_RJ.png,
para facilitar o seu futuro encontro. Quando a figura faz parte de um artigo ou relatório,
incluir também o número dessa no relatório; por exemplo, fig02-MortalidadeSUS_RJ.png.
Adicionalmente, uma boa política é salvar toda a figura em pasta própria do diretório de
trabalho, tal como /figs. Pode parecer excesso de organização, mas quando se lida com
figuras diariamente, em diferentes projetos, um padrão de nomenclatura é muito útil.
No ggplot2, salvamos figura com o comando ggsave():

fig_out <- 'figs/fig02-MortalidadeSUS_RJ.png'
ggsave(filename = fig_out,
plot = p_boxplot)
#> Saving 5 x 4 in image
Assim, o arquivo figs/fig02-MortalidadeSUS_RJ.png estará salvo na pasta de trabalho e

posteriormente poderá ser copiado e colado em um relatório técnico.
13 Conclusão e próximos passos

Este capítulo apresentou uma introdução prática ao uso do ggplot2 para a criação de
figuras. Mostrou-se o sistema de camadas do ggplot2 e a facilidade de se criarem
visualizações impactantes com o uso de poucas linhas de código. Com os dados do
DataSUS, foram criados gráficos de linhas, pontos, uso de geomas e facetas. Vale ressaltar
que se atingiram apenas superficialmente todas as possibilidades que o pacote oferece.
Para os interessados em aprender mais sobre o ggplot2, o livro de Hadley (WICKHAM et
al., 2022a) é ótima fonte.

Referências
BAZLEY, W. J.; CRONQVIST, H.; MORMANN, M. In the red: the effects of color on
investment behavior. Stockholm: School of Economics, 2017. (Swedish House of Finance
Research Paper, 17).
BÖRNER, K.; BUECKLE, A.; GINDA, M. Data visualization literacy: definitions, conceptual
frameworks, exercises, and assessments. Proceedings of the National Academy of
Sciences, v. 116, n. 6, p. 1857-64, 2019.
FRANCONERI, S. L. et al. The science of visual data communication: what works.

Psychological Science in the Public Interest, v. 22, n. 3, p. 110-161, 2021.
KOHLHAMMER, J. et al. Toward visualization in policy modeling. IEEE Computer

Graphics and Applications, v. 32, n. 5, p. 84-89, 2012.
SALDANHA, R. Microdatasus: Download and preprocess DataSUS files. 2022.

Disponível em: https://github.com/rfsaldanha/microdatasus. Acesso em: 27 set. 2022.
SCHWABISH, J. A. An economist’s guide to visualizing data. Journal of Economic

Perspectives, v. 28, n. 1, p. 209-234, 2014. Disponível em:
https://pubs.aeaweb.org/doi/pdf/10.1257/jep.28.1.209. Acesso em: 28 set. 2022.
WICKHAM, H. et al. Welcome to the tidyverse. Journal of Open Source Software, v. 4,

n. 43, p. 1686, 2019. Disponível em: https://doi.org/10.21105/joss.01686. Acesso em: 28
set. 2022.
WICKHAM, H. et al. Ggplot2: create elegant data visualisations using the grammar of
graphics. 2022a. Disponível em: https://CRAN.R-project.org/package=ggplot2.
WICKHAM, H. et al. Dplyr: a grammar of data manipulation. 2022b. Disponível em:

https://CRAN.R-project.org/package=dplyr. Acesso em: 28 set. 2022.
WICKHAM, H.; GIRLICH, M. Tidyr: tidy messy data. 2022. Disponível em:
https://CRAN.R-project.org/package=tidyr. Acesso em: 28 set. 2022.

575
Capítulo 21
Análise de regressão
Gleice Margarete de Souza Conceição1

Maria do Rosário Dias de Oliveira Latorre1
1
Faculdade de Saúde Pública, Universidade de São Paulo
RESUMO:
Este capítulo apresenta os aspectos teóricos e práticos fundamentais em Análise de Regressão Linear
Simples e Múltipla, os quais podem ser utilizados em diversos tipos de estudo epidemiológicos; entre
esses, os de séries temporais, possibilitando a descrição e a quantificação de tendências. Apresenta-se
o processo de modelagem completo de um conjunto de dados reais, intercalando os aspectos teóricos
com os respectivos comandos e saídas do R. O público alvo são analistas de dados e pesquisadores
da área da saúde, com conhecimentos sólidos de epidemiologia e bioestatística básicas.
PALAVRAS-CHAVE:
Regressão linear. Processo de modelagem. Análise de resíduos.

1 Introdução
A estatística fornece várias técnicas para descrever e quantificar associações, avaliar
tendências, fazer previsões, entre outros. Entre tais técnicas, estão os modelos de
regressão linear. A escolha da técnica mais adequada deve ser feita ainda no planejamento
do estudo – antes da coleta de dados – e depende do objetivo da pesquisa, em particular
da pergunta que o pesquisador deseja responder: a "pergunta do estudo". A elaboração
dessa pergunta é uma etapa crucial da pesquisa e requer conhecimento, experiência,
reflexão e criatividade sobre o tema, além de extensa revisão bibliográfica. A “pergunta do
estudo” deve ser FINER, ou seja, deve ser Factível, Interessante, Nova, Ética e Relevante
(HULLEY; CUMMINGS, 1988).
A partir da pergunta será feito o planejamento do estudo, que determinará detalhadamente

como deverá ser conduzida a pesquisa, de forma a responder tal pergunta. O planejamento
deve especificar a unidade de observação (uma planta, uma lâmina, uma pessoa, uma
cidade, etc.), as variáveis que serão medidas, onde, quando e como serão medidas, o
tamanho da amostra, entre outros, bem como a técnica estatística a ser utilizada.
A metodologia estatística auxilia na transformação da “pergunta do estudo” em uma

hipótese estatística, isto é, passível de ser testada utilizando-se métodos estatísticos. É
importante salientar que as hipóteses estatísticas são sempre testadas e não comprovadas
e os resultados, invariavelmente, são apresentados em termos de probabilidade.
Finalmente, é necessário chamar atenção para o fato de que as aplicações bem-sucedidas

das diferentes técnicas estatísticas exigem uma compreensão sólida, tanto dos
fundamentos teóricos subjacentes quanto do problema prático que se deseja estudar. A
evolução tecnológica facilitou o acesso a softwares estatísticos e tornou mais fácil e rápido
o ajuste de modelos. Porém, é essencial percorrer adequadamente todas as etapas do
processo de modelagem, com especial atenção para a avaliação da qualidade do ajuste
dos modelos.
Neste capítulo, apresentaremos os aspectos teóricos e práticos fundamentais inerentes aos

Modelos de Regressão Linear (MLR) simples e múltipla. Para compreendê-los, é
necessário algum conhecimento de estatística e epidemiologia básicas, incluindo noções
de probabilidade e testes de hipóteses.

577
Os MLR são amplamente aplicados na área da saúde e constituem um instrumento
importante de análise de dados em estudos epidemiológicos. Podem ser utilizados em
diversos tipos de estudo e, entre suas principais aplicações, estão a descrição e a
quantificação de associações lineares ou linearizáveis, bem como a análise de tendências
em séries temporais.
Para ilustrar o ajuste dos MRL na área da saúde, apresenta-se um exemplo de aplicação
com dados reais na área da saúde. Trata-se de um estudo transversal realizado em um
hospital público do município de São Paulo, que teve como um dos objetivos identificar os
fatores determinantes da prática de atividade física nos últimos 12 meses. A amostra é
composta por por 150 homens com 50 anos ou mais. Os dados integram a pesquisa
"Atividade física habitual e densidade mineral óssea em homens adultos e idosos"
(FLORINDO, 2000) e estão disponíveis no arquivo “Atividade física.xls”. As variáveis
disponibilizadas no banco de dados são:
• id: número de identificação do indivíduo;
• escore: escore de prática de atividade física nos últimos 12 meses (quanto maior,
maior a prática);
• idade, em anos;
• renda, em reais;
• escol: escolaridade, em anos de estudo (0: até 3, 1: mais de 3).
O processo de modelagem será realizado com o auxílio do software R e da interface

RStudio.
2 O processo de modelagem
Inicialmente, é necessário entender os conceitos de variável resposta e variável(eis)

explicativa(s). A variável resposta (variável de interesse do estudo, muitas vezes chamada
de outcome) é a aquela que acreditamos estar sendo afetada pela(s) outra(s), depender
da(s) outra(s), ser explicada pela(s) outra(s); também é denominada variável dependente
ou variável preditiva. A(s) variável(eis) que afeta(m) ou explica(m) a resposta, mas não
depende(m) da resposta, é/são denominada(s) variável(eis) explicativa(s),
independentes ou preditoras.

Os MRL envolvem, essencialmente, uma variável resposta quantitativa (𝑌𝑌) –
preferencialmente contínua – e uma ou mais variáveis explicativas (𝑋𝑋1 , 𝑋𝑋2 , … , 𝑋𝑋𝑝𝑝 ), as quais
podem ser quantitativas ou qualitativas. Os MLR, em geral, são utilizados para descrever e
avaliar o efeito que um conjunto de variáveis explicativas podem ter em uma resposta,
aproximar esse efeito por uma função matemática, facilitar a descrição e a quantificação de
associações e, eventualmente, podem ser utilizados para se fazer previsões. Entretanto, é
importante ressaltar que não servem para estabelecer causalidade.
Em termos estatísticos, o objetivo do estudo é escrever 𝑌𝑌 como função dos 𝑋𝑋𝑗𝑗 , isto é, 𝑌𝑌 =
𝑓𝑓(𝑋𝑋1 , 𝑋𝑋2 , … , 𝑋𝑋𝑝𝑝 ). No caso de um MRL, a função escolhida será a linear (𝑌𝑌 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋1 +
𝛽𝛽2 𝑋𝑋2 + ⋯ + 𝛽𝛽𝑝𝑝 𝑋𝑋𝑝𝑝 ).
A Figura 1 ilustra as etapas obrigatórias de um processo de modelagem.
Após a organização do banco de dados, o passo inicial da modelagem é a análise

descritiva, que envolve necessariamente a construção de diagramas de dispersão da
variável resposta em função de cada uma das explicativas e o cálculo de coeficientes de
correlação – caso sejam quantitativas. A visualização dos gráficos de dispersão é
fundamental para a compreensão da forma funcional da relação (linear, quadrática etc.)
entre a variável resposta e cada uma das variáveis explicativas. Para variáveis explicativas
qualitativas outras técnicas serão empregadas.
Os histogramas, box-plots e gráfico de quantis ajudam a avaliar qual a distribuição mais

apropriada para a variável resposta. Neste material, serão abordadas apenas as situações
nas quais a variável resposta tem distribuição Normal e a relação entre a variável resposta
e as explicativas quantitativas é linear. Para relações não lineares ou outras distribuições
que não a Normal, a classe de Modelos Linares Generalizados (PAULA, 2013) é ótima
alternativa.
Com o auxílio da análise descritiva, estipula-se o modelo inicial a ser ajustado. O processo
de ajuste deve começar com uma análise univariada, ou seja, com o ajuste de um modelo
de regressão simples para cada variável explicativa. É fundamental avaliar se o modelo se
ajustou bem aos dados, por meio da análise de diagnóstico ou análise de resíduos. Caso o
modelo não esteja bem ajustado, um novo modelo deve ser proposto e o processo volta à
etapa inicial, até que um bom ajuste seja obtido. A partir da análise univariada, faz-se a
seleção das variáveis que comporão o modelo múltiplo. O critério para a seleção e

579
permanência de variáveis no modelo múltiplo deve ser feito com coerência e conhecimento
estatístico e epidemiológico do tema e, sobretudo, deve ser bem especificado na descrição
da metodologia do estudo.
Depois de obtido o modelo final, faz-se nova análise de resíduos e – caso o modelo esteja
bem ajustado – suas estimativas devem ser apresentadas e interpretadas corretamente,
concluindo-se a análise estatística. Caso contrário, deve-se identificar onde está a falta de
ajuste e deve-se propor novo modelo, até que o modelo final esteja bem ajustado.
Figura 1 - Etapas obrigatórias de um processo de modelagem
A seguir, cada etapa do processo será explicada, intercalando-se teoria e prática. Serão
abordados os aspectos teóricos mais importantes e, na sequência, os comandos do R serão
apresentados. As bibliotecas do R serão carregadas à medida que se fizerem necessárias.
Os comandos do R serão apresentados em azul e as saídas de cada comando em
vermelho.

3 Análise descritiva
Antes de avaliar a existência de associações, é importante compreender o comportamento

de cada variável em particular, além de identificar possíveis erros de medição ou de
digitação. Assim, realiza-se uma análise descritiva inicial, por meio de medidas descritivas
e gráficos para cada variável. As medidas e gráficos mais adequados dependem do tipo de
variável em análise, particularmente se essa é qualitativa ou quantitativa. Somente depois
dessa etapa é que se passa a avaliar a existência de associações. Entretanto, neste
material, vai-se assumir que essa etapa já foi cumprida e serão apresentadas apenas as
análises descritivas e inferenciais inerentes aos modelos de regressão.
Para ilustrar o processo de análise descritiva, serão trabalhados os dados do exemplo 1.
Inicialmente, especifique-se o diretório de trabalho: no menu do RStudio, acesse-se a aba

Session → Set Working directory → Choose Directory e define-se o diretório no qual se
deseja trabalhar. Importa-se o banco de dados “Atividade fisica.xls” e nomeia-se como
"dados":
library(readxl)
dados <- read_excel("Atividade fisica.xlsx")
Para se exibir o banco de dados em uma nova aba no RStudio:
View(dados)
Obtendo algumas informações sobre o banco de dados:
names(dados) # Nomes das variáveis

[1] "id" "escore" "idade" "renda" "escol"
dim(dados) # Dimensões do banco de dados (número de linhas e colunas)
[1] 150 5
head(dados) # Primeiras linhas do banco de dados
# A tibble: 6 x 5
id escore idade renda escol
<dbl> <dbl> <dbl> <dbl> <dbl>
1 69 3.62 73 259. 0
2 140 4.38 80 213. 0
3 68 4.62 69 261. 0
4 129 4.5 59 332. 0
5 135 4.75 65 298. 0
6 126 4.75 66 298. 0

581
Para que o R possa reconhecer as variáveis categóricas do banco de dados, essas devem
ser convertidas em fatores.
Criando-se um fator chamado fescol, a partir da variável escol:

dados$fescol <- factor(dados$escol, levels=c(0, 1), labels=c("até 3","mais de 3"))
Obtendo-se algumas estatísticas descritivas das variáveis no banco de dados:
summary(dados) # Resumo das variáveis no banco de dados

id escore idade renda escol fescol
Min. : 1.00 Min. : 3.625 Min. :42.00 Min. :208.9 Min. :0.00 até 3 :78
1st Qu.: 38.25 1st Qu.: 6.000 1st Qu.:55.00 1st Qu.:262.6 1st Qu.:0.00 mais de 3:72
Median : 75.50 Median : 7.000 Median :60.50 Median :291.1 Median :0.00
Mean : 75.50 Mean : 7.032 Mean :61.73 Mean :289.0 Mean :0.48
3rd Qu.:112.75 3rd Qu.: 8.000 3rd Qu.:67.75 3rd Qu.:314.6 3rd Qu.:1.00
Max. :150.00 Max. :11.250 Max. :80.00 Max. :403.7 Max. :1.00
Para se visualizar a relação entre a variável resposta e as variáveis explicativas, será

produzida uma série de gráficos e medidas descritivas. Uma vez que a variável resposta é
sempre quantitativa, as medidas e gráficos mais adequados dependem do tipo de variável
explicativa (qualitativa ou quantitativa) que está sendo analisada.
Para variáveis explicativas quantitativas, serão utilizadas as ferramentas:
• diagrama de dispersão da variável resposta (sempre no eixo y) em função da

variável explicativa (sempre no eixo x);
• coeficiente de correlação linear de Pearson entre a variável resposta e a
explicativa.
•
Para variáveis explicativas qualitativas, serão utilizadas as ferramentas:
• Medidas descritivas numéricas (média, mediana, desvio padrão etc.) da variável

resposta para cada categoria da variável explicativa;
• Box-plots da variável resposta para cada categoria da variável explicativa.
Para fazer gráficos no R, será utilizada a biblioteca ggplot2. Para acessá-la, utilizar o
comando:
library(ggplot2)

Descrevendo a relação entre o escore e as variáveis explicativas quantitativas (idade
e renda)
Diagramas de dispersão
Escore x idade
ggplot(dados, aes(y = escore, x = idade)) +

geom_point() +
geom_smooth(method = lm, se=FALSE) +
labs(y = "Escore de prática de atividade física", x = "Idade (anos)") +
scale_x_continuous(breaks=seq(40, 85, 5)) +
scale_y_continuous(breaks=seq(2, 12, 2)) +
theme(panel.background = element_rect(fill = "grey80"))
Escore x renda
ggplot(dados, aes(y = escore, x = renda)) +

geom_point() +
geom_smooth(method = lm, se=FALSE) +
labs(y = "Escore de prática de atividade física", x = "Renda (reais)") +

583
O diagrama de dispersão do escore em função da idade mostra uma relação inversa entre
as variáveis, isto é, à medida que a idade aumenta, o escore de prática de atividade física
diminui. Embora essa relação não pareça ser muito forte, parece ser linear. Para a renda,
a relação é direta e linear, isto é, à medida que a renda aumenta, o escore de prática de
atividade física aumenta. As linhas em azul são as retas de regressão estimadas a partir
dos modelos para cada variável explicativas.
Coeficiente de correlação linear de Pearson
O coeficiente de correlação linear de Pearson pode ser escrito como
𝑛𝑛
1 (𝑋𝑋𝑖𝑖 − 𝑋𝑋̅) (𝑌𝑌𝑖𝑖 − 𝑌𝑌̅)
𝑟𝑟 = 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐(𝑋𝑋, 𝑌𝑌) = ∑
𝑛𝑛 − 1 𝑆𝑆𝑋𝑋 𝑆𝑆𝑌𝑌
𝑖𝑖=1
Tal coeficiente mede a presença e a força de uma associação linear e assume valores entre
-1 e 1. Valores próximos de 1 ou –1 indicam uma associação forte; valores próximos de
zero indicam ausência de associação. Alguns autores sugerem avaliar a presença de
associação linear a partir do coeficiente de correlação do seguinte modo:
• de 0.10 a 0.39 - fraca
• de 0.40 a 0.69 - moderada
• de 0.70 até 1 - forte.
Entretanto, de fato, não há uma norma rígida sobre isso. Deve-se levar em conta o contexto,
o tamanho da amostra e sempre avaliar a associação observando-se conjuntamente o
coeficiente de correlação e o diagrama de dispersão.
Para se calcular o coeficiente de correlação entre o escore de prática de atividade física e

a idade, utiliza-se o comando corr.test( ) da biblioteca psych. Antes, contudo, será criado um
banco de dados apenas com as variáveis quantitativas.
dados.quant <- subset(dados, select=c(escore, idade, renda))
library(psych)
corr.test(dados.quant, use = "pairwise",method="pearson")
Call:corr.test(x = dados.quant, use = "pairwise", method = "pearson")
Correlation matrix
escore idade renda
escore 1.00 -0.39 0.18
idade -0.39 1.00 -0.20

renda 0.18 -0.20 1.00
Sample Size
[1] 150
Probability values (Entries above the diagonal are adjusted for multiple tests.)
escore idade renda
escore 0.00 0.00 0.03
idade 0.00 0.00 0.03
renda 0.03 0.01 0.00
To see confidence intervals of the correlations, print with the short=FALSE option
Os coeficientes de correlação para cada par de variáveis são apresentados em Correlation

matrix. Para se avaliar se determinado coeficiente é significativo, realiza-se o teste de
hipóteses:
𝐻𝐻0 : 𝜌𝜌 = 0 (não há correlação entre as variáveis)

𝐻𝐻1 : 𝜌𝜌 ≠ 0 (há correlação entre as variáveis)
Os p-valores dos testes são exibidos em Probability values. Tanto o coeficiente quanto o p-
valor do teste somente podem ser interpretados se a relação entre as variáveis for,
concretamente, linear. Assim esses devem ser avaliados conjuntamente com o respectivo
diagrama de dispersão.
Observa-se que o coeficiente de correlação entre o escore e a idade foi -0.39, o que sugere
fraca, porém significativa (p-value < 0.01), relação linear inversa entre as variáveis. O
mesmo ocorre entre o escore e renda, exceto que a relação é direta (r=0.18, p-valor=0.03).
Com isso, seleciona-se as duas variáveis para serem incluídas no modelo múltiplo.
A biblioteca GGally oferece um modo prático de visualizar os diagramas de dispersão em

conjunto com os coeficientes de correlação:
library(GGally)
ggpairs(dados.quant) +

585
Aqui é possível visualizar não somente o comportamento da resposta em função das
explicativas como também as relações entre as variáveis explicativas. O entendimento
dessas relações é fundamental na escolha das variáveis que posteriormente comporão o
modelo múltiplo. Variáveis explicativas correlacionadas entre si podem estar fornecendo,
ao menos em parte, a mesma informação, a exemplo de renda e escolaridade, escolaridade
e idade, etc. Acomodar ambas em um modelo múltiplo poderá causar instabilidade nas
estimativas dos coeficientes e dos seus erros-padrões e, consequentemente, nos p-valores
dos testes de hipóteses.
Na figura nota-se a presença de uma associação linear entre idade e renda. À medida que
a idade aumenta, a renda diminui (r=-0.201). Essa associação não é muito forte, mas é
significativa (p=0.01).

Descrevendo a relação entre o escore e a variável explicativa qualitativa
(escolaridade).
Box-plot
ggplot(dados, aes(y = escore, x = fescol)) +
geom_boxplot() +
labs(x = "Escolaridade (anos de estudo)",
y = "Escore de prática de atividade física") +
Medidas descritivas
tapply(dados$escore, dados$fescol, mean) # média

até 3 mais de 3
6.233974 7.895833
tapply(dados$escore, dados$fescol, median) # mediana
até 3 mais de 3
6.125 7.875
tapply(dados$escore, dados$fescol, var) # variância
até 3 mais de 3
1.140568 1.561620
tapply(dados$escore, dados$fescol, sd) # desvio padrão
até 3 mais de 3
1.067974 1.249648
tapply(dados$escore, dados$fescol, length) # número de observações
até 3 mais de 3
78 72

587
Nota-se – a partir das medidas descritivas e do gráfico – que tanto a média quanto a
mediana do escore são um pouco maiores entre os indivíduos com maior escolaridade,
entretanto, a variabilidade parece semelhante nos dois grupos.
Para avaliar se existe associação entre o escore e a escolaridade, faz-se um teste de

hipóteses, nesse caso, o teste t-Student (TRIOLA, 2017). As hipóteses que se deseja testar
são:
𝐻𝐻0 : 𝜇𝜇𝑎𝑎𝑎𝑎é 3 = 𝜇𝜇𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 3 (A média do escore dos indivíduos nos dois níveis de escolaridade
- até 3 anos e com mais de 3 anos - É a mesma);
𝐻𝐻𝑎𝑎 : 𝜇𝜇𝑎𝑎𝑎𝑎é 3 ≠ 𝜇𝜇𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 3 (A média do escore dos indivíduos nos dois níveis de escolaridade
- até 3 anos e com mais de 3 anos - NÃO É a mesma).
Antes de se fazer o teste para as médias é necessário testar se as variâncias do escore

nos dois níveis de escolaridade são iguais ou não, pois a estatística do teste t-Student é
diferente para cada situação. As hipóteses que se deseja testar são:
2 2
𝐻𝐻0 : 𝜎𝜎𝑎𝑎𝑎𝑎é 3 = 𝜎𝜎𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 3 (A variância do escore dos indivíduos nos dois níveis de
escolaridade - até 3 anos e com mais de 3 anos - É a mesma);
2 2
𝐻𝐻𝑎𝑎 : 𝜎𝜎𝑎𝑎𝑎𝑎é 3 ≠ 𝜎𝜎𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 3 (A variância do escore dos indivíduos nos dois níveis de
escolaridade - até 3 anos e com mais de 3 anos - NÃO É a
mesma).
library(car)
Para se testar se as variâncias são iguais:
leveneTest(dados$escore, dados$fescol)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 1 0.6151 0.4341
148
Como p-valor>0.05 (Pr(>F)), não se rejeita 𝐻𝐻0 e conclui-se que as variâncias são iguais.
Para se testar se as médias são iguais:

t.test(escore ~ fescol, alternativa = "two.sided", var.equal = TRUE, data = dados).
Two Sample t-test
data: escore by fescol
t = -8.776, df = 148, p-value = 3.792e-15
alternative hypothesis: true difference in means between group até 3 and group mais de 3 is not equal to 0

95 percent confidence interval:
-2.036067 -1.287651
sample estimates:
mean in group até 3 mean in group mais de 3
6.233974 7.895833
Note-se que, na sintaxe do comando, é necessário especificar se as variâncias são iguais

ou diferentes. Neste caso, utiliza-se var.equal = TRUE.
Como p-value = 3.792e-15, rejeita-se 𝐻𝐻0 e conclui-se que a média do escore entre indivíduos
com mais de 3 anos de estudo é maior do que a média entre indivíduos com mais de 3 anos
de estudo. Assim, existe uma associação significativa entre o escore e a escolaridade, de
modo que essa variável é selecionada para o modelo múltiplo.
4 O Modelo de Regressão Linear Simples
Vamos apresentar o modelo de regressão linear simples, isto é, com única variável
explicativa, que será utilizada na análise univariada. Esse modelo pode ser escrito como:
𝑌𝑌𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝜀𝜀𝑖𝑖

onde:
𝑌𝑌𝑖𝑖 é o valor da variável resposta para a i-ésima observação;
𝑋𝑋𝑖𝑖 é o valor da variável explicativa para a i-ésima observação;
𝛽𝛽0 e 𝛽𝛽1 são os parâmetros a serem estimados;
𝜀𝜀𝑖𝑖 é um erro aleatório não observável;
𝜀𝜀𝑖𝑖 ~ 𝑁𝑁(0; 𝜎𝜎 2 ) e são independentes entre si;
i = 1, ..., n
Ou de outra forma:
𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 , 𝑌𝑌𝑖𝑖 ~𝑁𝑁(𝜇𝜇𝑖𝑖 ; 𝜎𝜎 2 ), independentes entre si,
onde 𝜇𝜇𝑖𝑖 é o valor médio de 𝑌𝑌𝑖𝑖 , ou seja, 𝜇𝜇𝑖𝑖 é a própria reta.
Esse modelo pode ser visualizado na figura a seguir.

589
Figura 2 – Representação gráfica do modelo de regressão linear simples
260 𝑌𝑌𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 + 𝜀𝜀𝑖𝑖

240
𝜀𝜀𝑖𝑖 ~𝑁𝑁(0, 𝜎𝜎 2 ); independentes
220
200
𝑌𝑌𝑖𝑖
180
160
𝜀𝜀𝑖𝑖 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖
140
120
100
80
15 20 25𝑋𝑋
𝑖𝑖
30 35 40 X 45
A reta 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 – ou simplesmente 𝜇𝜇𝑖𝑖 – corresponde à parte determinística do modelo e é
a mesma para todos os indivíduos. Entretanto, nem todos os pontos caem em cima da reta;
alguns estão acima e outros estão abaixo dessa. A distância entre cada ponto e a reta é
representada por 𝜀𝜀𝑖𝑖 , que corresponde à uma variabilidade aleatória ou erro aleatório, única
para cada indivíduo e que não pode ser explicada. Por exemplo, irmãos gêmeos criados na
mesma casa, com altura, hábitos e dietas semelhantes terão aproximadamente o mesmo
peso, mas não exatamente o mesmo peso. Por algum conjunto de fatores desconhecidos
– os quais não podem ser observados ou medidos – o peso pode variar de um para outro,
ainda que apenas alguns gramas. Essa variabilidade é considerada aleatória e sem
explicação.
Note-se que a expressão 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 corresponde à verdadeira reta de regressão que
rege a relação entre 𝑌𝑌 e 𝑋𝑋 na população, de modo que os coeficientes 𝛽𝛽0 e 𝛽𝛽1 são
desconhecidos e precisam ser estimados a partir do conjunto de dados disponível, isto é,
da amostra. As estimativas dos coeficientes serão chamadas de 𝑏𝑏0 e 𝑏𝑏1 , respectivamente,
e a reta estimada ou ajustada será 𝑌𝑌̂𝑖𝑖 = 𝑏𝑏0 + 𝑏𝑏1 𝑋𝑋𝑖𝑖 . Os coeficientes podem ser estimados
pelo Método dos Mínimos Quadrados ou pelo Método de Máxima Verossimilhança.
As suposições básicas desse modelo são:

• Normalidade – Para cada Xi, os valores de Y seguem uma distribuição Normal. Essa
suposição deve ser verificada por meio de histogramas, box-plots, gráficos de quantis e
do teste de Shapiro-Wilk ou Kolmogorov-Smirnov.

• Homocedasticidade – A variância de Y é a mesma independentemente do valor de X.
Essa suposição deve ser verificada nos diagramas de dispersão – para as variáveis
independentes quantitativas – ou pelo teste de Levene ou Bartlett – para as variáveis
independentes qualitativas.
• Linearidade – Caso o valor médio de 𝑌𝑌𝑖𝑖 (isto é, 𝜇𝜇𝑖𝑖 ) seja uma função de linha reta sobre
os Xi, pode-se estimar o modelo de regressão linear. Essa suposição deve ser avaliada
pelo diagrama de dispersão.
• Independência entre as observações – Os valores de 𝑌𝑌𝑖𝑖 não são correlacionados. Isso

é verdade, por exemplo, quando as observações 𝑌𝑌𝑖𝑖 provém de unidades experimentais
(indivíduos, plantas, folhas de árvores, famílias etc.) diferentes. Observações medidas
na mesma unidade experimental não são independentes. Por exemplos, a pressão
sistólica no braço direito e no esquerdo do mesmo indivíduo, a pressão sistólica em
instantes diferentes no mesmo indivíduo, a quantidade de poluição absorvida pelas
folhas de uma mesma planta etc. A depender das variáveis ou associações em estudo,
pode ser necessário que os indivíduos não partilhem características genéticas, ou seja,
nem mesmo pertençam à mesma família. Essa suposição deve ser garantida pelo
desenho do estudo e – se não o for – dificilmente poderá ser controlada na análise,
podendo invalidar os resultados do estudo.
Após o ajuste do modelo final, essas suposições devem ser checadas novamente, por meio
da análise de resíduos.
5 Checando as suposições do modelo
As suposições do modelo devem ser checadas inicialmente, antes do ajuste de cada

modelo e, novamente, após o ajuste do modelo final.
Normalidade
Para se avaliar se a variável resposta tem distribuição Normal, vamos fazer alguns gráficos
e um teste de Normalidade:

591
Histograma
ggplot(dados, aes(x = escore)) +

geom_histogram(breaks=seq(2,13,1), color="blue", fill="gray50") +
labs(x = "Escore de prática de atividade física", y = "Frequência") +
Nota-se que o histograma apresenta uma forma semelhante à de um sino, uma

característica da distribuição Normal.
Gráfico de quantis ou qq-plot
Esse gráfico é, basicamente, um diagrama de dispersão dos quantis da variável sob

observação contra os quantis da distribuição Normal teórica. Se a variável sob observação
tem distribuição Normal, os pontos no gráfico devem ficar dispostos em torno de uma reta.
library(qqplotr)
ggplot(dados, aes(sample = escore)) +
stat_qq_band(fill="white") +
stat_qq_line() +
stat_qq_point() +
labs(x = "Quantis da Normal", y = "Escore de prática de atividade física") +

Embora haja algum desvio dos pontos em relação à reta, todos os pontos caem dentro das
bandas de confiança, sem apresentar evidências de que a distribuição não seja Normal.
Teste de normalidade de Shapiro Wilk:
𝐻𝐻0 : A distribuição Normal é apropriada aos dados;

𝐻𝐻1 : A distribuição Normal não é apropriada aos dados.
shapiro.test(dados$escore) # Teste de normalidade de Shapiro-Wilk
Shapiro-Wilk normality test
data: dados$escore
W = 0.98905, p-value = 0.2913
Como o p-valor do teste é maior do que 0.05 (p-value = 0.2913), não se rejeita 𝐻𝐻0 e conclui-
se que não há evidências para rejeitar a normalidade dos dados.
Homoscedasticidade
Para se avaliar a suposição de homoscedasticidade, deve-se considerar se a variável

explicativa é quantitativa ou qualitativa.
Se a variável explicativa for quantitativa, a homoscedasticidade poderá ser checada,

inicialmente, por meio dos diagramas de dispersão e, novamente, na análise de resíduos.
Se houver homoscedasticidade, para cada valor de X, as amplitudes dos valores de Y
deverão ser semelhantes. Isso pode ser observado nos diagramas de dispersão do escore
em função da idade e da renda construídos anteriormente.

593
Se a variável explicativa for qualitativa, pode-se checar se a variância da variável resposta
é a mesma nas diferentes categorias da explicativa por meio de testes para igualdade de
variâncias como, por exemplo, o teste de Levene, feito anteriormente, em que se observa
que a suposição de homocedasticidade está satisfeita.
Linearidade
Os diagramas de dispersão exibidos anteriormente (do escore em função da idade e do

escore em função da renda) mostram que a relação entre a variável resposta e as
explicativas é linear.
Exemplos nos quais as suposições do modelo não estão satisfeitas
Em contraposição ao observado anteriormente, o conjunto de gráficos a seguir apresenta

situações nas quais as suposições do modelo não estão satisfeitas.
Nas situações a) e b), a distribuição da variável resposta não é Normal. Em c) e d) a

variância da variável resposta não é constante. Em c) note-se como a amplitude dos valores
de Y diminui à medida que X aumenta. Em d) note-se que a variabilidade de Y é muito
maior na categoria “mais de 3” do que na categoria “até 3”. Em e) e f) a relação entre a
variável resposta e a explicativa não é linear e não pode ser representada por uma reta;
além disso, a variância da variável resposta não é constante.

Figura 3 – Representação gráfica exemplificando situações nas quais as suposições do
modelo de Regressão Linear Simples não estão satisfeitas
a) b)
c) d)

595
e) f)
6 Ajuste de Modelos de Regressão Linear Simples
Inicialmente, vai-se ajustar modelos de regressão linear simples para cada uma das
variáveis explicativas separadamente.
Modelo de regressão linear simples tendo como variável explicativa a idade.
Para ajustar um modelo de regressão linear no R, utiliza-se a função lm, do inglês linear
model.
mod1 <- lm(escore ~ idade, data=dados)
Na fórmula, o símbolo ~ pode ser lido como “depende de”, de modo que se ajusta um
modelo de regressão linear em que “escore” depende de “idade” (lembre-se das definições
de variável dependente e independente). Também é necessário informar em qual banco de
dados o R deve procurar as variáveis especificadas na fórmula. Para isso, utiliza-se o
subcomando data=dados.

Note que a fórmula utilizada corresponde ao modelo 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 , onde 𝜇𝜇𝑖𝑖 é o valor médio
de 𝑌𝑌𝑖𝑖 , 𝑌𝑌𝑖𝑖 é o valor do escore do indivíduo i, e 𝑋𝑋𝑖𝑖 é a idade do indivíduo i. O símbolo <-
especifica que as estimativas do modelo foram guardadas no objeto mod1.
Para se obter as estimativas do modelo mod1, utiliza-se a função summary:

summary(mod1)
Call:
fórmula usada para ajustar o modelo
lm(formula = escore ~ idade, data = dados)
Residuals:
medidas descritivas para os resíduos
Min 1Q Median 3Q Max
(diferenças entre os valores observados e ajustados)
-2.7116 -1.1065 0.0489 0.8379 3.2676
Coefficients:
Estimate Std. Error t value Pr(>|t|) Estimativas para os coeficientes

(Intercept) 11.10428 0.79924 13.894 < 2e-16 *** estimativas para 𝛽𝛽0
idade -0.06598 0.01283 -5.142 8.47e-07 *** estimativas para 𝛽𝛽1
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Nível descritivo dos testes
Residual standard error: 1.316 on 148 degrees of freedom
Multiple R-squared: 0.1516, Adjusted R-squared: 0.1459 𝑅𝑅2 e 𝑅𝑅2 ajustado

F-statistic: 26.44 on 1 and 148 DF, p-value: 8.469e-07 Estimativas da ANOVA
Para se entender as informações apresentadas no summary passo a passo.
Estimativas dos coeficientes
Da coluna Estimate obtém-se 𝑏𝑏0 = 11.10428, 𝑏𝑏1 = −0.06598, de modo que a reta estimada
é 𝑌𝑌̂𝑖𝑖 = 11.10428 − 0.06598𝑋𝑋𝑖𝑖 .
Teste de hipóteses para os coeficientes
Para saber se, de fato, existe uma associação entre X e Y, isto é, se X pode ser usada para
explicar Y, faz-se o teste de hipóteses para o coeficiente 𝛽𝛽1 . As hipóteses são:
𝐻𝐻0 : 𝛽𝛽1 = 0 (Não existe associação entre X e Y);
𝐻𝐻1 : 𝛽𝛽1 ≠ 0 (Existe associação entre X e Y).

597
Note-se que se a inclinação da reta for igual a zero (𝛽𝛽1 = 0), a reta de regressão será
paralela ao eixo X, significando que os valores de Y não variam em função de X, isto é, não
existe associação entre X e Y.
Sob 𝐻𝐻0 , 𝛽𝛽1 = 0, a estatística do teste será

𝑏𝑏1
~𝑡𝑡
𝐸𝐸𝐸𝐸(𝑏𝑏1 ) 𝑛𝑛−2
Das colunas Estimate e Std. Error obtém-se 𝑏𝑏1 e 𝐸𝐸𝐸𝐸(𝑏𝑏1 ):
𝑏𝑏1 −0.06598
= = −5.142, (veja a coluna t value)
𝐸𝐸𝐸𝐸(𝑏𝑏1 ) 0.01283
Da tabela da 𝑡𝑡158 : 𝑃𝑃(𝑡𝑡 ≤ −5.142) < 0.001, (veja a coluna Pr(>|t|)).
Desse modo, rejeita-se 𝐻𝐻0 e conclui-se que há uma associação significativa entre o escore
e a idade. Para se compreender como é essa associação e descrevê-la, deve-se interpretar
os coeficientes ajustados.
Interpretação dos coeficientes
Para se interpretar os coeficientes, retoma-se o modelo proposto, 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 produzir
algumas variações nos valores de 𝑋𝑋𝑖𝑖 e espera-se ver o que acontece com μ𝑖𝑖 .
Para fins de simplicidade, omite-se o índice i.

𝜇𝜇 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋
• Fazendo-se X=0:
𝜇𝜇0 = 𝛽𝛽0 + 𝛽𝛽1 ∗ 0 = 𝛽𝛽0 , ou seja, 𝛽𝛽0 é o valor de 𝜇𝜇 quando 𝑋𝑋 = 0.
• Aumentando-se X de uma unidade:
𝜇𝜇(𝑋𝑋+1) = 𝛽𝛽0 + 𝛽𝛽1 (𝑋𝑋 + 1) = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋 + 𝛽𝛽1 = 𝜇𝜇 + 𝛽𝛽1 , ou seja, 𝛽𝛽1 é o aumento em μ (isto
é, o aumento esperado ou médio em Y) quando se aumenta X de uma unidade.
O modelo ajustado para a idade é 𝑌𝑌̂𝑖𝑖 = 11.10428 − 0.06598𝑋𝑋𝑖𝑖 . Nesse caso, 𝑏𝑏0 não tem
interpretação, uma vez que não se tem no conjunto de dados indivíduos com idade zero.
Mas para 𝑏𝑏1 = −0.06598, pode-se dizer que a cada aumento de um ano na idade, isto é, a
cada ano que passa, espera-se uma redução no escore de prática de atividade física de
0.066 pontos, em média. Analogamente, espera-se uma redução no escore de prática de
atividade física de 0.66 pontos, em média, a cada 10 anos.

Partição da soma de quadrados e tabela de Análise de Variância (ANOVA)
No final do summary, encontra-se um breve resumo do particionamento da variabilidade total:

F-statistic: 26.44 on 1 and 148 DF, p-value: 8.469e-07
Essas informações também podem ser obtidas com o comando anova:
anova(mod1)
Analysis of Variance Table
Response: escore
Df Sum Sq Mean Sq F value Pr(>F)
idade 1 45.794 45.794 26.443 8.469e-07 ***
Residuals 148 256.306 1.732
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Coeficiente de determinação ou explicação do modelo (R 2)
O coeficiente de determinação ou explicação do modelo (𝑅𝑅 2 ) é obtido a partir das somas

de quadrados apresentadas na ANOVA. É um número entre 0 e 1 e mede a proporção da
variabilidade total de Y, explicada pelo modelo adotado.
Multiple R-squared: 0.1516, Adjusted R-squared: 0.1459
No modelo que se ajustou, 𝑅𝑅2 = 0.1516, o que significa que a idade explica cerca de 15%
da variabilidade do escore de prática de atividade física. Na presença de várias variáveis
explicativas é conveniente utilizar o 𝑅𝑅 2 ajustado.
É importante ressaltar que o 𝑅𝑅2 e o 𝑅𝑅 2 ajustado não medem:
• a magnitude da inclinação de uma reta de regressão;

• a linearidade da relação entre Y e X;
• se o modelo está bem ajustado (quem faz isto é a análise de resíduos).
Intervalos de confiança para os coeficientes
Podem ser obtidos com a função confint:

confint(mod1)
2.5 % 97.5 %

599
(Intercept) 9.52487971 12.68367809
idade -0.09133287 -0.04062346
Modelo de regressão linear simples tendo como variável explicativa a renda
mod2 <- lm(escore ~ renda, data=dados)

summary(mod2)
Call:
lm(formula = escore ~ renda, data = dados)
Residuals:
-3.1965 -1.0643 -0.0152 0.9049 4.1638
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.996777 0.944180 5.292 4.28e-07 ***
renda 0.007040 0.003242 2.171 0.0315 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

F-statistic: 4.715 on 1 and 148 DF, p-value: 0.0315
Pelo que se viu anteriormente, pode-se dizer que, segundo esse modelo:
• Há uma relação linear significativa entre o escore e a renda (p-valor = 0.0315).

• Para cada aumento de R$100.00 na renda, espera-se um aumento de 0.704
pontos no escore, em média.
• A renda explica cerca de 3.1% da variabilidade do escore.
Modelo de regressão linear simples tendo como variável explicativa a escolaridade
mod3 <- lm(escore ~ escol, data=dados)

summary(mod3)
Call:
lm(formula = escore ~ escol, data = dados)
Residuals:
-2.8958 -0.7396 -0.1090 0.7568 3.3542

Coefficients:
(Intercept) 6.2340 0.1312 47.517 < 2e-16 ***
escol 1.6619 0.1894 8.776 3.79e-15 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

F-statistic: 77.02 on 1 and 148 DF, p-value: 3.792e-15
Segundo esse modelo,
• Há uma relação significativa entre o escore e a escolaridade (p-valor < 0.001);

• A escolaridade explica cerca de 34% da variabilidade do escore.
Como a escolaridade é uma variável qualitativa, a interpretação do seu coeficiente é um

pouco diferente.
Retome-se o modelo proposto, 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 , considerando-se agora que 𝑋𝑋𝑖𝑖 é a variável
escolaridade e que essa assume apenas dois valores: 0, para indivíduos com até 3 anos
de estudo, e 1, para indivíduos com mais de 3 anos de estudo.
Novamente, para fins de simplicidade, omite-se o índice i.
𝜇𝜇 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋
Então, para indivíduos com indivíduos com até 3 anos de estudo,

𝑋𝑋 = 0 ⟹ 𝜇𝜇até 3 = 𝛽𝛽0 + 𝛽𝛽1 ∗ 0 = 𝛽𝛽0 , ou seja, 𝛽𝛽0 é o valor esperado ou médio do escore para
indivíduos com até 3 anos de estudo.
Para indivíduos com indivíduos com mais 3 anos de estudo,
𝑋𝑋 = 1 ⟹ 𝜇𝜇mais de 3 = 𝛽𝛽0 + 𝛽𝛽1 ∗ 1 = 𝛽𝛽0 + 𝛽𝛽1 = 𝜇𝜇até 3 + 𝛽𝛽1 , ou seja, 𝛽𝛽1 é o aumento esperado
ou médio no escore em indivíduos com maior escolaridade, quando comparados com
indivíduos com menor escolaridade. 𝛽𝛽1 é a diferença na média do escore entre indivíduos
com maior escolaridade e menor escolaridade.

601
O modelo ajustado para a escolaridade é 𝑌𝑌̂𝑖𝑖 = 6.2340 + 1.6619𝑋𝑋𝑖𝑖 . Isso significa que o
escore médio em indivíduos com até três anos de estudo é 6.2340. Além disso, os
indivíduos com mais de três anos de estudo têm, em média, 1.6619 pontos a mais no escore
do que indivíduos com até três anos de estudo.
Esses resultados correspondem ao que se vira anteriormente na análise descritiva:

tapply(dados$escore, dados$fescol, mean)# média
até 3 mais de 3
6.233974 7.895833
Note-se que 7.895833 - 6.233974 é igual a 1.661859.
As estimativas dos modelos de regressão linear simples estão resumidas na tabela a seguir:
Tabela 1 – Estimativas dos modelos de regressão linear

simples para cada uma das variáveis explicativas
Erro padrão
Variável explicativa 𝑏𝑏1 p-valor R2
de 𝑏𝑏1
Idade -0.06598 0.0128 <0.001 0.1516
Renda 0.00704 0.0032 0.0315 0.0309
Escolaridade 1.6619 0.1894 <0.001 0.3423
Cada valor de 𝑏𝑏1 na tabela expressa o efeito individual de uma variável explicativa no
escore, sem levar em consideração as demais variáveis. Para se avaliar o efeito de cada
variável no escore, na presença de outras variáveis, ou seja, controlando para as demais
variáveis, vai-se proceder ao ajuste de um modelo múltiplo.
7 O Modelo de Regressão Linear Múltipla
O Modelo de Regressão Linear Múltipla é uma extensão direta do modelo simples,

adicionando as demais variáveis explicativas e pode ser escrito como:
𝑌𝑌𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋1𝑖𝑖 + 𝛽𝛽2 𝑋𝑋2𝑖𝑖 + ⋯ + 𝛽𝛽p 𝑋𝑋𝑝𝑝𝑝𝑝 + 𝜀𝜀𝑖𝑖

Agora, o modelo tem p variáveis explicativas (𝑋𝑋1 , 𝑋𝑋2 , … , 𝑋𝑋𝑝𝑝 ) e p+1 parâmetros a serem
estimados (𝛽𝛽0 , 𝛽𝛽1 , … 𝛽𝛽𝑝𝑝 ). O valor de 𝛽𝛽j expressa o efeito da variável 𝑋𝑋𝑗𝑗 na reposta,
controlando para as demais variáveis.
A interpretação dos coeficientes é a similar à do modelo simples:

• 𝛽𝛽0 é o valor médio de 𝑌𝑌𝑖𝑖 quando todas as variáveis explicativas forem iguais a zero.
• Se 𝑋𝑋𝑗𝑗 é uma variável quantitativa, 𝛽𝛽j é o aumento esperado ou médio em Y quando
se aumenta 𝑋𝑋𝑗𝑗 de uma unidade, independentemente das outras variáveis que estão
no modelo (pois o modelo está levando em consideração essas variáveis, isto é, está
controlado para essas variáveis).
• Se 𝑋𝑋𝑗𝑗 é uma variável categórica, 𝛽𝛽j é o aumento esperado ou médio em Y na
categoria em questão quando comparado com a categoria de referência,
independentemente das outras variáveis que estão no modelo.
8 Ajuste do Modelo de Regressão Linear Múltipla
No ajuste de um modelo múltiplo, é importante considerar a ordem de entrada das variáveis

explicativas e avaliar o que acontece com cada coeficiente quando uma nova variável é
inserida. Para um grande número de variáveis explicativas, um procedimento stepwise
forward é eficiente e fortemente recomendado (Kleinbaum, 1997). Nesse procedimento,
seleciona-se para o processo de modelagem múltipla todas as variáveis que apresentaram
p-valor menor do que 0.20 na análise univariada. As variáveis são inseridas uma a uma no
modelo múltiplo, de acordo com a sua importância, definida pelo p-valor obtido na análise
univariada, do maior para o menor. A cada nova variável inserida, deve-se decidir pela sua
permanência ou não no modelo. O critério de permanência é baseado no fato de a variável
ser significativa, no efeito que causa no coeficiente das variáveis que estão no modelo, na
sua contribuição para explicar a resposta e, obviamente, no bom senso.
Nos modelos de regressão simples, a variável escolaridade apresentou o menor p-valor,

bem como o maior valor de R2, seguida da variável idade. Então, seguindo-se um
procedimento stepwise forward, vai se começar com um modelo considerando essas duas
variáveis.
mod4 <- lm(escore ~ escol + idade, data=dados)
summary(mod4)
Call:

603
lm(formula = escore ~ escol + idade, data = dados)
Residuals:
-2.5059 -0.6636 -0.1760 0.8129 2.6154
Coefficients:
(Intercept) 9.41289 0.68840 13.674 < 2e-16 ***
escol 1.51614 0.17990 8.428 2.97e-14 ***
idade -0.05037 0.01073 -4.693 6.11e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

F-statistic: 54.99 on 2 and 147 DF, p-value: < 2.2e-16
O summary para o modelo múltiplo é similar ao do modelo simples.
Teste de hipóteses para o modelo
Inicialmente deseja-se saber se, de fato, o modelo proposto fornece alguma explicação
acerca da variabilidade da resposta. Para tanto, testa-se se todos os coeficientes das
variáveis explicativas são simultaneamente iguais a zero ou se existe pelo menos um
coeficiente diferente de zero. Assim, se se tiver p variáveis explicativas, as hipóteses
correspondentes serão:
𝐻𝐻0 : 𝛽𝛽1 = 𝛽𝛽2 = ⋯ 𝛽𝛽p = 0;
𝐻𝐻1 : nem todos os 𝛽𝛽j são iguais a 0.
Sob 𝐻𝐻0 , a estatística do teste tem distribuição 𝐹𝐹(𝑝𝑝; 𝑛𝑛−p−1) .
Na última linha do summary, encontramos o valor da estatística F e o correspondente p-valor:
Como o p-valor é menor do que 0.001, conclui-se que há pelo menos um coeficiente
diferente de zero e que o modelo é útil para explicar a variabilidade da resposta.
Desse modo, tem-se o interesse de avaliar se cada um dos coeficientes, individualmente,

é igual a zero ou não. Para cada coeficiente, faz-se o teste de hipóteses visto anteriormente,
cujas hipóteses são 𝐻𝐻0 : 𝛽𝛽𝑗𝑗 = 0 e 𝐻𝐻1 : 𝛽𝛽j ≠ 0. Similar ao modelo simples, a estatística do teste
para cada coeficiente tem distribuição t, agora com (n-p-1) graus de liberdade.

A coluna Estimate apresenta o valor estimado para o coeficiente de cada variável, as colunas
t value e Pr(>|t|) contêm, respectivamente, o valor da estatística t e o p-valor do teste para
cada variável.
Os p-valores para a escolaridade e para a renda são menores do que 0.001

(respectivamente, 2.97e-14 e 6.11e-06). Assim, rejeita-se 𝐻𝐻0 em ambos os casos e conclui-se
que a escolaridade está significativamente associada com o escore, independentemente
da idade (ou controlando para a idade). Analogamente, a idade está significativamente
associada com o escore, independentemente da escolaridade (ou controlando para a
escolaridade).
O R2 ajustado é 0.428, implicando que as duas variáveis explicam conjuntamente 42.8%

da variabilidade do escore.
É importante se entender o que aconteceu com as estimativas dos coeficientes quando se

passa do modelo simples para o modelo múltiplo, isto é, quais foram as alterações nos
coeficientes na presença de outras variáveis.
O coeficiente da escolaridade não sofreu grandes alterações na presença da idade.

Entretanto, o coeficiente da idade diminuiu consideravelmente. Isso deve ter ocorrido
porque uma parte do efeito da idade já está sendo explicado pela escolaridade. Os efeitos
de ambas as variáveis permanecem significantes e valor de R2 passou de 0.342 (no modelo
apenas com escolaridade) para 0.428 (no modelo com ambas).
Agora, consideremos um modelo com as três variáveis.
mod5 <- lm(escore ~ escol + idade + renda, data=dados)

summary(mod5)
Call:
lm(formula = escore ~ escol + idade + renda, data = dados)
Residuals:
-2.5210 -0.7177 -0.1434 0.8563 2.6445
Coefficients:
(Intercept) 8.653395 1.100699 7.862 7.66e-13 ***
escol 1.502667 0.180672 8.317 5.80e-14 ***

605
idade -0.048575 0.010929 -4.444 1.73e-05 ***
renda 0.002267 0.002563 0.885 0.378
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

A presença da variável renda não causou alterações nos coeficientes ou nos p-valores das
demais variáveis e nem no R2. Entretanto, o efeito de renda, na presença de escolaridade
e idade, não foi significativo (p=0.378). Isso ocorreu porque a informação oferecida pela
renda está contida, em grande parte, naquela oferecida pela escolaridade e pela idade,
tornando desnecessária a presença dessa variável no modelo, ao menos do ponto de vista
estatístico. Porém, do ponto de vista epidemiológico, pode ser importante manter essa
variável no modelo e garantir que as estimativas das demais variáveis estão controladas
para ela. De qualquer forma, é importante esclarecer que o fato de o efeito da renda não
ser significativo não quer dizer que essa não está associada ao escore, mas apenas que,
na presença da escolaridade e da idade, a renda não fornece explicação alguma adicional
sobre a variabilidade do escore. Por motivos de simplicidade, vai se continuar com o modelo
mod4, apenas com a idade e a escolaridade.
Finalmente, é razoável testar se há um efeito interação das variáveis idade e escolaridade.

Note-se que o modelo mod4 estima o efeito idade independentemente da escolaridade (isto
é, controlado para a escolaridade) e vice-versa. Esses efeitos, somados, contribuem para
explicar o escore, contudo, é razoável considerar que a idade e a renda, atuando em
conjunto, podem ter um efeito no escore maior do que simplesmente a soma do efeito das
duas. Para levar isso em conta, vai se testar a presença de interação inserindo no modelo
uma nova variável que é o produto das duas:
mod6 <- lm(escore ~ escol + idade + escol*idade, data=dados)

summary(mod6)
Call:
lm(formula = escore ~ escol + idade + escol * idade, data = dados)
Residuals:
-2.4999 -0.6684 -0.1711 0.8180 2.5997
Coefficients:
(Intercept) 9.296644 0.932275 9.972 < 2e-16 ***
escol 1.763040 1.342132 1.314 0.19104
idade -0.048525 0.014641 -3.314 0.00116 **
escol:idade -0.004011 0.021607 -0.186 0.85298

---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
O efeito de interação não foi significativo (p-valor=0.853) e, além disso, o efeito da

escolaridade deixou de ser significativo, indicando não existir um efeito de interação entre
as duas variáveis. Assim, o modelo mod4 será o modelo final e é necessário se avaliar a
qualidade do ajuste, por meio da análise de resíduos.
É importante ressaltar que, se houvesse um efeito de interação significativo, a interpretação

dos coeficientes não seria a mesma anteriormente. Esse tópico não é simples, para
entendê-lo melhor sobre veja Kleinbaum (1997), por exemplo.
Interpretação dos coeficientes
Supondo-se que o modelo final está bem ajustado (o que se verá se é verdade mais
adiante), vai se interpretar os seus coeficientes.
O modelo estimado é 𝑌𝑌̂𝑖𝑖 = 9.41289 + 1.51614𝑋𝑋1𝑖𝑖 − 0.05037𝑋𝑋2𝑖𝑖 ou, de modo mais simples,
𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
̂ 𝑖𝑖 = 9.41289 + 1.51614𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑖𝑖 − 0.05037𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
Assim, a escolaridade e a idade explicam significativa e independentemente o escore de

atividade física. Indivíduos com mais de três anos de estudo têm, em média, 1.51614 pontos
a mais no escore do que indivíduos com até três anos de estudo, independentemente da
idade; além disso, para cada ano de idade, há diminuição média de 0.05037 no escore,
independentemente da escolaridade. A escolaridade e a idade explicam, conjuntamente,
42.8% da variabilidade do escore de atividade física.
Note-se que:
✓ para indivíduos com até 3 anos de escolaridade, o escore médio ajustado é

̂ 𝑖𝑖 = 9.41289 − 0.05037𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 ;
✓ para indivíduos com mais de 3 anos de escolaridade, o escore médio ajustado é

̂ 𝑖𝑖 = 9.41289 + 1.51614 − 0.05037𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
̂ 𝑖𝑖 = 10.92903 − 0.05037𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 .

607
Ou seja, está-se ajustando duas retas com a mesma inclinação, portanto paralelas, que
somente diferem pelo valor dos interceptos, cuja diferença média é 1.51614.
A figura a seguir ilustra o modelo ajustado.
dados$vajust.mod4 <- fitted(mod4) # inserindo os valores ajustados no banco

# de dados
ggplot(dados) +
aes(y = vajust, x = idade, colour=fescol) +
geom_point(aes(y = escore, x = idade, colour=fescol)) +
geom_line(aes(y = vajust.mod4, x = idade, colour=fescol)) +
labs(y = "Escore", x = "Idade (anos)", colour="Escolaridade \n(anos de estudo)") +
Neste texto, pretende-se oferecer ferramentas básicas em análise de regressão, sem

aprofundamento no conceito de interação entre variáveis. Entretanto, a título de
curiosidade, se o efeito de interação tivesse sido significativo, as retas não seriam paralelas.

9 Análise de resíduos
Uma parte fundamental da modelagem é a análise de diagnóstico ou análise de resíduos

do modelo, a qual revelará se o modelo está ou não bem ajustado. Se não estiver, todas
as inferências feitas anteriormente, envolvendo estimativas para os 𝛽𝛽j e os testes de
hipóteses não serão válidos.
O resíduo é definido como a distância entre o valor de Y observado e o valor de Y ajustado

pelo modelo. Isto é:
𝑒𝑒𝑖𝑖 = 𝑌𝑌𝑖𝑖 − 𝑌𝑌̂𝑖𝑖 𝑖𝑖 = 1, … , 𝑛𝑛
O resíduo 𝑒𝑒𝑖𝑖 pode ser visto como o erro observado, em contrapartida ao erro aleatório 𝜀𝜀𝑖𝑖 ,
que é desconhecido e não observável, ou seja:
𝜀𝜀𝑖𝑖 = 𝑌𝑌𝑖𝑖 − 𝜇𝜇𝑖𝑖 → Distância entre 𝑌𝑌𝑖𝑖 e a verdadeira média (populacional,
desconhecida) e, portanto, desconhecido/
𝑒𝑒𝑖𝑖 = 𝑌𝑌𝑖𝑖 − 𝑌𝑌̂𝑖𝑖 → Distância entre 𝑌𝑌𝑖𝑖 e o seu valor ajustado. É conhecido.
Os resíduos 𝑒𝑒𝑖𝑖 são extremamente úteis para se avaliar se determinado modelo é apropriado
aos dados. Segundo o modelo apresentado, os erros 𝜀𝜀𝑖𝑖 são variáveis aleatórias
independentes e identicamente distribuídas com distribuição 𝑁𝑁(0; 𝜎𝜎 2 ). Se o modelo
ajustado for realmente apropriado para os dados, os resíduos observados 𝑒𝑒𝑖𝑖 devem refletir
as propriedades assumidas para os 𝜀𝜀𝑖𝑖 , ou seja, devem ter distribuição normal com média
igual a zero e variância constante e serem independentes entre si. Além disso, devem ser
pequenos porque quanto menor forem, mais os pontos estarão próximos da reta e mais a
variável explicativa fundamentará a variabilidade da resposta. Em geral, é difícil definir o
que é um valor “pequeno” para o resíduo, de modo que se trabalha com resíduos
padronizados. Como devem ter distribuição Normal, valores maiores do 1.96 ou menores
do que -1.96 são considerados grandes e, se o modelo estiver bem ajustado, espera-se
não mais do que 5% dos pontos nessa condição.
Para se avaliar as características dos resíduos observados e detectar possíveis desvios

das suposições do modelo é necessário examinar uma série de gráficos:
1. Histograma dos resíduos;
2. QQ-plot dos resíduos;
3. Box-plot dos resíduos;

609
4. Diagrama de dispersão dos resíduos em função dos valores ajustados;
5. Diagramas de dispersão dos resíduos em função de cada variável explicativa
e, quando for o caso,
6. Diagrama de dispersão dos resíduos em função do tempo; e
7. Diagramas de dispersão dos resíduos em função da ordem de coleta.
Os resíduos padronizados do modelo final (mod4) serão colocados no banco de dados (se
fez isso antes com os valores ajustados) e se obterão os gráficos.
dados$rpad.mod4 <- rstandard(mod4)
a) Histograma dos resíduos padronizados:
ggplot(dados, aes(x = rpad.mod4)) +

geom_histogram(breaks=seq(-4,4,0.5), color="blue", fill="gray50") +
labs(x = "Resíduo padronizado", y = "Frequência") +
b) QQ-plot dos resíduos padronizados:
ggplot(dados, aes(sample = rpad.mod4)) +

stat_qq_band(fill="white") +
stat_qq_line() +
stat_qq_point() +
labs(x = "Quantis da Normal (0,1)", y = "Resíduo padronizado") +
c) Box-plot dos resíduos padronizados:
ggplot(dados, aes(y = rpad.mod4)) +

geom_boxplot() +
labs(y = "Resíduo padronizado", x=" ") +
d) Diagrama de dispersão dos resíduos padronizados em função dos valores ajustados:
ggplot(dados, aes(y = rpad.mod4, x = vajust.mod4)) +

geom_point() +
geom_hline(yintercept =0, color="red") +
geom_hline(yintercept =c(-1.96, 1.96), linetype=2) +
scale_x_continuous(breaks=seq(4, 10, 0.5)) +
labs(y = "Resíduo padronizado", x = "Valor ajustado") +

e) Diagrama de dispersão dos resíduos padronizados em função das variáveis explicativas:
ggplot(dados, aes(y = rpad.mod4, x = idade, colour=fescol)) +

geom_point() +
geom_hline(yintercept =0, color="red") +
geom_hline(yintercept =c(-1.96, 1.96), linetype=2) +
labs(y = "Resíduo padronizado", x = "Idade (anos)", colour="Escolaridade \n(anos de estudo)") +

611
a) b)
c) d)

e)
Em a), b) e c) não há evidências de que a distribuição dos resíduos não seja Normal.
Em d) observa-se que os resíduos estão dispersos aleatoriamente em torno de zero, sem

apresentar nenhum tipo de padrão. Além disso, há poucos outliers (valores maiores do que
1.96 ou menores do que -1.96, característica da distribuição Normal). Além disso, a
amplitude dos valores do resíduo não apresenta grandes mudanças ao longo dos valores
ajustados, de modo que a suposição de homoscedasticidade está satisfeita.
Em e) os resíduos estão dispersos aleatoriamente em torno de zero, sem apresentar

nenhum tipo de padrão, com poucos outliers. A amplitude dos valores do resíduo não
apresenta grandes mudanças ao longo da idade.
Este texto apresentou os principais fundamentos em análise de regressão. Entretanto, uma

série de outros fatores devem ser levados em conta no ajuste desse tipo de modelo. Entre
esses estão a presença de multicolinearidade entre as variáveis explicativas, a existência
de observações discrepantes (outliers) na variável resposta ou na explicativa, a falha em
modelar adequadamente as interações entre as variáveis explicativas, a existência de
padrões na variável resposta (sazonalidade, por exemplo) ou na explicativa g etc. Tais
tópicos são extremamente relevantes e complementam o que foi apresentado aqui de modo
que, após a familiarização com os conceitos básicos, é importante que sejam explorados.

613
1 Introdução
A estatística fornece várias técnicas para descrever e quantificar associações, avaliar
tendências, fazer previsões, entre outros. Entre tais técnicas, estão os modelos de
regressão linear. A escolha da técnica mais adequada deve ser feita ainda no planejamento
do estudo – antes da coleta de dados – e depende do objetivo da pesquisa, em particular
da pergunta que o pesquisador deseja responder: a "pergunta do estudo". A elaboração
dessa pergunta é uma etapa crucial da pesquisa e requer conhecimento, experiência,
reflexão e criatividade sobre o tema, além de extensa revisão bibliográfica. A “pergunta do
estudo” deve ser FINER, ou seja, deve ser Factível, Interessante, Nova, Ética e Relevante
(HULLEY; CUMMINGS, 1988).
A partir da pergunta será feito o planejamento do estudo, que determinará detalhadamente

como deverá ser conduzida a pesquisa, de forma a responder tal pergunta. O planejamento
deve especificar a unidade de observação (uma planta, uma lâmina, uma pessoa, uma
cidade, etc.), as variáveis que serão medidas, onde, quando e como serão medidas, o
tamanho da amostra, entre outros, bem como a técnica estatística a ser utilizada.
A metodologia estatística auxilia na transformação da “pergunta do estudo” em uma

hipótese estatística, isto é, passível de ser testada utilizando-se métodos estatísticos. É
importante salientar que as hipóteses estatísticas são sempre testadas e não comprovadas
e os resultados, invariavelmente, são apresentados em termos de probabilidade.
Finalmente, é necessário chamar atenção para o fato de que as aplicações bem-sucedidas

das diferentes técnicas estatísticas exigem uma compreensão sólida, tanto dos
fundamentos teóricos subjacentes quanto do problema prático que se deseja estudar. A
evolução tecnológica facilitou o acesso a softwares estatísticos e tornou mais fácil e rápido
o ajuste de modelos. Porém, é essencial percorrer adequadamente todas as etapas do
processo de modelagem, com especial atenção para a avaliação da qualidade do ajuste
dos modelos.
Neste capítulo, apresentaremos os aspectos teóricos e práticos fundamentais inerentes aos

Modelos de Regressão Linear (MLR) simples e múltipla. Para compreendê-los, é
necessário algum conhecimento de estatística e epidemiologia básicas, incluindo noções
de probabilidade e testes de hipóteses.

Capítulo 22
Machine learning em políticas

públicas de saúde
Alexandre Chiavegatto Filho1
1
Faculdade de Saúde Pública, Universidade de São Paulo
RESUMO:
O aumento da disponibilidade de dados e os avanços na capacidade computacional têm permitido o
uso de modelos mais complexos que conseguem modelar de forma mais fidedigna a real complexidade
das interações entre os fatores que levam aos desfechos graves de saúde. As aplicações desses
algoritmos de machine learning terão impacto não apenas na prática clínica direta, mas também
na gestão do sistema de saúde e no desenvolvimento de políticas públicas. Este capítulo apresenta
os usos e principais desafios que precisam ser superados para que esses algoritmos consigam ter
impacto real na saúde.
PALAVRAS-CHAVE:
Inteligência artificial. Machine learning. Algoritmos preditivos.

615
1 Introdução
A ciência em saúde tem sido historicamente dominada pela área hoje conhecida como
análise de inferência, em geral caracterizada pela busca da existência de uma associação
estatisticamente significativa entre dois ou mais fatores (JAMES et al., 2014). Por exemplo,
uma das descobertas científicas mais impactantes no século passado foi sobre a
associação entre fumar e câncer de pulmão (DOLL; HILL, 1956), um dos principais motivos
de a prevalência do tabagismo em adultos ter caído rapidamente nas últimas décadas e ser
diretamente responsável por milhões de vidas salvas (SREERAMAREDDY; AYE, 2021).
O impacto dos estudos de inferência é inegável e continuará a dominar parte da ciência

pelas próximas décadas. Entretanto, com a chegada do big data e da melhoria da
capacidade computacional nos últimos anos, a área de machine learning (ML) tem crescido
em importância, inúmeras aplicações práticas existem no nosso dia-a-dia e são cada vez
mais frequentes na área da saúde (LISTL; CHIAVEGATTO FILHO, 2020).
A área de machine learning pode ser definida como a capacidade de máquinas aprenderem
a estabelecer regras complexas a partir de dados. Inserida no grupo maior de inteligência
artificial, na qual existe também a possibilidade de máquinas tomarem decisões inteligentes
a partir de regras estabelecidas por humanos, em que nesse caso não há um aprendizado
direto por parte das máquinas, uma área hoje conhecida como “boa e velha inteligência
artificial” (good old-fashioned AI).
Na sua maioria, estudos de machine learning envolvem a realização de uma predição, o

que torna a área tecnicamente oposta à da inferência. Por exemplo, se pensarmos em
termos de uma função:
𝑌𝑌 = 𝑓𝑓(𝑋𝑋)
Estudos de inferência estão preocupados em analisar a relação particular entre cada

variável X e o desfecho Y. Uma solução muito comum para analisar essa associação é
estimar uma equação de regressão linear, em que a relação entre cada variável X e o
desfecho Y é em geral representada por meio de um coeficiente multiplicador (β).
Para estudos preditivos de machine learning, essa relação particular entre os diversos
fatores pouco ou nada importa, pois o objetivo é estimar Y a partir da melhor função possível
das variáveis X, mesmo que isso envolva múltiplas interações e que torne a relação
particular de cada X com o desfecho Y inconclusiva na análise visual direta.

Essa possibilidade de desenvolver uma função não interpretável, entretanto, explicável –
na maioria dos casos, como se mostrará adiante – é o que torna ML tão eficaz para o
desenvolvimento de regras para a tomada de decisão, principalmente em áreas complexas
como a da saúde.
O fato de machine learning não precisar fornecer uma justificativa simplista e, portanto,
frequentemente errada, para uma decisão inteligente e complexa é o que permite o ajuste
da função que mais se aproxima da verdadeira interação entre fatores que leva ao desfecho
a ser predito. Essa liberdade é particularmente importante para a área da saúde, na qual
há muito tempo se sabe que os problemas mais graves não acontecem devido a único fator
plenamente isolado dos outros, mas sim devido à interação complexa entre os diversos
componentes demográficos, genéticos, ambientais, socioeconômicos, entre outros.
O presente capítulo será dividido da seguinte forma. Em primeiro lugar, serão apresentados
alguns dos potenciais usos de ML no desenvolvimento de políticas públicas, depois serão
apresentados alguns dos principais desafios técnicos da área, seguidos do estado da arte
atual da área de machine learning para dados estruturados e, por fim, serão apresentadas
algumas das principais limitações da área.
2 Possíveis uso de algoritmos preditivos em políticas públicas de saúde
A abrangência e a liberdade do uso de machine learning para auxiliar na tomada de decisão

torna possível o seu uso prático em todos os momentos da atenção à saúde, do nível micro
ao macro (NGIAM; KHOR, 2019). Na atenção direta pode servir de auxílio à tomada de
decisão por parte de profissionais de saúde. Na gestão do sistema pode auxiliar na
alocação de recursos físicos e humanos por parte dos serviços de saúde. Por fim, em
políticas públicas pode auxiliar no desenvolvimento de ações direcionadas para indivíduos
com o seu maior potencial de impacto. Essas três áreas serão exemplificadas mais
detalhadamente na sequência.
2.1 Machine learning na atenção direta à saúde dos pacientes
A área da saúde é complexa e multifatorial. Conseguir identificar todas as nuances

da interação dos fatores que levam a problemas graves de saúde é uma tarefa quase
impossível, principalmente considerando-se a quantidade de doenças existentes
(dezenas de milhares, segundo a Classificação Internacional de Doenças)

617
(ALMEIDA et al., 2020). Se compreender esses fatores é difícil para as doenças mais
prevalentes na população, torna-se uma tarefa quase impossível entre as doenças
raras.
Algoritmos de ML, por outro lado, conseguem aprender com exemplos de milhões
de pacientes a identificar as doenças e o risco de prognóstico negativo desses
pacientes. Além disso, não existe o risco de terem esquecimentos – com o tempo as
suas regras de decisão podem melhorar, um conjunto de regras conhecido como
aprendizado on-line ou contínuo (LEE; LEE, 2020).
Muitos artigos científicos têm sido publicados nos últimos anos, nos quais algoritmos
de ML são utilizados para auxiliar profissionais de saúde no diagnóstico de doenças
e na predição do prognóstico dos pacientes. Um estudo recente encontrou que
algoritmos de ML conseguem identificar o risco de o paciente ter doença de
Parkinson analisando sua respiração noturna (YANG et al., 2022). Outro demonstrou
– mesmo com poucos dados – que algoritmos de machine learning conseguem
aprender a detectar distúrbios da cabeça como tumores e fraturas no crânio (GUO
et al., 2022).
Após esse momento inicial de identificação da capacidade de algoritmos de ML para

tomarem decisões inteligentes em saúde, uma nova área em crescimento é a
realização de estudos clínicos randomizados para descobrir se o uso desses
algoritmos tem efeito na prática clínica a ponto de melhorar o prognóstico dos
pacientes (YIN et al., 2021). A ideia aqui é realizar algo parecido ao que se faz com
medicamentos e vacinas, em que é realizado o sorteio de alguns médicos para terem
acesso às decisões desses algoritmos e, assim, comparar os prognósticos desses
pacientes com aqueles cujos médicos não tiveram essa informação. Com isso, torna-
se possível identificar o efeito causal1 dos algoritmos na melhoria direta da atenção
aos pacientes.
Alguns poucos estudos clínicos randomizados que avaliam o efeito de algoritmos de

ML na prática clínica têm sido publicados nos últimos anos. Entretanto, seu baixo
número e por vezes a falta de rigor na condução das análises ainda tornam esses
resultados incipientes e inconclusivos (ZHOU et al., 2021).
1
Para melhor compreensão sobre RCT (Randomized Controlled Trials) e causalidade, ver o Capítulo 10
“Randomized Controlled Trials”: os experimentos aleatórios em Políticas Públicas.

2.2 Machine learning na gestão de recursos em saúde
Poucas são as áreas que coletam mais dados do que a saúde. Do momento em que
o paciente chega a um serviço de saúde ao momento em que recebe alta, um grande
número de variáveis é coletado, desde informações demográficas, histórico familiar
de doenças, medicamentos em uso, sintomas e sinais vitais, até os próprios
resultados dos exames e procedimentos que são realizados no paciente.
Recursos de saúde são escassos em todos os países do mundo; à medida que tem
ocorrido o rápido envelhecimento populacional pelo qual passam todas as regiões,
aumenta a pressão para tornar os gastos em saúde cada vez mais eficientes.
Desses, um dos principais é a realização desnecessária de alguns exames, os quais
na maioria dos casos são solicitados com as melhores intenções, mas que têm como
consequência diferentes níveis de desconfortos para os pacientes, além do próprio
desperdício de recursos.
Nesse sentido, ML pode ser utilizado para auxiliar profissionais de saúde a

identificarem o risco de o paciente ter a doença que um exame específico pretende
ajudar a diagnosticar. Isso é algo que médicos fazem naturalmente, pois os exames
solicitados são sempre aqueles que se desconfia que irão identificar a possível
doença do paciente. Com machine learning, os médicos poderão solicitar aos
algoritmos um escore de risco para as doenças específicas que esses exames se
propõem a identificar, permitindo diminuir a realização de exames desnecessários.
A alocação eficiente dos profissionais de saúde é também um grande desafio para

gestores de saúde, o que faz com que ao longo de uma semana a unidade passe ao
mesmo tempo por momentos de escassez e de excesso de profissionais. O uso de
algoritmos de ML pode auxiliar a identificar a necessidade futura de profissionais de
saúde e analisar, por exemplo, o horário/dia da semana e as características dos
pacientes que estão sendo admitidos no hospital nesse momento para predizer a
necessidade de médicos intensivistas no dia seguinte.
2.3 Machine learning para o desenvolvimento de políticas públicas
Toda política pública precisa ser focalizada. Não é possível desenvolver uma política
pública viável para toda a população de um país, pois isso levaria a enormes
desperdícios. Por exemplo, ao desenvolver uma política pública para diminuir o risco

619
de óbito infantil por meio de um acompanhamento por parte de um profissional de
saúde, é importante que sejam identificados os bebês com alto risco de óbito no
primeiro ano de vida para alocar de forma eficiente esses profissionais. Se houver
disponibilidade de dados, a identificação do risco de cada bebê ir a óbito pode ser
facilmente realizada com ML.
Um estudo recente do grupo de pesquisa do qual faço parte desenvolveu algoritmos

de machine learning para predizer a mortalidade neonatal em São Paulo e encontrou
que os algoritmos tiveram alta performance para predizer óbitos neonatais no ano
seguinte ao seu treinamento (BATISTA et al., 2021). Ainda mais importante foi o
resultado de que entre os 5% com maior risco – segundo os algoritmos – estavam
mais de 90% dos bebês que de fato iriam a óbito. Ou seja, uma política pública que
focasse em apenas 5% dos indicados pelos algoritmos conseguiria atuar em quase
todos os óbitos neonatais que de fato aconteceriam.
3 Desafios técnicos da aplicação de machine learning em saúde
Ao contrário do que o nome da área possa indicar, boa parte do trabalho do

desenvolvimento de um algoritmo não é da máquina, mas sim do especialista responsável
pela análise. É muito fácil desenvolver qualquer regra de decisão a partir de dados e a isso
chamar de machine learning, mesmo que as decisões tomadas por esse algoritmo sejam
sempre as piores possíveis.
O desenvolvimento de algoritmos de ML com boa performance preditiva necessita de

profissionais com ampla experiência em estatística e em programação, dupla habilidade –
essa cada vez menos disponível no mercado devido à alta demanda por esses
profissionais.
Garantir a boa performance de um algoritmo de ML não é uma tarefa fácil e começa no

ajuste no banco de dados que será utilizado para o treinamento. É importante, em primeiro
lugar, que a coleta de dados dos pacientes tenha sido feita de forma adequada e que os
erros tenham sido minimizados. Algoritmos não conseguem corrigir naturalmente erros
graves de coleta e, caso ocorram, os resultados preditivos dos algoritmos serão
necessariamente ruins. Como se costuma dizer em ciência de dados, “se entra lixo, sai lixo”
(KILKENNY; ROBINSON, 2018).

Existe grande número de técnicas de pré-processamento que precisam ser realizadas no
banco de dados antes do início do treinamento do algoritmo. No caso de dados
estruturados2 (a maior parte dos dados coletados no sistema de saúde), esses podem
incluir a padronização de variáveis contínuas, imputação de missing, one-hot encoding,
rebalanceamento e a identificação da presença de vazamento de informação (BATISTA;
CHIAVEGATTO FILHO, 2019).
Outro desafio técnico importante é definir como se fará a testagem do uso desse algoritmo
no mundo real, para que se obtenha o resultado de uma métrica que melhor indique a sua
performance preditiva na prática. A estratégia mais comum é dividir o banco de dados em
duas partes por meio de um sorteio. Uma parte dos dados é assim utilizada pelo algoritmo
para ajustar os seus parâmetros (suas regras de decisão). Esse conjunto de dados é
conhecido como “treino” e frequentemente é composto por 70% dos dados originais. Após
a definição do melhor modelo final, esse é aplicado ao conjunto de dados restante
(conhecido como “teste”) para que as predições sejam feitas em uma simulação de dados
futuros reais. Em estudos de machine learning são sempre reportadas as métricas de
performance nesses dados de teste que não foram utilizados no processo anterior de
aprendizado do algoritmo.
Por fim, é necessário estabelecer qual será a métrica utilizada para avaliar a qualidade
preditiva desse algoritmo. Uma solução simples seria analisar a proporção de acertos do
algoritmo, uma métrica conhecida como acurácia. O problema dessa métrica é que a
grande maioria dos desafios da área da saúde é predizer um evento relativamente raro e
até mesmo os eventos de saúde mais comuns são raros. Por exemplo, segundo os dados
oficiais do DataSUS, em 2020 a principal causa de óbito no Brasil foi câncer, mas apenas
0,1% dos brasileiros morreram de câncer em 2020 (224.829 óbitos por câncer em 214
milhões de residentes).
Ter uma boa acurácia para eventos raros é fácil – é só predizer que nenhum desses eventos
vai acontecer. No exemplo anterior, um algoritmo que predissesse que nenhum brasileiro
morreria por câncer em 2020 teria uma acurácia de 99,9%, porém seria uma predição inútil
pois não teria acertado único caso de interesse, que é a mortalidade por câncer.
2
Ver os capítulos 16 (Segurança no uso dos dados sensíveis para pesquisa em saúde) e 18 (Modelagem e
gestão de Banco de Dados com SQL e integração com o R) para o entendimento da diferença entre dados
estruturados, semiestruturados e não-estruturados.

621
Uma solução para esse problema é analisar o quanto o algoritmo acerta dos casos positivos
e dos negativos separadamente, o que pode ser feito por meio do cálculo da sensibilidade
e da especificidade da predição. A sensibilidade é calculada da seguinte forma:
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 =
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 + 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
Essa métrica permite identificar qual a proporção dos casos positivos que o algoritmo
conseguiu identificar como sendo de fato positivos. A especificidade é calculada como:
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 =
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 + 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
A especificidade, de forma análoga à sensibilidade, permite identificar qual proporção dos

casos negativos o algoritmo conseguiu identificar como sendo concretamente negativos.
Ao se analisar tanto a sensibilidade quanto a especificidade é possível obter um

balanceamento da importância de identificar os valores positivos e os negativos e, assim,
como mencionado no exemplo anterior, evitar que o algoritmo acerte apenas uma das duas
categorias.
O desafio do uso de duas métricas para analisar a performance preditiva dos algoritmos é
ser difícil selecionar o melhor algoritmo quando os valores das métricas não são uniformes,
pois um algoritmo pode ter melhores resultados de sensibilidade e outro de especificidade.
Uma solução para esse problema é utilizar a métrica que junte os resultados da
sensibilidade e especificidade em um só valor final; a mais comum delas é a área abaixo
da curva ROC.
A área abaixo da curva ROC é de certa forma um resumo dos resultados da sensibilidade
e da especificidade (mais tecnicamente, 1 - especificidade) à medida que se muda o
threshold do que é considerado um caso positivo. O threshold mais comum para identificar
casos positivos é 50%, mas outros pontos de corte são possíveis. Ao se analisarem todos
os possíveis pontos de cortes e seus resultados de sensibilidade e 1- especificidade é
possível criar a curva ROC, como demonstrado abaixo.

Figura 1 - Exemplo de uma área abaixo da curva ROC
Fonte: Freire (2022).
No exemplo acima, apresenta-se a curva ROC de um estudo que analisou a probabilidade

de um paciente ter colonização por bactérias (CRE) em transplante de fígado. A linha em
vermelho representa os resultados de sensibilidade (TPR) e 1-especificidade (FPR) para
cada threshold diferente e o espaço abaixo dessa linha é a área abaixo da curva ROC.
Quanto mais a linha da curva ROC tende para o lado esquerdo e superior do gráfico e,
portanto, quanto mais perto de 1 é a área abaixo da curva ROC, melhor é a performance
preditiva do algoritmo. De uma forma mais intuitiva, o resultado da área abaixo da curva
ROC corresponde à probabilidade de, quando forem selecionados um caso positivo e um
negativo aleatórios, o positivo será classificado pelo algoritmo como tendo maior
probabilidade de ser positivo do que o negativo.
Alguns desafios da área da saúde podem também envolver a predição não de uma
categoria, mas de um valor contínuo. Nesse caso, a métrica mais utilizada para analisar a
performance preditiva do algoritmo é a raiz quadrada do erro quadrático médio (do inglês
root mean squared error RMSE), calculada da seguinte forma:
"
(𝑦𝑦A𝑖𝑖 − 𝑦𝑦𝑦𝑦)!
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = >?
𝑛𝑛
#$%

623
Ou seja, calcula-se primeiramente o erro de cada predição, por meio da subtração de cada
valor predito (𝑦𝑦A) pelo seu valor real (𝑦𝑦) e elevando-se ao quadrado. Em seguida, somam-
se e dividem-se todos os erros quadráticos pelo número total de predições – para se obter
a média do erro quadrático – e finaliza-se com a raiz quadrada para retomar o resultado à
escala original.
4 Estado da arte
4.1 Algoritmos para dados estruturados
Machine learning é uma área bastante aberta a novidades e sem muitos paradigmas,
pois seu objetivo é apenas estabelecer a melhor regra de decisão a partir dos dados.
Por isso, a área tem passado por algumas revoluções nos últimos anos; dessas, a
mais recente é a dominância do uso da técnica de deep learning – conhecida como
transformers – para a análise de dados de imagem e de texto (linguagem natural)
(SHAMSHAD et al., 2022).
Entretanto, no tipo de dados mais utilizado na área de saúde e de políticas públicas,

isto é, dados tabulares/estruturados, as aplicações dos transformers ainda têm
deixado muito a desejar (BORISOV et al., 2021). Os algoritmos que atualmente
apresentam melhor performance preditiva têm sido consistentemente os algoritmos
de boosting, em particular o XGBoost e o lightGBM (AL-SHARI et al., 2021).
Ao se comparar a performance de algoritmos preditivos é importante que sejam

utilizadas as técnicas de pré-processamento e treinamento adequadas; esse é o
motivo pelo qual não é adequada a comparação de estudos realizados por diferentes
grupos de pesquisa, cujo rigor no tratamento dos dados e na otimização dos
algoritmos pode variar bastante.
A melhor forma de se comparar a capacidade dos algoritmos de aprenderem regras

complexas a partir dos dados é utilizar as mesmas técnicas para os mesmos
conjuntos de dados. Isso foi feito por Olson et al. (2018); esses autores se depararam
com a dominância de gradient boosting, seguida de random forests, também
encontrada pela maioria dos grupos de pesquisa de ML para dados estruturados.
Mais especificamente, o ranking de algoritmos com melhor performance em 165
bancos de dados diferentes foi gradient boosting, random forest, support vector

machines, extra trees, stochastic gradient descent, árvores de decisão, regressão
logística e k-vizinhos.
O interessante dessa análise é ter confirmado a importância de testar mais de um
algoritmo sempre que isso for tecnicamente viável, que passa a integrar o conceito
da “teoria de não há um almoço grátis”, a qual estabelece que em todas as
distribuições infinitas de bancos de dados, algum algoritmo, por pior que seja, vai ter
a melhor performance em pelo menos um dos casos. De fato, nesse estudo de Olson
et al. (2018), mesmo o melhor algoritmo (gradient boosting) ficou em média em
terceiro lugar nos 165 diferentes bancos de dados analisados.
Existem duas técnicas em crescimento no âmbito de ML em saúde, as quais devem

ocupar um espaço proeminente nos próximos anos: on-line learning e aprendizado
federado.
4.2 On-line learning
A área de on-line learning, também conhecida como aprendizado contínuo, refere-

se a estratégias que permitem a atualização de certa forma automática das regras
de decisão dos algoritmos à medida que novos dados vão chegando (LEE; LEE,
2020). Ou seja, ao mesmo tempo em que se realiza a predição, seus erros e acertos
ajudam a retreinar o algoritmo.
Na área da saúde, o uso de ML é particularmente importante devido à presença de

dataset shift, que ocorre quando existe uma mudança significativa na estrutura dos
dados (FINLAYSON et al., 2021). Por exemplo, novas intervenções de saúde podem
aparecer, protocolos clínicos podem mudar e até a opinião ou o interesse dos
pacientes sobre determinado procedimento pode alterar a conduta clínica realizada
para esses.
Uma alternativa ao on-line learning seria o retreinamento “manual” dos algoritmos do

zero, mas o uso de técnicas de on-line learning de certa forma automatiza essa
necessidade e torna mais eficiente a readaptação dos algoritmos.
4.3 Aprendizado federado
Conseguir garantir a privacidade dos pacientes é um dos desafios mais importantes

da área de ciência de dados em saúde (DE CRISTOFARO, 2020). Essa necessidade

625
é ainda mais importante para pacientes que possuem alguma doença sensível ou
socialmente estigmatizante como depressão ou HIV/AIDS, pois o vazamento dessa
informação pode trazer danos significativos para a vida dessas pessoas.
Algoritmos preditivos de machine learning necessitam frequentemente de muitos

dados de pacientes, o que significa a transferência e o processamento de
informações consideradas sigilosas. Uma solução para esse problema é o uso de
aprendizado federado, em que os dados dos pacientes são processados localmente
em cada hospital, sem a necessidade de transferência desse banco para um servidor
central (LI et al., 2020).
O uso de técnicas de aprendizado federado permite que somente os algoritmos

sejam transferidos e não mais os dados individuais dos pacientes. Nesse caso,
algoritmos são treinados localmente com os dados desse hospital específico e essa
informação é transferida para o próximo hospital onde serão novamente treinados e
assim consecutivamente.
Tanto a área de aprendizado federado quanto a de aprendizado on-line ainda são

relativamente recentes e o crescimento técnico da área, com novas estratégias e
modelos, tem ocorrido rapidamente nos últimos anos.
5 Desafios e limitações do uso de machine learning em saúde
Dois grandes desafios do uso de machine learning em saúde têm dominado a maior parte
do espaço nos debates sobre o futuro da área: explicabilidade e ética.
5.1 Explicabilidade em machine learning
Existem alguns motivos pelos quais é importante que algoritmos de machine learning
consigam explicar a sua tomada de decisão na área da saúde. Em primeiro lugar,
existe a questão de garantir que os profissionais de saúde confiem nas decisões dos
algoritmos (HENRY et al., 2022). Ao explicar detalhadamente os motivos pelos quais
o algoritmo conferiu determinada probabilidade para o paciente ter uma doença no
futuro, é provável que médicos tenham mais confiança nessa decisão. Por exemplo,
se o algoritmo indicar alto peso para tabagismo e obesidade ao predizer que um

paciente tem alto risco de infarto nos próximos anos, isso permite ao profissional de
saúde compreender o raciocínio utilizado pelo algoritmo e aumentar a sua disposição
em utilizá-lo.
Em segundo lugar, identificar os fatores que fizeram o algoritmo tomar determinada

decisão pode auxiliar a evitar o problema de vazamento de informação, que ocorre
quando o algoritmo usa informações não desejáveis ou disponíveis no momento da
tomada de decisão (CHIAVEGATTO FILHO et al., 2021). Por exemplo, um algoritmo
que utilize dados do hospital para predizer a incidência de câncer pode identificar
que hospitais oncológicos têm muitos casos de câncer, mas essa informação é
gerada após a ocorrência do câncer e não estará disponível para os médicos que
queiram identificar o risco de determinado paciente vir a ter câncer.
Em terceiro lugar, a capacidade de explicabilidade de uma decisão pode auxiliar a

identificar a presença de preconceitos (SVEEN et al., 2022). Por exemplo, se o
algoritmo estiver usando a raça-cor de um paciente para identificar a prioridade
desse paciente ser submetido a uma cirurgia, isso pode ser consequência de
preconceitos históricos humanos nessa tomada de decisão, algo que é possível e
necessário se extinguir com o uso de machine learning.
Existem hoje várias técnicas que permitem a identificação dos fatores que levaram
o algoritmo a tomar determinada decisão, muitas vezes com bastante detalhe. A
técnica mais comum para dados estruturados é o uso dos Shapley Values, método
proveniente da teoria dos jogos, que permite calcular a contribuição marginal de cada
fator para uma decisão, analisando-se a sua importância nas diferentes coalizões
possíveis de fatores (SUNDARARAJAN; NAJMI, 2020). Um exemplo de resultado
de Shapley Values está na figura abaixo:

627
Figura 2 - Exemplo de resultado de uma análise de Shapley Values
Fonte: Nascimento et al. (2022).
Os resultados acima são referentes a uma análise de Shapley Values para identificar
as variáveis mais importantes para predizer declínio de mobilidade em 5 anos entre
idosos do município de São Paulo. Pelos resultados, verifica-se que a idade foi a
variável preditora mais importante e teve impacto no aumento do risco de declínio
de mobilidade (pontos em vermelho à direita), resultado semelhante ao de se ter
baixa escolaridade. O efeito do gênero masculino, por outro lado, foi inverso,
diminuindo o risco individual de declínio de mobilidade em 5 anos.
5.2 Ética em machine learning
O uso de machine learning na área da saúde está sujeito à existência de alguns

vieses que precisam ser superados para garantir que a sua utilização seja
socialmente justa. Entre os principais desafios estão aqueles relacionados ao tipo de
banco de dados utilizado para o treinamento do algoritmo e também à presença de
desenvolvedores mal-intencionados.
Em primeiro lugar, é importante lembrar que a qualidade das decisões dos algoritmos
depende sempre da qualidade do banco de dados utilizado para o treinamento. Em
geral, o grande desafio é que os dados disponíveis para os algoritmos muitas vezes
foram gerados a partir de decisões de seres humanos, as quais frequentemente são
preconceituosas.

Assim, ao treinar com dados impregnados de preconceitos, é natural que os
algoritmos reproduzam esses mesmos preconceitos humanos, perpetuando-os ao
mesmo tempo que a sociedade vai se tornando cada vez mais tolerante e inclusiva.
O desafio nesse caso é garantir que os algoritmos estejam sendo treinados a partir
de dados com estruturas socialmente desejáveis e livres de preconceitos humanos
(KALLUS; ZHOU, 2018).
O segundo grande desafio ético dos bancos de dados é a disponibilidade de dados

de treinamento referentes a todos os grupos sociais, principalmente os mais
vulneráveis. Espera-se que atualmente os estabelecimentos de saúde que mais
coletam dados sejam aqueles cujos prontuários são eletrônicos, o que é mais
frequente em regiões mais ricas (ADLER-MILSTEIN et al., 2015). Nesse caso, o
problema é que os algoritmos podem aprender a tomar boas decisões para pacientes
mais ricos – por terem mais dados de treinamento – e decisões não tão boas para
pacientes de menor renda, o que resultará no aumento das desigualdades em saúde.
Nesse caso, é importante garantir que os dados disponíveis são suficientes para
todos os grupos sociais e ao fim do treinamento checar se a qualidade das decisões
tomadas pelo algoritmo final é parecida para os diferentes grupos.
O terceiro desafio é a presença de profissionais que deliberadamente orientem os

algoritmos em direção a decisões preconceituosas. Como exposto ao longo deste
capítulo, a grande parte do trabalho de uma análise preditiva de machine learning é
feita por humanos, que podem mudar a configuração dos algoritmos para se
tornarem preconceituosos. Nesse caso, a solução é que sempre se faça uma
auditoria externa da qualidade dos algoritmos nos diferentes grupos sociais por parte
de um pesquisador que não participou do desenvolvimento do algoritmo.
O lado positivo do uso de algoritmos para a tomada de decisão é que, no possível

caso de identificação de preconceitos, pode-se ajustá-los no sentido de corrigi-los,
ao contrário de seres humanos preconceituosos que muitas vezes não mudam suas
posições nem após os treinamentos éticos fornecidos por suas instituições (PALUCK
et al., 2021).

629
6 Conclusão
Machine learning tem enorme potencial para auxiliar a melhorar as decisões na área da
saúde. Entretanto, os seus muitos desafios referentes à qualidade dos profissionais da área
e dos bancos de dados precisam ser superados para que os algoritmos consigam mudar
profundamente a área da saúde. Com o avanço da inteligência artificial em outras áreas do
conhecimento, esse aprendizado poderá ser transferido de forma confiável e robusta para
a área da saúde, melhorar as decisões tomadas por gestores de saúde e contribuir para a
melhoria da saúde no país.

Referências
ADLER-MILSTEIN, J. et al. Electronic health record adoption in us hospitals: progress

continues, but challenges persist. Health Affairs, v. 34, n. 12, p. 2174-2180, 2015.
Disponível em: https://www.healthaffairs.org/doi/pdf/10.1377/hlthaff.2015.0992. Acesso
em: 25 out. 2022.
AL-SHARI, H.; SALEH, Y. A.; ODABA, A. Comparison of gradient boosting decision tree
algorithms for CPU performance. 2021. Journal of Institue of Science and Technology,
v. 37, n. 1, p. 157-168, 2021. Disponível em: https://dergipark.org.tr/en/download/article-
file/1577402. Acesso em: 25 out. 2022.
ALMEIDA, M. S. C. et al. Classificação Internacional das Doenças - 11ᵃ revisão: da

concepção à implementação. Revista de Saúde Pública, v. 54, p. 1-5, 2020. Disponível
em: https://scielosp.org/pdf/rsp/2020.v54/104/pt. Acesso em: 25 out. 2022.
BATISTA, A. F. M.; CHIAVEGATTO FILHO, A. D. P. Machine Learning aplicado à saúde.

In: ZIVIANI, A.; FERNANDES, N. C.; SAADE, D. C. M. (org.). Livro de minicursos. Porto
Alegre: Sociedade Brasileira de Computação, 2019.
BATISTA, A. F. M. et al. Neonatal mortality prediction with routinely collected data: a

machine learning approach. BMC Pediatrics, v. 21, n. 1, p. 1-6, 2021. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8293479/pdf/12887_2021_Article_2788.pdf
BORISOV, V. et al. Deep neural networks and tabular data: a survey. ArXiv, 2021. DOI:
arxiv-2110.01889.
CHIAVEGATTO FILHO, A.; BATISTA, A. F. D. M.; SANTOS, H. G. D. Data leakage in

health outcomes prediction with machine learning. Journal of Medical Internet
Research, v. 23, n. 2, p. 1-3, 2021. Disponível em:
https://www.jmir.org/2021/2/e10969/PDF. Acesso em: 25 out. 2022.
DE CRISTOFARO, E. An overview of privacy in machine learning. ArXiv, v. 1, p. 1-12,

2020. Disponível em: https://arxiv.org/pdf/2005.08679.pdf. Acesso em: 25 out. 2022.
DOLL, R.; HILL, A. B. Lung cancer and other causes of death in relation to smoking. BMJ,
v. 2, n. 50001, p. 1077-1081, 1956. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articl
es/PMC2035864/pdf/brmedj03180-0019.pdf. Acesso em: 30 out. 2022.
FINLAYSON, S. G. et al. The clinician and dataset shift in artificial intelligence. New
England Journal Medicine, v. 385, n. 3, p. 283-286, 2021. Disponível em:
FREIRE, M. P. et al. Prediction models for carbapenem-resistant carriage at liver

transplantation: a multicenter retrospective study. Transplant Infectious Disease, 2022.
DOI: https://doi.org/10.1111/tid.13920.
GUI, Y. et al. Deep learning with weak annotation from diagnosis reports for detection of
multiple head disorders: a prospective, multicentre study. The Lancet Digital Health, v. 4,
n. 8, p. e584-e593, 2022. Disponível em: https://www.thelancet.com/journals/landig
/article/ /PIIS2589-7500(22)00090-5/fulltext. Acesso em: 30 out. 2022.

631
HENRY, K. E. et al. Human-machine teaming is key to AI adoption: clinicians' experiences
with a deployed machine learning system. NPJ Digital Medicine, v. 5, n. 1, p. 1-6, 2022.
Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9304371/pdf/41746_2022_
Article_597.pdf. Acesso em: 30 out. 2022.
JAMES, G.; HASTIE, T.; TIBSHIRANI, R. An introduction to statistical learning: with

applications in R. New York: Springer 2014.
KALLUS, N.; ZHOU, A. Residual unfairness in fair machine learning from prejudiced
data. Sweden, PMLR 80, 2018. p. 2438-2448. Disponível em:https://arxiv.org/pdf/1806.
02887.pdf. Acesso em: 30 out. 2022.
KILKENNY, M. F.; ROBINSON, K. M. Data quality: "Garbage in - garbage out". Health

Information Management Journal, v. 47, n. 3, p. 103-105, 2018. Disponível em:
https://journals.sagepub.com/doi/pdf/10.1177/1833358318774357. Acesso em: 30 out.
2022.
LISTL, S.; CHIAVEGATTO FILHO, A. D. P. Big Data and Machine Learning. In: PERES,
M. A.; ANTUNES, J. L. F.; WATT, R. G. (org.). Oral epidemiology. New York: Springer
2020.
LEE, C. S.; LEE, A. Y. Clinical applications of continual learning machine learning. The
Lancet Digital Health, v. 2, n. 6, p. e279-e281, 2020. Disponível em:
https://www.thelancet.com/action/showPdf?pii=S2589-7500%2820%2930102-3. Acesso
em: 30 out. 2022.
LI, T. et al. Federated learning: challenges, methods, and future directions. IEEE Signal
Processing Magazine, v. 37, n. 3, p. 50-60, 2020. Disponível em:
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9084352. Acesso em: 30 out.
2022.
NASCIMENTO, C. F. do. et al. Early identification of older individuals at risk of mobility

decline with machine learning. Archives of Gerontology and Geriatrics, v. 100, 2022.
DOI: https://doi.org/10.1016/j.archger.2022.104625.
NGIAM, K. Y.; KHOR, I. W. Big data and machine learning algorithms for health-care
delivery. The Lancet Oncology, v. 20, n. 5, p. e262-e273, 2019. Disponível em:
https://www.sciencedirect.com/science/article/pii/S1470204519301494?via%3Dihub.
OLSON, R. S. et al. Data-driven advice for applying machine learning to bioinformatics

problems. In: PACIFIC SYMPOSIUM ON BIOCOMPUTING, 23., 2018. Proceedings [...].
2018. p. 192-203. Disponível em: https://pubmed.ncbi.nlm.nih.gov/29218881/. Acesso em:
30 out. 2022.
PALUCK, E. L. et al. Prejudice reduction: progress and challenges. Annual Review of

Psychology, v. 72, p. 533-560, 2021. Disponível em: https://www.annualreviews.org/
doi/pdf/10.1146/annurev-psych-071620-030619. Acesso em: 30 out. 2022.
SHAMSHAD, F. et al. Transformers in medical imaging: a survey. ArXiv, v. 1, 2022.

Disponível em: https://arxiv.org/pdf/2201.09873.pdf. Acesso em: 30 out. 2022.

SREERAMAREDDY, C.; AYE, S. N. Changes in adult smoking behaviours in ten global
adult tobacco survey (GATS) countries during 2008-2018 - a test of ‘hardening’
hypothesis’. BMC Public Health, v. 21, n. 1, p. 1-13, 2021. Disponível em:
SUNDARARAJAN, M.; NAJMI, A. The many Shapley values for model explanation. ArXiv,
v. 2, p. 1-20, 2020. Disponível em: https://arxiv.org/pdf/1908.08474.pdf. Acesso em: 30
out. 2022.
SVEEN, W.; DEWAN, M.; DEXHEIMER, J. W. The risk of coding racism into pediatric
sepsis care: the necessity of antiracism in machine learning. Journal of Pediatrics, v.
247, p. 129-132, 2022. Disponível em: https://www.sciencedirect.com/science /article/pii/
S0022347622003390?via%3Dihub. Acesso em: 30 out. 2022.
YIN, J.; NGIAM, K. Y.; TEO, H. H. Role of artificial intelligence applications in real-life
clinical practice: systematic review. Journal of Medical Internet Research, v. 23, n. 4, p.
e25759, 2021. Disponível em: https://pubmed.ncbi.nlm.nih.gov/33885365/. Acesso em: 30
out. 2022.
ZHOU, Q. et al. Clinical impact and quality of randomized controlled trials involving
interventions evaluating artificial intelligence prediction tools: a systematic review. NPJ
Digital Medicine, v. 4, n. 154, 2021. Disponível em: https://www.nature.com/articles/
s41746-021-00524-2. Acesso em: 30 out. 2022.

633
PARTE 5:
POLÍTICAS INFORMADAS POR
EVIDÊNCIAS E TRADUÇÃO DO
CONHECIMENTO

Capítulo 23
Evidências para políticas de

saúde: aspectos conceituais e
suas implicações para avaliações
de impacto
Jorge Otávio Maia Barreto1

Maurício Mota Saboya Pinheiro2
1
Fundação Oswaldo Cruz - Fiocruz
2
Instituto de Pesquisa Econômica Aplicada - IPEA
RESUMO:
Este capítulo fornece uma visão ampla acerca das evidências em políticas públicas, considerando-
se as diretrizes para Avaliação de Impacto em Políticas de Saúde (AIPS). Visa responder: i) Em que
medida as AIPS são influenciadas pelas limitações conceituais do movimento das políticas públicas
baseadas em evidências? ii) Como tais limitações podem introduzir vieses negativos nas decisões
em políticas? iii) Como superar esses vieses e limitações? Resgata o conceito de ecossistema de
evidências, apresenta alguns casos para o Brasil e discute tópicos que envolvem desde a melhoria do
ambiente geral para o uso de evidências até o fomento do compartilhamento, conexões e coproduções
de evidências entre gestores e outros stakeholders.
PALAVRAS-CHAVE:
Políticas públicas. Avaliação de impacto. Saúde. Análise conceitual.

635
1 Introdução
O objetivo principal deste capítulo é apresentar e discutir os conceitos e usos das
evidências para políticas públicas e suas relações com as avaliações de impacto de
políticas de saúde (AIPS). Procura-se também derivar as implicações teóricas e práticas
desses elementos sobre a tomada de decisão na formulação, implementação e avaliação
das políticas públicas. Por meio de uma análise conceitual – de caráter histórico e filosófico
– e considerando-se os contornos práticos que os conceitos relacionados com evidências
têm assumido no mundo e no Brasil, critica-se a concepção de evidência limitada aos
resultados de estudos científicos experimentais e se apontam implicações negativas da
adoção dessa concepção para as políticas públicas em geral e para as políticas de saúde
em particular. Finalmente, a partir de um breve estudo sobre casos paradigmáticos de AIPS,
propõe-se uma visão abrangente de evidência para políticas de saúde, para aplicação nas
diferentes modalidades de avaliação, tendo em vista sua melhor integração ao ecossistema
de evidências. Esse pode ser definido como o sistema integrado de atores e instituições, o
qual reflete conexões e interações formais e informais no uso de suas capacidades e
recursos para a produção, tradução e uso de evidências (STEWART et al., 2019).
A definição mais restrita de evidência, vinculada exclusivamente aos resultados de estudos

científicos experimentais, pode ser encarada como um pressuposto do movimento das
políticas públicas baseadas em evidências (PPBEs) em seu início. Embora tenha surgido
nos anos 1970 – no Reino Unido e Canadá – apenas no final dos anos 1990 o movimento
assumiu um programa explícito e uma abordagem interpretativa (HEAD, 2015). As PPBEs
objetivam promover a análise rigorosa de intervenções de políticas e programas, com a
intenção de fornecer insumos úteis para os tomadores de decisão, em sua consideração
contínua de desenvolvimento de políticas e melhoria de programas. No entanto, é possível
reconhecer que essas políticas tiveram seus princípios gestados pelo menos desde
meados do século XX, senão antes. Uma famosa caracterização desse movimento diz que
ele “ajuda na tomada de decisões bem informadas em políticas, programas e projetos
públicos, colocando as melhores evidências de pesquisas disponíveis no coração do
desenvolvimento e implementação das políticas públicas” (DAVIES, 2004, p. 3).
O movimento das PPBEs permanece vivo e influencia governos em todo o mundo. Em

2019, por exemplo, o governo dos Estados Unidos promulgou o Foundations for Evidence-
Based Policymaking Act of 2018 para melhorar o uso de evidências na formulação de
políticas e programas do governo federal. Essa lei exige que todas as agências
estadunidenses desenvolvam “políticas baseadas em evidências” e planos de avaliação

como parte de suas atividades institucionais (ESTADOS UNIDOS DA AMÉRICA, 2019).
Não obstante, ainda parece ser significativa a influência que um conceito limitado de
evidência pode ter nas discussões sobre políticas públicas. Por exemplo, no mais recente
relatório da Comissão Global de Evidências, apontou-se que outras comissões globais
frequentemente propõem o aumento da produção e disponibilidade de novas evidências,
tais como novas avaliações, em vez de dirigir sua atenção ao melhor uso dos “estoques”
de evidências existentes ou de preconizar a combinação de diversas formas de evidências.
Poucas comissões globais incluem explicitamente nas suas recomendações o uso de
outras formas de evidências – tais como a modelagem, informações qualitativas, sínteses
de evidências e diretrizes – para responder aos desafios sociais que têm em foco
(COMISSÃO [...], 2022).
No campo da saúde, os porta-vozes das PPBEs, ao menos em seus primeiros tempos,

entendiam que as melhores evidências a serem usadas em políticas públicas proviriam dos
resultados de pesquisas científicas rigorosas, de caráter empírico e experimental. Métodos
com essas características eram defendidos, de forma mais ou menos indistinta, para a
análise e tomada de decisão em várias áreas de políticas públicas, bem como para a
análise de uma enorme gama de problemas sociais que requeriam algum tipo de
intervenção pública.
As reconhecidas limitações da aplicação das premissas das PPBEs ao cotidiano dos

tomadores de decisão levaram ao surgimento de outro movimento, mais próximo da
dinâmica das políticas públicas – a saber, as políticas informadas por evidências (PIEs) (do
inglês Evidence-informed Policymaking ou Decision Making, EIP, EIPM ou EIDM). Segundo
essa abordagem mais recente, que ganhou corpo nas duas últimas décadas, a visão
estritamente vinculada às evidências experimentais deu lugar a uma visão mais
abrangente, a qual inclui diferentes formas de evidências, ao tempo em que valoriza
processos sistemáticos e transparentes para o seu uso como subsídio na formulação,
implementação e avaliação de políticas públicas em saúde. Atualmente as PIEs são
adotadas por entidades de influência global sobre governos, tais como a OMS (LESTER et
al., 2020), mas também no âmbito dos governos nacionais e locais, incluindo-se o Ministério
da Saúde (MS) e outros níveis de gestão do Sistema Único de Saúde (SUS) do Brasil
(BENTO et al., 2020). As PIEs também são promovidas por diversas redes intersetoriais,
instituições de pesquisa e intermediários do conhecimento que valorizam o intercâmbio e a

637
integração entre produtores e usuários de evidências (DIAS et al., 2014; MANSILLA et al.,
2018; SCARLETT et al., 2018).1
As PIEs são reconhecidas atualmente como o resultado de processos sistemáticos,

transparentes, participativos e contextualizados para a incorporação de evidências
científicas globais – de forma articulada com evidências locais – nos processos de tomada
de decisão, bem como na formulação e implementação de políticas públicas e programas
de saúde (LESTER et al., 20202). Os subsídios de evidências das PIEs são obtidos
especialmente por atividades apoiadas por plataformas de tradução do conhecimento
(PARTRIDGE et al., 2020) que incluem atividades de síntese (revisões sistemáticas e
outros tipos de sínteses de evidências para políticas), disseminação e intercâmbio com
diferentes setores da sociedade e governos (diálogos deliberativos de políticas). Esse
intercâmbio busca agregar informações sobre visões, experiências e interesses de
diferentes stakeholders para fortalecer a discussão sobre opções e intervenções para
abordar problemas prioritários em diferentes níveis dos sistemas de saúde (MOAT et al.,
2013).
Em que pese o surgimento e expansão do movimento das PIEs – e apesar das críticas e
autocríticas que as PPBEs têm sofrido nos últimos anos – esses movimentos ainda
padecem de limitações epistemológicas que acarretam vieses tanto na avaliação quanto
na prática das decisões das políticas públicas. Tais limitações e vieses constituem
verdadeira “armadilha”, na qual formuladores, implementadores e avaliadores muitas vezes
se encontram capturados, em especial ao descobrirem que não existem respostas simples
e diretas para um tema complexo e difícil de ser compreendido em sua inteireza como as
Mesmo nas PIEs, abordagens quantitativas e métodos econométricos parecem prevalecer

sobre outros delineamentos metodológicos. Isso ocorre inclusive na área das políticas de
saúde, na qual são muito populares as avaliações de impacto alinhadas com essas
abordagens. Em geral, busca-se um tipo específico de evidência empírica, constituída de
um teste de hipótese causal, em que se procura mensurar estatisticamente os efeitos
1
Bons exemplos de redes de PIEs intersetorial global são a COVID-END
https://www.mcmasterforum.org/networks/covid-end e a EVIPNet https://www.who.int/initiatives/evidence-
informed-policy-network.

(“impactos”) de determinada intervenção de política pública, com base em critérios
previamente estabelecidos para corroborar ou rejeitar a hipótese2.
As avaliações de impacto – em saúde e em outras áreas – muitas vezes são consideradas

como o melhor tipo de evidência possível para apoiar uma decisão. Em particular, são
consideradas decisivas para a adoção de intervenções que comporão uma política ou
programa porque se entende que seriam a melhor forma de se aferir sua eficácia. Ademais,
as avaliações de impacto também servem de base para análises do tipo custo-benefício e
outros estudos de avaliação econômica, chaves para a decisão do policymaker.3
Sem desconsiderar os méritos e a necessidade das avaliações de impacto com caráter

quantitativo, um conjunto de perguntas orienta este capítulo, a saber: em que medida as
AIPS sofrem influência das limitações conceituais que influenciaram as PPBEs? Como tais
limitações poderiam introduzir vieses negativos nas decisões em políticas de saúde no
Brasil e em outras partes do mundo? Que proposta conceitual compreensiva e atualizada
poderia ser considerada e defendida, a fim de se minimizarem potenciais distorções? Por
fim, qual o melhor caminho para aprimorar a integração das AIPS ao ecossistema de
evidências para políticas de saúde?
O capítulo se divide em cinco seções, incluindo-se esta introdução. Na seção 2, discutimos

conceitos relacionados com evidências para políticas e AIPS sob a perspectiva histórica.
Procura-se discutir como “evidência” tem sido entendida em diferentes disciplinas e áreas
de políticas públicas, bem como as implicações disso para o objetivo central deste capítulo.
A seção 2 procura conectar, a partir de breve panorama histórico, o tema de evidências
com o nascimento da área de políticas públicas. Com isso, de certa forma, preenche-se
uma lacuna nos estudos sobre as políticas de saúde pública no Brasil, os quais
desconsideram as articulações históricas entre as políticas de saúde e outras áreas de
políticas públicas. Na seção 3, analisam-se alguns exemplos reais de AIPS e busca-se
evidenciar os seus aspectos positivos e suas lacunas. A pergunta-chave dessa seção é:
como as AIPS lidam com as evidências no mundo real? A seção 4, de caráter propositivo,
apresenta critérios para se ampliar o conceito de evidência, de maneira que essa ampliação
melhore as AIPS no Brasil e sua integração ao ecossistema de evidências. Por fim, a seção
2
Os produtos entregues pela política causam os seus resultados e impactos esperados, conforme seu
modelo lógico? Essa seria a principal pergunta a que a avaliação de impacto procuraria responder (BRASIL,
2018, p. 262).
3
Não obstante, atualmente se reconhece não ser necessário realizar avaliações de impacto para que a
decisão seja considerada informada por evidências. Sobre isso, ver Lavis et al. (2012).

639
5 encerra o capítulo, resume as principais ideias e propõe uma agenda compartilhada entre
pesquisa e gestão sobre o assunto em pauta.
2 Evidências e AIPS: uma elucidação conceitual situada historicamente

Hoje em dia, parece pertencer ao senso comum a ideia de que políticas públicas devem se
basear em evidências e não em crenças infundadas, opiniões pessoais ou preconceitos de
qualquer natureza. Apesar desse consenso, a realidade da formulação e implementação
das políticas públicas pode mostrar outro cenário, no qual as evidências muitas vezes
sequer integram o conjunto de subsídios ou são incluídas evidências incompletas sobre os
problemas abordados ou sobre as intervenções que serão usadas, incluindo-se seus
potenciais resultados e outros aspectos essenciais à implementação, por exemplo. Quanto
ao sentido de “evidência”, usado pela mídia e pelo grande público, parece haver referência,
senão direta, pelo menos implícita aos conhecimentos e resultados de pesquisas
científicas.
Na verdade, é certo que muitos aspectos são considerados na tomada de decisões de

políticas e também que algumas formas de evidências são mais confiáveis do que outras.
Os tomadores de decisão também podem usar outros tipos de informação, tais como
evidências coloquiais derivadas de suas próprias experiências, da mesma forma que
podem considerar outros fatores na deliberação pública e tomada de decisão. Entre esses
fatores, incluem-se, por exemplo, as restrições orçamentárias, pressão de grupos de
interesse, os valores e convicções pessoais dos tomadores de decisão e/ou dos grupos
que eles representam ou que os apoiam/financiam. Por outro lado, assim como os
problemas e desafios enfrentados pelas políticas públicas, independentemente do seu
nível, o processo de tomada de decisão sempre é complexo e muitas vezes pouco
transparente, mas se defende amplamente o uso das evidências como um subsídio
importante e positivo a ser agregado às discussões.
Como dito, a palavra “evidência” é geralmente usada no sentido de resultados de pesquisas

científicas. Pesquisadores realizam estudos técnicos e os tomadores de decisão e
diferentes setores e grupos da sociedade podem usar os resultados desses estudos. De
preferência, os usuários das evidências selecionarão as formas que melhor correspondam
às suas questões específicas, de tal modo que é preciso reconhecer que geralmente não
há uma linha direta entre as evidências e a ação. No âmbito das políticas públicas
frequentemente as evidências podem ajudar a responder a algumas perguntas, mas não a

todas, ou podem ser de baixa qualidade ou ter aplicabilidade limitada para um contexto
específico e pode haver ainda incertezas relevantes que impeçam que seu uso seja direto
ou linear.
Na ciência, a evidência é o dado informacional, baseado na experiência, o qual corrobora

ou refuta uma hipótese. A experiência é codificada em um conjunto de informações
organizado, que pode, por exemplo, assumir a forma de uma série de dados quantitativos
para uma variável ou qualitativos para um fenômeno de interesse. Esse conjunto –
acrescido de um sem-número de regras de processamento de informações (modelos,
sistemas) e de corroboração de hipóteses científicas – é o que se pode chamar de evidência
pela perspectiva da atividade científica. Em consonância com essa caracterização, a
evidência científica é também associada a resultados de conhecimentos produzidos a partir
de processos transparentes, rigorosos, sistemáticos e reprodutíveis; tais processos incluem
os métodos experimentais, mas não se limitam a esses, por incluírem uma miríade de
abordagens e métodos aplicáveis a diferentes tipos de perguntas, as quais resultam em
pesquisas quantitativas, qualitativas e mistas.
Não é de hoje que as evidências científicas são pensadas como um valioso apoio na esfera
das decisões sobre políticas públicas. O uso do conhecimento científico nas políticas
públicas experimentou grande impulso desde meados do século XX, a partir dos Estados
Unidos. Ao trabalharem com as disciplinas da administração pública e análise de políticas
públicas, autores como Lasswell (1951; 1970) passaram a defender a aplicação do método
científico como fundamentais para lidar com os problemas que as políticas públicas
abordam. Ademais, a partir dos anos 1960, em solo norte-americano, houve um aumento
sem precedentes dos gastos públicos com programas de combate à pobreza, educação,
renda mínima, habitação, saúde e justiça criminal4. Isso gerou certa pressão social e política
para a avaliação desses programas (SHADISH JUNIOR; COOK; LEVITON, 1995), bem
como para o desenvolvimento de “[...] novos métodos, carreiras profissionais, fontes de
informação, instrumentos, técnicas e teorias voltadas para a avaliação de programas
públicos” (PINHEIRO, 2020b, p. 18).
A partir de meados do século XX, viveu-se um clima de otimismo, em que se acreditava ser
possível desenhar políticas públicas “ótimas” em favor do aumento do bem-estar geral.
4
Aspectos geopolíticos internacionais, ligados à guerra fria, não estiverem ausentes como motivações para
esse movimento. Por exemplo, Worthen, Fitzpatrick e Sanders (2004, p. 64) atribuem à Lei Educacional de
Defesa Nacional (1958) importante papel no desencadeamento da onda de avaliação de programas
educacionais nos Estados Unidos, dos anos 1960 em diante.

641
Esse entusiasmo era particularmente forte nas políticas macroeconômicas (monetária e
fiscal) de orientação keynesiana. Malinvauld (1998, p. 330) chega a afirmar que os
economistas, na avaliação e gestão da política econômica, viam-se como engenheiros
capazes de corrigir otimamente a trajetória de um foguete. A analogia da economia com a
engenharia não é mera coincidência aqui, mas reflete uma forma algo mecanicista e
racionalista de se considerarem os problemas econômicos. É claro que essa perspectiva,
de caráter estritamente determinístico, não encontrou reflexo na prática cotidiana dos
processos de formulação e implementação de políticas, mas ajudou a fundamentar uma
concepção de PPBEs, que ainda hoje influencia burocracias públicas e pesquisadores em
todo o mundo.
Historicamente, o padrão estabelecido no mainstream da ciência econômica para o uso de

evidências na tomada de decisão de políticas nessa área consiste nos resultados de
modelos econométricos derivados de teorias econômicas. A economia desenvolveu teorias
– como a da escolha baseada na teoria dos jogos5 – bem como métodos – como o da
avaliação de programas (program evaluation) – e ferramentas analíticas (análise de custo-
benefício, por exemplo) que seriam posteriormente usadas em diversas outras áreas de
políticas, inclusive em saúde. A mensuração objetiva, em termos comparativos e
quantitativos, da eficácia e da eficiência dos programas públicos era considerado um
desiderato comum aos policymakers que faziam uso desse tipo de ferramenta de avaliação.
Em que pese a ciência econômica ser o nascedouro do tema da avaliação de políticas

públicas, é preciso reconhecer que as áreas de saúde pública e da pesquisa sobre sistemas
de saúde constituíram, ao longo do tempo, concepção própria de evidência. Fundamentada
inicialmente na epidemiologia clínica, essa concepção evoluiu para incluir outras
abordagens, desde a pesquisa social até métodos avançados de síntese estatística – como
as meta-análises – e de tradução do conhecimento para a prática, como os guidelines
clínicos e de políticas. Por outro lado, apesar de os modelos econométricos serem
amplamente utilizados em avaliações de impacto de abrangência nacional, essa
modalidade de avaliação não precisa se restringir a grandes abrangências, porque muitos
elementos das AIPS poderiam ser considerados para apoiar o monitoramento e avaliação
também no nível local.
5
A teoria dos jogos foi desenvolvida a partir do trabalho de von Neumann e Morgenstern (1944) e deu
origem a um padrão de formalização teórico da escolha social. Nesse padrão, o juízo social é modelado
segundo a escolha da melhor alternativa entre um leque de opções possíveis, existentes e conhecidas.
Trata-se de um modelo dedutivo em sua essência, o qual pressupõe que todos os fatores envolvidos para
julgar os méritos de uma alternativa de ação sejam comparáveis e comensuráveis, em termos de utilidade
ou valor.

Nesse panorama histórico, as áreas da medicina e saúde merecem destaque, porquanto o
esclarecimento do significado de “evidências” em políticas públicas, assumido
contemporaneamente, muito se deve ao uso dessa expressão no contexto técnico de um
movimento que se tornaria conhecido por medicina baseada em evidência (MBE)6. Tendo
por precursor o epidemiologista Archibald Cochrane (1909-1988), a MBE objetiva renovar
o conhecimento e a prática médicos, por meio do uso de evidências científicas para
informar, entre outros, os diagnósticos, tratamentos e controles preventivos de doenças.
Na verdade, o movimento pretende ter um alcance mais amplo e cobrir inter alia o ensino
e o treinamento médicos, as diretrizes médicas, os programas de saúde e várias outras
intervenções na saúde pública. Essa grande abrangência justificaria inclusive a mudança
do nome do movimento para uma expressão semanticamente mais larga, como “políticas
e práticas em saúde baseadas em evidências”.
Segundo os porta-vozes da MBE, os resultados de pesquisas científicas e especialmente

os resultados de uma linha específica de investigação experimental – os ensaios clínicos
randomizados (ECRs)7 – deveriam orientar a prática clínica. Defendia-se que tal mudança
metodológica traria importantes ganhos para os resultados, em especial de racionalização
e economicidade dos sistemas de saúde e favoreceria instituições públicas e privadas.
Finalmente, acreditava-se que os benefícios desse movimento culminariam em um
aumento do bem-estar dos pacientes, pois esses se veriam preservados de terapias
desnecessárias, excessivamente caras e/ou danosas.
Sob certo ponto de vista, a MBE foi um sucesso, em especial para impulsionar o
desenvolvimento e disseminação de métodos para a avaliação de tecnologias em saúde
(ATS), que se tornariam globalmente aceitos como um importante subsídio das decisões
sobre a incorporação de tecnologias em saúde. A partir dos EUA e Canadá, esse
movimento difundiu-se para várias partes do mundo. A justificar esse sucesso, há vários
exemplos históricos, em que testes experimentais corrigiram erros graves em certas
6
Embora os princípios da MBE estivessem postos há décadas, a “[...] expressão ‘medicina baseada em
evidência’ foi usada pela primeira vez em 1992, numa publicação de um autointitulado Grupo de Trabalho
de Medicina Baseada em Evidência (do inglês The Evidence-Based Medicine Working Group), formado por
professores de epidemiologia clínica, informática médica e bioestatística da Universidade McMaster, no
Canadá (GOLDENBERG, 2005). Nesse trabalho pioneiro, os métodos usados naquelas disciplinas foram
apresentados, e seu emprego foi proposto, como um novo paradigma [...] na formação de médicos, nas
práticas clínicas e na tomada de decisões médicas e de saúde em nível macro” (PINHEIRO; NOGUEIRA,
2021, p. 12).
7
Os ensaios clínicos randomizados são também conhecidos por sua sigla em inglês (RCT-randomized
controlled trials).

643
práticas médicas consolidadas.8 Não obstante, também há o reconhecimento de que o
sucesso da MBE não foi uniforme em todas as especialidades médicas. Em áreas como a
psiquiatria e o tratamento de doenças mentais, os métodos preconizados por esse
movimento são bastante problematizados.9 Finalmente, trabalhos como os de Pinheiro e
Nogueira (2021) apontam várias limitações relativas à MBE, tais como a problemática
extensão da medicina clínica para as políticas de saúde coletivas e a falta de reflexão crítica
sobre a ética dos ECRs10.
Assim como a decisão clínica é complexa e deve considerar outros elementos, além das
recomendações fundamentadas em evidências – disponíveis nos protocolos clínicos – para
alcançar a melhor opção para um paciente, os tomadores de decisão nas políticas públicas
constantemente têm à sua frente problemas complexos; esses exigirão não apenas a
compreensão da suas causas e consequências, mas também a adoção de critérios de
priorização e de tomada de decisão, os quais produzirão consequências (positivas ou
negativas) para as populações abrangidas pelos efeitos das suas decisões. Dessa forma,
é necessário reconhecer a complexidade inerente aos problemas sociais abordados pelas
políticas públicas, de maneira que essa perspectiva informe não apenas a sua formulação
e implementação, como também a avaliação dos seus resultados e impactos.
Para os objetivos deste capítulo, cabe salientar que a MBE efetivamente contribuiu para a
difusão de certo viés empirista e experimentalista no entendimento das evidências em
políticas públicas, em especial no início do movimento das PPBEs, e para a disseminação
global da ATS como um subsídio essencial das atividades regulatórias sobre tecnologias –
novas e antigas – nos sistemas de saúde de todo o mundo. Ao produzir e defender que as
“melhores evidências” para orientar decisões médicas provinham de métodos
experimentais, especialmente de ensaios clínicos controlados e randomizados (ECR),
focados em eficácia e segurança, a MBE pode ter priorizado uma concepção
filosoficamente estreita de evidência, a qual pode se mostrar inadequada para o contexto
das políticas públicas. Embora esse viés tenha sido reconhecido recentemente como uma
8
Por exemplo, [...] Edwards et al. (2005) “[...] mostraram, por meio de ensaios clínicos randomizados
(ECRs), que a aplicação de esteroides para tratar inchaços derivados de lesões na cabeça em indivíduos
adultos – um tratamento estabelecido há décadas – na verdade, aumentava a probabilidade de morte dos
pacientes (PINHEIRO; NOGUEIRA, 2021, p. 7).
9
Vide, por exemplo, Thomas, Bracken e Timimi (2012).
10
Lacuna que pode levar, entre outras coisas, “ao abuso do poder econômico da indústria farmacêutica, ao
excesso de medicalização, à perda de autonomia de pacientes e médicos” (PINHEIRO; NOGUEIRA, 2021,
p. 42).

limitação a ser superada11, ainda acarreta distorções nas análises e decisões, inclusive em
outras áreas das políticas públicas, como se apresentará na seção 3.
Assim como qualquer pesquisa científica, as AIPS pretendem representar a realidade do

seu objeto de estudo de forma confiável. Para isso, é preciso assumir que suas perguntas
de pesquisa podem ser diversificadas e abrangentes, à medida que o interesse em
descortinar diferentes aspectos da política estudada é manifesto pelos tomadores de
decisão e outros interessados, em especial da sociedade civil organizada. Diante da
delimitação das perguntas de pesquisa, a escolha dos métodos precisa se adequar às
questões priorizadas, de forma a compor um painel metodológico diversificado.
Ademais, não é incomum que as hipóteses investigadas, geralmente relacionadas com os

efeitos da política estudada, sejam definidas no âmbito normativo da política, ou seja, a
partir dos objetivos previamente estatuídos. Contudo, pode ocorrer que a formulação e
implementação de uma política sejam mediadas por processos decisórios que
consideraram evidências científicas ou de outros tipos12. Nesse caso, evidências globais
disponíveis podem ajudar a problematizar hipóteses sobre os efeitos esperados das
intervenções que compõem a política estudada. Em outras palavras, uma AIPS poderia
considerar se os objetivos estatuídos na política podem ser alcançados pelas intervenções
propostas ou se a desconexão entre as intenções e ações reflete a lacuna entre uma
decisão bem informada e aquela tomada com base na vontade ou experiência de quem
decide.
De todo modo, após décadas de análises teóricas e empíricas, incluindo-se comparações

internacionais, resta claro que os ECRs e/ou revisões sistemáticas focadas em desfechos
quantitativos não podem ser “entronizados” sem maiores considerações, como “o melhor”
conjunto de evidências para orientar tomadores de decisão acerca do que pode ou não
pode “funcionar” em políticas públicas, mesmo na área da saúde. O otimismo exagerado
de outrora – em relação à aplicação dos métodos empíricos-experimentais na avaliação de
programas governamentais – deve dar lugar a uma atitude mais crítica e ponderada em
relação ao emprego das evidências nas políticas públicas em geral e, em particular, nas
políticas de saúde. Nesse diapasão, nas duas últimas décadas se produziram muitos
11
Vide, por exemplo, um movimento recente de orientação da prática médica que procura levar em
consideração os valores do paciente, o chamado “cuidado centrado no paciente” (patient-centered care), e
que surgiu como uma espécie de autocrítica no interior da MBE. Disponível em: https://bit.ly/3DQBBoI.
Acesso em: 6 set. 2021. Ver também Andermann et al. (2016).
12
Entre esses outros tipos de evidências, fora as estritamente científicas, identificam-se as evidências
locais, ligadas ao contexto de implementação da política.

645
trabalhos que exploram a complexidade das decisões em políticas públicas, incluídos os
contextos institucionais e a natureza conflitiva dessas decisões.13
Contrariando certo ideal tecnocrático, que parecia animar analistas e políticos na segunda
metade do século XX, hoje percebe-se não ser possível (nem desejável) eliminar, por
exemplo, o componente “político” das decisões das políticas públicas. Isso implica, entre
outras coisas, levar-se em consideração a perspectiva dos diversos interessados
(stakeholders) na política em questão. Ademais, sabe-se que os arcabouços
organizacionais e político-institucionais também podem exercer influência significativa
sobre os tipos de recursos informacionais usados nas decisões. Portanto, a resposta certa
à questão sobre a melhor evidência para julgar uma política pública dependerá de um
conjunto de fatores contextuais que a literatura de análise de políticas públicas tem
desenvolvido nos últimos anos. Tal intervenção será melhor para quem? Em que arranjos
institucionais? Em quais tempos e lugares?14
Em geral, usa-se o termo “evidência” para se referir a dados, relatos e observações que
ajudam a apoiar uma conclusão sobre um tema (TOMA et al., 2017). As evidências também
são susceptíveis ao contexto, pois as observações muitas vezes são relacionadas a fatores
específicos, o que torna necessárias avaliações consistentes sobre a aplicabilidade da
evidência em outros cenários. Diferentemente da MBE, o conhecimento científico aplicável
ao contexto das políticas públicas nas PIEs, consubstanciado nos resultados de pesquisas
científicas sobre temas e questões prioritárias de saúde pública, concentra-se em decisões
sobre populações em vez de sobre indivíduos. Embora as áreas compartilhem alguns
princípios comuns, tal como o ceticismo sobre os supostos benefícios de uma intervenção,
a dinâmica, valores e finalidades para o uso de evidências são diferentes nas duas áreas
(LOMAS et al., 2005; COOKSON, 2005).
13
Parkhurst (2022) apresenta um survey da literatura recente sobre a complexidade do uso de evidências
em políticas públicas. Os estudos aplicam teorias de um amplo conjunto de disciplinas que vão da ciência
política aos estudos de ciência e tecnologia e passam pelas ciências cognitivas. Esse esforço reflexivo,
empreendido nos últimos vinte anos, contribuiu enormemente para o entendimento acerca das limitações e
motivações dos tomadores de decisão em políticas públicas, a influência dos arranjos e sistemas
institucionais, bem como o papel das funções e atividades próprias dos diferentes espaços de política em
que as decisões são tomadas.
14
Walls et al. (2017) dão um exemplo da complexidade dessas questões e analisam a política
antitabagismo no Camboja. Para os gestores da saúde pública era mais importante convencer as
autoridades econômicas daquele país de que seria viável controlar o tabaco sem graves consequências
econômicas do que comprovar os efeitos maléficos do tabagismo para a saúde humana. Ora, conseguiu-se
esse objetivo com uma pesquisa comparativa dos países vizinhos que empreenderam essa política e não
com revisões sistemáticas de ECRs.

As evidências globais – conjunto de evidências científicas acessíveis globalmente – são
pontos de partida importantes para a avaliação sobre potenciais efeitos de intervenções,
pois efeitos em um contexto específico podem levar a conclusões errôneas sobre o que se
esperar de uma intervenção. As evidências locais (produzidas e disponíveis em cenários
específicos) podem contribuir para julgamentos sobre problemas, opções para enfrentar os
problemas e estratégias de implementação (LAVIS et al., 2012). Além disso, a
aplicabilidade ou transferibilidade de evidências globais para um contexto específico requer
o reconhecimento de elementos somente acessíveis por meio das evidências locais, as
quais podem influenciar a adoção e a implementação de opções de políticas de forma
determinante para o seu sucesso ou fracasso.
Por sua vez, nem toda evidência possui o mesmo grau de confiabilidade. Por isso, é
necessário avaliar quanta confiança é possível atribuir às evidências disponíveis, sejam
essas globais ou locais. No caso das evidências advindas de estudos científicos, entre
outros aspectos, é possível avaliar se o delineamento foi adequado à pergunta de pesquisa,
se existem possíveis vieses que tornem os resultados menos confiáveis. Em especial, os
resultados precisam ser apresentados de forma precisa e fiel às observações. As
evidências de pesquisa com maior robustez metodológica são geralmente mais
convincentes do que observações ao acaso ou de forma isolada, em face da sua
intersubjetividade, fortalecida quando são usados métodos transparentes e rigorosos na
coleta, análise e síntese dos dados.
Em geral, oito formas diferentes de evidências são encontradas na tomada de decisão,

incluindo-se:
• Análise de dados;
• Modelagem;
• Avaliações de diferentes tipos, inclusive AIPS;
• Pesquisa do comportamento/de implementação;
• Informações qualitativas;
• Síntese de evidências para políticas de saúde;
• Avaliação de tecnologias em saúde/análise de custo-efetividade;
• Diretrizes (guidelines) para a prática (clínica, de serviços ou de políticas).
Essas formas podem estar inter-relacionadas. Por exemplo, uma avaliação que apresenta
um ensaio clínico randomizado também pode incorporar evidências advindas de análises
de dados, de informações qualitativas e de uma análise de custo-efetividade. Da mesma

647
forma, um estudo de caso pode se basear em informações qualitativas sobre experiências
e preferências e em evidências quantitativas a partir da análise de dados, modelagem e
avaliações (COMISSÃO [...], 2022).
Dessa forma, cada etapa do processo de tomada de decisão pode ser mapeada para
diferentes formas de evidência especialmente úteis. Por exemplo, para entender um
problema e suas causas a análise de dados pode ajudar a delimitar a magnitude de um
problema, compará-lo no tempo e no espaço e contribuir com subsídios para o processo
de priorização. Por seu turno, estudos qualitativos podem ajudar a compreender a
perspectiva das pessoas que vivenciam o problema, suas causas e consequências.
Da mesma maneira, para selecionar dentre as opções disponíveis – a serem endereçadas

ao problema e suas causas – é preciso identificar seus potenciais benefícios, danos, custos,
adaptações necessárias e suas consequências, bem como os pontos de vista e
experiências das partes interessadas. Para isso, diferentes tipos de avaliações podem ser
úteis, tais como estudos de eficácia (ECRs para efeitos clínicos), estudos observacionais
(coortes que acompanham populações expostas a determinadas intervenções), avaliações
de tecnologias em saúde, análises de custo-efetividade (para determinar se uma nova
tecnologia é superior a outra disponível), avaliações de processo, as quais examinam como
e por que determinada opção funcionou em um contexto específico, além de estudos
qualitativos, para entender o que é importante para os cidadãos afetados pelas decisões
que serão tomadas.
A identificação de barreiras e facilitadores, por outro lado, é essencial para a implementação

das intervenções e estratégias de uma política ou programa. Descobrir o que e quem
provavelmente atrapalhará ou ajudará a alcançar os impactos desejados pode ser essencial
para o sucesso de uma política. Nesse caso, estudos qualitativos podem ser as melhores
fontes de evidência, bem como para compreender quais estratégias podem ajudar a
superar potenciais barreiras, pesquisas focadas em comportamento podem ser muito úteis.
Por fim, o monitoramento da implementação e avaliação dos impactos podem contar com
a análise de dados e, novamente, com diferentes tipos de avaliações, entre elas as AIPS.
Assim, existe diversidade entre as evidências hoje consideradas nas PIEs, a qual se
expande também sobre os limites das políticas sociais. Trata-se de uma visão abrangente
e inclui diferentes tipos de informação e diferentes formas de acessá-la.

As oito formas de evidências usadas para subsidiar decisões de políticas públicas, acima
explicadas, são apresentadas sinteticamente na Figura 1.
Figura 1 – Oito formas de evidências usadas como fontes de

informações para subsidiar as decisões de políticas públicas
Fonte: Comissão Global de Evidências para Enfrentar Desafios Sociais (2022, p. 44).
Nota: *ATS e análise de custo-efetividade estão agrupadas porque, em geral, são conduzidas
para os mesmos tipos de produtos / serviços e pelos mesmos grupos de evidências.
3 Exemplos de AIPS com diferentes abordagens

Nesta seção, analisam-se exemplos reais de AIPS, para evidenciar aspectos relevantes
para a temática deste capítulo, em especial para identificar respostas para a pergunta-
chave: como as AIPS lidam com as evidências no mundo real?
Apresentam-se quatro exemplos de AIPS publicadas e identificam-se informações

relacionadas com sua jurisdição; a política avaliada; as abordagens utilizadas e por que
isso foi importante; as relações com a perspectiva ampliada de evidências; e as lições para
a discussão nacional sobre AIPS. Espera-se que esses exemplos possam contribuir com a
discussão sobre as abordagens metodológicas complementares que podem ser usadas em
uma AIPS.

649
Quadro 1 – Exemplos e características de AIPS no mundo real
Características Caso 1 Caso 2 Caso 3 Caso 4

Efetividade de uma
Access to, use of and Beyond the income effect: Effect of integrated
intervenção de base
satisfaction with health impacts of conditional management of childhood
escolar sobre o tempo de
services among adults cash transfer programs on illness (IMCI) on health
tela de estudantes do
enrolled in Brazil’s Family private investments in worker performance in
ensino médio (HARDMAN
1. Título e referência Health Strategy: evidence human capital (CRUZ; Northeast-Brazil (AMARAL
et al., 2014)
from the 2008 National ZIEGELHOFER, 2014). et al., 2004)
Household Survey
(MACINKO; LIMA COSTA,
2008).
Municipal, Florianópolis e Estadual, Região NE,

2. Jurisdição Nacional, Brasil Nacional, Brasil
Recife Brasil
Atenção Integrada às
Doenças Prevalentes na
Projeto Saúde Boa Infância - AIDPI
(Intervenção de base (estratégia
escolar para promoção da multidimensional para
Estratégia Saúde da Programa Bolsa Família
3. Política avaliada / tipo atividade física e hábitos melhorar a saúde infantil,
Família (Atenção Primária (Transferência de Renda
de intervenção alimentares saudáveis com foco no(a): i)
à Saúde) Condicional)
sobre indicadores de desempenho dos
tempo de tela de profissionais de saúde; ii)
escolares) organização dos serviços
de saúde; e iii) práticas
familiares e comunitárias)
Este estudo utilizou dados Esse estudo analisou o É um estudo, Trata-se de um
4. Abordagens utilizadas e da Pesquisa Nacional de efeito causal do Programa randomizado e controlado, experimento quase-
porque isso foi importante Saúde Domiciliar (PNAD, Bolsa Família, aplicando sobre os efeitos das natural, em que os autores
IBGE) de 2008. Os modelos empíricos de intervenções do projeto examinam o efeito da
continua

continuação
desfechos de interesse regressão, a partir de “Saúde na Boa” em AIDPI sobre a qualidade
estavam relacionados com variáveis de renda e as escolas de duas capitais da assistência prestada a
o acesso, utilização e parcelas de gastos com brasileiras. A finalidade crianças abaixo de cinco
satisfação com os educação e saúde, dessa intervenção foi anos em consultas
serviços de atenção incluindo alimentação. O promover a prática de realizadas em serviços de
primária, os quais modelo usado atividades físicas e saúde. Foi realizado um
dependem de muitos possibilitaria analisar se o hábitos alimentares survey em 24 serviços de
fatores de confundimento. PBF impacta as decisões saudáveis em estudantes saúde (12 em que os
O estudo controlou as sobre as despesas das do ensino médio do profissionais de saúde
variáveis individuais famílias além de apenas o período noturno de foram treinados na
relacionadas com fatores efeito renda. escolas públicas estaduais estratégia AIDPI), em
predisponentes (ex.: sexo, de duas capitais quatro estados do NE
idade, nível educacional e brasileiras, por meio das brasileiro (BA, CE, PB e
necessidades de saúde), intervenções de um PE). Avaliou-se a
autoavaliação de saúde e programa denominado qualidade da assistência
o autorreferenciamento de Saúde Boa. O estudo prestada às crianças entre
limitações de mobilidade analisou indicadores 2 meses e 5 anos de
ou diagnóstico médico relacionados ao tempo de idade que frequentavam
prévio para condições tela dos estudantes em os serviços. Os
crônicas específicas, além dois grupos, que indicadores de
das características da receberam diferentes desempenho dos
residência do abordagens, e considerou profissionais de saúde
respondente, incluídos fatores de confusão incluíam dimensões como:
acesso ao abastecimento relacionados com gênero, avaliação da criança,
de água interna e região idade, ocupação, cidade, classificação da doença,
geográfica. nível de atividade física e tratamento e comunicação
a variável do tempo de com os pais ou
tela, na linha de base. cuidadores. Essa
abordagem metodológica
permitiu a produção de
continua

651
continuação
evidências confiáveis para
a avaliação de um
importante aspecto da
estratégia AIDPI e para o
Programa Saúde na
Família. Em particular,
corroborou-se a hipótese
de que o treinamento de
profissionais de saúde na
estratégia AIDPI melhora
a qualidade da atenção à
saúde em crianças de
zero a cinco anos em
estados do NE brasileiro.
Esta avaliação de impacto Apesar desta avaliação O estudo avaliou a
Esta avaliação de impacto
produziu evidências a utilizar um desenho qualidade do serviço
produziu evidências a
partir dos dados oficiais da experimental (ensaio oferecido pelos
partir dos dados oficiais da
Pesquisa de Orçamento controlado e profissionais de saúde
PNAD disponibilizados
Familiar – POF), 2008- randomizado), as treinados em AIDPI, em
pelo IBGE e incluiu a
2009, disponibilizados intervenções do projeto comparação com os
dimensão ‘Satisfação’
5. Relações com a pelo IBGE e explorou Saúde Boa não permitiram profissionais não
entre os desfechos
perspectiva ampliada de dimensões de impacto do a aferição de causalidade treinados. As dimensões
analisados, representando
evidências (mais PBF relacionadas com direta, em face dos avaliadas envolvem, entre
a compreensão dos
interpretativo) mudanças nos diferentes inúmeros fatores de outras coisas, aspectos
pesquisadores sobre a
tipos de despesas das confundimento qualitativos, como a
importância das
famílias beneficiárias do encontrados. Esta AIPS avaliação da criança
informações relacionadas
programa, especialmente utilizou questionários para doente e a comunicação
com dimensões de
relacionadas com o coletar informações com os pais das crianças
‘qualidade’, refletidas nas
acesso e consumo a bens, individuais que puderam atendidas. Portanto, o
percepções que os
produtos e serviços ser convertidas em estudo abre-se para
continua

continuação
cidadãos têm sobre a relacionados com as evidências locais sobre os formas qualitativas de
política avaliada. condições de saúde. efeitos das intervenções evidências usadas para
implementadas para um subsidiar decisões de
desfecho relevante. políticas públicas,
"dialogando" assim com
um conceito mais amplo
de evidência, para além
das evidências
meramente causais-
experimentais-
quantitativas.
Esta avaliação de impacto A metodologia desse
se deu em nível estudo permitiu uma
submunicipal e produziu avaliação detalhada de
evidências sobre um conjunto de aspectos
intervenções complexas relevantes (embora em
voltadas para grupos número limitado) de uma
É muito importante considerar os dados disponíveis em populacionais estratégia de saúde
diferentes fontes oficiais para delinear uma nova AIPS. heterogêneos e com abrangente e complexa
6. Lições para aproveitar Muitas vezes essas evidências relacionadas com dinâmica social própria. como a AIDPI, em
na discussão nacional datasets podem ser extremamente úteis para a Esta experiência de pequenos municípios de
sobre AIPS produção, em tempo oportuno e com economicidade, de avaliação demonstra a estados do NE brasileiro.
novas evidências relacionadas com políticas e viabilidade e utilidade de Reforçou-se a importância
programas. abordagens para apoiar do uso de indicadores
decisões locais sobre a validados e padronizados
implementação de internacionalmente pela
políticas e programas. OMS. Além disso, uma
das limitações dessa
pesquisa diz respeito a um
possível viés nos
continua

653
conclusão

resultados, derivado do
alto índice de rotatividade
dos profissionais de saúde
nos pequenos municípios
nordestinos. Essa
limitação alerta futuros
estudos de AIPS do
gênero sobre o desafio
metodológico de se lidar
com a alta rotatividade
dos profissionais de
saúde. Finalmente, o
estudo em pauta fornece
importante subsídio
metodológico e evidencial
para a elucidação das
cadeias causais de
avaliação do impacto da
AIDPI na redução da
mortalidade infantil no
Brasil.
Fonte: Macinko e Lima Costa (2008); Cruz e Ziegelhofer (2014); Hardman et al. (2014).

O Quadro 1 mostra diversas formas de avaliação de impacto em políticas de saúde. Alguns
estudos valem-se de ensaios randomizados (caso 3), outros de modelos de regressão
(caso 2), outros ainda combinam experimentos quase-naturais com o método de survey
(caso 4). Em comum, os casos apresentados ilustram análises de relações causais entre
intervenções de políticas e certas variáveis-resultado, de acordo com os modelos lógicos
que inspiraram o desenho dessas políticas.
Essa pequena amostra sugere haver grande variedade de tipos de análises de impacto em
políticas de saúde. Essa variedade, por sua vez, quando vista sob a ótica abrangente da
abordagem que se defende neste capítulo – o “ecossistema de evidências” – ganha certa
unidade na rede de conexões possíveis com as outras formas de evidências (vide
novamente a Figura 1).
Assim, quando se analisa o primeiro caso mostrado no Quadro 1, vê-se uma AIPS cujas
variáveis de resultado incluem a satisfação do usuário com os serviços de saúde. Isso
porque uma das perguntas do estudo pode ser assim formulada: os participantes da
Estratégia de Saúde na Família (ESF) teriam mais acesso, utilização e satisfação com
serviços de atenção primária à saúde do que os não participantes? Ou seja, as intervenções
dessa estratégia melhoram aquelas experiências (acesso, uso e satisfação) para os
participantes? Se a “satisfação” é uma variável qualitativa – pois assume valores
qualitativos como satisfeito/não satisfeito – essa deve refletir certos atributos ou juízos
subjetivos. Assim, a elucidação das cadeias causais que medeiam a intervenção pública
(ações da ESF) e a satisfação do usuário do serviço necessita de informações as quais,
por assim dizer, vão além do método da avaliação de impacto. Em especial, no
desvelamento mais profundo dessa cadeia causal, poderiam ser úteis estudos de caso e
entrevistas em profundidade com os usuários do serviço. Portanto, o caso 1 pode conectar-
se com outros elementos do ecossistema de evidências e receber complementos
importantes para a compreensão mais profunda acerca da natureza do impacto causado
pela política pública em questão.
No segundo caso, pergunta-se se o Programa Bolsa-Família (PBF) de alguma forma induz

seus beneficiários a gastarem mais com saúde. Apesar de o PBF não ser uma política de
saúde stricto sensu, mas antes uma política social transversal, é possível que acarrete
efeitos para a saúde das pessoas; por exemplo, por meio de mudanças nas decisões de
gasto com a saúde individual ou familiar. Ao corroborar a hipótese causal em pauta, o
estudo amplia a perspectiva do que sejam os impactos das políticas públicas na dimensão

655
da saúde, pois a saúde das pessoas pode ser afetada por medidas tomadas em áreas de
políticas distintas da própria área de saúde. Portanto, o tipo de avaliação de impacto
realizada nesse estudo tem o mérito de conectar a saúde com diferentes áreas de política,
a lembrar que as dimensões do bem-estar humano – ou as “capacitações”, na expressão
de Sen (2000) – podem estar conceitual e causalmente conectadas. Nesse sentido,
análises de impacto multidimensionais e multidisciplinares são bem-vindas. O conceito de
ecossistema de evidências acolhe naturalmente essas perspectivas analíticas mais
abrangentes.
No terceiro caso apresentado no Quadro 1, investiga-se o Programa Saúde Boa. As

medidas desse programa afetariam o tempo em que jovens estudantes do ensino médio,
em escolas públicas de duas capitais brasileiras, passam diante da tela de smartphones
(supostamente em jogos ou redes sociais)? Partindo-se do pressuposto de que os jovens
costumam passar demasiado tempo diário em atividades lúdicas usando smartphones – e
que esse não é um comportamento saudável – o estudo procurou estimar os efeitos causais
do programa Saúde Boa sobre essa variável (“tempo de tela”). Essa análise de impacto,
contudo, não logrou êxito ao verificar qualquer relação causal, porquanto não foi possível
controlar outras variáveis que afetam o fenômeno. Vale dizer, talvez a variável “tempo de
tela” seja afetada por fatores não contemplados entre as variáveis de controle do estudo e
com essas interaja de formas complexas. Nesse caso, pode ser oportuno um estudo
qualitativo (estudos de caso, entrevistas, estudos etnográficos etc.) para se entender
melhor os contextos que levam os adolescentes a passarem seu tempo diante das telas
dos smartphones. Nesse aspecto, ao abrir o foco para os métodos qualitativos, a
perspectiva do ecossistema de evidências pode contribuir para a AIPS.
Por fim, o caso 4 do Quadro 1 apresenta um estudo que avaliou a qualidade do serviço
oferecido pelos profissionais de saúde treinados em Atenção Integrada às Doenças
Prevalentes na Infância (AIDPI), em comparação com os profissionais não treinados. As
dimensões avaliadas envolvem, entre outras coisas, aspectos qualitativos, como a
capacidade do profissional de avaliar a criança doente e a comunicação com os pais das
crianças atendidas. Portanto, o estudo se abre para formas qualitativas de evidências
usadas para subsidiar decisões de políticas públicas, “dialogando” assim com um conceito
mais amplo de evidência, para além das evidências meramente causais-experimentais-
quantitativas.

4 A importância das evidências científicas em políticas de saúde e a ampliação do
uso de evidências em AIPS
Políticas públicas e programas existem para abordar problemas em diferentes setores da

sociedade, considerados prioritários e inseridos na agenda de governo. As políticas
públicas de saúde não são diferentes, por priorizarem os problemas de saúde pública que
têm diante de si, os quais muitas vezes são delimitados de forma insuficiente ou superficial,
para propor um conjunto de intervenções, também muitas vezes delimitadas e descritas de
forma insuficiente e superficial. Assim, as políticas públicas de saúde teriam o poder de
mudar a história do problema em questão e de produzir resultados positivos para os grupos
afetados, favorecendo a melhoria da vida dessas pessoas e, consequentemente, da
sociedade em geral.
No entanto, nem sempre políticas públicas alcançam os resultados que seus formuladores
desejam, porquanto ainda é pouco transparente e sistemático o processo de tomada de
decisão para a formação da agenda decisória e escolha dos problemas prioritários. Por
exemplo, é comum que a alternância de gestores produza a descontinuidade das
prioridades estatuídas anteriormente. Por essa razão, o conjunto de intervenções que
comporão uma política pública e apoiarão sua implementação muitas vezes carece de
consistência e efetividade.
Uma política pública formulada de maneira assistemática, pouco transparente, sem

participação dos legítimos interessados e que não utiliza evidências para subsidiar
suas discussões e decisões, provavelmente sofrerá não somente de lacunas de
implementação, mas também de monitoramento e avaliação. Isso porque dificilmente
incluirá um modelo lógico ou uma teoria de mudança estruturada em que estejam
explicitados os problemas prioritários, suas causas e as intervenções escolhidas, as quais
serão implementadas para produzir as mudanças esperadas pelos diferentes
interessados na política pública em questão.
No caso de ineficácia das intervenções – falhas na implementação ou ocorrência de

efeitos inesperados ou indesejados – é importante perceber isso de forma oportuna, de
modo que a política possa ser revista e adequada a tempo. Assim, uma política
formulada deveria sempre compreender um “quadro de referência” para o seu
monitoramento e avaliação, inclusive de impactos, além de explicitar os nexos entre as
diferentes facetas e causas do problema abordado e as intervenções propostas.

657
É nesse contexto que a incorporação de evidências científicas, como os subsídios das
AIPS, pode contribuir de forma importante para o desenvolvimento de políticas públicas
cada vez mais efetivas. As evidências científicas estão disponíveis de forma dispersa e
pode ser muito difícil para o usuário da evidência reunir sozinho todos os resultados de
estudos primários sobre uma questão de interesse para a tomada de decisão na formulação
de um novo programa ou política de saúde. Esse trabalho de síntese e tradução do
conhecimento global disponível sobre temas de saúde pública é realizado por muitos
grupos ao redor do mundo e estão à disposição muitos repositórios 15
de sínteses de
evidências em diferentes formatos, incluindo-se desde revisões sistemáticas dos mais
variados tipos (quantitativas e qualitativas) até mapas de evidências globais, que reúnem
uma gama infindável de recursos úteis para a problematização das políticas públicas, nas
suas etapas de formulação, implementação e avaliação.
A gama diversificada de documentos e recursos que sintetizam e tornam acessíveis

evidências obtidas com diferentes abordagens é crescente e representa o crescimento
exponencial do interesse acadêmico sobre mecanismos e plataformas de tradução do
conhecimento (do inglês knowledge translation), conceito reconhecido globalmente como
um processo dinâmico e iterativo de síntese, intercâmbio, disseminação e aplicação ética
do conhecimento para melhorar os resultados em sistemas e políticas de saúde
(ARMSTRONG et al., 2006; STRAUS et al., 2009; LAROCCA et al., 2012; ANDRADE;
PEREIRA, 2020).
Além das revisões sistemáticas que abordam perguntas relacionadas aos efeitos
comparativos de diferentes tecnologias em saúde – indispensáveis para apoiar escolhas
de incorporação e gestão de tecnologias – tem havido crescente disponibilidade de sínteses
de evidências globais sobre diferentes tópicos e arranjos de sistemas de saúde
(governança, financiamento, prestação de serviços e implementação etc.). Tais sínteses
representam uma fonte de alto valor para informar as discussões no âmbito nacional e local
na formulação, implementação e avaliação de políticas e programas de saúde.
Assim, o termo “avaliação de impacto” poderia ser usado para referir-se tanto à avaliação
dos resultados prováveis das intervenções previstas nos programas e políticas – mesmo
na sua fase de formulação – quanto àquelas planejadas para avaliar a implementação e os
15
Exemplos de repositórios de sínteses de evidências para Sistemas de Saúde e Saúde Pública:
https://www.healthsystemsevidence.org/; https://healthevidence.org/; https://sites.bvsalud.org/pie/pt/biblio;
https://africacentreforevidence.org/evidence-synthesis/; https://www.veredas.org/publicacoes/. Exemplos de
repositórios de mapas de evidência: https://www.3ieimpact.org/what-we-offer/evidence-mapping;
https://mtci.bvsalud.org/pt/mapas-de-evidencia-2/; https://www.unicef-irc.org/evidence-gap-maps; e
https://www.campbellcollaboration.org/evidence-gap-maps.html.

resultados, realizadas após o lançamento dos programas e políticas. Muitos formuladores
resultados, realizadas após o lançamento dos programas e políticas. Muitos formuladores
de políticas – e mesmo outros stakeholders – podem não perceber a importância das
de políticas – e mesmo outros stakeholders – podem não perceber a importância das
avaliações de impacto porque seu mandato é limitado no tempo ou suas decisões são
avaliações de impacto porque seu mandato é limitado no tempo ou suas decisões são
motivadas por fatores ideológicos. Porém, a institucionalização das AIPS pode ter várias
motivadas por fatores ideológicos. Porém, a institucionalização das AIPS pode ter várias
vantagens, além de ajudar a reduzir o risco político e social, por permitir o reconhecimento
vantagens, além de ajudar a reduzir o risco político e social, por permitir o reconhecimento
de informações imperfeitas para subsidiar as decisões sobre os programas públicos e
de informações imperfeitas para subsidiar as decisões sobre os programas públicos e
acionar maneiras de mudar o curso se os programas não funcionarem conforme o esperado
acionar maneiras de mudar o curso se os programas não funcionarem conforme o esperado
(OXMAN, 2010).
(OXMAN, 2010).
O valor da evidência para as políticas públicas advém de sua aplicabilidade ser passível de
O valor da evidência para as políticas públicas advém de sua aplicabilidade ser passível de
avaliação. Para isso, é necessário não apenas adotar uma perspectiva crítica sobre a
avaliação. Para isso, é necessário não apenas adotar uma perspectiva crítica sobre a
confiança a ser depositada nos achados desse tipo de estudo, mas, acima de tudo, uma
confiança a ser depositada nos achados desse tipo de estudo, mas, acima de tudo, uma
análise sistemática sobre o quanto esses têm sentido para o contexto político-social em
análise sistemática sobre o quanto esses têm sentido para o contexto político-social em
que uma nova política será formulada e implementada. Além disso, mecanismos e
que uma nova política será formulada e implementada. Além disso, mecanismos e
estratégias de tradução do conhecimento podem melhorar a disseminação dos resultados
estratégias de tradução do conhecimento podem melhorar a disseminação dos resultados
das AIPS e é essencial que se possa incluir esse tipo de estudo em sínteses de evidências
das AIPS e é essencial que se possa incluir esse tipo de estudo em sínteses de evidências
futuras que abordem as intervenções avaliadas.
futuras que abordem as intervenções avaliadas.
Por fim, é importante que as AIPS adotem uma perspectiva compreensiva sobre as
Por fim, é importante que as AIPS adotem uma perspectiva compreensiva sobre as
evidências, considerando-se a diversidade das questões de interesse envolvidas, as quais
evidências, considerando-se a diversidade das questões de interesse envolvidas, as quais
podem requerer diferentes abordagens metodológicas para serem respondidas e
podem requerer diferentes abordagens metodológicas para serem respondidas e
problematizadas. Também é importante se reconhecer que as AIPS integram o
problematizadas. Também é importante se reconhecer que as AIPS integram o
ecossistema de evidências como um dos tipos de evidência científica de alto valor para a
ecossistema de evidências como um dos tipos de evidência científica de alto valor para a
tomada de decisão, à medida que provê informações importantes sobre os efeitos de
tomada de decisão, à medida que provê informações importantes sobre os efeitos de
diferentes naturezas que uma política proporcionou em diferentes contextos de
diferentes naturezas que uma política proporcionou em diferentes contextos de
implementação.
implementação.
5 Considerações finais: síntese do argumento e uma agenda de pesquisa sobre o uso

5 Considerações finais: síntese do argumento e uma agenda de pesquisa sobre o uso
de evidências em AIPS
de evidências em AIPS
Este capítulo buscou responder a três perguntas inter-relacionadas: i) em que medida as
Este capítulo buscou responder a três perguntas inter-relacionadas: i) em que medida as
AIPS são influenciadas pelas limitações conceituais do movimento das políticas públicas
AIPS são influenciadas pelas limitações conceituais do movimento das políticas públicas
baseadas em evidências (PPBEs)? ii) como tais limitações podem introduzir vieses
baseadas em evidências (PPBEs)? ii) como tais limitações podem introduzir vieses
negativos nas decisões em políticas de saúde? iii) o que se propõe para superar aquelas
negativos nas decisões em políticas de saúde? iii) o que se propõe para superar aquelas
limitações conceituais e evitar os mencionados vieses negativos no uso das AIPS e das
limitações conceituais e evitar os mencionados vieses negativos no uso das AIPS e das
evidências nas políticas de saúde em geral?
evidências nas políticas de saúde em geral?

659
Em nossa análise, identificamos um conceito restrito de evidência ligado aos pressupostos
das PPBEs e à medicina baseada em evidência (MBE) – ao menos nos primórdios desses
movimentos – bem como encontrado na ciência econômica e em seus métodos de
avaliação da política macroeconômica. Esse conceito – que se pode chamar de “concepção
tradicional” – reduz o significado de “evidência” às evidências científicas, empírico-
experimentais, de natureza quantitativa, que procuram revelar as causas dos fenômenos e
que podem ser formalizadas matematicamente. Em geral, nos movimentos que valorizam
as evidências científicas para subsidiar as políticas públicas, mesmo hoje em dia, há o
pressuposto ou princípio normativo implícito, o qual estabelece que as evidências
científicas, tal como caracterizadas anteriormente, são (em sentido absoluto) as melhores
evidências para subsidiar as políticas públicas.
Ainda que se tenham reconhecido, em algum grau, as limitações da mencionada

concepção tradicional, essa tem condicionado as AIPS e as avaliações de tecnologias de
saúde (ATS) até os dias atuais. As AIPS teriam “herdado historicamente” a concepção
tradicional por meio de um conceito clássico de avaliação de impacto que a identifica com
um tipo específico de evidência empírica; essa se constituiria de um teste de hipótese
causal, em que se procura mensurar estatisticamente os efeitos (“impactos”) de
determinada intervenção de política pública, com base em critérios previamente
estabelecidos para corroborar ou rejeitar a hipótese.
O método elucidativo adotado neste capítulo recorre à historiografia do uso de evidências

em políticas públicas, a fim de mostrar a gênese histórica daquela concepção tradicional.
Procura-se também mostrar as articulações das políticas de saúde com outras áreas de
políticas públicas. Por meio dessas articulações – que envolvem as avaliações de
programas em educação, combate à pobreza, justiça criminal e políticas macroeconômicas,
entre outras – mostra-se como o campo das avalições de políticas de saúde consolidou um
núcleo conceitual próprio acerca das evidências, conquanto esse tenha recebido influências
das outras áreas. Evidências derivadas da epidemiologia, as sínteses estatísticas, meta-
análises e os guidelines são exemplos de um conjunto de evidências que distingue a área
da saúde.
O ideal de uma evidência científica, ao modo da concepção tradicional, tem tido

historicamente a sua aplicação problematizada no cotidiano das práticas decisórias das
políticas e sistemas de saúde. Essa tensão entre o ideal e as práticas do dia a dia das
políticas levou a uma autocrítica dos movimentos das PPBEs e MBE, bem como ao

surgimento das políticas informadas por evidências (PIEs), as quais tendem a uma
concepção mais ampla do que sejam boas evidências para apoiar as decisões em políticas
públicas de saúde.
Esse processo de autocrítica e ampliação conceitual parece ter abrangido também as AIPS
em certa medida. Em vez de restringir-se a mensurar estatisticamente os efeitos de
determinada intervenção a posteriori, as AIPS passaram a avaliar os efeitos prováveis das
intervenções previstas nos programas e políticas de saúde. Para isso, pode-se usar variada
gama de ferramentas e métodos e incluírem-se as simulações computacionais.
A evolução histórica do conceito de evidências para subsidiar decisões em políticas

públicas culmina com o mais recente Relatório da Comissão Global de Evidências para
Enfrentar Desafios Sociais (2022), o qual apresenta oito formas de evidências: análise de
dados; modelagem; avaliações de diferentes tipos, inclusive AIPS; pesquisa do
comportamento/de implementação; informações qualitativas; síntese de evidências para
políticas de saúde; avaliação de tecnologias em saúde/análise de custo-efetividade; e
diretrizes (guidelines) para a prática (clínica, de serviços ou de políticas). Essas formas
podem estar inter-relacionadas. A inclusão de estudos qualitativos nessa lista (por exemplo,
estudos de casos) representa um significativo avanço conceitual no estudo das evidências
aplicadas a políticas públicas, inclusive na área de saúde.
O pressuposto normativo, segundo o qual as evidências científicas, empírico-

experimentais, de natureza quantitativa – as quais procuram revelar as causas dos
fenômenos e que podem ser formalizadas matematicamente – são as melhores evidências
para subsidiar as políticas públicas, tem limitações epistemológicas e pragmáticas. De uma
parte, o pressuposto ignora a complexidade do objeto das políticas públicas. Esse objeto –
que se constitui das realidades sociais sobre as quais intervêm as políticas públicas –
caracteriza-se, entre outros aspectos, pela incerteza, multidimensionalidade,
multicausalidade. Em uma palavra, trata-se de um objeto complexo em um sentido
epistemológico. Logo, não pode ser adequadamente entendido apenas com evidências
científicas do tipo anteriormente mencionado. Em particular, o conceito de “causalidade
estatística” enfoca apenas as “causas” que transcendem o nível do agente individual.
Assim, características mais subjetivas, como o papel das crenças e valores nas decisões
individuais – e que sem dúvida afetam os resultados das políticas – muitas vezes escapam
àquelas evidências científicas. Portanto, as AIPS constituem-se de um tipo de explicação
em que o agente individual “desaparece” e é reduzido a um conjunto de características de

661
fundo traduzidas em variáveis operacionalizadas estatisticamente. Ainda que essa visão de
causalidade seja relevante para se estabelecerem relações gerais (evidências globais)
sobre determinada política de saúde, pode ser insuficiente sobretudo naqueles contextos
em que o exercício do poder de agência das pessoas que constituem o público-alvo das
políticas seja relevante para explicar os resultados e impactos dessas. Por exemplo,
transferir dinheiro para as pessoas prevenirem-se contra a contaminação por HIV não
acarretará necessariamente os mesmos efeitos para pessoas vivendo em contextos
diferentes (tempos, lugares, culturas etc.). Um dos motivos disso é que as pessoas reagem
de formas diferentes à mesma intervenção.16
Além de limitações epistemológicas, o dito pressuposto normativo padece de limitações

práticas e essas são as mais importantes. Como norma de ação, o pressuposto implica que
as evidências científicas, tais como definidas na concepção tradicional, devem ser
preferencialmente usadas a outros tipos de informações nas políticas públicas. Com isso,
ignora-se a complexidade e o caráter contextual dos processos decisórios em políticas
públicas, inclusive de saúde. A verdade é que muitos fatores, além das evidências
(científicas e de outros tipos) condicionam a tomada de decisões dos policymakers. Faz-se
referência a fatores relacionados a (DAVIES, 2004): experiência, expertise e juízos dos
tomadores de decisão; recursos; valores; hábitos e tradição; lobistas, grupos de pressão e
consultores; pragmática e contingências, entre outros. Restrições orçamentárias, pressão
de grupos de interesse, convicções pessoais, interesses e preferências dos tomadores de
decisão e/ou de grupos de interesse são exemplos adicionais de fatores “não evidenciais”
que afetam as decisões dos policymakers. Portanto, em tese, há contextos decisórios em
políticas públicas cuja análise seria mais útil e realista se lançasse mão de informações
baseadas em raciocínios mais casuísticos do que científicos.
Em um contexto decisório específico, frequentemente, as evidências científicas podem ter

sua aplicabilidade limitada. Por exemplo, pode haver incertezas que impeçam que seu uso
seja direto ou linear. Muitas vezes, o ambiente de incerteza que circunda uma decisão de
política pública deriva do próprio caráter conflitivo do processo de identificação dos
problemas sociais e de suas escalas de prioridades. Esse processo é naturalmente
complexo e de construção dialética e dialógica. Disputas de poder ocorrem aqui. Ademais,
os critérios usados na priorização dos objetivos sociais são vários, incluindo-se equidade,
direitos humanos, aceitabilidade, decência e outros. Tudo isso tende a tornar “opacos” os
Para uma crítica profunda ao conceito de causalidade, vide capítulo 7 desta coletânea (ALMEIDA-FILHO;
16
COUTINHO, 2022).

problemas sociais e os objetivos de políticas envolvidos, o que dificulta a aplicabilidade das
evidências científicas.
É preciso evitar que os métodos de avaliação dominem totalmente o estabelecimento dos

problemas de políticas. A seleção desses problemas é um processo complexo e de
implicações éticas e políticas para a vida das pessoas, o qual deve ser orientado
fundamentalmente pelos atores sociais interessados. Por isso, a escolha dos métodos de
pesquisa e avaliação de políticas deve subordinar-se aos problemas, objetos, temas e
tópicos desses; não o contrário. Isso não quer dizer que na prática cotidiana das políticas
públicas não possa ocorrer interação entre a priorização normativa dos problemas e os
métodos de análise e avaliação. Contudo, deve-se evitar a “tecnocracia do método” no
processo de identificação dos problemas e escolha das prioridades sociais a serem
enfrentadas pelas políticas públicas.
A priorização de escolhas de ações públicas com base tão-somente em aspectos

metodológicos restritos pode levar a um resultado de todo discordante com aquele
desejado socialmente. Por exemplo, no pautar-se por hierarquias rígidas de qualidade de
evidência, pode-se dar prioridade sistematicamente a certas opções e escolhas de políticas
para as quais seja possível e viável a realização de experimentos controlados ou outros
tipos de avaliações rigorosas focadas em efeitos quantificáveis. Ao se fazer isso, corre-se
o risco de favorecer as intervenções mensuráveis segundo os métodos preconizados como
os melhores. Com isso, privilegiam-se aqueles grupos – sejam esses atores corporativos
ou grupos populacionais – cujas necessidades são mais visíveis e mais facilmente
mensuráveis. Essa é uma “armadilha” na qual podem cair as decisões de políticas públicas
que se deixem guiar por uma concepção demasiado restrita de evidência.
Para evitar que o policymaker caia em tais “armadilhas”, é preciso partir de uma visão mais
abrangente acerca das evidências. Com esse intuito, este capítulo propõe a ampliação do
conceito de evidências para subsidiar decisões em políticas de saúde, de tal forma que as
AIPS integrem coerentemente com essa visão ampla. As AIPS constituem-se de uma forma
(dentre outras) do ecossistema de evidências em políticas de saúde, o qual, por sua vez,
compõe-se, pelo menos, das oito formas citadas no Relatório da Comissão Global de
Evidências para Enfrentar Desafios Sociais (2022) mencionadas anteriormente e
mostradas na Figura 1. A ideia de um “ecossistema de evidências” é muito relevante aqui
e sugere que as AIPS são uma forma que deve conviver cooperativamente –
“simbioticamente”, se quisermos – com as outras formas de evidências.

663
O ecossistema de evidências segue uma abordagem pluralista à epistemologia, a qual
valoriza distintas formas de conhecimento, sem estabelecer a priori uma hierarquia
qualitativa rígida entre essas formas. De acordo com essa visão, os estudos causais-
empírico-experimentais-quantitativos – que ainda contam como o “padrão-ouro” das
evidências em certos círculos de avaliação de políticas públicas – são apenas uma
daquelas formas de evidências. No ecossistema de evidências esses estudos devem
conviver em harmonia com as outras formas, de maneira análoga a que, em um sistema
ecológico, a diversidade biológica mantém-se em relativo equilíbrio. Sem nada que
justifique o seu domínio excludente sobre as outras “epistemologias”, a AIPS padrão deve
ter seus limites explicitados e eventualmente complementados com outras abordagens
metodológicas.
A proposta deste capítulo, porém, não se limita à esfera conceitual, mas abarca também
um conjunto de normas para o uso de evidências. Faz sentido, assim, falar-se de um
sistema de governança para o uso de evidências em políticas de saúde. Esse sistema deve
constituir-se pelo menos das seguintes partes: i) um sistema de conceitos e princípios
(LEJANO, 2006; OXMAN, 2010; PARKHURST, 2017) (sistematicidade, transparência,
contextualidade, adequação, qualidade, rigor, administração, representação, deliberação,
contestabilidade); ii) instituições; iii) ferramentas (sistemas e plataformas, como uma
plataforma de tradução e intermediação do conhecimento); iv) atividades (sínteses,
disseminação e intercâmbio de conhecimentos). Refere-se aqui a medidas de alcance mais
amplo (além do meramente “organizacional”) e de caráter mais duradouro, que orientem o
uso das evidências para subsidiar as decisões em políticas de saúde. O princípio
fundamental desse sistema de governança é a conciliação entre o valor das boas práticas
científicas com o valor da representatividade democrática dos valores (necessidades,
interesses, preferências etc.) dos diversos atores sociais interessados.
Obviamente o presente capítulo não tem a intenção de fornecer soluções prontas para um
problema tão complexo e relativamente pouco estudado no Brasil. Não obstante, para
desenvolver o tema da boa governança no uso das evidências em políticas de saúde,
elenca-se a seguir uma série de tópicos prioritários para promover mais integração das
AIPS ao ecossistema de evidências relacionado com políticas de saúde. A lista abaixo foi
adaptada das “estratégias para apoiar o uso das melhores evidências”, apresentadas no
Relatório da Comissão Global de Evidências (2022).

Melhorar o “ambiente” para o uso de evidências nas AIPS
O sistema de suporte de evidências (nacional ou subnacional) deve buscar as

melhores condições de estrutura e funcionamento e usar estratégias efetivas para
melhorar o uso de evidências pelas AIPS e também daquelas por essas produzidas
(por exemplo, promovendo atividades para o reconhecimento do conceito amplo e
uso efetivo do estoque de evidências, entre os grupos que realizam AIPS).
Priorizar e coproduzir evidências sobre impacto
Os tomadores de decisão e outros stakeholders relevantes para as AIPS devem

participar de processos sistemáticos e transparentes para a priorização de temas e
coprodução de novas evidências locais (nacionais ou subnacionais) para diferentes
jurisdições. Isso inclui análise de dados, modelagem, avaliações, pesquisa do
comportamento/de implementação, informações qualitativas. Os ditos processos
sistemáticos e transparentes têm por objetivo também traduzir e sintetizar as
melhores evidências globais (síntese de evidências) (por exemplo, realizando
encontros estruturados e voltados para a priorização compartilhada de temas e
questões de saúde pública, entre pesquisadores, tomadores de decisão e membros
da sociedade civil).
Apresentar e “exportar” evidências de AIPS para tomadores de decisão e outros

stakeholders
A integração de diferentes formas de evidências em tipos inovadores de produtos de

evidências, tais como a análise de dados para esclarecer um problema e suas
causas, a síntese de evidências para descrever os prováveis benefícios e prejuízos
de uma opção para resolver um problema e as ciências do comportamento para
desenvolver um plano de implementação (por exemplo, promover o desenvolvimento
e incorporação de produtos de tradução do conhecimento, adaptados a diferentes
públicos).
Facilitar o acesso e uso das AIPS pelos tomadores de decisão e outros stakeholders
As evidências de AIPS precisam estar acessíveis aos seus usuários, por meio de
repositórios de evidências adaptados e focados nas necessidades dos tomadores
de decisão e outros stakeholders (por exemplo, organizar ou integrar-se a

665
repositórios abertos e amigáveis de estudos e documentos relacionados com as
AIPS).
Melhorar o intercâmbio entre os elaboradores de AIPS com tomadores de decisão e

outros stakeholders
Estabelecer mecanismos efetivos para o diálogo entre os elaboradores das AIPS,

tomadores de decisão e outros stakeholders para facilitar a troca de conhecimento,
experiências, visões e opiniões entre os legítimos interessados em uma política ou
programa endereçado a um problema prioritário de saúde pública (por exemplo,
instituir e promover plataformas de tradução do conhecimento – síntese,
disseminação, intercâmbio e aplicação – em diferentes níveis do sistema de saúde).
6 Síntese das conclusões
Quadro 2 - Síntese das conclusões
Pergunta Método e conclusões

Identifica-se uma concepção tradicional de evidência,
associada aos pressupostos das PPBEs, que restringe o
conceito às evidências científicas, empírico-experimentais, de
natureza quantitativa, que procuram revelar as causas dos
fenômenos e que podem ser formalizadas matematicamente.
Em que medida as AIPS
Em seguida, identifica-se um conceito clássico de avaliação de
são influenciadas pelas
impacto, que a identifica com um tipo específico de evidência
limitações conceituais do
empírica. Por meio de um método historiográfico que percorre
movimento das políticas
várias áreas de políticas públicas, mostram-se as conexões
públicas baseadas em
conceituais entre as PPBEs e as AIPS. Ainda que tenha havido,
evidências (PPBEs)?
ao longo dos anos, uma problematização desses conceitos
tradicionais, levando a uma gradual ampliação do significado
de "evidências" em políticas públicas em geral e em AIPS em
particular, ainda há certo viés empirista e experimentalista em
relação ao que se entende por "evidências" em AIPS.
As mencionadas limitações conceituais assentam-se sobre um
pressuposto normativo, segundo o qual as evidências
científicas (com todas os atributos da concepção tradicional)
Como tais limitações
são as melhores evidências para subsidiar as políticas
podem introduzir vieses
públicas. Esse pressuposto, como norma de ação para o
negativos nas decisões
policymaker, pode acarretar graves vieses decisórios em
em políticas de saúde?
políticas de saúde e outras. Ignorando a complexidade, as
incertezas, conflitos e o caráter contextual dos processos
decisórios em políticas públicas, esse pressuposto pode levar
continua
conclusão
Pergunta Método e conclusões

a sérias distorções na priorização de escolhas das ações
públicas sobre os problemas sociais. Por exemplo, no pautar-
se por hierarquias rígidas de qualidade de evidência, pode-se
dar prioridade sistematicamente a certas opções e escolhas de
políticas para as quais seja possível e viável a realização de
experimentos controlados ou outros tipos de avaliações
rigorosas focadas em efeitos quantificáveis. Ao se fazer isso,
corre-se o risco de favorecer as intervenções que são
mensuráveis segundo os métodos preconizados como os
melhores. Com isso, privilegiam-se aqueles grupos – sejam
esses atores corporativos ou grupos populacionais – cujas
necessidades são mais visíveis e mais facilmente
mensuráveis. Essa é uma “armadilha” na qual podem cair as
decisões de políticas públicas que se deixem guiar por uma
concepção demasiado restrita de evidência.
Propõe-se partir de uma visão mais abrangente acerca das
evidências do que as perspectivas correntes. Para isso, lança-
se mão do conceito de "ecossistema de evidências", do qual as
AIPS são uma parte componente, que deve estar em conexão
orgânica e complementariedade com uma série de outras
formas de evidências, tais como: análise de dados,
modelagem, avaliações de diferentes tipos (inclusive AIPS),
pesquisa do comportamento/de implementação, informações
qualitativas, síntese de evidências para políticas de saúde,
O que se propõe para
avaliação de tecnologias em saúde/análise de custo-
superar aquelas
efetividade, diretrizes (guidelines) para a prática (clínica, de
limitações conceituais e
serviços ou de políticas). No ecossistema de evidências, os
evitar os mencionados
estudos causais-empírico-experimentais-quantitativos devem
vieses negativos no uso
conviver em harmonia com as outras formas, de maneira
das AIPS e das
análoga a que, em um sistema ecológico, mantém-se em
evidências nas políticas
relativo equilíbrio a diversidade biológica. A proposta deste
de saúde em geral?
capítulo também abarca um conjunto de normas para o uso de
evidências, o qual chamamos de "sistema de governança".
Esse se constitui de pelo menos quatro partes: i) um sistema
de conceitos e princípios (sistematicidade, transparência,
contextualidade, adequação, qualidade, rigor, administração,
representação, deliberação, contestabilidade); ii) instituições;
iii) ferramentas (sistemas e plataformas, como uma plataforma
de tradução e intermediação do conhecimento); e iv) atividades
(sínteses, disseminação e intercâmbio de conhecimentos).
Fonte: elaboração dos autores.

667
Referências
ALMEIDA FILHO, N.; COUTINHO, D. Causalidade e sobredeterminação: abordagem

translacional - transdisciplinar nas Ciências da Saúde. In: Avaliação de impacto das
políticas de saúde: um guia para o SUS. Brasília, DF: Ministério da Saúde, 2023.
AMARAL, J. et al. Effect of Integrated Management of Childhood Illness (IMCI) on health

worker performance in Northeast-Brazil. Cadernos de Saúde Pública, v. 20, supl. 2, p.
s209-s219, 2004. Disponível em: https://www.scielo.br/j/csp/a/4gy9gYnt5nt5qg543nk5
gjz/?lang=en&format=pdf. Acesso em: 14 nov. 2022.
ANDERMANN, A. et al. Evidence for health III: making evidence-informed decisions that
integrate values and context. Health Research Policy Systems, v. 14, n. 16, p. 1-8,
2016. Disponível em: https://health-policy-systems.biomedcentral.com/articles/10.1186/s
12961-016-0085-4. Acesso em: 20 out. 2022.
ANDRADE, K. R. C. de; PEREIRA, M. G. Knowledge translation in the reality of brazilian

public health. Revista de Saúde Pública, v. 54, 2020. Disponível em:
https://www.scielo.br/j/rsp/a/NYWX86QpnmtdSD6yTvY9PzL/abstract/?lang=en. Acesso
em: 28 ago. 2022.
ARMSTRONG, R. et al. The role and theoretical evolution of knowledge translation and
exchange in public health. Journal of Public Health, v. 28, n. 4, p. 384-389, 2006.
Disponível em: https://academic.oup.com/jpubhealth/article/28/4/384/1622772. Acesso
em: 28 ago. 2022.
BRASIL. Presidência da República. Casa Civil. Avaliação de políticas públicas: guia

prático de análise ex post. Brasília, DF: Casa Civil da Presidência da República, 2018. v.2.
COMISSÃO GLOBAL DE EVIDÊNCIAS PARA RESPONDER AOS DESAFIOS SOCIAIS.

Evidências: um chamado para a ação e caminho a seguir para tomadores de decisão,
intermediários de evidências e produtores de evidências orientadas para o impacto.
Hamilton: McMaster Health Fórum, 2022. Disponível em: https://www.mcmasterforum.org/
networks/evidence-commission. Acesso em: 28 ago. 2022.
COOKSON, R. Evidence-based policy making in health care: what it is and what it isn't.
Journal Health Services Research and Policy, v. 10, n. 2, p. 118-121, 2005. DOI:
https://journals.sagepub.com/doi/10.1258/1355819053559083.
CRUZ, M.; ZIEGELHOFER, Z. Beyond the income effect: impacts of conditional cash
transfer programs on private investments in human capital. The World Bank -
Development Prospects Group Global Modeling and Analytics Team, 2014. 111p. (World
Bank Policy Research Working Paper, n. 6867). Disponível em:
http://documents.worldbank.org/curated/en/756371468020374714/pdf/WPS6867.pdf.
DAVIES, P. Is evidence-based government possible? London: Jerry Lee Lecture, 2004.
DIAS, R. I.; BARRETO, J. O. M.; SOUZA, N. M. Desenvolvimento atual da Rede de

Políticas Informadas por Evidências (EVIPNet Brasil): relato de caso. Revista
Panamericana de Salud Pública, v. 36, p. 50-56, 2014. Disponível em:
https://iris.paho.org/handle/10665.2/7788. Acesso em: 28 ago. 2022.

EDWARDS, P. et al. Final results of MRC CRASH: a randomised placebo-controlled trial
of intravenous corticosteroid in adults with head injury: outcomes at 6 months. Lancet, v.
365, n. 9475, p. 1957-1959, Jun. 2005.
ESTADOS UNIDOS DA AMÉRICA. Foundations for evidence-based policymaking act

of 2018. Washington, D. C., 2019. (Public Law n.115-435). Disponível em:
https://www.congress.gov/bill/115th-congress/house-bill/4174. Acesso em: 28 ago. 2022.
FONSECA, I. F. et al. Instituições participativas e evidências híbridas: deliberação,

relações fecundas e ecologia de saberes. In: KOGA, N. M. et al. Políticas públicas e
usos de evidências no Brasil: conceitos, métodos, contextos e práticas. Brasília, DF:
IPEA, 2022. p. 224-250. Disponível em: http://repositorio .ipea.gov.br/ bitstream/ 11058/
11121/1/Politicas_publicas_e_usos.pdf. Acesso em: 30 ago. 2022.
GOLDENBERG, M. J. Evidence-based ethics? On evidence-based practice and the

“empirical turn” from normative bioethics. BMC Medical Ethics, v. 6, n. 11, p. 1-9, 2005.
HARDMAN, C. M. et al. Efetividade de uma intervenção de base escolar sobre o tempo de

tela em estudantes do ensino médio. Revista Brasileira de Cineantropometria e
Desempenho Humano, v. 16, Supl. 1, p. 25-35, 2014. Disponível em:
https://www.scielo.br/j/rbcdh/a/YyRGNXYSHWjz4bYSqzFrZdj/?lang=pt&format=pdf.
HEAD, B. W. Toward more “evidence-informed” policy making? Public Administration

Review, v. 76, n. 3, p. 472-484, 2015. Disponível em: https://onlinelibrary.wiley.com/doi/
epdf/10.1111/puar.12475. Acesso em: 26 ago. 2022.
LAROCCA, R. et al. The effectiveness of knowledge translation strategies used in public

health: a systematic review. BMC Public Health, v. 12, n. 751, p. 1-12, 2012. Disponível
em: https://bmcpublichealth.biomedcentral.com/articles/10.1186/1471-2458-12-751.
LASSWELL, H. D. The policy orientation. In: LERNER, D.; LASSWELL, H. D. (eds.) The
science of public policy: evolution of policy sciences. Stanford: Stanford University
Press, 1951.
LASSWELL, H. D. The emerging conception of the policy sciences. Policy Sciences, v. 1,

n. 1, p. 3-14, 1970.
LAVIS, J. N. et al. Guidance for evidence-informed policies about health systems: linking
guidance development to policy development. PLoS Medicine, v. 9, n. 3, p. 1-7, 2012.
Disponível em: https://journals.plos.org/plosmedicine/article?id=10.1371/journal.Pmed.
1001186. Acesso em: 26 ago. 2022.
LEJANO, R. P. Frameworks for policy analysis: merging text and context. New York-
London: Routledge-Taylor & Francis Group, 2006.
LESTER, L. et al. Evaluation of the performance and achievements of the WHO Evidence-
informed Policy Network (EVIPNet) Europe. Health Research Policy Systems, v. 18, n.
109, p. 1-19, 2020. Disponível em: https://health-policy-systems.biomedcentral.com/
articles/ 10.1186/s12961-020-00612-x. Acesso em: 20 ago. 2022.

669
MAS, J. et al. Conceptualizing and combining evidence for health system guidance:
final report. Ottawa: Canadian Health Services Research Foundation, 2005. Disponível
em: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.112.4445. Acesso em: 20
ago. 2022.
MACINKO, J.; LIMA COSTA, M. F. Access to, use of and satisfaction with health services
among adults enrolled in Brazil’s Family Health Strategy: evidence from the 2008 National
Household Survey. Tropical Medicine & International Health, v. 17, n. 1, p. 36-42, 2012.
Disponível em: https://onlinelibrary.wiley.com/doi/full/10.1111/j.1365-3156.2011.02866.x.
MALINVAUD, E. La modélisation en macroéconomie appliquée: quarante ans après.

Brussels Economic Review, v. 160, p. 329-342, 1998.
MANSILLA, C. et al. The Evidence-Informed Policy Network (EVIPNet) in Chile: lessons

learned from a year of coordinated efforts. Revista Panamericana de Salud Pública, v.
41, p. 1-8, Feb. 2018. Disponível em: https://iris.paho.org/bitstream/handle/10665.2/
33967/v41a362017.pdf?sequence=1&isAllowed=y. Acesso em: 20 ago. 2022.
MOAT, K. A. et al. Evidence briefs and deliberative dialogues: perceptions and intentions
to act on what was learnt. Bulletin of the World Health Organization, v. 92, p. 20-28,
2013. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3865546/pdf/
BLT.12.116806.pdf/. Acesso em: 20 ago. 2022.
NEUMANN, J. V.; MORGENSTERN, O. Theory of games and economic behavior.

OLIVEIRA, S. M. V. L. et al. Institucionalização das políticas informadas por evidências no

Brasil. Revista Panamericana de Salud Publica, v. 44, p. 1-10, 2020. Disponível em:
https://iris.paho.org/handle/10665.2/53138. Acesso em: 20 ago. 2022.
OXMAN, A. D. et al. A framework for mandatory impact evaluation to ensure well informed
public policy decisions. The Lancet, v. 375, n. 9712, p. 427-431, Jan. 2010. Disponível
em: https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(09)61251-4/fulltext.
PARKHURST, J. Prefácio: Improving evidence use in public policy. In: KOGA, N. M. et al.
Políticas públicas e usos de evidências no Brasil: conceitos, métodos, contextos e
práticas. Brasília, DF: IPEA, 2022. p. 13-27. Disponível em: http://repositorio.ipea.gov.br/
bitstream/11058/ 11121/1/Politicas_publicas_e_usos.pdf. Acesso em: 28 ago. 2022.
PARKHURST, J. The politics of evidence. London-New York: Routledge, 2017.
PARTRIDGE, A. C. R. et al. Lessons learned from descriptions and evaluations of

knowledge translation platforms supporting evidence-informed policy-making in low- and
middle-income countries: a systematic review. Health Research Policy Systems, v. 18, n.
127, p. 1-22, 2020. Disponível em: https://health-policy-systems.biomedcentral.com/
articles/10.1186/s12961-020-00626-5. Acesso em: 28 ago. 2022.

PINHEIRO, M. M. S. Políticas públicas baseadas em evidências: um modelo moderado de
análise conceitual e avaliação crítica. In: KOGA, N. M. et al. Políticas públicas e usos de
evidências no Brasil: conceitos, métodos, contextos e práticas. Brasília, DF: IPEA, 2022.
p. 59-84. Disponível em: http://repositorio.ipea.gov.br/bitstream/11058/11293/1/Politicas
_Publicas_cap01.pdf. Acesso em: 28 ago. 2022.
PINHEIRO, M. M. S. Políticas públicas baseadas em evidências (PPBEs): delimitando

o problema conceitual. Rio de Janeiro: IPEA, 2020a. (Texto para discussão IPEA, n.
2554). Disponível em: http://repositorio.ipea.gov.br/bitstream/11058/9915/1/td_2554.pdf.
PINHEIRO, M. M. S. Políticas públicas baseadas em evidências: uma avaliação crítica.

Boletim de Análise Político-Institucional, n. 24, p. 17-27, 2020b. Disponível em:
http://repositorio.ipea.gov.br/bitstream/11058/10373/1/bapi_24_art1.pdf. Acesso em: 28
ago. 2022.
PINHEIRO, M. M. S.; NOGUEIRA, R. P. Medicina baseada em evidências: uma

interpretação crítica e implicações para as políticas públicas. Brasília, DF: IPEA, 2021.
(Texto para discussão IPEA, n. 2696). Disponível em: http://repositorio.ipea.gov.br/
bitstream/ 11058/10830/1/td_2696.pdf. Acesso em: 28 ago. 2022.
SEN, A. K. Desenvolvimento como liberdade. São Paulo: Companhia das Letras, 2000.
SCARLETT, J. et al. Evidence-informed Policy Network (EVIPNet) Europe: success

stories in knowledge translation. Public Health Panorama, v. 4, n. 2, p. 161-169, 2018.
Disponível em: https://apps.who.int/iris/bitstream/handle/10665/325029/php-4-2-161-169-
eng.pdf. Acesso em: 28 ago. 2022.
SHADISH JUNIOR, W; COOK, T.; LEVITON, L. Foundations of program evaluation:

theories of practice. Newbury Park: Sage Publications, 1995.
STRAUS, S. E.; TETROE, J.; GRAHAM, I. Defining knowledge translation. Canadian

Medical Association Journal, v. 181, n. 3-4, p. 165-168, 2009. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2717660/. Acesso em: 28 ago. 2022.
STEWART, R. et al. The evidence ecosystem in South Africa: growing resilience and
institutionalisation of evidence use. Palgrave Communications, v. 5, 90, p. 2019.
Disponível em: https://www.nature.com/articles/s41599-019-0303-0. Acesso em : 28 ago.
2022.
TOMA, T. S. et al. Síntese de evidências para políticas de saúde. In: TOMA, T. S. et al.
(orgs.). Avaliação de tecnologias de saúde e políticas informadas por evidências.
São Paulo: Instituto de Saúde, 2017. p. 183-208. (Temas Saúde Coletiva, 22) Disponível
em: https://www.arca.fiocruz.br/bitstream/icict/42957/2/avaliacao_tecnologia_saude
polticas_inf_evidencias.pdf. Acesso em: 28 ago. 2022.
WALLS, H. et al. The many meanings of evidence: a comparative analysis of the forms
and roles of evidence within three health policy processes in Cambodia. Health Research
Policy and Systems, v. 15, n. 1, p. 1-13, 2017. Disponível em: https://health-policy-
systems.biomedcentral.com/articles/10.1186/s12961-017-0260-2. Acesso em: 28 ago.
2022.
WORTHEN, B.; FITZPATRICK, J.; SANDERS, J. Avaliação de programas: concepções

e prática. São Paulo: EDUSP, 2004.

671
Capítulo 24
A tradução do conhecimento e a
avaliação de impacto de políticas e
programas de saúde
Luís Eugenio Portela Fernandes de Souza1

Daniela Fortunato Rego2
Roberta Borges Silva2
1
Coordenação Geral de Evidências em Saúde, Departamento de Ciência e Tecnologia, Secretaria
2
de Ciência, Tecnologia, Inovação e Insumos Estratégicos em Saúde do Ministério da Saúde
RESUMO:
Este capítulo discute o conceito, as potencialidades e os limites da tradução do conhecimento como
ferramenta para promover o uso de conhecimento científico no processo de formulação e implantação
de políticas de saúde. Destina-se, primordialmente, a gestores e pesquisadores envolvidos em projetos
de avaliação de impacto de políticas de saúde, considerando, portanto, as características próprias das
organizações de saúde. Buscando apoiar, concretamente, os interessados na disseminação e no uso de
evidências científicas por tomadores de decisão, o capítulo apresenta estratégias práticas inovadoras
para aplicação do conhecimento. Assim, espera-se que possa orientar gestores e pesquisadores na
reflexão sobre a tradução do conhecimento como possibilidade de fortalecer a racionalidade técnico-
científica das políticas de saúde, de acordo com o público e contexto de interesse.
PALAVRAS-CHAVE:
Tradução do conhecimento. Barreiras e facilitadores. Estratégias práticas em tradução do
conhecimento.

1 O uso do conhecimento científico em organizações complexas
As organizações de saúde são bastante complexas e sua gestão é sempre um grande

desafio, seja no plano macropolítico de sistemas de saúde, seja no plano mesopolítico de
instituições e estabelecimentos, seja ainda no plano micropolítico de programas e
processos de trabalho dos profissionais de saúde.
Essa complexidade é multideterminada, a começar pela coexistência de objetivos múltiplos

e ambíguos em qualquer sistema ou organização de saúde. De fato, os sistemas e as
organizações, de saúde têm objetivos que vão desde a promoção e a proteção da saúde
da comunidade até a manutenção e a qualificação de sua força de trabalho, passando pela
prestação de cuidados aos doentes, pelo estabelecimento de relações estáveis com
fornecedores de bens e insumos e pelo atendimento das expectativas de toda a sociedade.
Relacionados a esses objetivos, encontra-se ampla gama de agentes envolvidos e seus

variados interesses, dos quais listamos alguns. Os usuários desejam ter atendidas suas
demandas e suas necessidades. Os profissionais e os técnicos de saúde têm interesses
relativos à sua sobrevivência e à realização profissional. Os fornecedores esperam obter o
que consideram a retribuição adequada pelo fornecimento de bens e insumos e manter ou
ampliar seus negócios. Os agentes políticos se interessam por capitalizar eleitoralmente o
êxito – se ocupam posições de governo – ou as dificuldades dos sistemas e das
organizações de saúde – se estão na oposição. Os meios de comunicação se interessam
pelos serviços de saúde quando geram notícias que atraem a audiência. Tudo isso faz com
que as organizações de saúde estejam permanentemente sob fortes pressões internas e
externas.
A complexidade da gestão de serviços de saúde é ainda determinada pela necessária

execução de vários processos de trabalho, esses mesmos altamente complexos.
Concretamente, o cuidado em saúde exige o exercício de competências que apenas
profissionais que passaram por um longo treinamento detêm e por isso obtiveram o
reconhecimento oficial que lhes dá o direito exclusivo de exercer sua profissão. Assim, os
serviços de saúde podem se caracterizar como organizações profissionais Mintzerg (1995),
ou seja, organizações que dependem do trabalho de profissionais para funcionar. Tais
profissionais são trabalhadores diferenciados pelo fato de que o próprio exercício das suas
competências exige que disponham de elevado grau de autonomia, a qual, se por um lado
é essencial para o bom desempenho da organização de saúde, por outro coloca desafios

673
específicos para os gestores relativos a gerir pessoal que obedece antes às regras
profissionais do que às regras organizacionais.
Essas características das organizações de saúde evidenciam que os processos de tomada

de decisão se desenvolvem sob distintas racionalidades, as quais podem ser classificadas
em duas grandes categorias: técnicas e políticas. As racionalidades técnicas referem-se ao
conhecimento técnico-científico, englobam as ciências mobilizadas pelas áreas da biologia,
da clínica, da epidemiologia, do planejamento e da gestão em saúde, com suas
convergências e divergências. As racionalidades políticas, por sua vez, são relativas às
negociações e relações de poder entre os diversos agentes e interesses envolvidos no
processo de tomada de decisão.
Enfim, a utilização do conhecimento científico e – mais ainda – a formulação e implantação

de políticas informadas por conhecimento científico enfrentam muitas barreiras
relacionadas à cultura organizacional, à estrutura política e institucional e às características
profissionais e pessoais dos membros das organizações (ELLEN et al., 2014).
Essas barreiras e dificuldades, contudo, não diminuem a importância do conhecimento para

a gestão da saúde, mas, ao contrário, justificam a busca por estratégias para superá-las.
Essa importância fica visível na definição de gestão da saúde, adotada pela célebre
Assembleia Mundial da Saúde de 1978 (OMS, 1978), que aprovou a meta de “Saúde para
Todos no ano 2000”:
[...] processo integrado para a definição de políticas sanitárias, a formulação
de programas prioritários que permitam pôr em prática essas políticas, a
habilitação de créditos preferentes nos orçamentos da saúde para esses
programas prioritários, a execução desses programas por meio do sistema
sanitário geral, a vigilância, a fiscalização e a avaliação desses programas
de saúde e dos serviços e instituições que os executam, e o aporte de uma
base adequada de informação para o processo em geral e cada um de seus
elementos [...] (tradução livre).
Claramente, a Assembleia optou por uma conceituação ampla de gestão, que incorpora o
conceito de administração como conjunto de técnicas usadas para o funcionamento de uma
organização, inclusive o planejamento, o financiamento, a contabilidade, a direção de
pessoal, a análise de sistemas etc., mas ultrapassa a sua abrangência ao incluir o processo
de tomada de decisão política também como objeto da gestão.

Aceitando-se essa conceituação, não é difícil perceber a importância do conhecimento
científico para a prática gerencial, abarcando tanto a definição de políticas quanto o domínio
do conjunto de técnicas de gestão.
Vale acrescentar que não são somente as organizações de saúde que possuem atributos
que dificultam a utilização do conhecimento científico. Curiosamente, as próprias
instituições de pesquisa adotam práticas que geram obstáculos a uma utilização ampla do
conhecimento que produzem. Com efeito, podem ser rapidamente elencados vários
aspectos das práticas científicas que interferem sobra a possibilidade de uso do
conhecimento.
A disponibilidade de conhecimento é o primeiro desses aspectos, dado que evidentemente

não se pode utilizar conhecimento indisponível. Ora, a disponibilidade depende do
investimento realizado em pesquisa e das prioridades definidas. A existência de “doenças
órfãs” é um exemplo marcante de como as práticas científicas podem comprometer a
produção e, consequentemente, a utilização de conhecimentos, em tese, altamente
necessários do ponto de vista das políticas de saúde.
A acessibilidade é outro aspecto significativo. O conhecimento disponível, mas pouco

divulgado, acessível apenas em publicações especializadas, escritas em termos
herméticos, por mais relevante que seja dificilmente será amplamente utilizado.
A validade do conhecimento é um terceiro aspecto a ser considerado. Sabe-se que há

abordagens epistemológicas diferentes, que adotam critérios de validade diferentes.
Estudos realizados dentro das abordagens hegemônicas têm, em regra, mais chances de
terem seus resultados divulgados e utilizados. Contudo, os gestores da saúde
frequentemente precisam de conhecimentos que somente abordagens alternativas podem
gerar e os quais têm dificuldades de encontrar.
Por fim, há os aspectos relativos ao contexto institucional e aos paradigmas científicos. Os

mecanismos de avanço na carreira, as divisões entre disciplinas, as relações dos centros
de pesquisas com a indústria, a definição do conhecimento como somatório de informações
ou como sentidos negociados socialmente são todos fatores que influenciam – diretamente
– a produção e – indiretamente – a utilização do conhecimento científico.

675
Frente a essas características, tendo-se reconhecido a importância do conhecimento
científico para a gestão, coloca-se, então, a tradução do conhecimento (TC) como conjunto
de estratégias potencialmente efetivas para ampliar o uso do conhecimento científico e
fortalecer a racionalidade técnico-sanitário nos processos de tomada de decisão relativos
à formulação e implantação de políticas e programas de saúde.
2 O conceito e o ciclo da tradução do conhecimento
Desde logo, é preciso explicitar que, na expressão “tradução do conhecimento”, o

substantivo conhecimento se refere unicamente ao conhecimento científico. Assim,
entende-se que se deve promover a apropriação do conhecimento científico pelos
tomadores de decisão. Em segundo lugar, deve-se reconhecer que – nesse contexto – o
termo “tradução” tem sido conceituado de modo amplo e extrapolado bastante a
significação encontrada nos contextos em que há referência ao intercâmbio de significantes
e significados entre duas línguas naturais, como o português e o inglês, por exemplo.
Tradução do conhecimento pode ser definida, de acordo com o Instituto Canadense de

Pesquisa em Saúde (CANADIAN, 2014), como o processo dinâmico e iterativo de síntese,
disseminação, intercâmbio e aplicação do conhecimento por meio de um complexo sistema
de interação entre pesquisadores e usuários do conhecimento (STRAUS; TETROE;
GRAHAM, 2009). Por enfatizar o caráter processual e iterativo da tradução do
conhecimento, essa definição – a mais comumente aceita internacionalmente – é a adotada
neste capítulo.
O processo de tradução do conhecimento acontece em todo o ciclo de ações, políticas e

programas de saúde (Figura 1). Ao longo desse ciclo, há reiteradas interações entre os
diferentes atores envolvidos, destacando-se pesquisadores, profissionais e gestores da
saúde (STRIFLER et al., 2018). Considerando-se o objetivo de fortalecer a racionalidade
técnico-científica das decisões organizacionais, vale destacar o papel importante dos
gestores na identificação de lacunas de conhecimento e, portanto, na definição de
pesquisas prioritárias para os sistemas de saúde, na viabilização de parcerias institucionais,
no fomento à geração de evidências e no uso de evidências para a formulação,
implementação e avaliação de políticas (OREM NABYONGA et al., 2013; GAGLIARD;
KOTHARI; GRAHAM, 2017; TOMLINSON; PARKER, 2021). Nesse sentido, o desafio é
promover a tradução do conhecimento durante todo o ciclo de interações:

• A geração da evidência, por meio da consolidação dos resultados da investigação
científica e da experiência profissional;
• A síntese da evidência, por intermédio de revisões sistemáticas e elaboração de

diretrizes;
• A transferência da evidência, pelas estratégias de difusão e disseminação do

conhecimento – direcionado a público geral ou específico;
• A implementação das evidências, com adaptação, monitoramento, avaliação e

sustentação do uso na organização.
Figura 1 - Rotatória da tradução do conhecimento.
Fonte: adaptado de Andrade e Pereira (2020).

677
É importante ressaltar que, além de pesquisadores, profissionais e gestores, outros atores
têm o potencial de participar do processo de tradução do conhecimento de formas
específicas, performando diferentes papéis, entre os quais se ressalta a importância
daquele que cumprem os especialistas em comunicação.
A fim de identificar potenciais facilitadores e barreiras ao uso de conhecimento, algumas

perguntas orientadoras podem ser úteis (LAVIS et al., 2003; GRIMSHAW et al., 2006;
ELLEN et al., 2011). Com efeito, as reflexões estimuladas por essas perguntas orientam a
definição das estratégias de tradução do conhecimento mais adequadas a cada contexto:
1. O que precisa ser transmitido?
2. Qual audiência é foco do conhecimento?
3. Quem vai transferir o conhecimento?
4. Como o conhecimento deve ser comunicado?
5. Quais os efeitos almejados com a comunicação do conhecimento?
A seguir, são apresentadas as estratégias de tradução do conhecimento mais

frequentemente acionadas, com resultados usualmente positivos. Reforça-se a
necessidade de se identificar possíveis barreiras e facilitadores relacionados à tradução do
conhecimento, considerando-se a audiência e o contexto específicos. Além disso, vale
reiterar a necessidade de engajamento dos atores envolvidos no processo, de acordo com
cada contexto temático, político, geográfico e financeiro.
3 Estratégias de tradução do conhecimento para promover o uso de resultados de

avaliações de impacto de políticas e programas de saúde
Há numerosas estratégias de tradução do conhecimento (ESMAIL et al., 2020). Por isso,

tem-se empregado a expressão “estratégias de tradução do conhecimento” referindo-se a
formas distintas de comunicação e promoção do uso de resultados de estudos científicos
como subsídios para a formulação e implantação de políticas governamentais.
Dessa forma, algumas estratégias serão aqui tratadas de maneira a esclarecer a

abordagem da TC em todas as suas fases, inclusive nos processos comunicativos
requeridos para sua efetividade como ferramenta de apoio à incorporação de resultados de
pesquisa de avaliação de impacto às políticas e programas de saúde.

Observando-se as estratégias de TC de forma panorâmica, identifica-se na literatura uma
variedade de modelos, teorias e ferramentas existentes (MOORE; TODD; REDMAN, 2009).
Moore, Todd e Redman (2009) apresentam – em uma revisão de escopo – 159 estratégias
de TC mapeadas. Essas foram utilizadas mais comumente para informar atividades de
planejamento, implementação e avaliação e menos comumente para informar atividades
de disseminação e sustentabilidade/escalabilidade do conhecimento produzido. Vinte e seis
modelos são utilizados em todo o espectro de implementação do conhecimento (desde
planejamento/design até sustentabilidade/escalabilidade). Todos os modelos foram
aplicados visando a mudança de comportamento de atores envolvidos em nível individual
e a maioria desses aplicados em nível organizacional (STRIFLER et al., 2018).
Destaca-se aqui um modelo específico muito utilizado, cuja classificação das estratégias
de TC é feita por domínios ou categorias de ações (KT Actions) (WOLFENDEN et al., 2022),
a saber:
1. Envolver o usuário final – em cada fase do processo de produção da pesquisa
os usuários do conhecimento poderão ou deverão se engajar;
2. Identificar o problema do usuário final – o problema da pesquisa é um

problema do usuário ou parte de um interesse somente do pesquisador sobre aquele
tema? Os problemas que resultarão em perguntas de pesquisas podem partir da
combinação de questões entre gestores e pesquisadores e aumentar as chances de
uso do conhecimento produzido;
3. Adaptar o conhecimento ao contexto local – além do engajamento precoce e

continuado dos usuários finais, a possibilidade de uso dos resultados da pesquisa
cresce muito se são adaptados à realidade local;
4. Avaliar as barreiras ao uso do conhecimento – o pesquisador e o gestor devem

avaliar sistematicamente que barreiras em nível individual, organizacional, social e
político podem afetar o uso do conhecimento e como lidar com essas barreiras;
5. Apoiar a adaptação e implementação de intervenções – a capacitação de
pessoas na compreensão do protocolo da pesquisa e seus resultados pode torná-
las comunicadoras do conhecimento no nível local;
6. Avaliar os resultados e monitorar o uso do conhecimento – é importante

avaliar e monitorar o uso do conhecimento, observando seus efeitos (desejados ou

679
indesejados), alcance, grau de implementação, custos incorridos, grau de
aceitabilidade e outros fatores internos e externos que podem ter tido impacto;
7. Produzir instrumentos e ferramentas – há diversos produtos que podem apoiar

os esforços de promoção do uso de conhecimento: resumos executivos e relatórios
da pesquisa, apresentação pessoal da pesquisa aos usuários finais e intermediários,
realização de oficinas, materiais educativos e peças de comunicação para mídias
sociais ou sites institucionais e de divulgação científica;
8. Sustentar o uso do conhecimento – as estratégias de TC devem ser

permanentes e não pontuais, de modo a contribuir para a criação ou o fortalecimento
de uma cultura organizacional de valorização do uso do conhecimento científico.
Para isso, pode-se desenvolver ações como treinamento de equipe no nível local e
institucionalização das parcerias entre pesquisadores e gestores do conhecimento
(GRAHAM; TETROE, 2009).
Diante dessa diversidade de estratégias, é importante esclarecer que, ao se trazer à tona

os processos comunicativos utilizados na TC, existem diferentes maneiras de divulgação
do conhecimento. Algumas dessas se referem à transferência passiva do conhecimento e
são classificadas como estratégias de difusão, das quais são exemplos as publicações
científicas, as apresentações em conferências e congressos acadêmicos e as postagens
em redes sociais. Por sua vez, a disseminação se refere à transferência ativa do
conhecimento, por meio da adaptação da linguagem da mensagem ao público-alvo
específico (WILSON et al., 2010; LOMAS, 1993). Na disseminação, o conhecimento
científico produzido, por exemplo, pelas pesquisas avaliativas, é ativamente direcionado
aos seus usuários imediatos – os gestores públicos – e potencializada sua incorporação às
políticas públicas.
Nesse momento serão consideradas apenas as ferramentas de disseminação do

conhecimento, cientes de que não é possível esgotar os numerosos mecanismos que
podem ser utilizados. A ideia central é a de que pesquisadores da área de avaliação de
políticas de saúde podem aumentar os impactos de suas pesquisas e liderar ações de TC
e comunicação científica para transferência e uso das evidências produzidas (ELLEN et al.,
2014).

A seguir, abordam-se de forma mais específica algumas dessas ferramentas que embora
frequentemente utilizadas são inovadoras no campo da TC:
1. Implementação de serviços colaborativos de knowledge brokering dentro
das organizações – os “intermediários do conhecimento” ou “transmissores do
conhecimento” são serviços capazes de promover a interação entre pesquisadores
e usuários finais, bem como desenvolver a capacidade de tomada de decisão
informada por evidências (CVITANOVIC et al., 2021). As principais atividades
realizadas por esses serviços são:
a. Criação de redes de pesquisadores e tomadores de decisão;
b. Transformação ou enquadramento de questões clínicas ou de gestão em

questões de pesquisa;
c. Apoio a pesquisadores e tomadores de decisão para definir prioridades de

pesquisa;
d. Orientação aos tomadores de decisão quanto a acesso, avaliação,

adaptação e aplicação de evidências geradas por pesquisas;
e. Apoio aos tomadores de decisão para encontrar, desenvolver ou

encomendar sínteses de evidências que tragam mensagens personalizadas
correspondentes às suas necessidades de informação;
f. Avaliação do contexto local, considerando-se barreiras e facilitadores para a

troca de conhecimento entre tomadores de decisão e pesquisadores;
g. Desenvolvimento, implementação e avaliação de estratégias de TC;
h. Estabelecimento de sistemas de gestão do conhecimento dentro das

organizações.
2. Elaboração de resumos executivos e construção de highlights de evidências

de impacto – para auxiliar os tomadores de decisão em relação à compreensão dos
principais aspectos de determinada pesquisa, os resumos executivos e mensagens-
chaves são essenciais a síntese e a disseminação do conhecimento (BRIEFING,
2009; ONU, 2018).

681
3. Mapas de evidências de impacto – trata-se de uma ferramenta de TC que busca
identificar, caracterizar e facilitar a visualização de evidências sobre os impactos de
intervenções em saúde pública ou outras áreas de políticas públicas. A título de
exemplo, vale mencionar destacada iniciativa internacional: 3ie – International
Initiative for Impact Evaluation (SNILSTVEIT, 2013). No Brasil, o Centro Latino-
Americano e do Caribe de Informação em Ciências da Saúde implementou essa
metodologia como uma ação de TC para o Sistema Único de Saúde (BIREME,
2022).
4. Storytelling e Datastorytelling – a contação de histórias é uma ferramenta

popular e eficaz para engajar usuários de conhecimento e apoiar a aceitação de
evidências científicas. O desenvolvimento da estratégia de storytelling envolve três
fases. (a) A fase teórica especifica o objetivo, os mecanismos de ação e as técnicas
que levarão aos efeitos pretendidos. (b) A fase de modelagem envolve o
desenvolvimento de uma abordagem iterativa, com o envolvimento de usuários
finais. Finalmente, (c) a avaliação formal ajuda a determinar se a intervenção está
tendo os efeitos pretendidos (BROOKS et al., 200). De modo semelhante, as
histórias baseadas em dados e informações têm sido muito utilizadas para
comunicar evidências que requerem apresentação e visualização de dados
quantitativos. As estratégias de disseminação como essas podem ser úteis para
promover o uso de evidências acerca do impacto de políticas de saúde (DAVIDSON,
2017).
5. Aplicação de um plano de tradução do conhecimento para comunicar

resultados de pesquisa – o planejamento meticuloso da comunicação de uma
mensagem com conteúdo científico deve ser feito sempre, qualquer que seja o
público a que se destina. Trabalhar na mensagem a partir de um passo a passo
auxilia a abordagem de todos os componentes essenciais para a boa comunicação
do conhecimento produzido (THE HOSPITAL FOR SICK CHILDREN, 2022).
Espera-se que o leitor deste capítulo tenha podido compreender as características

intrínsecas ao processo de tradução do conhecimento e, a partir disso, selecionar a
estratégia que melhor se aplica ao seu contexto, considerando a comunicação do
conhecimento científico provindo de avaliações de impacto de políticas ou programas de
saúde, visando contribuir com o aprimoramento dos processos decisórios em saúde.

Referências
ANDRADE, K. R. C.; PEREIRA, M. G. Knowledge translation in the reality of Brazilian

public health. Revista de Saúde Pública, v. 54, p. 1-7, 2020. Disponível em:
https://www.scielo.br/j/rsp/a/NYWX86QpnmtdSD6yTvY9PzL/?format=pdf&lang=en. Acesso
em: 24 out. 2022.
BIREME-CENTRO LATINO-AMERICANO E DO CARIBE DE INFORMAÇÃO EM

CIÊNCIAS DA SAÚDE. Mapa de evidências: conceito e metodologia. São Paulo: Portal
da BVS, [2022]. Disponível em: http://red.bvsalud.org/mapasdeevidencias-2/. Acesso em:
15 jul. 2022.
BRIEFING note: decisions, rationale and key findings summary. Health Evidence, 2009.
Disponível em: https://healthevidence.org/practice-tools.aspx#PT6. Acesso em: 10 jul.
2022.
BROOKS, S. P. et al. A framework to guide storytelling as a knowledge translation

intervention for health-promoting behaviour change. Implementation Science
Communications, v. 28, n. 3, p. 1-13, 2022. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8962242/pdf/43058_2022_Article_282.pdf.
CANADIAN INSTITUTES OF HEALTH RESEARCH. More about knowledge translation

at CIHR: knowledge translation definition. Ottawa: CIHR, 2014. Disponível em: https://cihr-
irsc.gc.ca/e/29418.html#7. Acesso em: 24 out. 2022.
CVITANOVIC, C. et al. Strategies for building and managing ‘trust’ to enable knowledge
exchange at the interface of environmental science and policy. Environmental Science &
Policy, v. 123, p. 179-189, 20221. Disponível em:
https://www.sciencedirect.com/science/article/pii/S1462901121001465. Acesso em: 24
out. 2022.
DAVIDSON, B. Storytelling and evidence-based policy: lessons from the grey literature.
Palgrave Communications, v. 3, n. 17093, p. 1-10, 2017. Disponível em:
https://www.nature.com/articles/palcomms201793. Acesso em: 24 out. 2022.
ELLEN, M. E. et al. Determining research knowledge infrastructure for healthcare systems:

a qualitative study. Implement Science, v. 6, n. 60, p. 1-5, 2011. Disponível em:
ELLEN, M. E. et al. Barriers, facilitators and views about next steps to implementing
supports for evidence-informed decision-making in health systems: a qualitative study.
Implement Science, v. 9, n. 179, p. 1-12, 2014.
ESMAIL, R. et al. A scoping review of full-spectrum knowledge translation theories,

models, and frameworks. Implement Science, v. 15, n. 1, p. 1-14, 2020. Disponível em:
GAGLIARDI, A. R.; KOTHARI, A.; GRAHAM, I. D. Research agenda for integrated

knowledge translation (IKT) in healthcare: what we know and do not yet know. Journal of
Epidemiology Community Health, v. 71, n. 2, p. 105-106, 2017. Disponível em:
https://jech.bmj.com/content/jech/71/2/105.full.pdf. Acesso em: 24 out. 2022.

683
GRAHAM, I. D.; TETROE, J. M. Getting evidence into policy and practice: perspective of a
health research funder. Journal of the Canadian Academy of Child and Adolescent
Psychiatry, v. 18, n. 1, p. 46-50, 2009.
GRIMSHAW, J. M. et al. Knowledge for knowledge translation: the role of the Cochrane
Collaboration. Journal Continuing Education Health Professions, v. 26, n. 1, p. 55-62,
2006. Disponível em: https://pubmed.ncbi.nlm.nih.gov/19270848/. Acesso em: 24 out.
2022.
LAVIS, J. N. et al. How can research organizations more effectively transfer research
knowledge to decision makers? Milbank Quarterly, v. 81, n. 2, p. 221-248, 2003.
Disponível em: https://onlinelibrary.wiley.com/doi/full/10.1111/1468-0009.t01-1-00052?sid
=nlm %3 Apubmed. Acesso em: 24 out. 2022.
LOMAS, J. Diffusion, dissemination, and implementation: who should do what? Annals of

the New York Academy of Sciences, v. 703, p. 226-235, 1993.
DOI: 10.1111/j.1749-6632.1993.tb26351.x.
MINTZBERG, H. Criando organizações eficazes: estruturas em cinco configurações.

São Paulo: Atlas, 1995.
MOORE, G.; TODD, A.; REDMAN, S. Strategies to increase the use of evidence from
research in population health policy and programs: a rapid review. Glebe: Sax
Institute, 2009. Disponível em: https://www.health.nsw.gov.au/research/Documents/10-
strategies-to-increase-research-use.pdf. Acesso em: 24 out. 2022.
OREM NABYONGA, J. et al. Perspectives on the role of stakeholders in knowledge

translation in health policy development in Uganda. BMC Health Services Research, v.
13, n. 324, p. 1-13, 2013. Disponível em: https://bmchealthservres.biomedcentral.com/
/articles/10.1186/1472-6963-13-324. Acesso em: 24 out. 2022.
ORGANIZAÇÃO MUNDIAL DA SAÚDE - OMS. Declaração de Alma-Ata. Conferência

Internacional sobre os Cuidados de Saúde Primários. Cazaquistão: OMS, 1978.
Disponível em: www.who.int/publications/almaata_declaration_en.pdf. Acesso em: 20 jul.
2022.
SNILSTVEIT, B. et al. Evidence gap maps: a tool for promoting evidence-informed policy
and prioritizing future research. Washington, DC: World Bank, 2013. (Policy research
working paper; n° 6725). Disponível em:
https://openknowledge.worldbank.org/handle/10986/16941. Acesso em: 20 jul. 2022.
STRAUS, S. E.; TETROE, J.; GRAHAM, I. Defining knowledge translation. CMAJ:

Canadian Medical Association Journal, v. 181, n. 3-4, p. 165-168, 2009.
STRIFLER, L. et al. Scoping review identifies significant number of knowledge translation

theories, models, and frameworks with limited use. Journal of Clinical Epidemiology, v.
100, p. 92-102, 2018. Disponível em: https://www.sciencedirect.com/science/article/pii/
/S0895435617314178?via%3Dihub. Acesso em: 24 out. 2022.
THE HOSPITAL FOR SICK CHILDREN (SickKids). Knowledge translation planning

template. Toronto: University Avenue, 2022. Disponível em: https://www.sickkids.ca/en/
learning/continuing-professional-development/knowledge-translation-training/knowledge-
translation-planning-template-form/. Acesso em: 18 jul. 2022.

TOMLINSON, E.; PARKER, R. Cochrane - Six-step stakeholder engagement
framework. 2021. Disponível em: https://training.cochrane.org/sites/training.cochrane.org/
files/public/uploads/Six%20Step%20Stakeholder%20Engagement%20Framework.pdf.
Acesso em: 13 jul. 2022.
UNITED NATIONS. Climate action now: summary for policymakers 2018. Bonn, GE:
United Nations, Climate Change Secretariat, 2018.
WILSON, P. M. et al. Disseminating research findings: what should researchers do? A

systematic scoping review of conceptual frameworks. Implement Science, v. 5, n. 91, p.
1-16, 2010. Disponível em: https://implementationscience.biomedcentral.com/articles/
10.1186/1748-5908-5-91. Acesso em: 24 out. 2022.
WOLFENDEN, L. et al. Increased use of knowledge translation strategies is associated

with greater research impact on public health policy and practice: an analysis of trials of
nutrition, physical activity, sexual health, tobacco, alcohol and substance use
interventions. Health Research Policy System, v. 20, n. 15, p. 1-10, 2022. Disponível
em: https://health-policy-systems.biomedcentral.com/ articles/10.1186/s12961-022-00817-
2. Acesso em: 24 out. 2022.

685
Capítulo 25
Como comunicar evidências

científicas para gestores públicos e
tomadores de decisão?
Fabiana Mascarenhas1
Luciano Máximo2
1
Assessoria de Comunicação (Ascom) da Fundação Oswaldo Cruz - Brasília
2
Gerente de projetos de formação de talentos e geração de empregos no
mercado de tecnologia brasileiro do setor privado
RESUMO:
Este capítulo aborda o papel e a importância da comunicação de evidências científicas como
ferramenta essencial para subsidiar a tomada de decisão em saúde e, à luz da literatura sobre as áreas
da tradução do conhecimento e comunicação em saúde, propõe estratégias para tornar a comunicação
mais acessível, compreensível e útil aos diferentes atores sociais envolvidos no processo decisório.
Tais estratégias, que incluem conteúdo sobre como lidar com infodemia e desinformação, têm como
público de interesse, principalmente, aqueles que determinam as ações, programas e políticas de
saúde, os gestores/as das diferentes esferas governamentais brasileiras: municipal, estadual e federal.
Espera-se que esse trabalho possa colaborar para orientar as ações de comunicação realizadas por
diferentes grupos e instituições, sobretudo as envolvidas na gestão pública.
PALAVRAS-CHAVE:
Tomada de decisão em saúde. Comunicação em saúde. Tradução do conhecimento. Comunicação de
evidências.

A resposta para a pergunta-título deste artigo não é simples, tampouco existe no Brasil um
manual com o passo a passo ou recomendações concretas e validadas sobre as formas
mais eficazes de se comunicar evidências científicas para gestores de saúde e/ou
formuladores de políticas e programas, tendo em vista, principalmente, a diversidade desse
público e os diferentes contextos socioculturais em que estão inseridos.
A verdade é que não há receita quando o assunto é a comunicação de evidências

científicas, independentemente do público que se pretende alcançar. Não apenas pela
complexidade que a envolve, mas sobretudo pelo fato de se tratar de uma área cuja
condução varia conforme a audiência e o tipo de conhecimento a se comunicar. Diante do
crescente volume de conhecimento em saúde atualmente disponível e da velocidade em
que é gerado em nível global, o desafio da comunicação se torna ainda maior, uma vez que
esses fatores influenciam na capacidade de utilização, adoção e aplicação das evidências
científicas.
Há, no entanto, estratégias que se podem adotar com o objetivo de tornar a comunicação
mais acessível, compreensível e útil para os diferentes atores sociais envolvidos no
processo decisório. Este artigo aborda essas estratégias, tendo como público de interesse,
principalmente, aqueles que determinam as ações, programas e políticas de saúde, os
gestores/as das esferas governamentais brasileiras: municipal, estadual e federal. Espera-
se que este trabalho possibilite contribuir para orientar as ações de comunicação efetuadas
por diferentes grupos e instituições, especialmente aquelas incluídas na gestão pública.
1 A importância da comunicação na tomada de decisão
O uso de evidências científicas no processo decisório em saúde tem sido incentivado

mundialmente. Políticas e serviços informados por evidências são uma tendência na busca
por melhores resultados, uma vez que colaboram para qualificar a tomada de decisão
diante dos problemas prioritários de saúde; isso se aplica principalmente aos países como
o Brasil, os quais tendem a ter limitações de recursos relacionadas ao investimento em
pesquisa (BARRETO; SOUZA, 2013; PAHO; WHO, 2007).
O país tem acumulado uma série de iniciativas com o objetivo de incentivar e promover o
uso de evidências científicas na gestão público-governamental. Entre as principais estão o
desenvolvimento da Rede de Políticas Informadas por Evidências (Rede EvipNet) (DIAS;

687
BARRETO; SOUZA, 2014), a implantação da Rede Brasileira de Avaliação de Tecnologias
em Saúde (Rebrats), Brasil (2010) e a criação da Coordenação de Evidências e
Informações Estratégicas para a Gestão em Saúde (Coevi), vinculada ao Departamento de
Ciência e Tecnologia do Ministério da Saúde, que permitiu a estruturação de um Serviço
de Produção de Evidências para Apoio à Tomada de Decisão (BRASIL, 2019).
Entretanto, embora diferentes iniciativas sobre o uso do conhecimento científico como

suporte ao processo de decisão em saúde estejam sendo realizadas no Brasil e em
diferentes países do mundo, o uso sistemático dos resultados de pesquisas científicas por
tomadores de decisão ainda é considerado incipiente (BRASIL, 2019). Estudos da literatura
apontam algumas barreiras para o não uso ou baixo uso das evidências científicas na
gestão em saúde, entre essas a comunicação pouco eficiente dos resultados das pesquisas
(BRASIL, 2015; LOMAS, 1997; KOGA et al., 2020; FERRAZ; PEREIRA; PEREIRA, 2019).
As evidências, muitas vezes, não são efetivamente comunicadas e, quando isso ocorre, é
comum que os gestores não compreendam ou tenham dificuldade de interpretar, adaptar e
aplicar o conhecimento científico ao contexto no qual está inserido (BRASIL, 2015; KOGA
et al., 2020; BRASIL, 2021).
Na tentativa de minimizar esse problema, Dias et al. (2015), Brasil (2015) apontam quatro
estratégias principais para estimular o uso de evidências científicas por tomadores de
decisão em saúde: (1) produzir e disseminar sínteses de evidência com linguagem
adaptada a diferentes públicos; (2) usar plataforma virtual on-line para disseminação do
conhecimento científico; (3) utilizar o jornalismo e outras formas de comunicação social
para ampliar a disseminação do conhecimento científico; e (4) promover a interação entre
pesquisadores e tomadores de decisão.
Os resultados de um estudo mais recente não foram muito diferentes. O trabalho investigou
tipos e condicionantes de usos de evidências por servidores de órgãos federais brasileiros
e identificou experiências de políticas públicas baseadas em evidências em áreas
específicas (KOGA et al., 2020). Como parte desse projeto desenvolveu-se um policy brief
Brasil (2021), o qual buscou analisar a visão dos servidores públicos federais sobre o uso
e não uso de evidências científicas nas políticas públicas.
O estudo revelou, entre outros resultados, que as fontes científicas estão entre as menos
utilizadas por esse público para acessar evidências: 54% desses servidores afirmam que
nunca ou raramente fazem uso de relatórios de pesquisas científicas e 72% afirmaram que

não existe ou não sabem da existência de uma área especializada em seu ministério
voltada para a utilização de evidências (BRASIL, 2021).
Também se apresentou aos respondentes um conjunto de alternativas relacionadas a

fatores que potencialmente poderiam favorecer sua utilização. A credibilidade e prestígio
da fonte, aplicabilidade dos resultados e fornecimento de recomendações estão entre os
principais motivos a levarem os servidores a utilizarem estudos e pesquisas. Foram
respondidos 2.180 questionários válidos, a partir de amostra para a administração pública
direta (BRASIL, 2021).
Entre as recomendações apontadas nesse trabalho para os produtores do conhecimento

estão ampliar e diversificar o uso das fontes de acesso aos produtores de políticas públicas
– de acordo com o público que se pretende alcançar – e investir no desenvolvimento da
capacidade de comunicação de evidências não apenas para os gestores públicos, mas
também para a sociedade, mídia e os diversos atores envolvidos na política (BRASIL,
2021).
Os contextos mundial e nacional revelam que tão importante quanto incentivar e promover
o uso de evidências científicas na tomada de decisão é pensar em como comunicar o
conhecimento científico e os resultados das pesquisas aos gestores/as de saúde
(SANTANA; MENDONÇA; SOUSA, 2022). Para isso, é fundamental desenvolver
estratégias adaptadas a diferentes contextos institucionais e sociais e considerar a
comunicação como parte essencial de um processo que envolve desde a produção até a
implementação da evidência (BARRETO; SOUZA, 2013; BRASIL, 2015; FERRAZ;
PEREIRA; PEREIRA, 2019; DIAS et al., 2015; CANADIAN, 2012).
Partindo-se dessa premissa, é fundamental compreender a comunicação em perspectiva

transdisciplinar, dada a complexidade entre seu campo e o campo da saúde, ou seja, como
campos de saber inter-relacionados. Conforme observa Costa (2018), estuda-se a interface
entre saúde e comunicação em diferentes perspectivas e nomenclaturas. Comunicação e
saúde; comunicação em saúde; comunicação da saúde; e comunicação para a saúde são
alguns dos termos encontrados, boa parte usada como sinônimo, mas que expressam
mensagens diferentes e relacionam a comunicação à saúde (e vice-versa).
Os processos de comunicação em saúde envolvem ainda outra importante área de

conhecimento denominada comunicação científica a qual, de acordo com Vale-Caribé

689
(2015), aparece como termo genérico ao qual outros encontram-se subordinados como
difusão científica, divulgação científica, popularização da ciência e disseminação científica.
A autora explica que o campo semântico da comunicação científica inclui a comunicação
da informação gerada a partir dos métodos das ciências, tanto para os pares quanto para
o público leigo.
Não obstante às questões conceituais e de nomenclatura, é fundamental entender a

transferência ou comunicação de evidências científicas como uma área que se inter-
relaciona com os campos da comunicação em saúde e da comunicação científica, e como
tal, trata-se de uma ferramenta estratégica capaz de auxiliar a tomada de decisão em saúde
e influenciar comportamentos, seja no âmbito individual ou coletivo (SANTANA;
MENDONÇA; SOUSA, 2022; CANADIAN, 2012).
Mosquera (2003) destaca a importância da comunicação em saúde ao afirmar que as

tendências epidemiológicas atuais ampliaram o papel da comunicação em saúde como
componente vital para a prática da saúde pública, como o ressurgimento de doenças
consideradas controladas, juntamente com o aumento das doenças degenerativas nos
países em desenvolvimento, o surgimento de novos organismos infecciosos, a resistência
microbiana a drogas terapêuticas e uma ênfase crescente na prevenção de doenças e
promoção da saúde (MOSQUERA, 2003).
A importância desse papel é reforçada diante do surgimento de novos vírus e doenças, a

exemplo do zika vírus e do SARS-CoV-2, tendo esse último originado a Covid-19, além do
crescente aumento das notícias falsas – as fake news – e do excesso de informação – a
chamada infodemia (MASSARANI, 2021).
Mosquera (2003) ressalta ainda o uso da informação em saúde por instituições

governamentais com o objetivo de gerar mudanças de práticas e atitudes para promoção
da saúde junto a indivíduos e comunidades. Nesse sentido, as informações e
comunicações em saúde, segundo o autor, devem ser úteis e oportunas para a tomada de
decisão no âmbito da vigilância e para a promoção da saúde.
De igual maneira, a Organização Mundial da Saúde (OMS) reconhece a comunicação como

um elemento necessário aos esforços para melhorar a saúde pública (NATIONAL CENTER
FOR HEALTH STATISTICS, 2012), uma vez que engloba o estudo e o uso de estratégias
para informar e influenciar decisões individuais e coletivas. O órgão estabeleceu um guia

(WHO, 2017) com seis princípios para comunicações efetivas direcionadas a diferentes
públicos, que devem ser considerados em todas as diretrizes da OMS, atividades e
materiais de comunicação. De acordo com a OMS, uma comunicação efetiva deve ser
acessível, acionável, confiável, relevante, oportuna e compreensível.
Figura 1 - Princípios para uma comunicação efetiva
Fonte: OMS, 2017.
Faz-se necessário destacar, no entanto, os limites da comunicação que, mesmo quando

realizada de forma efetiva, por si somente não é capaz de garantir que as decisões em
saúde serão tomadas com base no conhecimento científico (STRAUS; TETROE;
GRAHAM, 2011). O processo de tomada de decisão é complexo e influenciado por
diferentes atores – gestores, profissionais de saúde, pesquisadores, indústria, sociedade
civil e seus representantes –, além de múltiplos fatores – econômicos, ideológicos, político-
partidários e sociais. Portanto, está mediado por relações que extrapolam o campo da
comunicação (BARRETO; SOUZA, 2013; STRAUS; TETROE; GRAHAM, 2011).
Isso significa não haver garantia de que, uma vez que o conhecimento tenha sido
comunicado ou transferido, será implementado posteriormente. Mas para que esse
processo ocorra de forma efetiva é preciso praticar uma comunicação integrada e
institucionalizada na estrutura do governo em questão, o que envolve a elaboração de

691
estratégias e planejamento de disseminação do conhecimento, educação, além da
integração dos atores envolvidos no processo decisório (BRASIL, 2015; STRAUS;
TETROE; GRAHAM, 2011; BARTLETT; GAGNON, 2016; RESEARCH, 2019; LIU et al.,
2018).
Outro ponto fundamental diz respeito ao uso das evidências científicas como fator
determinante à tomada de decisão em saúde. As evidências científicas são fontes de
informação importantes utilizadas para apoiar as ações e decisões na área da saúde, mas,
conforme afirmam Oxman e colaboradores, não são por si mesmas soluções (OXMAN et
al., 2009). Portanto, não se pode afirmar que o uso de evidências produz necessariamente
melhores decisões, Lomas (1997) embora sejam alicerces fundamentais para subsidiar
decisões em saúde (LOMAS, 1997; MARTINEZ-SILVEIRA, 2015).
Ademais, há questões relacionadas à qualidade e contexto que precisam ser consideradas.

Evidências provenientes de resultados de pesquisas bem desenhadas e relatadas tendem
a ter mais poder ou influência que observações casuais ou de pesquisas com falhas
metodológicas (LOMAS, 1997; MARTINEZ-SILVEIRA, 2015) por isso torna-se fundamental
estabelecer critérios sistemáticos de avaliação e analisar a viabilidade de sua aplicação.
Além disso, às vezes a melhor evidência não é diretamente relevante em determinado
contexto, Galvão et al. (2013) são necessárias investigações que busquem abordar
evidências adaptáveis a contextos específicos.
2 A comunicação de evidências e a tradução do conhecimento
Antes de falarmos sobre as estratégias para comunicar evidências científicas a gestores/as

de saúde é preciso compreender e contextualizar a comunicação de evidências no âmbito
da tradução do conhecimento (do inglês knowledge translation - KT), (CANADIAN, 2012;
STRAUS; TETROE; GRAHAM, 2013), cuja definição e importância foram abordados no
capítulo anterior.
Atualmente, existem diferentes modelos propostos por Andrade (2019), Bezerra et al.
(2019) para representar os componentes ou cada uma das etapas necessárias à tradução
do conhecimento, apontada como uma das principais ferramentas para tentar reduzir a
histórica lacuna existente entre o conhecimento científico gerado no campo da saúde e a
utilização desse conhecimento na prática pelos diferentes públicos.

Não é o objetivo deste artigo discorrer sobre esses modelos, mas é importante informar que
esses incluem, principalmente, as etapas relacionadas à geração, síntese, disseminação,
intercâmbio e implementação ou aplicação da evidência científica. São exemplos o modelo
Conhecimento-para-Ação, proposto por Graham et al. (2006) e Field et al. (2014) e o
modelo de assistência médica baseada em evidências do Joanna Briggs Institute (JBI)
(PEARSON; WEEKS; STERN, 2011).
Embora possam variar, esses modelos destacam a importância da comunicação das

evidências científicas ou da chamada transferência da evidência, que diz respeito à
transmissão do conhecimento ao potencial usuário (ANDRADE, 2019). A essa etapa estão
associados ao menos dois conceitos: a difusão e a disseminação do conhecimento.
A definição de conceitos como disseminação, difusão e divulgação científica são variados

e dependem do contexto no qual se inserem (SANTANA; MENDONÇA; SOUSA, 2022).
Lomas (1993) entende por disseminação a adaptação e empacotamento do conhecimento
ou mensagem para um público específico, incluindo métodos ativos e formatos
direcionados para melhor compreensão do conteúdo (LOMAS, 1993).
De modo semelhante, Bueno (1985; 2010) compreende o processo de disseminação como

pressuposto da transferência de informações científicas e tecnológicas, transcritas em
códigos especializados, também a um público seleto formado por especialistas. Esse
processo comporta dois níveis: disseminação intrapares e disseminação extrapares. O
primeiro diz respeito à circulação de informações de C&T entre especialistas de uma área
ou de áreas conexas. A disseminação extrapares se refere à circulação de informações de
C&T também para especialistas, mas que se situam fora da área-objeto da disseminação
ou são de outras áreas.
Para Bueno (1985; 2010), no entanto, o conceito de difusão tem limites bastante amplos e,
nesse sentido, incorpora a divulgação científica, a disseminação científica e o jornalismo
científico, considerando-os como suas espécies. O autor emprega o termo difusão para se
referir a todo e qualquer recurso utilizado para a veiculação de informações científicas e
tecnológicas.
A extensão do conceito permite abranger desde periódicos especializados, bancos de

dados e reuniões científicas (congressos, simpósios, seminários) até páginas de ciência e
tecnologia dos jornais e das revistas, programas de rádio e televisão e o cinema dito

693
científico. Atualmente, inclui ainda os blogs, as redes sociais e mídias digitais em geral. Os
conceitos variam, portanto, de acordo com o perfil do público, o nível de discurso, a
natureza dos canais ou ambientes utilizados para sua veiculação e a intenção explícita de
cada processo em particular (LOMAS, 1993; BUENO, 1985).
Entretanto, no contexto da tradução do conhecimento, o objetivo da comunicação de

evidências é não apenas informar Wolton (2010) ou reportar os resultados de pesquisas e
estudos, mas colaborar para que as decisões em saúde sejam, de fato, subsidiadas pelo
conhecimento científico (SANTANA; MENDONÇA; SOUSA, 2022). Para isso, é necessário
o desenvolvimento de estratégias que possam tornar o conteúdo científico não somente
acessível, mas sobretudo capaz de facilitar a compreensão dos gestores/as sobre
determinado problema, contexto ou realidade e auxiliar o desenvolvimento de ações e
decisões em diversas instâncias, sejam relacionadas às políticas e programas de saúde, à
implantação de serviços e de procedimentos ou à aquisição de equipamentos e tecnologias
de saúde (CANADIAN, 2012).
Por essa perspectiva, a comunicação de evidências precisa ser pensada a partir do

conceito da comunicação em saúde ou, conforme afirma a autora Schiavo (2007), a partir
de uma abordagem multifacetada, com o objetivo de influenciar, engajar e prover suporte a
indivíduos, comunidades, profissionais de saúde, grupos especiais, políticos e o público
para defender, introduzir, adotar ou sustentar um comportamento, prática ou política que
por fim melhorará os resultados de saúde.
Assim, torna-se fundamental praticar uma comunicação direcionada, identificar o público

estratégico, investigar qual a melhor forma de alcançá-lo e adequar e estruturar a
mensagem de acordo com o perfil do mesmo, o que inclui aspectos relacionados à
linguagem e melhores formatos para apresentação dos dados e das principais informações
(BRASIL, 2015; SANTANA; MENDONÇA; SOUSA, 2022; RESEARCH, 2019).
Sempre que possível, essa comunicação precisa contemplar também a análise da

aplicabilidade das evidências científicas, de acordo com as necessidades dos gestores/as
e das especificidades regionais e locais, ou seja, adaptar as possíveis intervenções ao
contexto sociocultural no qual o público de interesse está inserido (BARRETO; SOUZA,
2013; BRASIL, 2015; FERRAZ; PEREIRA; PEREIRA, 2019; DIAS et al., 2015; CANADIAN,
2012). No caso do Brasil, isso inclui orientar de que forma as evidências encontradas nos

estudos podem ser utilizadas, na prática, no âmbito do Sistema Único de Saúde (SUS)
(SANTANA; MENDONÇA; SOUSA, 2022).
Existe uma variedade de modelos e estratégias de comunicação em saúde (MOSQUERA,

2003), assim como variam as estratégias de intervenções de tradução do conhecimento
(CANADIAN, 2012; BEZERRA et al., 2019). A adoção de um ou mais modelos dependerá,
entre outros fatores, do tipo de conteúdo e audiência que se pretende alcançar (CANADIAN,
2012). Assim, tendo em vista a comunicação direcionada aos atores envolvidos no
processo decisório em saúde e com base nas recomendações dos estudos (BRASIL, 2015;
KOGA et al., 2020; BRASIL, 2021) e referências mencionadas nesse artigo, reunimos
algumas estratégias (BRASIL, 2015; KOGA et al., 2020; BRASIL, 2021; DIAS et al., 2015;
WHO, 2017; STRAUS; TETROE; GRAHAM, 2011; RESEARCH, 2019; BEZERRA et al.,
2019; FIELD et al., 2014; OXMAN et al., 2020) para tornar a comunicação de evidências
científicas mais acessível, amigável e útil a esse público.
A seleção dessas estratégias foi realizada, prioritariamente, com base no Guide to

Knowledge Translation Planning at CIHR: integrated and end-of-grant approaches
(CANADIAN, 2012) e nas recomendações de Lavis et al. (2003), as quais sugerem uma
estrutura organizacional como estratégia de transferência de conhecimento para tomadores
de decisão a partir de cinco perguntas: (1) O que deve ser transferido para os tomadores
de decisão? (2) Para quem deve ser transferido? (3) Por quem? (4) Como? (5) Com que
efeito?
3 A comunicação para a ação: algumas estratégias
A estrutura organizacional como estratégia de transferência de conhecimento proposta na

seção anterior deste artigo é um passo importante para auxiliar pesquisadores a construir
pontes para uma comunicação de evidências eficaz e um acesso a evidências facilitado,
pois contextualiza o processo do uso de evidências dentro do ciclo da política pública e
propicia um norte de como o conhecimento científico pode contribuir para a tomada de
decisão, um dos estágios mais complexos desse ciclo.
Tendo isso em vista, a comunicação se torna protagonista nesse processo, devendo

permeá-lo da fase de pesquisa e geração de conhecimento e/ou evidências, passando pela

695
transmissão dessas evidências aos gestores/as de saúde, até a tomada de decisão de uma
autoridade e sua respectiva comunicação à sociedade.
Portanto, uma comunicação para a ação de evidências científicas de estudos de avaliação

de impacto de políticas e programas de saúde para gestores deve contemplar as seguintes
estratégias, que demonstram ser significativamente mais eficazes quando adotadas de
forma concomitante.
3.1 Desenvolver um plano de comunicação
Recomenda-se o desenvolvimento de um plano de tradução do conhecimento que,

por sua vez, contemple um plano de comunicação estruturado desde o início da
pesquisa e contenha estratégias de disseminação, divulgação e/ou
compartilhamento do conhecimento científico como forma de aumentar os benefícios
e o impacto dos achados da pesquisa. O escopo do plano de comunicação deve ser
adequado às metas, objetivos e prazos estabelecidos no plano de tradução do
conhecimento e recursos disponíveis. No entanto, é importante destacar que o plano
de comunicação pode ser alterado ou modificado à medida que se desenvolve a
pesquisa, pois novas estratégias ou necessidades podem ser identificadas no
decorrer do processo.
3.2 Incluir profissional ou equipe especializada na comunicação dos

resultados de pesquisa
A comunicação de conhecimento científico ou evidências para embasar a tomada de

decisões de gestores/as e lideranças da área de saúde deve ser vista como uma
ação estruturante e integrada e não uma ação isolada para uma divulgação mais
abrangente destinada a um público amplo. Considerando-se as devidas capacidades
de estrutura organizacional ou institucional, a estratégia comunicacional deve
começar a partir da pesquisa e percorrer – de maneira dinâmica e interativa – todo
o seu percurso até o momento da tomada de decisão. A presença de um profissional
ou uma equipe especializada potencializará a tradução do conhecimento eficaz, o
que implica mapear e trabalhar a comunicação nas estratégias a seguir. O perfil
desse profissional/equipe pode ter caráter multidisciplinar, o que favorece o
compartilhamento de experiências e a interação entre atores da mesma organização
ou de organizações parceiras à medida em que a pesquisa acontece.

3.3 Identificar o público de interesse
Pesquisadores e cientistas, com apoio de profissional ou equipe especializada de

comunicação, devem ter a flexibilidade de apresentar o resultado de seus estudos
conforme a necessidade dos consumidores dessas informações, de modo que o
conhecimento produzido ou as evidências geradas tenham melhor aderência e
auxiliem no processo de tomada de decisão. Para isso, no entanto, é fundamental
se considerar que o processo decisório e a gestão em saúde são influenciados e
administrados por diferentes atores sociais, o que envolve a participação de pessoas
com diferentes perfis (gênero, idade etc.), origens, formações, trajetórias políticas e
que estão inseridas em diferentes contextos. Portanto, o processo de transferência
do conhecimento demandará estratégias de comunicação específicas, as quais
devem ser elaboradas de acordo com o perfil dos usuários do conhecimento.
3.4 Adaptar linguagem
Para se obter o melhor aproveitamento do conhecimento científico – ou das

evidências – gerado como suporte à tomada de decisões, é importante contar com
o auxílio de profissional/equipe de comunicação para adaptar a linguagem das
pesquisas ou estudos, conforme o perfil e a necessidade do público predeterminado
e ao contexto político e social em que as informações/dados produzidos serão
utilizados. Em alguns casos, essa adaptação pode envolver a tradução da linguagem
tecnicista e academicista, comumente utilizada no meio científico, para uma
linguagem não formal e acessível aos diferentes usuários do conhecimento,
especialmente os não especialistas em determinado tema ou assunto. Para isso,
sugere-se evitar os usos de jargões, parágrafos longos e ambiguidades, dar
preferência a períodos em ordem direta, apresentar primeiro o conteúdo mais
importante de cada seção ou subseção e usar, sempre que possível, verbos na voz
ativa.
3.5 Utilizar elementos visuais e diversificar formato
O uso de elementos e recursos visuais – infografias, fotografias, ilustrações, tabelas,

gráficos – deve ser considerado, assim como a apresentação dos resultados em
diferentes formatos e adaptados aos públicos em potencial – boletins informativos,
resumos executivos ilustrados, sínteses de evidências, diálogos deliberativos,
mapas, infográficos, relatórios técnicos, postagens em redes sociais, eventos
educativos e de sensibilização, vídeos etc. Trata-se de uma preocupação importante,

697
pois o modo como a informação é apresentada pode ter impacto em como essa é
interpretada e utilizada.
3.6 Ser conciso e objetivo
Concisão e objetividade são essenciais para uma comunicação efetiva. Trata-se de

um desafio, mesmo para profissionais de comunicação gabaritados, pois as
temáticas científicas são geralmente complexas e demandam esforço relevante para
a tradução que transmita as informações necessárias para a boa compreensão.
Algumas técnicas podem ser empregadas para dar conta dessa estratégia:
linguagem simples, uma proposta de comunicação que surgiu no Reino Unido e nos
Estados Unidos nos anos 1940, com o objetivo de facilitar a leitura de textos e
documentos; e o lide jornalístico, prática que condensa no início do texto as principais
informações de um conteúdo que está sendo divulgado – o que (a ação), quem (o
agente), quando (o tempo), onde (o lugar), como (o modo) e por que (o motivo) –,
com o intuito de atrair e conduzir o leitor/a ao longo do texto.
3.7 Fazer disseminação ativa
Embora comuns no ambiente científico, as publicações em periódicos, as

apresentações não interativas em conferências, seminários e webinars são meios
de disseminação passiva, o que obriga os usuários do conhecimento a interpretar e
avaliar, por conta própria, como utilizar as evidências disponíveis.
Esses mecanismos passivos são importantes, mas, muitas vezes, não levam a
mudanças comportamentais ou que possam influenciar no desenvolvimento de
ações efetivas, uma vez que se concentram na disseminação de evidências sem
fazer conexão sobre como as evidências podem ser aplicadas pelos usuários do
conhecimento em diferentes contextos. Por isso, é fundamental adaptar as possíveis
intervenções ao contexto sociocultural no qual o público de interesse está inserido e
isso inclui orientar – na prática – de que forma as evidências encontradas podem ser
utilizadas.
Outro ponto a ser destacado é a necessidade de buscar disseminar evidências não

somente por meio de métodos que sejam facilmente acessíveis (por exemplo,
publicações de acesso aberto e mídias sociais), mas que incluam estratégias de
disseminação ativas (a exemplo dos podcasts, postagens em blogs e tweets etc.).

Essas estratégias colaboram para o desenvolvimento de etapas acionáveis para a
implementação da evidência.
4 Iniciativas e exemplos
A construção de produtos e ferramentas de tradução do conhecimento tem sido utilizada

com o objetivo de incentivar e promover o uso de evidências científicas pelos tomadores
de decisão em saúde. Entre as principais está a elaboração de sínteses de evidências
(BRASIL, 2015; MARTINEZ-SILVEIRA, 2015; APÓSTOLO, 2017), atualmente um dos
principais instrumentos para informar políticas e a tomada de decisões em saúde, em
função de seu potencial para fornecer análises aprofundadas sobre os achados, além de
ampliar a compreensão sobre os fenômenos de interesse.
Entretanto, a complexidade do tema e a quantidade de dados em revisões podem impedir

a compreensão e o uso em processos de decisão, por isso é necessário pensar em
estratégias que possam sintetizar grandes volumes de dados e informações em formatos
acessíveis. O desenvolvimento de softwares ou plataformas web que permitam a criação
de apresentações interativas de dados de revisão sistemática em formatos que atendam
às necessidades dos usuários do conhecimento é uma estratégia recomendada (BRASIL,
2015; DIAS et al., 2015).
No Brasil, um bom exemplo de produção de sínteses de evidências com linguagem

adaptada a diferentes públicos é o trabalho desenvolvido pelo Instituto Veredas,
organização sem fins lucrativos que busca promover a utilização de conhecimento técnico
e científico na formulação e no desenvolvimento de políticas públicas no Brasil.
O Veredas iniciou suas atividades em 2016 – com o objetivo de construir pontes entre
gestão pública, academia e sociedade civil – e apresentou alternativas que geram mais
acesso ao conhecimento técnico e científico na execução de políticas públicas. A instituição
atua na área da tradução do conhecimento e das políticas informadas por evidências (PIE)
e apoia intervenções sociais. Tem como missão construir pontes para que políticas e
intervenções sociais sejam mais efetivas e colaborativas e garantir os direitos da população
brasileira.
Abaixo estão alguns exemplos de produtos elaborados pelo Instituto Veredas, em parceria
com diferentes instituições, como a Fundação Oswaldo Cruz (Fiocruz). As publicações e os

699
projetos desenvolvidos pela organização estão disponíveis em https://www.
veredas.org/publicacoes/.
Figura 2 - Sínteses de evidências
Fonte: Instituto Veredas.
Assim como as sínteses, os mapas de evidências também têm sido utilizados como uma
importante ferramenta de tradução do conhecimento para subsidiar gestores de saúde na
tomada de decisão. Esse método busca sintetizar, identificar, descrever e caracterizar
graficamente a evidência científica que existe para determinada temática e mapear
possíveis lacunas de conhecimento (BIREME, 2020).
Os mapas de evidências demonstram tanto o quantitativo de estudos quanto os principais

achados, por meio dos quais também é possível identificar vazios de produção de
conhecimento. Tudo é apresentado em uma espécie de dashboard (painel digital interativo)
em que é possível criar e escolher filtros que direcionem a pesquisa para o objetivo buscado
pelo gestor ou pesquisador.
O Centro Latino-Americano e do Caribe de Informação em Ciências da Saúde da

Organização Pan-Americana da Saúde (Bireme/Opas), por exemplo, vem realizando uma
série de mapas de evidências sobre a aplicabilidade clínica de práticas integrativas e
complementares de saúde (PICS), em parceria com a Rede MTCI Américas e Consórcio
Acadêmico Brasileiro de Saúde Integrativa (Cabsin). O material subsidia profissionais de

saúde, tomadores de decisão e pesquisadores que atuam na construção de ações de saúde
baseadas em evidências. Os mapas produzidos até aqui estão disponíveis em
https://www.paho.org/pt/noticias/19-11-2020-biremeopas-lanca-mapas-evidencias-sobre-
aplicabilidade-clinica-das-praticas.
No exemplo da figura 2 é possível consultar contribuições das medicinas tradicionais,

complementares e integrativas (MTCI) no contexto da pandemia de Covid-19. Nesse mapa
de evidências (disponível em https://mtci.bvsalud.org/pt/contribuicoes-das-medicinas-
tradicionais-complementares-e-integrativas-mtci-no-contexto-do-covid-19/), o usuário pode
consultar até 126 estudos de dezenas de países diferentes, entre revisões sistemáticas,
estudos não randomizados, ensaios clínicos etc.
Figura 3 - Mapa de evidências - contribuições das MTCI para Covid-19
Fonte: Instituto Veredas.
A International Initiative for Impact Evaluation (3ie) é uma organização considerada

referência na produção de mapas de lacunas de evidências – ferramentas que
sistematizam informações exclusivamente de revisões sistemáticas e avaliações de
impactos de políticas de diversas áreas em todo o mundo. O resultado são apresentações
visuais e interativas que destacam a concentração e a ausência de avaliações de impacto

701
e revisões sistemáticas de políticas públicas no mundo. Além dos mapas, a plataforma da
3ie traz conteúdo e dados didáticos sobre essa metodologia, com textos, gráficos e vídeos
(figura 3).
Mais informações: https://www.3ieimpact.org/evidence-hub/evidence-gap-maps.
Figura 4 - Vídeo sobre como usar um mapa de lacuna de evidências

Para assistir: https://youtu.be/vlYSCau0Nlo
Fonte: 3ie.
Outras iniciativas vêm sendo realizadas mundialmente, a fim de tornar a comunicação de

evidências mais amigável, a exemplo dos resumos visuais, que também buscam apresentar
os resultados das pesquisas científicas de forma mais sucinta, objetiva e atraente.
É o caso do policy brief estruturado em infográficos desenvolvido pela organização First 5

Orange County sobre política de saúde bucal para crianças. Todas as informações,
incluindo as recomendações de políticas públicas, estão dispostas em ilustrações, números
destacados, gráficos de fácil entendimento e textos breves e objetivos. Tudo isso torna o
material amigável e de fácil leitura não somente para gestores públicos e tomadores de
decisão, mas para um público mais amplo.

Figura 5 - Policy brief ilustrado
Fonte: First 5 Orange County

(https://healthysmilesoc.org/wp-content/uploads /2017/02/ Commission-InfoGraphics.pdf).
Dentro desse contexto, cabe destacar ainda o trabalho realizado pela organização
Cochrane, rede global independente formada por pesquisadores, pacientes, cuidadores e
pessoas interessadas em saúde. A organização atua em mais de 130 países e conta com
o trabalho de voluntários dedicados a realizarem sistemas de tomada de decisão com a
metodologia Cochrane para apresentação da melhor evidência científica em todo o mundo.
A Cochrane traduz estudos de diferentes países e os disponibiliza em diversos idiomas,

inclusive o português. Além de disponibilizar um manual que aborda os caminhos para a
produção de uma revisão sistemática, a organização oferece os chamados Resumos para
Leigos (PLS, em inglês), que fazem parte de todas as revisões Cochrane e foram criados
para ajudar as pessoas a compreenderem e interpretarem os resultados do estudo. Para
facilitar a compreensão e a tradução, todos os PLSs têm o mesmo padrão, estrutura e tipo
de linguagem. Por meio do link https://www.cochrane.org/pt/evidence é possível ter acesso
a mais de 7 mil PLSs por intermédio de uma simples ferramenta de busca.

703
Figura 6 - Ferramenta de busca de Resumos para Leigos (PLSs)
Fonte: Cochrane (https://www.cochrane.org/pt/evidence).
A Cochrane também vem investindo na área de podcasts. Por meio da plataforma, a

organização oferece as evidências em formato de áudio de fácil acesso e permite que o
público – onde quer que esteja – atualize-se sobre as revisões sistemáticas mais recentes
publicadas. Os podcasts estão disponíveis no Spotify e em Apple Podcasts e são gravados
em mais de 30 idiomas, com duração média de 5 minutos.
5 Infodemia e fake news: prioridades na pauta da gestão pública
Além de um imenso desafio para governos em todo o mundo e em diversas áreas, a

pandemia de Covid-19 apresentou um componente extremamente importante e
delicadamente complexo para o processo de tomada de decisão na gestão pública: mais
do que nunca, lidar de forma constante com uma quantidade imensurável de notícias,
informações e evidências – muitas delas acuradas, tantas outras não – tornou-se prática
regular e obrigatória para os profissionais de políticas públicas envolvidos nas ações de
combate à crise sanitária. O surto pandêmico iniciado em 2019 não apenas o espalhou o
vírus SARS-Cov-2 e um rastro de milhões de mortes globalmente, mas veio acompanhado
de um dos maiores fenômenos de infodemia conhecidos pela humanidade.

De acordo com a OMS, infodemia é o excesso de informações, algumas precisas e outras
não, que tornam difícil encontrar fontes idôneas e orientações confiáveis para sua
confirmarção. Refere-se ao grande aumento no volume de informações associadas a um
assunto específico, que podem se multiplicar exponencialmente em pouco tempo devido a
um evento específico, como a pandemia de Covid-19. Em março de 2020, mês em que a
OMS elevou a status de pandemia global a crise sanitária provocada pela doença, mais de
360 milhões de vídeos foram carregados no Youtube com a classificação “covid-19” e “covid
19” e 550 milhões de tuítes continham os termos “coronavírus”, “corona vírus”, “covid19”,
“covid-19”, “covid_19” ou “pandemia”. Cerca de 19.200 artigos foram publicados no Google
Scholar entre dezembro de 2019 e março de 2020 (OPAS; OMS, 2020).
Associada a isso está a desinformação: informação, notícia ou até um conjunto elaborado

de conteúdos ou evidências falsos ou imprecisos (fake news) cuja intenção deliberada é
enganar, criar confusão (OPAS; OMS, 2020). O impacto da desinformação é deletério em
vários campos da vida em sociedade, não apenas no contexto da pandemia de Covid-19,
período em que se testemunhou no mundo certo avanço da perda de credibilidade na
ciência e, consequentemente, tomadas de decisões de políticas públicas sem o devido
embasamento científico ou em evidências robustas.
Diante de tamanho desafio, em um dos momentos mais críticos da pandemia, a OMS

promoveu a primeira conferência científica sobre o tema. Mais de cem especialistas se
reuniram e concluíram que infodemia, desinformação, fake news requerem resposta
coordenada e multidisciplinar. Do mesmo modo que autoridades sanitárias, cientistas,
gestores e profissionais de saúde devem se apoiar na ciência da epidemiologia para a
tomada de decisões na resposta à pandemia, são necessárias ferramentas e intervenções
baseadas em evidências para o enfrentamento do problema da infodemia e suas
derivações. No encontro foram definidos quatro pilares estratégicos para a gestão da
infodemia: (1) monitoramento de informações (vigilância); (2) fortalecimento da capacidade
de alfabetização em saúde digital e ciência; (3) incentivo a processos de aprimoramento da
qualidade das informações, como verificação de fatos e revisão por pares; e (4) tradução
precisa e oportuna do conhecimento, minimizando fatores de distorção, como influências
políticas ou comerciais (GARCIA; DUARTE, 2020).
Como se pôde notar, o problema da infodemia e fake news é hercúleo e não existe bala de
prata para resolvê-lo. A busca por soluções passa não por um, mas por toda uma cadeia
de atores do ciclo das políticas públicas, que devem agir de forma coordenada e

705
multidisciplinar, como sugere a OMS. Cabe a esses atores “combater a desinformação”
(PRUDENTE; OLIVEIRA-COSTA, 2020), o que torna oportuno destacar algumas iniciativas
brasileiras nos setores públicos e privados que seguem nessa direção.
Pesquisadores da Fiocruz criaram o aplicativo para celular “Eu fiscalizo”, no qual as

pessoas podem denunciar conteúdos falsos em emissoras de TV, streaming, cinema, jogos
eletrônicos, espetáculos, publicidades e mídias sociais (BRASIL, 2020).
A plataforma A Casa disponibiliza cursos, palestras e lives on-line para atualização

profissional de servidores públicos de sáude e contempla todas as cidades do território
nacional. Coordenado pelo Instituto de Pesquisa e Apoio ao Desenvolvimento Social
(IPADS), Conselho Nacional de Secretarias Municipais de Saúde (Conasems) e pela
Confederação Nacional dos Agentes Comunitários de Saúde (Conacs) o projeto e suas
redes sociais proporcionam troca de experiências entre agentes de diferentes localidades
e ajudam a reciclar conhecimento científico sobre saúde com abordagem ao combate às
fake news (CAVALCANTI, 2022).
Com o objetivo de estabelecer um canal aberto e direto com a população para ajudar a
desmentir notícias falsas, o Ministério da Saúde lançou, em agosto de 2018, um serviço de
combate às fake news. As dúvidas são encaminhadas por meio do aplicativo WhatsApp e
esclarecidas pelas áreas técnicas da pasta. Em seu primeiro ano de funcionamento, a conta
recebeu mais de 10 mil mensagens para verificação (PRUDENTE; OLIVEIRA-COSTA,
2020).
Similarmente, o governo do estado de São Paulo criou um canal exclusivo no Telegram

para combater notícias falsas sobre a pandemia de Covid-19. A medida informa cidadãos
inscritos no aplicativo sobre as principais ações oficiais do governo, esclarece conteúdos
eventualmente classificados como desinformação e oferece opções de checagem factual e
informações para identificação de fake news (SÃO PAULO, 2020).
A promoção do uso de evidências científicas na tomada de decisão em saúde tem sido

incentivada mundialmente. Entretanto, ainda são incipientes as discussões sobre como
comunicar as evidências aos gestores/as de saúde, tendo em vista a diversidade desse
público e os diferentes contextos socioculturais nos quais estão inseridos. Este capítulo

buscou apresentar estratégias e exemplos de iniciativas de comunicação que possam
contribuir para tornar o conhecimento científico mais acessível, compreensível e útil aos
diferentes atores sociais envolvidos no processo decisório em saúde.
A importância e necessidade de recomendações específicas voltadas a esse público se

tornam ainda mais evidentes diante da complexidade do processo decisório em saúde e da
dificuldade dos tomadores de decisão para interpretar, adaptar e aplicar o conhecimento
científico considerando a própria realidade, como revelado em alguns dos estudos
mencionados neste artigo.
Nesse sentido, a comunicação pode ser uma ferramenta estratégica essencial para
subsidiar gestores/as de saúde. Para isso, no entanto, é preciso pensá-la não como uma
atividade isolada, mas como uma ação estruturante e integrada ao processo que envolve
desde a geração até a implementação da evidência.
O acesso e a disponibilização do conhecimento e da informação em saúde qualificam o uso

da evidência científica e ampliam as bases para a colaboração entre gestores/as federais,
estaduais e municipais e desses com profissionais, pesquisadores, educadores,
comunidade e usuários dos serviços de saúde, favorecendo a articulação com outros
segmentos da sociedade, igualmente mobilizados para a promoção da saúde.
Pensar a comunicação como um eixo essencial à formação, às ações e às práticas em

saúde é compreender também os desafios e complexidade a essa associados,
principalmente diante do crescente volume de conhecimento em saúde atualmente
disponível e da velocidade com a qual é gerado em nível global.
A comunicação vai além do simples repasse da informação. Funciona em um

sistema/espaço socioeconômico de produção de relações de poder que a influenciam e
tornam complexo o seu processo. Por si somente não é capaz de garantir que as decisões
em saúde serão tomadas com base no conhecimento científico. Entretanto, quando
utilizada de forma estratégica e efetiva, pode colaborar para reduzir a histórica lacuna entre
o conhecimento gerado e sua utilização na prática.
As estratégias listadas neste artigo não esgotam as diferentes possibilidades de

transferência do conhecimento e/ou comunicação de evidências científicas existentes,
tampouco é esse o objetivo. Diante dos inúmeros desafios inerentes ao processo de tomada

707
de decisão, tornam-se imprescindíveis estudos que possam investigar estratégias de
informação e comunicação utilizadas para apoiar a tomada de decisão em saúde,
considerando-se os diferentes contextos e realidades.
Este material não tem a pretensão de ser um manual ou padronizar a forma de comunicar
evidências científicas. Está mais para um documento norteador, que propõe uma reflexão
sobre o papel estratégico da comunicação no desenvolvimento de ações, políticas e
programas de saúde e, à luz da tradução do conhecimento e da comunicação em saúde,
apresenta algumas propostas que podem colaborar para tornar efetiva a comunicação
voltada a gestores/as e demais atores envolvidos na gestão em saúde, de modo a auxiliá-
los no processo decisório.
Espera-se, assim, oferecer uma contribuição à gestão em saúde no Brasil e apoiar a

tomada de decisão informada por evidências.

Referências
ANDRADE, K. R. C. de. Tradução do conhecimento e sua aplicação na Atenção

Primária à Saúde. 2019. Tese (Doutorado em Ciências Médicas) - Universidade de
Brasília, Brasília, 2019.
APÓSTOLO, J. Síntese da evidência no contexto da translação da ciência. Coimbra:

Escola Superior de Enfermagem de Coimbra (ESEnfC), 2017.
BARTLETT, G.; GAGNON, J. Physicians and knowledge translation of statistics: Mind the
gap. CMAJ: Canadian Medical Association Journal, v. 188, n. 1, p. 11–12 2016.
Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4695343. Acesso em: 23
out. 2022.
BARRETO, J. O. M.; SOUZA, N. M. Avançando no uso de políticas e práticas de saúde

informadas por evidências: a experiência de Piripiri-Piauí. Ciência & Saúde Coletiva, v.
18, n. 1, p. 25-34, 2013.
BEZERRA, L. C. A. et al. Translação do Conhecimento na qualificação da gestão da

Vigilância em Saúde: contribuição dos estudos avaliativos de pós-graduação. Physis:
Revista de Saúde Coletiva, v. 29, n. 1, p. 1-33, 2019. Disponível em:
https://www.scielo.br/j/physis/a/zpVCp9wjLDQq6SZVqLGpYjz/?lang=pt. Acesso em: 23
out. 2022.
BIREME. Mapa de evidências: traduzindo o conhecimento para aproximar a ciência da

gestão em saúde. Boletim BIREME/OPAS/OMS, n. 44, maio 2020. Disponível em:
https://boletin.bireme.org/pt/2020/05/31/mapa-de-evidencias-traduzindo-o-conhecimento-
para-aproximar-a-ciencia-da-gestao-em-saude. Acesso em: 23 out. 2022.
BRASIL. Ministério da Saúde. Secretaria de Ciência, Tecnologia, Inovação e Insumos

Estratégicos em Saúde. Departamento de Ciência e Tecnologia. Consolidação da área de
avaliação de tecnologias em saúde no Brasil. Revista de Saúde Pública, v. 44, n. 2, p.
381-383, abr. 2010. (Informes Técnicos Institucionais). Disponível em:
https://www.redalyc.org/articulo.oa?id=67240184022. Acesso em: 23 out. 2022.

Estratégicos em Saúde. Departamento de Ciência e Tecnologia. Síntese de evidências
para políticas de saúde: estimulando o uso de evidências científicas na tomada de
decisão. Brasília, DF: Ministério da Saúde, 2015. Disponível em:
https://bvsms.saude.gov.br/bvs/publicacoes/sintese_evidencias_politicas_saude_1ed.pdf

Estratégicos em Saúde. Departamento de Ciência e Tecnologia. Serviço de produção de
evidências para apoio à tomada de decisão: portfólio de produtos. Brasília, DF:
Ministério da Saúde, 2019. Disponível em: https://bvsms.saude.gov.br/bvs/publicacoes/
servico_ producao_apoio_evidencias_tomada_decisao_portifolio_produtos.pdf. Acesso
em: 23 out. 2022.
BRASIL. Ministério da Saúde. Pesquisadoras da Fiocruz lançam novo aplicativo 'Eu

fiscalizo'. Rio de Janeiro: Agência Fiocruz de Notícias, 2020. Disponível em:
https://agencia.fiocruz.br/pesquisadoras-da-fiocruz-lancam-novo-aplicativo-eu-fiscalizo.

709
BRASIL. Ministério da Economia. Policy Brief em questão: evidências para políticas
públicas. Brasília, DF: Instituto de Pesquisa Econômica Aplicada – IPEA, 2021.
BUENO, W. da C. O conceito de jornalismo científico e suas funções. Ciência e Cultura,

v. 37, n. 9, p. 1420-1427, set. 1985. Disponível em: https://biopibid.ccb.ufsc.br/files/
2013/12/Jornalismo-cient%C3%ADfico-conceito-e-fun%C3%A7%C3%A3o.pdf. Acesso
em: 23 out. 2022.
BUENO, W. da C. Comunicação científica e divulgação científica: aproximações e

rupturas conceituais. Informação & Informação, v. 15, n. esp1, p. 1-12, 2010. Disponível
em: https://www.uel.br/revistas/uel/index.php/informacao/article/view/6585. Acesso em: 23
out. 2022.
CANADIAN INSTITUTES OF HEALTH RESEARCH - CIHR. Guide to knowledge

translation planning at CIHR: integrated and end-of-grant approaches. Otawa: CIHR,
2012. Disponível em: https://cihr-irsc.gc.ca/e/documents/kt_lm_ktplan-en.pdf. Acesso em:
23 out. 2022.
CAVALCANTI, T. Agentes de saúde e endemias de todo o país vão aprender a combater

fake news. Folha de São Paulo, São Paulo, 14 maio 2022. Disponível em:
https://www1.folha.uol.com.br/equilibrioesaude/2022/05/agentes-de-saude-e-endemias-
de-todo-o-pais-vao-aprender-a-combater-fake-news.shtml?utm_source= whatsapp & utm
_medium=social&utm_campaign=compwa. Acesso em: 23 out. 2022.
COSTA, M. S. de O. Comunicar saúde: uma perspectiva teórica. In: CONGRESSO DA

ASSOCIAÇÃO LATINOAMERICANA DE PESQUISADORES EM COMUNICAÇÃO -
ALAIC, 14., 2016, San José. Anais... San José: ALAIC, 2018. (Anais do Grupo Temático
5 Comunicação e Saúde).
DIAS, R. I.; BARRETO, J. O. M.; SOUZA, N. M. Desenvolvimento atual da Rede de

Políticas Informadas por Evidências (EVIPNet Brasil): relato de caso. Revista
Panamericana de Salud Publica, v. 36, n. 1, p. 50, 2014.
DIAS, R. I. da S. C. et al. Estratégias para estimular o uso de evidências científicas na

tomada de decisão. Cadernos de Saúde Coletiva, v. 23, n. 3, p. 316-322, 2015.
Disponível em: https://www.scielo.br/j/cadsc/a/sYHVMfZ33dYsHn85bFrwRQj/?format
=pdf&lang=pt. Acesso em: 23 out. 2022.
FERRAZ, L.; PEREIRA, R. P. G.; PEREIRA, A. M. R. da C. Tradução do conhecimento e

os desafios contemporâneos na área da saúde: uma revisão de escopo. Saúde em
Debate, v. 43, n. esp. 2, p. 200-216, nov. 2019. Disponível em: https://www.scielo.br/j/sd
eb/a/hVLgmkWFGwytPvC3BkwLgZk/?format=pdf&lang=pt. Acesso em: 23 out. 2022.
FIELD, B. et al. Using the knowledge to action framework in practice: a citation analysis
and systematic review. Implementation Science, v. 9, n. 172, p. 1-14, 2014. Disponível
em: https://implementationscience.biomedcentral.com/articles/10.1186/s13012-014-0172-
2. Acesso em: 23 out. 2022.
GALVAO, M. C. et al. The clinical relevance of information index (CRII): Assessing the
relevance of health information to the clinical practice. Health Information and Libraries
Journal, v. 30, n. 2, p. 110-120, 2013.

GARCIA, L. P.; DUARTE, E. Infodemia: excesso de quantidade em detrimento da
qualidade das informações sobre a covid-19. Epidemiologia e Serviços de Saúde, v. 29,
n. 4, p. 1-4, 2020. Disponível em: http://scielo.iec.gov.br/scielo.php?script=sci_arttext&pid
=S1679-49742020000400001#B11. Acesso em: 23 out. 2022.
GRAHAM, I. D. et al. Lost in knowledge translation: time for a map? Journal of

Continuing Education in the Health Professions, v. 26, n. 1, p. 13-24, 2006. Disponível
em: https://pubmed.ncbi.nlm.nih.gov/16557505/. Acesso em: 23 out. 2022.
KOGA, N. M. et al. O que informa as políticas públicas: survey sobre o uso e o não uso
de evidências pela burocracia federal brasileira. Brasília, DF: Instituto de Pesquisa
Econômica Aplicada - IPEA, 2020. (Texto para Discussão, n° 2619). Disponível em:
http://repositorio.ipea.gov.br/bitstream/11058/10376/1/td_2619.pdf. Acesso em: 23 out.
2022.
LAVIS, J. N. et al. Knowledge transfer study group. How can research organizations more
effectively transfer research knowledge to decision makers? Milbank Quarterly, v. 81, n.
2, p. 221-248, 2003. Disponível em: https://pubmed.ncbi.nlm.nih.gov/12841049/ Acesso
em: 23 out. 2022.
LIU, W. et al. Determinants of knowledge translation from health technology assessment

to policy-making in China: from the perspective of researchers. PLoS ONE, v. 13, n. 1, p.
1-13, 2018. Disponível em: https://journals.plos.org/plosone/article?id=10.1371/journal.
pone.0190732. Acesso em: 23 out. 2022.
LOMAS, J. Research and evidence–based decision making. Australian and New

Zealand Journal of Public Health, v. 21, n. 5, p.439-441, 1997.
LOMAS, J. Diffusion, dissemination, and implementation: who should do what?

Annals of the New York Academy of Sciences, v. 703, n. 1, p. 226-235, 1993.
MARTINEZ-SILVEIRA, Martha. Revisões sistemáticas como fonte de evidências

científicas em saúde. Tese (Doutorado) – Instituto de Comunicação e Informação
Científica e Tecnológica em Saúde – Fundação Oswaldo Cruz (Fiocruz). Rio de Janeiro,
2015. Disponível em: https://www.arca.fiocruz.br/bitstream/handle/icict/12432/martha
_silveira_icict_dout_2015.pdf?sequence=1&isAllowed=y. Acesso em: 23 out. 2022.
MASSARANI, L. M. et al. Infodemia, desinformação e vacinas: a circulação de conteúdos

em redes sociais antes e depois da covid-19. Liinc em Revista, v. 17, n. 1, p. 1-23, 2021.
Disponível em: http://revista.ibict.br/liinc/article/view/5689. Acesso em: 23 out. 2022.
MOSQUERA, M. Comunicación en salud: conceptos, teorías y experiencias. La iniciativa

de Comunicación, n. 52, jul. 2003. Disponível em: https://www.comminit.com/la/drum_
beat_52.html. Acesso em: 23 out. 2022.
NATIONAL CENTER FOR HEALTH STATISTICS. Healthy People 2010: final review.
Hyattsville, 2012. (PHS Publication no. 2012-1038). Disponível em: https://www.cdc.gov/nchs
/data/hpdata2010/hp2010_final_review.pdf. Acesso em: 23 out. 2022.
ORGANIZAÇÃO PAN-AMERICANA DA SAÚDE - OPAS. Entenda a infodemia e a

desinformação na luta contra a covid-19. Washington DC: OPAS, 2020. (Série: Kit de
Ferramentas de Transformação Digital. Ferramentas de Conhecimento, 9). Disponível em:
https://iris.paho.org/bitstream/handle/10665.2/52054/Factsheet-Infodemic_por.pdf?
Sequence =16. Acesso em: 23 out. 2020.

711
OXMAN, A. D. et al. SUPPORT tools for evidence-informed health policymaking (STP 1:
What is evidence-informed policymaking? Health Research Policy and Systems, v. 7, n.
p. 1-7, 2009. Suppl 1. Disponível em: https://health-policy-systems.biomedcentral.com/
articles/10.1186/1478-4505-7-S1-S1. Acesso em: 23 out. 2022.
OXMAN, A. D. et al. Development of a checklist for people communicating evidencebased

information about the effects of healthcare interventions: a mixed methods study. BMJ
Open, v. 10, n. 7, p. 1-9, 2020. Disponível em: https://bmjopen.bmj.com/content/bmjopen/
10/7/e036348.full.pdf . Acesso em: 23 out. 2022.
PAN AMERICAN HEALTH ORGANIZATION - PAHO. Health agenda for the Américas
2008 - 2017. Washington, DC: PAHO, 2007. 25p. (Presented by the Ministers of Health of
the Americas in Panama City, June 2007). Disponível em:
https://www1.paho.org/hq/dmdocuments/2009/Health_Agenda_for_the_Americas_2008-
2017.pdf. Acesso em: 23 out. 2022.
PEARSON, A.; WEEKS, S.; STERN, C. Translation science and the JBI model of
evidence-based healthcare. Australia: Lippincott Williams & Wilkins, 2011. (Synthesis
Science in Healthcare Series: Book 1) Disponível em: https://nursing.lsuhsc.edu/JBI/docs/
JBIBooks/JBI_Model.pdf. Acesso em: 23 out. 2022.
PRUDENTE, L.; OLIVEIRA-COSTA, M. Ponto de vista: o desafio das fake news para os
gestores de políticas públicas. Nexo Políticas Públicas, dez. 2020. Disponível em:
https://pp.nexojornal.com.br/ponto-de-vista/2020/O-desafio-das-fake-news-para-os-
gestores-de-pol%C3%ADticas-p%C3%BAblicas. Acesso em: 23 out. 2022.
RESEARCH Protocol: communication and dissemination strategies to facilitate the use of

health-related evidence: Effective Health Care Program. Rockville: Agency for Healthcare
Research and Quality, 2019. Disponível em: https://effectivehealthcare.ahrq.gov/products/
medical-evidence-communication/ research-protocol. Acesso em: 23 out. 2022.
SÃO PAULO. Governo do Estado. SP contra o novo coronavírus - sem fake news.
2020. Disponível em: https://www.saopaulo.sp.gov.br/coronavirus/sem-fake-news/.
SANT’ANA, F. M.; MENDONÇA, A. V. M.; SOUSA, M. F. de. A comunicação de

evidências científicas: uma ferramenta estratégica para auxiliar a tomada de decisão no
SUS. In: MENDONÇA, A. V. M.; SOUSA, M. F. de. (org.). Práticas interdisciplinares de
informação, educação e comunicação em saúde para a prevenção das arboviroses
Dengue, Zika e Chikungunya: desafios teóricos e metodológicos. Brasília, DF: ECoS,
2022, p. 35-49.
SCHIAVO, R. Health communication: from theory to practice. Nova Jersey: John Wiley
& Sons, 2007.
STRAUS, S. E.; TETROE, J. M.; GRAHAM, I. D. Knowledge translation is the use of

knowledge in health care decision making. Journal of Clinical Epidemiology, v. 64, n. 1,
p. 6-10, 2011. Disponível em: https://www.jclinepi.com/article/S0895-4356(09) 00267-
4/fulltext. Acesso em: 23 out. 2022.
STRAUS, S.; TETROE, J.; GRAHAM, I. D. Knowledge translation in health care:

moving from evidence to practice. 2nd ed. Nova Jersey: John Wiley & Sons, 2013.

VALE CARIBÉ, R. de C. do. Comunicação científica: reflexões sobre o conceito.
Informação & Sociedade: Estudos, v. 25, n. 3, p. 89-104, 2015. Disponível em:
https://periodicos.ufpb.br/ojs2/index.php/ies/article/view/23109. Acesso em: 23 out. 2022.
WOLTON, D. Informar não é comunicar. Porto Alegre: Sulina, 2010. Disponivel em:
http://imprensasindical.org.br/wp-content/uploads/2019/03/88202667-Informar-nao-
comunicar.pdf. Acesso em: 23 out. 2022.
WORLD HEALTH ORGANIZATION. Strategic communications framework for

effective communications. Geneva: WHO/Department of Communications, 2017.
Disponível em: http://www.who.int/mediacentre/communication-framework.pdf. Acesso
em: 23 out. 2022.

713
Conte-nos o que pensa sobre esta publicação. Clique aqui ou escaneie o QR Code acima e responda a pesquisa.

Biblioteca Virtual em Saúde do Ministério da Saúde
bvsms.saude.gov.br

Avaliacao Impacto Politicas Saude Guia Sus

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Avaliacao Impacto Politicas Saude Guia Sus

Enviado por

Direitos autorais:

Formatos disponíveis

MINISTÉRIO DA SAÚDE

Tiragem: 1ª edição – 2023 – versão eletrônica

Ministra de Estado da Saúde:

Secretário de Ciência, Tecnologia, Inovação e Complexo da Saúde:

Projeto gráfico e diagramação:

Modo de acesso: World Wide Web:

Avaliação de impacto das políticas de saúde: um guia para o SUS

PARTE 4: CIÊNCIA DE DADOS COM FOCO NO DATASUS 385

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

Departamento de Ciência e Tecnologia – Decit

Assim, entende-se que se aprofunda, no âmbito das políticas de saúde, as orientações

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

A avaliação de impacto de políticas, programas, projetos, estratégias ou outras

No mesmo sentido, é de interesse lembrar os esforços do Decit para promover a

Que os esforços para sistematizar e disponibilizar informações se conjuguem com esta

Departamento de Ciência e Tecnologia – Decit

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

Avaliação de impacto das políticas

Vinícius de Araújo Mendes1

Faculdade de Economia, Universidade Federal da Bahia (PPGE-UFBA)

Instituto de Saúde Coletiva, Universidade Federal da Bahia (ISC-UFBA)

A expressão Avaliação de Políticas Públicas adentrou o debate público no Brasil na década

O debate acadêmico sobre a avaliação de políticas públicas, no entanto, remete a décadas

Os livros-textos atuais sobre avaliação de políticas públicas – ou avaliação de impacto ou

É notável que, apesar da ideia de causalidade para avaliação de intervenções, como

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

A abordagem experimental de Avaliação de Políticas Públicas parte da ideia de que, se a

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

O desenho do quase-experimento depende do desenho da política (intervenção), da

O público interessado em avaliação de políticas públicas era contemplado pela literatura

2 O livro: sua história, objetivos e potenciais alcances

Assim, em dezembro de 2018, o Departamento de Ciência e Tecnologia do Ministério da

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

Figura 1 - Resumo dos Debates da Primeira Oficina

Em setembro de 2021, realizou-se nova oficina com todos os 58 autores e autoras

O livro se inicia com uma reflexão da equipe do Departamento de Ciência e Tecnologia do

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

Parte 1: Introdução à avaliação de impacto de políticas de saúde

O capítulo 1 – Avaliação de Impacto de Políticas e Programas de Saúde no Brasil – de

O capítulo 2 – Institucionalização da Avaliação no Âmbito do Setor Público – de Luciana

No capítulo 3 – Indicadores e medidas em saúde: conceitos e aplicações para as

Parte 2: Fundamentos lógicos e conceituais

A parte 2 do livro se inicia com o capítulo 4 – Avaliação de Impacto de Políticas

As pesquisadoras do Insper – Isabela Furtado, Carolina Marinho e Carolina Melo – dedicam

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

Parte 3: Métodos de inferência causal

O capítulo 8 – Diagramas Causais e Equações Estruturais na Avaliação de Políticas

O capítulo 9 – Introdução aos Modelos Experimentais e Não-Experimentais Aplicados à

No capítulo 10 – Randomized Controlled Trials: os experimentos aleatórios em Políticas

No capítulo 11 – Métodos baseados em escores de propensão e suas aplicações em

No capítulo 12 – O Método de Diferenças-em-Diferenças Aplicado à Avaliação de Políticas

No capítulo 13 – Dando um Salto de Qualidade: Regressão Descontínua e Aplicações em

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

Parte 4: Ciência de dados com foco no DataSUS

A parte 4 do livro apresenta ao leitor conceitos e ferramentas para utilização de dados –

No capítulo 16 – Segurança no uso do dado identificado: como montar um protocolo – os

No capítulo 17 – Acesso aos dados agregados e microdados do SUS – os pesquisadores

No capítulo 18 – Banco de Dados Relacional e Analítico – Felipe Ferré, técnico do Conselho

O capítulo 19 – Manipulando dados no R – escrito por Wagner Bonat, da Universidade

O capítulo 20 – Visualização de Dados – escrito por Marcelo Perlin, da Universidade

O capítulo 21 – Análise de Regressão – de autoria de Gleice Conceição e Maria do Rosário

Avaliação de Impacto das Políticas de Saúde: um guia para o SUS

No capítulo 22 – Aprendizagem de Máquina – Alexandre Chiavegatto (FSP-USP)