Escolar Documentos
Profissional Documentos
Cultura Documentos
AVALIAÇÃO DE
IMPACTO DAS
POLÍTICAS DE SAÚDE
UM GUIA PARA O SUS
Brasília – DF
2023
MINISTÉRIO DA SAÚDE
Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde
Departamento de Ciência e Tecnologia
AVALIAÇÃO DE
IMPACTO DAS
POLÍTICAS DE SAÚDE
UM GUIA PARA O SUS
Brasília – DF
2023
2023 Ministério da Saúde.
Esta obra é disponibilizada nos termos da Licença Creative Commons – Atribuição – Não Comercial
– Compartilhamento pela mesma licença 4.0 Internacional. É permitida a reprodução parcial ou total
desta obra, desde que citada a fonte.
A coleção institucional do Ministério da Saúde pode ser acessada, na íntegra, na Biblioteca Virtual em Saúde do Ministério da
Saúde: bvsms.saude.gov.br.
Organização:
Erika Santos de Aragão
Luís Eugenio Portela Fernandes de Souza
Marcio Santos da Natividade
Vinícius de Araújo Mendes
Acompanhamento técnico:
Ana Maria Caetano de Faria
Daniela Fortunato Rêgo
Fernanda Borges Serpa
Fernanda Madeira de Ley Botelho da Cunha
Jayne Cecília Martins
Letícia Alves Tadeu Santiago
Luiz Claudio Barcelos
Marina Melo Arruda Marinho
Patricia de Campos Couto
Revisão:
Maria Creuza Ferreira da Silva
Maria Goret Ferreira de Moraes
Normalização:
Delano de Aquino Silva – Editora MS/CGDI
Ficha Catalográfica
Brasil. Ministério da Saúde. Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde. Departamento de
Ciência e Tecnologia.
Avaliação de impacto das políticas de saúde: um guia para o SUS [recurso eletrônico] / Ministério da Saúde,
Secretaria de Ciência, Tecnologia, Inovação e Complexo da Saúde, Departamento de Ciência e Tecnologia. – Brasília:
Ministério da Saúde, 2023.
714 p. : il.
1. Avaliação – Políticas Públicas. 2. Avaliação de Impacto – Políticas Públicas. 3. Políticas Públicas de saúde. I.
Título.
CDU 614.2
Catalogação na fonte – Coordenação-Geral de Documentação e Informação – Editora MS – OS 2023/0383
Título para indexação:
Impact Evaluation of Health Policies: A Guide for The Brazilian Health System
SUMÁRIO
APRESENTAÇÃO 07
INTRODUÇÃO
Avaliação de impacto das políticas públicas de saúde: uma introdução
Vinicius Mendes, Erika Aragão e Luís Eugenio Portela Fernandes de Sousa 12
PARTE 1:
INTRODUÇÃO À AVALIAÇÃO DE IMPACTO DE POLÍTICAS DE SAÚDE 30
CAPÍTULO 1
Avaliando o impacto na saúde da população de políticas e programas de proteção
social e de saúde implementadas no Brasil
Erika Aragão e Mauricio Lima Barreto 31
CAPÍTULO 2
Institucionalização da avaliação no âmbito do Executivo Federal: CMAP e editais de
pesquisa em saúde
Luciana Mendes Santos Servo e Rodrigo Pucci de Sá e Benevides 46
CAPÍTULO 3
Indicadores e medidas em saúde: conceitos e aplicações para as informações
disponíveis no Brasil
Mônica Viegas Andrade, Kenya Noronha, Aline Souza e Júlia Almeida Calazans 81
PARTE 2:
FUNDAMENTOS LÓGICOS E CONCEITUAIS 124
CAPÍTULO 4
Avaliação de impacto de políticas públicas: racionalidade, fundamentos lógicos e
experiências das políticas sociais
Naercio Menezes Filho e Bruno Kawaoka Komatsu 125
CAPÍTULO 5
Teoria da Mudança: definição, utilidade e como construir
Isabela Furtado, Carolina Marinho e Carolina Melo 156
CAPÍTULO 6
Projetando o impacto de intervenções futuras: princípios e métodos
Rodrigo Volmir Anderle, Felipe Alves Rubio, José Alejandro Ordoñez e
Davide Rasella 178
CAPÍTULO 7
Causalidade e sobredeterminação: abordagem translacional-transdisciplinar na
avaliaçao em saúde
Naomar de Almeida-Filho e Denise Coutinho 193
PARTE 3:
MÉTODOS DE INFERÊNCIA CAUSAL 230
CAPÍTULO 8
Diagramas causais e equações estruturais na avaliação de políticas públicas
Marcelo M. Taddeo, Leila Denise Amorim e Rosana Aquino 231
CAPÍTULO 9
Introdução aos modelos experimentais e não-experimentais aplicados à avaliação
de políticas públicas em saúde
Aléssio Tony Cavalcanti de Almeida e Antônio Vinícius Barros Barbosa 267
CAPÍTULO 10
Randomized Controlled Trials: os experimentos aleatórios em políticas públicas
André Portela Souza, Lycia Lima e Caio Castro 291
CAPÍTULO 11
Métodos baseados em escore de propensão e suas aplicações em avaliação de
políticas de saúde
Dandara de Oliveira Ramos e Rosemeire Leovigildo Fiaccone 307
CAPÍTULO 12
O Método diferenças-em-diferenças
Bladimir Carrillo Bermudez e Danyelle Santos Branco 329
CAPÍTULO 13
Regressão descontínua e aplicações na área de saúde
Breno Sampaio e Giuseppe Trevisan 344
CAPÍTULO 14
O método de variáveis instrumentais e aplicações em políticas de saúde
Rudi Rocha 370
CAPÍTULO 15
Um debate sobre dados pessoais e dados sensíveis para pesquisa científica e para
pesquisa em saúde pública a partir da Lei Geral de Proteção de Dados
Bethânia Almeida 386
CAPÍTULO 16
Segurança no uso dos dados sensíveis para pesquisa em saúde: Repositório de
dados
Marcio Natividade, Samilly Silva Miranda, Alberto Sironi, Evandro Mota Lopes e Juracy
Bertoldo 401
CAPÍTULO 17
Acesso aos dados agregados e microdados do SUS
Raphael de Freitas Saldanha, Marcel de Moraes Pedroso e
Monica de Avelar F. M. Magalhães 418
CAPÍTULO 18
Modelagem e gestão de banco de dados com SQL e integração com o R
Felipe Ferré 435
CAPÍTULO 19
Manipulando dados no R
Wagner Hugo Bonat 502
CAPÍTULO 20
Introdução à visualização de dados com o R
Marcelo S. Perlin 544
CAPÍTULO 21
Análise de regressão
Gleice M. S. Conceição e Maria do Rosário de Oliveira Latorre 576
CAPÍTULO 22
Machine learning em políticas públicas de saúde
Alexandre Chiavegatto Filho 615
PARTE 5:
POLÍTICAS INFORMADAS POR EVIDÊNCIAS E TRADUÇÃO DO CONHECIMENTO 634
CAPÍTULO 23
Evidências para políticas de saúde: aspectos conceituais e suas implicações para
avaliações de impacto
Jorge Otávio Maia Barreto e Maurício Mota Saboya Pinheiro 635
CAPÍTULO 24
A tradução do conhecimento e a avaliação de impacto de políticas e programas de
saúde
Luís Eugenio Portela Fernandes de Souza, Daniela Fortunato Rego e Roberta Borges
Silva 672
CAPÍTULO 25
Como comunicar evidências científicas para gestores públicos e tomadores de
decisão?
Fabiana Mascarenhas e Luciano Maximo 686
APRESENTAÇÃO
8 Ministério da Saúde
O campo de avaliação de políticas públicas vem se consolidando na administração pública
como um passo fundamental do ciclo da política pública. Incorporar de forma sistemática
essa prática, particularmente no que se refere à avaliação de impacto de políticas de saúde,
é fundamental para o aprimoramento e fortalecimento do Sistema Único de Saúde (SUS).
Por isso, é com grande satisfação que se entrega esta obra – Avaliação de impacto das
políticas de saúde: um guia para o SUS – cujo objetivo é colaborar para o processo de
institucionalização da pesquisa em avaliação de impacto das ações no âmbito das políticas
de saúde.
Obviamente uma obra desse porte é um projeto de longo prazo que envolve muitos
profissionais, tanto do ministério quanto aqueles vinculados a outras instituições, como
prova o amplo leque de autores que se dedicaram para colocar seu conhecimento neste
registro. Esse é um ponto que vale a pena destacar, não somente pela abrangência que o
livro toma para si, mas para lembrar que este projeto começou há algum tempo, com duas
oficinas realizadas em 2018 e 2019, em momentos de reunir ideias, contemplar abordagens
e definir conteúdo. Isso mostra que o compromisso com o uso de evidências no exercício
de avaliação de políticas perpassa diferentes gestões do Ministério da Saúde. Desse modo,
esta obra assume contornos programáticos dos mais relevantes.
A cultura da avaliação das políticas públicas vem se fortalecendo por normativas recentes,
tais como o Decreto nº 9.203 de 22/11/2017 e o Decreto nº 10.411 de 30/6/2020, os quais
estabelecem o uso de evidências e metodologias de pesquisa na elaboração,
implementação e revisão das políticas públicas. Ademais, o Decreto nº 11.358 de 1/1/2023
define, dentre as competências do Decit/SECTICS/MS, coordenar a elaboração, execução
e avaliação de programas e projetos de saúde.
Espera-se que este guia subsidie fortemente os profissionais que realizarão avaliações de
impacto, apresentando grande parte do referencial conceitual e arsenal metodológico
disponíveis. Por outro lado, almeja-se sensibilizar gestores do SUS que atuam nos diversos
níveis da administração pública para a importância da cultura de avaliação e a toda a gama
de práticas avaliativas, particularmente de avaliação de impacto, as quais podem ser
acessadas para estudar os resultados finalísticos de intervenções de saúde.
10 Ministério da Saúde
órgãos de controle e outros. Iniciativas dessa natureza contribuem para que no futuro se
possa atingir a almejada avaliação de impacto da pesquisa para o SUS.
Boa leitura, bons estudos e que o conhecimento sobre avaliação de impacto sistematizado
nesta obra se materialize na gestão em saúde no SUS.
12 Ministério da Saúde
1 Introdução
1
Donald Rubin e seu artigo canônico de 1974.
O recurso a experimentos naturais foi muito importante, em especial nas décadas de 1980
e 1990, para se aprofundar o debate sobre as fontes de vieses em trabalhos empíricos e
como corrigi-los. Causalidade era sinônimo de identificação. Ou seja, se o experimento
natural corrigia a fonte de viés, o parâmetro estimado era identificado sem viés e, portanto,
a relação causal era estabelecida2. Essa literatura teve forte inserção na área de economia
do trabalho, educação, saúde, demografia, economia política e democracia, entre outras3.
Um exemplo de experimento natural muito utilizado foi a ocorrência de nascimento de
gêmeos. Em 1980, Rosenzweig e Wolpin publicaram um artigo no qual testavam como
quantidade e qualidade (capital humano, educação) interagem na escolha pelo número
ótimo de filhos, usando gêmeos como experimento natural4. Ponczek e Souza (2012)
fizeram esse exercício no Brasil e incorporaram todos os avanços da literatura. Gêmeos
foram utilizados como experimento natural para se testar o retorno da escolaridade na
educação por Ashenfelter e Krueger (1994). Nos anos 2000, os estudos que recorreram a
experimentos e quase-experimentos tornaram-se protagonistas e colocaram a Avaliação
de Políticas Públicas em destaque. Esses estudos recuperaram a contribuição seminal de
Rubin (1974) e puseram uma lupa em um problema de viés mais específico – o viés de
seleção.
2
Ao se estimar o modelo 𝑌𝑌 = 𝑋𝑋𝑋𝑋 + 𝜀𝜀 com correlação entre X e 𝜀𝜀 diferente de zero, 𝑐𝑐𝑐𝑐𝑐𝑐(𝑋𝑋, 𝜀𝜀) ≠ 0, isto
significa que X afeta Y, (𝑋𝑋 → 𝑌𝑌), 𝜀𝜀 afeta Y, (𝜀𝜀 → 𝑌𝑌), e Y é afetado por X via 𝜀𝜀, (𝜀𝜀 → 𝑋𝑋 → 𝑌𝑌). Portanto, quando
isso ocorre 𝛽𝛽 é estimado com viés (captura tanto o efeito 𝑋𝑋 → 𝑌𝑌 quanto o efeito 𝜀𝜀 → 𝑋𝑋 → 𝑌𝑌). A literatura de
experimentos naturais busca um experimento natural, como nascimento de gêmeos, um choque climático,
uma mudança de lei, alguma fonte de variação exógena que anule o efeito de 𝜀𝜀 em X. Assim, uma vez
anulado, 𝛽𝛽 captura apenas o impacto de X em Y, ou 𝑋𝑋 → 𝑌𝑌. Portanto, a literatura de identificação indica que
𝛽𝛽 captura o efeito causal de X em Y.
3
Rosenzweig; Wolpin (2000) fazem ampla revisão da literatura de experimentos naturais em economia.
4
A ideia é bem intuitiva. Quanto maior a quantidade de filhos que um casal decide ter, é mais custoso
proporcionar qualidade a todos (educação, saúde etc.). Ao decidir ter menos filhos, o casal pode estar
trocando quantidade de filhos por qualidade. Na literatura isso ficou denominado Quantity-Quality Trade-off.
No entanto, comparar um casal que decidiu ter um filho com um casal que decidiu por dois filhos seria
comparar grupos diferentes. Ao se utilizarem gêmeos, a literatura consegue comparar um casal que decidiu
por um filho com um casal que também decidiu por um filho, mas um experimento da natureza proporcionou
dois filhos a esse casal com a ocorrência de gêmeos.
14 Ministério da Saúde
média entre o grupo de tratamento e o grupo de controle representaria o efeito médio do
tratamento sobre os tratados ou Average Treatment Effect on the Treated (ATT). Em 2007,
Duflo, Kremer e Gleenerster divulgaram um toolkit completo sobre o uso de aleatorização
em pesquisa sobre desenvolvimento econômico5 voltada para avaliar o impacto de políticas
públicas em áreas como pobreza, nutrição, educação, finanças e saúde, com a finalidade
de aumento do bem-estar da população afetada pela política pública6. Vale registrar que o
periódico Social Science & Medicine dedicou o volume 2010 do ano 2018 à discussão sobre
os potenciais e os limites do uso de Randomized Controlled Trials (RCTs) para avaliar
políticas públicas em diversas áreas como medicina, sociologia, educação, economia,
tendo como autores especialistas Andrew Gelman, Judea Pearl, Angus Deaton, Nancy
Cartwright e Guido Imbens, entre outros7.
O uso de RCTs para avaliar intervenções tem o grande potencial de estimar as relações de
causa e efeito e permite o controle de vieses, notadamente o de seleção. Suas limitações,
contudo, não são pequenas e a primeira é o custo de realização de tais experimentos.
Algumas instituições financiam a prática de RCTs para se avaliar políticas públicas em
países em desenvolvimento, como o caso do J-PAL, Banco Mundial, Banco Interamericano
de Desenvolvimento. Pesquisadores com acesso a recurso conseguiriam planejar e
conduzir um experimento aleatório. Porém, nesse ponto, a segunda limitação seria ter
acesso a uma localidade em um país-alvo e convencer tanto o público local quanto as
autoridades sobre os benefícios de se conduzir tal pesquisa. Por fim, existem limites
institucionais e éticos que inviabilizariam a realização de um experimento. Exemplo disso
seria uma política pública de saúde no Brasil. Uma vez que o sistema é universal, garantir
uma intervenção em um grupo (tratado) e não proporcionar o acesso a tal política ao grupo-
controle fere o importante princípio da universalidade do SUS. Então, quando um
5
Anterior ao Tookit, Shadish, Cool e Campbell (2001) era um livro-texto referência sobre o assunto. Imbens
e Rubins (2015) são uma referência atual sobre o assunto, dedicando toda a Parte II do livro à literatura
estatística e econométrica dos Experimentos Aleatórios Clássicos.
6
Importante fazer a ressalva de que a prática de se separarem dois grupos, o tratado e o controle, por um
processo aleatório, fazer uma intervenção apenas no grupo de tratamento e, após um certo período, compará-
los para se testar o efeito de tal intervenção é o padrão-ouro da prática clínica. É a forma tradicional de se
testar novos medicamentos, por exemplo, em experimentos duplo-cegos ou triplo-cegos. Tal prática é mais
antiga do que a similar aplicação em avaliação de Políticas Públicas. As aplicações clínicas são realizadas
em escala menor, usualmente, com maior controle sobre todos os fatores que podem influenciar o resultado
potencial, em especial confounding, externalidades, desbalanceamento, que são problemas reais em um
experimento. O grupo de controle recebe um placebo, o que não alteraria seu comportamento em relação ao
grupo dos tratados. Em Políticas Públicas, escalas são usualmente maiores, há maior dificuldade de se coletar
informações a todo instante para se controlar os possíveis efeitos que contaminariam o resultado potencial e,
por fim, o grupo de controle, ao não receber a intervenção pública, pode mudar seu comportamento (não
existe aqui normalmente um placebo nesse grupo).
7
Kawachi, Subramanian e Ryan (2018).
8
Quase-experimento é a tradução realizada pela literatura nacional de Quasi-Experimental Designs.
9
Rosenbaum; Rubin (1983), Rosenbaum; Rubin (1984).
10
Dehejia; Wahba (1999), Dehejia; Wahba (2002) e Dehejia (2005).
11
Imbens; Angrist (1994).
12
Para a literatura sobre Diferenças-em-Diferenças, Roth et al. (2022) fazem uma atualização dos recentes
métodos e avanços. Para a literatura sobre Regressão Descontínua, ver Cattaneo e Titiunik (2022).
13
Primeira edição de 2011 e segunda edição de 2016. Livro disponível, pelo Banco Mundial, em inglês
(original), português, espanhol e francês: Gertler et al. (2016).
16 Ministério da Saúde
Assim, faltava na literatura brasileira um livro sobre avaliação de políticas públicas que
discutisse tanto as versões canônicas dos modelos experimentais e quase-experimentais
e seus avanços metodológicos mais recentes quanto inclusive visões críticas sobre o
conceito de causalidade. Faltava também um livro que jogasse luz sobre as políticas
públicas de saúde, com foco no SUS especificamente, ainda que sem esquecer as
experiências internacionais.
Além disso, este livro busca avançar em outras direções: (1) reconta as experiências de
avaliação de políticas públicas sociais e de saúde; (2) apresenta ao leitor caminhos para
interpretar os principais indicadores em saúde; (3) debate a questão do acesso aos dados
e como utilizá-los em pesquisas empíricas, sem ferir a privacidade das pessoas; e 4) discute
a comunicação de achados científicos para o público em geral.
O livro é escrito para públicos diversos e se destina a acadêmicos ou cientistas que realizam
(ou desejam realizar) avaliações de impacto de políticas de saúde, autoridades políticas e
gestores e técnicos de serviços públicos que precisam e demandam tais avaliações para
subsidiar suas decisões sobre a formulação, a implementação e a (des)continuação de
políticas de saúde.
A ideia original deste livro ocorre em 2018, quando gestores e técnicos do Ministério da
Saúde sentem a necessidade de institucionalizar a prática da avaliação de impacto e, para
isso, buscam apoio de pesquisadores e acadêmicos avaliadores de políticas públicas. A
essa altura, os Guias Ex Ante e Ex Post eram uma realidade no setor público brasileiro, em
especial na esfera federal, e o termo Avaliação de Políticas Públicas havia se tornado mais
corriqueiro dentro do governo federal.
Fonte:
Fonte: Atrium FacilitaçãoVisual,
Atrium Facilitação Visual,2018,
2018,
1º 1º Oficina
Oficina Avaliação
Avaliação de Políticas
de Políticas de Saúde,
de Saúde, Ministério
Ministério daeSaúde
da Saúde HAOC.e
HAOC.
No ano 2019, o Decit organiza mais duas Oficinas para Elaboração de Diretrizes de
Avaliação de Impacto de Políticas e Programas de Saúde: a segunda, em maio, em nova
parceria com o Hospital Alemão, e a terceira, em dezembro, em parceria com o Hospital do
Coração. Ao todo, entre palestrantes e colaboradores, mais de 60 pessoas estiveram
envolvidas nas segunda e terceira oficinas.
18 Ministério da Saúde
O resultado desse intenso debate foi uma proposta de elaboração de um guia orientador
da realização de pesquisas de avaliação de impacto, útil a pesquisadores e a gestores
interessados em conduzir e em interpretar estudos avaliativos. A proposta desse guia
transforma-se, em 2021, no projeto de elaboração do presente livro, liderado pelo Programa
de Economia, Tecnologia e Inovação em Saúde (PECS) do Instituto de Saúde Coletiva da
Universidade Federal da Bahia (ISC-UFBA). Dois anos depois, o livro está sendo publicado.
A estrutura do livro, com suas seções e capítulos, assim como a seleção de autores e
autoras, emergiu das contribuições recebidas desde a 1ª oficina mencionada e evoluiu por
meio do contato direto entre gestores do Ministério da Saúde, notadamente da
Coordenação de Evidências e Informações Estratégicas para Gestão em Saúde, vinculada
ao Decit, e pesquisadores das áreas de Economia da Saúde, Política de Saúde e Avaliação
de Políticas Públicas.
3 A estrutura do livro
Para atingir tais objetivos, o livro foi estruturado em cinco partes – (1) Introdução à avaliação
de impacto de políticas de saúde; (2) Fundamentos lógicos e conceituais; (3) Métodos de
inferência causal; (4) Ciência de dados com foco no DataSUS; e (5) Políticas informadas
por evidências e tradução do conhecimento – as quais serão detalhadas a seguir.
A parte 1 do livro apresenta ao leitor o debate atual sobre Avaliação de Impacto de Políticas,
com foco em saúde, uma atenção especial para a saúde pública, sem se aprofundar na
discussão sobre métodos de avaliação. Trata-se de um convite ao leitor para se familiarizar
com os conceitos e as teorias da área, recorrendo-se a exemplos de avaliações de políticas
públicas de saúde.
20 Ministério da Saúde
de uma população. Nesse capítulo são apresentadas as principais bases de dados
domiciliares ou de registros administrativos disponíveis e se discutem quais medidas –
individuais ou agregadas –podem ser geradas e utilizadas em estudos de avaliação de
políticas de saúde.
Ainda que a avaliação ex-post tenha proeminência neste livro, o capítulo 6 – Projetando e
avaliando o impacto de intervenções futuras: princípios e métodos – escrito por Rodrigo
Volmir, Felipe Rubio, José Ordoñez e Davide Rasella, pesquisadores do ISC/UFBA,
apresenta os fundamentos das avaliações de impacto ex-ante com foco em modelos
matemáticos e estatísticos preditivos do comportamento da morbidade (hospitalização) e
da mortalidade por diferentes causas em segmentos diversos da população. Dentre os
14
Tal destaque deve-se às contribuições da Professora Elizabeth Moreira dos Santos (ENSP) na Terceira
Oficina para elaboração de Diretrizes Metodológicas para Avaliação de Impacto de Políticas de Saúde,
ocorrida nos dias 5 e 6 de dezembro de 2019 em Brasília.
A parte 3 do livro apresenta os métodos clássicos para inferência causal. Aqui, o leitor terá
contato com diferentes métodos e suas aplicações e conhecerá as potencialidades e os
limites de cada um. Nessa discussão, serão privilegiados exemplos da literatura de saúde,
saúde pública e epidemiologia. Como citado, os principais livros sobre inferência causal e
avaliação de políticas públicas tinham como ponto de partida o Modelo de Resultados
Potenciais de Rubin. Apenas os livros mais recentes apresentam ao leitor uma visão
alternativa para se pensar causalidade, especialmente aquela de Judea Pearl.
15
Cunningham (2021) apresenta os DAG – Directed Acyclic Graphs – em seu Capítulo 3, Huntington-Klein
(2022) em seu capítulo 6 e Hernán e Robins (2020) também em seu capítulo 6.
22 Ministério da Saúde
disponibilidade de dados (longitudinal ou corte transversal), o número de unidades tratadas
e a existência de problemas na implementação da intervenção. Ressalte-se que o método
de Controle Sintético é somente apresentado nesse capítulo.
16
Os autores disponibilizaram o banco de dados e a rotina de programação do Stata para que o leitor
consiga replicar os exemplos apresentados no capítulo.
No capítulo 15 que inicia essa parte, intitulado – Um debate sobre dados pessoais e dados
sensíveis para pesquisa científica e avaliação de políticas públicas a partir da Lei Geral de
Proteção de Dados – Bethânia Almeida (Cidacs/Fiocruz) debate profundamente sobre o
uso de dados pessoais e dados sensíveis para pesquisas, em especial em saúde pública,
a partir da LGPD. A produção de conhecimento depende do uso de dados e o acesso a
microdados sensíveis possibilita realizar avaliação de impacto em saúde com diversos
desfechos. O capítulo mostra como é possível usar os dados sensíveis e proteger
simultaneamente a privacidade das pessoas a que se referem os seus dados.
24 Ministério da Saúde
sensíveis. É um passo a passo para se construir uma infraestrutura que armazene dados
sensíveis, em especial do SUS, para utilizá-los em pesquisas e avaliação de políticas
públicas, respeitando a LGPD.
17
Raphael Saldanha publicou, em conjunto com Ronaldo Bastos e Christovam Barcellos, o artigo
Microdatasus: pacote para download e pré-processamento de microdados do Departamento de Informática
do SUS (DATASUS) no CPS em 2019. A leitura do Capítulo 17 e desse artigo é necessária para qualquer
pesquisador que queira acessar microdados do DataSUS.
A parte 5 do livro, com seus três capítulos, busca jogar luz sobre duas questões centrais:
como o processo e o produto da avaliação de impacto de determinada intervenção –
complexos em razão do desenho do experimento ou quase-experimento ou do tratamento
dos dados – podem ser comunicados a uma grande audiência? Ou ainda como podem
subsidiar a formulação de políticas públicas e informar de forma significativa a gestores
públicos que tomam decisões políticas?
26 Ministério da Saúde
efetivas quando se associam ao exercício democrático da cidadania no interior das
organizações.
4 Conclusão
Os organizadores esperamos que esta longa introdução seja útil ao leitor, o qual pode –
com mais elementos – escolher fazer a leitura sequencial do primeiro ao último capítulo do
livro ou ir diretamente à parte que lhe interessa em especial. Boa leitura!
ANGRIST, J.; PISCHKE, J. S. Mastering metrics: the path from cause to effect. Nova
Jersey: Princeton University Press, 2015.
CUNNINGHAM, S. Causal inference: The Mixtape. London: Yale University Press, 2021.
DEHEJIA, R. Pratical propensity score matching: a reply to Smith and Todd. Journal of
Econometrics, n. 125, p. 355-364, 2005.
GERTLER, P. J. et al. Impact evaluation in practice. Washington, DC: The World Bank,
2016.
HERNÁN, M. A.; ROBINS, J. M. Causal inference: what if. London: Chapman &
Hall/CRC, 2020.
IMBENS, G. W.; RUBIN, D. B. Causal inference for statistics, social, and biomedical
sciences: an introduction. Cambridge: Cambridge University Press, 2015.
28 Ministério da Saúde
KAWACHI, I.; SUBRAMANIAN, S. V.; MOWAT, R. Randomized controlled trials and
evidence-based policy: a multidisciplinary dialogue. Social Science & Medicine, v. 210,
p. 1, 2018.
PONCZEK, V.; SOUZA, A. P. New evidence of the causal effect of family size on child
quality in a developing country. Journal of Human Resources, v. 47, n. 1, p. 64-106,
2012.
30 Ministério da Saúde
Capítulo 1
Erika Aragão1
Mauricio L. Barreto1,2
1
Instituto de Saúde Coletiva, Universidade Federal da Bahia
2
Centro de Integração de Dados e Conhecimentos para a Saúde (Cidacs), Fiocruz - Bahia
RESUMO:
O objetivo deste capítulo é apresentar um panorama dos estudos de Avaliação de Impacto de
políticas e programas de proteção social e de saúde que tenham efeito sobre a saúde da população
brasileira, considerando-se a complexidade dos determinantes sociais que interferem nas condições
de saúde de qualquer população. Serão apresentados os esforços de investigação realizados no país
buscando-se atribuir nexos causais entre as intervenções resultantes de políticas públicas e seus
efeitos na saúde, fenômeno essencialmente complexo, bem como a heterogeneidade destes efeitos,
em diferentes extratos da população (nível de pobreza, cor-etnia, sexo etc.), os principais achados
dos estudos apresentados, em busca de se identificarem suas contribuições para o aperfeiçoamento
das políticas públicas avaliadas, assim como as principais limitações para a realização desses estudos.
PALAVRAS-CHAVE:
Avaliação de Impacto de Políticas e Programas de Saúde. Avaliação de Impacto de Políticas e
Programas Sociais.
32 Ministério da Saúde
Bretanha (SCLIAR, 2007). Pode-se citar ainda, na Europa, os trabalhos pioneiros de
Frederik Engels (2010), no campo da economia política, denunciando as terríveis condições
da classe trabalhadora na Inglaterra.
Outro avanço importante no entendimento dos fatores que determinam os níveis de saúde
de uma população foi quando se percebeu que, além da pobreza absoluta, as
desigualdades sociais constituem-se importante determinante; isso explica que mesmo em
sociedades afluentes, porém com significativos níveis de desigualdades, como acontece na
maioria dos países considerados desenvolvidos, as condições de saúde da população são
piores naqueles mais desiguais. Portanto, como tem apontado Wilkinson (1997), os níveis
de desigualdades são importantes definidores de sociedades mais ou menos saudáveis.
Nos anos 1980 e 1990 questionou-se fortemente esse papel do Estado; as políticas
neoliberais pautaram a agenda internacional. O Sistema Único de Saúde (SUS) brasileiro
foi criado nesse contexto de redução do Estado nas economias centrais e recomendações
de sua adoção para a América Latina. O chamado Consenso de Washington propunha
medidas como corte de gastos públicos para a redução da dívida pública e reforma fiscal
focada na redução da tributação das empresas, ampliação do setor privado em todas as
áreas mediante privatizações e abertura comercial e econômica. A premissa era a de que
a redução do protecionismo iria ampliar a abertura das economias para o investimento
estrangeiro e promoveria consequentemente o crescimento econômico (ARAGÃO;
FUNCIA, 2021).
34 Ministério da Saúde
simples, direto e unicausal. Desse modo, o principal desafio das investigações sobre as
relações entre determinantes sociais e saúde consiste em estabelecer uma hierarquia de
determinações entre as condições sociais, econômicas, ambientais, políticas e como essas
incidem sobre as condições de saúde, tanto no âmbito individual quanto no coletivo. O
estudo dessa cadeia de mediações permite também identificar onde e como devem ser
feitas as intervenções com o objetivo de reduzir as desigualdades de saúde, ou seja, os
pontos mais sensíveis nos quais tais intervenções podem provocar maior impacto. Ou seja,
reduzir desigualdades sociais, por exemplo, é fundamental para a redução das
desigualdades em saúde (BUSS; PELEGRINO FILHO, 2007).
Diversos são os modelos que procuram esquematizar a trama de relações entre os vários
fatores estudados por meio desses enfoques, como os do modelo de Dahlgren e Whitehead
(GUNNING-SCHEPERS, 1999) e do modelo de Didericksen e outros (EVANS et al., 2001).
Tais modelos ajudam a operacionalizar as diferentes camadas e inter-relações entre os
diferentes fenômenos que afetam a saúde. Em termos gerais, incorporam a crescente
influência da percepção de que as condições sociais, econômicas e culturais dos países e
assumem a importância de se enfrentar problemas como a pobreza e as condições de
saúde.
No Brasil, um dos programas sociais cujos efeitos têm sido mais estudados, inclusive na
área da saúde, é o Bolsa Família, programa de transferência condicional de renda criado
em 2003; diz-se condicional porque estabelece pré-requisitos para as famílias receberem
o benefício. Tais condicionalidades são centradas na educação e saúde de crianças e
gestantes. Colocar e manter as crianças na escola, o calendário vacinal e pré-natal em dia
eram exigências para que as pessoas aptas pudessem continuar a receber recursos.
36 Ministério da Saúde
Um estudo seminal no campo da saúde coletiva foi o de Rasella e colaboradores (2013),
cujo objetivo foi avaliar o efeito do programa Bolsa Família nas mortes de crianças menores
de cinco anos decorrentes de causas específicas associadas à pobreza: desnutrição,
diarreia e infecções respiratórias. Nos municípios nos quais havia um programa consolidado
de transferência de renda houve redução de cerca de 25% da mortalidade de crianças
menores de 5 anos. Entre as doenças mais impactadas pelo programa estão as diarreias,
cuja redução foi de quase 50%, e a desnutrição - ainda uma causa importante de óbito -
teve um decréscimo de mais de 60%. Essa foi a primeira demonstração do efeito de um
programa de transferência de renda sobre a chance de sobrevivência de crianças
brasileiras.
Sabe-se que os estudos de base individual são muito mais demonstrativos e rigorosos em
termos de testar esse tipo de hipótese causal, mas os estudos e dados agregados são
muito importantes. O trabalho de Rasella et al. (2013) foi reproduzido para diferentes tipos
de desfechos e desde então uma série de estudos tem sido conduzida e publicada por
diferentes pesquisadores, a mostrar o impacto de programas sociais, como o Bolsa Família
e outros em diferentes desfechos de saúde como tuberculose (SOUZA et al., 2018),
hanseníase (NERY et al., 2014), violência (MACHADO et al., 2018), suicídio (ALVES et al.,
2019), saúde materna (RASELLA et al., 2021), dentre outros.
1
https://cidacs.bahia.fiocruz.br.
A partir dessas iniciativas, tornou-se possível montar investigações muito mais detalhadas
para demostrar o impacto dos efeitos do Bolsa Família e outros programas sociais e de
saúde, na saúde. Em resumo, com esses recursos tem sido possível avaliar com maior
precisão, mais detalhes e nuances os efeitos na saúde dos programas e políticas avaliadas.
Em uma análise transversal, aninhada à Coorte dos 100 Milhões de Brasileiros, em que
foram analisados dados de 6,3 milhões de crianças menores de cinco anos, cujas famílias
se inscreveram no Cadastro Único entre 2006-2015 (RAMOS et al., 2021), mostrou-se que
o Bolsa Família tem importante efeito na mortalidade de crianças menores de 5 anos (da
ordem de 17% menor entre as crianças de famílias que receberam o benefício em relação
àquelas de famílias não contempladas pelo auxílio), achados compatíveis com o estudo
prévio, em que se utilizaram dados agregados (RASELLA et al., 2013). Porém, esses novos
achados mostraram nuances que não poderiam ser observadas nos estudos ecológicos.
Utilizando-se dados individualizados, evidenciou-se que o efeito do Bolsa Família foi maior
nos grupos mais vulneráveis; da ordem de 28% nos municípios mais pobres, de 26% entre
crianças de mães negras ou de 22% entre crianças nascidas a pré-termo. Avaliação do
impacto do Bolsa Família sobre a hanseníase indicou redução de 14% na incidência nos
municípios com alta carga da doença (PESCARINI et al., 2020a), além de evidenciar 22%
de aumento na taxa de aderência/adesão ao tratamento e 24% nas taxas de cura
(PESCARINI et al., 2020b). Estudo similar sobre o impacto do Bolsa Família sobre as taxas
de suicídio mostrou que para as pessoas que receberam o benefício essas foram
aproximadamente 50% menores relativamente aos que não o receberam (MACHADO et
al., 2022). Sobre a mortalidade das doenças cardiovasculares, um estudo realizado em
período relativamente curto de seguimento indicou que enquanto não se observou um efeito
global em todo o país, houve redução da ordem de 14% na população de 30-60 anos de
idade, residentes nos municípios mais pobres do país (PESCARINI et al., 2022)
38 Ministério da Saúde
Em resumo, os estudos mais recentes que utilizam dados individuados sobre os quais
aplicam-se os denominados métodos quase-experimentais, como apresentados acima,
comprovam os efeitos observados nas avaliações a partir de dados agregados. Entretanto
os estudos individuados são mais robustos, podem capturar efeitos sobre diferentes
estratos e grupos sociais, os quais foram sempre maiores entre os mais pobres e excluídos.
Desse modo, os achados, em seu conjunto, indicam que apesar dos seus limites, esses
programas vêm contribuindo para o desenvolvimento de uma sociedade mais saudável e
menos desigual, na medida que os efeitos são maiores nos grupos mais vulneráveis,
reduzindo as desigualdades em saúde existentes.
A abordagem avaliativa utilizada para os programas sociais vem sendo ampliada para
políticas e programas de saúde. Estudos com dados agregados têm consistentemente
mostrado efeitos do Programa Saúde da Família (PSF) sobre a saúde, sejam na saúde
infantil (AQUINO et al., 2009; RASELLA et al., 2010) e nas doenças cardiovasculares e
cerebrovasculares (RASELLA et al., 2014). Estudos mais recentes, explorando as mesmas
questões, porém realizados com dados da Coorte de 100 milhões de Brasileiros. mostram
que em municípios com alta cobertura do PSF apresentaram reduções significativas na
incidência e na mortalidade por tuberculose, 22% e 28% respectivamente (JESUS et al.,
2022), enquanto estudo em curso, ainda não publicado, usando metodologia ainda mais
rigorosa que o anterior, mostra que o PSF tem o efeito de reduzir cerca de 40% a
mortalidade infantil (PINTO-JR, 2023). Mais recentemente e no contexto das mudanças
climáticas, iniciam-se esforços para a avaliação do impacto de políticas ambientais na
mitigação de efeitos climáticos extremos, os quais ocorrem em frequência cada vez maior,
mundialmente e também no nosso país.
40 Ministério da Saúde
na área de saúde, foco no SUS, tem sua trajetória acadêmica beneficiada, uma vez
contemplados com recursos para tal pesquisa, se comparados com pesquisadores que
concorreram, porém não foram beneficiados.
Políticas públicas de saúde, como o Aqui Tem Farmácia Popular, as Policlínicas Regionais
de Saúde ou o PPSUS, com o objetivo de gerar resultados acadêmicos que melhorem as
práticas do SUS, são formuladas pelo Ministério da Saúde ou pelas Secretarias de Saúde
e precisam ser avaliadas especialmente por dois motivos: 1) testar empiricamente se tais
programas cumprem o seu objetivo principal; 2) testar os canais de impacto e seus
potenciais efeitos heterogêneos. O conjunto de resultados pode aumentar a quantidade de
informações para que gestores do Sistema Único de Saúde tomem melhores decisões,
melhorem o sistema e, consequentemente, os indicadores da população beneficiada.
5 Considerações finais
42 Ministério da Saúde
Referências
ALVES, F. J. O.; MACHADO, D. B.; BARRETO, M. L. Effect of the Brazilian cash transfer
programme on suicide rates: a longitudinal analysis of the Brazilian municipalities. Social
Psychiatry and Psychiatric Epidemiology, 54, n. 5, p. 599-606, 2019. DOI:
10.1007/s00127-018-1627-6.
AQUINO, R. et al. Impact of the Family Health Program on infant mortality in Brazilian
municipalities. American Journal of Public Health, v. 99, n. 1, p. 87-93, 2009.
BALTRUSIS, N.; DIOTTAVIANO, M. C. L. Rich and por, each one in their place:
socioespatial inequality in São Paulo. Caderno CRH, v. 22, n. 55, p.135-149, 2009.
BARRETO, M. L. et al. The Centre for Data and Knowledge Integration for Health
(CIDACS): linking health and social data in Brazil. International Journal of Population
Data Science, v. 4, n. 2, p. 1-12, 2019. DOI: 10.23889/ijpds.v4i2.1140.
BARRETO, M. L. et al. Cohort profile: the 100 Million Brazilian Cohort. International
Journal of Epidemiology, v. 51, n. 2, p. e27-e38, 2022.
BIRN, A. E. Back to Alma Ata, from 1978 to 2018 and beyond. American Journal of
Public Health, v. 108, n. 9, p. 1153-1155, 2018.
EVANS, T. et al. Challenging inequities in health from ethics to action. Oxford: Oxford
University Press, 2001.
MACHADO, D. B. et al. Relationship between the bolsa familia national cash transfer
programme and suicide incidence in Brazil: a quasi-experimental study. PLoS Medicine,
v. 19, n. 5, p. 1-17, 2022. DOI: 10.1371/journal.pmed.1004000.
NERY, J. S. et al. Effect of the Brazilian conditional cash transfer and primary health care
programs on the new case detection rate of leprosy. PLoS Neglected Tropical Diseases,
v. 8, n. 11, p. 1-7, nov. 2014. DOI: 10.1371/journal.pntd.0003357.
PINTO-JR, E. P. et al. Impact of PHC system factors on under-5 mortality: final report.
Salvador: Cidacs/Fiocruz, 2023. Disponível em: https://cidacs.bahia.fiocruz.br/aps/.
Acesso em: 21 maio 2023.
PESCARINI, J. M. et al. Conditional cash transfer program and leprosy incidence: analysis
of 12.9 million families from the 100 Million Brazilian Cohort. American Journal of
Epidemiology, v. 189, n. 12, p. 1547-1558, 2020a. DOI: 10.1093/aje/kwaa127
RAMOS, D. et al. Conditional cash transfer program and infant mortality: a nested cross-
sectional analysis in the Cohort of 100 Million Brazilians. PloS Medicine, v. 18, n. 9, p. 1-
20, 2021. DOI:10.1371/journal.pmed.1003509.
44 Ministério da Saúde
RASELLA, D. et al. Effect of a conditional cash transfer program on infant mortality: a
national analysis of Brazilian municipalities. Lancet, v. 382, n. 9886, p. 57-64, 2013. DOI:
10.1016/S0140-6736(13)607151.
RASELLA, D.; AQUINO, R.; BARRETO, M. L. Reducing childhood mortality from diarrhea
and lower respiratory tract infections in Brazil. Pediatrics, v. 126, n. 3, p. 534-540, 2010.
RASELLA, D. et al. Impact of primary health care on mortality from heart and
cerebrovascular diseases in Brazil: a nationwide analysis of longitudinal data. British
Medical Journal, n. 348, p. 1-10, 2014. DOI: 10.1136/bmj.g4014.
SOUZA, R. et al. Family health and conditional cash transfer in Brazil and its effect on
tuberculosis mortality. International Journal of Tuberculosis and Lung Disease, v. 22,
p. 1300-1306, 2018.
VILLERMÉ L. R. Reseña del estado físico y moral de los obreros de las industrias del
algodón, la lana y la seda. In: BUCK, C. et al. (ed.). El desafio de la epidemiología:
problemas y lecturas seleccionadas. Washington: OPAS, 1988. p. 34-37.
WHITEHEAD, M. The concepts and principles of equity and health. Geneva: WHO,
2000. (EUR/ICP/RPD 414, 7734r).
Institucionalização da avaliação no
âmbito do Executivo Federal: CMAP e
editais de pesquisa em saúde
1
Instituto de Pesquisa Econômica Aplicada - IPEA
RESUMO:
Este capítulo discute a institucionalização da avaliação de programas e políticas de saúde. As
ações vêm sendo objeto de avaliação há anos, tanto pela maior interação entre universidades,
institutos de pesquisa e Ministério da Saúde quanto pela atuação do CMAP. O trabalho parte
de análises documentais, revisão da literatura, além de buscar dados sobre financiamento das
pesquisas e incorporar a perspectiva a partir do PPA e da LOA. Apesar da longa discussão sobre a
institucionalização da avaliação, ainda há muitos desafios para que as avaliações sejam efetivamente
incorporadas e contribuam para aperfeiçoamento das políticas públicas de saúde.
PALAVRAS-CHAVE:
Avaliação. Institucionalização. Políticas públicas de saúde.
46 Ministério da Saúde
1 Apresentação
A avaliação tem, entre outros objetivos, apoiar a gestão para aprimoramento das políticas
públicas. Como seu objeto – as políticas públicas – se reveste de níveis de complexidade,
institucionalidade e maturidade bem diferenciados, a institucionalização da avaliação deve
considerar esses fatores e ter capacidade para a esses se adaptar (VAISTMAN; PAES-
SOUZA, 2011).
Nesse processo recente, ações da área de saúde têm sido selecionadas para
monitoramento e avaliação. Para além dessa avaliação pelo centro de governo, as políticas,
programas e ações do Ministério da Saúde têm sido objeto de avaliação com fomento por
esse órgão setorial e parceiros. Esse fomento acontece diretamente por meio das áreas
técnicas gestoras dos programas ou por editais coordenados pela Secretaria de Ciência,
Tecnologia e Insumos Estratégicos (SCTIE).
2 Metodologia
48 Ministério da Saúde
Editais da SCTIE: Pesquisa Saúde
O sítio do Pesquisa Saúde contém diferentes formas de acesso aos dados das pesquisas
relacionadas aos editais do DECIT. Uma dessas formas é por meio do Tabnet (disponível
na página), o qual contém informações sobre o ano de publicação do edital ou da
contratação do projeto; da instituição de vínculo do coordenador proponente do projeto de
pesquisa; subagenda da ANPPS; vinculação aos objetivos estratégicos das PESS;
modalidade de fomento; modalidade de gestão; tipo de pesquisa; natureza da pesquisa;
setor de aplicação; parceiro administrativo; parceiro orçamentário e se houve formação de
mestre, doutor ou especialista. Os conteúdos de pesquisa disponíveis no Tabnet incluem:
quantidade de projetos, valor com bolsa, valor sem bolsa, valor DECIT, valor parceiro e
valor total dos projetos. O foco da análise eram avaliações financiadas pelos editais e
avaliações de impacto. O termo “avaliação” aparece nas subagendas da ANPSS, em
objetivos estratégicos das PESS e no setor de aplicação. Contudo, quando são analisados
os dados pelo Tabnet1, observa-se uma grande inconsistência das informações disponíveis,
como a ausência de informações sobre as pesquisas para os anos 2015 a 2017 e ausência
parcial de informações para os anos 2004, 2011, 2018 e 2021. Essas inconsistências foram
verificadas utilizando-se a variável “unidade da federação” e comparando com a planilha
obtida por meio do mecanismo de busca do site Pesquisa Saúde2, de onde é possível extrair
as planilhas Excel® usando-se o filtro ano a ano. O total de registros pelo Tabnet foi de
5.405 pesquisas, enquanto nas planilhas extraídas do mecanismo de busca foram 7.094,
ou seja, 24% das pesquisas não constam do Tabnet. Outra inconsistência da consulta do
Tabnet é a ausência parcial de informações de algumas variáveis (nem todas foram
testadas) como “Subagenda ANPPS”, que consta somente em 1.964 pesquisas, 28% do
total de 7.094 pesquisas financiadas entre 2002 e 2021.
Optou-se por trabalhar com a base mais detalhada sobre as pesquisas. A base completa
dos editais não foi localizada devido às mudanças realizadas na vinculação do site do
Ministério da Saúde ao gov.br. Assim, decidiu-se por realizar a extração ano a ano de todas
as pesquisas por meio do mecanismo de busca do sítio do Pesquisa Saúde, que traz
informações relevantes não disponíveis no Tabnet, tais como o título e o resumo de todas
as pesquisas financiadas.
1
A consulta de dados do site Pesquisa Saúde pelo Tabnet está disponível em:
http://pesquisasaude.saude.gov.br/erro/httpErro404.xhtml;jsessionid=x7riWKf8iVMte5e6AgmHesW4.
2
O mecanismo de busca do sítio Pesquisa Saúde está disponível em:
http://pesquisasaude.saude.gov.br/pesquisas.xhtml.
O Plano Plurianual (PPA) foi estabelecido na Constituição Federal de 1988 (CF 88),
no capítulo que trata “Dos Orçamentos”, Art. 165, que se refere também à Lei de
Diretrizes Orçamentárias (LDO) e à Lei Orçamentária Anual (LOA). Enquanto o PPA
é um instrumento de planejamento de quatro anos, o qual começa no segundo ano
do mandato presidencial e vai até o primeiro ano do mandato seguinte, a LDO e a
LOA são anuais. A CF 88 previa também um sistema de controle interno mantido
pelos poderes Executivo, Legislativo e Judiciário, com a finalidade, entre outras, de
avaliar o cumprimento das metas previstas no plano, bem como os seus resultados
relativos à eficácia e à eficiência (Art. 74).
3
Não foram contabilizados os títulos de editais que repetem o título da pesquisa, por se considerar que
houve erro no preenchimento.
50 Ministério da Saúde
O primeiro PPA teve vigência no período 1991-1995 – o único quinquenal – e foi
marcado pela instabilidade econômica e política (GARCIA, 2000). O PPA para o
período 1996-1999 buscou vincular planejamento e orçamento – ocasião em que se
iniciou a construção de um sistema de informações gerenciais para monitoramento
do plano – e a avaliação era mencionada como atribuição de cada órgão setorial.
Garcia (2000) considera que esse plano nem chegou a ser avaliado, pois não havia
instrumentos efetivos para isso e o foco estava muito centrado na questão fiscal,
reduzindo-se a importância do planejamento.
4
PPA 2000-2003: https://bibliotecadigital.economia.gov.br/handle/123456789/525650.
5
Cabe destacar que “[...] antes da aprovação da Lei do PPA 2000-2003, houve a promulgação da LRF, que
inaugura, segundo Barcelos (2012), um novo regime de governança orçamentária no Brasil. Nesse ponto, a
sobreposição e a disputa entre os instrumentos de planejamento e orçamento revelam-se de maneira nítida”
(COUTO; CARDOSO JUNIOR, 2020, p. 26).
Como ressalta Serpa (2011), em ambos os PPAs a atuação da CMA foi dominada
pela análise dos projetos de grande vulto. Além disso, não houve reuniões da CMA
durante os anos 2008, 2010 e início de 2011 (SERPA, 2011). Ainda segundo a
análise realizada por essa comissão, houve discussões para desenvolvimento de
metodologias centradas no que se denominou avaliações rápidas, as quais foram
baseadas na construção de modelo lógico de programas visando explicitar a teoria
do programa, seus objetivos, insumos, atividades e resultados esperados. A
proposta metodológica foi aplicada a um programa (FERREIRA; CASSIOLATO;
GONZALEZ, 2009) e consolidada também em uma nota técnica de orientação
52 Ministério da Saúde
elaborada por equipe do IPEA (CASSIOLATO; GUERESI, 2010). Ainda que não
tenha sido concluída no âmbito da CMA, a aplicação dessa metodologia foi
disseminada pela equipe da Secretaria de Planejamento e Investimentos
(SPI/MPOG) – que coordenava a formulação, monitoramento e avaliação do PPA –
e o Tribunal de Contas da União (TCU) constatou sua importância para melhoria da
formulação dos programas e atividades de avaliação (SERPA, 2011).
Outro ponto importante destacado por Serpa (2011) a partir de avaliação realizada
pelo Banco Mundial, em 2006, é que a estrutura do PPA e as informações produzidas
para seu monitoramento e avaliação eram mais utilizadas para subsidiar as
necessidades do gestor do Plano no MPOG e não atendiam diretamente às
necessidades dos órgãos setoriais. Essa questão remete a duas outras, as quais
permitem fazer conexões com a discussão específica desse processo de
institucionalização da avaliação de políticas: (1) o foco nas ações orçamentárias e a
menor importância conferida ao planejamento; (2) a não conformidade entre o que o
PPA e os órgãos setoriais denominam programa; (3) a atuação das UMAs como
coordenadoras dos processos de avaliação setoriais e estabelecimento de diálogo
entre PPA e a programação de cada órgão.
Com relação ao primeiro ponto, Navarro, Santos e Franke (2012) argumentam que
o planejamento era voltado para controlar as ações, tendo os programas como
centros de custos e cujo objetivo era a redução dos gastos públicos. A eficiência se
tornou o objetivo preponderante a ser alcançado nesse processo. A análise das
políticas públicas, a elaboração de diagnósticos e a revisão do plano não eram o foco
principal. Assim, conforme esses autores, predominam a preocupação com a revisão
de estruturas orçamentárias e discussões contábeis. Cavalcante (2007) chama
atenção também para o peso dado ao controle orçamentário que influenciará a
sistemática de monitoramento e avaliação no âmbito do Executivo. Esse autor
também salienta a dificuldade dos gestores dos programas para aferir seus
resultados, expressa nas limitações na elaboração de indicadores de resultados –
principalmente para mensurá-los – e mais, para estimar o impacto desses
programas.
Criado ainda na vigência do PPA 2004-2007, o SMMP pretendia dar mais celeridade
às respostas para o alto escalão e produzir informações diferenciadas daquelas
contidas no PPA. As prioridades eram definidas por um comitê composto pela Casa
Civil e suas duas subchefias – Subchefia de Articulação e Monitoramento (SAM) e
Subchefia de Ação Governamental (SAG) – e pela SPI/MPOG. Estabelecia-se um
fluxo de informações que geravam posteriormente um relatório situacional e de
encaminhamentos para orientar as decisões do Ministro-Chefe da Casa Civil e do
Presidente (MAIA; SILVA; SALVIANO, 2013). Ainda em 2007, com a criação do
Programa de Aceleração do Crescimento (PAC), estabeleceu-se um novo sistema
para acompanhamento das metas presidenciais relacionadas ao PAC. O SIOP
respondia por todo o PPA e o SISPAC pelo monitoramento do PAC.
O SIOP passou a ser utilizado para elaboração e revisão do PPA e dos projetos da
LDO e da LOA, para alterações orçamentárias e de créditos, do orçamento
impositivo, informação sobre as receitas, acompanhamento das estatais,
acompanhamento orçamentário e monitoramento do PPA (ENAP, 2021). A princípio
esse sistema integrou ainda mais o processo de elaboração do orçamento e do PPA.
54 Ministério da Saúde
Ao mesmo tempo, os debates sobre a preponderância do orçamento sobre o
planejamento levaram a uma proposta de separação entre ambos, a qual foi
consolidada no processo de elaboração do PPA 2012-2015. A expectativa era dar
maior clareza às prioridades de governo, estabelecer mecanismos para a gestão
estratégica do Plano, bem como ampliar a participação social. Havia argumentos de
que se mantém uma inversão no processo: “em vez de o PPA balizar a elaboração
das LOAs, as dotações atualizadas das leis orçamentárias é que têm alimentado o
processo de revisão do PPA” (MARTINS NETO; CARDOSO JUNIOR, 2018). Esse
argumento é reforçado em outras análises que reiteram a predominância do
orçamento sobre o planejamento (COUTO; CARDOSO JUNIOR, 2020). Como
argumentam Martins Neto e Cardoso Jr., a despeito dos avanços o fato de o PPA ter
que consolidar toda a ação de governo, “[...] fez com que as políticas prioritárias
ficassem escondidas em um universo de mais de 400 objetivos e 2 mil metas”
(MARTINS NETO; CARDOSO JUNIOR, 2018, p. 73). Os autores, contudo,
consideram que esse PPA cumpriu papel importante quanto à participação social.
No final do ciclo desse PPA, em 2015, por decreto se criou o Grupo de Trabalho
Interministerial para Acompanhamento de Gastos Públicos do Governo Federal
(Gtag), composto pelo MPOG, Ministério da Fazenda, Casa Civil e Controladoria-
Geral da União (CGU). Seus objetivos estavam relacionados a melhorias da
eficiência e efetividade do gasto público e aperfeiçoamento das políticas públicas. O
GTAG tinha caráter temporário.
6
BRASIL. Ministério do Planejamento, Orçamento e Gestão. Portaria Interministerial n. 102, de 7 de abril
de 2016. Brasília, DF: MOG, 2016. Disponível em: https://bit.ly/3OThw5z. Acesso em: 2 jan. 2022.
7
Em janeiro de 2019, por meio da Medida Provisória 870, posteriormente convertida em lei (Lei nº 13.844,
de junho de 2019), a reforma administrativa unificou os Ministério da Fazenda e o MPOG, que passaram a
fazer parte do Ministério da Economia. Nessa reforma a ESAF foi incorporada à ENAP.
8
Antes da formalização do CMAP na lei do PPA, entre 2016-2018, havia então um processo de avaliação
de diversas políticas selecionadas pelo Centro de Governo (SACCARO; ROCHA; MATION, 2018); no
âmbito da saúde foi avaliado o Programa Farmácia Popular do Brasil e seu impacto sobre indicadores de
internações (ALMEIDA; VIEIRA; SÁ, 2018). Essa avaliação foi realizada no momento em que houve
questionamentos sobre a efetividade do programa, a qual mostrou impactos positivos de redução de
internações por doenças crônicas; em momentos posteriores, essa avaliação foi mencionada em defesa da
continuidade do programa quando houve propostas de extingui-lo.
56 Ministério da Saúde
avaliação foi incluída como um processo sistemático, integrado e institucionalizado
a ser realizado no âmbito do CMAP tanto para políticas financiadas pelo gasto direto
quanto por subsídios.
9
No caso dos subsídios, de acordo com a “projeção disponível dos Demonstrativos de Gasto Tributário
(DGT) e dos Benefícios Financeiros e Creditícios (DBF&C), no caso dos subsídios” (BRASIL, 2019).
10
“O rol de gastos com Subsídios são ações não orçamentárias, relacionadas a benefícios tributários e
creditícios, que não constam no OGU, somados aos subsídios financeiros, que têm ações orçamentárias.
As ações classificadas como Gastos Diretos são as demais ações orçamentárias de Programas Finalísticos,
excluindo-se, adicionalmente, as despesas financeiras orçamentárias que geram subsídios creditícios”
(BRASIL, 2019, p. 2).
Assim, um ciclo de avaliação do PPA começa pelo processo de seleção das ações
a serem avaliadas. Uma vez selecionadas as ações, as secretarias do Ministério da
Economia, a CGU, o IPEA, a ENAP e o IBGE, bem como convidados com notório
11
“Gasto Direto foi de R$ 328,98 milhões [2]. No caso dos Subsídios da União, a mediana das políticas é de
R$ 651,88 milhões para 2020. Os Programas Finalísticos acima dos respectivos pisos representaram 99,5%
do total do Gasto Direto e 97,4% do total do Subsídios da União elencados no PPA” (BRASIL, 2019, p. 3).
58 Ministério da Saúde
saber são chamados a contribuir com as avaliações do CMAP12. São realizadas
oficinas em que se discute como a avaliação será conduzida: quais as questões de
avaliação propostas, qual a metodologia a ser utilizada, qual o órgão coordenador
da avaliação e quem serão os executores de cada questão. Em 2020 e 2021, o IPEA
foi um dos órgãos que mais coordenou e executou avaliações, após a CGU. A ENAP
tem atuado com a produção de materiais ou textos de apoio à avaliação, contratação
de consultores para apoiar oficinas e prestar outros apoios por demanda dos
coordenadores da avaliação e em acordo com a equipe de supervisão das
avaliações da Secretaria Especial do Tesouro e Orçamento (SETO/ME), criada em
2021, tendo em sua composição o Departamento de Avaliação de Políticas Públicas,
que passou a ser o supervisor das avaliações do CMAP.
12
Podem ser convidados a contribuir pesquisadores e representantes de outros órgãos e de entidades
públicas e privadas com notório saber (BRASIL, 2019).
Um relatório intermediário deve ser enviado para a supervisão e há pelo menos uma
reunião técnica com participação dos membros do comitê ao qual se refere a
avaliação (CMAG ou CMAS). Outra reunião técnica é realizada no início do ano
seguinte. Além do relatório de avaliação, a instituição coordenadora deve produzir,
junto com os executores, um relatório de recomendações e esses dois produtos
devem ser enviados para os órgãos setoriais gestores dos programas/das ações até
março do ano subsequente. Os órgãos setoriais têm, em geral, 15 dias para produzir
uma manifestação sobre ambos os relatórios, mas o foco principal é sobre as
recomendações. A coordenação deve enviar as versões finais dos relatórios de
avaliação e recomendação, acompanhadas das manifestações dos órgãos setoriais
para o CMAP até o final de abril ou começo de maio do ano seguinte àquele do início
do ciclo de avaliação. Assim, os executores e a coordenação têm cerca de 10 meses
para produzirem as avaliações e os relatórios mencionados.
60 Ministério da Saúde
deliberação pelo Conselho. Os membros do Conselho debatem os resultados e as
recomendações, aprovam, solicitam alterações ou exclusão dessas e inclusive
consideram as manifestações dos órgãos setoriais. Após a deliberação do CMAP,
tornam-se públicos os relatórios aprovados juntamente com as atas que contêm as
deliberações do Conselho.
No Ciclo 2019, uma das dificuldades para se analisar a ação selecionada (CEAF) foi
o fato de ela ser parte de uma política mais ampla, qual seja, a Política Nacional de
Assistência Farmacêutica (PNAF), bem como se relacionar a políticas de
incorporação de tecnologia, desenvolvimento produtivo e regulação de preços, entre
outras. Isso ficou claro na elaboração do modelo lógico da ação selecionada,
contudo, a avaliação não tratava da PNAF, mas de uma ação que era parte dessa
política. Além disso, como destacado no relatório de avaliação, o CEAF é composto
por medicamentos de três grupos (básico, estratégicos e especializados), cujas
características, forma de organização da ação e responsabilidades de cada ente
federado são distintas (BRASIL, 2020a). Essas dificuldades também fizeram parte
dos processos de avaliações das outras ações selecionadas nos ciclos
subsequentes.
62 Ministério da Saúde
Quadro 1 - Avaliações de Programas e Ações de Saúde nos Ciclos 2019 a 2021 do CMAP
64 Ministério da Saúde
e Estruturação da Gestão do Trabalho e da Educação no SUS (ProgeSUS), entre
outros que eram parte de planos orçamentários. O principal plano orçamentário
dessa ação era o Apoio ao Desenvolvimento da Graduação, Pós-Graduação Stricto
e Latu Sensu em áreas estratégicas para o SUS (PO 0003), em razão de responder
por mais de 80% do recurso da ação em 2020. Contudo, somente por meio de
análises para além dos planos orçamentários, em diálogo com a equipe da Secretaria
de Gestão do Trabalho e da Educação na Saúde (Sgets) foi possível saber que os
recursos alocados nesse principal plano orçamentário são destinados principalmente
para o Programa Nacional de Apoio à Formação de Médicos Especialistas em Áreas
Estratégicas (Pró-residência Médica) e o Programa Nacional de Bolsas de
Residências Multiprofissionais e em Área Profissional da Saúde. Considerando-se a
impossibilidade de se avaliarem todos aqueles denominados programas pelo
Ministério da Saúde, os quais compunham essa ação orçamentária no ciclo de
CMAP, a partir das discussões entre os potenciais executores da avaliação
aplicaram-se novamente os critérios de materialidade (peso no orçamento) e de
criticidade para selecionar o Pró-residência como o programa a ser avaliado no Ciclo
2021.
13
Em 2021 os recursos foram alocados em outros dois novos POs (000E – Pró-residência médica e em
área multiprofissional da saúde no âmbito da atenção especializada e 000F – Pró-residência médica e em
área multiprofissional da saúde no âmbito da atenção primária), os quais não separavam as bolsas por
modalidade, mas por nível de atenção. Contudo, em 2022, novamente voltou a ter somente um plano
orçamentário.
Programa
Ciclo % % %
PPA 2020- Ação / Plano Orçamentário 2020 R$ milhões
CMAP ASPS Programa Ação
2023
Total ASPS 2020 160.985,11 100,0
Programa 5018 - Atenção especializada
99.371,73 61,7 100,0
à saúde
Programa Ação 8585 - Atenção à saúde da
50.200,26 31,2 50,5 100,0
5018 - população para procedimentos em MAC
Atenção 0000 - Atenção à saúde da população para
44.023,49 27,3 44,3 87,7
especializada procedimentos em MAC
à saúde 0001 - SAMU - 192 1.160,97 0,7 1,2 2,3
0005 - Fundo de Ações Estratégicas e
5.015,80 3,1 5,0 10,0
Compensação-FAEC
Programa 5019 - Atenção Primaria à
26.717,15 16,6 100,0
Saúde
Ação 219A - Piso de atenção básica em
2020 20.647,66 12,8 77,3 100,0
saúde
0002 - Agente Comunitário de Saúde 3.945,42 2,5 14,8 19,1
0008 - Incentivo financeiro da APS -
Programa 8.929,20 5,5 33,4 43,2
capitação ponderada
5019 -
0009 - Incentivo financeiro da APS -
Atenção 1.654,83 1,0 6,2 8,0
desempenho
Primária à
000A - Incentivo para ações estratégicas 2.950,30 1,8 11,0 14,3
Saúde
000B - Incentivo financeiro da APS - per
1.125,16 0,7 4,2 5,4
capita de transição
000C - Incentivo financeiro da APS - fator
1.572,88 1,0 5,9 7,6
compensatório de transição
000D - Programa de informatização da
469,87 0,3 1,8 2,3
APS
Total ASPS 2020 160.985,11 100,0
continua
66 Ministério da Saúde
conclusão
0002 - Formação de profissionais técnicos
de saúde e fortalecimento das escolas 5,46 0,0 0,3 0,4
técnicas/centros formadores do SUS
0003 - Apoio ao desenvolvimento da
graduação, pós-graduação stricto e latu 1.039,51 0,6 55,6 83,5
sensu em áreas estratégicas para o SUS
Programa
Ciclo % % %
PPA 2020- Ação / Plano Orçamentário 2020 R$ milhões
CMAP ASPS Programa Ação
2023
0004 - Apoio a educação permanente dos
48,70 0,0 2,6 3,9
trabalhadores do SUS
0005 - Apoio à melhoria da capacidade de
gestão de sistemas e gerência de unidades 0,60 0,0 0,0 0,0
do SUS
0006 - Modernização e qualificação do
11,98 0,0 0,6 1,0
trabalho no SUS
000C - Democratização das relações de
trabalho e regulação das profissões de 4,01 0,0 0,2 0,3
saúde
Com referência ao terceiro ponto, esse tem sido um tema também importante nas
avaliações do CMAP: acesso a bancos de dados e sistemas de informação para
68 Ministério da Saúde
realização das avaliações. A maioria das avaliações realizadas no âmbito do CMAP
na área de saúde demandou dados que não estavam disponíveis publicamente.
Mesmo na relação direta entre órgãos da administração pública federal e nos casos
de instituições que garantiam o devido tratamento restrito ou sigiloso dos dados,
entre a demanda inicial e o efetivo recebimento das informações, em muitos casos
os dados demoram mais de 6 meses para serem obtidos. Alguns dados chegaram
próximos ao prazo final de entrega dos relatórios para o CMAP e não foram usados,
a exigir adaptações metodológicas e alguma revisão do escopo da avaliação. Nesse
processo, antes mesmo de se obterem os dados, eram importantes as rodadas de
discussão com as equipes técnicas para compreensão dos sistemas, registros e
formatação da demanda. O acesso aos dados em tempo oportuno para a realização
de avaliação, cujo prazo efetivo é de 10 meses, tem sido um ponto crítico para a
realização das avaliações de implementação, resultados e impactos de programas e
ações da área de saúde e também relatado por equipes de outras avaliações
setoriais.
70 Ministério da Saúde
destaque para as Iniciativas do PPA 2012-2015 relacionadas à saúde e a tentativa
de vincular os objetivos estratégicos e prioridades de pesquisa a essas iniciativas.
Todos esses processos foram coordenados por meio da SCTIE/MS; em sua maior
parte, o fomento se deu por meio de editais. A análise dos quantitativos e alguns
detalhamentos relacionados a esses editais são o objeto da próxima seção.
As principais
2002
informações
2,0
sobre 2,0
as pesquisas
0,0
financiadas0,0pelo MS 88
por 3,0742
meio de
editais2003
2004
11,1
da SCTIE estão
82,0
10,7
disponíveis
70,9
0,4
em planilhas
11,2
anuais no0,0
0,0
130
site Pesquisa
835
2,6798 1
Saúde .
2,5140
Entre 2005
2002 e 2019146,8
2006 158,8
86,1
6.480 pesquisas
77,6
60,7
contaram
81,1
0,0
com recursos
0,0
619 2,3524
principalmente
815 2,2579
do
2007 37,4 23,9 13,5 0,0 168 2,1786
próprio MS e do CNPq
2008 174,8
e em alguns
75,3
casos também
99,5
das secretarias
0,0
estaduais
329 2,0615
de
2009 118,1 72,3 45,8 0,0 773 1,9655
saúde, Capes, Unesco,
2010 52,2 entre outros.
19,7 As pesquisas
15,0 financiadas
17,5 somam
190 R$ 1,50
1,8712
2011 36,5 15,1 14,0 7,4 36 1,7547
bilhão2012
no período2; desse
79,8 montante,
51,2 53,1% de recursos do13,8
14,7 DECIT e o354restante
1,6648dos
2013 157,9 86,1 44,1 27,7 984 1,5675
parceiros.
2014 Contudo, no
64,4Gráfico 1 observa-se
60,0 grande
3,8 flutuação
0,6no volume
200de recursos
1,4742
2015 2,9 1,8 1,0 0,0 41 1,3521
e na classificação
2016 daqueles
98,5 aportados
18,5 por parceiros.
23,6 56,4 299 1,2434
2017 123,0 70,6 27,3 25,1 400 1,2020
2018 72,0 36,2 18,9 16,8 169 1,1595
2019 85,7 20,5 1,3 64,0 68 1,1178
Gráfico 1 – Recursos aplicados
1.503,8 nas pesquisas
798,5 financiadas
475,9 pela SCTIE/MS
229,4 e por parceiros, por
100,0% 53,1% 31,6% 15,3%
ano dos editais, em R$ milhões correntes
200
175
180
159 158
160 147
140 28
123
118
99
120 81
61
44 98 25
100 86
82 46
80
80 27 72
11 14 64
56
60 52 1
4 17
15
64
37 37 19
40 86 17 86
71 78 75 72 71
14 7 60 24
15 51
20 11 14 1
36
2 0 24 3 20
20 15 18
0 11 0
1
0 2 2
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
Valor DECIT Valor Parceiro Valor Parceiro Não Informado Valor Total
1
Site http://pesquisasaude.saude.gov.br/ (https://bit.ly/3Ah5ldF).
2
Os valores das planilhas apresentaram algumas inconsistências que foram corrigidas da seguinte forma:
quando o valor total da pesquisa é menor do que a soma do “valor DECIT” com o “valor parceiro”, assumiu-
se que corresponde a essa soma; quando o valor total da pesquisa é maior do que a soma do “valor DECIT”
com o “valor parceiro”, criou-se uma coluna com essa diferença identificada como “valor parceiro não
informado”, a qual corresponde a 15,3% do total.
Outras
Outras 336
336
Violência,Acidentes
Violência, AcidenteseeTraumas
Traumas 128
128
Saúdedo
Saúde doIdoso
Idoso 129
129
BioéticaeeÉtica
Bioética Éticana
naPesquisa
Pesquisa 156
156
Ambiente,Trabalho
Ambiente, TrabalhoeeSaúde
Saúde 162
162
ComplexoProdutivo
Complexo Produtivoda
daSaúde
Saúde 177
177
Promoçãoda
Promoção daSaúde
Saúde 191
191
SaúdeBucal
Saúde Bucal 202
202
Epidemiologia
Epidemiologia 212
212
Saúde
Saúdeda
daCriança
Criançaeedo
doAdolescente
Adolescente 233
233
Gestão
Gestãodo
doTrabalho
TrabalhoeeEducação
Educaçãoem
emSaúde
Saúde 244
244
Saúde
SaúdeMental
Mental 248
248
Saúde
Saúdeda
daMulher
Mulher 249
249
Assistência
AssistênciaFarmacêutica
Farmacêutica 252
252
Sistemas,
Sistemas,Programas
ProgramaseePolíticas
Políticasem
emSaúde
Saúde 341
341
Alimentação e Nutrição
Alimentação e Nutrição 363
363
Avaliação de Tecnologias e Economia da Saúde
Avaliação de Tecnologias e Economia da Saúde 386386
Pesquisa Clínica 435
Pesquisa Clínica 435
Doenças Crônicas Não Transmissíveis 757
Doenças Crônicas Não Transmissíveis 757
Doenças Transmissíveis 1,279
Doenças Transmissíveis 1,279
0 200 400 600 800 1000 1200 1400
0 200 400 600 800 1000 1200 1400
Fonte: Ministério da Saúde. Pesquisa Saúde. Disponível em: https://bit.ly/3Ah5ldF.
Em uma busca pelos termos “avaliação” e “impacto” nos resumos das pesquisas,
verificou-se que em 38% constam pelo menos um dos termos e que em 5% (320
pesquisas) ambos os termos.
3
Na base de dados consultadas surgem mais três subagendas, além das 24: “Saúde materno-infantil”, a
partir de 2013, e “Desenvolvimento de Tecnologias e Inovação em Saúde” e “Economia e Gestão em
Saúde”, a partir de 2017. Outras seis subagendas também tiveram sua nomenclatura alterada.
72 Ministério da Saúde
Tabela 1 – Pesquisa Saúde 2002 a 2019 – resumos de
pesquisas com os termos “avaliação” e “impacto”
Total de Resumo com os termos "Avaliação" ou "Impacto"
Projetos de Resumo com os termos "Avaliação" ou "Impacto"
SubagendaSubagenda Total de % do "Avaliação" "Avaliação
Pesquisa Total "Avaliação" "Impacto"
Projetos Total e "Impacto" de impacto"
2002dea 2019
"Avaliação" e "Avaliação
Total 6,480 Total
Pesquisa 2,446% do38%"Avaliação"
1,448 672 "Impacto"
320 6
2002 a Total
Doenças Transmissíveis 1,279 368 29% 199 133
"Impacto"de 36
impacto"
2019
Doenças Crônicas Não
Total 6.480 2.446 27738%
757 1.448 173
37% 67277 320 27 6
Transmissíveis
Doenças Transmissíveis 1.279 368 29% 199 133 36 1
Pesquisa Clínica
Doenças Crônicas Não 757435 134
277 37% 31% 72
173 77 51 11
27 1
Transmissíveis
Avaliação de Tecnologias e Economia 435 134 31% 72 51 11
386 203 53% 119 43 41
daPesquisa
Saúde Clínica 386 203 53% 119 43 41
Avaliação edeNutrição
Alimentação Tecnologias e
363363 19719754%54% 111
111 53 53 32
32 1
Economia da
Sistemas, Programas e Políticas em 47% 20 1
Saúde 341341 160160 47% 103
103 36 36 20 1
Saúde
Alimentação e Nutrição 42% 12
252 20
Assistência Farmacêutica 252 10610629% 42% 7474 20 7
12 1
Sistemas, Programas e Políticas em 249 73 40% 51 15 18 1
Saúde da Mulher
Saúde 249 73 29% 51 15 7
248 100 42% 58 24 17
Saúde Mental 244 248 103 10038% 40% 58 1524 18
Assistência Farmacêutica 70 13
Gestão doda
Trabalho 233 30
Saúde Mulher e Educação em 244
88 40%
103 42% 70
45
15 12
17 1
Saúde
Saúde Mental 212 84 38% 42 29
18
Saúde da Criança e do Adolescente 202233 76 88 38% 4539 18 30 13 1
Gestão do Trabalho e Educação em 40% 6
191 76 47 23 3
Saúde
Epidemiologia 212 8423%40% 42 29 12 1
177 40 33 4 10
Saúde Bucal
Saúde da Criança e do Adolescente 202 39%
76 38% 39 18 18 1
162 63 22% 28 25 1
Promoção da
EpidemiologiaSaúde 191 76 40% 47 23 6
156 34 55% 32 1 10
Saúde Bucal
Complexo Produtivo da Saúde 129177 71 40 23% 33 134 3
43% 48 8
Promoção da Saúde
Ambiente, Trabalho e Saúde 128162 55 63 39% 28 21 25 10
4
42% 25
Complexo Produtivo da
Bioética e Ética na Pesquisa Saúde 96156 40 34 22% 32 131 13
37% 23
Ambiente, Trabalho e Saúde 7
Saúde do Idoso 84129 31 71 55% 4821 13 6
10
Bioética e Ética na Pesquisa 44% 3
Violência, Acidentes e Trauma 62128 27 55 43% 2518 21 84 1
Saúde do Idoso 40% 8
Comunicação e Informação em Saúde 50 96 20 40 42% 238 13 4
Violência, Acidentes e Trauma
Saúde dos Povos Indígenas 84 3142%37% 21 6 7 3
Comunicação e Informação em 24 1
10 4
Saúde da dos
Saúde Pessoa comIndígenas
Povos Deficiência 62 2754%44% 18 3 3 6
Saúde 13 7 3
Saúde da da Pessoa com
População NegraDeficiência
e das 40% 1
5 50 2 20 40% 8 1 8 4
Saúde da População
Comunidades Tradicionais Negra e das 50%
2
Comunidades Tradicionais 1 1
Desenvolvimento de Tecnologias e
Desenvolvimento de Tecnologias e 24 10 42% 4 6
Inovação
InovaçãoememSaúde
Saúde
Demografia
Demografia e Saúde
e Saúde 13 7 54% 3 3 1
Saúde Materno
Saúde Infantil
Materno Infantil 5 2 40% 1 1
Economia
Economia e Gestão
e Gestão em em Saúde
Saúde 2 1 50% 1
74 Ministério da Saúde
relacionadas ao desenho dos programas (27). Em seguida aparecem questões sobre
resultados (24), implementação (19), impacto (15) e governança (13) e 46 programas
haviam sido avaliados até o Ciclo 2021 (FEU et al., 2022). Essa importância das avaliações
de desenho mostra a centralidade de se conhecer melhor o objeto da avaliação,
aprofundando-se na elaboração desse tipo de avaliação e nas interações com os gestores
dos programas.
Outro ponto que chama atenção nessa análise dos autores é a centralidade do processo
orçamentário para o CMAP. Ao fazerem considerações sobre esse processo recomendam
mudanças ainda maiores nessa direção:
Essa questão tem sido um dos pontos centrais da discussão sobre os rumos que deve
tomar a avaliação no Centro de Governo. Uma PEC com o intuito de acabar com o PPA
chegou a ser elaborada, mas não foi aprovada. Contudo, isso mostra que essa é uma
discussão ainda em andamento e que pauta o debate sobre os rumos da avaliação no
âmbito do Executivo federal.
Com relação a questões mais diretamente ligadas à realização das avaliações, dois pontos
merecem destaque: (i) a clareza de que a seleção do objeto da avaliação (programa, ação,
plano orçamentário) demanda interações com os gestores e equipes técnicas nos órgãos
setoriais que atuam no que está sendo avaliado; (ii) após realizar essa seleção, para
aqueles programas ou ações que não tenham modelo lógico elaborado, essa pode ser uma
etapa importante do processo de avaliação: a realização de uma avaliação de desenho; (iii)
as avaliações deveriam ser um processo contínuo, ou seja, se existem questões relevantes
que não puderem ser respondidas em um ciclo do CMAP, mas que seriam importantes para
melhor compreensão dos resultados, o ciclo seguinte deveria incorporar a continuidade da
avaliação. Esse último caso é particularmente relevante quando há acesso a dados
restritos. A experiência do CMAP tem mostrado que entre a demanda, o acesso aos
Outro ponto relevante tanto para o CMAP quanto para as avaliações financiadas com
recursos do Ministério da Saúde é a elaboração de catálogos de planos, políticas,
programas e ações, incluindo-se as informações sobre o seu arcabouço legal, seu desenho,
relatórios de monitoramento, avaliações realizadas e seus resultados, bem como
disponibilizados os produtos entregues. O IPEA tem trabalhado em uma proposta de
catálogo a partir do SIOP, do PPA e das bases legais de ações, planos e programas para
apoiar, entre outros, os trabalhos realizados no âmbito do CMAP (BRITO; MELLO;
ALENCAR, 2022). Um grande desafio é estabelecer o diálogo entre a estrutura
orçamentária e do PPA e aquilo que os órgãos setoriais da saúde, particularmente o
Ministério da Saúde, denominam de programa, ação, iniciativa ou intervenção. De qualquer
76 Ministério da Saúde
forma, a elaboração de catálogos permitirá ampliar essas discussões e o diálogo entre as
avaliações no âmbito do CMAP e aquelas financiadas pelo Ministério da Saúde.
ALMEIDA, A. T. C.; VIEIRA, F. S.; SÁ, E. D de. Os Efeitos do acesso a medicamentos por
meio do Programa Farmácia Popular sobre a saúde de portadores de doenças crônicas
não transmissíveis. In: SACCARO, N.; ROCHA, W.; MATION, L. CMAP 2016 a 2018:
estudos e propostas do Comitê de Monitoramento e Avaliação de Políticas Públicas
Federais. Rio de Janeiro: IPEA, 2018. Disponível em: https://bit.ly/3zXLYWH. Acesso em:
5 jan. 2022.
BRASIL. Lei nº 10933, de 11 de agosto de 2004. Dispõe sobre o Plano Plurianual para o
período 2004/2007. Brasília, DF: Câmara dos Deputados, 2004a. Disponível em:
https://bit.ly/3f7qOPs. Acesso em: 5 set. 2022
78 Ministério da Saúde
da Economia, 2020a. (Nota Técnica SEI nº 1702/2020/ME). Disponível em:
https://bit.ly/3vzjP6Q. Acesso em: 15 dez. 2021.
BRITO, A.; MELO, J.; ALENCAR, J. Catálogo de políticas públicas: primeiros resultados
e hipóteses de pesquisa. Brasília, DF: IPEA, 2022. (Texto para Discussão, preliminar).
Disponível em: https://bit.ly/3MOhSuF. Acesso em: 29 set. 2022.
CASSIOLATO, M.; GUERESI, S. Como elaborar Modelo Lógico: roteiro para formular
programas e organizar avaliação. Brasília, DF: IPEA, 2010. (Nota Técnica n. 6, Disoc).
SACCARO, N.; ROCHA, W.; MATION, L. CMAP 2016 a 2018: estudos e propostas do
Comitê de Monitoramento e Avaliação de Políticas Públicas Federais. Rio de Janeiro:
IPEA, 2018. Disponível em: https://bit.ly/3zpCJyc. Acesso em: 5 jan. 2022.
80 Ministério da Saúde
Capítulo 3
1
Centro de Desenvolvimento e Planejamento Regional – CEDEPLAR/UFMG
RESUMO:
Este capítulo apresenta os principais indicadores para mensurar o estado de saúde individual ou
agregado. São discutidos o método de cálculo, fontes de dados, vantagens e limitações. O uso de
indicadores sociais é uma ferramenta importante para planejamento, formulação e acompanhamento
de políticas públicas. No Brasil, a avaliação de programas e políticas tem crescido, sobretudo devido
à ampla disponibilidade de bases de dados oficiais. Este capítulo contribui para esse debate à medida
que oferece um portfólio de métricas que podem ser facilmente incorporadas à definição de metas
e políticas.
PALAVRAS-CHAVE:
Indicadores de saúde. Medidas individuais. Mortalidade. Morbidade.
Umas das principais dificuldades em estudos que envolvem saúde é sua definição e
mensuração. Uma contribuição fundamental ocorreu em 1946 com a proposição da
Organização Mundial de Saúde (OMS), para a qual saúde é “um estado completo de bem-
estar físico, mental e social e não apenas a ausência de doença ou enfermidade” (WHO,
1946). Essa abordagem avança em relação à visão predominante na época que se
abordava a saúde como ausência de doença. Por ser holístico, o conceito proposto pela
OMS é capaz de considerar a multidimensionalidade presente no conceito de bem-estar
individual e social (PAHO, 2018). Embora bem aceita por diferentes stakeholders, essa
abordagem traz pelo menos duas dificuldades fundamentais. A primeira é tornar a
formulação de políticas de saúde um desafio quase intangível, à medida que as políticas
dificilmente terão a abrangência proposta. A segunda é a multidimensionalidade implícita
dificultar a sua mensuração, em virtude de isoladamente nenhuma medida ser capaz de
abarcar as múltiplas dimensões envolvidas no conceito de bem-estar (SEGRE; FERRAZ,
1997; BATISTELLA, 2007).
Existem diversos indicadores para mensurar a saúde, os quais permitem avaliar distintas
dimensões, desde as mais específicas, a exemplo de taxas de mortalidade por determinada
causa, até dimensões mais amplas que avaliam condições gerais de saúde (PAHO, 2018).
Os indicadores também se distinguem segundo o nível de análise, a depender da forma
como as informações de saúde são disponibilizadas, se no nível mais agregado – com
abrangência regional – ou desagregadas – até o nível do indivíduo. A escolha dependerá
dos objetivos dessa mensuração e da disponibilidade das informações. As medidas
agregadas se referem ao estado de saúde médio da população e permitem traçar o perfil
epidemiológico e o monitoramento das doenças na sociedade, além de contribuir para a
formulação de políticas públicas de saúde. As medidas individuais, por sua vez, por
propiciarem uma análise mais desagregada, fornecem um retrato da condição de saúde
individual. Além disso, a análise de sua distribuição permite avaliar a condição de saúde
entre diferentes grupos sociodemográficos e vai além de uma medida sintética média.
Esses indicadores podem contemplar dimensões diferentes da condição de saúde dos
indivíduos ou fatores de risco incluindo-se hábitos ou estilo de vida. Além dos indicadores
que medem o estado de saúde, é comum também avaliar a utilização e gastos com serviços
de saúde, determinantes importantes do estado de saúde da população (WHO, 2007;
TRAVASSOS; CASTRO, 2012).
82 Ministério da Saúde
Este capítulo tem como objetivo apresentar os principais indicadores de saúde e as bases
de dados disponíveis no Brasil. Além desta introdução, este capítulo está dividido em mais
7 seções. A próxima seção faz breve discussão das principais propriedades e atributos que
os indicadores devem apresentar. Na seção 3 apresentam-se as bases de dados e fontes
de informações disponíveis de saúde para o Brasil e abordam-se as principais pesquisas
considerando-se sua disponibilidade em um período mais recente e sua possibilidade de
comparação com outras pesquisas internacionais. As seções 4 e 5 discutem as medidas
individuais e agregadas, respectivamente, e apresentam-se as dimensões de saúde que
esses indicadores abordam, suas vantagens e limitações. A seção 6 trata dos indicadores
referentes à utilização e gastos com saúde; a seção 7 apresenta uma discussão acerca da
ênfase mais recente sobre análises de desempenho do sistema de saúde que envolvem os
aspectos de equidade e eficiência. Por fim, na seção 8, as considerações finais.
Os indicadores de saúde têm sido cada vez mais um instrumento fundamental de políticas.
A escolha dos indicadores, entretanto, precisa obedecer a determinados critérios. Jannuzzi
(2017) discute de forma abrangente os atributos básicos e as propriedades desejáveis dos
indicadores sociais. De acordo com o autor, os atributos básicos permitem melhor definição
dos indicadores, tais como referência conceitual, unidade de medida (por exemplo por
habitantes, em termos percentuais, por casos e anos de vida), unidade de análise (por
exemplo individual, familiar, agregado por municípios, estados, países), referência de
tempo ou período, abrangência territorial, fonte de dados e instituição responsável, uso,
significado e limitação. A referência conceitual diz respeito ao arcabouço teórico que
justifica a dimensão da saúde que está sendo analisada. Esse referencial não
necessariamente contempla uma estrutura de causalidade, mas remete a uma associação
entre o evento/condição de saúde e o indicador. Além do referencial teórico, a definição do
indicador está condicionada à sua capacidade e limitação na interpretação do fenômeno de
saúde mensurado.
A escolha dos indicadores, por sua vez, deve ser pautada pelas propriedades desejáveis
que esses devem atender. Jannuzzi (2017) elenca as seguintes propriedades: validade,
confiabilidade (qualidade do levantamento da informação), grau de cobertura, sensibilidade,
especificidade, reprodutibilidade, comunicabilidade, periodicidade de atualização, nível de
1
Essa seção está baseada em Jannuzzi (2017).
Até o final dos anos 2000, a PNAD era a principal pesquisa domiciliar no Brasil que
contemplava informações de saúde e era realizada por processo de amostragem,
com ampla cobertura nacional e periodicidade anual. A pesquisa coletava
informações detalhadas sobre os atributos individuais, tais como mercado de
84 Ministério da Saúde
trabalho, rendimentos e migração. A cada ano, a PNAD apresentava um suplemento
contendo informações sobre temas específicos; em 1981, 1986, 1988, 1998, 2003 e
2008 a saúde foi o tema abordado. Em 1981, 1986 e 1988 as perguntas presentes
nos suplementos referiam-se a características mais específicas da saúde, tais como
gravidez e parto, e à utilização dos serviços de saúde, sem conter informações mais
amplas que permitissem mensurar o estado de saúde dos indivíduos (ANDRADE,
2002; TRAVASSOS et al., 2008). Em 1998, 2003 e 2008 ampliou-se o questionário
do suplemento saúde e se forneceu um conjunto bastante detalhado do estado de
saúde dos indivíduos e informações sobre utilização e acesso aos serviços de saúde.
Em 2011, a PNAD foi substituída pela PNAD contínua; essa, além de alterar o seu
desenho amostral e periodicidade de coleta, não prevê a inclusão dos suplementos
relacionados com as informações sobre saúde, as quais passaram a ser coletadas
por meio da Pesquisa Nacional sobre Saúde (PNS), realizada pelo Ministério da
Saúde em parceria com o IBGE, sob a coordenação da Fiocruz. Além de guardar
certa comparabilidade com os suplementos de saúde da PNAD, a PNS ampliou o
conjunto de informações investigadas e incorporou medidas antropométricas,
mensuração da pressão arterial e coleta de amostras de sangue e de urina para
exames clínicos. Além disso, há um módulo referente à saúde do idoso e saúde da
mulher e gestante. A primeira PNS foi conduzida em 2013; a periodicidade prevista
de coleta das informações era quinquenal, no entanto, devido a problemas técnicos,
a segunda pesquisa foi realizada somente em 2019.
86 Ministério da Saúde
Survey (DHS), que envolve diferentes países e permite comparações internacionais.
Entretanto, no Brasil, a pesquisa foi conduzida em três pontos no tempo, a última
realizada há mais de 10 anos, em 2006 (BRASIL, 2009a; DHS, [2018]).
A PeNSE fornece dados sobre hábitos alimentares, prática de atividade física, saúde
sexual e reprodutiva e uso de tabaco, álcool e outras drogas por estudantes do 9º
ano do ensino fundamental de escolas públicas e privadas. A pesquisa foi iniciada
em 2009 e é realizada pelo IBGE e Ministério da Saúde com apoio do Ministério da
Educação. A partir de 2015 foi incluída uma amostra de escolares de 13 a 17 anos
de idade com a finalidade de permitir comparações internacionais, especificamente
com a pesquisa Global School-based Student Health Survey (GSHS), desenvolvida
pela OMS e realizada em diversos países da América, África, Europa, Ásia e Oceania
(IBGE, 2021a).
88 Ministério da Saúde
paciente (BRASIL, 2007b). O SIA foi amplamente estabelecido no país a partir de
1995. Os principais documentos de alimentação do sistema são a Autorização de
Procedimento de Alta Complexidade (APAC) e o Boletim de Produção Ambulatorial
(BPA). São disponibilizados dados dos procedimentos, custos e informações
demográficas dos pacientes (BRASIL, 2010).
As medidas clínicas são obtidas a partir de exames realizados por profissionais de saúde
ou por pesquisadores os quais são marcadores para o risco de desenvolvimento de
doenças crônicas ou eventos agudos (por exemplo, nível de estresse, inflamações). As
mais comumente utilizadas são medidas da pressão sanguínea e coleta de amostras de
sangue ou de saliva para a detecção de determinadas doenças. Apesar de serem medidas
90 Ministério da Saúde
mais objetivas, não estão livres de limitações. A primeira refere-se ao custo elevado de
coleta desses dados, sobretudo em pesquisas domiciliares com ampla cobertura geográfica
e populacional. A segunda limitação a que essas medidas também estão sujeitas são os
erros de mensuração. O diagnóstico da doença é sensível ao tipo de teste realizado, à
metodologia escolhida para definir os pontos de cortes e parâmetros referentes à
concentração da substância analisada, às condições que os indivíduos se encontravam no
momento da realização do exame e às condições de armazenamento do material coletado
(NATIONAL RESEARCH COUNCIL, 2000).
Dessa forma, a maior parte das pesquisas domiciliares, sobretudo aquelas de cobertura
geográfica mais ampla, baseiam-se na autopercepção dos indivíduos para se obterem
medidas sobre o seu estado de saúde. As principais medidas autorreportadas
compreendem três dimensões do estado de saúde: clínica, funcional e geral. A dimensão
clínica define a doença como um desvio de uma norma fisiológica. Nas pesquisas
domiciliares disponíveis para o Brasil, as principais medidas que permitem avaliar essa
dimensão referem-se à presença de doenças crônicas. As doenças comumente
investigadas são diabetes, hipertensão arterial sistêmica, doenças cardiovasculares,
doenças respiratórias como asma e bronquite, artrite/reumatismo, problemas de coluna e
doenças mentais como depressão e ansiedade. A declaração dessas doenças pelos
indivíduos entrevistados depende do acesso aos serviços de saúde, do estágio/evolução
da doença e da capacidade de identificar a enfermidade com base nos sintomas. Algumas
doenças podem ser detectadas por meio de sintomas amplamente conhecidos. No entanto,
em alguns casos, é necessário que o processo de deterioração do estado de saúde esteja
em um estágio mais avançado para que os sintomas sejam percebidos (NORONHA;
ANDRADE, 2006). A hipertensão, por exemplo, está associada a ocorrência de eventos de
pressão elevada enquanto a diabetes é uma doença crônica mais silenciosa, sem o
aparecimento de sintomas. Essas características resultam em uma autodeclaração da
diabetes bem inferior àquela observada para a hipertensão quando comparadas aos níveis
reais de prevalência esperados (SCHMIDT et al., 2009; SENA, 2017). No caso de
depressão, são utilizados instrumentos específicos que permitem classificar os indivíduos
segundo o grau de depressão a partir de uma lista de sintomas pré-definidos. Um
instrumento muito utilizado para rastrear risco de depressão na população geral é o Patient
Health Questionnaire (PHQ-9), um questionário simples e de fácil aplicação. O PHQ-9
apresenta nove questões e contempla os seguintes sintomas, definidos pelo Manual
Diagnóstico e Estatístico dos Transtornos Mentais (DSM-IV): humor deprimido, perda de
interesse ou prazer em realizar atividades cotidianas, distúrbios de sono, cansaço ou falta
92 Ministério da Saúde
comparativos entre diferentes localidades ou subgrupos populacionais. Além disso, essa
variável está sujeita a erros sistemáticos de declaração, uma vez que depende do conjunto
de informações que os indivíduos possuem ao avaliarem sua condição de saúde
(STRAUSS; THOMAS, 1998). Por exemplo, por terem menos acesso aos serviços de
saúde, os indivíduos das classes de renda mais baixa podem ter mais dificuldades para
avaliar de forma precisa seu estado de saúde e superestimar o percentual de pessoas
saudáveis nessa camada de renda.
Por fim, outro conjunto de indicadores que se baseia na autodeclaração dos indivíduos
refere-se aos hábitos e estilo de vida. Apesar de não serem medidas diretas do estado de
saúde, o monitoramento desses indicadores é importante por se constituírem fatores de
risco para o desenvolvimento de determinadas condições e morbidades (BRASIL, 2005;
STEYN; DAMASCENO, 2006). Em geral, são investigados o consumo de cigarro e de
bebidas alcoólicas, hábitos alimentares (medidos pelo consumo de determinados grupos
de alimentos), prática de exercícios físicos e comportamentos relacionados à saúde sexual
e reprodutiva.
Os indicadores agregados de saúde fornecem uma medida sintética que permitem avaliar
e monitorar o estado de saúde médio de uma população e podem ser construídos com base
em informações sobre mortalidade ou morbidade. O conhecimento do perfil epidemiológico
da população e sua trajetória é fundamental para a formulação de políticas de saúde de
forma a atender melhor às demandas e necessidades dos indivíduos de uma determinada
sociedade. Adicionalmente, o acompanhamento dos indicadores ao longo do tempo permite
avaliar e monitorar o desempenho das políticas de saúde implementadas (MALTA; SILVA,
2013; SILVA et al., 2020).
Uma pesquisa realizada pela Fundação Oswaldo Cruz (Fiocruz), em parceria com o
Ministério da Saúde, permitiu estimar a cobertura e o fator de correção dos registros
de óbitos e de nascidos vivos para os municípios brasileiros. Foi conduzida busca
ativa dessas informações em uma amostra de 129 municípios do nordeste e
Amazônia Legal. Os resultados, estimados com base nessa amostra, foram
posteriormente extrapolados para todos os municípios brasileiros. Para o Brasil, a
cobertura do SIM (para todos os grupos de idade) e do Sinasc é alta, acima de 90%.
Para os óbitos infantis, entretanto, a cobertura, além de mais baixa, apresenta
desigualdades importantes entre as regiões e municípios brasileiros
(SZWARCWALD et al., 2011). Enquanto no norte e nordeste, em média a cobertura
94 Ministério da Saúde
é igual a 69,4% e 73,1%, nas regiões sul e sudeste, esses percentuais são bem mais
elevados, em torno de 98% e 94%, respectivamente. Esses achados evidenciam que
a subnotificação dos óbitos infantis ainda é uma questão que precisa ser enfrentada
pelos gestores, sobretudo nas localidades mais pobres.
No Brasil, observou-se redução significativa na TMI de 162 para 83 mortes por mil
nascidos vivos entre 1930 e 1980, uma queda de quase 50% em um período de 50
anos. Essa queda foi constatada em todas as regiões do país e é explicada
principalmente por reduções nos óbitos ocorridos durante o período pós-neonatal
(VICTORA et al., 2011). Como consequência, os óbitos neonatais passaram a ser o
principal componente da mortalidade infantil. Em 2019, utilizando informações
disponibilizadas pelo SIM e Sinasc, a taxa de mortalidade infantil era igual a 12,4 por
mil nascidos vivos; as mortes neonatais responderam pela maior parte dos óbitos
entre crianças menores de um ano de idade (70%).
96 Ministério da Saúde
5.4 Razão de mortalidade materna
No Brasil, nas últimas décadas, houve redução importante nesse indicador devido
principalmente à implementação de políticas públicas direcionadas à saúde materna.
Essas políticas vêm sendo implementadas desde a década de 1980 e têm propiciado
melhorias de acesso ao cuidado pré-natal e aumento do número de partos realizados
em instituições apropriadas. Apesar dessas melhorias, os níveis atuais da RMM no
Brasil ainda permanecem em patamares elevados e chega a ser de 5 a 10 vezes
superior ao observado em países de alta renda (VICTORA et al., 2011). Entre 1990
e 2015, foi de 50% a redução observada nesse indicador no Brasil, abaixo da meta
estabelecida pelos Objetivos de Desenvolvimento do Milênio (ODM), que era de
70%. Estimativas para 2015 mostram que a RMM no país está em torno de 62 óbitos
maternos por 100.000 nascidos vivos. Esse valor está dentro da meta estabelecida
pelos Objetivos de Desenvolvimento Sustentável (ODS), que preconiza taxas
inferiores a 70 óbitos por 100.000 nascidos. No entanto, devido às grandes
disparidades observadas entre as regiões do país, algumas localidades ainda
apresentam valores superiores (BRASIL, 2018).
98 Ministério da Saúde
lista requer atualização periódica devido ao desenvolvimento de novas tecnologias
de saúde (MALTA et al., 2010a). Diversos estudos têm mostrado a importância das
causas evitáveis no Brasil, mas com redução nos últimos anos sobretudo nas regiões
com níveis mais elevado de desenvolvimento econômico (ABREU et al., 2007;
KANSO et al., 2013; MALTA et al., 2010b, 2018).
O AVAQ foi desenvolvido por Klarman et al. (1968) e definido como o número de
anos vividos em determinada condição de saúde ponderada pela sua respectiva
qualidade de vida. A qualidade de vida é mensurada a partir da escolha de um
instrumento específico. Entre os principais instrumentos, citam-se o EQ-5D,
desenvolvido pelo grupo Euroqol, o SF-36d, o SF-6D e o Whoqol (HAWTHORNE et
al., 2003; CRUZ, 2010). O EQ-5D e o SF-6D são os instrumentos mais utilizados no
Brasil. O primeiro descreve a saúde em cinco dimensões, com três níveis de
severidade possíveis, o que resulta em 243 estados de saúde possíveis; o segundo
são seis dimensões com quatro a seis níveis de severidade, o que resulta em 18000
estados de saúde. Para qualquer um desses instrumentos os pesos da qualidade de
vida são mensurados com base nas preferências em saúde dos indivíduos de
determinada sociedade. Essas preferências são obtidas a partir de questionários
individuais que permitem aos indivíduos valorarem estados de saúde distintos. As
técnicas utilizadas para avaliar os estados de saúde são fundamentadas na teoria
microeconômica. Em linhas gerais, a ideia subentendida no processo de valoração
é que existe um trade-off entre quantidade e qualidade de vida. Dessa forma, é
possível encontrar um número de anos de vida em perfeita saúde e um número de
anos de vida com alguma doença que iguala a utilidade dos indivíduos em cada um
desses estados. Os valores dos pesos podem variar entre zero e 1 e indicar o valor
de utilidade médio atribuído para morte e saúde plena respectivamente.
A demanda por serviços de saúde pode ser mensurada por indicadores de utilização ou de
gastos. No Brasil, esses indicadores são calculados principalmente a partir dos dados
administrativos para a produção ambulatorial e hospitalar, disponíveis por intermédio do
Sistema de Informações Ambulatoriais (SIA) e Sistema de Informações Hospitalares (SIH)
no Sistema Único de Saúde, respectivamente. Os indicadores de produção hospitalar são
mais confiáveis uma vez que cada internação financiada no SUS requer o preenchimento
de uma AIH. Essa exigência administrativa, torna os dados do SIH bastante adequados
para mensurar o quantitativo da produção hospitalar. A produção ambulatorial, por outro
lado, não requer a abertura de um registo administrativo específico para cada serviço
realizado e possibilita ao município fazer o lançamento da produção total ou desagregada.
Como as informações ambulatoriais ainda apresentam certa heterogeneidade na forma de
lançamento dos dados no sistema, os dados ambulatoriais são menos confiáveis e por isso
menos usados.
Além dos registros administrativos, a utilização de serviços de saúde pode ser mensurada
por meio das informações individuais disponíveis nas pesquisas domiciliares. A principal
pesquisa domiciliar para a construção de indicadores de utilização é a Pesquisa Nacional
em Saúde, que fornece informações sobre consultas e internações. A vantagem do uso da
PNS é a possibilidade de construção de indicadores considerando-se atributos individuais
tais como idade, sexo, local de residência, escolaridade, renda domiciliar. As pesquisas
domiciliares são fundamentais para investigar a relação entre os atributos individuais e a
demanda por serviços de saúde. Um dos recortes amplamente realizado é a presença de
cobertura de serviços de saúde que permite comparar a utilização e acesso aos serviços
de saúde para os beneficiários de planos de saúde e para os usuários do SUS (MACINKO;
LIMA-COSTA, 2012; ANDRADE et al., 2013; CASTRO et al., 2019). Essas análises são
fundamentais para subsidiar políticas públicas, sobretudo análises da equidade no acesso
e no estado de saúde.
O uso de indicadores de gasto com serviços de saúde é ainda pouco disseminado no Brasil.
Em parte, esse uso menos frequente se deve às limitações das fontes de dados disponíveis.
A principal fonte de dados para indicadores de gasto são os sistemas administrativos: SIH,
sistema APAC (Autorização de Procedimentos de Alta Complexidade) e SIA. Para todos
esses sistemas são registradas as despesas com procedimentos financiados pelo SUS. A
principal limitação dessas bases de dados, entretanto, deve-se à distorção dos preços
relativos dos serviços. O agregado do gasto ou despesa é resultado do produto entre o
Outra fonte de dados muito usada para a mensuração da utilização e gastos em serviços
de saúde no Brasil é a Pesquisa de Orçamentos Familiares (POF), a qual visa mensurar as
estruturas de consumo, dos gastos, dos rendimentos e parte da variação patrimonial das
famílias. Dessa forma, é possível traçar um perfil das condições de vida da população
brasileira a partir da análise de seus orçamentos domésticos, incluídos os gastos com
saúde. Além das informações diretamente associadas à estrutura orçamentária, várias
características dos domicílios e das famílias são investigadas, o que possibilita a análise
por outros fatores socioeconômicos (VIACAVA et al., 2006; MALTA et al., 2008; BOOING
et al., 2014; SANTOS et al., 2017). A primeira pesquisa de orçamentos familiares realizada
no Brasil ocorreu em 1974-1975 e se chamava Estudo Nacional de Despesa
Familiar (Endef). Desde então foram realizadas diversas edições da POF com frequência
relativamente periódica: POF 1987-1988, POF 1995-1996, POF 2002-2003, POF 2008-
2009 e POF 2017-2018. O desenho da amostra foi estruturado de modo a propiciar a
publicação de resultados para Brasil, grandes regiões (norte, nordeste, sudeste, sul e
centro-oeste) e, também, por situações urbana e rural. Para as UF, os resultados
contemplam o total e a situação urbana. Nas nove regiões metropolitanas e nas capitais
das unidades da federação, os resultados correspondem à situação urbana.
Fontes
Indicador Descrição Principais usos Limitações
principais
Medidas individuais de saúde
Padrão de
referências ou
VIGITEL, POF, Avaliação da ponto de corte
Características físicas
PNDS (DHS condição das medidas
Antropométricas dos indivíduos (ex.:
Brasil), SABE, nutricional e risco pode não refletir a
peso, altura, IMC)
ELSA de doenças condição de
grupos
específicos
continua
Fontes
Indicador Descrição Principais usos Limitações
principais
Indicadores de demanda por serviços de saúde
Dados
Produção ambulatorial e
ambulatoriais são
hospitalar (ex.:
menos confiáveis
consultas, internações) Acompanhament
devido a
o da demanda e
Utilização SIA, SIH, PNS heterogeneidade
acesso aos
na forma de
serviços de saúde
lançamento das
informações no
sistema
Despesas realizadas Fiscalização e
com procedimentos de planejamento do Distorção dos
Gasto saúde (ex.: gastos com SIA, SIH, POF uso dos recursos preços relativos
medicamentos e dos serviços
exames)
Avaliação do desempenho dos sistemas de saúde
Conhecimento Indicadores
Distribuição equitativa
das necessidades diferentes podem
de saúde e no
PNAD, PNS, de grupos levar a diferentes
Equidade acesso/utilização dos
SABE específicos para conclusões sobre
serviços (ex.: índice de
redução das a existência de
concentração)
diferenças desigualdades
Estimação
Avaliação da
Combinação de sensíveis às
relação entre os
indicadores de especificações do
resultados
Eficiência resultados e insumos SIOPS modelo
obtidos e os
utilizados no processo
recursos
de produção do cuidado
empregados
(ex.: gasto com saúde
per capita)
ASADA, Y.; KEPHART, G. Equity in health services use and intensity of use in Canada.
BMC Health Services Research, v. 7, n. 41, p. 1-12, 2007.
CALAZANS, J. A.; QUEIROZ, B. L. The adult mortality profile by cause of death in 10 Latin
American countries (2000–2016). Revista Panamericana de Salud Publica, v. 44, p. 1-9,
2020.
CASTRO, M. C. et al. Brazil's unified health system: the first 30 years and prospects for
the future. The Lancet, v. 394, n. 10195, p. 345-356, 2019.
IBGE. Tábuas completas de mortalidade para o Brasil 2020. Rio de Janeiro: IBGE,
2021b. (Nota técnica n. 01/2021). Disponível em:
https://static.poder360.com.br/2021/11/nota-tecnica-tabuas-de-mortalidade.pdf. Acesso
em: 8 set. 2022.
KANSO, S. et al. A evitabilidade de óbitos entre idosos em São Paulo, Brasil: análise das
principais causas de morte. Cadernos de Saúde Pública, v. 29, n. 4, p. 735-748, abr.
2013.
KROENKE, K.; SPITZER, R. L. The PHQ-9: a new depression diagnostic and severity
measure. Psychiatric Annals, v. 32, n. 9, p. 509-515, 2002.
O’DONNELL, O. et al. Analyzing health equity using household survey data: a guide
to techniques and their implementation. Washington, DC: World Bank, 2007. Disponível
em:https://openknowledge.worldbank.org/bitstream/handle/10986/6896/424800ISBN9780
11O FFICIAL0USE0ONLY10.pdf?sequence=1&isAllowed=y. Acesso em: 9 set. 2022.
SAN MARTÍN, J. L. et al. The epidemiology of dengue in the Americas over the last three
decades: a worrisome reality. The American Journal of Tropical Medicine and
Hygiene, v. 82, n. 1, p. 128-135, Jan. 2010.
SANTOS, M. et al. Guidelines for utility measurement for economic analysis: the brazilian
policy. Value in Health Regional Issues, v. 31, p. 67-73, 2022.
STEYN, K.; DAMASCENO, A. Lifestyle and related risk factors for chronic diseases. In:
JAMISON, D.T. et al. (org.). Disease and mortality in Sub-Saharan Africa. Washington,
DC: The World Bank, 2006. p. 247-65.
THE DHS Program Demografic ang Health Surveys. Rockville: DHS, [2018]. Disponível
em: https://dhsprogram.com/methodology/survey-search.cfm? sendsearch=1&str1=
49,&crt= 1&listgrp=0 . Acesso em: 22 jan. 2022.
VICTORA, C. G. et al. Maternal and child health in Brazil: progress and challenges. The
Lancet, v. 377, n. 9780, p. 1863-1876, 2011.
WORLD HEALTH ORGANIZATION. WHO methods and data sources for global
burden of disease estimates 2000-2019. Geneva: WHO, 2020. (Global Health
Estimates Technical Paper WHO/ DDI/DNA/GHE/2020.3). Disponível em:
https://cdn.who.int/media/docs/default-source/gho-documents/global-health-
estimates/ghe2019_daly-methods.pdf?sfvrsn=31b25009_7. Acesso em: 8 set. 2022.
informações de
Financiamento
Periodicidade
Abrangência
Tamanho da
Principais
Pesquisa
Objetivo
amostra
saúde
Ano
Nacional,
PNAD Conhecer as 112.434 grandes Estado de saúde,
1998, Ministério da
(Pesquisa características de domicílios/ regiões, cobertura privada Quinquenal
2003, Saúde / IBGE
Nacional por saúde da 344.975 Unidades da de saúde, acesso
2008
Amostra de população pessoas Federação e utilização de
Domicílio) (1998) (UF), regiões serviços de
133.255 metropolitanas saúde
domicílios/ e distrito
384.834 federal
pessoas
(2003)
150.591
domicílios/
391.868
pessoas
(2008)
Mensal
Cerca de Nacional e
PNAD COVID- 2020 Estimar o número Sintomas da (maio a Ministério da
193 mil grande
19 de pessoas com COVID-19 e nov.) / Saúde/ IBGE
domicílios regiões
sintomas da providências Semanal
por mês / 48
síndrome gripal e tomadas em (maio a
mil
monitorar os relação aos setembro)
domicílios
impactos da sintomas
por semana
pandemia da
COVID-19 no
mercado de
trabalho
Coletar 81.357
PNS 2013, informações domicílios / Estado de saúde, Quinquenal Ministério da
(Pesquisa 2019 sobre o 64.348 hábitos de vida, Saúde/IBGE/
Nacional de desempenho do entrevistas cobertura privada Fiocruz
Nacional,
Saúde) sistema de saúde (2013) e utilização de
grandes
e condições de 108.525 serviços de
regiões e UF
saúde da domicílios / saúde
população 90.846
entrevistas
(2019)
Tamanho
VIGITEL Monitorar a
amostral Nacional, Ministério da
(Vigilância de frequência e a Estado de saúde, Anual
mínimo de capitais e Saúde/
Fatores de 2006- distribuição de hábitos de vida,
2.000 distrito federal Secretaria de
Risco e 2020 fatores de risco e excesso de peso
adultos (18 Vigilância em
Proteção para proteção para e obesidade
anos ou Saúde
Doenças Doenças
mais) por
Crônicas por Crônicas em
cidade
Inquérito todas as capitais
Telefônico)
1987- Avaliar perfil das Nacional, Despesas com Desde Ministério da
POF
2018 condições de 48.470 grandes saúde, peso e 1995 a Saúde/IBGE
15.105 Contatos
ELSA Investigar Instituições Ministério da
2008- servidores/as Histórico médico, telefônicos
(Estudo doenças crônicas das regiões Saúde /
2010; de hábitos de vida e anuais com
Longitudinal de e fatores sul, sudeste e Secretaria de
2012- instituições realização de re-exames
Saúde do biológicos, nordeste Ciência,
2014; públicas de exames clínicos e
Adulto) comportamentais, (Fundação Tecnologia e
2017- ensino entrevistas
ambientais, Oswaldo Cruz Insumos
2019 superior e a cada 3-4
ocupacionais e / USP / UFBA Estratégicos /
pesquisa anos
sociais / UFES / Ministério de
com idade
UFMG / Ciência,
entre 35 e 74
UFRGS) Tecnologia e
anos
Inovação /
Decit / CNPq
/ FINEP/
Fiocruz-RJ /
USP / UFBA /
UFES /
UFMG /
UFRGS
Notas: * Elsi-Brasil é comparável internacionalmente aos estudos Health and Retirement Family of Studies,
realizados em diversos países da Europa e Ásia, nos EUA, México, Costa Rica, Nova Zelândia, África do Sul
e Gana.
†
SABE é comparável internacionalmente às pesquisas realizadas em Bridgetown (Barbados); Buenos Aires
(Argentina); Santiago (Chile); Havana (Cuba); Cidade do México (México) e Montevidéu (Uruguai).
‡
PNDS é comparável internacionalmente ao projeto Measure DHS (Demographic and Health Survey, que
tem apoio da Agência dos Estados Unidos para o Desenvolvimento Internacional (USAID) e parceria de várias
instituições internacionais.
§
PeNSE é comparável internacionalmente ao Global School-based Student Health Survey (GSHS) da OMS,
realizada com escolares de 13 a 17 anos.
Ano/ Principais
Registro Alimentação do
Periodicid Objetivo Abrangência informações de
Administrativo sistema
ade saúde
Registros Administrativos do Ministério da Saúde
Declaração de
Local de residência e
SIM Desde Óbito (DO)
Coletar dados Nacional, ocorrência do óbito;
(Sistema de 1975 / preenchidas pelas
sobre grandes regiões, óbitos fetais e não
Informação mensal e unidades
mortalidade UF e municípios fetais; condições e
sobre anual notificantes do
causas do óbito
Mortalidade) óbito
Declaração de
SINASC Desde Coletar dados Nascido Vivo Local e data do
(Sistema de 1990 / epidemiológicos (DN), preenchida Nacional, nascimento,
Informações mensal e referentes aos pelos profissionais grandes regiões, informações da
sobre Nascidos anual nascidos vivos da saúde ou UF e municípios gravidez e parto e do
Vivos) parteiras recém-nascido
tradicionais
autorizadas
Coletados pela
SINAN Ficha Individual de
Desde Registrar e Período e local da
(Sistema de Notificação (FIN) e
1990 / processar os Nacional, notificação e/ou
Informação de pela Ficha
mensal e dados sobre grandes regiões, agravo
Agravos de Individual de
anual agravos de UF e municípios
Notificação) Investigação (FII),
notificação
preenchidas pelas
compulsória
unidades
assistenciais para
cada paciente
Autorização de
Nacional,
Internação
SIH Desde Registrar grandes regiões, Informações da
Hospitalar (AIH)
(Sistema de 1981 / internações UF e municípios hospitalização; valor
preenchida pelo
Informações mensal e hospitalares e das AIH;
hospital após a
Hospitalares) anual financiadas pelo estabelecimento procedimentos
alta hospitalar e
SUS s realizados na
enviada para a
internação
Secretaria de
Saúde municipal
ou estadual
O BPA (Boletim
de Produção
SIA Desde Nacional, UF, Dados do paciente,
Processamento Ambulatorial) é
(Sistema de 1992 / municípios e estabelecimento e
das informações preenchido pelo
Informações mensal e estabelecimento procedimentos
de atendimento estabelecimento
Ambulatoriais) anual s
ambulatorial de saúde. Nos
financiados pelo procedimentos de
SUS alta complexidade,
as informações
são coletadas
através da APAC
(Autorização de
Procedimentos de
Alta
Complexidade)
Padronizar a As operadoras
Conteúdo e
TISS troca de precisam enviar
estrutura, 2)
(Troca de informações mensalmente Nacional, UF
2007 / Representação de
Informações na entre informações como
mensal conceito em saúde,
Saúde operadoras de demonstrativos de
3) Comunicação, 4)
Suplementar) planos de saúde pagamento, de
Segurança e 5)
e prestadores análise de contas
Organizacional
de serviços de e recursos de
saúde sobre os glosa
procedimentos
realizados
1
Cátedra Ruth Cardoso do Insper, Faculdade de Administração, Economia e
Contabilidade da Universidade de São Paulo e Academia Brasileira de Ciências.
2
Cátedra Ruth Cardoso do Insper.
RESUMO:
Neste capítulo, o objetivo é colocar os conceitos fundamentais para o entendimento do que é uma
avaliação de impacto e fazer um panorama da literatura empírica sobre avaliação de políticas sociais
no Brasil. Em primeiro lugar, será introduzida brevemente a noção de avaliação de impacto e se
discutirá o que é uma avaliação, quais são seus fundamentos e elementos centrais e quais são os
motivos para fazê-la. Além disso, para mostrar o desenvolvimento dessa literatura no Brasil, será
elaborado um levantamento de estudos empíricos que realizaram avaliações de impacto utilizando
alguma das metodologias discutidas neste livro, as quais permitem isolar o efeito causal a partir de
hipóteses de identificação. O foco será o levantamento de políticas sociais direcionadas à educação
e ao mercado de trabalho e políticas federais de transferência de renda; serão interpretados os fatos
estilizados e conclusões obtidas.
PALAVRAS-CHAVE:
Avaliação de impacto. Conceitos. Efeito causal.
Este capítulo caracteriza o que são avaliações de programas sociais que utilizam dados
quantitativos e discute brevemente sua relevância e os fundamentos lógicos que sustentam
a sua realização. Mostra também o desenvolvimento da literatura de avaliação ao trazer
um levantamento de trabalhos que utilizam metodologias discutidas neste livro e que
permitem isolar o efeito causal dos programas sociais analisados a partir de algumas
hipóteses de identificação. Realizou-se levantamento cujo foco são três das principais
políticas públicas das áreas de transferência de renda, educação e mercado de trabalho.
1
Políticas públicas voltadas à área da saúde, por exemplo, podem ser avaliadas em relação a seus efeitos
sobre indicadores como aqueles descritos no capítulo 3 deste livro.
Podem-se se usar evidências como essas para a tomada de decisões. Por exemplo,
poderiam ser ampliados os programas cujos benefícios superam seus custos e que
entregam mais benefícios do que programas alternativos para cada unidade de custo,
enquanto poderiam ser reduzidos ou substituídos os que trazem menos benefícios do que
seus custos. As avaliações podem ajudar também a se decidir sobre a manutenção de
inovações de desenho de programa ou formas alternativas de se implementá-lo.
Nesse sentido, as avaliações de impacto fazem parte de uma estrutura mais ampla de
implementação de políticas públicas baseadas em evidências (PPBE), com o objetivo de
melhorar a qualidade do gasto público, a qual tem sido incorporada ao processo de gestão
das políticas federais (BRASIL, 2018). As PPBE compõem um conjunto de análises e
procedimentos baseados no uso da melhor evidência disponível sobre os resultados de um
programa para guiar o processo de tomada de decisão política, com os objetivos de reduzir
gastos desnecessários, expandir programas inovadores e aumentar a transparência (PEW-
MACARTHUR, 2014).
Com programas sociais em mente, pode-se considerar dois tipos de ações: um mais ativo
– que é o de participar do programa em dado momento (o qual também se chama
tratamento) – e um mais passivo – que seria não participar do mesmo programa naquele
mesmo momento (o qual chamamos controle). Uma unidade de análise possui um resultado
possível que deriva de cada uma dessas ações. A esses chamamos resultados potenciais,
nome que se deve ao fato fundamental de que – em determinado momento posterior à
realização da ação – somente o resultado potencial associado à ação realizada será
concretizado e somente será possível observar esse resultado. Para maior precisão, para
cada unidade o tratamento será representado por uma variável que indica a participação
no programa social 𝑊𝑊, o qual assumirá o valor 1 quando houve participação e valor 0
quando não houve. Além disso, o resultado realizado de cada unidade será representado
pela variável numérica 𝑌𝑌 e os resultados potenciais por 𝑌𝑌! – quando houve participação –
e por 𝑌𝑌" – quando não houve.
O resultado contrafactual, no entanto, não pode ser observado. Dessa forma, quando se
quer estimar o efeito causal do programa, o problema central é o de que não é possível
observar os dois potenciais resultados simultaneamente, fato também chamado problema
fundamental da inferência causal. De outra forma, faltam dados (do inglês missing data) e
Na prática, para estimar esses parâmetros com dados observados, pode-se tentar estimar
o parâmetro da diferença de médias dos resultados observados. No entanto, há uma
diferença entre esse parâmetro e o ATE e o ATT, os quais são vieses introduzidos quando
os resultados potenciais possuem alguma associação com o tratamento. De outra forma,
se os resultados potenciais dos grupos tratados em média não são iguais, essa diferença
faz com que haja um viés.
Nesse ponto, fica claro que para haver capacidade de se estimar o ATE e o ATT sem viés,
precisa-se entender como o tratamento é atribuído às unidades, ou seja, é preciso saber
por que algumas unidades participam do programa e outras não. Essa forma de atribuição
do tratamento é chamada de mecanismo de seleção, de acordo com o qual é preciso usar
uma metodologia econométrica específica para se estimarem aqueles parâmetros. As
metodologias abordadas nesse livro lidarão com diferentes mecanismos, com hipóteses
específicas sobre os dados para a identificação dos efeitos dos programas.
Nesta seção, breve panorama da literatura de avaliação de impacto de políticas será trazido
nas áreas de transferência de renda, educação e mercado de trabalho. Para cada área
selecionou-se um programa federal relevante e realizou-se o levantamento de artigos e
working papers que trazem avaliações de impacto. Utilizou-se como critério principal na
seleção daqueles estudos o uso de metodologias que realizam comparações explícitas
entre grupos de tratamento e de controle – ou de regressões que controlam por uma série
de variáveis – ou seja, exercícios empíricos que fazem a comparação entre os grupos
afetados ou não pela política, mantendo-se constantes uma série de características nos
dois grupos.2
2
Para mais detalhes sobre a metodologia da análise de regressão ver capítulo 21 desse livro.
Para ter direito ao benefício do PBF, uma família deveria ser incluída pelos
governos municipais que aderiram ao programa no Cadastro Único (Cadúnico).
Além disso, o nível de renda familiar per capita das famílias deveria ser inferior à
linha de pobreza extrema do programa (R$ 89 em 2021) ou inferior à linha de
pobreza (R$ 178 em 2021)6 e incluir crianças e jovens de até 17 anos de idade,
nutrizes ou grávidas. As famílias incluídas como extremamente pobres receberiam
um benefício básico (de R$ 89 mensais em 2021). Além disso, todas as famílias
pobres ou extremamente pobres poderiam receber um benefício variável para
cada criança ou jovem de até 15 anos de idade, nutriz ou grávida, até o limite de
cinco benefícios por família (cada benefício de R$ 41 em 2021). A partir de 2008,
as famílias compostas por jovens de 16 ou 17 anos de idade poderiam ainda
receber um benefício variável para cada jovem (de R$ 48 em 2021), até o limite
de dois por família. A informação do Cadúnico era atualizada e verificada a cada
dois anos e as famílias poderiam sair do PBF caso recebessem transferências de
outros programas ou não mais se encaixassem no perfil do PBF.
3
O PBF foi criado por meio da Medida Provisória nº 132 e instituído em 2004 por meio da Lei nº 110.836 de
9 de janeiro de 2004. O programa foi posteriormente regulamentado por vários decretos ao longo dos anos.
4
O Programa de Renda Mínima vinculada à Educação (também chamado de Bolsa Escola Federal), o
Programa Nacional de Acesso à Alimentação (também chamado de Cartão Alimentação), o Programa
Nacional de Renda Mínima vinculado à Saúde (também chamado de Bolsa Alimentação), o Programa
Auxílio Gás e, a partir de 2005, também o Programa de Erradicação do Trabalho Infantil (PETI).
5
O PBF foi extinto em novembro de 2021 pelo Decreto nº 10.852 de 2021, que instituiu o Auxílio Brasil.
6
Os valores nominais das linhas de pobreza e pobreza extrema foram sendo atualizados ao longo dos
anos. Para valores até 2019, veja Neves et al. (2020, p. 5).
7
Para discussão mais detalhada sobre metodologias experimentais, ver o capítulo 10 desse livro.
3.1.2 Consumo
Outro ramo da literatura investiga como o PBF impacta o consumo e a nutrição das
famílias. O aumento da renda disponível pode aumentar o gasto de consumo das
famílias, porém, essa relação não é imediata, considerando-se que essas poderiam
alterar outros comportamentos, como a oferta de trabalho e a poupança. Além do
nível do consumo, o PBF poderia alterar sua composição, como o aumento da
aquisição de bens não essenciais e que não se relacionam com a redução da fome
ou desnutrição (OLIVEIRA et al., 2007).
8
A metodologia de PSM consiste, em linhas gerais, em construir um grupo de comparação a partir das
famílias não beneficiárias que possuem características observáveis semelhantes às das beneficiárias. Ver
capítulo 11 desse livro para maiores detalhes.
3.1.4 Educação
9
Vários dos estudos discutidos nesta subseção utilizam indicadores e bases de dados discutidos no
capítulo 3 desse livro. Estudos que usam indicadores agregados de mortalidade, como a taxa de
mortalidade por suicídio (ALVES; MACHADO; BARRETO, 2019), taxa de mortalidade de crianças menores
de 5 anos (RASELLA et al., 2013; RASELLA et al., 2021; MALERBA, 2018) ou a taxa de mortalidade infantil
(SHEI, 2013) utilizam dados do Sistema de Informação sobre Mortalidade (SIM). Os estudos que calculam
taxas de mortalidade infantil ou de crianças também utilizam dados do Sistema de Informação sobre
Nascidos Vivos (SINASC). Outros estudos usam dados do Sistema de Informação de Agravos de
Notificação (Sinan) para construir o indicador agregado de incidência de tuberculose (NERY et al., 2017) ou
para construir uma variável indicadora de cura de tuberculose (TORRENS et al., 2015). Há ainda estudos
cujas fontes de dados não são tipicamente de estudos de saúde, mas que utilizam indicadores de saúde
como o IMC cf. Batistella (2012), com dados da POF/IBGE) ou medidas antropométricas cf. Neto e Barriel
(2017), com dados da POF/IBGE, e Brauw et al. (2012), com dados das pesquisas de linha de base do
PBF).
10
As taxas de aprovação e de abandono são calculadas em relação ao total de matrículas no início do ano.
A distorção idade-série é a proporção de crianças e jovens com atraso escolar dentro de algum grupo de
idade ou grau escolar. O atraso escolar normalmente é definido como a situação em que a criança possui
dois anos a mais do que a idade ideal mínima para estar em cada série.
O PBF pode ainda ter efeitos sobre o comportamento criminal entre jovens, por
intermédio dos efeitos sobre frequência à escola e alocação de tempo sem estudos
3.2 Fundeb
O Fundeb foi criado com caráter temporário (mantido de 1998 a 2006),11 como uma
solução de financiamento no contexto de correção de fluxo do ensino fundamental
no início dos anos 1990 e constitui uma série de fundos (uma para cada unidade
federativa) formados a partir de transferências entre entes federativos e com regras
de uso dos recursos disponíveis para financiar a educação. Os estados e municípios
transferem parcelas de suas receitas tributárias e das transferências federais do
Fundo de Participação dos Estados (FPE) e dos Municípios (FPM) para os fundos
dos respectivos estados. Há então a redistribuição dos recursos dentro de cada
11
O Fundef foi instituído pela Lei nº 9.424 de 1996.
12
Os valores arrecadados pelos estados com os menores valores por aluno e a redistribuição dos recursos
federais determinam o valor mínimo que deve ser gasto por estudante. Para mais detalhes, ver Hirata, Melo
e Oliveira (2020).
13
Os recursos tinham como origem percentuais das receitas tributárias do ICMS (Imposto sobre Circulação
de Mercadorias e Serviços), do IPI (Imposto sobre Produtos Industrializados) proporcional às exportações,
além de percentuais dos Fundos de Participação dos Estados (FPE) e dos Municípios (FPM).
14
O Fundeb foi instituído pela Emenda Constitucional nº 53 de 2006 e regulamentado pela Lei 11.494 de
2007 e pelo decreto 6.253 de 2007.
15
O Fundeb é composto por parcelas do ICMS, ITR (Imposto sobre a Propriedade Rural), ITCMD (Imposto
de Transmissão Causa Mortis e Doação), FPE, FPM, IPVA (Imposto sobre Propriedade de Veículos
Automotores), IPI exp. e Desoneração de Exportações.
16
O Novo Fundeb foi instituído pela Emenda Constitucional 108 de 2020 e regulamentado pela Lei 14.113
de 2020.
17
Para mais informações sobre a metodologia de variáveis instrumentais, veja o capítulo 14 deste livro.
Em relação aos efeitos sobre indicadores de fluxo, a literatura mais recente tem
encontrado resultados de melhoria do fluxo escolar com o Fundef/Fundeb. Apesar
de resultados iniciais não conclusivos (FRANCO; MENEZES FILHO, 2011), há
evidências de efeitos negativos do Fundeb sobre a distorção idade-série (CRUZ;
ROCHA, 2018) e de que desvios dos recursos daquele programa por corrupção
aumentam as taxas de abandono e de reprovação (FERRAZ; FINAN; MOREIRA,
2012).
18
A política de desoneração da folha de pagamentos foi incluída na Medida Provisória (MP) 540 de 2011,
transformada na Lei 12.546 de 2011. Aquela política foi posteriormente alterada por diversas leis e decretos.
A desoneração de folha tinha validade até 2014, prazo que foi expandido, porém
com modificações nas regras do programa. A partir de 2015 a adesão se tornou
voluntária e, a partir de 2017, a abrangência setorial foi reduzida para os setores de
transportes, construção civil e comunicações. A nova versão do benefício seria
encerrada no fim de 2021, mas foi ampliada por mais dois anos.21
19
As alíquotas foram reduzidas para respectivamente 1% e 2% no primeiro ano de vigência da política pela
Lei 12.715 de 2012.
20
Os setores inicialmente selecionados foram de indústria de confecção, de artefatos de couro e calçados,
serviços de tecnologia da informação, tecnologia da informação e comunicação e serviços de call center cf.
Dallava ( 2014).
21
Expansão instituída pela Lei 14.288 de 2021.
22
Os estudos levantados exploram essas variações com estimações pelo método de diferenças em
diferenças. Maiores detalhes sobre essa metodologia podem ser encontrados no capítulo 12 deste livro.
O trabalho de Carmo (2012) usa dados no nível de pessoas de 2011 e 2012 e que
incluem tanto o mercado formal quanto o informal para avaliar os efeitos da política
de desoneração. A autora não encontra efeitos significantes nem sobre o grau de
formalização nem sobre a realocação da mão de obra entre atividades econômicas.
4 Conclusão
ALVES, F. J. O.; MACHADO, D. B.; BARRETO, M. L. Effect of the Brazilian cash transfer
programme on suicide rates: a longitudinal analysis of the Brazilian municipalities. Social
Psychiatry and Psychiatric Epidemiology, v. 54, n. 5, p. 599–606, 2019. DOI: 10.1007/
s00127-018-1627-6.
ANDRADE, M. V. et al. Income transfer policies and the impacts on the immunization of
children: the Bolsa Família Program. Cadernos de Saúde Pública, v. 28, n. 7, p.1347-
1358, 2012. Disponível em: http://www.scielosp.org/pdf/csp/v28n7/13.pdf. Acesso em: 22
ago. 2022.
ARAÚJO, G. S.; RIBEIRO, R.; NEDER, H. D. Impactos do Programa Bolsa Família sobre
o trabalho de crianças e adolescentes residentes na área urbana em 2006. Economia, v.
11, n. 4, p. 57-102, dez. 2010. Disponível em: http://www.anpec. org.br/revista/ vol11/
vol11n4p5 7_ 102.pdf. Acesso em: 24 ago. 2022.
BRASIL. VIS Data - Base de dados online. Brasília, DF: Secretaria de Avaliação e
Gestão da Informação-SAGI, 2022. Disponível em:
https://aplicacoes.mds.gov.br/sagi/vis/data3/data-explorer.php.
BRAUW, A. et al. Bolsa Família and household labor supply. Economic Development
and Cultural Change, v. 63, n. 3, p. 423–457, 2015. DOI: https://doi.org/10.1086/680092.
BRAUW, A. et al. The impact of Bolsa Família on schooling. World Development, v. 70,
p. 303-316, 2015. DOI: https://doi.org/10.1016/j.worlddev.2015.02.001.
BRAUW, A. et al. The impact of Bolsa Familia on child, maternal, and household
welfare. Washington, D.C: IFPRI, 2012.
CARMO, A. S. et al. Influence of the Bolsa Família Program on nutritional status and food
frequency of schoolchildren. Jornal de Pediatria, v. 92, n. 4, p. 381-387, 2016. DOI:
http://dx.doi.org/10.1016/ j.jped.2015.10.008.
CHAUVIN, J. P. Public education investment and local labor markets: evidence from a
large Federal Program in Brazil. Washington, D.C: Inter-American Development
Bank/Department of Research and Chief Economist, 2018. (Discussion paper, IDB-DP nº
606). Disponível em: https://publications.iadb.org/en/public-education-investment-and-
local-labor-markets-evidence-large-federal-program-brazil. Acesso em: 25 ago. 2022.
CHIODA, L.; MELLO, J. M. P. de; SOARES, R. R. Spillovers from conditional cash transfer
programs: Bolsa Família and crime in urban Brazil. Economics of Education Review, v.
54, p. 306-320, 2016. DOI: https://doi.org/10.1016/j.econedurev.2015.04.005.
CRUZ, T.; SILVA, T. Minimum spending in education and the flypaper effect. Economics
of Education Review, v. 77, Aug. 2020. DOI: https://doi.org/ 10.1016/ j.econedurev. 2020.
102 012.
CRUZ, G.; ROCHA, R. Efeitos do FUNDEF/B sobre frequência fscolar, fluxo fscolar e
trabalho infantil: uma análise com base nos censos de 2000 e 2010. Estudos
Econômicos, v. 48, n. 1, p. 39-75, mar. 2018.
DUARTE, G. B.; SAMPAIO, B.; SAMPAIO, Y. Programa Bolsa Família: impacto das
transferências sobre os gastos com alimentos em famílias rurais. Revista de Economia e
Sociologia Rural, v. 47, n. 4, p. 903-918, 2009. DOI: https://doi.org/10.1590/S0103-
20032009000400005.
ECONOMIC COMMISSION FOR LATIN AMERICA AND THE CARIBBEAN. Report on the
economic impact of coronavirus disease (COVID-19) on Latin America and the Caribbean.
2020a. Disponível em:https://repositorio.cepal.org/bitstream/handle/11362/ 45603/1/
S2000312_en.pdf. Acesso em: 25 dez. 2022.
ECONOMIC COMMISSION FOR LATIN AMERICA AND THE CARIBBEAN. The social
challenge in times of COVID-19. 2020b. (Special Report COVID-19, n. 3). Disponível em:
https://repositorio.cepal.org/handle/11362/45544?locale-attribute=en. Acesso em: 25 dez.
2022.
FERRAZ, C.; FINAN, F.; MOREIRA, D. B. Corrupting learning. Evidence from missing
federal education funds in Brazil. Journal of Public Economics, v. 96, n. 9-10, p. 712-
726, 2012. DOI: https://doi.org/10.1016/j.jpubeco.2012.05.012.
HADDAD, M. A.; FREGUGLIA, R.; GOMES, C. Public spending and quality of education in
Brazil. Journal of Development Studies, v. 53, n. 10, p. 1679-1696, 2017. DOI: https://
doi.org/10.1080/00220388.2016.1241387.
MATTOS, E.; POLITI, R.; YAMAGUCHI, A. Grants and dispersion of local education
spending in Brazil. Regional Studies, v. 52, n. 2, p. 239-249, 2018. DOI: https://doi.org/
10.1080/00343404.2017.1287891.
MELO, A. S. S. D. A.; STARZEC, C.; GARDES, F. The “ Bolsa-Família” Program and the
Food Insecurity in Brazilian household between 2009 and 2013. In: ENCONTRO
NACIONAL DE ECONOMIA, 44., 2013, Foz do Iguaçu. Anais [...]. Foz do Iguaçu:
ANPEC, 2013. 19 p. Disponível em: https://www.anpec.org.br/encontro/2016/submissao/
/files_I/i5-15947443edc6e1498446b776165267a7.pdf. Acesso em: 26 ago. 2022.
NEVES, J. A. et al. The Brazilian cash transfer Program (Bolsa Família): a tool for
reducing inequalities and achieving social rights in Brazil. Global Public Health, v. 0, n. 0,
p. 1-17, 2020. DOI: https://doi.org/10.1080/17441692.2020.1850828.
PAES DE BARROS, R.; LIMA, L. Avaliação de impacto de programas sociais: por que,
para que e quando fazer? In: MENEZES FILHO, N. A.; PINTO, C. C. de X. (orgs.).
Avaliação econômica de projetos sociais. 3. ed. São Paulo: Fundação Itaú Social,
2016.
PAIVA, L. H.; SOARES, F. V.; VIANA, I. A. V.; CIRENO, F.; DURAN, A. C. The effects of
conditionality monitoring on educational outcomes: evidence from Brazil’s Bolsa Família
Programme. Brazilian Political Science Review, v. 15, n. 1, p. 1-39, 2021. DOI:
https://doi.org/10.1590/1981-3821202100010001.
RAMOS, D. et al. Conditional cash transfer program and child mortality: A cross-sectional
analysis nested within the 100 million brazilian cohort. PLoS Medicine, v. 18, n. 9, p. 1-20,
2021. DOI: https://doi.org/10.1371/journal.pmed.1003509.
ROUGIER, E.; COMBARNOUS, F.; FAURÉ, Y. A. The “Local Economy” effect of social
transfers: an empirical assessment of the impact of the Bolsa Família Program on local
productive structure and economic growth. World Development, v. 103, p. 199-215,
2018. DOI: https://doi.org/10.1016/j.worlddev.2017.09.019.
SHEI, A. Brazil’s conditional cash transfer program associated with declines in infant
mortality rates. Health Affairs, v. 32, n. 7, p. 1274-1281, 2013. DOI: https://doi.org/
10.1377/hlthaff.2012.0827.
SILVEIRA, F. G.; Van HORN, R.; CAMPOLINA, B. A substitute for substitution: Bolsa
Família’s effects on the combination of work and school for children and adolescents aged
10-18. Brasília: International Policy Centre for Inclusive Growth (IPC - IG), 2013. 27p.
Disponível em: https://ipcig.org/sites/default/files/pub/en/IPCWorkingPaper121.pdf? page=
73d9cd4d54. Acesso em: 26 ago. 2022.
TAVARES, P. A. Efeito do Programa Bolsa Família sobre a oferta de trabalho das mães.
Economia e Sociedade, v. 19, n. 3, p. 613-623, 2010. DOI:
https://doi.org/10.1590/s0104-06182010000300008.
Isabela Furtado1
Carolina Marinho1
Carolina Melo1
1
Insper - Instituto de Ensino e Pesquisa
RESUMO:
A teoria da mudança é uma ferramenta útil para o desenho, monitoramento e avaliação de programas.
Por meio de uma sequência lógica descreve como os resultados almejados por uma intervenção
podem ser alcançados. Este capítulo tem como objetivo informar o gestor público, o avaliador ou a
parte interessada no processo de desenho, monitoramento e avaliação de uma política ou programa
sobre a definição, utilidade e método de construção de uma teoria da mudança. Por fim, para ilustrar
os conceitos apresentados, a última seção do capítulo apresenta um exemplo prático.
PALAVRAS-CHAVE:
Teoria da mudança. Cadeia de resultados. Desenho e avaliação de políticas e programas.
Muitas vezes, políticas públicas são apresentadas para a sociedade sem que seus
resultados sejam acompanhados e mensurados (CRUMPTON et al., 2016). Porém, tão
importante quanto lançar e implementar uma intervenção é realizar seu desenho,
monitoramento e avaliação de impacto de forma adequada. Do ponto de vista da gestão, o
monitoramento permite revelar se a intervenção está sendo (ou foi) implementada conforme
seu protocolo pré-estabelecido, enquanto a avaliação de impacto busca mensurar
justamente os efeitos do programa e medir os efeitos causais da intervenção sobre os
resultados de interesse. O monitoramento é importante para a avaliação, pois, sem esse,
não se sabe o que foi de fato entregue aos beneficiários.
É, então, por meio do monitoramento e de uma avaliação de impacto que policy makers
terão os elementos necessários para verificar se o programa atingiu os efeitos esperados,
e, a partir de uma análise custo-benefício ou custo-efetividade, compreender se realizaram
um bom investimento e se, portanto, o programa deve ser continuado – condicionado ou
não a um redesenho – expandido ou cancelado. Do ponto de vista da sociedade programas
que contam com desenho, monitoramento e avaliação bem estruturados são mais
transparentes e permitem o conhecimento do grau de assertividade das decisões dos
gestores.
Este capítulo está dividido em 4 seções além desta introdução. Na segunda seção o
conceito de teoria da mudança será exposto detalhadamente, assim como sua origem e
sua estrutura. Na terceira seção, será abordada a utilidade da ferramenta, expondo-se os
principais agentes que se beneficiam da teoria da mudança. Na quarta seção, será
explicado como a teoria da mudança deve ser construída. Por fim, na última seção, se
evidenciará um exemplo prático de aplicação da teoria da mudança, que será fundamental
para que os principais conceitos sejam expostos e trabalhados.
A teoria da mudança pode ser representada de diversas maneiras, com diferentes níveis
de complexidade e aprofundamento da cadeia de processos, atividades e indicadores de
resultado. Para avaliação de impacto de projetos sociais complexos, e particularmente os
projetos de saúde, a teoria da mudança é muitas vezes representada por diagramas ou por
1
Por exemplo, para que se atinja determinado objetivo de saúde pública em áreas urbanas vulneráveis,
determinada intervenção pode envolver não somente uma intervenção isolada, mas um conjunto de ações
nos campos da educação, infraestrutura básica e moradia (FUNDAÇÃO TIDE SETÚBAL; ITAÚ SOCIAL;
INSPER METRICIS, 2021).
2
As teorias de mudança social estão relacionadas à corrente de pensamento do educador Paulo Freire, que
argumentava pela combinação de teoria e ação para se criar uma mudança social.
Não há consenso na literatura sobre quais são as características de uma “boa teoria da
mudança”, porém, segundo Mayne (2017), essa deve apresentar um modelo bem
3
Usualmente são também conhecidos como “Efeito” ou “Impacto”, porém por serem resultados pretendidos
preferimos as nomenclaturas “Resultados finais ou Resultados à sociedade” já que a definição de impacto
está ligada ao efeito causal propriamente dito. Quando se mapeia resultados em uma teoria da mudança,
mapeia-se potenciais resultados causais, que não podem ser considerados impactos até que seja feita uma
avaliação rigorosa que confirme-os como tais (INSPER METRICIS, 2022).
4
O conceito de longo prazo, neste contexto, não significa necessariamente um grande espaço de tempo
entre a intervenção e os resultados finais. Existem políticas sociais em que os resultados são mais
imediatos, havendo um curto espaço de tempo entre a intervenção e os resultados ou efeitos à sociedade.
O longo prazo significa que são os resultados mais distantes ou finais almejados desde a implantação do
programa ou ainda que serão os últimos resultados alcançados.
A teoria da mudança é uma ferramenta que comunica de forma clara, lógica e visual a
política pública, programa ou projeto, explicita a intervenção que se pretende implementar,
os insumos necessários para que essa seja colocada em funcionamento, os produtos que
se espera obter a partir dessa intervenção e os resultados iniciais, intermediários e finais
necessários para que se alcance o objetivo mais amplo da intervenção (IMAS; RIST, 2009;
INSPER METRICIS, 2022; FUNNEL; ROGERS, 2011). Assim, a ferramenta tem importante
função na disseminação de informações relevantes da política pública, programa ou projeto
entre diferentes stakeholders como formuladores, investidores, gestores, implementadores,
avaliadores e também para a sociedade.
5
O Guia de Avaliação de Impacto Socioambiental para Utilização em Projetos e Investimentos de Impacto
do Insper Metricis, por exemplo, sugere que o avaliador que desenvolverá a teoria da mudança faça a
conexão dos resultados mapeados com os Objetivos de Desenvolvimento Sustentável e, assim, facilite o
entendimento dos stakeholders da contribuição da intervenção para o cumprimento da agenda 2030
(INSPER METRICIS, 2022).
Por sua vez, os indicadores dos resultados mapeados a partir de uma teoria da mudança,
além de serem utilizados para monitoramento, também são úteis para mensuração de
impacto. Como os indicadores de resultado medem mudanças valorizadas pelos
beneficiários da intervenção, esses são adequados para avaliar o sucesso – ou impacto –
da política, programa ou projeto (INSPER METRICIS, 2022). A teoria da mudança também
auxilia o avaliador a definir quando a mensuração de impacto deve ser realizada. O
encadeamento dos resultados apresentados pela ferramenta pode revelar o tempo que a
intervenção leva para gerar as mudanças pretendidas para a população-alvo (IMAS; RIST,
2009). Por exemplo, se a intenção do avaliador for mensurar o impacto da intervenção
sobre um resultado que deve ser observado no longo prazo, não é recomendável realizar
a avaliação no curto prazo ou logo após o início da implementação.
6
Para mais informações sobre o que é uma árvore de problema e uma árvore de objetivos, veja (DEARDEN
et al., 2002).
De forma mais prática: a teoria da mudança irá, em um primeiro momento, guiar o avaliador
na busca por dados que permitam realizar medição de impacto. Ciente dos dados
disponíveis, o avaliador poderá, então, recorrer à teoria da mudança para obter outras
informações relevantes sobre a intervenção e para traçar uma estratégia de medição
factível que forneça o mais alto grau de validade interna possível, sem abdicar do poder de
generalização dos resultados para outros contextos (o que é importante, por exemplo, para
futuras discussões de expansão da política, programa ou projeto).
Por fim, a teoria da mudança pode ainda auxiliar o avaliador e o gestor público a
entenderem os resultados da avaliação. A avaliação pode gerar evidências de que a
conexão entre um produto e um resultado ou entre um resultado e outro resultado é
confirmada para aquela intervenção em particular. No entanto, quando a avaliação revela
que a conexão outrora mapeada não se sustenta, faz-se necessário buscar entender se
alguma hipótese assumida para garantir tal conexão é violada. Esse exercício ajuda na
identificação de potenciais causas de falhas no desenho da intervenção que impedem o
atingimento dos objetivos pretendidos. Dessa forma, a teoria da mudança contribui para o
redesenho de políticas, programas e projetos sociais (FUNNEL; ROGERS, 2011). O
constante aprimoramento da intervenção motiva a contínua revisão da teoria da mudança,
em um processo de busca incessante pela solução para um problema social complexo.
7
A teoria da mudança pode ser uma ferramenta útil para a definição de indicadores que serão utilizados
para mensurar e monitorar os resultados da intervenção. Porém, o mapeamento de indicadores não
necessariamente é realizado na elaboração da teoria da mudança.
8
Material disponível em: https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-
indicadores-de-desenvolvimento-de-areas-urbanas-vulneraveis/.
É importante destacar que o trabalho visava a criação de um painel de indicadores para ser
aplicado a diferentes territórios urbanos periféricos que enfrentam problemas parecidos e,
portanto, não estava relacionado a uma política, programa ou projeto específico. Para
definição do conjunto de indicadores, o ponto de partida da pesquisa foi a elaboração de
uma teoria da mudança e, na ausência de um objetivo específico associado a uma
intervenção, procedeu-se ao levantamento dos problemas mais comuns em áreas urbanas
vulneráveis, os quais foram associados a objetivos gerais explicitados de forma alinhada
com os Objetivos de Desenvolvimento Sustentável (ODSs),10 também utilizados para
representar os resultados finais para a sociedade. O passo seguinte foi o mapeamento dos
resultados necessários para que tais objetivos pudessem ser alcançados e, por fim, foram
propostas intervenções (produtos, atividades e insumos) capazes de gerar esses
resultados. Assim, a construção da teoria da mudança seguiu uma abordagem “de trás para
frente”, partindo dos resultados finais para a sociedade até chegar aos insumos necessários
para a realização das atividades propostas (CLARK, 2021; MACKENZIE; BLAMEY, 2005;
ANDERSON 2005).
Para identificar os problemas mais comuns enfrentados por territórios urbanos periféricos,
a equipe de pesquisa do Insper Metricis partiu do estudo e observação de bairros periféricos
da cidade de São Paulo, como o Jardim Lapenna, localizado no distrito de São Miguel
Paulista (zona leste),11 Pinheirinho D’Água, localizado no distrito de Jaraguá (zona oeste)
e Parque Novo Mundo, localizado no distrito de Vila Maria (zona norte). Os pesquisadores
também estudaram casos bem-sucedidos de desenvolvimento de áreas urbanas periféricas
das cidades de Recife (PE) e de Medellín (Colômbia).12 Os problemas mapeados foram
9
Uma das autoras deste capítulo integrou a equipe técnica do projeto e descreve aqui a construção da teoria
da mudança sob o olhar da sua participação no processo. Quaisquer erros ou falhas na interpretação do
projeto são de responsabilidade da autora.
10
Para conhecer quais são os Objetivos de Desenvolvimento Sustentável da Agenda 2030, acesse:
https://brasil.un.org/pt-br/sdgs.
11
As experiências da Fundação Tide Setúbal em projetos de desenvolvimento do território do Jardim Lapenna
foi a grande motivação para a realização do trabalho, considerando-se que a organização apoia o
desenvolvimento do bairro desde 2005.
12
Como sugerido no trabalho “A Lupa na Cidade: Painel de Indicadores de Desenvolvimento de Áreas
Urbanas Vulneráveis”, para mais informações sobre as intervenções urbanas realizadas em Medellín,
consulte Silva (2013), Chagas (2016), Echeverri (2017), Salles e Alvim (2019), Brasil (2015) e Urán Arenas
(2012), e para mais informações sobre as intervenções urbanas realizadas em Recife, consulte Salles e Alvim
(2019), Recife (2016), Rego, Menezes e Ratton Júnior (2019).
Para cada macrotema foi elaborada uma versão inicial da teoria da mudança, partindo-se
de uma pesquisa de benchmarking que abrangeu revisão da literatura acadêmica e técnica
sobre intervenções capazes de gerar os resultados pretendidos em contextos com
características similares.14 Muitas vezes não foi possível encontrar estudos prévios que
trouxessem evidência da capacidade de uma intervenção afetar um resultado à sociedade
e contribuir para atingir um ODS de forma mais ampla. Nesses casos, buscou-se por
estudos prévios sobre intervenções capazes de afetar resultados intermediários os quais,
por sua vez, apresentassem eficácia documentada para afetar os resultados finais
pretendidos.
As versões iniciais das teorias da mudança foram, então, apresentadas para discussão com
diversos stakeholders – incluídos especialistas nos macrotemas específicos, equipe de
trabalho da Fundação Tide Setúbal e grupos de lideranças tradicionais e lideranças jovens
do bairro Jardim Lapenna – com o intuito de validar as conexões estabelecidas, verificar a
completude do trabalho feito até ali e, consequentemente, identificar novos potenciais
canais de mudanças ainda não mapeados. A partir das ideias oriundas dessas discussões,
a revisão de literatura foi integralizada e as versões iniciais das teorias da mudança foram
revisadas, produzindo uma versão final para cada um dos oito macrotemas.
Por fim, foi construída uma teoria da mudança integrada, única, que engloba todos os
macrotemas. Para tanto, primeiramente foram identificados os insumos, atividades,
13
ODS 3: Saúde e Bem-Estar - Garantir o acesso à saúde de qualidade e promover o bem-estar para todos,
em todas as idades (NAÇÕES UNIDAS BRASIL, 2022).
14
Foram priorizados estudos com o nível mais alto possível de validade interna e externa. No entanto, na
ausência de estudos quantitativos mais rigorosos, evidências qualitativas foram utilizadas; na ausência de
estudos sobre intervenções implementadas em contextos parecidos, foram utilizadas evidências sobre
contextos com características menos similares àqueles presentes nos territórios de interesse.
Importante destacar ainda que os resultados das atividades podem estar conectados entre
si. Por exemplo, o R6 está conectado aos resultados R12, R13, R23 e R27. E, ao se
examinar cuidadosamente a teoria da mudança integrada completa, pode-se notar que os
resultados presentes na cadeia de mudança que parte das atividades de saúde pública
também são alimentados por atividades de outras áreas e isso também acontece com a
15
Como a teoria da mudança integrada é muito extensa, não a apresentamos completa ao leitor aqui,
contudo, essa pode ser encontrada na publicação original do trabalho, disponível em:
https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-indicadores-de-desenvolvimento-
de-areas-urbanas-vulneraveis/.
Fonte: Reprodução parcial da teoria da mudança apresentada na publicação “A Lupa na Cidade: Painel de
Indicadores de Desenvolvimento de Áreas Urbanas Vulneráveis”, referente a trabalho desenvolvido pelo
Insper Metricis e financiado pela Fundação Tide Setúbal e Itaú Social.
Fonte: Reprodução parcial da teoria da mudança apresentada na publicação “A Lupa na Cidade: Painel de
Indicadores de Desenvolvimento de Áreas Urbanas Vulneráveis”, referente a trabalho desenvolvido pelo
Insper Metricis e financiado pela Fundação Tide Setúbal e Itaú Social.
16
Um quadro completo de justificativas para todas as conexões mapeadas na teoria da mudança integrada
pode ser encontrado na publicação original do trabalho, disponível em:
https://fundacaotidesetubal.org.br/publicacoes/a-lupa-na-cidade-painel-de-indicadores-de-desenvolvimento-
de-areas-urbanas-vulneraveis/.
continua
P.32: Número de UBSs que R.35: População tem Para que haja uma entrega
contam com a estrutura acesso a serviços de saúde de serviços de saúde básica
adequada de suprimentos e básica de qualidade de qualidade, é necessário
equipamentos que as unidades de saúde
contem com uma estrutura
mínima de equipamentos e
medicamentos (WHO,
2010). Estudos apontam
que a infraestrutura das
unidades de saúde da
família e os equipamentos
para ações na Atenção
Básica são insuficientes e
insatisfatórios (MOREIRA et
al., 2017).
Fonte: Reprodução parcial da teoria da mudança apresentada na publicação “A Lupa na Cidade: Painel de
Indicadores de Desenvolvimento de Áreas Urbanas Vulneráveis”, referente a trabalho desenvolvido pelo
Insper Metricis e financiado pela Fundação Tide Setúbal e Itaú Social.
BAMBERGER, M.; MABRY, L. 2019. RealWorld evaluation: working under budget, time,
data, and political constraints. New Yor: Sage publication, 2019.
BREUER, E. et al. Using theory of change to design and evaluate public health
interventions: a systematic review. Implementation Science, v. 11, n. 63, p. 1-17, 2016.
Disponível em: https://implementationscience.biomedcentral.com/track/pdf/10.1186/s130
12-016-0422-6.pdf. Acesso em: 11 set. 2022.
CASTRO, M. et al. Brazil's unified health system: the first 30 years and prospects for the
future. The Lancet, v. 394, n. 10195, p. 345-356, 2019
CRUMPTON, C. D. et al. Evaluation of public policies in Brazil and the United States: a
research analysis in the last 10 years. Revista de Administração Pública, v. 50, n. 6, p.
981-1001, nov./dez. 2016. Disponível em:
https://www.scielo.br/j/rap/a/ptZ4nqddFYXYsL3ZqCSKgRz/?format=pdf&lang=en. Acesso
em: 11 set. 2022.
IMAS, L. G.; RIST, R. C. The road to reasults. designing and conducting effective
development evaluations. Washington, DC: World Bank, 2009. p. 59-74. The World Bank.
2009.
MACKENZIE, M.; BLAMEY, A. The practice and the theory: lessons from the application of
a theories of change approach. Evaluation, v. 11, n. 2, p. 151-168, 2005.
MAINI, R., S.; MOUNIER-JACK, S.; BORGHI, J. How to and how not to develop a theory
of change to evaluate a complex intervention: reflections on an experience in the
Democratic Republic of Congo. BMJ Global Health, v. 3, n. 1, p. 1-6, 2018. Disponível
em: https://gh.bmj.com/content/3/1/e000617. Acesso em: 11 set. 2022.
SALLES, M.; ALVIM, R. Urbanismo e segurança pública. São Paulo: BEI, 2019.
2
ISGlobal, Hospital Clínic - Universitat de Barcelona, Barcelona, Espanha
RESUMO:
Este capítulo teve como objetivo apresentar as principais metodologias utilizadas para projeção de
impactos futuros de políticas em saúde ou avaliação de impacto ex-ante. Essa apresentação foi feita
de forma sucinta, destacando as principais características e exemplos de aplicação. Desse modo,
o capítulo funciona como uma porta de entrada dessa abordagem para analistas e tomadores de
decisão. O capítulo também aponta a necessidade de planejamento e continuidade na aplicação
dessas metodologias como forma de construção de recursos chaves para aplicações emergenciais
como as vivenciadas com a Covid-19.
PALAVRAS-CHAVE:
Forecast. Avaliação de impacto ex-ante. Série Temporal. Modelo compartimental. Microssimulações.
Modelo baseado em agentes.
Diferentes metodologias podem ser utilizadas para realizar esse tipo de projeção com
diferentes estruturas de dados, complexidades, premissas, modelagem de risco, incertezas
e compreensibilidade geral. Este capítulo se propõe a apresentar quatro dessas
metodologias quantitativas1; uma de base estatística, outra matemática e as duas restantes
de base computacional. Estes métodos são: I) Séries Temporais, II) Modelos
Compartimentais, III) Microssimulações e IV) Modelos Baseados em Agentes (ABM).
1Também é possível aplicar metodologias qualitativas de projeção de impactos de políticas que se utilizam
de entrevistas estruturadas com especialistas ou ainda de métodos que combinem abordagens quantitativas
e qualitativas.
Neste capítulo trata-se sobre os princípios e métodos para projetar o impacto futuro de
políticas em saúde. Focamos a discussão nos quatro modelos mais utilizados: Séries
Temporais, Modelos Compartimentais, Microssimulações e Modelos Baseados em
Agentes. Outras metodologias menos utilizadas não abordadas neste capítulo também
podem ser consideradas para esse princípio. Por exemplo, avaliação comparativa de risco
(MURRAY et al., 2004), modelos econométricos estruturais (WILLIAMS et al., 2020) e
modelos de inteligência artificial e aprendizado de máquina (GIBERT et al., 2018).
No entanto, ITS e DRM exigem que se façam várias observações antes e depois da
política para avaliar o impacto de forma robusta e, portanto, são aplicadas com mais
frequência em análises retrospectivas (ou seja, avaliação do impacto na saúde).
Avalia-se o efeito da política comparando-se a variação nas inclinações da série
temporal contrafactual. Se a mudança na inclinação devido à política em estudo for
conhecida, a análise de Série Temporal pode ser usada para prever os impactos na
saúde de uma proposta de política.
Apesar da simplicidade do modelo SIR, os MCs costumam ser mais complexos, pois
são customizados de acordo com a doença infecciosa específica em estudo e a
dinâmica populacional, como incluir características demográficas (nascimento,
mortalidade natural do indivíduo, movimento migratório etc.) ou outras heterogêneas.
Como resultado, a mesma doença pode ser modelada por meio de diferentes MCs,
a depender de quais aspectos e parâmetros estão incluídos no modelo (SIETTOS;
RUSSO, 2013).
Embora os MCs tenham longa tradição e existam para quase todas as doenças
infecciosas existentes, esses se tornaram particularmente populares durante a atual
pandemia de COVID-19 (LAVIELLE et al., 2021), devido aos esforços sem
precedentes de modeladores matemáticos para se prever a propagação da doença.
3.3 Microssimulações
Microssimulações (MS) têm sido cada vez mais utilizadas na pesquisa em saúde
pública devido à sua capacidade de avaliar os efeitos da intervenção considerando-
se as heterogeneidades da população (ABRAHAM, 2013). Essas são capazes de
simular os efeitos diferenciais das políticas em subpopulações específicas e,
Durante a simulação, cada unidade muda seu estado, no caso de uma variável
categórica, ou seus valores, no caso de uma variável contínua, com base nas
probabilidades de transição específicas da unidade. Essas probabilidades podem
seguir a suposição de Markov, de que a probabilidade de transição depende apenas
do estado atual da unidade, considerando-se os estados ou valores de outras
variáveis demográficas e socioeconômicas da unidade ou outras regras de
transição mais complexas (ROBERTS et al., 2012). Uma distinção útil das MS é
entre modelos estáticos ou dinâmicos: os estáticos procuram reproduzir o impacto
de uma política nas unidades em determinado momento, enquanto os
dinâmicos rastreiam trajetórias e transições de unidades ao longo do tempo
(RUTTER; ZASLAVSKY; FEUER, 2011).
2
Do inglês Properties, Actions, Roles, Time, Enviroment.
Embora o ABM seja uma ferramenta poderosa para simular sistemas complexos,
sua construção não é trivial. Escolhas específicas de funções e/ou algoritmos podem
afetar sensivelmente seus resultados e sua formulação pode ficar complexa demais,
a ponto criar dificuldades para sua compreensão e interpretação e, assim, tomar o
sentido contrário aos seus objetivos. É desafiador combinar simplicidade e realismo
nos modelos. Suposições sobre propriedades, ações, regras, tempo e ambiente
precisam ser bem fundamentadas em dados e evidências empíricas – ou teóricas.
Contudo, há um esforço de tornar as aplicações mais acessíveis com o
desenvolvimento de softwares específicos (ABAR et al., 2017), valendo sempre a
premissa de inserir complexidade aos modelos, sem torná-los complexos demais.
É preciso considerar que cada metodologia possui seus pressupostos e uma extensa
literatura por trás e também que é necessário um aprofundamento maior da metodologia
elegida para a projeção de impacto em saúde. Este capítulo buscou apresentar,
brevemente, quatro dentre as mais utilizadas para esse fim. Identificamos em um quadro
síntese (Quadro 1), uma caracterização geral dessas e destacamos softwares e linguagens
comumente utilizados nessas aplicações. O uso dessas metodologias não é restrito a esses
softwares e linguagens, pelo contrário, o desenvolvimento de aplicações específicas que
buscam tornar mais acessível a utilização dessas metodologias é cada vez maior. Ao
mesmo tempo, equipes transdisciplinares têm investido no desenvolvimento de modelos
em linguagens de programação tradicionais, como C++ e JavaScript, otimizando sua
capacidade de processamento e complexidade.
Fonte: Elaboração própria. *A aplicação dessas metodologias não é restrita aos softwares/linguagens
sugeridos aqui. Esses são apenas indicações de softwares comumente utilizados na área da saúde que
também podem ser utilizados para essas metodologias.
O processo – que não é necessariamente linear nem restrito a um único ponto de partida –
pode se iniciar com a política/fenômeno a ser observada(o) e a identificação dos recursos
disponíveis para análise (ROBERTS et al., 2012). Por recursos, entende-se uma
diversidade de fatores que podem variar de projeto para projeto. Contudo, alguns
elementos são mais recorrentes: tempo de execução, expertise da equipe, conhecimento
sobre o fenômeno/política, capacidade computacional e disponibilidade de recursos
financeiros. São elementos que acabam delimitando o que é possível fazer dentro das
condições disponíveis.
A expertise da equipe em relação à política e as metodologias afetam o tempo de
desenvolvimento e, caso não seja um recurso disponível, demandará a contratação de
consultores ou de novos membros para a equipe. É necessário identificar quais são os
prazos para execução da avaliação e qual seu escopo para identificar quais metodologias
são mais viáveis. Por exemplo, todos os modelos aqui apresentados podem ter diferentes
níveis de complexidade e detalhamento, mas modelos baseados em indivíduos (individual-
Based Models, IBM) (WILLEM et al., 2017), como microssimulações e baseados em
agentes, usualmente necessitam mais tempo de desenvolvimento. Como esses modelos
são bastante flexíveis, demandam mais tempo para concepção e programação. Apesar de
também serem flexíveis, modelos compartimentais e de séries temporais possuem uma
literatura consolidada e uma estrutura básica que permitem avançar mais rapidamente no
desenvolvimento das avaliações.
ABAR, S. et al. Agent based modelling and simulation tools: a review of the state-of-art
software. Computer Science Review, v. 24, p. 13-33, 2017.
BASU, S. et al. Averting obesity and type 2 diabetes in India through sugar-sweetened
beverage taxation: an economic-epidemiologic modeling study. PLoS Medicine, v. 11, n.
1, p. e1001582, 2014.
CHAO, D.; HASHIMOTO, H.; KONDO, N. Dynamic impact of social stratification and social
influence on smoking prevalence by gender: an agent-based model. Social Science
Medicine, v. 147, p. 280-287, 2015.
ELLIOTT, E.; KIEL, L. D. Agent-based modeling in the social and behavioral sciences.
Nonlinear Dynamics, Psychology and Life Sciences, v, 8, n. 2, p. 121-130, 2004.
GALEA, S.; RIDDLE, M.; KAPLAN, G. A. Causal thinking and complex system approaches
in epidemiology. International Journal of Epidemiology, v. 39, n. 1, p. 97-106, 2010.
HEATH, B. L.; HILL, R. R. Some insights into the emergence of agent-based modelling.
Journal of Simulation, v. 4, n. 3, p. 163-169, 2010.
MACAL, C. M. Everything you need to know about agent-based modelling and simulation.
Journal of Simulation, v. 10, p. 144-156, 2016.
OJAL, J. et al. Sustaining pneumococcal vaccination after transitioning from gavi support:
a modelling and cost-effectiveness study in Kenya. Lancet Global Health, v. 7, n. 5, p.
644-654, 2019.
RASELLA, D. et al. Child morbidity and mortality associated with alternative policy
responses to the economic crisis in Brazil: a nationwide microsimulation study. PLoS
Medicine, v. 15, n. 5, p. 1-20, 2018.
RUTTER, C. M.; ZASLAVSKY, A.; FEUER, E. Dynamic microsimulation models for health
outcomes: a review. Medical Decision Making, v. 31, n. 1, p. 10-18, 2011.
XIANG, Y. et al. COVID-19 epidemic prediction and the impact of public health
interventions: a review of COVID-19 epidemic models. Infectious Disease Modelling, v.
6, p. 324-342, 2021.
WILLIAMS, M. J. et al. External validity and policy adaptation: from impact evaluation to
policy design. World Bank Research Observer, v. 35, n. 2, p. 158-191, 2020.
WISMAR, M. et al. (ed.). The effectiveness of health impact assessment: scope and
limitations of supporting decision-making in Europe. World Health Organization. European
Observatory on Health Systems and Policies, 2007.
Causalidade e sobredeterminação:
abordagem translacional-
transdisciplinar na avaliaçao em saúde
Naomar de Almeida-Filho1
Denise Coutinho2
Instituto de Saúde Coletiva, Universidade Federal da Bahia
1
2
Instituto de Psicologia, Universidade Federal da Bahia
RESUMO:
Problematiza-se aqui a ideia clássica de determinação causal e apresenta-se o conceito de
sobredeterminação, visando à construção de modelos de avaliação tecnológica de interesse
dos gestores em saúde. Para isso, inclui-se a proposta de ‘redes de sobredeterminação’ como
possibilidade de aplicação das epistemologias do Sul aos temas da saúde e correlatos. Em uma
dimensão pragmático-crítica, argumenta-se que a articulação transdisciplinar de estratégias de
pesquisa permite uma abordagem translacional capaz de dar conta de problemas complexos no
campo da saúde.
PALAVRAS-CHAVE:
Sobredeterminação. Causalidade. Ciência translacional. Transdisciplinaridade. Avaliação tecnológica
em saúde.
1 Neocausalismo pós-empiricista
Pearl (2009; 2010) postula a explicitação das bases epistemológicas dos pressupostos
estatísticos dos modelos causais e destaca as categorias de linearidade e normalidade
(além de outras premissas que ele chama de “funcionais-distributivas”), especialmente
quando variáveis categóricas estão envolvidas. Como fundamento para uma definição
intuitiva de causalidade contrafactual, Pearl (2009, p. 332) adverte que
nada numa função de distribuição nos diz como essa distribuição seria
diferente se as condições externas mudassem – digamos, da configuração
observacional para a experimental – porque as leis da teoria da
probabilidade não ditam como uma propriedade de uma distribuição deve
mudar quando outra propriedade é modificada.
Na epidemiologia, toda uma geração com formação matemática competente e base lógica
sólida como Paul Holland (1986), Sander Greenland (1990) e James Robins (2001),
reforçados por Olli Miettinen – em sua fase recente – acorre em defesa dessa linha teórica.
Como fundamentação epistemológica do neocausalismo contrafactual nesse campo,
Miettinen (2013) propõe o que chama três gnoses (diagnose, etiognose, prognose),
distinção necessária para a produção de modelos causais baseados em estimativas
probabilísticas individualizadas. Seu objetivo declarado é a formalização de uma nova
teoria da pesquisa em saúde com foco em “investigação metaepidemiológica” (MIETTINEN;
KARP, 2012). Recentemente, Miettinen, Steurer e Hofman (2019) dedicaram um apêndice
à inteligência artificial como apoio diagnóstico, mesmo como alternativa à avaliação clínica,
em um projeto ambicioso de promoção de uma “medicina gnóstica”, dita “baseada em
conhecimento científico” – para se distinguir da medicina baseada em evidências –
supostamente mais adequada aos novos contextos de cuidado em saúde.
Morabia (2005) defende que a epidemiologia tem uma concepção própria, sui generis, de
causalidade. Em suas palavras, “a inferência causal na epidemiologia consiste em verificar
a coerência lógica de uma declaração de causalidade e determinar se o que foi encontrado
grosseiramente contradiz o que achamos que já sabemos” (MORABIA, 2005, p. 1). Em
ensaio mais recente, Morabia (2013) analisa que a ideia de inferência causal pode ser
rastreada até os filósofos ingleses Hume e Mill, bem antes de justificar os critérios de Hill.
Por outro lado, o modo de estabelecer causalidade estabelecido nos postulados de Henle-
Koch – oriundos da bacteriologia e que ainda prevalecem na abordagem clínica
convencional – em todos os casos exige que o efeito específico siga uma dada causa, tão
específica quanto o efeito esperado.
As propostas de retorno à causalidade atualmente vigentes são muito diferentes entre si.
Uma, de orientação biomédica, apresenta-se como alternativa viável de volta de uma noção
de determinação causal aberta, uma suposta causalidade empírica, de retorno à causa
necessária de Galileu, que toma o termo de Aristóteles. Outra tenta recuperar a causalidade
como um “causalismo atenuado”, uma forma de representar causalidade baseada em uma
referência probabilística pós-bayesiana. A primeira se mostra causalista sem disfarces; a
segunda, ao fazer justiça à sua sofisticação teórica, seria um causalismo pós-empiricista.
No entanto, no nível interpretativo, ambas as propostas de retorno à causalidade
permanecem lineares, deterministas, monótonas (todos os nexos entre seus elementos são
da mesma natureza) e desconsideram a variedade de relações encontradas no complexo
espaço das funções de ocorrência de doenças.
Enfim, pode-se supor que o mundo não se rege apenas por modalidades estáveis e
unívocas de nexos entre eventos (SAMAJA, 2004). Vários fenômenos com características,
ponderações, potencialidades diferentes, mas que têm a capacidade de atuar
conjuntamente para provocar desfechos não obrigatoriamente indesejáveis, dependem de
condições e circunstâncias específicas e fortuitas como determinantes ou condicionantes
dos seus efeitos. Mais: seres biológicos – mesmo dentro da própria espécie – podem sofrer
variações que lhes conferem capacidades diferentes de reação/resposta a determinados
fenômenos que os afetam. Em geral, é difícil separar efeitos de contextos (ecossociais e
culturais) em relação às dimensões físicas e biológicas de indivíduos e populações.
Como conceito, o termo ‘sobredeterminação’ foi criado por Sigmund Freud, para se referir
à série articulada de causas e fatores desencadeantes de sintomas psíquicos e das
diversas formações do inconsciente. Em estudo pioneiro, Luiz David Castiel (1988, p. 8)
informa que em A Herança e a Etiologia das Neuroses (1896) Freud introduziu uma nova
classificação de “influências etiológicas” em função do efeito produzido: condições, causas
concorrentes, causas específicas e causas provocativas. Castiel (1988) também menciona
Nesse conjunto de textos, Freud destaca três mecanismos centrais de constituição dos
sonhos: a condensação, o deslocamento e a sobredeterminação. Ao definir o novo conceito
como vinculado à contingência, afirma, de modo surpreendentemente preciso, que o tipo
de determinação que constrói os sonhos “parece artificial porque não está ligada a fatores
fortes, mas secundários que, ao se multiplicarem, ganham força”. Elementos de “baixo valor
psíquico” e de reduzida importância isolada nos processos inconscientes adquirem novos
valores ao se articularem como sobredeterminação.
Em uma série de textos elaborados entre 1955-1957, reunidos nos Écrits, Jacques Lacan
(2009) recupera a ideia de sobredeterminação como central na teoria freudiana original. Ao
reafirmar a autoria desse conceito em Freud, Lacan (2009, p. 56) identifica uma lacuna
crucial na obra freudiana, como “apercepção da função simbólica”, na qual um “vislumbre
iluminador” pode ser identificado na ordem da linguagem: “a determinação do signatário ao
do significado, [...] essa sobredeterminação que é a única em questão”. Em vários
momentos de sua análise, Lacan (2003; 2009) reitera que a causalidade psíquica implica
"uma cadeia simbólica" de sujeição a um “jogo intersubjetivo” (LACAN, 2009, p. 412), e que
"as leis da linguagem são as únicas capazes de sobredeterminação" ou, dito de outro modo,
“a sobredeterminação é estritamente concebível somente na estrutura da linguagem”
(2003, p. 606). Em um horizonte crítico abertamente antiessencialista, Lacan afirma que
propriedades causais ou etiogenéticas dos fenômenos psíquicos somente operam “nos
registros da linguagem: de onde vem a sobredeterminação, o que não faz sentido senão
nesta ordem” (LACAN, 2009, p. 281). Em síntese, para Lacan (2009, p. 439) “o que Freud
chama de sobredeterminação, deve ser considerado acima de tudo como um fato de
sintaxe, onde seus efeitos da analogia devem ser apreendidos”.
Si así es, es necesario admitir que la contradicción deja de ser unívoca (las
categorías dejan de tener de una vez por todas un papel y un sentido fijos),
ya que refleja en sí, en su misma esencia, su relación con la estructura
Enfim, ciente dos limites impostos pelo economicismo, com sua concepção de sociedade
enquanto “conjunto estruturado complexo”, para distanciar-se do conceito hegeliano de
“totalidade” Althusser recupera o conceito freudiano de sobredeterminação. Aqui,
identificam-se duas formas de pensar a sobredeterminação que se articulam com
implicações diferentes: a primeira refere-se à relação do todo com suas partes, sendo essas
diversas e múltiplas e sendo a primeira definida por elas, ao mesmo tempo em que as
condiciona; a segunda refere-se à questão da “última instância” em que a estrutura
econômica determina as formas da superestrutura que, em um movimento de retroação,
seria também sobredeterminada.
4 Sobredeterminação em saúde
O modo como tem sido usada a ideia de ‘sobredeterminação’, proposta por Freud como
expressão do aparelho psíquico e das formações do inconsciente, mostra que o conceito
se atualiza em Lacan como sobredeterminação simbólica e se redefine em Althusser para
análise dialética das formações sociais. Propostas articuladoras entre psicanálise e
marxismo permitem a aproximação com a ideia de sistemas complexos, nos quais
processos sobredeterminados coincidem com desfechos, contradições e contingências e
têm possibilidade de existência e espaço de operação. São instâncias de
sobredeterminação, mediante retroação, simultaneamente determinantes e determinadas.
Como ilustração, mais importante do que formalizar rigorosamente métodos para descrever
e medir os objetos da saúde-doença-cuidado certamente será compreender raízes e
determinações e aplicar uma abordagem pluralista em termos metodológicos.
2) Risco como dano estruturado. Tal conceito subsidia modelos de intervenção para
proteção da saúde nas áreas de saúde ambiental e ocupacional, com
fundamentação dedutiva, descritiva e estrutural.
Por outro lado, a partir de vários ângulos de análise, a Proteção à Saúde – como estratégia
– logicamente se posiciona no registro do impossível, apesar de historicamente ter sido
construída como um campo de prática plausível. Protege-se a saúde pela indução de uma
impossibilidade, tornando-se impossível (como pretensão) o dano à integridade,
funcionalidade ou existência dos seres humanos. Seu modelo é o controle e o experimento
a intervenção necessária. Tal modalidade – o impossível – deve ser considerada em sua
estrutura lógica, o que não significa que essa não exista. Apenas esse controle e
experimento não são realidades em si, mas realidades linguísticas que produzem efeitos
reais e não são encontradas nas condições efetivas de pesquisa ou intervenção; como
eventos circunstanciais, somente são reconhecidos por seus efeitos. Rigorosamente, um
experimento nunca pode ser reproduzido, é único, e pode, sim, quando replicado, constituir
uma série. Além disso, a replicação jamais ocorre como planejado, uma vez que a situação
do laboratório não tem outra relação com a vida além da plausibilidade. A realidade do
experimento nunca corresponde à realidade do evento. No caso da prevenção de riscos à
saúde, diante das imponderabilidades que envolvem a determinação e geração de danos
à saúde, mesmo que se tomem medidas preventivas não se tem certeza de que os
resultados de proteção serão garantidos, a depender das medidas tomadas.
Para lidar com objetos complexos e singulares em saúde, considerados como totalidades
sobredeterminadas, compostas por eventos sobre os quais as ciências devem considerar
um efeito sintetizador para preservar sua integridade heurística, Samaja (2003, p. 115-116)
reitera a sobredeterminação como conceito-chave para melhor se compreender a
reprodução social de processos saúde-enfermidade e fenômenos correlatos a tais objetos
complexos, regidos por lógicas plurais:
Essa última opção constitui a novidade possível no presente esforço de exploração das
bases epistemológicas da epidemiologia visando à modelagem ou concretização de
situações de saúde ou à avaliação de intervenções sobre realidades de saúde. Para melhor
compreender sua dinâmica e operar metodologicamente seus efeitos como estratégia de
produção de conhecimento, recorre-se ao dispositivo heurístico da “rede de
sobredeterminação” (que eventualmente se conforma como matrizes).
Em muitos pontos de sua obra, Freud tratava então o fenômeno psíquico como uma rede.
Em A Interpretação dos sonhos (1973[1900]) fala explicitamente do aparelho psíquico como
“cadeia de pensamentos” ou “tecido reticular”. No glossário que subsidia a noção freudiana
de sobredeterminação, o termo ‘determinante’ implica invariavelmente uma cadeia de
pensamentos. Cada elemento da cadeia de pensamentos é sobredeterminado no sentido
de que sua origem pode remontar a toda uma série desses. Esses elementos não precisam
necessariamente ter estreita relação mútua nos próprios pensamentos; podem pertencer
Miller (2009, p. 869) complementa o texto dos Écrits com uma tabela comentada das
representações gráficas concebidas por Jacques Lacan. Segundo ele, a montagem
progressiva das redes traz à tona algumas das propriedades da sobredeterminação, em
três modalidades: (i) Rede – surgimento de simples antecipação por distribuição
dissimétrica, na qual a memória aparece como a lei elementar da repetição (gráfico
relacionado e pseudossimétrico); (ii) “Repartitório” e tabela – para representar a
emergência, por meio de uma segunda distribuição dissimétrica, de uma antecipação
complexa concluída pelo feedback; (iii) Representação de rede – transformação do
precedente em rede. Finalmente, a montagem de dispositivos heurísticos como
representação gráfica de objetos sobredeterminados se viabiliza sob a forma de “redes de
sobredeterminação” que revelam grande potencial para uma hermenêutica epidemiológica
Recentes reflexões produzidas por Austin (2018, 2021) postulam uma designação aberta
de ciência translacional e ampliam a noção original de pesquisa translacional. Essa
ampliação-abertura propicia compreensão epistemológica mais ampla e sistêmica desse
paradigma de produção e aplicação de conhecimento científico, extrapolando os limites do
campo da saúde. A relevância dessas reflexões recomenda a transcrição dos argumentos
principais (AUSTIN, 2021, p. 1632):
6 Comentário sintético
Por um lado, há uma visão linear e unidirecional (da bancada para a beira
do leito) que é utilizada pela maioria da bibliografia; outro modelo seria uma
translação bidirecional e ainda linear (da bancada para a beira do leito e, por
vezes, daí novamente para a bancada); finalmente, uma visão mais
complexa, na qual o processo de translação seria um processo dinâmico e
de sentido variado.
Também influenciado pela epistemologia peirciana, Juan Samaja (1987; 1994) formula uma
teoria dos modos de produção do conhecimento científico e traz uma concepção original
de planos de ocorrência e interfaces hierárquicas. Para Samaja (2004), qualquer tratamento
conceitualmente eficiente da questão da saúde deve basear-se em modelos explicativos
de maior complexidade e espectros conceituais mais amplos: do molecular-subindividual-
sistêmico-ecológico na dimensão biológica à dimensão individual-grupo-social-cultural na
dimensão histórica. Para aplicar tais categorias, conceitos e estratégias na modelagem de
objetos complexos e singulares da ordem dos eventos críticos da saúde, com significativo
grau de eficiência heurística, é preciso identificar subespaços ou planos de ocorrência,
introduzir formas de determinação, descrever objetos intermediários e delimitar interfaces
estruturantes dos processos de totalização desses objetos. Objetos desse tipo tendem a
AYMERICH, M. et al. Translational research: aconcept emerged from health sciences and
exportable to education sciences. Annals of Translational Medicine Epidemiology, v. 1,
n. 1, p. 1005, 2014. Disponível em: https://austinpublishinggroup.com/translational-
medicine/fulltext/atme-v1-id1005.pdf. Acesso em: 22 out. 2022.
BACHELARD, R. La formation de I’esprit scientifique. 8th ed. Paris: Vrin, 1972. (1re
édition, 1938).
BOURDIEU, P. La distinción: criterios y bases sociales del gusto. Madrid: Taurus, 1988.
CHEN, X. et al. The international effort: building the bridge for Translational Medicine:
Report of the 1st International Conference of Translational Medicine (ICTM). Clinical
Translation Medicine, v. 1, n. 1, p. 1-10, 2021. Disponível em:
https://clintransmed.springeropen.com/articles/10.1186/2001-1326-1-15. Acesso em: 22
out. 2022.
FREUD, S. Analisis fragmentario de una histeria “Caso Dora”. In: OBRAS completas de
Sigmund Freud. Tradução: Luis Lopez-Ballesteros y de Torres. Madrid: Biblioteca Nueva,
1973 [1901-1905]. t. I.
GIBBONS, M. et al. The new production of knowledge: the dynamics of science and
research in contemporary societies. London: Sage Publications, 1994.
GREENLAND, S.; PEARL, J.; ROBINS, J. M. Causal diagrams for epidemiologic research.
Epidemiology, v. 10, p. 7-48, 1999.
HERNÁN, M. A.; ROBINS, J. M. Causal inference: what if. Boca Raton: Chapman &
Hall/CRC Press, 2020. 302p. Disponível em: https://cdn1.sph.harvard.edu/wp-content/
uploads/sites/1268/2020/02/ci_hernanrobins_21feb20.pdf. Acesso em: 20 ago. 2022.
LACAN, J. Escritos. Tradução: Tomás Segovia. 3 ed. rev. y corr. México: Siglo XXI, 2009.
t. I e II.
LACAN, J. Seminário XIX ... Ou pior. [1971-1972]. Tradução: Denise Coutinho et al.
Salvador: Espaço Moebius de Psicanálise, 2003.
MORABIA, A. Hume, Mill, Hill, and the sui generis epidemiologic approach to causal
inference. American Journal of Epidemiology, v. 178, n. 15, p. 1526-1532, 2013. DOI:
10.1093/aje/kwt223.
PEARL, J. Causality: models, reasoning, and inference. 2nd New York: Cambridge
University Press, 2009.
VANDERWEELE, T. J.; ROBINS J. M. Directed acyclic graphs, sufficient causes, and the
properties of conditioning on a common effect. American Journal of Epidemiology, v.
166, n. 9, p. 1096-1104, 2007. Disponível em:
https://academic.oup.com/aje/article/166/9/1096/88564. Acesso em: 26 ago. 2022.
ZERHOUNI, E. The NIH roadmap. Science, v. 302, n. 5642, p. 63-72, 2003. DOI:
10.1126/ science.1091867.
Marcelo M. Taddeo1
Leila Denise Amorim1
Rosana Aquino2
1
Instituto de Matemática e Estatística, Universidade Federal da Bahia
2
Instituto de Saúde Coletiva, Universidade Federal da Bahia
RESUMO:
Este capítulo destina-se a gestores e pesquisadores envolvidos em projetos de avaliação de impacto
de políticas públicas. O seu objetivo é apresentar o uso de diagramas causais como ferramenta
para compreensão dos mecanismos causais de intervenções, considerando-se possíveis fatores
contextuais e individuais que possam afetar a mensuração de seus efeitos e destacar sua relevância
e aplicabilidade para construção de investigações rigorosas. Os conceitos e terminologias da teoria
de grafos são sumarizados e ilustram a sua implementação por meio do uso de funções disponíveis
em software estatístico.
PALAVRAS-CHAVE:
Inferência causal. Diagramas causais. Grafo Direcionado Acíclico (DAG, do inglês Directed Acyclic
Graph).
1
CGD. 2006. When Will We Ever Learn? Improving Lives through Impact Evaluation. Washington, DC: Center
for Global Development, Evaluation Gap Working Group.
Em suma, a operacionalização das noções de causa e efeito demanda (i) uma definição –
ao mesmo tempo aceitável e quantificável – do que é efeito causal e (ii) métodos
matemáticos apropriados que permitam sua estimação, se possível, em termos da Teoria
da Probabilidade. Atualmente, há alguns enfoques para se lidar com esses problemas. Em
linhas bastante genéricas, pode-se dividi-los em duas categorias principais: uma baseada
em respostas potenciais (RUBIN, 1974; NEYMAN, 1923) e outra baseada em diagramas
causais e equações estruturais (PEARL, 2009; ROBINS, 1986). Embora concorrentes,
essas possuem diversas interseções e podem muitas vezes ser utilizadas conjuntamente
em problemas de inferência causal. Neste capítulo, será abordada apenas a metodologia
baseada em diagramas causais.
Diagramas (ou grafos) causais e equações estruturais são ferramentas úteis para
identificar, visualizar e quantificar as relações de causa e efeito entre
intervenções/exposições e desfechos/variáveis resposta em um sistema de interesse, bem
como para determinar os fatores de confusão (confundimento) que podem enviesar as
relações causais dentro da estrutura assumida pelo investigador. O uso de diagramas
causais também permite identificar e avaliar quais variáveis são relevantes nessa relação
e quais devem ser controladas em eventuais modelos. Indica ainda a possibilidade de
caminhos e estratégias de identificação do efeito causal por meio de critérios específicos
ou pela indicação de variáveis instrumentais. Além disso, ajuda a identificar os mediadores
entre a exposição e o desfecho e a avaliar se o efeito total do primeiro sobre o segundo
pode ou não ser decomposto em efeitos diretos e indiretos. Na sequência, esses objetos e
seu uso no contexto de inferência causal serão descritos mais detalhadamente. Exposições
2
Um resumo interessante sobre a relação entre economia e causalidade é de Hoover (2008).
3
“To give scientific explanations is to show how events […] fit into the causal structure of the world.”
Os grafos são objetos bastante intuitivos e se adaptam muito bem à linguagem cotidiana.
Por exemplo, um caminho entre 𝑋𝑋 e 𝑌𝑌 é um conjunto de vértices 𝑊𝑊! , 𝑊𝑊" ,..., 𝑊𝑊# ligados
entre si por arestas que conectam 𝑋𝑋 e 𝑌𝑌. As arestas de um caminho não necessitam apontar
todas no mesmo sentido, mas quando isso ocorre, diz-se tratar de um caminho
direcionado. Um caminho direcionado que começa e termina no mesmo vértice é
denominado ciclo (ou ciclo direcionado). Um grafo 𝒢𝒢, ao mesmo tempo direcionado e sem
ciclos, como na Figura 1 (c), é um grafo direcionado acíclico (DAG4).
4
Do inglês Directed Acyclic Graph.
𝑊𝑊! 𝑊𝑊!
𝑌𝑌 𝑊𝑊$ 𝑌𝑌 𝑊𝑊$
(a) Grafo não-direcionado (b) Grafo direcionado com ciclo.
𝑊𝑊!
𝑌𝑌 𝑊𝑊$ 𝑊𝑊! 𝑋𝑋 𝑊𝑊#
Neste capítulo, discutem-se apenas os grafos do tipo DAG (Figuras 1(c) e 1(d)). Sob a
perspectiva causal, DAGs representam fenômenos em que não há causação mútua
(mesmo que indireta, via ciclos). Vértices que apontam para uma variável 𝑋𝑋, como na
Figura 1 (d), são chamados pais5 de 𝑋𝑋 e denotados por 𝑝𝑝𝑎𝑎% ou 𝑝𝑝𝑎𝑎& (quando 𝑋𝑋 for indexado
pelo índice 𝑖𝑖). Por definição, os pais de uma variável representam o conjunto de todas suas
causas diretas. Analogamente se há um caminho “totalmente” direcionado partindo de 𝑋𝑋
até 𝑌𝑌, isto é, um caminho do tipo 𝑋𝑋 → 𝐴𝐴! → ⋯ → 𝐴𝐴# → 𝑌𝑌, diz-se que 𝑋𝑋 é um ancestral de 𝑌𝑌
ou que 𝑌𝑌 é um descendente de 𝑋𝑋. Uma variável 𝑋𝑋 com 𝑝𝑝𝑎𝑎% = ∅, ou seja, sem pais, é
chamada exógena. Caso contrário, é endógena. Por fim, vale notar que embora um DAG
exclua a possibilidade de causação mútua, não é impossível que um elemento do
mecanismo seja afetado de forma recorrente ao longo do tempo. Nesses casos, vale
observar, tal elemento é representado por mais de uma variável e é normalmente indexado
pelo tempo, como, por exemplo, na situação 𝑅𝑅' → 𝑈𝑈' → 𝑅𝑅'(! (e.g. 𝑅𝑅 é renda e 𝑈𝑈
escolaridade). O ponto relevante aqui é observar que 𝑅𝑅' e 𝑅𝑅'(! – embora representem o
5
Do inglês Parents.
Tecnicamente, a substituição do operador 𝑑𝑑𝑑𝑑(𝑥𝑥) por 𝑥𝑥 foi possível, pois 𝑃𝑃E𝑦𝑦, 𝑥𝑥 2 |𝑑𝑑𝑑𝑑(𝑥𝑥)H = 0,
se 𝑥𝑥′ ≠ 𝑥𝑥, e 𝑃𝑃E𝑥𝑥|𝑑𝑑𝑑𝑑(𝑥𝑥)H = 1. Porém, aqui o fato realmente relevante é a representação da
quantidade contrafactual 𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H em termos das quantidades estimáveis 𝑃𝑃(𝑦𝑦|𝑤𝑤, 𝑥𝑥) e
𝑃𝑃(𝑤𝑤), se 𝑊𝑊 for observável. Caso alguns dos componentes de 𝑊𝑊 sejam não observáveis, a
situação se complica, pois não se pode estimar 𝑃𝑃(𝑦𝑦|𝑥𝑥, 𝑤𝑤). Uma possibilidade seria
incrementar o diagrama causal (desde que respaldados pela teoria) de forma a tornar o
efeito identificável utilizando-se outros critérios, a exemplo dos que serão vistos mais
adiante neste capítulo. Por fim, observa-se que a fórmula anterior é um caso particular de
um resultado mais geral: basta que os pais de 𝑋𝑋 sejam observáveis para que o efeito causal
𝑃𝑃E𝑦𝑦M𝑑𝑑𝑑𝑑(𝑥𝑥)H seja identificável de acordo com a fórmula.
6
Randomized Controlled Trial (RCT)
Na próxima seção, veremos dois critérios bastante poderosos para a identificação de efeitos
causais em situações consideravelmente mais complexas do que a descrita nos parágrafos
anteriores. Esses critérios são elaborados em termos de estruturas ou padrões de
dependência (cadeias, bifurcações e colisoras) extremamente simples e que podem ser
visualizadas considerando-se três variáveis quaisquer (W , V e T) em um DAG, tais como
ilustradas na Figura 5 e descritas com mais pormenores na sequência.
𝑊𝑊 𝑉𝑉 𝑇𝑇 𝑊𝑊 𝑉𝑉 𝑇𝑇
(a) Cadeia (b) Bifurcação
𝑊𝑊 𝑉𝑉 𝑇𝑇
(c) Colisor
4.1 Cadeia
Quando W causa V e esse, por sua vez, causa T, como na Figura 5(a), diz-se que formam
uma cadeia. Por exemplo, de modo simplificado, o Programa Mais Médicos (W) afeta o
número de consultas pré-natal (V), que, por sua vez, afeta a mortalidade materna (T). Se
a distribuição conjunta de W, V e T é compatível8 com o grafo da Figura 5(a), há
dependência entre todas as variáveis. No entanto, condicionadas em V, as variáveis W e 𝑇𝑇
tornam-se independentes. Em outras palavras, W e T são condicionalmente
independentes dado V e escreve-se 𝑊𝑊 ⊥ 𝑇𝑇𝑇𝑇𝑇. Alguns autores utilizam o termo overcontrol
bias para se referirem à situação em que um viés causal é introduzido por se condicionar a
distribuição de duas variáveis em uma cadeia causal pela variável mediando-as (isto é, no
meio da cadeia) (ELWERT, 2013; ELWERT et al., 2014; CINELLI et al., 2021). No exemplo
anterior, ilustrado na Figura 5(a), ao se fixar determinado número de consultas pré-natal, o
efeito do PMM na mortalidade materna (Z) não pode ser mais capturado.
7
Chain, Fork & Collider.
8
A distribuição conjunta 𝑃𝑃(𝑥𝑥! , … , 𝑥𝑥" ) das variáveis (𝑋𝑋! , … , 𝑋𝑋" ) que compõem um grafo causal 𝒢𝒢 e o referido
grafo são compatíveis se 𝑃𝑃(𝑥𝑥! , … , 𝑥𝑥" ) admitir a decomposição 𝑃𝑃(𝑥𝑥! , … , 𝑥𝑥" ) = ∏"#$! 𝑃𝑃(𝑥𝑥# |𝑝𝑝𝑎𝑎# ).
Quando W e T possuem V como causa em comum, como na Figura 5(b), diz-se que essas
formam uma bifurcação. Um exemplo típico dessa estrutura poderia ser definido pelo
papel da renda familiar (V) que afeta a alocação no Programa Bolsa Família (W) e também
o número de infecções por sífilis (T). Assim como no caso anterior, há dependência entre
todas variáveis envolvidas nas relações expressas pelo grafo da Figura 5(b), contudo, as
variáveis W e 𝑇𝑇 são condicionalmente independentes dado V, isto é, 𝑊𝑊 ⊥ 𝑇𝑇|𝑉𝑉.
4.3 Colisor
Se W e T são causas de V, como na Figura 5(c), diz-se que W e T estão em colisão e que
𝑉𝑉 é uma variável colisora. Para ilustrar, suponha-se que 𝑊𝑊 indique infecção por H1N1, T
infecção por Covid-19 e 𝑉𝑉 admissão hospitalar (por infecção respiratória). Diferentemente
dos casos anteriores, W e 𝑇𝑇 são (marginalmente) independentes. Porém, uma correlação
espúria entre W e 𝑇𝑇 é induzida quando se condiciona em 𝑉𝑉.
Figura 6 - Viés induzido por um colisor condicionar em 𝑌𝑌 pode induzir um viés (positivo ou
negativo) no efeito de 𝑋𝑋 sobre 𝑌𝑌. Greenland et al.
(1999a), por exemplo, consideram o caso em que 𝑌𝑌
representa o sangramento uterino, 𝑋𝑋 o nível de
estrogênio e 𝑍𝑍 o câncer de endométrio. Eles observam
Fonte: eleboração própria.
que a associação entre estrogênio e câncer de endométrio é “drasticamente reduzida”
quando avaliada em níveis distintos de sangramento uterino. No entanto, como se observa
no mesmo artigo, o mais plausível é que, em vez de remover um potencial viés causal entre
𝑋𝑋 e 𝑍𝑍 ao condicionar em 𝑌𝑌, o que se observou foi uma redução enviesada da associação
entre essas. Como se verá mais adiante, sendo a Figura 6 a representação correta do
fenômeno, o ideal seria modelar a incidência de câncer do endométrio apenas em função
do nível de estrogêncio sem condicionar nos níveis de sangramento uterino. A relação entre
sangramento e uso de estrogênio aumenta a taxa de detecção de câncer (bias de
detecção).
5.1 d-Separação
O critério da d-separação identifica se dois conjuntos de covariáveis (𝑋𝑋 e 𝑌𝑌, por exemplo)
são condicionalmente independentes, dado um terceiro conjunto de variáveis 𝒁𝒁. A letra d
em d-separação refere-se à palavra “direcionado”. Formalmente, um caminho 𝑐𝑐 em 𝒢𝒢 é dito
bloqueado ou d-separado por um conjunto de variáveis 𝒁𝒁 se ao menos uma das seguintes
condições se verificar:
(D1) 𝑐𝑐 contém uma cadeia 𝑊𝑊! → 𝑍𝑍! → 𝑊𝑊" ou uma bifurcação 𝑊𝑊! ← 𝑍𝑍! → 𝑊𝑊" com 𝑍𝑍! em 𝒁𝒁;
ou (D2) 𝑐𝑐 contém um colisor 𝑊𝑊, tal que 𝑊𝑊 e nenhum dos seus descendentes estão contidos
em 𝒁𝒁.
Na Figura 2, por exemplo, há dois caminhos que conectam X e Y que não partem de X, a
saber, 𝑐𝑐! : X ← W! → 𝑊𝑊" ← 𝑊𝑊$ → 𝑌𝑌 e 𝑐𝑐" : X ← W" ← 𝑊𝑊$ → 𝑌𝑌. Pelo critério da d-separação,
𝒁𝒁 = {𝑊𝑊$ } é suficiente para bloquear ambos os caminhos, pois ambos são bloqueados por
𝑊𝑊$ , pois contêm uma bifurcação na qual 𝑊𝑊$ é a causa comum. Note-se que, além disso, o
caminho 𝑐𝑐! é naturalmente bloqueado por 𝑊𝑊" , que atua como variável colisora. Em outras
palavras, se o grafo da Figura 2 descreve o mecanismo de interesse, ao se condicionar em
𝑊𝑊$ , faz-se com que toda dependência entre 𝑋𝑋 e 𝑌𝑌 se dê exclusivamente através do caminho
“direto” 𝑋𝑋 → 𝑌𝑌. Aplicando-se o critério de d-separação, a única variável de ajuste para
controlar o confundimento para a relação entre 𝑋𝑋 e 𝑌𝑌 é W3. Observe-se, em particular, que
𝑊𝑊" intercepta tanto 𝑐𝑐! quanto 𝑐𝑐" e que uma abordagem mais ingênua poderia usá-la para
tentar controlar o confundimento entre 𝑋𝑋 e 𝑌𝑌. No entanto, ao se fazer isso, o caminho 𝑐𝑐! ,
que estava bloqueado por W3, seria “desbloqueado” e se induziria, dessa forma, uma
correlação espúria entre a exposição e o desfecho.
Assim, controlando-se por 𝒁𝒁, garante-se que toda dependência residual entre X e 𝑌𝑌 se dê
unicamente pelo caminho partindo de X. De fato, se 𝒁𝒁 satisfaz o critério da porta dos fundos
em relação a X e 𝑌𝑌, então o efeito causal de 𝑋𝑋 sobre 𝑌𝑌 é identificável e dado por10.
9
Do inglês Backdoor criterion.
10
Teorema 3.3.2, Pearl (2009, p. 79).
11
No ajuste via regressão, o IC para o efeito de interesse com nível de confiança de 95% é (-0,22;0,08) e no
ajuste via PSM é (-0,31;0,00).
12
Do inglês Frontdoor criterion.
(c) todos os caminhos de 𝑽𝑽 para 𝑌𝑌 apontando para 𝑽𝑽 são bloqueados por 𝑋𝑋.
Sob esse critério, vale a seguinte forma de identificação do efeito de 𝑋𝑋 sobre 𝑌𝑌: se 𝑽𝑽 satisfaz
o critério da porta da frente em relação a X e 𝑌𝑌 e P(𝑥𝑥, 𝑣𝑣) > 0, então o efeito causal de 𝑋𝑋
sobre 𝑌𝑌 é identificável e dado por13
Exemplo 5. O grafo da Figura 9, uma variação do grafo da Figura 2, é utilizado para ilustrar
o critério da porta da frente, com a diferença de que (i) a variável 𝑊𝑊$ foi renomeada para 𝑁𝑁
para ressaltar o fato de que agora está se assumindo não-observável e (ii) uma nova
variável 𝑉𝑉 entre 𝑋𝑋 e 𝑌𝑌 foi incluída. Em princípio, a variável 𝑉𝑉 mediando 𝑋𝑋 e 𝑌𝑌 poderia ser
algum elemento inicialmente desprezado pelo investigador, dado que seu interesse
primordial é o efeito total de 𝑋𝑋 sobre 𝑌𝑌, a despeito de qualquer possível mediação entre
elas.
13
Teorema 3.3.4, Pearl (2009, p. 83).
9 Mediação causal
A Figura 10 representa o mecanismo básico com o qual se quer lidar. Para que uma
variável se qualifique como mediadora, é preciso que exista uma precedência temporal, ou
seja, M deve ocorrer posteriormente a 𝑋𝑋 e anteriormente a 𝑌𝑌. Porém, na realidade, o que
determina um mediador é a teoria científica que respalda o mecanismo causal escolhido
(IMAI et al., 2010). Um exemplo de análise de mediação na avaliação de políticas públicas
em saúde é descrito por Anselmi e colaboradores (2017), no qual se faz a avaliação de
impacto de um programa de pagamento por desempenho (P4P=payment for performance)
(exposição, X) conduzido na Tanzânia, sobre a atenção à saúde materna (Y), mediado pela
cobertura dos serviços de saúde (mediador M).
Normalmente o interesse primordial é o efeito de 𝑋𝑋 sobre 𝑌𝑌, porém, no caso ilustrado pela
Figura 10, há dois caminhos pelos quais essa influência “flui”: um direto 𝑋𝑋 → 𝑌𝑌 e outro
indireto ou mediado 𝑋𝑋 → 𝑀𝑀 → 𝑌𝑌. A influência direta de 𝑋𝑋 sobre 𝑌𝑌 é mais fácil de se
identificar. Por exemplo, pode-se fixar 𝑀𝑀 em um nível 𝑚𝑚 e estimar o chamado efeito direto
controlado (EDC), que é definido por
𝐸𝐸𝐸𝐸𝐸𝐸(𝑚𝑚) = 𝐸𝐸 [𝑌𝑌/9 − 𝑌𝑌/ & 9 ] = 𝐸𝐸 [𝑌𝑌𝑌𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥𝑥 𝑀𝑀 = 𝑚𝑚𝑚] − 𝐸𝐸 [𝑌𝑌𝑌𝑑𝑑𝑑𝑑(𝑋𝑋 = 𝑥𝑥𝑥𝑥 𝑀𝑀 = 𝑚𝑚𝑚].
A estratégia acima é inviável para a identificação do efeito indireto de 𝑋𝑋 sobre 𝑌𝑌, pois não
há maneira óbvia de se bloquear o “fluxo causal” pelo caminho direto 𝑋𝑋 → 𝑌𝑌. Um enfoque
menos intuitivo, baseado em intervenções pontuais, tanto sobre o tratamento quanto sobre
a mediação, foi sugerido por Robins e Greenland (1992) e Pearl (2001). Chama-se de efeito
direto natural a quantidade14 𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) = 𝐸𝐸 Å𝑌𝑌/:'& − 𝑌𝑌/ & ('& |𝑐𝑐Ç e de efeito indireto natural
𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) = 𝐸𝐸 Å𝑌𝑌/:' − 𝑌𝑌/: & |𝑐𝑐Ç. O NDE reflete a diferença esperada nos desfechos quando se
'
identidade 𝑌𝑌/ = 𝑌𝑌/:' implica que o efeito total 𝑇𝑇𝑇𝑇(𝑐𝑐) = 𝐸𝐸 Å𝑌𝑌/:' − 𝑌𝑌/2:'& |𝑐𝑐Ç é exatamente
igual à soma dos efeitos naturais direto e indireto, i.e., 𝑇𝑇𝑇𝑇(𝑐𝑐) = 𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐) + 𝑁𝑁𝑁𝑁𝑁𝑁(𝑐𝑐).
14
Em inglês utilizam-se as nomenclaturas Natural Direct Effect e Natural Indirect Effect, daí os acrônimos
NDE e NIE. Por serem bastante difundidos, esses serão mantidos no texto em vez dos correspondentes em
português EDN e EIN. Isso também vale para o efeito total.
Também por causa dos contrafactuais encaixados, a identificação dos efeitos direto e
indireto é um pouco mais complicada. No entanto, sob as condições de identificabilidade
(A1) – (A4) descritas abaixo15 (PEARL, 2001) os efeitos naturais direto e indireto são
identificáveis
Por fim, vale observar que o conceito de mediação acima apresentado, embora bastante
geral, possui suas limitações. Possivelmente, a principal é o fato de que 𝑀𝑀 deve ser tratado
como um elemento único (porém, não necessariamente escalar). Em aplicações nas quais
os efeitos de múltiplos mediadores devem ser avaliados individualmente, outras
considerações precisam ser levadas em conta. Além disso, pode-se desejar avaliar o efeito
da mediação em escalas diferentes das apresentadas acima. Diversos trabalhos são
15
A condição (A4) pode ser ignorada se se garantir que a inexistência de confundimento pós-tratamento, isto
é, todo confundimento (exposição/mediador, exposição/desfecho e mediador/desfecho) é devido a
covariáveis basais (IMAI et al., 2010).
DAGitty.net é um ambiente virtual que fornece ferramentas para construir, editar e analisar
diagramas causais e pode ser usado diretamente no R por meio dos pacotes dagitty e
ggdag, os quais foram usados para a construção das Figuras 11- 14. Os primeiros passos
incluem a criação do DAG usando linguagem simbólica do DAGitty, com especificação das
variáveis ou nós (nodes, na nomenclatura do dagitty) e das arestas, incorporando a
definição de pais, filhos, ancestrais e descendentes dos nós. Por exemplo, a Figura 11(a)
ilustra um DAG que representa uma bifurcação, enquanto a Figura 11(b) ilustra a utilização
de cores e legenda para discriminar confundidores (pais) de tratamento (filhos), na qual a
e b denotam os confundidores da relação entre x e y. Todas as variáveis/vértices são
representadas por círculos nos diagramas causais construídos pelo daggity no R.
(a)
(a) (b) (b)
Figura 12 - DAG para avaliar relação causal entre APS como fonte usual do cuidado e
hospitalização por doenças crônicas
Para estudar o efeito causal do uso da APS sobre a hospitalização por doenças crônicas,
deve-se avaliar todos os caminhos backdoor e produtores de confundimento na relação
entre as variáveis de interesse. Cadeias e bifurcações são caminhos abertos em um DAG
e todos os caminhos abertos entre a exposição e o desfecho podem ser listados com o uso
da função ggdag_paths() do pacote ggdag do R, conforme mostrado na Figura 13 (a).
(a) (b)
(c)
Diferentes estratégias podem ser adotadas para bloquear esse caminho backdoor. No
entanto, o ajuste por colisores ou mediadores pode introduzir um viés. Considerando-se um
determinado DAG, existem ferramentas computacionais para testar implicações de
suposições implícitas no diagrama causal e sugerir conjuntos de variáveis a serem
controladas para identificação do efeito causal (ANKAN et al., 2021). Nesse sentido podem
ser definidos conjuntos de variáveis minimamente suficientes, ou seja, conjuntos de
variáveis que, quando controladas, bloqueiam todos os caminhos backdoor. Quando
variáveis importantes do DAG são não-mensuradas/latentes, pode não ser possível
produzir esses conjuntos suficientes para bloquear esses caminhos. No exemplo da Figura
12 esse conjunto é constituído por uma única variável, a saber, o conhecimento sobre a
doença. Em outras palavras, se o mecanismo causal descrito pelo DAG estiver correto,
pode-se obter uma estimativa não enviesada do efeito causal do uso da APS sobre as
hospitalizações por doenças crônicas simplesmente controlando (ajustando) pelo
conhecimento sobre a doença. O conjunto minimamente suficiente de variáveis a ser
incluído no ajuste pode ser encontrado com auxílio da função ggdag_adjustment_set() do
(a) (b)
(c) (d)
Considere-se agora um segundo exemplo para ilustrar o viés que pode resultar em análises
com um colisor, conforme a Figura 5(c). Para essa discussão considere novamente a
relação entre H1N1, COVID-19 e admissão hospitalar (por infecção respiratória) como
ilustrada pelo DAG da Figura 14(a). H1N1 e COVID-19 são independentes, pois são
Outra forma menos óbvia de viés devido à estratificação pela presença do colisor ocorre
quando se faz o ajuste por um descendente de colisor. Para ilustrar, considere a Figura
14(d), em que se acrescentou uma medicação (ibuprofeno) que poderia ser usada durante
a hospitalização por quaisquer das duas viroses. Nesse caso, a inclusão de ibuprofeno no
ajuste do modelo torna H1N1 e COVID-19 associados (d-conectados). Esse tipo de
avaliação pode se tornar ainda mais difícil em DAGs muito complexos porque algumas
vezes colisores são também confundidores. Os caminhos contendo colisores estão
naturalmente bloqueados. Porém, um colisor em um caminho pode não ser colisor em outro
caminho e confundir a relação entre exposição e desfecho. Assim, é perfeitamente possível
que eventualmente o investigador julgue necessário ajustar pela variável colisora. Nesses
casos, deve-se adotar uma estratégia para remover o viés resultante da inclusão da variável
colisora.
11 Considerações finais
As relações causais descritas com auxílio dos diagramas causais e equações estruturais
empregam conceitos e terminologia da teoria de grafos sumarizados neste capítulo e outros
critérios importantes para avaliação de d-separação, tendo sua implementação sido
ilustrada por meio do uso de funções disponíveis em software estatístico que facilitam a
A estimação do efeito causal total pode ser feita usando a Eq.1 ou outro método, como os
descritos nos capítulos 11-14. Para tal:
a) todos os caminhos não causais devem estar bloqueados para obtenção de estimativa sem
viés, conforme sintetizado no passo (2);
b) a identificação do efeito causal depende da validade do diagrama causal postulado, ou
seja, assume-se que o DAG corretamente retrata o fenômeno.
Exercícios de fixação
ANKAN, A.; WORTEL, I. M. N.; TEXTOR, J. Testing graphical causal models using the R
package “dagitty”. Current Protocols, v. 1, p. 1-22, 2021. DOI: 10.1002/cpz1.45.
ANSELMI, L.; BINYARUKA, P.; BORGHI, J. Understanding causal pathways within health
systems policy evaluation through mediation analysis: an application to payment for
performance (P4P) in Tanzania. Implementation Science, v. 12, n. 10, p. 1-18, 2017.
DOI:10.1186/s13012-016-0540-1.
BARRETT, M. ggdag: an R Package for visualizing and analyzing causal directed acyclic
graphs. 2021. Disponível em: https://github.com/malcolmbarrett/ggdag. Acesso em: 20
ago. 2022.
CAMERON, D. B.; MISHRA, A.; BROWN, A. N. The growth of impact evaluation for
international development: how much have we learned? Journal of Development
Effectiveness, v. 8, n. 1, p. 1-21, 2016. DOI: https://doi.org/10.1080/19439342.2015.
1034156.
CINELLI, C.; FORNEY, A.; PEARL, J. Crash course in good and bad controls: technical
report R-493. 2021. Disponível em: https://ftp.cs.ucla.edu/pub/stat_ser/r493.pdf. Acesso
em: 20 ago. 2022.
COX, D. R. Planning of experiments. New York: John Wiley & Sons, 1958.
DANIEL, R. et al. Causal mediation analysis with multiple mediators. Biometrics, v. 71, n.
1, p. 1-14, 2015. Disponível em: https://onlinelibrary.wiley.com/doi/epdf/ 10.1111/biom.
12248. Acesso em: 20 ago. 2022.
IMAI, K.; KEELE, L.; YMAMOTO, T. Identification, inference and sensitivity analysis for
causal mediation effects. Statistical Science, v. 25, n. 1, p. 51-71, 2010. DOI:
10.1214/10-STS321.
PEARL, J. Graphs, causality and structural equation models. Sociological Methods and
Research, v. 27, n. 2, p. 226-284, 1998. Disponível em: https://ftp.cs.ucla.edu/pub/stat_
ser/r253-reprint.pdf. Acesso em: 20 ago. 2022.
PEARL, J.; GLYMOUR, M.; JEWELL, N. P. Causal inference in statistics. New York:
Wiley, 2016.
PEARSON, K. The grammar of science. New York: Cosimo, 1911.
ROBINS, J. M.; GREENLAND, S. Identifiability and exchangeability for direct and indirect
effects. Epidemiology, v. 3, p. 143-155, 1992. DOI: 10.1097/00001648-199203000-
00013.
ROBINS, J.; HERNÁN, M.; BRUMBACK, B. Marginal structural models and causal
inference in epidemiology. Epidemiology, v. 11, p. 550-560, 2000.
SALMON, W. A third dogma of empiricism. In: BUTTS, R.; HINTIKKA, J. (ed.). Basic
problems in methodology and linguistics. Dordrecht: D. Reidel, 1977. p. 149-166.
SHRIER, I.; PLATT, R. W. Reducing bias through direct acyclic graphs. BMC Medical
Research Methodology, v. 8, n. 70, p. 1-15, 2008. Disponível em:
https://bmcmedresmethodol.biomedcentral.com/articles/10.1186/1471-2288-8-70. Acesso
em: 20 ago. 2022.
SIMON, H. A. Causal ordering and identifiability. In: HOOD, C.; KOOPMAN, T. C. (ed.).
Studies in econometric methods. New York: Wiley and Sons Inc, 1953. p. 49-74.
SPIRTES, P.; GLYMOUR, C.; SCHEINES, R. Causation, prediction and search. 2nd ed.
Cambridge: MIT Press, 2001.
TADDEO, M. M.; AMORIM, L. D. Causal mediation for survival data: a unifying approach
via GLM. Revista Colombiana de Estadística, v. 45, n. 1, p. 161-191, 2022. DOI:
http://doi.org/10.15446/rce.v45n1.94553.
WU, C. DAG: Stata module to provide utilities for directed acyclic graphs. 2019. Disponível
em: https://EconPapers.repec.org/RePEc:boc:bocode:s458467. Acesso em: 20 ago. 2022.
Ancestral Uma causa direta (ou seja, pai) ou causa indireta (por exemplo,
avô) de uma variável específica.
Causa em Uma variável que causa duas ou mais outras variáveis. No
comum contexto de um DAG, uma variável que é, ao mesmo tempo, uma
ancestral de duas outras variáveis.
Colisor Variável que é ao mesmo tempo o efeito direto de outras duas
variáveis.
Condicionar em Uso de restrição amostral ou estratificação/regressão para
uma variável examinar a associação de exposição e desfecho dentro dos
níveis da variável condicionada.
Confundidor O confundidor é uma causa em comum para duas variáveis
(ou viés de distintas. Pode-se também considerar ancestrais de duas
confundimento) variáveis como um elemento de confundimento entre elas.
Correlação Ocorre quando duas ou mais variáveis são correlacionadas,
espúria porém, sem uma relação causal entre si. Especificamente em
estruturas com colisores, correlações espúrias são induzidas ao
se condicionar na variável colisora.
Critério da Critério de identificação causal baseado em d-separação que faz
Porta da Frente uso de variáveis intermediárias entre a exposição e o desfecho.
Critério da Critério de identificação causal baseado em d-separação que faz
Porta dos uso das variáveis confundidoras.
Fundos
d-separação Critério usado para decidir se um determinado conjunto de
variáveis (X) é condicionalmente independente de outro (Y)
quando condicionamos em um terceiro conjunto de variáveis (Z).
Descendente Efeito direto (ou seja, filho) ou efeito indireto (por exemplo, neto)
de uma determinada variável.
Efeito direto Na presença de uma variável mediadora, o efeito direto
controlado controlado é efeito direto da exposição sobre o desfecho em
níveis (estratos) fixados do mediador.
Efeito direto Ao se comparar a discrepância no efeito de dois tratamentos
natural (NDE) distintos (sendo um deles considerado o tratamento “natural”)
sobre um desfecho e na presença de uma variável mediadora, o
efeito direto natural é o efeito da exposição sobre o desfecho
RESUMO:
Este capítulo tem o objetivo de fornecer um guia prático sobre os diferentes modelos utilizados na
avaliação de impacto. De forma geral, são discutidos os fundamentos dos modelos experimentais e
não-experimentais aplicados à avaliação de programas ou políticas públicas em saúde. Além disso,
apresenta uma árvore de decisão metodológica, cujo foco consiste em discutir os desafios e subsidiar
o pesquisador em saúde a respeito da escolha da metodologia mais adequada.
PALAVRAS-CHAVE:
Métodos experimentais e não-experimentais. Avaliação em saúde. Árvore de decisão.
Este capítulo tem como objetivo fornecer um guia prático para a escolha da metodologia
mais adequada de avaliação de impacto. Para isso, serão discutidos os fundamentos a
respeito do uso de modelos experimentais e não-experimentais aplicados à avaliação de
programas ou políticas públicas em saúde. De forma geral, serão discutidos os critérios
básicos para a definição lógica da escolha da metodologia frente aos diversos desafios da
avaliação. Tais desafios envolvem, por exemplo, a forma de seleção dos beneficiários para
o tratamento, a disponibilidade e estrutura de dados disponíveis e a influência de fatores
externos e não observados pelo avaliador.
Vale ressaltar que uma avaliação de impacto bem conduzida é composta de oito etapas
básicas. A Figura 1 exibe uma sequência conceitual para o desenvolvimento de um estudo
avaliativo focado na identificação de efeitos causais de uma intervenção, partindo-se da
delimitação do problema de avaliação da comunicação e disseminação das evidências
encontradas. Destaca-se que não necessariamente o desenvolvimento do estudo precisa
seguir a sequência definida na Figura 1, mas via de regra essa seria a ordem esperada.
A revisão da literatura especializada é uma etapa importante para verificar o que existe
acerca de estudos sobre a política de interesse, as variáveis utilizadas, as estratégias de
identificação e os principais resultados, bem como mapear como a avaliação de impacto
que será desenvolvida pode dar sua contribuição sobre o tema.
Do ponto de vista técnico, a avaliação de impacto na área da saúde não possui diferenças
específicas no que tange às etapas iniciais, mas provavelmente a depender da natureza do
problema e do nível de desagregação da análise, será necessário um conjunto de dados
individualizados (microdados) que podem estar sujeitos às restrições da Lei Geral de
Proteção de Dados Pessoais (LGPD)1, do sigilo médico e outros dados sensíveis,
sobretudo pelo fato de algumas estratégias metodológicas requererem dados longitudinais
dos indivíduos beneficiados e não beneficiados pela política em saúde.
Como destacado, os dados para uma avaliação de impacto precisam ser obtidos para
grupos de indivíduos tratados e não tratados, em que é obrigatória a identificação da
condição de tratamento e dos indicadores que mensuram impactos atribuíveis direta ou
indiretamente às ações da política ou programa de interesse. Além desse conjunto
1
Lei nº 13.709, de 14 de agosto de 2018, que versa sobre a proteção de dados pessoais. No capítulo 15
deste livro, inclusive, há uma discussão sobre dados pessoais e sensíveis a partir da LGPD.
Mesmo considerando-se apenas o primeiro grupo (o dos indivíduos que têm dor de
cabeça com regularidade), o efeito do medicamento pode ser ambíguo. O efeito
poderia ser observado apenas para os participantes com perfil específico, enquanto
para os demais a redução da incidência seria observada mesmo na ausência do
tratamento (tomar o medicamento). Tais situações levantam algumas questões
importantes sobre como o tratamento pode ser diferente entre indivíduos, seja por
fatores relacionados à idade, sexo, hábitos saudáveis de saúde ou a incidência de
outras doenças preexistentes. Uma possível abordagem quando o tratamento é
heterogêneo, ou seja, varia para cada indivíduo, é observar a distribuição dos efeitos
Para se entender qual tipo de efeito está sendo estimado, considere-se um cenário
em que o pesquisador consiga observar os resultados potenciais para um grupo de
quatro indivíduos que compõem o experimento. Suponha-se que as unidades são
designadas de forma aleatória ao grupo de tratamento ou de controle.
1 M Sim 2 1 1
2 F Não 5 1 4
3 F Sim 5 2 3
4 M Não 4 2 2
Fonte: elaboração própria.
Cada linha da tabela apresenta informações para um indivíduo, sendo a amostra total
composta por dois indivíduos do sexo masculino e dois do sexo feminino. A terceira coluna
indica o status da intervenção: tratado ou não tratado. As colunas seguintes (4 e 5) indicam
os resultados potenciais de cada indivíduo, ou seja, os resultados que seriam observados
caso o indivíduo fosse tratado – Y(1) – e caso não fosse tratado – Y(0). Como se sabe, não
é possível observar ambas as situações simultaneamente para cada indivíduo. Portanto,
nos dados reais, observamos apenas Y(1) para as unidades que foram tratadas, enquanto
observamos apenas Y(0) para os indivíduos não tratados. No entanto, tal exemplo é útil
para se entender como diferentes efeitos são obtidos de acordo com a configuração dos
grupos.
Antes de iniciarmos, é válido destacar que esse tipo de abordagem usada neste capítulo
tem limitações, contudo é uma tentativa de facilitar, sobretudo, para aqueles pesquisadores
que estão iniciando na área de avaliação de impacto. A Figura 2 apresenta uma árvore de
decisão metodológica em avaliação de impacto, cujo processo de escolha é guiado por
questões balizadoras com resposta binária (sim ou não). A primeira questão balizadora é:
a atribuição de tratamento para participação no programa foi por meio de um sorteio
(escolha aleatória)?
2
Tanto os indivíduos quanto a equipe de avaliação não deveriam saber quais pessoas integrariam o grupo
de tratamento nem as que integrariam o grupo de controle até que o experimento terminasse, a fim de garantir
melhor identificação das relações de causa e efeito do programa (CONNERS et al., 1976; KERSHNER;
HAWKE, 1979).
Caso a resposta para a questão 02 seja não, ou seja, não houve falhas na
execução do desenho experimental do programa, enfim haveria como definir
o método estatístico para mensuração do efeito médio de tratamento sobre
os tratados (ATT): teste de diferença de médias entre o GT e GC ou modelo
onde 𝑦𝑦𝑖𝑖 é o indicador de impacto para o i-ésimo indivíduo, 𝑇𝑇𝑖𝑖 representa uma
variável binária indicadora de tratamento e 𝑢𝑢𝑖𝑖 é o termo de erro aleatório do
modelo. Os termos 𝛼𝛼 e 𝛿𝛿 são os parâmetros a serem estimados e o ATT seria
dado pelo o coeficiente 𝛿𝛿. Os resultados da eq. (1) se equivaleriam a um teste
de diferença de média.
Se, por outro lado, fosse identificada alguma possível falha de implementação
no desenho experimental, ou seja, uma resposta positiva para a questão 02,
a escolha do método estatístico geralmente usada nesses casos poderia ser
a do modelo de regressão com variáveis instrumentais (VI).
Essa estratégia, por exemplo, foi adotada por Barros et al. (2011), os quais
constataram uma falha na execução do desenho experimental para avaliação
do impacto do acesso às creches gratuitas sobre o mercado de trabalho das
mulheres na cidade do Rio de Janeiro. Como foram identificados problemas
nas atribuições aleatórias3 entre os sorteados para vagas nas creches entre
GT e GC, os autores fizeram uso do método de Variável Instrumental (VI) para
estimar o Efeito Médio Local do Tratamento (LATE). A Equação 2 apresenta
o estimador de Wald para a estimação do impacto, usando o sorteio como
variável instrumental (Z) do modelo.
3
94% das crianças sorteadas para compor o GT estavam sendo tratadas, enquanto 51% das sorteadas para
o GC também estavam sob algum tratamento.
Bastante comum nas ciências sociais para avaliação programas e políticas públicas,
os métodos quase-experimentais (o termo quase, derivado do latim quasi pode ser
traduzido por “como se fosse”, “de certa maneira”) utilizam técnicas estatísticas para
obterem o melhor grupo de comparação possível para as unidades tratadas.
Diversas metodologias têm sido desenvolvidas ao longo do tempo para encontrar o
contrafactual do grupo de tratamento, ou seja, um grupo com características
parecidas e que representa o que teria acontecido às unidades tratadas se não
fossem sujeitas à intervenção. Os principais métodos não-experimentais serão
apresentados a seguir, tendo por base a sequência lógica disposta na Figura 2 para
auxiliar o pesquisador na escolha do modelo.
3.2.1 Pareamento
Caso a resposta seja positiva, seria possível fazer uso do modelo de variáveis
instrumentais (VI). Como destacado por Angrist (1990), a utilização de VI tem
como grande desafio a escolha de um bom instrumento. Ademais, a forma de
interpretar os efeitos de tratamento fica mais restrita, ou seja, teríamos um
Efeito Médio de Tratamento Local (Local Average Treatment Effect – LATE).
O capítulo 14 apresenta maiores detalhamentos sobre o modelo de variáveis
instrumentais.
ANGRIST, J. D. Lifetime earnings and the Vietnam era draft lottery: evidence from social
security administrative records. The American Economic Review, v. 80, n. 3, p. 313-336,
1990.
BARROS, R. P. et al. The impact of access to free childcare on women's labor market
outcomes: evidence from a randomized trial in low-income neighborhoods of Rio de
Janeiro. In: WORLD BANK ECONOMISTS’ FORUM, Mar. 2011, Rio de Janeiro. Prepared
for [...]. Rio de Janeiro, 2011. Disponível em: https://citeseerx.ist.psu.edu/viewdoc
/download?doi=10.1.1.258.5722&rep=rep1&type=pdf. Acesso em: 7 set. 2022.
CARRILLO, B.; FERES, J. Provider supply, utilization, and infant health: evidence from a
physician distribution policy. American Economic Journal: Economic Policy, v. 11, n. 3,
p. 156-196, 2019.
DUFLO, E.; DUPAS, P.; KREMER, M. Education, HIV, and early fertility: experimental
evidence from Kenya. American Economic Review, v. 105, n. 9, p. 2757-2797, Sep. 2015.
SNOW, J. Cholera, and the water supply in the south districts of London. British Medical
Journal, v. 1, n. 42, p. 864-865, 1857.
1
Fundação Getúlio Vargas (FGV), Escola de Economia de São Paulo (EESP), Centro de
Aprendizagem em Avaliação e Resultados para a África Lusófona e Brasil (CLEAR)
RESUMO:
O objetivo deste capítulo é discutir a importância dos experimentos aleatórios para políticas
públicas em saúde e expor os aspectos técnicos necessários para que o leitor possa implementar
experimentos na prática. Mostram-se também os aspectos conceituais do método experimental para
avaliar o impacto causal de uma intervenção, bem como alguns exemplos de seu uso. Dessa maneira,
o capítulo apresenta uma ferramenta de avaliação que fornece resultados que podem direcionar
futuras políticas e expansões de programas existentes, ou seja, embasar e solidificar a tomada de
decisões do gestor público.
PALAVRAS-CHAVE:
Experimentos aleatórios. Avaliação de políticas públicas. Impacto causal.
Cada vez mais o uso de experimentos aleatórios vem se tornando mais usual para a
avaliação de políticas públicas. Isso também vem se tornando cada vez mais comum na
área de saúde. Trata-se de uma forma de dimensionamento dos impactos de uma
intervenção, por meio da randomização daqueles que recebem o tratamento e daqueles
que não o recebem. Na linguagem desse tipo de experimento trata-se, respectivamente,
dos grupos de tratamento e de controle. A principal ideia é ter dois grupos que teriam
desfechos semelhantes na ausência do tratamento ou política (DUFLO et al., 2007)
Com isso, a aleatorização tem uma série de vantagens como tornar a avaliação do
programa mais robusta, além de garantir que os indivíduos elegíveis tenham a mesma
chance de participar do programa. Trata-se de uma maneira justa de alocar os recursos da
política quando a população elegível é igualmente apta para receber determinada
intervenção. Adicionalmente, é extremamente fácil de ser explicada para as pessoas se
comparada a outros métodos mais complicados de alocação de beneficiários, o que permite
O restante deste capítulo irá se organizar da seguinte maneira. Primeiro vai se abordar
conceitos fundamentais relacionados ao que é de fato um contrafactual e como se dá a
estimação dos efeitos usando o método de experimentos aleatórios. Em seguida, tratar-se-
á especificamente de aleatorização em políticas públicas, além de possíveis problemas. Na
próxima seção, serão trazidos alguns exemplos ligados a políticas públicas especificamente
na área de saúde. Para concluir, será realizada uma reflexão sobre o uso dos resultados
de uma avaliação para orientar ações com relação a política pública de fato.
2 Conceitos
𝑌𝑌!" : resultado potencial do indivíduo quando ele não recebe o tratamento (𝑇𝑇! = 0)
Na prática, o efeito da política em determinada pessoa seria dado pela diferença entre
esses dois resultados potenciais. Assim, o impacto causal em cada um dos indivíduos
poderia ser calculado como:
β! = 𝑌𝑌!# − 𝑌𝑌!"
Note-se, no entanto, que no mundo real se observa apenas um deles, pois a pessoa é
tratada ou não é tratada. Assim, toda a questão gira em torno de encontrar o contrafactual
ideal e esse é justamente o papel da aleatorização. Ao se aleatorizar o tratamento, criam-
se dois grupos que podem concretamente ser comparados.
É interessante notar que essa propriedade faz com que as esperanças condicionais sejam
iguais às esperanças não condicionais. Assim tem-se:
𝔼𝔼[𝑌𝑌!" |𝑇𝑇! = 1] = 𝔼𝔼[𝑌𝑌!" |𝑇𝑇! = 0] = 𝔼𝔼[𝑌𝑌!" ]
Como não se observam os efeitos para cada indivíduo, estimam-se efeitos médios na
amostra. Matematicamente, pode-se escrever isso como sendo função das esperanças
condicionais e estimar dois efeitos sobre um resultado de interesse 𝑌𝑌: o Efeito Médio de
Tratamento (ATE) e o Efeito Médio de Tratamento sobre os Tratados (ATT).
ATE: 𝔼𝔼[𝑌𝑌!# − 𝑌𝑌!" ]
A próxima etapa seria, então, como estimar essas quantidades. Para isso utiliza-se o
método de Mínimos Quadrados Ordinários (MQO), que indicará a diferença da média
observada para um desfecho de interesse entre os grupos de tratamento e controle. O MQO
segue a seguinte equação:
𝑌𝑌! = 𝛼𝛼 + 𝛽𝛽𝑇𝑇! + 𝑒𝑒!
onde 𝑋𝑋! é uma característica observável. Aqui, o desejado é que o coeficiente associado à
variável que indica tratamento seja estatisticamente não significante, isto é, igual a zero.
Além do ATE e do ATT, existe um terceiro parâmetro que pode ser de interesse do
pesquisador e esse é estimado quando a participação na intervenção que está sendo
analisada depende da escolha do indivíduo, mas há uma aleatorização que depende da
oferta da participação ou de algum tipo de encorajamento. É o chamado Efeito da Intenção
de Tratar (ITT).
Por fim, vai-se falar dos tipos de aleatorização mais comuns de serem encontrados. Um
importante fator é o chamado mecanismo de designação, o qual determina quais unidades
(indivíduos, grupos, municípios etc.) realmente receberão a política a ser estudada.
Segundo Imbens e Rubin (2015), um experimento clássico é aquele cujo mecanismo de
designação atende a três critérios.
Por fim, há os experimentos com aleatorização por pares. Trata-se do caso extremo do tipo
de experimento anterior, no qual cada estrato é composto de duas unidades. Uma será
A limitação de recursos pode gerar outro tipo de aleatorização no ambiente de uma política
pública: a aleatorização na ordem de entrada, o chamado phase-in. Pode-se estar falando
de uma política pela qual toda a população deva receber a intervenção, não devendo haver,
ao fim da política, um grupo de controle. Assim, pode-se usar um processo de aleatorização
para a entrada gradual dos participantes, ou seja, há uma expansão gradual ao longo do
tempo, na qual a ordem de participação é aleatorizada e, no fim, todos serão eventualmente
tratados.
Essa forma de aleatorização permite avaliar aqueles programas dos quais não se pode
excluir uma parte da população, por exemplo, uma política de acesso ao saneamento
básico. Além disso, o fato de todos serem tratados aumenta a chance de os grupos de
controle também contribuírem para a pesquisa, considerando-se que eventualmente
também receberão tratamento. No entanto, essa expectativa do tratamento pode também
gerar impactos negativos, por poder influenciar o comportamento do grupo de controle.
Esse tipo de aleatorização também dificulta a estimação de resultados no longo prazo, pois
o grupo de controle eventualmente não terá mais nenhum componente. Por fim, caso a
expansão do programa aconteça em ritmo mais acelerado do que o tempo para que essa
surta efeito, não é possível estimar o efeito médio do tratamento.
Por fim, pode-se ter a aleatorização de encorajamento: aqui fala-se de uma situação na
qual aleatorizar o acesso a um programa não é possível, seja por questões práticas ou
éticas. Assim, toda a população tem acesso ao programa. Em situações desse tipo, uma
possibilidade é aleatorizar não a parcela que recebe o tratamento, mas sim a parcela da
população que irá receber encorajamento para participar do programa, aumentando a
probabilidade de que o grupo de tratamento efetivamente receba a política. Podemos
pensar em uma campanha na qual pessoas são sorteadas para receber mensagens via
SMS para receberem a vacina contra a COVID-19.
Os fatores que afetam o MDE são: o tamanho da amostra, a proporção de tratados, o nível
de significância e de poder e a variância do termo de erro. A sua fórmula é a seguinte:
1
𝑀𝑀𝑀𝑀𝑀𝑀 = 𝜎𝜎 ∗ (𝑡𝑡#)* + 𝑡𝑡+ ) ∗ E
𝑁𝑁𝑁𝑁(1 − 𝑃𝑃)
Vamos aos termos: 𝜎𝜎 é o desvio padrão do erro populacional, valor esse desconhecido, que
precisa ser estimado pelo pesquisador. Quanto maior for, maior é o MDE; 𝑡𝑡#)* e 𝑡𝑡+ são os
valores da distribuição t-student associados a, respectivamente, o nível de poder 𝑘𝑘 e 𝛼𝛼.
Esses valores são de escolha do pesquisador e essa escolha envolve um trade-off: maior
poder e significância implicam também maior MDE; 𝑁𝑁 é o tamanho da sua amostra e 𝑃𝑃 é a
proporção de tratados. Note-se que para esse último termo, quanto mais próximo de 0,5
for, menor será o MDE.
5 Problemas possíveis
Apesar das suas vantagens, uma avaliação por si só pode gerar incentivos
comportamentais nos indivíduos envolvidos no estudo (GERTLER et al., 2018). O primeiro
desses é o chamado Efeito Hawthrone: as unidades envolvidas na avaliação alteram seus
comportamentos simplesmente porque estão sendo observadas. Outro é o Efeito John
Henry: as unidades de controle exercem um esforço maior uma vez que não foram
selecionadas para o grupo de tratamento.
Outro comportamento negativo que a avaliação pode gerar é a chamada antecipação: as
unidades do grupo de controle mudam seu comportamento por terem uma expectativa de
receber o programa no futuro. Por fim, há também o chamado viés de substituição: as
unidades que não foram selecionadas para receber o programa podem ser capazes de
encontrar programas substitutos por iniciativa própria.
O problema do atrito ocorre quando partes da amostra não são encontradas ao longo do
tempo ou se recusam a participar do processo de coleta de dados. Se o atrito for aleatório
(não-correlacionado com a designação do tratamento), então perde-se apenas precisão na
estimação. Entretanto, o atrito levará ao viés do estimador de impacto se as unidades que
decidem abandonar o tratamento são sistematicamente diferentes daquelas que
permanecem.
Por fim, destaca-se que o método não é inquestionável e está sob constante escrutínio por
parte da comunidade científica. Deaton (2020) ressalta que como qualquer outro método,
o uso de experimentos aleatórios deve ser feito com cautela. Não se trata de um padrão
ouro à prova de questionamentos e que é mais fácil ou menos problemático do que outros.
Além disso, o autor afirma que as questões mais preocupantes dizem respeito à ética,
especialmente quando pessoas muito pobres são experimentadas. Heckman (2020)
também afirma que os experimentos aleatórios possuem uma série de limitações que são
ignoradas e levam ao questionamento dos resultados apresentados, tanto em estudos mais
antigos quanto em estudos mais recentes.
Miguel e Kremer (2004) referem que o programa reduziu o absenteísmo escolar nas escolas
de tratamento em um quarto. A desparasitação melhorou substancialmente a saúde e a
participação escolar das crianças não tratadas nas escolas de tratamento e nas escolas
vizinhas, implicando que o programa gerou externalidades. Além disso, foram grandes o
suficiente para justificar o tratamento totalmente subsidiado. No entanto, os autores não
encontraram evidências de que a desparasitação melhorou os resultados dos testes
acadêmicos.
O mesmo experimento também foi estudado por outros trabalhos. Aiken et al. (2015) e
Davey et al. (2015) fazem uma reanálise de Miguel e Kremer (2004). Ambos os trabalhos
de reanálise apresentam evidências que continuam sustentando fortemente os resultados
de externalidades positivas do tratamento de desparasitação e impactos da participação
escolar. Além disso, Kremer tem uma série de outros trabalhos que indicam outras políticas
de desparasitação em outros países desenvolvidos
O Reach Up and Learn foi desenvolvido pelo governo jamaicano e tratava-se de uma
intervenção na primeira infância com foco no desenvolvimento físico e intelectual das
crianças. Envolveu 129 crianças com crescimento estagnado entre 9 e 24 meses de idade.
Walker et al. (2006) estudam os impactos de longo prazo dessa intervenção. Das 129
crianças identificadas entre 9 e 24 meses, 103 foram acompanhadas até os 17-18 anos. As
principais variáveis estudadas foram: ansiedade, depressão, autoestima e comportamento
antissocial avaliado por questionários administrados por entrevistadores; déficit de atenção,
hiperatividade e comportamento avaliado por entrevistas com os pais.
O programa StayingFit é on-line e tem por objetivo incentivar e orientar o controle de peso
e hábitos alimentares saudáveis. Originário dos Estados Unidos, foi desenvolvido para os
padrões dessa realidade. No entanto, Barrera et al. (2013) e Castro et al. (2015) fizeram
uma série de adaptações para adequá-lo para a realidade brasileira, levando em conta
cultura, hábitos e valores.
Os resultados de Silva et al. (2019) indicam que os alunos do grupo de intervenção tiveram
uma chance 43% maior de consumir feijão regularmente e uma chance 35% menor de
consumir refrigerantes regularmente. Não foram encontradas diferenças entre os grupos
de tratamento e controle quanto aos parâmetros antropométricos. Apesar desses
resultados modestos, a implementação de uma intervenção na web parece gerar benefícios
e ajudar a promover mudanças positivas nos hábitos em relação a alimentação dos jovens.
Por fim, pode-se ressaltar como aspecto relevante o modo pelo qual se pode usar os
resultados de avaliações de programas para direcionar futuras políticas e expansões de
programas existentes. Ou seja, é importante que o estudo das respostas a um tratamento
seja capaz de embasar e solidificar a tomada de decisões.
Outro conceito importante para a tomada de decisão na política pública, tendo como base
a avaliação de impacto, é a chamada análise custo-benefício. Novamente compara-se os
custos aos benefícios trazidos pela política em questão, no entanto, nesse caso os
benefícios necessariamente devem corresponder ao valor monetário dos impactos da
política que foram obtidos na etapa anterior de avaliação.
Caso o indicador de impacto não seja medido em unidades monetárias, será preciso
transformá-lo em tal unidade de medida para o cômputo dos benefícios em valores
monetários. Note-se que o procedimento de monetização se baseia na adoção de hipóteses
para converter o valor do impacto de sua unidade de medida original para unidades
monetárias e esse processo de conversão deve ser explícito e embasado por valores de
referências consolidados na literatura.
Um autor que discute isso em alguns artigos é Charles F. Manski, o qual tem diversos
trabalhos em que analisa de que maneira o tomador de decisão com relação a uma política
pública pode decidir, por exemplo, acerca da expansão de um programa existente em um
novo contexto, tendo como base uma avaliação experimental.
MANSKI, Charles F.; TETENOV, Aleksey. Admissible treatment rules for a risk-averse
planner with experimental data on an innovation. Journal of Statistical Planning and
Inference, v. 137, n. 6, p. 1998-2010, 2007.
1
Instituto de Saúde Coletiva, Universidade Federal da Bahia
2
Centro de Integração de Dados e Conhecimentos para a Saúde (CIDACS-Fiocruz Bahia)
3
Departamento de Estatística, Universidade Federal da Bahia
RESUMO:
Objetivo: Introduzir o leitor aos pressupostos e a aplicação de técnicas baseadas em escores de
propensão. Público-alvo: pesquisadores envolvidos em projetos de avaliação de impacto, gestores em
saúde e comunidade acadêmica em geral. Mensagem principal do capítulo: Os métodos de avaliação
baseados em escores de propensão são de aplicação relativamente fácil em estudos observacionais.
PALAVRAS-CHAVE:
Escores de propensão. Pareamento. Ponderação. Kernel. Iptw.
Somente no início da década de 1970, com a publicação dos artigos Cochran e Rubin
(1973) e Rubin (2012) introduziram-se discussões relacionadas à estratificação e
pareamento na avaliação do efeito de intervenções em estudos observacionais. Os
métodos de pareamento são usados em duas situações: naquela que se refere à seleção
das unidades de análise em um determinado desenho de estudo e na outra, quando os
dados foram coletados e o objetivo é reduzir o viés de seleção no processo de estimação
(STUART, 2010). Vale ressaltar que o pareamento pode ser realizado diversas vezes antes
da estimação do efeito de interesse e o diagnóstico de cada pareamento pode ser realizado
de modo a selecionar aquele que produz menor viés. Um importante avanço ocorreu em
Por exemplo, nos estudos observacionais que envolvem situações nas quais a intervenção
é representada por uma variável binária, T, onde Ti =1 representa que a i-ésima unidade
de análise tenha recebido a intervenção e Ti = 0, caso não o tenha recebido, e X denota
um conjunto de p variáveis observadas, o modelo logístico pode ser utilizado para estimar
o escore de propensão, de modo que
! !"#$%
ei(X) =
"# ! !"#$%
É boa prática que variáveis de confusão sempre sejam incluídas como variáveis preditoras
dos escores de propensão e que variáveis colisoras ou intermediárias não sejam incluídas
(ALI et al., 2014; BROOKHART et al., 2006; PATRICK, 2011; MYERS et al., 2011; ALI et
al., 2019). No entanto, na literatura há controvérsias acerca da inclusão de fatores de risco,
considerando-se a introdução de viés e o quanto contribuem ou não para a precisão das
estimativas do impacto da política sobre o desfecho (GREENLAND, 2011). Em uma revisão
da literatura, identificam-se três principais abordagens quanto à seleção de variáveis
preditoras de escores de propensão: a) uso de variáveis associadas apenas com a
intervenção; b) uso de variáveis de confundimento e; c) uso de variáveis de confundimento
somadas a fatores de risco para o desfecho.
A segunda abordagem propõe que escores de propensão devem ser estimados a partir de
variáveis de confundimento, aquelas associadas tanto ao status de intervenção quanto ao
desfecho de interesse. Essa pode ser considerada a abordagem mais tradicional,
recomendada pela maioria dos manuais de avaliação de impacto (GERTLER et al., 2018;
KHANDKER; KOOLWAL; SAMAD, 2009) e por pesquisadores líderes na área de
metodologias quase experimentais (ROSENBAUM; RUBIN, 1983; AUSTIN;
GROOTENDORST; ANDERSON, 2007; AUSTIN et al., 2007). Os benefícios de uma
abordagem de escores de propensão estimados com base em variáveis de confundimento
são a boa performance para reduzir o viés associado a variáveis de confundimento e a
estabilidade de seus resultados mesmo em cenários de forte viés de seleção
(desbalanceamento das covariáveis entre indivíduos tratados e não tratados). Em uma
estratégia como a de pareamento, que será detalhada mais adiante, a comparação do
desfecho de interesse entre indivíduos tratados e indivíduos não tratados, suficientemente
pareados em seu escore de propensão, produz o impacto estimado da política/programa
analisada.
• Pareamento por raio ou calibre define uma distância máxima entre os escores de
propensão das unidades de análise pertencentes aos grupos intervenção/tratado e
não tratado. Ou seja, cada unidade tratada somente será pareada com uma unidade
do grupo controle se esse possuir um valor de escore de propensão que se encontra
em uma distância pré-definida (raio) do escore de propensão. Nessa abordagem não
há consenso a respeito do valor da distância máxima que deve ser utilizada. Austin
Pareamento pelo kernel, por sua vez, pode ser considerado uma técnica mista que envolve
pareamento e ponderação. Consiste em um método de pareamento não-paramétrico que
usa médias ponderadas de todos os indivíduos no grupo de controle para construir o
resultado contrafactual. Com base em um parâmetro de largura de banda (h), o método
determina o quão estreita deve ser uma banda de valores em torno dos escores de
propensão dos participantes para considerá-los "pareáveis". Essa distância é definida com
base em uma função de densidade de kernel a ser definida pelo pesquisador dentre
diversas opções disponíveis (Epanechnikov, função retangular ou uniforme, triangular,
biweight, triweight, cosine trace ou Parzen). Uma vez definido o parâmetro de distância h,
o método define um esquema de ponderação para todas as unidades não tratadas e atribui
maiores pesos às unidades mais próximas daquelas unidades tratadas, as quais serão
pareadas.
Estudos de simulação têm indicado que o Kernel Matching (KM) pode ser mais vantajoso
quando comparado aos métodos tradicionais de pareamento por escores de propensão
(nnm, caliper, multivariate distance matching); há evidências de redução significativamente
maior de vieses nos erros padrão a favor do Kernel Matching (HANDOUYAHIA; HADDAD;
EATON, 2013; NAIMI et al., 2014). Outras vantagens são a possibilidade de ajuste para
diferentes formas funcionais, o que torna o método mais flexível, e a imposição de um
parâmetro h, que restringe a janela de valores possíveis para pareamento e censura valores
ou pesos extremos. No entanto, a tarefa de encontrar um valor ideal para h é
2. Suporte comum – requer que para cada indivíduo no grupo intervenção exista um par no
grupo que não recebe a intervenção com valores similares nas características observadas
(representada por X). Dessa forma, assegura-se que os indivíduos possuem probabilidade
de fazerem parte do grupo de intervenção ou não intervenção sempre positiva, a qual varia
Define-se o efeito causal comparando-se os valores que o desfecho pode assumir para
diferentes valores do tipo de intervenção ou exposição. O problema básico para se
identificar o efeito causal é que o desfecho de interesse é observado em único grupo, ou
seja, no grupo de intervenção ou no grupo que não recebeu a intervenção, mas nunca sob
as duas situações ao mesmo tempo. Ou seja, em uma avaliação de impacto não se observa
o evento de interesse nos indivíduos alocados no grupo de intervenção, caso esses
tivessem sido alocados no grupo de não intervenção, referido como contrafactual. Dessa
forma, um grupo de comparação é utilizado para identificar o contrafactual do que teria
acontecido sem a intervenção. Esse grupo de comparação deve ser representativo do
grupo de intervenção, com a diferença de que o primeiro não participou do programa.
Portanto, deve-se sempre depender de uma etapa de substituição ao estimar o efeito causal
e, assim, a validade dessa estimativa dependerá da validade dessa substituição.
O termo população alvo será usado para o grupo de indivíduos sobre o qual nossa pergunta
científica deseja estimar o efeito causal de uma intervenção. A população alvo pode ser
composta por um grupo de pessoas (como na maioria dos estudos epidemiológicos), por
vários grupos de pessoas (como em um estudo de intervenção em várias comunidades) ou
por uma pessoa. Além disso, vamos considerar para cada unidade dessa população um
valor yi associado à variável desfecho Y e uma variável binária T que possui o valor 1 se
essa unidade participa do programa/intervenção e o valor 0 caso não participe. Em geral
há dois parâmetros comumente utilizados para estimar o efeito causal: o efeito médio do
tratamento na população alvo ou elegível para o programa de intervenção (average
treatment effect ou ATE) e o efeito médio do tratamento entre os tratados (average
treatment effect on the treated ou ATT), ou seja, condicionado aos indivíduos ou a uma
Sabe-se que E (Y1i - Y0i | Di =1) = E (Y1i | Di =1) - E (Y0i | Di =1). Como mencionado, o resultado
contrafactual de um indivíduo sob intervenção/tratamento E (Y0i | Di =1) não pode ser
observado, uma vez que um indivíduo somente pode estar no grupo de intervenção ou não
intervenção em um ponto específico do tempo. Portanto, alguns métodos podem ser
adotados para lidar com esse problema. Cada um desses métodos tem premissas e
requisitos específicos e tem como procedimento comparar as unidades com características
semelhantes nos grupos. Por exemplo, de acordo com a hipótese de independência
condicional, o processo de seleção ocorre segundo características observadas
(representadas pelo vetor X) e indivíduos com essas características idênticas possuem a
mesma probabilidade de serem alocadas como tratamento ou controle.
Portanto, para introduzir esses estimadores nos procedimentos que envolvem métodos
com escores de propensão, o pressuposto de independência deve ser alcançado.
Considera-se que a população de interesse seja dividida em dois subconjuntos com NT
unidades e NC unidades, em que T denota o subconjunto dos que recebem o
tratamento/intervenção e C o subconjunto daqueles que não o recebem. Seja C(i) o conjunto
de controles da unidade i e ei o escore de propensão estimado para essa unidade. Assim,
quando se realiza o pareamento pelo método do vizinho mais próximo, C(i) = { min || ei – ej
||}, ou seja, fazem parte desse conjunto as unidades da subpopulação C que apresentam
as menores diferenças absolutas dos escores de propensão com a unidade tratada i.
Quando o pareamento é por raio, o conjunto C(i) é composto por todas as unidades j que
têm diferença absoluta dos escore de propensão menor do que um raio(r) pré-estabelecido
no pareamento. Dessa forma, C(i) = { ej , min || ei – ej || < r }. Tanto para o pareamento por
vizinho mais próximo quanto para o pareamento por raio tem-se que NCi representa o
número de controles pertencentes a C, o qual é pareado com o indivíduo tratado i
pertencente à subpopulação T. O estimador para ATT para esses dois tipos de pareamento
pode ser definido como
" "
τM = ∑i∈T Yi1 - ∑j∈C Wj Yjo
%& %&
"
onde Wj = ∑i Wij com peso Wij = se j pertence C(i) ou Wij =0 caso contrário
%'%
Esses parâmetros não são os únicos que podem ser estimados. Ou seja, o efeito causal
pode ser calculado em uma escala linear (por exemplo ATT e ATE) e não linear (AUSTIN;
STUART, 2017). No contexto da epidemiologia é muito comum que o desfecho de interesse
tenha uma escala de mensuração categórica e, dessa forma, outros parâmetros causais
podem ser estimados como a razão de chances (do inglês odds ratio), risco relativo,
diferença de riscos nos procedimentos que envolvem o uso de escore de propensão. Como
mencionado anteriormente, há necessidade de se encontrar um substituto para a
frequência/chance da doença contrafactual. Na prática, esse substituto pode ser
mensurado de uma população diferente da população alvo durante o período etiológico
(período definido pela pergunta de investigação) ou ainda da população alvo observada em
um momento diferente do período etiológico. Entretanto, vale ressaltar que a presença de
viés em qualquer escala da medida de efeito causal pode estar relacionada à má
especificação do modelo de escore de propensão e consequentemente à baixa
performance do balanceamento, como também à não verificação do pressuposto de
independência condicional (a participação no programa independe da resposta potencial
condicional às variáveis pré-tratamento).
É uma estratégia que tem vantagem em relação ao modelo de regressão multivariado, uma
vez que a heterogeneidade do efeito do tratamento pode ser considerada por meio da
definição da população de estudo. A metodologia de escores de propensão pode ser
utilizada em situações que envolvam dados com estrutura de dependência, ou seja, dados
provenientes de pesquisas que possuem estrutura hierárquica com indivíduos agregados
De acordo com Leite e colaboradores (LEITE et al., 2015), o efeito do conglomerado sobre
a probabilidade de atribuição ao tratamento pode ser abordado por meio de um modelo
para o escore de propensão em cada conglomerado separadamente e, como
consequência, seria preciso combinar as estimativas e ponderar pelo tamanho de cada
conglomerado. Outra opção para o escore de propensão seria incorporar tanto os efeitos
das variáveis ao nível individual, quanto ao nível do conglomerado, diretamente no modelo
ou por intermédio de um modelo de efeitos aleatórios (ou modelo multinível).
Uma das críticas mais frequentes ao uso de escores de propensão se refere a sua
performance limitada no contexto de confundidores não mensurados (FU et al., 2019) e
pode inclusive apresentar resultados mais viesados que modelos convencionais de
regressão multivariada (BIONDI-ZOCCAI et al., 2011). Em alguns contextos específicos, o
uso de escores de propensão não é recomendado. No caso de intervenções raras, por
exemplo, os dados das variáveis confundidoras observadas e disponíveis para o estudo
podem não ser suficientes para modelar a probabilidade de receber a intervenção e resultar
em prejuízos significativos na validade dos escores estimados. Uma vez que o modelo para
o escore esteja mal especificado, consequentemente o balanceamento esperado das
variáveis de confusão não será atingido (FU et al., 2019). O uso de escores de propensão
também encontra limitações importantes e não é recomendado em contextos de grandes
disparidades entre o grupo de intervenção e controle quanto à prevalência ou incidência do
desfecho de interesse na linha de base. Estudos de simulação indicam maior probabilidade
de erro do tipo 1 em tais cenários, especialmente na performance do pareamento por
escores de propensão (SCHONBERGER; GILBERTSEN; DAI, 2014).
7 Conclusões
Páginas utéis:
ANDRADE, M. V. et al. Income transfer policies and the impacts on the immunization of
children: the Bolsa Família Program. Cadernos de Saude Publica, v. 28, n. 7, p. 1347-
1358, jul. 2012. Disponível em: http://dx.doi.org/10.1590/s0102-311x2012000700013.
Acesso em: 18 set. 2022.
AUSTIN, P. C. et al. Conditioning on the propensity score can result in biased estimation
of common measures of treatment effect: a Monte Carlo study. Statistics in Medicine, v.
26, n. 4, p. 754-768, Feb. 2007. Disponível em: http://dx.doi.org/10.1002/sim.2618.
Acesso em: 18 set. 2022.
AUSTIN, P. C.; STUART, E. A. Moving towards best practice when using inverse
probability of treatment weighting (IPTW) using the propensity score to estimate causal
FU, E. L. et al. Merits and caveats of propensity scores to adjust for confounding.
Nephrology Dialysis Transplantation, v. 34, n. 10, p. 1629-1635, Oct. 2019. Disponivel
em: http://dx.doi.org/10.1093/ndt/gfy283. Acesso em: 18 set. 2022.
GUERTIN, J. R. et al. Head to head comparison of the propensity score and the high-
dimensional propensity score matching methods. BMC Medical Research Methodology,
v. 16, p. 1-10, Feb. 2016. Disponível em: http://dx.doi.org/10.1186/s12874-016-0119-1.
Acesso em: 18 set. 2022.
HANDOUYAHIA, A.; HADDAD, T.; EATON, F. Kernel matching versus inverse probability
weighting: a comparative study. International Journal of Mathematical and
Computational Sciences, v. 7, n. 8, p. 1218-1233, Aug. 2013. Disponível em:
http://publications.waset.org/16101/kernel-matching-versus-inverse-probability-weighting-
a-comparative-study. Acesso em: 18 set. 2022.
KARIM, M. E.; PANG, M.; PLATT, R. W. Can we train machine learning methods to
outperform the high-dimensional propensity score algorithm? Epidemiology, v. 29, n. 2, p.
191-198, Mar. 2018. Disponível em: http://dx.doi.org/10.1097/EDE.0000000000000787.
Acesso em: 18 set. 2022.
LEE, B. K.; LESSLER, J.; STUART, E. A. Weight trimming and propensity score weighting.
PLoS One, v. 31, n. 6, p. 1-6, 2011. Disponível em:
http://dx.doi.org/10.1371/journal.pone.0018174. Acesso em: 18 set. 2022.
LI, F.; MORGAN, K. L.; ZASLAVSKY, A. M. Balancing covariates via propensity score
weighting. Journal of American Statistical Association, v. 113, n. 521, p. 390-400, Jan.
2018. Disponível em: https://doi.org/10.1080/01621459.2016.1260466. Acesso em: 18
set. 2022.
MACHADO, D. B. et al. Relationship between the Bolsa Família national cash transfer
programme and suicide incidence in Brazil: a quasi-experimental study. PLoS Medicine,
v. 19, n. 5, p. 1 - 17, May 2022. Disponível em:
http://dx.doi.org/10.1371/journal.pmed.1004000. Acesso em: 18 set. 2022.
RAMOS, D. et al. Conditional cash transfer program and child mortality: A cross-sectional
analysis nested within the 100 Million Brazilian Cohort. PLoS Medicine, v. 18, n. 9, p. 1-
20, Sep. 2021. Disponível em: http://dx.doi.org/10.1371/journal.pmed.1003509. Acesso
em: 18 set. 2021.
ROBINS, J. M.; HERNÁN, M. A.; BRUMBACK, B. Marginal structural models and causal
inference in epidemiology. Epidemiology, v. 11, n. 5, p. 550-560, Sep. 2000. Disponível
em: http://dx.doi.org/10.1097/00001648-200009000-00011. Acesso em: 18 set. 2022.
ROBINS, J. M.; MARK, S. D.; NEWEY, W. K. Estimating exposure effects by modelling the
expectation of exposure conditional on confounders. Biometrics, v. 48, n. 2, p. 479-495,
Jun. 1992. Disponível em: https://www.ncbi.nlm.nih.gov/pubmed/1637973. Acesso em: 18
set. 2022.
RUBIN, D. B.; THOMAS, N. Matching using estimated propensity scores: relating theory to
practice. Biometrics, v. 52, n. 1, p. 249-264, Mar. 1996. Disponível em:
https://www.ncbi.nlm.nih.gov/pubmed/8934595. Acesso em: 18 set. 2022.
SPREEUWENBERG, M. D. et al. The multiple propensity score as control for bias in the
comparison of more than two treatment arms: an introduction from a case study in mental
health. Medical Care, v. 48, n. 2, p. 166-174, Feb. 2010. Disponivel em:
http://dx.doi.org/10.1097/MLR.0b013e3181c1328f. Acesso em: 18 set. 2022.
STUART, E. A. Matching methods for causal inference: a review and a look forward.
Statistical Science, v. 25, n. 1, p. 1-21 . 2010. Disponível em:
http://dx.doi.org/10.1214/09-sts313. Acesso em: 18 set. 2022.
O método diferenças-em-diferenças
1
Escola de Economia de São Paulo, FGV-SP, e licenciado do PIMES-UFPE
Escola de Economia de São Paulo, FGV-SP, e licenciada da UFPE
2
RESUMO:
O objetivo deste capítulo é fornecer um guia prático do uso do método de diferenças-em-diferenças
na avaliação de políticas públicas em saúde. O público-alvo são gestores interessados em avaliar
o desempenho de dada política pública ou programa usando informação antes, durante e após a
sua implementação. A principal mensagem é ser possível avaliar políticas públicas utilizando-se
dados observacionais quando existe um grupo de tratamento e controle bem definidos e quando
existe informação antes e depois da implementação do programa. A orientação chave é levar
particularmente em consideração a importância das condições sob as quais os resultados obtidos
poderiam ser válidos e quando não.
PALAVRAS-CHAVE:
Diferenças-em-diferenças. Políticas públicas. Avaliação de impacto.
2 O modelo diferenças-em-diferenças
Note-se que a primeira parte do lado direito da equação (1) é a mudança de 𝑌𝑌 entre o
período 1 e 2 no grupo de tratamento. A segunda parte do lado direito representa a análoga
mudança para o grupo de controle. Portanto, o estimador de diferenças-em-diferenças são
diferenças entre essas mudanças no 𝑌𝑌 entre ambos os grupos.
Antes da implementação do PMM, a taxa de médicos era 0.19 no grupo tratado e 0.27 no
grupo de tratamento, uma diferença de 30% em contraposição aos municípios tratados. No
período após a intervenção, a taxa de médicos passou a 0.30 tanto nos municípios tratados
quanto nos de controle, o que implica aumento de 0.11 e 0.03 em ambos os grupos
respetivamente. O aumento de 0.11 no grupo de tratados pode refletir o efeito do PMM,
mas também outros fatores que levaram ao aumento no número de médicos de forma geral.
Calculando a diferença da diferença, pode-se eliminar o aumento devido a outros fatores
sob o pressuposto de que esses afetam ambos os grupos similarmente, pressuposto esse
3 Condição de identificação
Observe-se que esse pressuposto não implica que os grupos de tratados e controles sejam
similares em condições iniciais. O modelo precisa simplesmente que se tais diferenças
iniciais existem, essas permaneçam constantes ao longo do tempo. No exemplo do PMM,
observou-se que a taxa de médicos em UBS era mais baixa nos municípios tratados, uma
O estimador de diferenças-em-diferenças (1) também pode ser obtido com base na análise
de regressão. Seja Post uma variável a indicar o período pós-intervenção e ε um erro
aleatório idiossincrático, então, o parâmetro de interesse pode ser obtido como a seguir:
𝑌𝑌$& = 𝛼𝛼' + 𝛼𝛼! 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃& + 𝛼𝛼" 𝐷𝐷$ + 𝛽𝛽#$%% 𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃& 𝑥𝑥 𝐷𝐷$ + 𝜀𝜀$& (2)
Regressão generalizada. Em alguns casos, a base de dados contém vários períodos antes
e depois do tratamento. Por exemplo, depois de iniciar o PMM, é possível monitorar a
evolução da oferta de médicos todos os anos após o tratamento porque o ministério de
saúde está sempre a coletar esses dados. Desse modo, é possível avaliar os efeitos de
longo prazo do programa usando-se esses dados.
Onde os termos 𝜇𝜇& e 𝜃𝜃$ representam efeitos fixos de tempo e unidade. Esse modelo pode
ser estimado por MQO em que se incluem variáveis indicadoras para cada unidade de
seção cruzada e para cada unidade temporal. Nesse caso, é importante omitir um grupo de
referência para evitar problemas de colinearidade. A inclusão de efeitos fixos de indivíduos
controla de forma flexível por características que diferem por indivíduos, mas que não
mudam ao longo do tempo. Por sua vez, os efeitos fixos de tempo capturam qualquer
choque que afete todos os indivíduos de forma semelhante, tais como condições
macroeconômicas ou reformas nacionais de saúde.
Para implementar esse teste de maneira formal, é necessário modificar o modelo (3) da
seguinte forma:
𝑌𝑌$& = 𝛼𝛼' + 𝜇𝜇& + 𝜃𝜃$ + < 𝛽𝛽( 1[𝑡𝑡 = 𝑘𝑘]𝑥𝑥 𝐷𝐷$ + 𝜀𝜀$& (5)
De forma geral, a pesquisadora deveria atentar para fatores que poderiam ter mudado
juntamente com o programa em questão e ver se houve diferenças significativas nessa
Para esse exemplo, usamos os dados extraídos diretamente do artigo publicado por Carrillo
e Feres (2019). O PMM foi implementado em setembro de 2013 em municípios
considerados prioritários. Os objetivos do programa são amplos. Para simplificar, o foco
será em estimar seus efeitos sobre a oferta de médicos. Como o tratamento varia em nível
municipal, o modelo será estimado usando-se um painel de dados municipais. Como os
efeitos sobre a oferta de médicos não deveriam levar muito tempo para aparecer, a unidade
de tempo empregada foi o bimestre, focalizando-se nos 20 bimestres anteriores e
posteriores ao programa. O bimestre em que o programa é adotado é normalizado a zero,
de modo que a variável tempo toma os valores 𝑡𝑡 = −20, −19, . . .0, 1, 2, . . .20.
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Estimou-se o modelo (4) com adicionais variáveis explanatórias para as nossas variáveis
dependentes de interesse. As variáveis explanatórias são interações entre variáveis
demográficas medidas em 2010 interagidas com a tendência linear de tempo. Essas
variáveis incluem: taxa de médicos, renda per capita, logaritmo da população, taxa de
analfabetismo, taxa da população indígena, índice de Gini, taxa de desemprego, taxa da
população urbana, área total do município, altitude, distância da capital do estado, uma
Iniciou-se com um modelo que não incluiu nenhuma dessas variáveis, mas somente os
efeitos fixos de tempo e município. O coeficiente estimado é idêntico àquela diferença-em-
diferença bruta implicada pela Figura 1. O PMM está associado a um aumento de 0.08
médicos por 100 mil residentes, um efeito estimado com muita precisão e altamente
significante em pelo menos 5%.
Robust
physician_BHU_cpta Coef. Std. Err. t P>|t| [95% Conf. Interval]
Neste ponto, o controle se deu pela interação entre uma tendência linear e as
características iniciais dos municípios. Se as diferenças entre municípios tratados e não
tratados não estão associadas a diferenças em tendências na oferta de médicos, a inclusão
desses controles não deveria alterar significativamente o coeficiente de interesse. Quando
se incluem esses controles, o coeficiente de interesse de fato é maior, sugerindo que se
existe qualquer viés devido a diferenças iniciais essas não são responsáveis pelos
resultados obtidos.
Robust
physician_BHU_cpta Coef. Std. Err. t P>|t| [95% Conf. Interval]
c.date#
c.lnPopulation2010 -.001513 .0001447 -10.46 0.000 -.0017966 -.0012293
c.date#
c.Iliteracy_rate2010 -.0000402 .000019 -2.12 0.034 -.0000773 -3.01e-06
c.date#
c.indigenous_share2010 .0000221 .0000196 1.12 0.261 -.0000164 .0000605
c.date#
c.unemployment_rate2010 -.0000542 .0000309 -1.75 0.079 -.0001148 6.36e-06
c.date#
c.
rural_population_s~2010 2.43e-06 6.98e-06 0.35 0.728 -.0000113 .0000161
c.date#
c.municipality_area 7.55e-09 1.06e-08 0.71 0.476 -1.32e-08 2.83e-08
c.date#
c.distance_to_capital 8.54e-07 6.70e-07 1.28 0.202 -4.58e-07 2.17e-06
Pode-se interpretar os resultados acima de forma causal? Para responder a essa questão
precisamos avaliar a plausibilidade do pressuposto de identificação (1). Para isso,
estimamos o modelo flexível (5), o qual basicamente estima o modelos diferenças-em-
diferenças para cada bimestre antes e depois do programa. A Figura 2 mostra esses
resultados. Como se pode observar, a taxa de médicos em UBS começa a aumentar
somente depois que o programa é implementado e não antes. Os coeficientes para o
período pré-tratamento são muito próximos de zero e geralmente estatisticamente
insignificantes e, o mais importante, nenhuma clara tendência apresentam. Dada a alta
Figura 2 - Estimação do efeito do PMM sobre médicos em UBS por 100 mil residentes
7 Conclusão
O método de diferenças-em-diferenças é particularmente útil na avaliação de políticas
públicas, dado que muitas dessas políticas não são alocadas de forma aleatória e o modelo
não requer que indivíduos tratados e não tratados sejam similares. Para isso, os
pesquisadores deveriam ter informações sobre as variáveis dependentes de interesse
vários períodos antes e depois da intervenção. Metodologicamente é relativamente simples
implementar esse método. Embora o pressuposto chave de identificação não possa ser
testado formalmente, é ainda possível avaliar a sua plausibilidade usando-se dados durante
o período pré-tratamento.
Neste capítulo, o foco foi o programa Mais Médicos, mas existem muitos programas que
podem ser diretamente avaliados pelo método de diferenças-em-diferenças. Outros
exemplos incluem os programas Saúde da Família, Farmácia Popular e os Centros de
Atenção Psicossocial (CAPS), entre outros. Alguns desses têm sido avaliados
rigorosamente, mas certamente algumas lacunas ainda existem e precisam ser
preenchidas para informar o desenho de política de saúde pública no Brasil.
CARRILLO, B.; FERES, J. Provider supply, utilization, and infant health: evidence from a
physician distribution policy. American Economic Journal: Economic Policy, v. 11, n. 3,
p. 156-196, 2019. Disponível em: https://www.aeaweb.org/articles?id=10.1257/pol.201706
19. Acesso em: 19 set. 2022.
Breno Sampaio1
Giuseppe Trevisan1
1
Universidade Federal de Pernambuco, Grupo de Avaliação de Políticas Públicas e Econômicas - Gappe
RESUMO:
Este capítulo tem por objetivo apresentar o método de regressão descontínua a pesquisadores
e formuladores de políticas interessados em avaliar políticas públicas na área da saúde. Além de
fornecer explicação intuitiva acerca do funcionamento do método, oferece-se um guia prático para
sua implementação e discutem-se formas de testar a validade de suas hipóteses e a robustez dos
resultados obtidos quando se avalia uma intervenção. Por fim, apresentam-se os mais recentes e
relevantes avanços metodológicos acerca da técnica e exploram-se aplicações na área de saúde.
PALAVRAS-CHAVE:
Regressão descontínua. Avaliação de políticas públicas. Guia prático.
O exemplo anterior retrata o caso mais simples de descontinuidade, conhecido como caso
sharp. Note-se que a chance de receber o tratamento salta de 0% para 100% em torno do
cutoff e indica que todos os municípios elegíveis são tratados e todos os não-elegíveis não
recebem o tratamento.2 Logo, o termo sharp sugere a descontinuidade mais “acentuada”
possível nessa probabilidade. A demonstração do estimador de RD será iniciada utilizando-
se esse contexto.
1
Evoluções recentes do método buscam expandir interpretações de efeitos de tratamento para pontos
distantes do cutoff. Ver, por exemplo, Angrist e Rokkanen (2015).
2
A depender do contexto, a probabilidade de receber o tratamento a partir do ponto de corte pode ir de
100% para 0%. Isso aconteceria se a intervenção fosse direcionada às unidades localizadas abaixo do
cutoff.
Ou seja, o efeito de interesse é obtido pela diferença das médias do indicador de impacto
entre o grupo tratado e o grupo de controle para as observações próximas do ponto 𝑐𝑐. O
efeito para essa subpopulação é denominado de Efeito Médio Local de Tratamento (Local
Average Treatment Effect, LATE). Similarmente, pode-se dizer que esse é um efeito médio
local de tratamento sobre os tratados. Perceba-se que, quanto mais 𝜖𝜖 se aproxima de 0,
menos observações tendem a ser usadas na estimação de 𝛽𝛽"# , uma vez que se está cada
vez mais próximo do cutoff.
onde 𝑢𝑢! é um termo de erro aleatório e os termos 𝑌𝑌! e 𝑥𝑥! são os mesmos definidos
anteriormente. No modelo econométrico, o parâmetro de interesse aparece multiplicando-
se a variável indicadora 𝐷𝐷! . Seguindo-se a mesma ideia da Equação (1), essa especificação
estima a descontinuidade 𝛽𝛽"# em 𝑌𝑌! o mais próximo possível de 𝑥𝑥! = 𝑐𝑐. Vale ressaltar que
nas aplicações empíricas é bastante comum se normalizar o cutoff para zero, facilitando-
se assim a interpretação do efeito causal advindo do modelo acima.
3
Polinômio de grau superior que pode ser utilizado na busca de especificação mais flexível. Ver Gelman e Imbers
(2019) para maiores detalhes sobre especificações.
O caso sharp envolve um cenário ideal em que todos os indivíduos sujeitos a uma
intervenção respeitam a regra que define o tratamento. Na prática, muitas vezes não se
observa tal situação. Por exemplo, é possível encontrar indivíduos que recebem o
tratamento – quando não deveriam ser tratados e, quando deveriam receber o tratamento,
negam-se à oportunidade. Esse contexto deixa claro a possibilidade de comportamento
endógeno do indivíduo, o que não significa que não se pode explorar interessantes efeitos
a partir do quase-experimento originado ao redor de um cutoff. A seguir, apresenta-se como
recuperar o efeito médio local nesse contexto.
O parâmetro 𝛿𝛿"# representa o LATE. Como se pode perceber, o estimador do caso sharp
apresentado na Equação (1) configura um caso especial do estimador em (5), no qual a
descontinuidade 𝛼𝛼"# no ponto 𝑐𝑐 é igual a 1. O momento é também oportuno para se
apresentar mais dois novos jargões. Diz-se que o numerador é o estimador da “forma
reduzida”, modelo de regressão que mostra a relação entre a descontinuidade em 𝑥𝑥! e o
indicador de impacto, 𝑌𝑌! . O denominador representa o estimador de “primeiro estágio”,
modelo que mostra a relação entre a descontinuidade em 𝑥𝑥! e o status do tratamento4, 𝑇𝑇! .
Mesmo que não haja conformidade perfeita com o tratamento, o estimador da forma
reduzida pode ser bastante informativo. Particularmente, a estimação de 𝛽𝛽"# em um
desenho fuzzy traz uma interpretação de relevante interesse para o responsável pelo
desenho de política pública, uma vez que denota um Efeito de Intenção do Tratamento
(Intention-to-Treat Effect, ITT). Se retomarmos o exemplo fictício das unidades de saúde, o
governo federal poderia estar interessado apenas em saber se a política de transferência
de recursos para instalação das unidades de vacinação impactou o número de casos de
COVID-19 nas localidades, independentemente de serem tratados ou não (instalarem ou
não as unidades de saúde). Portanto, o estimador traduz o efeito da elegibilidade para o
tratamento. Não obstante, ainda é necessário haver descontinuidade na probabilidade de
tratamento (ou seja, a estimativa de 𝛼𝛼"# deve ser estatisticamente significante), que ainda
é uma condição necessária para a identificação.
4
Conforme será detalhado no capítulo seguinte, a variável binária que indica a descontinuidade na
probabilidade (ou seja, 𝐷𝐷! ) é utilizada como um instrumento para a variável de tratamento.
Para que os estimadores apresentados – LATE e ITT – tenham suas interpretações válidas,
é necessário atender a uma condição de identificação que, até o momento, ficou implícita.
Antes de apresentar essa importante hipótese, lembre-se do arcabouço de resultados
potenciais. Existe uma situação efetivamente observada pelo avaliador (factual) e aquela
que é impossível de ser observada (contrafactual). Essa última representa o que teria
acontecido com o grupo de tratados caso não tivessem recebido o tratamento. Com isso
em mente, a hipótese que viabiliza a recuperação do parâmetro de interesse é:
Hipótese de identificação: A média condicional da variável de interesse para o grupo
contrafactual apresenta uma transição suave no cutoff.
onde 𝛾𝛾 representa a diferença média da característica 𝑊𝑊! entre os lados direito e esquerdo
da vizinhança próxima ao cutoff. Para haver validade interna do desenho, deseja-se que 𝛾𝛾
seja estatisticamente igual a zero para cada uma das características, indicando-se que os
fatores estão igualmente balanceados em torno do cutoff. Dessa forma, torna-se mais
plausível afirmar que a intervenção causou impacto e se exclui a possibilidade de outras
características influenciarem a descontinuidade observada no indicador de impacto.
Outra estratégia usual para checar a sensibilidade dos resultados é utilizar diferentes
polinômios da running variable. O exemplo ilustrado na equação apresentada na seção 3
utiliza polinômio de primeiro grau. No entanto, é possível o uso de diferentes ordens na
variável 𝑥𝑥! , como polinômios quadráticos, cúbicos, entre outros. O artigo recente de Gelman
e Imbens (2019) recomenda o uso de polinômios lineares ou quadráticos, uma vez que
ordens maiores podem comprometer o não-viés na estimação do parâmetro. Da mesma
forma, visa-se aqui a não-sensibilidade da estimativa ao emprego de diferentes polinômios
da running variable. Vale destacar que, ao se utilizarem métodos não-paramétricos de
estimação, pode-se também alternar o peso atribuído às unidades observacionais para o
cálculo do efeito de tratamento conforme suas frequência e distância em relação ao cutoff
(IMBENS; LEMIEUX, 2008).
Por fim, o uso de covariadas (variáveis explicativas) pode ser excelente alternativa para
melhorar a eficiência do estimador. Em outras palavras, o uso de variáveis de controle no
desenho de regressão descontínua pode gerar ganhos de inferência estatística ao reduzir
a variância do estimador. Uma vez que essas características não são correlacionadas com
o tratamento (fato que deve ter sido checado anteriormente no teste de balanceamento), o
coeficiente estimado não deve alterar significativamente sua magnitude e ainda ganha
precisão – o que proporciona robustez. O artigo recente de Calonico et al. (2019) demonstra
um estimador não-paramétrico alternativo, ajustado para a inclusão de covariadas, de
forma a aumentar a precisão da estimativa.
7 Avanços metodológicos
A abordagem com uma running variable contínua e único cutoff, em ambos os casos sharp
e fuzzy, configura a formatação padrão do desenho de RD e, por conseguinte, é a mais
corriqueiramente observada nas avaliações de políticas. A literatura traz ainda situações
empíricas um tanto quanto particulares, as quais demandam certos ajustes no método para
a identificação de efeito causal. As últimas duas décadas são marcadas por grandes
avanços no arcabouço metodológico de RD e aplicáveis aos mais variados contextos. Nesta
seção, traz-se algumas das contribuições metodológicas mais relevantes com o intuito de
fornecer ponto de partida para a leitura de artigos científicos e inspiração para futuros
desenhos de avaliação de políticas públicas de saúde5.
O uso de RD não está limitado ao caso de uma running variable de natureza contínua. Ou
seja, é possível pensar em uma variável quantitativa que realiza valores discretos para
funcionar como running variable. Como ilustração, pode-se pensar em um caso no qual
uma legislação separa grupos de tratamento e controle baseando-se na idade do indivíduo
(definida em meses, por exemplo): indivíduos que têm pelo menos 20 anos de idade (240
5
Outros métodos não abordados neste material incluem: difference-in-discontinuity (GREMBI; TROIANO,
2016), RDD dinâmico (CELLINI et al., 2010) e extrapolação de efeitos de tratamento além do cutoff
(CATTANEO et al., 2021). É possível também haver outras combinações de métodos. Recomenda-se essas
referências como um ponto de partida para o aprofundamento do leitor.
Em certas ocasiões pode ocorrer de uma política configurar mais de um cutoff para definir
a elegibilidade para um tratamento. As situações que empregam múltiplos cutoffs,
geralmente, abordam diferentes tratamentos ou intensidades do mesmo tratamento.
Utilizando-se nosso caso hipotético de instalação de unidades de saúde para vacinação, a
política poderia aumentar o montante de transferência de recursos de acordo com o
tamanho da população, além do cutoff de 25,7 mil habitantes anteriormente estabelecido.
Por exemplo, cidades a partir de 100 mil habitantes receberiam o dobro de recursos e, a
partir de 300 mil habitantes, o triplo. Esse cenário permitiria, então, que cidades maiores
pudessem instalar mais unidades de vacinação. Ao redor de cada um dos três cutoffs,
podem se configurar grupos de tratamento e controle e, então, estimarem-se os LATEs em
um desenho de regressão descontínua com múltiplos cutoffs. Uma vantagem desse tipo de
desenho é poder trazerem-se evidências e discussões acerca da validade externa da
política, uma vez que subgrupos diferentes da população podem ter repostas heterogêneas
ao tratamento. Como exemplo, Bertanha (2020) propõe formas paramétricas e não-
paramétricas para estimação do LATE para cada cutoff7.
Por vezes, é necessário que o indivíduo atenda a mais de um critério bem definido para
garantir elegibilidade para uma política pública. Imagine-se que, no caso da política
ilustrativa de vacinação, além de ter de superar o limite populacional de 25,7 mil habitantes
para configurar o tratamento, o município deve ter uma razão despesa/receita menor do
6
Durante muito tempo, o procedimento comumente utilizado para estimação dos erros-padrões era realizar
uma clusterização pela própria running variable. Os autores mostram que essa prática gera intervalos de
confiança viesados e propõe uma correção “honesta” do estimador. Como uma solução simplificada, pode-
se empregar erros-padrões robustos à heterocedasticidade.
7
Uma abordagem utilizada anteriormente à solução proposta pelo autor era agregar as observações dos
diferentes cutoffs e normalizá-las para a utilização de um único cutoff. Apesar de ser uma solução prática,
essa mascara a heterogeneidade do tratamento para os diferentes subgrupos.
A elegibilidade a uma política pública, definida a partir de um ponto de corte, pode não gerar
descontinuidade sobre a variável de interesse. Contudo, isso não necessariamente significa
que essa não produza um efeito local de tratamento. Em vez de provocar descontinuidade
local, pode gerar mudança de comportamento no indicador de maneira a alterar a sua
tendência. Visualmente, um gráfico que represente a relação entre o indicador de impacto
e a running variable em um plano cartesiano mostraria mudança clara de trajetória do
indicador de impacto (ou seja, na inclinação da reta) a partir do cutoff, em vez de
descolamento abrupto em sua média como denotado na Figura 1. Portanto, o desenho de
regressão descontínua pode se estender para o que se denomina de Desenho de
Regressão Kink (RKD), termo cunhado por Nielsen, Sorensen e Taber (2010). Essa
situação ressalta ainda mais a importância da análise gráfica em estudos que pretendem
utilizar choques exógenos bem definidos (que impõem pontos de corte) sobre uma variável
quantitativa. Similar ao RDD, o RKD também incorpora os casos sharp e fuzzy, a depender
da conformidade das unidades observacionais com o tratamento. Card et al. (2015)
discutem diferentes maneiras de se estimar o parâmetro de interesse no contexto de RKD.
8 Aplicações em saúde
Esta seção explora artigos científicos publicados em periódicos de alto impacto acadêmico
que implementam a estratégia de RD para avaliação de políticas ou de intervenções de
outras naturezas com implicações em indicadores de saúde. Aborda-se um breve contexto
institucional para a implementação da análise e apresentados os principais indicadores
8
Outra possibilidade de avaliação utilizando RDD pode surgir a partir de descontinuidades geográficas
(latitude e longitude), nas quais a oferta de uma política é restrita a certas localidades. Nesses casos,
havendo informação georreferenciada, talvez seja possível utilizar os indivíduos próximos aos limites
geográficos que determinam a elegibilidade como grupos de tratamento e controle.
9
Para outras evidências que exploram efeitos de elegibilidade para políticas públicas sobre indicadores de
saúde, consultar Ludwig e Miller (2007) e Fujiwara (2015).
9 Considerações finais
Por mais que haja uma oferta considerável de trabalhos que utilizam desenho de regressão
descontínua para avaliar políticas públicas diversas, as quais têm implicações sobre
indicadores de saúde, não é comum encontrar avaliações de políticas específicas de
saúde que utilizam essa ferramenta – especialmente no contexto brasileiro. Isso pode estar
BERNAL, N.; CARPIO, M. A.; KLEIN, T. J. The effects of access to health insurance:
evidence from a regression discontinuity design in Peru. Journal of Public Economics, v.
154, p. 122-136, 2017.
CELLINI, S. R.; FERREIRA, F.; ROTHSTEIN, J. The value of school facility investments:
Evidence from a dynamic regression discontinuity design. The Quarterly Journal of
Economics, v. 125, n. 1, p. 215-261, 2010.
CHOI, J. Y.; LEE, M. J. Regression discontinuity with multiple running variables allowing
partial effects. Political Analysis, v. 26, n. 3, p. 258-274, 2018.
GELMAN, A.; IMBENS, G. Why high-order polynomials should not be used in regression
discontinuity designs. Journal of Business & Economic Statistics, v. 37, n. 3, p. 447-
456, 2019.
GREMBI, V.; NANNICINI, T.; TROIANO, U. Do fiscal rules matter? American Economic
Journal: Applied Economics, v. 8, n. 3, p. 1-30, 2016.
LUDWIG, J.; MILLER, D. L. Does head start improve children's life chances? Evidence
from a regression discontinuity design. The Quarterly Journal of Economics, v. 122, n.
1, p. 159-208, 2007.
MENEZES-FILHO, N.; POLITI, R. Estimating the causal effects of private health insurance
in Brazil: Evidence from a regression kink design. Social Science & Medicine, v. 264, p.
1-9, 2020.
MULLER, T.; SHAIKH, M. Your retirement and my health behavior: Evidence on retirement
externalities from a fuzzy regression discontinuity design. Journal of Health Economics,
v. 57, p. 45-59, 2018. Disponível em: https://www.sciencedirect.com/science/article/pii/
S0277953620304779?via%3Dihub. Acesso em: 15 set. 2022.
NIELSEN, H. S.; SORENSEN, T.; TABER, C. Estimating the effect of student aid on
college enrollment: Evidence from a government grant policy reform. American
Economic Journal: Economic Policy, v. 2, n. 2, p. 185-215, 2010.
Rudi Rocha1
1
Fundação Getúlio Vargas - FGV, Escola de Administração de Empresas de São Paulo- EAESP
RESUMO:
Este capítulo tem como objetivo apresentar um panorama conceitual e aplicado sobre o uso de
variáveis instrumentais (VI) em avaliações de impacto e destina-se a gestoras/es e pesquisadoras/
es com interesse na implementação de técnicas de econometria aplicada para avaliação de impacto
de políticas públicas. O capítulo pode ser utilizado como um guia sobre os fundamentos da técnica,
conjugado com livros-texto mais completos sobre o tema, recomendados ao final do capítulo.
PALAVRAS-CHAVE:
Identificação causal. Endogeneidade. Variáveis instrumentais.
À primeira vista, portanto, nos parece que temos em mãos algo realmente eficaz para
resolver nossos problemas em avaliação de impacto. Muito embora isso seja verdade em
contextos específicos, como veremos neste capítulo, nem sempre conseguimos utilizar o
método de VI. Em última instância, é relativamente difícil encontrar uma variável
instrumental válida, peça central do método.
Neste capítulo veremos inicialmente uma base conceitual simplificada que nos ajudará a
compreender a validade e o uso adequado de uma variável instrumental. Uma vez claras
as definições e intuições por trás do método de VI, passaremos então a questões mais
técnicas relacionadas à estimação. Na sequência, discutiremos questões práticas e
essenciais em trabalhos aplicados que fazem uso de VI. Como nos demais métodos de
inferência causal, existe um protocolo de pesquisa a ser seguido ao se utilizar o VI, o qual
requer considerações específicas. Discutiremos também a combinação das demais
técnicas com VI. Por fim, encerraremos este capítulo com aplicações de VI já realizadas
em avaliação de políticas de saúde no Brasil.
2 Base conceitual
Vamos utilizar um esquema conceitual para ilustrar um problema muito comum de
endogeneidade relacionado à variável omitida, e a partir disso definir uma VI e métodos de
estimação. A Figura 1 a seguir ilustra esquematicamente um caso no qual queremos
identificar o impacto da variável X sobre Y, muito embora exista uma variável não observada
U correlacionada simultaneamente com ambas as variáveis de interesse e resultado.
Por exemplo, vamos supor que X define uma política de saúde introduzida ao nível
municipal cujo objetivo é diminuir as taxas de mortalidade infantil Y. Essa política pode ter
sido direcionada a municípios de determinadas regiões socioeconomicamente mais
vulneráveis de acordo como indicador U. Nesse caso, portanto, podemos ter U
correlacionado positivamente relacionado com a alocação da política X e com taxas de
mortalidade infantil Y mais altas, por se tratarem de locais mais vulneráveis. Como
resultado, eventualmente encontraremos uma relação negativa entre X e Y, ou seja, quanto
mais alocamos recursos em X, mais altas se apresentam as taxas de mortalidade infantil.
Uma conclusão descuidada pode levar ao corte de uma política que eventualmente era
efetiva no combate à mortalidade infantil.
Vamos então definir uma variável instrumental ou instrumento Z como aquela que afeta X,
porém sem relação com U. Ou seja, se existe alguma relação entre Z e Y, isso ocorre
exclusivamente através de variações em X. Dito de outra forma, a única relação entre
variações em Z e em Y se dá via variações em X, tudo o mais constante. Notem que existem
por trás dessa definição duas condições bastante importantes e que deverão ser válidas na
prática. Em primeiro lugar, Z deverá afetar X. Ou seja, precisamos ter uma correlação entre
o instrumento Z e a variável de interesse endógena X. Chamamos essa relação entre X e
Z de primeiro estágio. Em segundo lugar, Z deverá afetar Y apenas através de X. O
instrumento não deverá ter relação com quaisquer outras variáveis potencialmente
relacionadas com a variável de resultado Y. Chamamos essa condição de restrição de
exclusão. Um instrumento válido, portanto, precisará respeitar as duas condições acima.
Muito embora existam outras questões técnicas que devem ser consideradas, como
veremos à frente, o primeiro estágio e a restrição de exclusão deverão valer.
Notem, entretanto, que o primeiro estágio é uma condição observável. Basta definirmos um
instrumento Z para verificarmos empiricamente em que medida existe uma relação entre
372 Ministério da Saúde
as variáveis Z e X. Em última instância, essa é uma questão operacional. O desafio muito
frequentemente recai sobre a restrição de exclusão, cuja validade requer condições
bastante únicas e que não pode ser testada – afinal, existem inúmeras variáveis
observáveis ou não que podem estar contidas em U e, portanto, simultaneamente
relacionadas com Z e Y. A validade da restrição de exclusão, nesse sentido, depende de
características muito específicas do contexto empírico e de um convencimento
eventualmente baseado em teoria ou discussão conceitual, já que é uma hipótese não
verificável. É comum encontrarmos na literatura científica variáveis instrumentais
estranhas. Não à toa, um instrumento válido Z não tem relação direta com Y a não ser
através de X. Essa alavanca é bastante específica.
3 Estimação
Como então utilizar um instrumento válido para a identificação de impactos causais? Um
dos estimadores de VI mais intuitivos e utilizados em econometria aplicada é o estimador
de Mínimos Quadrados Ordinários em 2 Estágios (MQO2E) – utilizamos como jargão a
sigla 2SLS, que se refere à expressão em inglês two-stage least squares. De modo
simplificado, como o nome sugere, esse estimador é baseado em um sistema de duas
equações lineares. A primeira equação refere-se ao primeiro estágio, quando regredimos a
variável endógena X no instrumento Z e nas demais variáveis exógenas do modelo em
questão – para simplificação, podemos denotá-las por X-k. Ou seja, se válido o fato de que
as demais variáveis do modelo – como, por exemplo, variáveis de controle ou efeitos-fixos
– são exógenas, devemos incluí-las juntamente com Z no lado direito de nossa equação de
primeiro estágio. Por ser uma projeção ortogonal, dadas as propriedades do MQO, nesse
primeiro estágio conseguiremos decompor variações de X em duas partes.
Podemos então seguir para o segundo estágio, em que regredimos finalmente a nossa
variável de resultado Y sobre 𝑋𝑋̂ e as demais variáveis exógenas do modelo. Notem que, se
de fato temos um instrumento Z válido, podemos assumir que a variação remanescente em
𝑋𝑋̂ é exógena e ortogonal a U. Quebramos então a relação endógena entre X e U ao utilizar
no segundo estágio em lugar de X o seu componente exógeno 𝑋𝑋̂. Intuitivamente, utilizamos
a alavanca Z para gerar uma variação exógena em X e independente de U. Devemos notar
também, no entanto, que a variação remanescente em X contida em 𝑋𝑋̂ é apenas uma parte
da variação total em X. Isso significa que temos menos informação nos dados para a
identificação dos nossos parâmetros e que a variação utilizada tem como origem as
observações que responderam ao instrumento. Voltaremos a esse ponto mais adiante.
Caso o instrumento Z seja válido, portanto, o estimador 𝛽𝛽̂2𝑠𝑠𝑠𝑠𝑠𝑠 por 2SLS pode ser
considerado consistente. Com relação à eficiência e estimação do seu erro padrão, muito
embora pareça intuitivo tratar ou estimar as duas equações acima separadamente,
devemos sempre considerar que temos um sistema de equações em mãos e que a
inferência correta deve levar em consideração este fato e a estrutura de covariância entre
os componentes de erro idiossincrático do primeiro e do segundo estágios. Felizmente,
códigos já prontos no Stata ou no R resolvem estas questões mais técnicas para nós e nos
entregam estimativas para os parâmetros de interesse e erros-padrão corretamente
estimados. No Stata, por exemplo, a sintaxe abaixo ilustra como usar o comando no caso
em que temos y variável de resultado, x variável de interesse endógena, z variável
instrumental e um conjunto de variáveis de controle c 1, c2 ... ck. Notem que o comando
destaca entre parênteses os termos x endógeno e z instrumento.
iv_reg = ivreg(y ~ x + C | C + z)
4 Questões práticas
Instrumentos fracos. Nesta seção discutimos uma série de questões práticas que
devemos considerar ao utilizarmos o método de VI. Em primeiro lugar, devemos reforçar o
fato de que é relativamente difícil encontrar um instrumento válido em aplicações. Como já
discutido, isso decorre em grande medida da restrição de exclusão. Ainda assim, mesmo
que a restrição de exclusão seja válida, podemos ter o problema de instrumentos fracos.
Vimos que, em última instância, o instrumento pode ser interpretado como uma alavanca
que nos permite gerar uma variação exógena em X e utilizá-la para a identificação do efeito
causal de X sobre Y no segundo estágio. Como discutimos também, a variação
remanescente em X contida em 𝑋𝑋̂ é apenas parte da variação total em X, o que significa
que temos menos informação nos dados para a identificação dos nossos parâmetros.
Quanto menos variação é gerada pela alavanca, menos informação carregamos para o
segundo estágio.
Para essa questão ficar mais clara, voltemos ao exemplo no qual o instrumento Z com
origem em um sorteio aleatório cujo resultado implica na adesão dos municípios sorteados
à política X. Por ser resultado de um sorteio, Z deverá ser independente das variáveis
observáveis ou não que podem estar contidas em U. Por outro lado, esperamos que Z afete
a adesão à política X, logo, quaisquer variações em Y induzidas por variações em Z devem
ocorrer via variações em X. Agora vamos separar duas situações. Na primeira delas, uma
vez sorteado, o município necessariamente adere à política X. Na segunda delas, uma vez
sorteado, o município pode ou não aderir à política X. Mas especificamente, suponha que
nesse segundo caso apenas os municípios de determinada macrorregião do país tende a
aderir à política. Considere também que temos efeitos heterogêneos, por exemplo, o efeito
da política neste grupo de municípios é diferente do efeito nos municípios do restante do
país (pode ser maior ou menor). Ao compararmos as duas situações, percebemos que no
primeiro caso a alavanca é mais transversal a todos os municípios, enquanto no segundo
ela tende a mover um grupo específico de municípios.
Importante também mencionar que quando temos efeitos heterogêneos em nosso contexto
empírico, precisamos de algumas hipóteses adicionais para identificação, para além do
primeiro estágio e da restrição de exclusão como antes enunciados. Destaca-se a condição
de monotonicidade. Essa condição impõe que o instrumento afete o comportamento das
unidades de observação no mesmo sentido. Embora o instrumento possa ser incapaz de
mover algumas unidades (por exemplo, tenha efeito zero sobre a adesão de municípios à
política X no restante do país), quando ele induz mudança ele o faz no mesmo sentido:
todas as unidades afetadas movem-se no mesmo sentido, ou positivamente ou
negativamente. Essa condição é bastante técnica e sem ela não conseguimos garantir que
o parâmetro estimado recupere uma média ponderada do efeito causal no grupo das
unidades afetadas.
O respeito às condições para que o instrumento seja válido mesmo sob efeitos
heterogêneos, no entanto, não nos garante que tal alavanca nos entregue o resultado que
o faria sob efeitos homogêneos. Sob efeitos heterogêneos, o método de VI nos entrega um
efeito de tratamento médio local de X sobre Y, mais uma vez recorrendo a jargões, um
LATE (local average treatment effect): o parâmetro LATE é o efeito causal médio de X sobe
Y para aquelas unidades cujo comportamento foi alterado pelo instrumento Z.
Discussão de hipóteses e forma reduzida. Como já deve estar claro neste ponto,
trabalhar com variáveis instrumentais requer uma série de reflexões sobre condições
técnicas e interpretações que são próprias do contexto empírico. Importante enfatizar que
muito temos o que refletir e discutir sobre a restrição de exclusão, uma vez que essa é não
apenas condição fundamental para a validade do método como também uma hipótese não
testável. Em última instância, essa condição refere-se à relação entre o instrumento e as
demais variáveis não observáveis que podem afetar Y. Por ser uma condição não testável
empiricamente, a defesa ou o escrutínio da restrição de exclusão se dá no campo da teoria
e da lógica, sempre aplicadas ao contexto empírico no qual se dá a análise em questão.
Uma parte importante de um estudo que utiliza variáveis instrumentais, portanto, refere-se
à discussão sobre as hipóteses que garantem a validade da restrição de exclusão e sobre
as possíveis histórias alternativas que poderiam conectar Z a outros determinantes de Y
que não X.
O Programa Aqui Tem Farmácia Popular. O programa ATFP tem como objetivo ampliar
o acesso da população a medicamentos, principalmente de uso contínuo e para doenças
crônicas, através da participação de farmácias privadas. Américo e Rocha (2020)
examinaram em que medida a expansão do programa afetou taxas de hospitalização e
óbitos por doenças crônicas. Em particular, relacionaram o número per capita de farmácias
acreditadas pelo programa com taxas de mortalidade e hospitalizações por diabetes em
Apesar da importância do ATFP, ainda não havia nenhuma avaliação realizada sobre os
efeitos do programa sobre a saúde da população e os desafios para a identificação de
quaisquer efeitos causais eram bastante claros. Como o programa se difundia através da
adesão de farmácias privadas, esperava-se que essa difusão ocorresse inicialmente em
lugares com maior demanda por medicamentos e onde a rede privada era maior – por
exemplo, em lugares com renda mais alta ou onde o perfil etário da população era mais
envelhecido. Nesse caso, o programa poderia estar seguindo endogenamente em direção
a locais com taxas mais altas de óbitos e hospitalizações por condições crônicas. Se esse
fosse o caso, uma análise de regressão mais superficial do programa poderia resultar em
estimativas com viés de subestimação.
Américo e Rocha (2020) definiram então um modelo em painel com efeitos-fixos de tempo
e municípios relacionando desfechos de saúde e presença do ATFP em combinação com
uma variável instrumental – algo que pudesse gerar uma variação exógena no ritmo de
acreditação de farmácias ao longo do tempo, condicional a controles observáveis,
características municipais fixas no tempo e a tendências de tempo comuns a todos os
municípios. De acordo com o desenho do programa, as farmácias teriam que comprovar
vínculo empregatício de um farmacêutico no momento de submissão dos documentos para
acreditação. No entanto, isso representou uma restrição de facto para muitas farmácias,
que não contavam com a presença de farmacêutico em seus contratos e tiveram
dificuldades de contratação. Os autores definem como instrumento o produto entre uma
tendência de tempo (variando, portanto, no tempo para todos os municípios) e o número
Os dois gráficos a seguir nos ajudam a refletir sobre validade da restrição de exclusão. O
gráfico da esquerda mostra os coeficientes de uma regressão que relaciona o número de
farmácias acreditadas ao programa a interações entre dummies de ano e da oferta de
farmacêuticos per capita no município em 2006, primeiro ano do ATFP. Vemos que o
número de farmácias responde positivamente à oferta de farmacêuticos em 2006 ao longo
do tempo. O gráfico da direita realiza o mesmo exercício, mas agora utilizando a oferta de
funcionários de farmácia exceto farmacêuticos. Como podemos observar, não vemos
nenhuma relação sistemática entre a difusão do programa com a presença destes
funcionários. Esse padrão sugere que de fato a oferta inicial de farmacêuticos foi relevante
para a difusão do programa. Note que o instrumento não é definido como esta oferta, algo
que seria correlacionado com inúmeras outras características municipais relevantes e que
é absorvido por efeitos-fixos municipais, mas como a interação entre essa oferta e uma
tendência linear de tempo. Por hipótese, é essa variação bastante específica que induziria
exogenamente a difusão diferencial do programa entre municípios ao longo do tempo. Para
uma descrição de outros testes e uma discussão mais detalhada sobre a validade da
restrição de exclusão, ver a Seção 4 de Américo e Rocha (2020).
Por fim, a Tabela 1 abaixo mostra os principais resultados econométricos do artigo para
taxas de hospitalização e mortalidade por tipo de diabetes. Cada célula da tabela refere-se
No segundo painel encontramos um padrão similar para diabetes tipo II. Com relação aos
coeficientes de mortalidade, nota-se que o sinal chega a se inverter. Na primeira coluna, o
MQO nos informa uma associação positiva entre o programa e o desfecho. Ao nos
movermos para o 2SLS, vemos que o coeficiente se torna negativo e significativo a 10%.
No caso da hospitalização, verificamos que o coeficiente aumenta mais de 10 vezes (em
módulo) quando nos movemos do MQO para o 2SLS. Mais uma vez, encontramos que o
ATFP foi ainda mais efetivo para a diminuição da taxa de hospitalização por diabetes tipo
II em comparação ao que nos foi informado pelo resultado do MQO.
5 Considerações finais
O método de VI nos oferece uma ferramenta importante e versátil para desenhos empíricos
de identificação de impactos causais e avaliação de políticas públicas. Como discutimos
neste capítulo, no entanto, é fundamental termos claro que existem limitações. Em primeiro
lugar, a tarefa de encontrar uma variável instrumental válida é difícil e devemos ter sempre
em mente a validade da restrição de exclusão, além de outras questões técnicas relevantes.
Mesmo que essas questões sejam resolvidas, e são muitas, devemos lembrar também que
o método de VI nos permite identificar um parâmetro local (LATE) quando temos efeitos
heterogêneos – o que é muito comum em aplicações.
Isso dito, muitas vezes o uso desse recurso pode fazer a diferença. É importante termos
uma caixa de ferramentas completa e preparada para uso, e sem dúvida alguma o método
Por fim, é fundamental ter em vista que o uso adequado do método de VI deve respeitar
protocolos, dentre eles a discussão cuidadosa da restrição de exclusão. Por sua vez, a
restrição de exclusão não é verificável empiricamente e é muito contingente ao contexto
empírico em questão. Por esse motivo, é sempre muito importante que as aplicações com
VI tragam consigo uma descrição detalhada e bem refletida sobre o contexto empírico e, a
partir disso, a definição bem fundamentada do instrumento. Acredito que seja exatamente
isso que faça com que as aplicações com VI sejam tão interessantes, o uso adequado do
método requer algo para além do método: requer discussão conceitual e teórica, conectada
à construção da base de dados e definição das variáveis, e domínio sobre o que se passa
no contexto empírico.
AMÉRICO, P.; ROCHA, R. Subsidizing access to prescription drugs and health outcomes:
The case of diabetes. Journal of Health Economics, v. 72, p. 102347, 2020.
ANGRIST, J. D.; KRUEGER, A. B. Instrumental variables and the search for identification:
From supply and demand to natural experiments. Journal of Economic Perspectives, v.
15, n. 4, p. 69-85, 2001.
CUNNINGHAM, S. Causal inference: the mixed tape. New Haven: Yale University Press,
2021.
Bethânia Almeida1
1
Centro de Integração de Dados e Conhecimentos para Saúde (CIDACS/Fiocruz)
RESUMO:
A pesquisa acadêmica e a pesquisa em saúde pública são contextos específicos de processamento
de dados pessoais na Lei Geral de Proteção de Dados (LGPD). No caso da pesquisa em saúde
pública, além dos devidos padrões éticos relacionados a estudos e pesquisas, será necessária a
regulamentação por parte da Autoridade Nacional de Proteção de Dados e das autoridades da área
da saúde para o adequado estabelecimento de procedimentos. O Brasil precisa envidar esforços para
construir um ecossistema de gestão e governança de dados para pesquisa que abarque a vinculação
de dados administrativos governamentais para pesquisa em saúde pública, com o intuito de subsidiar
a geração de conhecimento científico e de evidências para melhorar as condições de vida e de saúde
da população brasileira.
PALAVRAS-CHAVE:
Dados pessoais. Dados pessoais sensíveis. Pesquisa científica. Pesquisa em saúde pública. LGPD.
A LGPD prevê que dados pessoais e dados pessoais sensíveis devem ser tratados de
forma legal, justa e transparente em relação aos titulares dos dados para mitigar potenciais
riscos em relação aos seus direitos e liberdades. O consentimento do titular dos dados ou
de seu responsável legal é requerido para coleta, processamento e utilização de dados
pessoais e dados pessoais sensíveis conjuntamente com garantias de transparência,
segurança e minimização no uso desses tipos de dados.
O art. 5º, inciso XII da lei define consentimento como “manifestação livre, informada e
inequívoca pela qual o titular concorda com o tratamento de seus dados pessoais para uma
finalidade determinada”. Entretanto, na LGPD existem situações em que a utilização de
dados pessoais e de dados pessoais sensíveis são permitidas sem o consentimento do
titular, desde que existam salvaguardas e proporcionalidade no uso dos dados para alcance
das finalidades. Dentre essas situações estão a pesquisa acadêmica e a pesquisa em
saúde pública.
No Brasil, todo protocolo de pesquisa que envolve seres humanos requer aprovação do
Sistema CEP/Conep com o objetivo de proteger o participante do estudo e assegurar que
esse seja conduzido de acordo com princípios éticos, a partir de resoluções e normativas
deliberadas pelo Conselho Nacional de Saúde1.
A sigla CEP se refere a Comitê de Ética em Pesquisa, instância institucional e local dos
órgãos de pesquisa. A sigla Conep faz referência à Comissão Nacional de Ética em
Pesquisa, instância nacional responsável por analisar projetos de pesquisa que possuem
cooperação internacional propostos pelo Ministério da Saúde e os de áreas temáticas
1
Para obter informações sobre as normativas deliberadas pelo Conselho Nacional de Saúde, acesse:
http://conselho.saude.gov.br/normativas-conep?view=default.
Existem situações em que o uso de dados pessoais e dados pessoais sensíveis para
pesquisa científica poderá ocorrer sem o consentimento do titular dos dados ou de seu
responsável legal. Tais situações precisam ser justificadas e seguir algumas condições em
termos de responsabilidades assumidas pelo coordenador do estudo para mitigar riscos e
assegurar os direitos dos participantes. Na LGPD, o tratamento desses tipos de dados para
pesquisa científica e para pesquisa em saúde pública sem o consentimento do titular
também poderá ocorrer, com base legal no interesse público, desde que seguidos os
requisitos e as recomendações estabelecidos nessa lei.
2
A ANPD é o órgão da administração pública federal responsável por zelar, implementar e fiscalizar o
cumprimento da LGPD no Brasil. Informações sobre a consulta pública intitulada “A LGPD e o tratamento de
dados pessoais para fins acadêmicos e para a realização de estudos por órgão de pesquisa” poderão ser
encontradas pelo link: https://www.gov.br/anpd/pt-br/assuntos/noticias/anpd-publica-estudo-tecnico-a-lgpd-
e-o-tratamento-de-dados-pessoais-para-fins-academicos-e-para-a-realizacao-de-estudos-por-orgao-de-
pesquisa.
Ressalta-se ainda que nessa lei a pesquisa acadêmica e a pesquisa em saúde pública são
consideradas contextos específicos de processamento de dados pessoais e de dados
pessoais sensíveis, desde que busquem equilibrar os direitos individuais e a busca pelo
interesse público a partir da aplicação de medidas técnicas e organizacionais suficientes e
adequadas para garantir a proteção dos dados e o mínimo possível de processamento para
alcance dos objetivos das pesquisas e redução dos riscos relacionados à sua utilização
(DONEDA; BARRETO; ALMEIDA, 2019).
No artigo 4º, a LGPD estabelece seu escopo e define que não se aplica ao tratamento de
dados pessoais realizado para fins exclusivamente jornalístico, artístico e também
acadêmico. Para fim acadêmico remete para os artigos 7º e 11.
Destaca-se ainda que a LGPD tem um artigo específico que dispõe sobre estudos em
saúde pública, o art. 13, o qual estabelece:
Ainda sobre o art. 13, é dito que “o órgão de pesquisa será o responsável pela segurança
da informação prevista no caput desse artigo, não permitida, em circunstância alguma, a
transferência dos dados a terceiro” (BRASIL, 2019, art. 13, § 2.º). E que “o acesso aos
dados de que trata esse artigo será objeto de regulamentação por parte da autoridade
nacional e das autoridades da área da saúde e sanitárias, no âmbito de suas competências”
(BRASIL, 2019, art. 13, § 3º).
Preocupações acerca de como os dados são processados para avaliação de sua qualidade
e aderência a marcos éticos e regulatórios estão presentes na LGPD. Aspectos de suma
importância ao se considerar que a produção e reutilização de dados de distintas fontes em
um mundo cada vez mais digitalizado subsidiam a geração de conhecimento científico,
recorte do texto aqui apresentado.
A LGPD estabelece que os responsáveis pelo tratamento dos dados pessoais organizem e
mantenham registros sobre qualquer atividade relacionada ao processamento de dados
pessoais e de dados pessoais sensíveis. Além disso, institui que os titulares dos dados
possuem o direito de acesso facilitado às informações sobre qualquer tratamento pelos
quais seus dados sejam submetidos. Adicionalmente, a qualquer momento a ANPD poderá
solicitar relatórios e informações específicas sobre o tratamento dos dados para averiguar
se estão sendo seguidos princípios previstos na lei, como proporcionalidade no uso dos
dados para alcance da finalidade que embasou a coleta, transparência e não discriminação
(BRASIL, 2018).
Até então, os titulares dos dados não tinham o direito de saber sobre as formas de coleta e
organização de seus dados, inclusive para criação de seus perfis. Na LGPD, o titular dos
dados poderá pedir revisão do procedimento em decisões baseadas em análises
automatizadas.
O titular dos dados tem direito a solicitar a revisão de decisões tomadas
unicamente com base em tratamento automatizado de dados pessoais que
afetam seus interesses, incluídas as decisões destinadas a definir o seu
A gestão de dados é central na LGPD, aqui concebida como a administração de todo o ciclo
de vida dos dados, desde a coleta, tratamento, acesso e preservação destes.
3
Por meio de modelos analíticos automatizados, conhecidos por algoritmos, identificam-se padrões para
tomada de decisões a partir dos dados disponibilizados.
Outro aspecto a ser considerado é que a LGPD se refere exclusivamente aos direitos dos
indivíduos sobre seus dados e que dados anonimizados não são considerados dados
pessoais. Porém, mesmo sem fazer referência a uma pessoa identificada ou identificável,
informações como localidade, condições de saúde, raça/etnia e status socioeconômico
podem identificar grupos, comunidades e mesmo populações inteiras. Situações que
requerem escrutínio ético sobre os potenciais benefícios e riscos acerca das condições de
tratamento e das finalidades de uso desses dados.
Direitos de grupos sobre seus dados passaram a fazer parte de discussões e orientações
voltadas para a gestão de dados pela perspectiva da ciência aberta. Notadamente a
governança de dados baseada nos princípios Collective Benefit, Authority to Control,
Responsability, Ethics (CARE), acrônimo do inglês para Benefício Coletivo, Autoridade para
Controlar, Responsabilidade, Ética.
Os princípios voltados à proteção de direitos e soberania de povos indígenas sobre seus
dados; gestão e governança de dados pautada no consentimento e acompanhamento dos
usos e reusos de dados individuais, coletivos, ambientais, sociais, religiosos, ancestrais e
culturais a esses relacionados, devem estar em consonância com os valores e interesses
desses povos (GLOBAL INDIGENOUS DATA ALLIANCE, 2022). Os princípios CARE
A gestão de dados articula aspectos técnicos com aspectos sociais – por buscar manter a
segurança e confidencialidade dos dados em respeito aos direitos de indivíduos e de grupos
– e a transparência acerca da proveniência e tratamento aplicado para avaliação da
qualidade e da adequação dos dados às finalidades de (re)utilização.
Ao reconhecer algumas preocupações éticas, legais e sociais em torno dos usos e reusos
de dados pessoais e de dados pessoais sensíveis de indivíduos e grupos a partir da
utilização e Big Data e da gestão de dados pela perspectiva da ciência aberta, a seguir se
abordará a utilização de dados administrativos governamentais para pesquisa científica e
para pesquisa em saúde pública.
Destaca-se que dados administrativos não são uma amostra de toda a população, mas
representativos de um segmento populacional que tem um ou mais atributos em comum.
Dentre as vantagens de se utilizarem estes tipos de dados, destacam-se os grandes
tamanhos das amostras, populações bem caracterizadas e informações coletadas ao longo
do tempo, que possibilitam a realização de estudos longitudinais retrospectivos e
prospectivos (BRAVEMAN; GOTTLIEB, 2014; SANCHEZ et al., 2021; PAIXÃO et al., 2021).
Dados administrativos são um tipo de Big Data, cujo acesso e integração entre bases
apresentam desafios éticos, legais e metodológicos. Pesquisadores em saúde pública
precisam levar em consideração uma série de desafios que visam assegurar direitos de
indivíduos e grupos; e a avaliação dos benefícios e potenciais riscos causados pelo uso de
Big Data de modo a ter um conjunto de medidas que viabilizem o uso dos dados para
melhorar as condições de saúde da população (SALERNO et al., 2017).
No Brasil, ainda não existem iniciativas nesses moldes institucionais, apesar de estudos
que utilizam técnicas de vinculação de dados para pesquisa em saúde ocorrerem desde a
década de 1990. Em 2014, houve uma iniciativa intitulada Seminário sobre a Vinculação de
Bases de Dados na Saúde, na cidade do Rio de Janeiro, organizado pelo Departamento de
Informática do Sistema Único de Saúde (Datasus)/Ministério da Saúde, com a participação
de atores nacionais e convidados de países reconhecidamente desenvolvidos nessa área.
Foram discutidos princípios para orientar a normatização e padronização da utilização de
bancos de dados identificados e vinculados para gestão e pesquisa em saúde e incentivar
o Brasil a adotar um modelo nacional de vinculação de bases de dados populacionais
(COELI; PINHEIRO; CAMARGO JÚNIOR, 2015).
4
Alguns exemplos no Reino Unido, Canadá, Estados Unidos e Austrália: SAIL Databank.
https://saildatabank.com/; Administrative Data Research UK. https://www.adruk.org/; Population Data BC.
https://www.popdata.bc.ca/; Massive Data Institute. https://mdi.georgetown.edu/; Population Health
Research. Network (https://www.phrn.org.au/); Center for Health Services Research
https://chsr.centre.uq.edu.au/research/administrative-data-analytics.
5 Considerações finais
Ressalta-se ainda que a LGPD poderá dinamizar processos de literacia sobre direitos
individuais e coletivos sobre seus dados que incluam a sensibilização e o provimento de
informações sobre direitos, finalidades de uso, possíveis exceções para uso de dados
secundários sem o consentimento do titular e salvaguardas previstas na lei.
BARRETO, M. L. et al. The Centre Data and Knowledge Integration for Health (CIDACS):
linking health and social data in Brazil. International Journal of Population Data
Science, v. 4, n. 2, p. 1-11, 2019. Disponível em:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8142622/pdf/ijpds-04-1140.pdf. Acesso em:
27 set. 2022.
BRAVEMAN, P.; GOTTLIEB, L. The social determinants of health: it’s time to consider the
causes of the causes. Public Health Reports, v. 129, supl. 2, p. 19-31, 2014. Disponível
em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3863696/. Acesso em: 27 set. 2022.
LEONELLI, S. A pesquisa científica na era do Big Data: cinco maneiras que mostram
como o Big Data prejudica a ciência e como podemos salvá-la. Tradução de Carla Cristina
Munhoz Xavier. Rio de Janeiro: Fiocruz, 2022.
SALERNO, J. et al. Ethics, big data and computing in epidemiology and public health.
Annals of Epidemiology, v. 27, n. 5, p. 297-301, 2017. Disponível em:
https://pubmed.ncbi.nlm.nih.gov/28595734/. Acesso em: 27 set. 2022.
SANCHEZ, M. N. et al. Physical disabilities caused by leprosy in 100 million cohort in
Brazil. BMC Infectious Diseases, v. 21, n. 1, p. 1-11, 2021. Disponível em:
https://pubmed.ncbi.nlm.nih.gov/33752632/. Acesso em: 27 set. 2022.
Marcio Natividade1
Samilly Silva Miranda1
Alberto Sironi1
Evandro Mota Lopes Neto1
Juracy Bertoldo1
1
Instituto de Saúde Coletiva, Universidade Federal da Bahia
RESUMO:
Com o crescimento exponencial da produção de dados, cada vez mais os pesquisadores têm se
apropriado da análise de grandes bancos de dados (Big Data), embora sejam necessários muitos
requisitos que envolvem a ética, a segurança, o armazenamento e a gestão. Este capítulo, de forma
sintética, discorre sobre a segurança e gestão da informação, a partir de dados sensíveis (identificados)
no campo da saúde, apresentando a infraestrutura necessária para garantir a salvaguarda desses
dados com segurança, bem como discutindo aspectos que viabilizem as pesquisas em saúde no
contexto da Lei de Geral de Proteção de Dados (LGPD) de 13.709/2018.
PALAVRAS-CHAVE:
Produção de dados. Big Data. Ética, segurança e gestão da informação.
1
Linkage consiste na ligação de dois ou mais bancos de dados independentes, com a característica de
possuírem variáveis em comum (SILVA; LEITE; ALMEIDA, 2009).
Para Zhang et al. (2017), existem três possibilidades que a ciência do Big Data pode
oferecer para minimizar as disparidades em saúde: incorporar informações padronizadas
sobre determinantes demográficos e sociais nos registros eletrônicos de saúde; vincular
variáveis geográficas e determinantes sociais da saúde a dados clínicos e resultados de
saúde; e levar à melhor compreensão da etiologia das disparidades de saúde. Essas ações
tendem a contribuir para o melhor direcionamento das políticas públicas e das práticas em
vigilância, bem como orientar o desenvolvimento de intervenções prioritárias e adequadas
a cada grupo populacional.
O termo Data Lake (lago de dados em português) foi criado em 2010 por James Dixon e
sua equipe da Pentaho (software de business intelligence) (DIXON, 2015). Essa
nomenclatura faz analogia a um corpo d'água que não foi filtrado ou contido, o que
representaria um repositório capaz de armazenar dados em seu estado natural/original.
Fonte: https://www.salesforce.com/br/blog/2020/10/data-warehouse-e-data-lake.html.
Os Data Lakes (DLs) exigem governança, segurança e manutenção contínuas para que os
dados possam ser usados e acessados. De acordo com Miloslavskaya e Tolstoy (2016)
alguns requisitos devem ser considerados para o devido suporte aos DLs: uma arquitetura
escalável; governança e aplicação de políticas de retenção, disposição, identificação de
dados; catalogação e indexação centralizada do inventário de dados (e metadados)
disponíveis, incluindo fontes, versionamento, veracidade e precisão; capacidade de
relacionamento de um banco de dados relacional; informações sobre o que foi feito com o
dado, quando e sua origem; facilidade de acesso, gerência e análise, dentre outros.
Embora o DL tenha atraído mais atenção das áreas de negócios do que das áreas de
pesquisa acadêmica (KHINE; WANG, 2018), pode ser empregado nos estudos de
diferentes áreas, como da saúde, genoma, meio ambiente etc. Ter acesso a grandes
volumes de dados possibilita a produção de informações mais confiáveis, que tendem a
facilitar o monitoramento, controle e erradicação de doenças e agravos em saúde. No
entanto, para que os benefícios desse repositório de dados sejam de fato alcançados é
imprescindível que as instituições de pesquisa possuam infraestrutura mínima para
armazenar e garantir a gestão dos dados científicos de maneira fácil, rápida e segura.
4 Infraestrutura
De maneira geral, as tecnologias de Big Data requerem uma estrutura que possibilite
aumentar o desempenho da manipulação de grandes volumes de dados. Para se instalar
um repositório de dados é importante verificar a capacidade de cada equipamento que será
utilizado, considerando-se a eficiência de processar e armazenar os dados. Segundo
Taurion (2013), a qualidade dos dados é um ponto crucial do Big Data. Metodologicamente
é fundamental estruturar o processo operacional e os constantes atributos relacionados à
validade, volatilidade, regras de transformação, processo de uso dentro da organização e
como esses dados podem gerar um fator de diferenciação.
• HDD – comumente conhecido como disco rígido, o hard disk drive é considerado
a parte principal em sistemas de armazenamento. É um tipo de armazenamento
não volátil, ou seja, retém os dados mesmo quando são desligados. Matrizes de
discos podem ser montadas com vários HDs com o objetivo de alcançar maior
capacidade de armazenamento e gerar alto rendimento de acesso e alta
disponibilidade a custos mais baixos;
• SSD – o solid state drive, mais conhecido como SSD, é um tipo de armazenamento
que não tem componentes mecânicos e é considerado mais rápido e silencioso
quando comparado ao HD; possui taxas de transferência maiores e geram menos
latência (tempo até acessar um arquivo).
Ainda segundo Hu et al. (2014), as categorias de matrizes de discos também são um fator
importante para ser considerado na infraestrutura e podem ser entendidas como
subsistemas de armazenamento e organizadas de diferentes maneiras, nas quais se
destacam:
• Armazenamento de conexão direta (DAS) – Direct Attached Storage consiste
no armazenamento local no qual dispositivos, como vários HDs, por exemplo, são
conectados diretamente a um computador ou servidor sem a utilização de rede entre
eles;
Necessário mencionar que o R Software também merece destaque no cenário dos dados.
O R é uma linguagem de programação multiparadigma voltada para o campo da estatística,
a qual permite manipular, analisar e visualizar dados de forma concisa e eficiente. Além
das técnicas estatísticas, também fornece técnicas gráficas e é altamente extensível por
intermédio de pacotes. Os pacotes são conjuntos de funções extras que agregam
funcionalidades ao R. Pelo pacote Sparklyr, por exemplo, é possível utilizar os recursos do
Spark com o R e otimizar o processamento de grandes bases de dados.
A partir da integração dos SIS abre-se a possibilidade para novas perguntas de pesquisa,
o que propicia acompanhar os indivíduos desde o nascimento até o óbito. Para unir
Para garantir a segurança dos dados que subsidiam diversas pesquisas, o Instituto de
Saúde Coletiva da Universidade Federal da Bahia (ISC/UFBA) conta com o repositório de
dados seguros Prof. Sebastião Loureiro2, local com alta capacidade de processamento,
armazenamento e estrutura de segurança como controle de acesso por biometria e
monitoramento por câmeras. O lugar conta com dois ambientes; o primeiro tem um servidor
com alta capacidade de processamento e armazenamento para vinculações de dados, seja
por métodos determinísticos, não determinísticos e probabilísticos, sem qualquer conexão
externa – local ou com internet. O segundo ambiente, cujo foco é a construção de datasets
e análises por meio de dados não identificados, conta também com servidores de alta
capacidade em relação a processamento, memória RAM e disco.
2
Prof. Sebastião Loureiro foi docente do Instituto de Saúde Coletiva da UFBA, médico, Ph.D. em
epidemiologia, fundador do grupo de pesquisa em economia da saúde e um incentivador da aquisição dos
servidores para uso intensivo de dados em pesquisas com foco no SUS.
4º - Os dados são anonimizados de forma que o indivíduo não possa ser identificado
de acordo com a LGPD;
Tendo em vista a importância do uso de dados sensíveis para uso em pesquisas, torna-se
relevante assegurar sua segurança e proteção. Embora existam protocolos que orientam
àqueles envolvidos com a gestão de dados científicos, incluindo-se a formalização do
compromisso com as questões éticas e de privacidade, é imperiosa a aprovação em Comitê
A Resolução no 466/2012 impõe que as pesquisas que envolvem seres humanos devem
atender aos fundamentos éticos e científicos pertinentes, os quais devem prever
procedimentos que assegurem a confidencialidade e a privacidade durante todas as fases
da pesquisa. Técnicas para anonimização dos dados, além de outras medidas de
segurança dos repositórios, discutidas anteriormente, são fundamentais para a proteção
dos dados pessoais, bem como amparam os pesquisadores responsáveis pela salvaguarda
dos dados de futuras complicações éticas.
A produção de conhecimento gera benefícios para toda a sociedade. Fazer ciência é ser
capaz de produzir resultados utilizando-se de procedimentos, métodos e técnicas de forma
clara, objetiva e imparcial. Logo, uma política institucional de dados fortalece a possibilidade
de armazenar, gerir, compartilhar e analisar dados de diferentes fontes com segurança e
qualidade.
CHRISTEN, P. Data matching: concepts and techniques for record linkage, entity
resolution, and duplicate detection. Berlim: Springer, 2012.
CHRISTEN, P.; RANBADUGE, T.; SCHNELL, R. Linking sensitive data: methods and
techniques for practical privacy-preserving information sharing. Berlim: Springer Nature,
2020.
CORSI, A. et al. Big data analytics as a tool for fighting pandemics: a systematic review of
literature. Journal of Ambient Intelligence and Humanized Computing, v. 12, n. 10, p.
9163-9180, 2021. Disponível em: https://pubmed.ncbi.nlm.nih.gov/33144892/. Acesso em:
30 set. 2022.
DIXON, J. Pentaho, Hadoop, and Data Lakes. 2015. Disponível em: https://jamesdixon.
wordpress.com/ 2010/10/14/pentaho-hadoop-and-data-lakes/. Acesso em: 15 maio 2022.
HU, H. et al. Toward scalable systems for big data analytics: a technology tutorial. IEEE
Access, v. 2, p. 652-687, 2014. Disponível em: https://ieeexplore.ieee.org/stamp/stamp.js
p ?tp=&arnumber=6842585. Acesso em: 29 set. 2022.
KHINE, P. P.; WANG, Z. S. Data lake: a new ideology in big data era. In: ITM WEB OF
CONFERENCES 17. Proceedings [...]. 2018. p. 1-11, ref. 03025. (WCSN 2017).
Disponível em: https://www.itm-conferences.org/articles/itmconf/pdf/2018/02/itmconf_
wcsn2018_03025.pdf. Acesso em: 29 set. 2022.
MILOSLAVSKAYA, N.; TOLSTOY, A. Big Data, Fast Data and Data Lake Concepts.
Procedia Computer Science, v. 88, p. 300-305, 2016. Disponível em:
https://www.sciencedirect.com/science/article/pii/S1877050916316957. Acesso em: 5 nov.
2022.
SAETRA, H. S. Science as a vocation in the era of big data: the philosophy of science
behind big data and humanity's continued part in science. Integrative Psychological &
Behavioral Science, v. 52, n. 4, p. 508-522, 2018. Disponível em:
https://pubmed.ncbi.nlm.nih.gov/29974331/. Acesso em: 29 set. 2022.
ZHANG, X. et al. Big data science: opportunities and challenges to address minority health
and health disparities in the 21st Century. Ethnicity & Disease, v. 27, n. 2, p. 95-106,
2017. Disponível em: https://pubmed.ncbi.nlm.nih.gov/28439179/. Acesso em: 29 set.
2022.
1
Fundação Oswaldo Cruz - Fiocruz
RESUMO:
O capítulo “Acesso aos dados agregados e microdados do SUS” apresenta um histórico sobre a
disseminação da informação em saúde no Brasil e a criação do DataSUS. Em seguida, apresenta alguns
Sistemas de Informação em Saúde, com detalhes sobre sua criação e finalidades. São apresentadas
as ferramentas de acesso aos dados TabWin e TabNet. Por fim, apresenta-se um pacote do R para a
finalidade de download e pré-processamento de microdados do DataSUS.
PALAVRAS-CHAVE:
Sistemas de Informação em Saúde. Processamento eletrônico de dados. Software.
Pode-se afirmar que a coleta sobre informação em saúde começa de forma dispersa no
Brasil, ainda no início da colonização portuguesa, com registros de nascimentos e óbitos
em paróquias religiosas e registros ambulatoriais e hospitalares criados por instituições de
saúde e dispensários no começo do século XX. No final do mesmo século, os dados
populacionais de saúde eram muito atrelados ao trabalho formal, vinculados aos registros
trabalhistas e de aposentadoria.
Cabe aqui ressaltar que o DataSUS é criado e estabelecido no mesmo momento em que o
Brasil passa a se informatizar mais amplamente, com a possibilidade de importação de
equipamentos possibilitada pela Lei da Informática (no 8.248/91 e no 8.387/91), na transição
de um modelo de mercado econômico fechado para aberto. Dessa forma, pode-se afirmar
que o DataSUS acompanhou o processo de informatização brasileiro em seu início, de
forma pioneira.
Alguns foram criados inicialmente para dar conta de demandas administrativas, como o
pagamento de internações em instituições de saúde e serviços de profissionais. Outros
sistemas foram criados especificamente para finalidades epidemiológicas, visando prover
o Estado de informações sobre a saúde da população.
Em ambos os casos, à medida que um sistema de informação passa a não ser capaz de
responder a perguntas novas, esse pode ser reformado ou pode-se criar um sistema de
informação novo, visando atender àquela demanda específica.
Por esse motivo, o retrato atual dos Sistemas de Informação em Saúde é disperso em
vários componentes, com algumas sobreposições de finalidade entre seus sistemas e
estados transitórios na sua evolução.
Importante também ressaltar que alguns dos Sistemas de Informação em Saúde cobrem
os processos registrados apenas nas instâncias públicas do SUS e devem ser
complementados por sistemas próprios de informação da Saúde Suplementar (serviços
privados de saúde prestador por instituições privadas e planos de saúde). A fonte apresenta
alguns dos Sistemas de Informação em Saúde do Brasil ilustra que esses visam dar conta
do ciclo de vida de um cidadão e cobrem aspectos desde o seu nascimento até o óbito.
Além desses, podem-se destacar os sistemas de informação estruturais, como o Cadastro
Nacional de Estabelecimentos e Profissionais de Saúde (CNES) e o Sistema de
Informações sobre Orçamentos Públicos em Saúde (SIOPS).
Ainda que existam esses tempos típicos de consolidação e defasagem, cabe ressaltar que
alguns sistemas de informação em saúde disponibilizam dados antes do tempo previsto,
como preliminares do dado a ser disponibilizado no futuro, após correções e ajustes
necessários.
A forma mais tradicional é utilizar os sistemas disponibilizados pelo próprio MS: TabNet e
TabWin.
3.1 TabNet
O TabNet é um sistema de consulta aos dados dos sistemas de informação em saúde e
outros dados relacionados à saúde acessível diretamente pela internet; na página do
DataSUS1 existe um link para acessá-lo.
O sistema é estruturado por temas, conforme quadro abaixo (consulte a lista de siglas em
conjunto).
https://datasus.saude.gov.br
1
Na próxima tela, o usuário precisa configurar como a tabela de dados agregados será
construída. É possível especificar qual informação será utilizada para linhas, colunas e
conteúdo, bem como o período desejado. Também é possível configurar alguns filtros
referentes a especificidades dos agravos ou procedimentos, faixa etária, sexo, cor/raça,
entre outros.
Cabe destacar que filtro de período se refere à data de processamento do dado e não à
data de ocorrência em alguns sistemas. Por exemplo, a seleção de dezembro de 2019 nos
dados do SIH se refere às internações processadas nesse mês e ano e pode conter
internações realizadas em dezembro, novembro e outros meses.
3.2 TabWin
As informações disponibilizadas de forma agregada pelo TabNet não atendem a todas as
necessidades de pesquisa, as quais algumas vezes demandam dados em outras
agregações ou individuais. Para essa finalidade, foi desenvolvido o TabWin.
Após sua instalação, a utilização do TabWin depende de dois tipos de arquivos: os arquivos
de dados (formato DBC) e os arquivos auxiliares de tabulação (formatos DEF e CNV), que
podem ser acessados no mesmo local de download do TabWin.
4 DataSUS no R: microdatasus
Com o advento da ciência de dados e Big Data, o acesso e uso dos dados se tornaram
mais intensos e variados e demandaram a utilização de novas plataformas que permitam o
uso mais livre dos dados, sem a dependência de programas elaborados pelo próprio MS.
Em geral, esse uso se dá com linguagens de programação e dentre as mais comuns para
este uso estão o R e o Python. Ambas as linguagens oferecem diversas vantagens para o
acesso, manipulação e análise de dados em qualquer sistema operacional. Enquanto no
Python é possível utilizar a biblioteca pysus2, no R pode-se utilizar a biblioteca
microdatasus3.
Em geral, o objetivo dessas bibliotecas é facilitar o acesso aos dados com o download
automático dos arquivos necessários e automatizar o pré-processamento dos dados, que
https://github.com/AlertaDengue/PySUS
2
https://github.com/rfsaldanha/microdatasus
3
install.packages("remotes")
remotes::install_github("rfsaldanha/microdatasus")
library(microdatasus)
A biblioteca microdatasus é dotada de duas funções principais: uma para o acesso aos
dados e outra para o pré-processamento desses.
Para o acesso aos dados, utiliza-se a função fetch_datasus. Atualmente, o pacote permite
o download de dados dos seguintes sistemas de informação:
>dim(dados_sim)
[1] 285306 88
Outro exemplo: realizar o download de dados do SIH para o estado do Espírito Santo, entre
janeiro de 2018 e março de 2019. Como os arquivos do SIH são divididos entre ano e mês,
é necessário informar esses parâmetros para a função.
>dim(dados_sih)
[1] 300925 113
>unique(dados_sim$SEXO)
[1] 2 1 0
Levels: 0 1 2
Para atribuir os rótulos dessa variável e demais variáveis categóricas, pode-se utilizar as
funções do tipo process do pacote microdatasus. Tem-se as seguintes funções no pacote:
Note-se que não há funções nos pacotes para todos os sistemas de informação e suas
variações. Essas funções são adicionadas ao pacote esporadicamente, com o trabalho
voluntário de pessoas que contribuem para a evolução e manutenção do pacote.
Abaixo, vai-se pré-processar os dados do SIM que foram baixados no exemplo anterior.
dados_sim<- process_sim(data = dados_sim)
>unique(dados_sim$SEXO)
[1] "Feminino" "Masculino" NA
library(microdatasus)
library(tidyverse)
Sys.setlocale("LC_TIME","pt_BR")
dados_sinasc %>%
select(PARTO, DTNASC) %>%
mutate(
dia_semana = format(as.Date(DTNASC), "%a")
) %>%
group_by(dia_semana, PARTO) %>%
summarise(freq = n()) %>%
ungroup() %>%
na.omit() %>%
mutate(
dia_semana = factor(
x = dia_semana, levels = c("Seg", "Ter", "Qua",
"Qui", "Sex", "Sáb", "Dom")
)
) %>%
ggplot(aes(fill = PARTO, x = dia_semana, y = freq)) +
geom_bar(position = "fill", stat = "identity") +
scale_y_continuous(labels = scales::percent) +
theme_bw() +
labs(title = "Tipo de parto por dia da semana", subtitle = "Santa Catarina, 2019",
fill = NULL, x = "Dia da semana", y = "Percentual") +
theme(legend.position = "bottom")
Com esse pequeno código, consegue-se realizar o download dos dados do SINASC, pré-
processar as suas variáveis e fazer uma análise rápida do dia do nascimento e tipo de
parto, evidenciando o comportamento anômalo de mais partos cesarianos em dias
comerciais e mais partos vaginais nos finais de semana.
5 Conclusões
O DataSUS tem papel essencial nas ações de saúde pública brasileira, executa desde a
coleta dos dados até a disseminação e passa pela estruturação e organização de
informações de saúde. Ainda que problemas possam ser evidenciados em seus Sistemas
de Informação em Saúde, a importância de sua manutenção e uso é indiscutível.
Sigla Descrição
AMS Pesquisa Assistência Médico Sanitária
ANS Agência Nacional de Saúde Suplementar
APAC Autorização de Procedimento de Alta Complexidade
CBO Classificação Brasileira de Ocupações
CMD Conjunto Mínimo de Dados
CNES Cadastro Nacional de Estabelecimentos de Saúde
COAP Contrato Organizativo da Ação Pública da Saúde
CSV Comma Separated Values
DATAPREV Empresa de Tecnologia e Informações da Previdência Social
DataSUS Departamento de Informática do SUS
FNS Fundo Nacional de Saúde
HIPERDIA Programa para a Melhoria do Controle dos Pacientes com Hipertensão e
Diabetes Mellitus
IBGE Instituto Brasileiro de Geografia e Estatística
IDB Indicadores e Dados Básicos
INAMPS Instituto Nacional de Assistência Médica da Previdência Social
PCE Programa de Controle da Esquistossomose
PIB Produto Interno Bruto
PNAD Pesquisa Nacional por Amostra de Domicílios
PNS Pesquisa Nacional da Saúde
RNDS Rede Nacional de Dados em Saúde
SCZ Síndrome Congênita associada à infecção pelo vírus Zika
SIA Sistema de Informações Ambulatoriais
SIH Sistema de Informações Hospitalares
SIM Sistema de Informação sobre Mortalidade
SINAN Sistema de Informação de Agravos de Notificação
SINASC Sistema de Informações de Nascidos Vivos
SIOPS Sistema de Informações sobre Orçamentos Públicos em Saúde
SIPNI Sistema de Informações do Programa Nacional de Imunizações
SISCAN Sistema de Informação do Câncer
SISCOLO Sistema de Informação do Câncer do Colo do Útero
SISMAMA Sistema de Informação de Câncer de Mama
SISVAN Sistema de Informações da Vigilância Alimentar e Nutricional
UF Unidade da Federação
VIGITEL Vigilância de Fatores de Risco e Proteção para Doenças Crônicas por
Inquérito Telefônico
VIVA Vigilância de Violências e Acidentes
Felipe Ferré1
1
Conselho Nacional deSecretários de Saúde - Conass
RESUMO:
Este capítulo introduz a modelagem e gestão de dados, tendo como foco o gestor do SUS e
pesquisadores de saúde coletiva. Para isso, utiliza a integração de Sistema Gerenciador de Banco de
Dados (SGBD) com o R e linguagemestruturada de consulta SQL (Structured Query Language). Além
disso, aborda os conceitos de modelagem relacional e analítica e demonstra por meio de exemplos
com os dados do SUS, como armazenar e recuperar dados, elaborar estratégias de indexação e como
realizar a transposição e processamento de bases de dados massivas – Big Data.
PALAVRAS-CHAVE:
Linguagem R. Gestão de dados. Big Data. SQL.
O capítulo foi escrito com abordagem da prática para a teoria, isto é, são trazidos exemplos
práticos de dados disseminados via ftp://ftp.datasus.gov.br (no bojo da estratégia do
TabWin; para mais informações acesse https://datasus.saude.gov.br/transferencia-de-
arquivos/) e https://opendatasus.saude.gov.br/. Os exemplos são aplicados aos conceitos
das ciências da computação e informação acerca da modelagem relacional e introduzidos
aspectos do diagrama de entidade e relacionamento.
Os exemplos foram codificados em R, versão 4.1.2 e PostgreSQL (psql) 14.2 (Ubuntu 14.2-
1.pgdg20.04+1). Pequenas adaptações podem ser necessárias caso o usuário possua
ambientes diferentes, contudo, sem prejuízo para a aprendizagem dos conceitos.
• ambiente cliente-servidor, uma vez que os dados podem ser acessados pelas
máquinas dispostas no mesmo ambiente de rede ou por parceiros quando o acesso
externo à rede é configurado ou quando são armazenados em nuvem.
Os dados disseminados pelo Datasus são detalhados no capítulo 17 – Acesso aos Dados
agregados e microdados do SUS. O interesse aqui é apenas sumarizar os dados
disponíveis para caracterizar o recorte escolhido. O conhecimento do conteúdo dos dados
disponibilizados pelo SUS, da estrutura e forma de disseminação, é fundamental para a
modelagem relacional e respectiva gestão dos bancos de dados resultantes.
continua
Logo, para obter dados hospitalares nacionais entre 01/2008 e 03/2022 deverão ser
extraídos, transformados e carregados 17.251 arquivos DBC e organizado o
armazenamento de 1.917.030.286 registros. A Tabela 2 mostra características de arquivos
DBC sortidos.
DOEXT11.DBC SIM DOE - Declarações de Óbitos por causas externas 145.842 2020-01-31
3.2.1 Entidades
3.2.2 Atributos
• Possibilidade de subdivisão:
o simples (por exemplo sexo, idade,);
o composto (por exemplo endereço, nome, composição de princípio ativo
do medicamento e data de internação).
• Derivação:
o primários ou armazenados (data de nascimento);
o derivados, pois são obtidos a partir dos dados armazenados (por
exemplo idade calculada a partir data de nascimento, número de
atendimentos de dado usuário do SUS, dias entre o tratamento atual e
o anterior).
3.2.3 Domínio
3.2.4 Relacionamentos
Nesse ponto o leitor deve ter intuído que uma entidade é registrada no banco
de dados enquanto um conjunto específico de atributos (aqui também
chamado classe). Bancos de dados em saúde são comumente modelados
com conjuntos, a exemplo de usuário do
SUS, trabalhador, estabelecimento e procedimento. Cada objeto da classe é
relacionado em tabelas à parte. Em bancos de dados estruturados, o formato
mais comum é o de tabela – com linhas ou tuplas – representando cada
instância, isto é, o usuário do SUS x, o trabalhador y, o estabelecimento z e
o procedimento w e colunas representando cada atributo respectivo.
Existem várias formas de se integrar R com outras linguagens. Aqui vai se atar os
códigos SQL e R para usar o melhor de ambos. Em um ambiente markdown utiliza-
se o chunk sql. Adote a ferramenta Rstudio para a melhor experiência de usuário na
edição de código-fonte.
A Tabela 6 apresenta uma amostra dos registros obtidos do SIA PA. Os subsistemas
do SIA estão listados na Tabela 3.
pa_ges pa_cmp pa_autoriz pa_proc_id pa_ci pa_ pa_sexo pa_mu pa_qt ap_cnspcn
tao dpri idade npcn dapr
Agora tem-se duas tabelas no banco de dados no schema bd_ medicamento, bd_
_medicamento.tm_sia_am e bd_medicamento.tm_sia_pa.
Por exemplo, a Tabela 8 foi obtida com o comando SELECT * FROM bd_
medicamento.tm_sia_am.
pa sexo count
Feminino 96252
Masculino 68532
pa sexo count
Feminino 3552
Masculino 3457
Existem funções que podem ser utilizadas para se avaliar a tabela inteira ou
associadas à cláusula GROUP BY, por exemplo:
select pa_sexo,
COUNT(*)*2+10 as frequencia,
ROUND(AVG(pa_idade::int)) as média,
CEIL(STDDEV(pa_idade::int)) as desvio
from bd_medicamento.tm_sia_pa
where pa_idade::int between 0 and 17
group by pa_sexo
Feminino 7114 11 4
Masculino 6924 12 4
4.4.7 Junções
select pa_gestao,
pa_cmp,
pa_autoriz,
pa_proc_id,
pa_cidpri,
pa_idade,
pa_sexo,
ap_cnspcn
from bd_medicamento.tm_sia_pa as PA
join bd_medicamento.tm_sia_am as AM
on PA.pa_autoriz = AM.ap_autoriz
and PA.pa_gestao = AM.ap_gestao
order by ap_cnspcn, pa_cmp, pa_proc_id
limit 20
UPDATE bd_teste.tm_teste
SET dt_nascimento = '1928-12-22'
WHERE id_usuariosus = 1;
update bd_medicamento.tm_sia_pa
set pa_sexo = 'F'
where pa_sexo = 'Feminino';
update bd_medicamento.tm_sia_pa
set pa_sexo =
case
when pa_sexo = 'Feminino' then 'F'
when pa_sexo = 'Masculino' then 'M'
else 'NA'
end;
WHERE condição_1
AND/OR condição_2
Existem várias formas para fazer carga de dados no SGBD. A forma mais
comum é fazer a carga de um arquivo tabulado, usualmente com separador
de vírgula ou ponto e vírgula; em formato CSV.
Exemplo:
Isso ocorre por se tratar de uma tabela analítica, isto é, desenvolvida para fins
estatísticos e estudos com dados secundários.
pa_cmp::INTEGER,
pa_autoriz::BIGINT,
pa_proc_id::BIGINT,
pa_cidpri,
pa_qtdapr::SMALLINT
co nu nu co co qt co seq co seq
gestao competen autorizacao procedimen diagnostico aprova dispensa usuario sus
cia to sigtap cid10 da cao
270000 202201 27212005521 604600020 Q802 30 1 38774
36
270000 202201 27212008676 604650019 H401 1 2 7760
49
270000 202201 27212008676 604740018 H401 0 3 7760
49
270000 202201 27212008676 604660022 H401 1 4 7760
49
270000 202201 27212008708 604310056 G700 0 5 33886
72
270000 202201 27212008714 604650027 H401 0 6 13927
33
270000 202201 27212008729 604590024 L700 0 7 69
84
270000 202201 27212008737 604740018 H401 0 8 6517
87
270000 202201 27212008909 604090013 N041 0 9 17769
70
update bd_medicamento.tf_dispensacao
set co_usuario_cns_criptografado = ap_cnspcn
from bd_medicamento.tm_sia_am
where co_gestao = ap_gestao::integer
and nu_autorizacao = ap_autoriz::bigint;
Agora vai se gerar uma tabela unívoca de usuários para garantir integridade
referencial, isto é, que cada usuário ocupe apenas um registro, afinal, o
mesmo usuário não pode se repetir nessa tabela.
update bd_medicamento.tm_sia_pa PA
from bd_medicamento.tm_sia_am AM
update bd_medicamento.tf_usuario U
nu_idade = pa_idade::smallint ,
co_municipio_residencia_ibge = pa_munpcn::INTEGER
from
select distinct *
from
select ap_cnspcn,
pa_idade,
pa_sexo,
pa_munpcn,
dense_rank () over (
partition by ap_cnspcn
order by pa_cmp
) co_seq_atendimento
from bd_medicamento.tm_sia_pa
) PA2
Where
PA2.ap_cnspcn = U.co_usuario_cns_criptografado
update bd_medicamento.tf_dispensacao D
set co_seq_usuario_sus = U.co_seq_usuario_sus
from bd_medicamento.tf_usuario U
where D.co_usuario_cns_criptografado = U.co_usuario_cns_criptografado ;
drop co_usuario_cns_criptografado;
Agora que as tabelas temporárias não são mais necessárias, pode-se excluí-
las com o comando DROP.
4.7 Controle
CREATE USER para criar usuários. GRANT para conceder privilégios. REVOKE
para revogar privilégios.
Existe plataforma de bancos de dados em nuvem, a qual basta ser contratada junto ao
fornecedor, por exemplo, a SQL Azure da Microsoft® e a google Cloud SQL.
Aprender SQL significa falar o mesmo idioma praticado em dezenas de lugares, porém,
com diversas variações. Assim como é possível aprender espanhol básico e falar em
diversos países, é desejável se especializar na variação praticada em Buenos Aires, Madri
ou Guadalajara, caso venha a se comunicar frequentemente com a linguagem local.
Existem ferramentas chamadas cliente dos SGBD, as quais facilitam a interação com
o usuário. Assim como ocorre com R Commander, a interação padrão do usuário
com a linguagem é por meio de um terminal com interação praticamente exclusiva
via teclado, no qual são digitados e executados os comandos, mostrando-se o
resultado em forma de texto simples (Figura 7).
• no_ - nome
(por exemplo no_usuário_sus, no_trabalhador, no_equipamento);
6 Considerações finais
BOOCH, G.; RUMBAUGH, J.; JACOBSON, I. UML: guia do usuário. Tradução Fábio
Freitas da Silva. Rio de Janeiro: Elsevier, 2005.
Manipulando dados no R
1
Universidade Federal do Paraná (UFPR)
RESUMO:
O capítulo apresenta e exemplifica as tarefas básicas de importação, arrumação, manipulação
e exportação de dados utilizando o software R. Em linguagem simples, demonstram-se as cinco
principais ações de manipulação de dados: filtrar, ordenar, selecionar, criar/transformar e resumir.
Além disso, mostram-se as tarefas usuais de arrumação de dados como disposição do formato longo
para o curto e vice-versa e união de diferentes conjuntos de dados via um código indexador. Para
ilustrar, ao final, apresenta-se um estudo de caso aplicando-se os conhecimentos apresentados no
decorrer do capítulo e utilizando-se dados da saúde.
PALAVRAS-CHAVE:
Linguagem R. Tidy Data. Manipulação de dados.
Por outro lado, essa mesma revolução vem trazendo cada vez mais desafios para a análise
de dados, uma vez que o volume e velocidade na qual somos capazes de gerar, coletar e
armazenar dados crescem vertiginosamente. De maneira geral, a forma como se coletam
e armazenam dados não é a ideal para analisá-los. Seja qual for a área ou a análise que
se deseja realizar, é crucial organizar a base de dados de forma adequada para análise.
Neste capítulo, serão discutidas técnicas e ferramentas computacionais para o que se
chama manipulação de dados.
Ao trabalhar com análise de dados lida-se com dados de todos os tipos e formatos. O R
nativamente apresenta um conjunto completo de ferramentas para importar, manipular e
exportar conjuntos de dados. Também existem pacotes especializados para essas tarefas,
tais como os pacotes do framework tidyverse: readr para leitura, tidyr para arrumação e o
dplyr para manipulação. Neste capítulo se discutirão os aspectos básicos da manipulação
de dados usando-se os princípios do tidy data ou dados arrumados. Esse termo ficou
famoso após o artigo Tidy Data. O chamado tidy data segue três princípios:
• Cada variável está em uma coluna;
• Cada observação está em uma linha;
• Cada tipo de unidade observacional está em uma célula.
A ideia parece simples, mas na prática pode ser confusa. A melhor forma de entender esses
conceitos é por meio da prática e exemplos. Neste capítulo vai-se lidar com conjuntos de
dados simples para ilustrar os principais aspectos da importação, manipulação e
exportação de dados. A estrutura deste capítulo segue a ordem lógica de uma análise de
dados, a saber:
• Importação de dados: Etapa na qual o objetivo é a partir de uma fonte primária
de dados importá-los para o ambiente de programação R. Fontes de dados como o
DataSUS e similares são as mais populares. Em geral os arquivos serão obtidos por
meio de algum sítio eletrônico em um formato de texto pleno como .csv, .tsv, .txt,
entre outros. Outra forma usual é os dados serem disponibilizados em planilhas
• Arrumação de dados: Após importar a base de dados é comum que essa não
esteja organizada como se deseja para análise. Assim, o objetivo dessa etapa é
fazer com que os três princípios do tidy data sejam respeitados.
Nas próximas seções se discutirá cada uma dessas etapas com mais detalhes e diversos
exemplos.
2 Importando dados
No universo da análise de dados existem diversos tipos de arquivos como: arquivos de
texto pleno, planilhas eletrônicas e banco de dados relacionais. Provavelmente, a forma
mais popular de armazenar um pequeno conjunto de dados é em uma planilha eletrônica.
Todas as planilhas eletrônicas podem facilmente exportar uma tabela no formato retangular
em um arquivo de texto pleno (plain text). Para salvar uma planilha em formato texto pleno,
na maioria das planilhas eletrônicas basta selecionar o Menu -> Arquivo (File) -> Salvar
como (Save as) e selecionar o formato desejado. Um cuidado importante é deixar a planilha
o mais simples possível, ou seja, sem formatações, cores, células mescladas etc. Lembre-
se: cada coluna deve ser uma variável e cada linha uma observação. Entre os diversos
formatos disponíveis os mais populares são: .csv (comma-separated value) e .tsv (tab
separated values) ou versões desses.
Pode-se pensar: por que não ler a planilha eletrônica diretamente? Essa é uma
possibilidade, porém, a extensão das planilhas está atrelada ao sistema operacional. Por
exemplo, não se terá planilhas do famoso Microsoft Excel em um sistema operacional Linux.
Da mesma forma, dificilmente haverá arquivos do tipo .odf do pacote OpenOffice, popular
em ambientes Linux, em sistemas operacionais Windows. Assim, opta-se por usar arquivos
de texto pleno porque são mais portáveis e, de certa forma, agnósticos ao sistema
operacional e/ou software fabricante.
Um arquivo no formato .csv quando visualizado em um editor de texto simples como o bloco
de notas, wordpad ou gedit tem o seguinte formato:
Sigla;Código;Município;idh;renda;alfab;
AC;1200013;Acrelândia;;136,539;73,309;
AC;1200054;Assis Brasil;;115,16;70,954;
AC;1200104;Brasiléia;;132,383;75,493;
AC;1200138;Bujari;;118,815;61,23;
AC;1200179;Capixaba;;108,164;62,283;
AC;1200203;Cruzeiro do Sul;;140,199;71,548;
AC;1200252;Epitaciolândia;;134,364;75,381;
Note-se que o caractere (;) separa as colunas. Isso significa que o ponto e vírgula é o
caractere delimitador de campos. De forma similar um arquivo .tsv tem a seguinte estrutura:
O objetivo do pacote readr é fornecer uma maneira rápida e amigável de ler dados
retangulares. Esse pacote foi criado para lidar com os mais diversos tipos de formatos de
dados encontrados na prática e dispõe das funções read_csv(), read_tsv(), read_delim(),
read_fwf(), read_table() e read_log(). Além de serem funções bastante simples do ponto de
vista do usuário, possuem um recurso interessante: por meio do argumento col_types é
possível fornecer uma lista que desde a leitura informa o tipo da variável, o que poupa
esforços na fase de tratamento dos dados para análise. Abaixo carregou-se o pacote readr
e visualizou-se a sua documentação.
library(readr)
help(readr)
Para começar, vai se importar um arquivo no formato .txt disponível como material
suplementar para este livro no endereço web www.avaliausus.org/livro Indica-se baixar o
arquivo e colocá-lo na mesma pasta em que está o arquivo de comandos R. Antes de
importar o arquivo aconselha-se abri-lo com algum editor de texto e observar que o
caractere separador nesse exemplo é um tab. Por esse motivo, vai se usar a função do
pacote readr destinada a conjuntos de dados separados por tabulação: a read_tsv(). Ao se
abrir o arquivo .txt nota-se que cada coluna tem um nome, por isso o argumento col_names
= TRUE deve ser usado. O código @ref(lem:lebd) ilustra como importar essa base de dados
para o R e mostra as primeiras seis linhas.
library(readr)
dados <- read_tsv("anovareg.txt", col_names = TRUE)
## Rows: 72 Columns: 4
## ── Column specification
────────────────────────────────────────────────────────
## Delimiter: "\t"
## chr (2): cultivar, bloco
## dbl (2): dose, indice
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(dados)
## # A tibble: 6 × 4
## cultivar dose bloco indice
## <chr> <dbl> <chr> <dbl>
## 1 Ag-1002 0I 46
## 2 Ag-1002 0 II 48
## 3 Ag-1002 0 III 44
## 4 Ag-1002 0 IV 46
## 5 Ag-1002 60 I 48
## 6 Ag-1002 60 II 47
Outro conjunto de dados será importado, agora no formato .csv o qual está no mesmo
endereço web. Novamente pode-se abrir o arquivo em um editor de texto e verificar que o
caractere separador é um espaço em branco. Nesse caso, a função do pacote readr para
leitura é a read_table().
##
## ── Column specification
────────────────────────────────────────────────────────
## cols(
## `"y"` = col_double(),
## `"x"` = col_double()
## )
## # A tibble: 6 × 2
## `"y"` `"x"`
## <dbl> <dbl>
## 1 207318. 55
## 2 250846. 69
## 3 165755. 46
## 4 219817. 61
## 5 268582. 73
## 6 229060. 63
Se a leitura foi executada com sucesso não se deverá receber mensagem alguma. O erro
mais comum nesse ponto é não se especificar o caminho de diretórios corretamente; nesse
caso se receberá uma mensagem similar a esta:
O R está dizendo que não conseguiu encontrar o arquivo que se deseja ler no diretório que
se está procurando. Convém lembrar-se: para saber onde o R está trabalhando usa-se o
comando getwd().
Com a leitura bem sucedida, é hora de se inspecionar o que foi carregado. Recomenda-se
usar a função glimpse() para se ter uma visão geral do arquivo. Assim o pacote dplyr, que
contém a função glimpse, vai ser carregado e inspecionar o objeto dados.
library(dplyr)
##
## Attaching package: 'dplyr'
glimpse(dados)
A função glimpse() começa por mostrar quantas observações (rows) e quantas colunas
(cols) a base de dados contém. Nesse caso temos 20 observações (linhas) e 2 variáveis
(colunas). Na sequência apresenta-se o nome de cada coluna e o tipo de dado que essa
representa. Nesse exemplo, tem-se variáveis do tipo dbl – abreviação para double. Com o
conjunto de dados disponível é o momento de arrumá-los para posterior análise.
3 Arrumando dados
Para se analisar um conjunto de dados é importante que esse esteja arrumado, ou seja,
cada coluna deve ser uma variável e cada linha uma observação. Na maioria das situações
práticas os dados não estarão nesse formato e se precisará trabalhar para deixá-lo dessa
forma. Um dos pacotes R mais famosos para arrumação de dados é o tidyr. O código abaixo
carrega o pacote tidyr e acessa sua documentação.
library(tidyr)
help(tidyr)
Uma situação comum é quando os dados vêm em muitas colunas. Isso ocorre muito na
tabulação de dados de experimentos nos quais se tem medidas realizadas ao longo do
tempo. Por exemplo, suponha-se que o conjunto de dados consiste no número de casos
de uma doença rara em seis grandes centros urbanos, nos anos 2011, 2012 e 2013.
Nesse exemplo as observações da variável de interesse estão em três colunas (2011, 2012
e 2013). Além disso, a variável ano, que deveria ser única coluna, está no título de três
outras colunas; esse é um exemplo típico de dados desorganizados que estão no formato
amplo (wide). O que se deseja é transformá-los para o formato longo (long), de modo que
cada variável esteja em uma coluna e cada observação em uma linha.
Pode-se realizar essa operação utilizando-se o pacote tidyr. Para o caso de empilhar
colunas existe a função pivot_longer().
library(magrittr)
## # A tibble: 9 × 3
## cidade ano resposta
## <chr> <chr> <dbl>
## 1 Curitiba 2011 5
## 2 Curitiba 2012 6
## 3 Curitiba 2013 6
## 4 São Paulo 2011 7
## 5 São Paulo 2012 2
## 6 São Paulo 2013 9
## 7 Rio de Janeiro 2011 3
## 8 Rio de Janeiro 2012 5
## 9 Rio de Janeiro 2013 7
• O argumento names_to nomeia a coluna que vai converter os nomes das colunas
para um fator.
• Por fim, especifica-se que nada deve ser feito com a coluna cidade por meio do
argumento cols = -cidade.
Note-se que se introduziu um novo operador: o %>%, chamado pipe, cujo objetivo é
encaminhar um valor para uma expressão ou chamada de função. Nesse caso, utiliza-se o
%>% para indicar que na função pivot_longer() o objeto de interesse é o data.frame tb1. É
importante ressaltar que dentro da função pivot_longer() pode-se especificar diretamente o
data.frame por meio do argumento data, contudo, o código fica mais organizado e elegante
quando usamos o %>%.
É possível também fazer a operação inversa, ou seja, desempilhar, caso seja de interesse.
Isso pode ser feito com a função pivot_wider() do tidyr.
## # A tibble: 3 × 4
## cidade `2011` `2012` `2013`
## <chr> <dbl> <dbl> <dbl>
## 1 Curitiba 5 6 6
## 2 São Paulo 7 2 9
## 3 Rio de Janeiro 3 5 7
Outra operação pode ser necessária – separar uma variável em várias outras, o que é
comum quando um campo de texto é a união de várias informações. Considere-se o
seguinte data.frame.
tb <- data.frame(US = c("US1", "US2", "US3"),
cidade_ano = c("Curitiba/2012", "Santos/2012", "Viçosa/2016"),
local = c("Curitiba-PR", "Santos-SP", "Viçosa-MG"))
tb
## US cidade_ano local
## 1 US1 Curitiba/2012 Curitiba-PR
## 2 US2 Santos/2012 Santos-SP
## 3 US3 Viçosa/2016 Viçosa-MG
Uma alternativa simples e que exige pouco tratamento para separação de variáveis é a
função separate() do pacote tidyr. Para essa função os argumentos são o data.frame, a
coluna de interesse, quais colunas novas serão criadas e qual o separador. Por exemplo,
o seguinte código
tb_nova1 <- tb %>% separate(col = cidade_ano,
into = c('Cidade', 'Ano'),
sep = '/')
tb_nova1
## US Cidade Ano local
## 1 US1 Curitiba 2012 Curitiba-PR
## 2 US2 Santos 2012 Santos-SP
## 3 US3 Viçosa 2016 Viçosa-MG
separa a coluna cidade_ano em outras duas colunas chamadas Cidade e Ano, usando-se
como caractere para separar as informações a /. De forma similar pode-se separar as
informações da coluna local.
tb_nova2 <- tb_nova1 %>% separate(col = local,
into = c('Município', 'UF'),
sep = '-')
tb_nova2
## US Cidade Ano Município UF
## 1 US1 Curitiba 2012 Curitiba PR
## 2 US2 Santos 2012 Santos SP
## 3 US3 Viçosa 2016 Viçosa MG
Da mesma forma que podemos separar variáveis que estão na mesma coluna pode ser
necessário criar novas variáveis unindo-se os valores de duas ou mais colunas. Por
exemplo, suponha-se que em um data.frame os campos dia, mês e ano estão cada um em
uma coluna. Porém, precisa-se de apenas uma coluna que represente a data da
observação. Assim, é necessário juntar essas três colunas em uma nova.
Por fim, frequentemente se terá que lidar com dados faltantes. Algumas vezes pode-se
simplesmente querer remover todas as linhas que tenham algum NA. Outras vezes
preenchê-las com algum valor específico. O pacote tidyr dispõe de funções bastante úteis
para tratamento de dados ausentes. Veja o seguinte conjunto de dados:
Para se excluírem todas as linhas que contenham pelo menos um NA tem-se a função
drop_na() do pacote tidyr.
Para se substituir os campos iguais a NA por algum valor, o pacote tidyr dispõe da função
replace_na(), a qual recebe como argumento o data.frame e uma lista com o nome da
variável no data.frame e qual o valor que um dado ausente encontrado naquela variável
deve assumir.
tb %>% replace_na(list(N_tratamentos = 0,
N_remedios = 0))
## Paciente N_consultas N_tratamentos N_remedios
## 1 1 0 0 0
## 2 2 1 0 1
## 3 3 3 0 1
## 4 4 1 2 0
## 5 5 2 1 0
É importante salientar que tratar dados ausentes de forma estatisticamente coerente nem
sempre é tarefa fácil. Assim, convém se pensar muito bem o que os dados faltantes
significam no contexto em que se está trabalhando e se faz sentido substituir por algum
número ou mesmo excluir da base de dados.
4 Manipulando dados
Uma vez que os dados estejam arrumados é a hora de começar a conhecê-los. Seguindo-
se os princípios do tidy data, para manipular um conjunto de dados há cinco ações
essenciais:
• Ordenar observações de acordo com os seus valores.
• Selecionar variáveis de acordo com o seu nome e/ou características.
• Filtrar observações de acordo com os seus valores.
• Criar/transformar variáveis a partir de variáveis existentes.
library(dplyr)
help(dplyr)
Para ilustrar o uso de cada uma das ações de manipulação convém considerar os dados
apresentados na Figura @ref(fig:tabelaexemplo). O exemplo consiste em um estudo
longitudinal composto por sete pacientes de duas unidades de saúde, avaliados em três
consultas com relação a severidade de alguma doença. A severidade foi avaliada como
uma nota entre 0 e 10. Por fim, a variável número de medicamentos que o paciente usou
durante o período avaliado é registrado na coluna medicamentos. Obviamente esse é um
exemplo simples e puramente didático. Porém, com base nesses dados é possível ilustrar
as principais tarefas da etapa de manipulação de dados.
A ação mais simples é a de ordenação, que pode ser feita de acordo com os valores de
uma ou mais variáveis.
Por exemplo, pode-se ordenar os pacientes pelo seu código. No dplyr a função destinada
para ordenação é a arrange().
Note-se que a variável código foi ordenada de forma crescente; para ordená-la de maneira
decrescente:
## paciente US medicamentos
## 1 João US1 4
## 2 Vanessa US1 4
## 3 Tiago US2 0
## 4 Luana US2 8
## 5 Gisele US2 2
## 6 Pedro US1 0
## 7 André US2 5
## paciente US medicamentos
## 1 João US1 4
## 2 Vanessa US1 4
## 3 Tiago US2 0
## 4 Luana US2 8
É possível selecionar apenas os pacientes que fazem uso mais de dois medicamentos
utilizando-se a função filter() do dplyr.
Pode-se também selecionar pelo número das linhas usando a função slice() do dplyr.
Além disso, pode-se selecionar apenas as extremidades – cabeça (head) ou cauda (tail).
O número de observações pode ser alterado pelo argumento n.
# Cabeça
df1 %>% slice_head(n = 3)
# Cauda
df1 %>% slice_tail(n = 3)
Outro exemplo é selecionar pacientes em que a soma das severidades das consultas 1, 2
e 3 seja maior que 18.
df1 %>% filter(US == "US1" & (severidade1 + severidade2 + severidade3) > 18)
Trocar a ordem das colunas para que as severidades apareçam primeiro pode ser feito
tanto pelo nome quanto pelos números associados às colunas.
df1[,c(4,5,6,1,2,3)]
## s1 s2 s3 cod pac US
## 1 8.0 9.0 8.0 256 João US1
## 2 7.5 7.5 7.5 487 Vanessa US1
## 3 9.5 8.0 7.5 965 Tiago US2
## 4 7.0 8.5 5.0 125 Luana US2
## 5 4.5 5.0 NA 458 Gisele US2
## 6 5.5 7.5 9.0 874 Pedro US1
## 7 3.0 NA 3.0 963 André US2
A ação de transformação consiste em criar novas variáveis a partir das variáveis existentes;
por exemplo, pode-se calcular a severidade média dos pacientes e, para isso, é possível
utilizar a função mutate() do dplyr.
df1 %>% mutate(media = (s1 + s2 + s3)/3)
## cod pac US s1 s2 s3 med media
## 1 256 João US1 8.0 9.0 8.0 4 8.333333
## 2 487 Vanessa US1 7.5 7.5 7.5 4 7.500000
## 3 965 Tiago US2 9.5 8.0 7.5 0 8.333333
## 4 125 Luana US2 7.0 8.5 5.0 8 6.833333
## 5 458 Gisele US2 4.5 5.0 NA 2 NA
## 6 874 Pedro US1 5.5 7.5 9.0 0 7.333333
## 7 963 André US2 3.0 NA 3.0 5 NA
df1
## cod pac US s1 s2 s3 med media
## 1 256 João US1 8.0 9.0 8.0 4 8.333333
## 2 487 Vanessa US1 7.5 7.5 7.5 4 7.500000
## 3 965 Tiago US2 9.5 8.0 7.5 0 8.333333
## 4 125 Luana US2 7.0 8.5 5.0 8 6.833333
## 5 458 Gisele US2 4.5 5.0 0.0 2 3.166667
## 6 874 Pedro US1 5.5 7.5 9.0 0 7.333333
## 7 963 André US2 3.0 0.0 3.0 5 2.000000
É possível criar uma coluna para classificar a severidade. Por exemplo, se o paciente tem
severidade (média > 7) classifica-se como alta; se (40 < média < 70) como média ou se
(média < 40) como baixa, usando-se a função cut().
A última ação a discutir é a de resumo ou sumarização, a qual está muito ligada à ideia de
dados no formato amplo. No exemplo dos pacientes o conjunto de dados está no formato
amplo. Se se desejar calcular a média da severidade para cada consulta precisa-se
percorrer uma a uma as colunas severidade1, severidade2 e severidade3 e calcular a
média. Se os dados estiverem no formato longo seria mais facilmente possível usar a ideia
de resumir uma variável condicional aos valores de outra; nesse caso: a severidade.
df1_long %>%
group_by(consulta) %>%
summarise(media = mean(valor))
## # A tibble: 3 × 2
## consulta media
## <chr> <dbl>
## 1 s1 6.43
## 2 s2 6.5
## 3 s3 5.71
Pode-se agrupar por mais de uma coluna; por exemplo, a severidade média de cada
unidade de saúde para cada consulta.
df1_long %>%
group_by(US, consulta) %>%
summarise(media = mean(valor))
## `summarise()` has grouped output by 'US'. You can override using the `.groups`
## argument.
## # A tibble: 6 × 3
## # Groups: US [2]
## US consulta media
## <chr> <chr> <dbl>
## 1 US1 s1 7
## 2 US1 s2 8
## 3 US1 s3 8.17
## 4 US2 s1 6
## 5 US2 s2 5.38
## 6 US2 s3 3.88
Outra opção é calcular mais de uma medida resumo. No caso da função summarise() basta
acrescentar uma linha e especificar que se tem interesse em obter outra medida.
df1_long %>%
group_by(US, consulta) %>%
5 Combinando dados
Note-se que no conjunto df2 não temos uma coluna chamada severidade3. Assim, primeiro
precisamos criá-la.
df2$severidade3 <- NA
Uma vez que os conjuntos de dados são compatíveis, pode-se simplesmente concatenar
suas linhas usando-se a função rbind().
df <- rbind(df1, df2)
df
## codigo paciente unidade_saude severidade1 severidade2 severidade3
## 1 256 João US1 8.0 9.0 8.0
## 2 487 Vanessa US1 7.5 7.5 7.5
## 3 965 Tiago US2 9.5 8.0 7.5
## 4 125 Luana US2 7.0 8.5 5.0
## 5 458 Gisele US2 4.5 5.0 NA
## 6 874 Pedro US1 5.5 7.5 9.0
## 7 963 André US2 3.0 NA 3.0
## 8 505 Bia US3 6.5 8.5 NA
## 9 658 Carlos US3 7.5 8.0 NA
## 10 713 Cris US3 7.5 9.0 NA
## medicamentos
## 1 4
Por fim, outra operação que aparece com frequência ao se analisarem dados é a de
juntar/parear duas tabelas que possuem uma chave primária. Essas operações são
geralmente chamadas junções (join) e existem diversas versões, as quais estão entre as
mais comuns:
# Left join
left_join(df1, df_extra, by = "codigo")
# Right join
right_join(df1, df_extra, by = "codigo")
# inner join
inner_join(df1, df_extra, by = "codigo")
6 Exportando dados
Após a realização das análises é bastante provável que se precise exportar um conjunto
de dados organizado ou uma tabela com estatísticas. O R tem uma longa lista de funções
para exportar dados. Assim como leitura, o pacote readr dispõe de uma série de funções
de escrita.
A forma mais comum é exportar um arquivo de texto pleno nos formatos .csv ou .txt. Para
essa tarefa as funções write_tsv() e write_csv() podem ser usadas. É possível exportar o
resultado da junção das tabelas df1 e df_extra como o resultado de nossa análise, conforme
ilustra o código @ref(lem:exporta).
Exemplo de uso da função `write_csv()` para exportar arquivos de texto pleno.
final <- inner_join(df1,
df_extra,
by = "matricula")
write_csv(final,
file = "Nome_do_arquivo.csv")
Sem dúvida, exportar dados em texto pleno é muito fácil e simples, entretanto, existem
algumas desvantagens. A principal é que as classes das colunas podem ser perdidas ao
ler novamente o conjunto de dados em R. Por ser um texto pleno o arquivo não carrega
metadados que foram criados em R. Caso seja de interesse, é possível salvar o próprio
objeto R que contém o seu data.frame usando-se a função save().
save(final,
file = "Nome_do_arquivo.RData")
A principal vantagem é que tudo que se fez no objeto final será mantido. Outra vantagem é
que se pode salvar outros formatos de dados como listas, matrizes e arrays. Para carregar
novamente o data.frame deve-se usar a função load().
load("Nome_do_arquivo.RData")
Caso se tenha um objeto mais complicado, como por exemplo uma série de listas, a função
dput() é uma opção interessante, por permitir salvar um objeto R como um texto simples, o
qual pode ser copiado e colado.
dput(final)
É possível também escrever um arquivo com extensão .R que pode ser posteriormente
carregado no R.
dput(final,
file = "Nome_do_arquivo.R")
dget("Nome_do_arquivo.R")
Essa estratégia pode ser usada para múltiplos objetos usando-se a função dump(),
source("Nome_do_arquivo.R")
Outro formato que o R exporta é o formato binário com a extensão .rda. As vantagens desse
formato são ocupar pouco espaço em disco e preservar as propriedades do objeto R.
save(final,
file = "Nome_do_arquivo.rda")
Nesse caso, pode-se usar novamente a função load() para fazer a leitura em R.
Por fim, é possível salvar todos os objetos e instruções que se usou em sua sessão R
usando-se a função save.image().
Agora que se tem todos os ingredientes para lidar com dados em R, mostra-se como
praticar em um exemplo com dados reais extraídos do site do DataSUS.
Foram mantidos esses dados da forma mais crua possível para que se vivenciem todos os
desafios das etapas de importar, manipular, analisar e apresentar os resultados de uma
análise de dados.
Novamente usa-se o pacote readr e a função read_delim que permite facilmente especificar
esses argumentos. O Código @ref(lem:lebasedados) ilustra como importar o conjunto de
dados para o R.
────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (1): Município
## dbl (14): Menor 1 ano, 1 a 4 anos, 5 a 9 anos, 10 a 14 anos, 15 a 19 anos, 2...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
Se a leitura foi executada com sucesso deve-se receber uma mensagem indicando a
especificação das colunas, bem como o tipo e nome de cada uma. Assim, é hora de
Dada a estrutura da base de dados vemos claramente que os princípios do tidy data não
são respeitados em ao menos dois pontos:
1. A coluna Município contém duas informações, o código e nome do município.
Novamente é preciso arrumar essa informação para tê-la em apenas uma coluna. Nesse
sentido, tem-se um conjunto de dados no formato amplo.
Para começar, vamos particionar a informação da coluna Município. Note-se que nesse
exemplo há um desafio adicional, uma vez que o separador das informações código e nome
do município é o espaço em branco. Porém, para municípios com nome composto, a
exemplo de Alto Alegre dos Parecis, ao se usar o argumento sep = ' ' da função separate
não se obterá o resultado desejado.
Assim, vai ser preciso lidar com algumas operações relacionadas com strings. De forma
geral o termo strings será usado para se referir a campos com texto. O tidyverse tem um
A função str_split do pacote stringr é adequada para essa tarefa. Por default a função
retorna uma lista com os valores. Como se quer construir um novo data.frame com os
valores do código e nome do município vai se usar o argumento simplify = TRUE, uma
forma de em vez de retornar uma lista retornar os valores do código e nome do município
cada um em uma coluna.
Porém, o objeto retornado será da classe matrix. Assim, deve-se convertê-lo para
data.frame e renomear suas colunas para então juntá-lo com o conjunto de dados original.
O Código @ref(lem:separastring) faz a separação da coluna Município, guarda o resultado
em um objeto chamado dados_temp e renomeia as suas colunas.
library(stringr)
dados_temp <- data.frame(str_split(dados$Município, " ", 2, simplify = TRUE))
dados_temp <- dados_temp %>% rename("Codigo" = X1,
"Nome" = X2)
Por fim, pode-se juntar as colunas Código e Nome com o data.frame original. A função
bind_cols faz essa tarefa.
O próximo passo é transformar o conjunto de dados do formato amplo para longo e empilhar
as colunas relacionadas com as faixas etárias.
## # A tibble: 5 × 5
## Codigo Nome Município faixa_etaria contagem
## <chr> <chr> <chr> <chr> <dbl>
## 1 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… Menor 1 ano NA
## 2 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 1 a 4 anos NA
## 3 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 5 a 9 anos NA
## 4 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 10 a 14 anos 1
## 5 110001 Alta Floresta D'Oeste 110001 Alta Floresta D'Oes… 15 a 19 anos 2
Por fim, municípios onde a contagem de mortes por causas externas foi zero estão
registrados como NA. Assim, é interessante substituir os NAs por zero para facilitar a
obtenção de estatísticas descritivas e tabelas de frequência.
A tarefa foi realizada, mas tem alguns aspectos que podem ser melhorados:
1. A ordem das faixas etárias não está na ordem natural. Por exemplo, a faixa
Menor que 1 ano apareceu como antepenúltima.
Assim, precisa-se primeiro selecionar quais os níveis da coluna faixa_etária se quer manter
e depois especificar qual a ordem que se deseja que sejam exibidos. Usa-se a função filter
para selecionar quais faixas etárias se quer.
dados_long_faixa <- dados_long %>%
filter(faixa_etaria %in% c("Menor 1 ano", "1 a 4 anos" , "5 a 9 anos",
"10 a 14 anos", "15 a 19 anos" , " 20 a 29 anos" ,
"30 a 39 anos" , "40 a 49 anos", "50 a 59 anos" ,
"60 a 69 anos" , "70 a 79 anos" , "80 anos e mais"))
class(dados_long_faixa$faixa_etaria)
## [1] "character"
Note-se que a classe é character. Assim, é necessário convertê-la para factor e informar
ao R qual é a ordem em que as faixas devem ser apresentadas.
Outra forma de se resumirem os dados, a qual pode ser interessante, é por município.
Suponha-se que se quer saber quantas mortes por causas externas ocorreram na cidade
de Curitiba, porém independentemente da faixa etária. Nesse caso, os passos são: primeiro
filtrar apenas os dados de Curitiba e depois somá-los, conforme ilustrado no Código abaixo.
dados_long_faixa %>%
filter(Nome == "Curitiba") %>%
summarize("Total" = sum(contagem))
## # A tibble: 1 × 1
## Total
## <dbl>
## 1 905
Suponha-se agora que o interesse é obter uma tabela com o número absoluto e a taxa de
mortalidade por causas externas padronizada pela população residente para cada estado.
Nesse caso precisa-se de um conjunto adicional de dados com a população residente em
cada estado. Além disso, é preciso saber a qual estado cada município pertence. O IBGE
dispõe de bases de dados com a população residente por município com a informação
adicional de a qual estado cada município pertence. Um exemplo desse tipo de base de
dados é o arquivo Pop_2019.csv, disponível como material suplementar deste livro.
Recomenda-se ler essa base de dados em R e explorá-la.
pop2019 <- read_delim("Pop_2019.csv")
## Rows: 5570 Columns: 5
## ── Column specification
pop2019 %>%
slice_head(n = 5)
## # A tibble: 5 × 6
## UF COD COD_MUNI MUNICIPIO POP Codigo
## <chr> <dbl> <chr> <chr> <dbl> <chr>
Agora faz-se a junção usando-se a função left_join, que foi utilizada por se querer manter
apenas os códigos de municípios que estão no conjunto de dados pop2019. Pode-se
inspecionar a coluna Município do conjunto de dados dados_long_faixa para identificar que
existem alguns códigos para indicar que o município do óbito foi ignorado. Assim, não se
deseja pegar esses casos.
Para se atingir o objetivo de se ter uma tabela com as taxas de mortalidade por estado
precisa-se primeiro somar os óbitos por faixa etária dentro de cada município. Após isso
pode-se somar por estado e padronizar pela população.
municipio <- completo %>%
group_by(Codigo) %>%
summarize("Obitos" = sum(contagem),
"Nome" = unique(Nome),
"Populacao" = unique(POP),
"UF" = unique(UF))
Agora que se tem a base com a soma dos óbitos por município pode-se agregar por UF.
UF <- UF %>%
mutate("Taxa" = (Obitos/Populacao)*100000) %>%
arrange(desc(Taxa))
UF %>%
slice_head(n = 5)
## # A tibble: 5 × 4
## UF Obitos Populacao Taxa
## <chr> <dbl> <dbl> <dbl>
## 1 RR 456 605761 75.3
## 2 TO 1062 1572866 67.5
## 3 ES 2625 4018650 65.3
## 4 PE 6017 9557071 63.0
## 5 GO 4349 7018354 62.0
View(UF)
Neste capítulo passa-se por todas as principais etapas de uma análise de dados usando o
R e os pacotes do tidyverse. Para o leitor interessado indica-se um link com diversas folhas
GROLEMUND, G.; WICKHAM, H. R for Data Science. California: O’Reilly Media, 2017.
WICKHAM, H. Tidy Data. Journal of Statistical Software, v. 59, n. 10, p. 1-23, 2014.
Disponível em: https://www.jstatsoft.org/index.php/jss/article/view/v059i10. Acesso em: 29
out. 2022.
Marcelo S. Perlin1
1
Universidade Federal do Rio Grande do Sul (UFRGS)
RESUMO:
Este capítulo tem como objetivo apresentar o tema de visualização de dados na plataforma R;
utilizando-se exclusivamente do pacote ggplot2 e seu sistema de camadas. O texto apresenta usos
específicos da ferramenta para dados de saúde pública obtidos junto ao DataSUS. O público-alvo são
analistas de dados de saúde e gestores. Todos os gráficos apresentados no capítulo são reproduzíveis
em seu próprio computador. Os arquivos fonte do texto e código estão disponíveis em https://github.
com/msperlin/chapter-dataviz-saude.gov. A principal mensagem é a de que o R e ggplot2 são ótimas
(e gratuitas) ferramentas que produzem gráficos de qualidade e fáceis de se utilizar. Uma sugestão
de uso do capítulo é buscar rodar o código apresentado e perceber, na prática, como a montagem de
uma figura no R + ggplot2 é acessível a todos
PALAVRAS-CHAVE:
R. Visualização de dados. ggplot2. Gráficos.
Na recente pandemia de 2020 (COVID 19), o cientista de dados Burn Murdoch criou um
gráfico mundialmente reconhecido e atualmente empregado pelo Financial Times, o qual
mostra a evolução do número de casos confirmados (média de sete dias) entre diversos
países.
Neste capítulo vai se estudar a forma de construção de gráficos no R. Esse não é, de forma
alguma, um conteúdo completo sobre o tema. O objetivo aqui é apresentar um material
prático sobre como criar figuras com o ggplot2. Alguns atalhos serão tomados para
condensar o conteúdo e também não se discutirão usos avançados. Leitores que desejam
aprender mais sobre o pacote, o livro de Hadley é o melhor material disponível
gratuitamente na internet (WICKHAM et al., 2022a)
Em um primeiro passo, o código em si será deixado de lado para focar nos conceitos por
trás de uma figura bem construída e, passo seguinte, para o uso do pacote ggplot2 e sua
filosofia na criação de camadas da figura. Por fim, diversos exemplos de gráficos
construídos a partir dos dados do DataSUS serão apresentados.
2 Princípios e componentes
O que torna a figura de Burn Murdoch tão impactante? Qual foi o processo de criação da
figura? Neste capítulo vai se procurar responder a essas questões por meio da discussão
de princípios e componentes visuais de um gráfico de dados e se discutir os elementos
centrais e independentes da plataforma de programação.
Nesse caso, um sólido parecer técnico terá seu impacto limitado pela capacidade de
comunicação do relatório. Perceba-se que de nada adiantará se realizar um trabalho
fantástico na análise de dados se a parte escrita e gráfica não conseguir transmitir a
Mais próximo do tema do livro, gráficos são fortes elementos de comunicação e servem
para convencer o leitor de determinada ideia. Assim, o primeiro princípio da criação de
gráficos é: uma figura deve justificar a sua existência (SCHWABISH, 2014). Deve-se
remover todo o excesso. Um erro muito comum dos iniciantes é tentar criar os mais variados
gráficos sem se perguntar se esses adicionam novas informações à análise. Apenas porque
se pode fazer um gráfico não significa que se deve mostrá-lo ao leitor. O valor de um
conteúdo está diretamente relacionado às novas informações que esse traz para a análise;
é importante ater-se àquelas que ajudam a transmitir sua mensagem. Não se deve hesitar
em cortar elementos gráficos. Sempre que se encontrar uma figura que não seja discutida
em pelo menos dois parágrafos do texto principal, não se deve ter receio de retirá-la do
documento. Se não se conseguir escrever mais do que dois parágrafos sobre uma figura,
provavelmente isso não é importante.
Esqueleto de um gráfico
Texto eixo y
Texto explicativo no eixo vertical, definindo uma variável de interesse. Importante
relembrar que um gráfico de dispersão se lê como “variável y é afetada por variável
x”. Portanto, y é a variável que merece maior atenção nas explicações dos demais
componentes, tal como subtítulo.
Texto eixo x
Texto correspondente ao eixo horizontal. Geralmente utiliza-se algo como tempo ou
outra variável de interesse. Em um gráfico de barras, por exemplo, o eixo x pode ser
um tipo de grupo existente nos dados (por exemplo, solteiro/casado).
Note-se que mesmo sem adicionar os dados em si, o esqueleto revela quais
informações se pode esperar no gráfico: o número de cases de gripe infantil no
estado do RS ao longo dos anos. Como regra de bolso, é conveniente iniciar um
gráfico pela construção do esqueleto, para depois se inserir os dados em si. Isso
produzirá um feeling de qual a mensagem do gráfico e o que o leitor esperará ao ler
o título e subtítulo, antes mesmo de incluir no gráfico os dados em si.
Observe-se que as linhas do gráfico são apenas uma nova camada sobre o
esqueleto formado anteriormente. Caso uma leva de dados seja importada, o
esqueleto se mantém o mesmo, porém as linhas mudarão. O entendimento desse
tipo de dinâmica – uso de camadas para construir o gráfico – é extremamente
importante pois o pacote ggplot2 se utiliza da mesma lógica.
Agora que se tem um gráfico básico com linhas, pode-se utilizar outros canais –
cores e formas – para facilitar a comunicação. Imagine-se que os dados de
mortalidade infantil também estão disponíveis para o estado do Paraná (PR). Para
visualizar os dados, pode-se separar as linhas por cores:
Nesse caso, a escolha das cores foi automática pelo comando do ggplot2. Uma
possível implementação futura aqui seria se utilizar as cores predominantes da
bandeira de cada estado para representar cada linha. Indo além, se a análise é sobre
a diferença de casos de gripe infantil entre os estados, outro gráfico com as
diferenças mensais seria ainda mais intuitivo. Note-se como se utilizam diferentes
canais visuais para transmitir uma mensagem, moldando o gráfico de acordo com o
objetivo da pesquisa.
O uso de pontos e formas fazem mais sentido em gráficos nos quais cada ponto pode ser
entendido como independente dos demais. Esse é o caso clássico de gráficos de dispersão,
em que se busca explicar uma variável com base em outra. Por exemplo, considere-se
Comparando-se os gráficos anteriores, note-se que barras e linhas resultam em algo sem
muita intuição – painéis B e C são difíceis de entender, enquanto painel A é mais simples
e intuitivo na transmissão da mensagem.
No último caso, gráficos de barras funcionam muito bem quando a variável explicativa é
uma categoria. Por exemplo, considere-se comparar o efeito de diferentes dietas sobre o
peso de uma galinha criada em cativeiro. Os grupos, nesse caso, são as diferentes dietas,
enquanto a variável de interesse é o peso final médio para cada galinha.
O uso de cores em um gráfico serve para direcionar a atenção do leitor para alguma
informação importante. Quando usado com parcimônia, as cores funcionam muito bem e
facilitam o entendimento e mensagem da análise. A cor vermelha, por exemplo, é
relacionada com calor ou perda financeira. Contudo, cuidado com excessos; o uso de
muitas cores pode dificultar a análise.
Além do uso de cores, pode-se também alterar os seguintes canais em um gráfico com
dados:
• formas (shapes): mudança do estilo da linha ou ponto. Exemplo: linhas tracejadas
simples ou duplas, pontos como triângulos ou quadrados;
• tamanho (size): tamanho dos pontos e linhas.
Atenção para o exemplo a seguir, no qual se visualizam os casos de gripes nos estados
Rio Grande do Sul e Paraná com os canais de formato de ponto (shape), tamanho (size) e
cor (color).
Tabelas em formato longo são orientadas por linhas – não por colunas – em que cada ponto
de dados é representado por única linha da tabela. Assim, ao se incrementar a base com
novos pontos de dados, aumentam-se apenas as linhas da tabela. O importante aqui é
saber distinguir os formatos. Importante reiterar que o ggplot2 não trabalha com tabelas
no formato largo (ou gordo). A conversão entre uma e outra é sempre possível, porém não
entra no escopo deste capítulo. Para mais detalhes sobre o formato longo/large e
operações de conversão, ver o manual do pacote tidyr (WICKHAM; GIRLICH, 2022).
Para todos os exemplos dos capítulos, serão utilizados dados reais do DataSUS relativos
a mortalidades no estado do Rio de Janeiro entre 2015 e 2019. Os dados foram baixados
com o pacote microdatasus (SALDANHA, 2022) e manipulados para manter apenas a
colunas necessárias para a análise. Veja abaixo a sua descrição:
#> Rows: 689,048
#> Columns: 6
#> $ DTOBITO <date> 2015-06-03, 2015-02-17, 2015-09-13, 2015-06-09, 2015-10-0…
#> $ DTNASC <date> 1921-05-08, 1949-04-21, 1957-04-07, 1926-10-14, 1934-05-3…
#> $ SEXO <chr> "Feminino", "Feminino", "Masculino", "Feminino", "Masculin…
#> $ OCUP <chr> "Dona de Casa", "Auxiliar de escritório, em geral", "Admin…
#> $ munResNome <chr> "Rio de Janeiro", "Rio de Janeiro", "Rio de Janeiro", "Rio…
#> $ idade_obito <dbl> 94.1, 65.9, 58.5, 88.7, 81.4, 104.5, 44.6, 31.0, 91.7, 71.…
Note-se que a tabela retirada do DataSUS contém 689048 linhas, 6 colunas e é do tipo
longa, em que cada caso de mortalidade é representado por uma linha. Temos colunas
para a data de óbito (DTOBITO), gênero (SEXO), ocupação (OCUP) e outras. Para
visualizar esses dados, será necessário realizar algumas agregações temporais com
pacote dplyr (Wickham et al., 2022b). Todos os dados apresentados aqui estão disponíveis
como arquivo .rds no repositório do capítulo no Github.
library(ggplot2)
p <- ggplot()
print(p)
Esse é o ciclo de criação de gráficos com o ggplot2. Essas etapas serão repetidas
diversas vezes. Vale notar que, por default, o comando print manda a figura para
tela do RStudio, na aba direita inferior. Caso se queira ter mais controle do tamanho
7 O primeiro gráfico
O primeiro gráfico, então, será uma visualização dos óbitos mensais obtidos no DataSUS
para o estado do Rio de Janeiro. Para tal, será utilizado o pacote dplyr para agregar os
dados mensais e contar o número de óbitos:
library(ggplot2)
library(dplyr)
glimpse(df_ano_mes)
#> Rows: 60
#> Columns: 2
#> $ ano_mes <date> 2015-01-01, 2015-02-01, 2015-03-01, 2015-04-01, 2015-05-01, 2…
#> $ n <int> 11779, 9623, 10160, 10687, 12616, 11531, 11291, 10684, 10679, …
Com o eixo x na coluna ano_mes e eixo y na coluna n, criou-se o gráfico com o seguinte
comando:
print(p)
No uso da função ggplot, o argumento data é o dataframe com os dados agregados por
ano. O mapeamento das colunas do dataframe para o gráfico em si é realizado via função
aes, a qual define a estética (aesthetics) do gráfico pela indicação das coordenadas x e y.
Em outras palavras, ao se usar o código ggplot(data = df_ano_mes, mapping = aes(x =
ano_mes, y = n)) equivale a dizer para o ggplot: “para os dados em df_ano_mes, use os
dados da coluna ano_mes para o eixo x, e os dados da coluna n para o eixo y”. Observe-
se que por si só essa definição não indica o tipo de gráfico (linha/barra etc.), apenas os
mapeamentos desejados.
Para indicar qual o tipo de gráfico a ser construído, usa-se o operador de soma (“+”) para
adicionar uma camada extra, nesse caso o geom_line(), o qual indica o uso de uma camada
de linha. Caso também se queira uma camada com o ponto em si indicado no gráfico, basta
adicionar geom_point() em outra linha:
p <- ggplot(data = df_ano_mes,
mapping = aes(x = ano_mes, y = n)) +
geom_line() +
geom_point()
print(p)
Adicionalmente, insere-se título, subtítulo e texto para eixos com a função labs:
p <- ggplot(data = df_ano_mes,
mapping = aes(x = ano_mes, y = n)) +
geom_line() +
geom_point() +
labs(title = "Mortes for Mês do Ano",
subtitle = "Dados para o estado do Rio de Janeiro, entre 2015 e 2019",
x = 'Mês do Ano',
y = "Número de Mortes",
caption = "Dados retirados do DataSUS")
print(p)
Adicionalmente, usa-se o argumento size na função labs para modificar o título da legenda.
Reforçando, a função aes() define um mapeamento entre os dados da tabela de entrada e
os canais do gráfico. Enquanto na primeira versão do gráfico definiu-se arbitrariamente o
A função aes pode ser utilizada em qualquer função de canal, tal como geom_line,
geom_point, geom_col, entre outras. Assim, há total liberdade para se mapear os
elementos gráficos da figura aos dados em si, o que permite enorme flexibilidade.
Quando se olha o resultado do gráfico criado, fica bastante claro que sim, existe
sazonalidade nos dados. Os meses janeiro, dezembro, maio, junho e julho são aqueles
com o maior número de óbitos. Especificamente, a legenda indica que maio possui
aproximadamente 5% mais de mortalidades do que a média de todos os meses, enquanto
fevereiro tem queda aproximada de menos de 10% da média de mortalidades. Note-se
como essa disparidade fica mais óbvia e intuitiva para o leitor quando se utiliza para o
mapeamento do tamanho dos pontos a mortalidade encontrada em cada mês.
9 Uso de temas
Os gráficos apresentados anteriormente possuem uma configuração bastante peculiar:
área sombreada e com grid no interior do gráfico, uso de fonte e tamanho de letras
específicas, entre outras. Essas escolhas fazem parte do tema padrão do pacote. O
ggplot2 possui outros temas pré-compilados tal como configurações do gráfico em preto e
branco, cinzento e tema light.
Para se utilizar um novo tema em um gráfico, basta adicionar a função do tema como uma
nova camada. Todos os temas possuem um nome de função tal como em theme_XXXX.
Exemplos: tema preto e branco: theme bw(), tema cinzento: theme_gray(). Vale salientar
que também é possível construir uma função de tema personalizado, com opções
específicas sobre cores, tamanhos e todos os demais componentes da figura. Assim, é
possível unificar a aplicação do mesmo tema para diferentes gráficos de forma bastante
eficiente. Esse tópico, porém, é mais avançado que a proposta deste capítulo. Para uma
comparação com os demais temas, abaixo apresenta-se uma seleção de temas para um
gráfico simples com base nos dados do SUS.
10 Visualizando distribuições
O pacote ggplot2 inclui diversos gráficos típicos de análise de dados como histogramas
(frequência e densidade) e gráficos de distribuição (QQ plots e boxplots). Com esses é
possível analisar as distribuições de variáveis, separados em grupos ou não.
Para se construir um histograma com o ggplot2, basta passar a coluna desejada e adicionar
a camada da função geom_histogram. A seguir um exemplo para o histograma das idades
das pessoas na base de mortalidade do SUS:
Como esperado, temos maior frequência de mortalidade para idades mais avançadas –
após 80 anos – e também os casos de mortalidade infantil no ano zero. Como curiosidade,
a maior idade encontrada no momento do óbito é 121 anos, para uma pessoa residente de
Angra dos Reis, do sexo masculino e nascida em 01/01/1897.
Para reforçar, o resultado do gráfico é bastante claro: na média, homens tendem a viver
menos que as mulheres. Ao se observarem as diferenças entre as medianas, nota-se que
as mulheres tendem a falecer em idade próxima dos 75 anos, enquanto os homes falecem
aos 62 anos aproximadamente.
print(p)
O primeiro passo para construir o gráfico foi calcular as mortalidades por mês e gênero
(coluna SEXO) utilizando-se o pacote dplyr, como também as diferenças percentuais da
média. O código do ggplot2 é exatamente igual ao anterior, exceto pela adição da nova
camada facet_wrap(~SEXO), a qual indica a criação das facetas de acordo com o gênero.
Perceba-se que os nomes dos grupos aparecem no topo de cada faceta, enquanto a
legenda e as escalas dos eixos são compartilhadas, para facilitar posterior análise.
BAZLEY, W. J.; CRONQVIST, H.; MORMANN, M. In the red: the effects of color on
investment behavior. Stockholm: School of Economics, 2017. (Swedish House of Finance
Research Paper, 17).
BÖRNER, K.; BUECKLE, A.; GINDA, M. Data visualization literacy: definitions, conceptual
frameworks, exercises, and assessments. Proceedings of the National Academy of
Sciences, v. 116, n. 6, p. 1857-64, 2019.
WICKHAM, H. et al. Ggplot2: create elegant data visualisations using the grammar of
graphics. 2022a. Disponível em: https://CRAN.R-project.org/package=ggplot2.
Acesso em: 28 set. 2022.
WICKHAM, H.; GIRLICH, M. Tidyr: tidy messy data. 2022. Disponível em:
https://CRAN.R-project.org/package=tidyr. Acesso em: 28 set. 2022.
Análise de regressão
1
Faculdade de Saúde Pública, Universidade de São Paulo
RESUMO:
Este capítulo apresenta os aspectos teóricos e práticos fundamentais em Análise de Regressão Linear
Simples e Múltipla, os quais podem ser utilizados em diversos tipos de estudo epidemiológicos; entre
esses, os de séries temporais, possibilitando a descrição e a quantificação de tendências. Apresenta-se
o processo de modelagem completo de um conjunto de dados reais, intercalando os aspectos teóricos
com os respectivos comandos e saídas do R. O público alvo são analistas de dados e pesquisadores
da área da saúde, com conhecimentos sólidos de epidemiologia e bioestatística básicas.
PALAVRAS-CHAVE:
Regressão linear. Processo de modelagem. Análise de resíduos.
Para ilustrar o ajuste dos MRL na área da saúde, apresenta-se um exemplo de aplicação
com dados reais na área da saúde. Trata-se de um estudo transversal realizado em um
hospital público do município de São Paulo, que teve como um dos objetivos identificar os
fatores determinantes da prática de atividade física nos últimos 12 meses. A amostra é
composta por por 150 homens com 50 anos ou mais. Os dados integram a pesquisa
"Atividade física habitual e densidade mineral óssea em homens adultos e idosos"
(FLORINDO, 2000) e estão disponíveis no arquivo “Atividade física.xls”. As variáveis
disponibilizadas no banco de dados são:
• id: número de identificação do indivíduo;
• escore: escore de prática de atividade física nos últimos 12 meses (quanto maior,
maior a prática);
• idade, em anos;
• renda, em reais;
• escol: escolaridade, em anos de estudo (0: até 3, 1: mais de 3).
2 O processo de modelagem
Em termos estatísticos, o objetivo do estudo é escrever 𝑌𝑌 como função dos 𝑋𝑋𝑗𝑗 , isto é, 𝑌𝑌 =
𝑓𝑓(𝑋𝑋1 , 𝑋𝑋2 , … , 𝑋𝑋𝑝𝑝 ). No caso de um MRL, a função escolhida será a linear (𝑌𝑌 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋1 +
𝛽𝛽2 𝑋𝑋2 + ⋯ + 𝛽𝛽𝑝𝑝 𝑋𝑋𝑝𝑝 ).
Com o auxílio da análise descritiva, estipula-se o modelo inicial a ser ajustado. O processo
de ajuste deve começar com uma análise univariada, ou seja, com o ajuste de um modelo
de regressão simples para cada variável explicativa. É fundamental avaliar se o modelo se
ajustou bem aos dados, por meio da análise de diagnóstico ou análise de resíduos. Caso o
modelo não esteja bem ajustado, um novo modelo deve ser proposto e o processo volta à
etapa inicial, até que um bom ajuste seja obtido. A partir da análise univariada, faz-se a
seleção das variáveis que comporão o modelo múltiplo. O critério para a seleção e
A seguir, cada etapa do processo será explicada, intercalando-se teoria e prática. Serão
abordados os aspectos teóricos mais importantes e, na sequência, os comandos do R serão
apresentados. As bibliotecas do R serão carregadas à medida que se fizerem necessárias.
Os comandos do R serão apresentados em azul e as saídas de cada comando em
vermelho.
View(dados)
Para fazer gráficos no R, será utilizada a biblioteca ggplot2. Para acessá-la, utilizar o
comando:
library(ggplot2)
Diagramas de dispersão
Escore x idade
Escore x renda
𝑛𝑛
1 (𝑋𝑋𝑖𝑖 − 𝑋𝑋̅) (𝑌𝑌𝑖𝑖 − 𝑌𝑌̅)
𝑟𝑟 = 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐(𝑋𝑋, 𝑌𝑌) = ∑
𝑛𝑛 − 1 𝑆𝑆𝑋𝑋 𝑆𝑆𝑌𝑌
𝑖𝑖=1
Tal coeficiente mede a presença e a força de uma associação linear e assume valores entre
-1 e 1. Valores próximos de 1 ou –1 indicam uma associação forte; valores próximos de
zero indicam ausência de associação. Alguns autores sugerem avaliar a presença de
associação linear a partir do coeficiente de correlação do seguinte modo:
• de 0.10 a 0.39 - fraca
• de 0.40 a 0.69 - moderada
• de 0.70 até 1 - forte.
Entretanto, de fato, não há uma norma rígida sobre isso. Deve-se levar em conta o contexto,
o tamanho da amostra e sempre avaliar a associação observando-se conjuntamente o
coeficiente de correlação e o diagrama de dispersão.
library(psych)
corr.test(dados.quant, use = "pairwise",method="pearson")
Call:corr.test(x = dados.quant, use = "pairwise", method = "pearson")
Correlation matrix
escore idade renda
escore 1.00 -0.39 0.18
idade -0.39 1.00 -0.20
Os p-valores dos testes são exibidos em Probability values. Tanto o coeficiente quanto o p-
valor do teste somente podem ser interpretados se a relação entre as variáveis for,
concretamente, linear. Assim esses devem ser avaliados conjuntamente com o respectivo
diagrama de dispersão.
Observa-se que o coeficiente de correlação entre o escore e a idade foi -0.39, o que sugere
fraca, porém significativa (p-value < 0.01), relação linear inversa entre as variáveis. O
mesmo ocorre entre o escore e renda, exceto que a relação é direta (r=0.18, p-valor=0.03).
Com isso, seleciona-se as duas variáveis para serem incluídas no modelo múltiplo.
Na figura nota-se a presença de uma associação linear entre idade e renda. À medida que
a idade aumenta, a renda diminui (r=-0.201). Essa associação não é muito forte, mas é
significativa (p=0.01).
Box-plot
geom_boxplot() +
labs(x = "Escolaridade (anos de estudo)",
y = "Escore de prática de atividade física") +
theme(panel.background = element_rect(fill = "grey80"))
Medidas descritivas
leveneTest(dados$escore, dados$fescol)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 1 0.6151 0.4341
148
Como p-valor>0.05 (Pr(>F)), não se rejeita 𝐻𝐻0 e conclui-se que as variâncias são iguais.
Como p-value = 3.792e-15, rejeita-se 𝐻𝐻0 e conclui-se que a média do escore entre indivíduos
com mais de 3 anos de estudo é maior do que a média entre indivíduos com mais de 3 anos
de estudo. Assim, existe uma associação significativa entre o escore e a escolaridade, de
modo que essa variável é selecionada para o modelo múltiplo.
Vamos apresentar o modelo de regressão linear simples, isto é, com única variável
explicativa, que será utilizada na análise univariada. Esse modelo pode ser escrito como:
220
200
𝑌𝑌𝑖𝑖
180
160
𝜀𝜀𝑖𝑖 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖
140
120
100
80
15 20 25𝑋𝑋
𝑖𝑖
30 35 40 X 45
Fonte: elaboração própria.
A reta 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 – ou simplesmente 𝜇𝜇𝑖𝑖 – corresponde à parte determinística do modelo e é
a mesma para todos os indivíduos. Entretanto, nem todos os pontos caem em cima da reta;
alguns estão acima e outros estão abaixo dessa. A distância entre cada ponto e a reta é
representada por 𝜀𝜀𝑖𝑖 , que corresponde à uma variabilidade aleatória ou erro aleatório, única
para cada indivíduo e que não pode ser explicada. Por exemplo, irmãos gêmeos criados na
mesma casa, com altura, hábitos e dietas semelhantes terão aproximadamente o mesmo
peso, mas não exatamente o mesmo peso. Por algum conjunto de fatores desconhecidos
– os quais não podem ser observados ou medidos – o peso pode variar de um para outro,
ainda que apenas alguns gramas. Essa variabilidade é considerada aleatória e sem
explicação.
Note-se que a expressão 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 corresponde à verdadeira reta de regressão que
rege a relação entre 𝑌𝑌 e 𝑋𝑋 na população, de modo que os coeficientes 𝛽𝛽0 e 𝛽𝛽1 são
desconhecidos e precisam ser estimados a partir do conjunto de dados disponível, isto é,
da amostra. As estimativas dos coeficientes serão chamadas de 𝑏𝑏0 e 𝑏𝑏1 , respectivamente,
e a reta estimada ou ajustada será 𝑌𝑌̂𝑖𝑖 = 𝑏𝑏0 + 𝑏𝑏1 𝑋𝑋𝑖𝑖 . Os coeficientes podem ser estimados
pelo Método dos Mínimos Quadrados ou pelo Método de Máxima Verossimilhança.
• Linearidade – Caso o valor médio de 𝑌𝑌𝑖𝑖 (isto é, 𝜇𝜇𝑖𝑖 ) seja uma função de linha reta sobre
os Xi, pode-se estimar o modelo de regressão linear. Essa suposição deve ser avaliada
pelo diagrama de dispersão.
Após o ajuste do modelo final, essas suposições devem ser checadas novamente, por meio
da análise de resíduos.
Normalidade
Para se avaliar se a variável resposta tem distribuição Normal, vamos fazer alguns gráficos
e um teste de Normalidade:
library(qqplotr)
ggplot(dados, aes(sample = escore)) +
stat_qq_band(fill="white") +
stat_qq_line() +
stat_qq_point() +
labs(x = "Quantis da Normal", y = "Escore de prática de atividade física") +
theme(panel.background = element_rect(fill = "grey80"))
Como o p-valor do teste é maior do que 0.05 (p-value = 0.2913), não se rejeita 𝐻𝐻0 e conclui-
se que não há evidências para rejeitar a normalidade dos dados.
Homoscedasticidade
Linearidade
c) d)
Inicialmente, vai-se ajustar modelos de regressão linear simples para cada uma das
variáveis explicativas separadamente.
Para ajustar um modelo de regressão linear no R, utiliza-se a função lm, do inglês linear
model.
Na fórmula, o símbolo ~ pode ser lido como “depende de”, de modo que se ajusta um
modelo de regressão linear em que “escore” depende de “idade” (lembre-se das definições
de variável dependente e independente). Também é necessário informar em qual banco de
dados o R deve procurar as variáveis especificadas na fórmula. Para isso, utiliza-se o
subcomando data=dados.
Residuals:
medidas descritivas para os resíduos
Min 1Q Median 3Q Max
(diferenças entre os valores observados e ajustados)
-2.7116 -1.1065 0.0489 0.8379 3.2676
Coefficients:
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Nível descritivo dos testes
Residual standard error: 1.316 on 148 degrees of freedom
Da coluna Estimate obtém-se 𝑏𝑏0 = 11.10428, 𝑏𝑏1 = −0.06598, de modo que a reta estimada
é 𝑌𝑌̂𝑖𝑖 = 11.10428 − 0.06598𝑋𝑋𝑖𝑖 .
Para saber se, de fato, existe uma associação entre X e Y, isto é, se X pode ser usada para
explicar Y, faz-se o teste de hipóteses para o coeficiente 𝛽𝛽1 . As hipóteses são:
𝐻𝐻0 : 𝛽𝛽1 = 0 (Não existe associação entre X e Y);
Desse modo, rejeita-se 𝐻𝐻0 e conclui-se que há uma associação significativa entre o escore
e a idade. Para se compreender como é essa associação e descrevê-la, deve-se interpretar
os coeficientes ajustados.
Para se interpretar os coeficientes, retoma-se o modelo proposto, 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 produzir
algumas variações nos valores de 𝑋𝑋𝑖𝑖 e espera-se ver o que acontece com μ𝑖𝑖 .
O modelo ajustado para a idade é 𝑌𝑌̂𝑖𝑖 = 11.10428 − 0.06598𝑋𝑋𝑖𝑖 . Nesse caso, 𝑏𝑏0 não tem
interpretação, uma vez que não se tem no conjunto de dados indivíduos com idade zero.
Mas para 𝑏𝑏1 = −0.06598, pode-se dizer que a cada aumento de um ano na idade, isto é, a
cada ano que passa, espera-se uma redução no escore de prática de atividade física de
0.066 pontos, em média. Analogamente, espera-se uma redução no escore de prática de
atividade física de 0.66 pontos, em média, a cada 10 anos.
anova(mod1)
Analysis of Variance Table
Response: escore
Df Sum Sq Mean Sq F value Pr(>F)
idade 1 45.794 45.794 26.443 8.469e-07 ***
Residuals 148 256.306 1.732
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
No modelo que se ajustou, 𝑅𝑅2 = 0.1516, o que significa que a idade explica cerca de 15%
da variabilidade do escore de prática de atividade física. Na presença de várias variáveis
explicativas é conveniente utilizar o 𝑅𝑅 2 ajustado.
Call:
lm(formula = escore ~ renda, data = dados)
Residuals:
Min 1Q Median 3Q Max
-3.1965 -1.0643 -0.0152 0.9049 4.1638
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4.996777 0.944180 5.292 4.28e-07 ***
renda 0.007040 0.003242 2.171 0.0315 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Pelo que se viu anteriormente, pode-se dizer que, segundo esse modelo:
Call:
lm(formula = escore ~ escol, data = dados)
Residuals:
Min 1Q Median 3Q Max
-2.8958 -0.7396 -0.1090 0.7568 3.3542
Retome-se o modelo proposto, 𝜇𝜇𝑖𝑖 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋𝑖𝑖 , considerando-se agora que 𝑋𝑋𝑖𝑖 é a variável
escolaridade e que essa assume apenas dois valores: 0, para indivíduos com até 3 anos
de estudo, e 1, para indivíduos com mais de 3 anos de estudo.
𝜇𝜇 = 𝛽𝛽0 + 𝛽𝛽1 𝑋𝑋
𝑋𝑋 = 1 ⟹ 𝜇𝜇mais de 3 = 𝛽𝛽0 + 𝛽𝛽1 ∗ 1 = 𝛽𝛽0 + 𝛽𝛽1 = 𝜇𝜇até 3 + 𝛽𝛽1 , ou seja, 𝛽𝛽1 é o aumento esperado
ou médio no escore em indivíduos com maior escolaridade, quando comparados com
indivíduos com menor escolaridade. 𝛽𝛽1 é a diferença na média do escore entre indivíduos
com maior escolaridade e menor escolaridade.
As estimativas dos modelos de regressão linear simples estão resumidas na tabela a seguir:
Erro padrão
Variável explicativa 𝑏𝑏1 p-valor R2
de 𝑏𝑏1
Idade -0.06598 0.0128 <0.001 0.1516
Renda 0.00704 0.0032 0.0315 0.0309
Escolaridade 1.6619 0.1894 <0.001 0.3423
Cada valor de 𝑏𝑏1 na tabela expressa o efeito individual de uma variável explicativa no
escore, sem levar em consideração as demais variáveis. Para se avaliar o efeito de cada
variável no escore, na presença de outras variáveis, ou seja, controlando para as demais
variáveis, vai-se proceder ao ajuste de um modelo múltiplo.
Call:
Residuals:
Min 1Q Median 3Q Max
-2.5059 -0.6636 -0.1760 0.8129 2.6154
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.41289 0.68840 13.674 < 2e-16 ***
escol 1.51614 0.17990 8.428 2.97e-14 ***
idade -0.05037 0.01073 -4.693 6.11e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Inicialmente deseja-se saber se, de fato, o modelo proposto fornece alguma explicação
acerca da variabilidade da resposta. Para tanto, testa-se se todos os coeficientes das
variáveis explicativas são simultaneamente iguais a zero ou se existe pelo menos um
coeficiente diferente de zero. Assim, se se tiver p variáveis explicativas, as hipóteses
correspondentes serão:
𝐻𝐻0 : 𝛽𝛽1 = 𝛽𝛽2 = ⋯ 𝛽𝛽p = 0;
𝐻𝐻1 : nem todos os 𝛽𝛽j são iguais a 0.
Sob 𝐻𝐻0 , a estatística do teste tem distribuição 𝐹𝐹(𝑝𝑝; 𝑛𝑛−p−1) .
Como o p-valor é menor do que 0.001, conclui-se que há pelo menos um coeficiente
diferente de zero e que o modelo é útil para explicar a variabilidade da resposta.
Call:
lm(formula = escore ~ escol + idade + renda, data = dados)
Residuals:
Min 1Q Median 3Q Max
-2.5210 -0.7177 -0.1434 0.8563 2.6445
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8.653395 1.100699 7.862 7.66e-13 ***
escol 1.502667 0.180672 8.317 5.80e-14 ***
A presença da variável renda não causou alterações nos coeficientes ou nos p-valores das
demais variáveis e nem no R2. Entretanto, o efeito de renda, na presença de escolaridade
e idade, não foi significativo (p=0.378). Isso ocorreu porque a informação oferecida pela
renda está contida, em grande parte, naquela oferecida pela escolaridade e pela idade,
tornando desnecessária a presença dessa variável no modelo, ao menos do ponto de vista
estatístico. Porém, do ponto de vista epidemiológico, pode ser importante manter essa
variável no modelo e garantir que as estimativas das demais variáveis estão controladas
para ela. De qualquer forma, é importante esclarecer que o fato de o efeito da renda não
ser significativo não quer dizer que essa não está associada ao escore, mas apenas que,
na presença da escolaridade e da idade, a renda não fornece explicação alguma adicional
sobre a variabilidade do escore. Por motivos de simplicidade, vai se continuar com o modelo
mod4, apenas com a idade e a escolaridade.
Supondo-se que o modelo final está bem ajustado (o que se verá se é verdade mais
adiante), vai se interpretar os seus coeficientes.
O modelo estimado é 𝑌𝑌̂𝑖𝑖 = 9.41289 + 1.51614𝑋𝑋1𝑖𝑖 − 0.05037𝑋𝑋2𝑖𝑖 ou, de modo mais simples,
𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒
̂ 𝑖𝑖 = 9.41289 + 1.51614𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑖𝑖 − 0.05037𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖
Note-se que:
O resíduo 𝑒𝑒𝑖𝑖 pode ser visto como o erro observado, em contrapartida ao erro aleatório 𝜀𝜀𝑖𝑖 ,
que é desconhecido e não observável, ou seja:
𝜀𝜀𝑖𝑖 = 𝑌𝑌𝑖𝑖 − 𝜇𝜇𝑖𝑖 → Distância entre 𝑌𝑌𝑖𝑖 e a verdadeira média (populacional,
desconhecida) e, portanto, desconhecido/
𝑒𝑒𝑖𝑖 = 𝑌𝑌𝑖𝑖 − 𝑌𝑌̂𝑖𝑖 → Distância entre 𝑌𝑌𝑖𝑖 e o seu valor ajustado. É conhecido.
Os resíduos 𝑒𝑒𝑖𝑖 são extremamente úteis para se avaliar se determinado modelo é apropriado
aos dados. Segundo o modelo apresentado, os erros 𝜀𝜀𝑖𝑖 são variáveis aleatórias
independentes e identicamente distribuídas com distribuição 𝑁𝑁(0; 𝜎𝜎 2 ). Se o modelo
ajustado for realmente apropriado para os dados, os resíduos observados 𝑒𝑒𝑖𝑖 devem refletir
as propriedades assumidas para os 𝜀𝜀𝑖𝑖 , ou seja, devem ter distribuição normal com média
igual a zero e variância constante e serem independentes entre si. Além disso, devem ser
pequenos porque quanto menor forem, mais os pontos estarão próximos da reta e mais a
variável explicativa fundamentará a variabilidade da resposta. Em geral, é difícil definir o
que é um valor “pequeno” para o resíduo, de modo que se trabalha com resíduos
padronizados. Como devem ter distribuição Normal, valores maiores do 1.96 ou menores
do que -1.96 são considerados grandes e, se o modelo estiver bem ajustado, espera-se
não mais do que 5% dos pontos nessa condição.
Os resíduos padronizados do modelo final (mod4) serão colocados no banco de dados (se
fez isso antes com os valores ajustados) e se obterão os gráficos.
c) d)
Em a), b) e c) não há evidências de que a distribuição dos resíduos não seja Normal.
10 Considerações finais
1
Faculdade de Saúde Pública, Universidade de São Paulo
RESUMO:
O aumento da disponibilidade de dados e os avanços na capacidade computacional têm permitido o
uso de modelos mais complexos que conseguem modelar de forma mais fidedigna a real complexidade
das interações entre os fatores que levam aos desfechos graves de saúde. As aplicações desses
algoritmos de machine learning terão impacto não apenas na prática clínica direta, mas também
na gestão do sistema de saúde e no desenvolvimento de políticas públicas. Este capítulo apresenta
os usos e principais desafios que precisam ser superados para que esses algoritmos consigam ter
impacto real na saúde.
PALAVRAS-CHAVE:
Inteligência artificial. Machine learning. Algoritmos preditivos.
A ciência em saúde tem sido historicamente dominada pela área hoje conhecida como
análise de inferência, em geral caracterizada pela busca da existência de uma associação
estatisticamente significativa entre dois ou mais fatores (JAMES et al., 2014). Por exemplo,
uma das descobertas científicas mais impactantes no século passado foi sobre a
associação entre fumar e câncer de pulmão (DOLL; HILL, 1956), um dos principais motivos
de a prevalência do tabagismo em adultos ter caído rapidamente nas últimas décadas e ser
diretamente responsável por milhões de vidas salvas (SREERAMAREDDY; AYE, 2021).
A área de machine learning pode ser definida como a capacidade de máquinas aprenderem
a estabelecer regras complexas a partir de dados. Inserida no grupo maior de inteligência
artificial, na qual existe também a possibilidade de máquinas tomarem decisões inteligentes
a partir de regras estabelecidas por humanos, em que nesse caso não há um aprendizado
direto por parte das máquinas, uma área hoje conhecida como “boa e velha inteligência
artificial” (good old-fashioned AI).
Para estudos preditivos de machine learning, essa relação particular entre os diversos
fatores pouco ou nada importa, pois o objetivo é estimar Y a partir da melhor função possível
das variáveis X, mesmo que isso envolva múltiplas interações e que torne a relação
particular de cada X com o desfecho Y inconclusiva na análise visual direta.
O fato de machine learning não precisar fornecer uma justificativa simplista e, portanto,
frequentemente errada, para uma decisão inteligente e complexa é o que permite o ajuste
da função que mais se aproxima da verdadeira interação entre fatores que leva ao desfecho
a ser predito. Essa liberdade é particularmente importante para a área da saúde, na qual
há muito tempo se sabe que os problemas mais graves não acontecem devido a único fator
plenamente isolado dos outros, mas sim devido à interação complexa entre os diversos
componentes demográficos, genéticos, ambientais, socioeconômicos, entre outros.
O presente capítulo será dividido da seguinte forma. Em primeiro lugar, serão apresentados
alguns dos potenciais usos de ML no desenvolvimento de políticas públicas, depois serão
apresentados alguns dos principais desafios técnicos da área, seguidos do estado da arte
atual da área de machine learning para dados estruturados e, por fim, serão apresentadas
algumas das principais limitações da área.
Algoritmos de ML, por outro lado, conseguem aprender com exemplos de milhões
de pacientes a identificar as doenças e o risco de prognóstico negativo desses
pacientes. Além disso, não existe o risco de terem esquecimentos – com o tempo as
suas regras de decisão podem melhorar, um conjunto de regras conhecido como
aprendizado on-line ou contínuo (LEE; LEE, 2020).
Muitos artigos científicos têm sido publicados nos últimos anos, nos quais algoritmos
de ML são utilizados para auxiliar profissionais de saúde no diagnóstico de doenças
e na predição do prognóstico dos pacientes. Um estudo recente encontrou que
algoritmos de ML conseguem identificar o risco de o paciente ter doença de
Parkinson analisando sua respiração noturna (YANG et al., 2022). Outro demonstrou
– mesmo com poucos dados – que algoritmos de machine learning conseguem
aprender a detectar distúrbios da cabeça como tumores e fraturas no crânio (GUO
et al., 2022).
1
Para melhor compreensão sobre RCT (Randomized Controlled Trials) e causalidade, ver o Capítulo 10
“Randomized Controlled Trials”: os experimentos aleatórios em Políticas Públicas.
Poucas são as áreas que coletam mais dados do que a saúde. Do momento em que
o paciente chega a um serviço de saúde ao momento em que recebe alta, um grande
número de variáveis é coletado, desde informações demográficas, histórico familiar
de doenças, medicamentos em uso, sintomas e sinais vitais, até os próprios
resultados dos exames e procedimentos que são realizados no paciente.
Recursos de saúde são escassos em todos os países do mundo; à medida que tem
ocorrido o rápido envelhecimento populacional pelo qual passam todas as regiões,
aumenta a pressão para tornar os gastos em saúde cada vez mais eficientes.
Desses, um dos principais é a realização desnecessária de alguns exames, os quais
na maioria dos casos são solicitados com as melhores intenções, mas que têm como
consequência diferentes níveis de desconfortos para os pacientes, além do próprio
desperdício de recursos.
Toda política pública precisa ser focalizada. Não é possível desenvolver uma política
pública viável para toda a população de um país, pois isso levaria a enormes
desperdícios. Por exemplo, ao desenvolver uma política pública para diminuir o risco
Outro desafio técnico importante é definir como se fará a testagem do uso desse algoritmo
no mundo real, para que se obtenha o resultado de uma métrica que melhor indique a sua
performance preditiva na prática. A estratégia mais comum é dividir o banco de dados em
duas partes por meio de um sorteio. Uma parte dos dados é assim utilizada pelo algoritmo
para ajustar os seus parâmetros (suas regras de decisão). Esse conjunto de dados é
conhecido como “treino” e frequentemente é composto por 70% dos dados originais. Após
a definição do melhor modelo final, esse é aplicado ao conjunto de dados restante
(conhecido como “teste”) para que as predições sejam feitas em uma simulação de dados
futuros reais. Em estudos de machine learning são sempre reportadas as métricas de
performance nesses dados de teste que não foram utilizados no processo anterior de
aprendizado do algoritmo.
Por fim, é necessário estabelecer qual será a métrica utilizada para avaliar a qualidade
preditiva desse algoritmo. Uma solução simples seria analisar a proporção de acertos do
algoritmo, uma métrica conhecida como acurácia. O problema dessa métrica é que a
grande maioria dos desafios da área da saúde é predizer um evento relativamente raro e
até mesmo os eventos de saúde mais comuns são raros. Por exemplo, segundo os dados
oficiais do DataSUS, em 2020 a principal causa de óbito no Brasil foi câncer, mas apenas
0,1% dos brasileiros morreram de câncer em 2020 (224.829 óbitos por câncer em 214
milhões de residentes).
Ter uma boa acurácia para eventos raros é fácil – é só predizer que nenhum desses eventos
vai acontecer. No exemplo anterior, um algoritmo que predissesse que nenhum brasileiro
morreria por câncer em 2020 teria uma acurácia de 99,9%, porém seria uma predição inútil
pois não teria acertado único caso de interesse, que é a mortalidade por câncer.
2
Ver os capítulos 16 (Segurança no uso dos dados sensíveis para pesquisa em saúde) e 18 (Modelagem e
gestão de Banco de Dados com SQL e integração com o R) para o entendimento da diferença entre dados
estruturados, semiestruturados e não-estruturados.
Essa métrica permite identificar qual a proporção dos casos positivos que o algoritmo
conseguiu identificar como sendo de fato positivos. A especificidade é calculada como:
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 =
𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 + 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
O desafio do uso de duas métricas para analisar a performance preditiva dos algoritmos é
ser difícil selecionar o melhor algoritmo quando os valores das métricas não são uniformes,
pois um algoritmo pode ter melhores resultados de sensibilidade e outro de especificidade.
Uma solução para esse problema é utilizar a métrica que junte os resultados da
sensibilidade e especificidade em um só valor final; a mais comum delas é a área abaixo
da curva ROC.
A área abaixo da curva ROC é de certa forma um resumo dos resultados da sensibilidade
e da especificidade (mais tecnicamente, 1 - especificidade) à medida que se muda o
threshold do que é considerado um caso positivo. O threshold mais comum para identificar
casos positivos é 50%, mas outros pontos de corte são possíveis. Ao se analisarem todos
os possíveis pontos de cortes e seus resultados de sensibilidade e 1- especificidade é
possível criar a curva ROC, como demonstrado abaixo.
Quanto mais a linha da curva ROC tende para o lado esquerdo e superior do gráfico e,
portanto, quanto mais perto de 1 é a área abaixo da curva ROC, melhor é a performance
preditiva do algoritmo. De uma forma mais intuitiva, o resultado da área abaixo da curva
ROC corresponde à probabilidade de, quando forem selecionados um caso positivo e um
negativo aleatórios, o positivo será classificado pelo algoritmo como tendo maior
probabilidade de ser positivo do que o negativo.
Alguns desafios da área da saúde podem também envolver a predição não de uma
categoria, mas de um valor contínuo. Nesse caso, a métrica mais utilizada para analisar a
performance preditiva do algoritmo é a raiz quadrada do erro quadrático médio (do inglês
root mean squared error RMSE), calculada da seguinte forma:
"
(𝑦𝑦A𝑖𝑖 − 𝑦𝑦𝑦𝑦)!
𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 = >?
𝑛𝑛
#$%
4 Estado da arte
Machine learning é uma área bastante aberta a novidades e sem muitos paradigmas,
pois seu objetivo é apenas estabelecer a melhor regra de decisão a partir dos dados.
Por isso, a área tem passado por algumas revoluções nos últimos anos; dessas, a
mais recente é a dominância do uso da técnica de deep learning – conhecida como
transformers – para a análise de dados de imagem e de texto (linguagem natural)
(SHAMSHAD et al., 2022).
Dois grandes desafios do uso de machine learning em saúde têm dominado a maior parte
do espaço nos debates sobre o futuro da área: explicabilidade e ética.
Existem alguns motivos pelos quais é importante que algoritmos de machine learning
consigam explicar a sua tomada de decisão na área da saúde. Em primeiro lugar,
existe a questão de garantir que os profissionais de saúde confiem nas decisões dos
algoritmos (HENRY et al., 2022). Ao explicar detalhadamente os motivos pelos quais
o algoritmo conferiu determinada probabilidade para o paciente ter uma doença no
futuro, é provável que médicos tenham mais confiança nessa decisão. Por exemplo,
se o algoritmo indicar alto peso para tabagismo e obesidade ao predizer que um
Existem hoje várias técnicas que permitem a identificação dos fatores que levaram
o algoritmo a tomar determinada decisão, muitas vezes com bastante detalhe. A
técnica mais comum para dados estruturados é o uso dos Shapley Values, método
proveniente da teoria dos jogos, que permite calcular a contribuição marginal de cada
fator para uma decisão, analisando-se a sua importância nas diferentes coalizões
possíveis de fatores (SUNDARARAJAN; NAJMI, 2020). Um exemplo de resultado
de Shapley Values está na figura abaixo:
Os resultados acima são referentes a uma análise de Shapley Values para identificar
as variáveis mais importantes para predizer declínio de mobilidade em 5 anos entre
idosos do município de São Paulo. Pelos resultados, verifica-se que a idade foi a
variável preditora mais importante e teve impacto no aumento do risco de declínio
de mobilidade (pontos em vermelho à direita), resultado semelhante ao de se ter
baixa escolaridade. O efeito do gênero masculino, por outro lado, foi inverso,
diminuindo o risco individual de declínio de mobilidade em 5 anos.
Em primeiro lugar, é importante lembrar que a qualidade das decisões dos algoritmos
depende sempre da qualidade do banco de dados utilizado para o treinamento. Em
geral, o grande desafio é que os dados disponíveis para os algoritmos muitas vezes
foram gerados a partir de decisões de seres humanos, as quais frequentemente são
preconceituosas.
Machine learning tem enorme potencial para auxiliar a melhorar as decisões na área da
saúde. Entretanto, os seus muitos desafios referentes à qualidade dos profissionais da área
e dos bancos de dados precisam ser superados para que os algoritmos consigam mudar
profundamente a área da saúde. Com o avanço da inteligência artificial em outras áreas do
conhecimento, esse aprendizado poderá ser transferido de forma confiável e robusta para
a área da saúde, melhorar as decisões tomadas por gestores de saúde e contribuir para a
melhoria da saúde no país.
AL-SHARI, H.; SALEH, Y. A.; ODABA, A. Comparison of gradient boosting decision tree
algorithms for CPU performance. 2021. Journal of Institue of Science and Technology,
v. 37, n. 1, p. 157-168, 2021. Disponível em: https://dergipark.org.tr/en/download/article-
file/1577402. Acesso em: 25 out. 2022.
BORISOV, V. et al. Deep neural networks and tabular data: a survey. ArXiv, 2021. DOI:
arxiv-2110.01889.
DOLL, R.; HILL, A. B. Lung cancer and other causes of death in relation to smoking. BMJ,
v. 2, n. 50001, p. 1077-1081, 1956. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articl
es/PMC2035864/pdf/brmedj03180-0019.pdf. Acesso em: 30 out. 2022.
FINLAYSON, S. G. et al. The clinician and dataset shift in artificial intelligence. New
England Journal Medicine, v. 385, n. 3, p. 283-286, 2021. Disponível em:
https://pubmed.ncbi.nlm.nih.gov/34260843/. Acesso em: 30 out. 2022.
GUI, Y. et al. Deep learning with weak annotation from diagnosis reports for detection of
multiple head disorders: a prospective, multicentre study. The Lancet Digital Health, v. 4,
n. 8, p. e584-e593, 2022. Disponível em: https://www.thelancet.com/journals/landig
/article/ /PIIS2589-7500(22)00090-5/fulltext. Acesso em: 30 out. 2022.
KALLUS, N.; ZHOU, A. Residual unfairness in fair machine learning from prejudiced
data. Sweden, PMLR 80, 2018. p. 2438-2448. Disponível em:https://arxiv.org/pdf/1806.
02887.pdf. Acesso em: 30 out. 2022.
LISTL, S.; CHIAVEGATTO FILHO, A. D. P. Big Data and Machine Learning. In: PERES,
M. A.; ANTUNES, J. L. F.; WATT, R. G. (org.). Oral epidemiology. New York: Springer
2020.
LEE, C. S.; LEE, A. Y. Clinical applications of continual learning machine learning. The
Lancet Digital Health, v. 2, n. 6, p. e279-e281, 2020. Disponível em:
https://www.thelancet.com/action/showPdf?pii=S2589-7500%2820%2930102-3. Acesso
em: 30 out. 2022.
LI, T. et al. Federated learning: challenges, methods, and future directions. IEEE Signal
Processing Magazine, v. 37, n. 3, p. 50-60, 2020. Disponível em:
https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9084352. Acesso em: 30 out.
2022.
NGIAM, K. Y.; KHOR, I. W. Big data and machine learning algorithms for health-care
delivery. The Lancet Oncology, v. 20, n. 5, p. e262-e273, 2019. Disponível em:
https://www.sciencedirect.com/science/article/pii/S1470204519301494?via%3Dihub.
Acesso em: 30 out. 2022.
SUNDARARAJAN, M.; NAJMI, A. The many Shapley values for model explanation. ArXiv,
v. 2, p. 1-20, 2020. Disponível em: https://arxiv.org/pdf/1908.08474.pdf. Acesso em: 30
out. 2022.
SVEEN, W.; DEWAN, M.; DEXHEIMER, J. W. The risk of coding racism into pediatric
sepsis care: the necessity of antiracism in machine learning. Journal of Pediatrics, v.
247, p. 129-132, 2022. Disponível em: https://www.sciencedirect.com/science /article/pii/
S0022347622003390?via%3Dihub. Acesso em: 30 out. 2022.
YIN, J.; NGIAM, K. Y.; TEO, H. H. Role of artificial intelligence applications in real-life
clinical practice: systematic review. Journal of Medical Internet Research, v. 23, n. 4, p.
e25759, 2021. Disponível em: https://pubmed.ncbi.nlm.nih.gov/33885365/. Acesso em: 30
out. 2022.
ZHOU, Q. et al. Clinical impact and quality of randomized controlled trials involving
interventions evaluating artificial intelligence prediction tools: a systematic review. NPJ
Digital Medicine, v. 4, n. 154, 2021. Disponível em: https://www.nature.com/articles/
s41746-021-00524-2. Acesso em: 30 out. 2022.
1
Fundação Oswaldo Cruz - Fiocruz
2
Instituto de Pesquisa Econômica Aplicada - IPEA
RESUMO:
Este capítulo fornece uma visão ampla acerca das evidências em políticas públicas, considerando-
se as diretrizes para Avaliação de Impacto em Políticas de Saúde (AIPS). Visa responder: i) Em que
medida as AIPS são influenciadas pelas limitações conceituais do movimento das políticas públicas
baseadas em evidências? ii) Como tais limitações podem introduzir vieses negativos nas decisões
em políticas? iii) Como superar esses vieses e limitações? Resgata o conceito de ecossistema de
evidências, apresenta alguns casos para o Brasil e discute tópicos que envolvem desde a melhoria do
ambiente geral para o uso de evidências até o fomento do compartilhamento, conexões e coproduções
de evidências entre gestores e outros stakeholders.
PALAVRAS-CHAVE:
Políticas públicas. Avaliação de impacto. Saúde. Análise conceitual.
Em que pese o surgimento e expansão do movimento das PIEs – e apesar das críticas e
autocríticas que as PPBEs têm sofrido nos últimos anos – esses movimentos ainda
padecem de limitações epistemológicas que acarretam vieses tanto na avaliação quanto
na prática das decisões das políticas públicas. Tais limitações e vieses constituem
verdadeira “armadilha”, na qual formuladores, implementadores e avaliadores muitas vezes
se encontram capturados, em especial ao descobrirem que não existem respostas simples
e diretas para um tema complexo e difícil de ser compreendido em sua inteireza como as
políticas de saúde.
1
Bons exemplos de redes de PIEs intersetorial global são a COVID-END
https://www.mcmasterforum.org/networks/covid-end e a EVIPNet https://www.who.int/initiatives/evidence-
informed-policy-network.
2
Os produtos entregues pela política causam os seus resultados e impactos esperados, conforme seu
modelo lógico? Essa seria a principal pergunta a que a avaliação de impacto procuraria responder (BRASIL,
2018, p. 262).
3
Não obstante, atualmente se reconhece não ser necessário realizar avaliações de impacto para que a
decisão seja considerada informada por evidências. Sobre isso, ver Lavis et al. (2012).
Não é de hoje que as evidências científicas são pensadas como um valioso apoio na esfera
das decisões sobre políticas públicas. O uso do conhecimento científico nas políticas
públicas experimentou grande impulso desde meados do século XX, a partir dos Estados
Unidos. Ao trabalharem com as disciplinas da administração pública e análise de políticas
públicas, autores como Lasswell (1951; 1970) passaram a defender a aplicação do método
científico como fundamentais para lidar com os problemas que as políticas públicas
abordam. Ademais, a partir dos anos 1960, em solo norte-americano, houve um aumento
sem precedentes dos gastos públicos com programas de combate à pobreza, educação,
renda mínima, habitação, saúde e justiça criminal4. Isso gerou certa pressão social e política
para a avaliação desses programas (SHADISH JUNIOR; COOK; LEVITON, 1995), bem
como para o desenvolvimento de “[...] novos métodos, carreiras profissionais, fontes de
informação, instrumentos, técnicas e teorias voltadas para a avaliação de programas
públicos” (PINHEIRO, 2020b, p. 18).
A partir de meados do século XX, viveu-se um clima de otimismo, em que se acreditava ser
possível desenhar políticas públicas “ótimas” em favor do aumento do bem-estar geral.
4
Aspectos geopolíticos internacionais, ligados à guerra fria, não estiverem ausentes como motivações para
esse movimento. Por exemplo, Worthen, Fitzpatrick e Sanders (2004, p. 64) atribuem à Lei Educacional de
Defesa Nacional (1958) importante papel no desencadeamento da onda de avaliação de programas
educacionais nos Estados Unidos, dos anos 1960 em diante.
5
A teoria dos jogos foi desenvolvida a partir do trabalho de von Neumann e Morgenstern (1944) e deu
origem a um padrão de formalização teórico da escolha social. Nesse padrão, o juízo social é modelado
segundo a escolha da melhor alternativa entre um leque de opções possíveis, existentes e conhecidas.
Trata-se de um modelo dedutivo em sua essência, o qual pressupõe que todos os fatores envolvidos para
julgar os méritos de uma alternativa de ação sejam comparáveis e comensuráveis, em termos de utilidade
ou valor.
Sob certo ponto de vista, a MBE foi um sucesso, em especial para impulsionar o
desenvolvimento e disseminação de métodos para a avaliação de tecnologias em saúde
(ATS), que se tornariam globalmente aceitos como um importante subsídio das decisões
sobre a incorporação de tecnologias em saúde. A partir dos EUA e Canadá, esse
movimento difundiu-se para várias partes do mundo. A justificar esse sucesso, há vários
exemplos históricos, em que testes experimentais corrigiram erros graves em certas
6
Embora os princípios da MBE estivessem postos há décadas, a “[...] expressão ‘medicina baseada em
evidência’ foi usada pela primeira vez em 1992, numa publicação de um autointitulado Grupo de Trabalho
de Medicina Baseada em Evidência (do inglês The Evidence-Based Medicine Working Group), formado por
professores de epidemiologia clínica, informática médica e bioestatística da Universidade McMaster, no
Canadá (GOLDENBERG, 2005). Nesse trabalho pioneiro, os métodos usados naquelas disciplinas foram
apresentados, e seu emprego foi proposto, como um novo paradigma [...] na formação de médicos, nas
práticas clínicas e na tomada de decisões médicas e de saúde em nível macro” (PINHEIRO; NOGUEIRA,
2021, p. 12).
7
Os ensaios clínicos randomizados são também conhecidos por sua sigla em inglês (RCT-randomized
controlled trials).
Assim como a decisão clínica é complexa e deve considerar outros elementos, além das
recomendações fundamentadas em evidências – disponíveis nos protocolos clínicos – para
alcançar a melhor opção para um paciente, os tomadores de decisão nas políticas públicas
constantemente têm à sua frente problemas complexos; esses exigirão não apenas a
compreensão da suas causas e consequências, mas também a adoção de critérios de
priorização e de tomada de decisão, os quais produzirão consequências (positivas ou
negativas) para as populações abrangidas pelos efeitos das suas decisões. Dessa forma,
é necessário reconhecer a complexidade inerente aos problemas sociais abordados pelas
políticas públicas, de maneira que essa perspectiva informe não apenas a sua formulação
e implementação, como também a avaliação dos seus resultados e impactos.
Para os objetivos deste capítulo, cabe salientar que a MBE efetivamente contribuiu para a
difusão de certo viés empirista e experimentalista no entendimento das evidências em
políticas públicas, em especial no início do movimento das PPBEs, e para a disseminação
global da ATS como um subsídio essencial das atividades regulatórias sobre tecnologias –
novas e antigas – nos sistemas de saúde de todo o mundo. Ao produzir e defender que as
“melhores evidências” para orientar decisões médicas provinham de métodos
experimentais, especialmente de ensaios clínicos controlados e randomizados (ECR),
focados em eficácia e segurança, a MBE pode ter priorizado uma concepção
filosoficamente estreita de evidência, a qual pode se mostrar inadequada para o contexto
das políticas públicas. Embora esse viés tenha sido reconhecido recentemente como uma
8
Por exemplo, [...] Edwards et al. (2005) “[...] mostraram, por meio de ensaios clínicos randomizados
(ECRs), que a aplicação de esteroides para tratar inchaços derivados de lesões na cabeça em indivíduos
adultos – um tratamento estabelecido há décadas – na verdade, aumentava a probabilidade de morte dos
pacientes (PINHEIRO; NOGUEIRA, 2021, p. 7).
9
Vide, por exemplo, Thomas, Bracken e Timimi (2012).
10
Lacuna que pode levar, entre outras coisas, “ao abuso do poder econômico da indústria farmacêutica, ao
excesso de medicalização, à perda de autonomia de pacientes e médicos” (PINHEIRO; NOGUEIRA, 2021,
p. 42).
11
Vide, por exemplo, um movimento recente de orientação da prática médica que procura levar em
consideração os valores do paciente, o chamado “cuidado centrado no paciente” (patient-centered care), e
que surgiu como uma espécie de autocrítica no interior da MBE. Disponível em: https://bit.ly/3DQBBoI.
Acesso em: 6 set. 2021. Ver também Andermann et al. (2016).
12
Entre esses outros tipos de evidências, fora as estritamente científicas, identificam-se as evidências
locais, ligadas ao contexto de implementação da política.
Contrariando certo ideal tecnocrático, que parecia animar analistas e políticos na segunda
metade do século XX, hoje percebe-se não ser possível (nem desejável) eliminar, por
exemplo, o componente “político” das decisões das políticas públicas. Isso implica, entre
outras coisas, levar-se em consideração a perspectiva dos diversos interessados
(stakeholders) na política em questão. Ademais, sabe-se que os arcabouços
organizacionais e político-institucionais também podem exercer influência significativa
sobre os tipos de recursos informacionais usados nas decisões. Portanto, a resposta certa
à questão sobre a melhor evidência para julgar uma política pública dependerá de um
conjunto de fatores contextuais que a literatura de análise de políticas públicas tem
desenvolvido nos últimos anos. Tal intervenção será melhor para quem? Em que arranjos
institucionais? Em quais tempos e lugares?14
Em geral, usa-se o termo “evidência” para se referir a dados, relatos e observações que
ajudam a apoiar uma conclusão sobre um tema (TOMA et al., 2017). As evidências também
são susceptíveis ao contexto, pois as observações muitas vezes são relacionadas a fatores
específicos, o que torna necessárias avaliações consistentes sobre a aplicabilidade da
evidência em outros cenários. Diferentemente da MBE, o conhecimento científico aplicável
ao contexto das políticas públicas nas PIEs, consubstanciado nos resultados de pesquisas
científicas sobre temas e questões prioritárias de saúde pública, concentra-se em decisões
sobre populações em vez de sobre indivíduos. Embora as áreas compartilhem alguns
princípios comuns, tal como o ceticismo sobre os supostos benefícios de uma intervenção,
a dinâmica, valores e finalidades para o uso de evidências são diferentes nas duas áreas
(LOMAS et al., 2005; COOKSON, 2005).
13
Parkhurst (2022) apresenta um survey da literatura recente sobre a complexidade do uso de evidências
em políticas públicas. Os estudos aplicam teorias de um amplo conjunto de disciplinas que vão da ciência
política aos estudos de ciência e tecnologia e passam pelas ciências cognitivas. Esse esforço reflexivo,
empreendido nos últimos vinte anos, contribuiu enormemente para o entendimento acerca das limitações e
motivações dos tomadores de decisão em políticas públicas, a influência dos arranjos e sistemas
institucionais, bem como o papel das funções e atividades próprias dos diferentes espaços de política em
que as decisões são tomadas.
14
Walls et al. (2017) dão um exemplo da complexidade dessas questões e analisam a política
antitabagismo no Camboja. Para os gestores da saúde pública era mais importante convencer as
autoridades econômicas daquele país de que seria viável controlar o tabaco sem graves consequências
econômicas do que comprovar os efeitos maléficos do tabagismo para a saúde humana. Ora, conseguiu-se
esse objetivo com uma pesquisa comparativa dos países vizinhos que empreenderam essa política e não
com revisões sistemáticas de ECRs.
Por sua vez, nem toda evidência possui o mesmo grau de confiabilidade. Por isso, é
necessário avaliar quanta confiança é possível atribuir às evidências disponíveis, sejam
essas globais ou locais. No caso das evidências advindas de estudos científicos, entre
outros aspectos, é possível avaliar se o delineamento foi adequado à pergunta de pesquisa,
se existem possíveis vieses que tornem os resultados menos confiáveis. Em especial, os
resultados precisam ser apresentados de forma precisa e fiel às observações. As
evidências de pesquisa com maior robustez metodológica são geralmente mais
convincentes do que observações ao acaso ou de forma isolada, em face da sua
intersubjetividade, fortalecida quando são usados métodos transparentes e rigorosos na
coleta, análise e síntese dos dados.
Essas formas podem estar inter-relacionadas. Por exemplo, uma avaliação que apresenta
um ensaio clínico randomizado também pode incorporar evidências advindas de análises
de dados, de informações qualitativas e de uma análise de custo-efetividade. Da mesma
Dessa forma, cada etapa do processo de tomada de decisão pode ser mapeada para
diferentes formas de evidência especialmente úteis. Por exemplo, para entender um
problema e suas causas a análise de dados pode ajudar a delimitar a magnitude de um
problema, compará-lo no tempo e no espaço e contribuir com subsídios para o processo
de priorização. Por seu turno, estudos qualitativos podem ajudar a compreender a
perspectiva das pessoas que vivenciam o problema, suas causas e consequências.
Por fim, o monitoramento da implementação e avaliação dos impactos podem contar com
a análise de dados e, novamente, com diferentes tipos de avaliações, entre elas as AIPS.
Assim, existe diversidade entre as evidências hoje consideradas nas PIEs, a qual se
expande também sobre os limites das políticas sociais. Trata-se de uma visão abrangente
e inclui diferentes tipos de informação e diferentes formas de acessá-la.
Fonte: Comissão Global de Evidências para Enfrentar Desafios Sociais (2022, p. 44).
Nota: *ATS e análise de custo-efetividade estão agrupadas porque, em geral, são conduzidas
para os mesmos tipos de produtos / serviços e pelos mesmos grupos de evidências.
continua
continua
continua
continua
Essa pequena amostra sugere haver grande variedade de tipos de análises de impacto em
políticas de saúde. Essa variedade, por sua vez, quando vista sob a ótica abrangente da
abordagem que se defende neste capítulo – o “ecossistema de evidências” – ganha certa
unidade na rede de conexões possíveis com as outras formas de evidências (vide
novamente a Figura 1).
Assim, quando se analisa o primeiro caso mostrado no Quadro 1, vê-se uma AIPS cujas
variáveis de resultado incluem a satisfação do usuário com os serviços de saúde. Isso
porque uma das perguntas do estudo pode ser assim formulada: os participantes da
Estratégia de Saúde na Família (ESF) teriam mais acesso, utilização e satisfação com
serviços de atenção primária à saúde do que os não participantes? Ou seja, as intervenções
dessa estratégia melhoram aquelas experiências (acesso, uso e satisfação) para os
participantes? Se a “satisfação” é uma variável qualitativa – pois assume valores
qualitativos como satisfeito/não satisfeito – essa deve refletir certos atributos ou juízos
subjetivos. Assim, a elucidação das cadeias causais que medeiam a intervenção pública
(ações da ESF) e a satisfação do usuário do serviço necessita de informações as quais,
por assim dizer, vão além do método da avaliação de impacto. Em especial, no
desvelamento mais profundo dessa cadeia causal, poderiam ser úteis estudos de caso e
entrevistas em profundidade com os usuários do serviço. Portanto, o caso 1 pode conectar-
se com outros elementos do ecossistema de evidências e receber complementos
importantes para a compreensão mais profunda acerca da natureza do impacto causado
pela política pública em questão.
Por fim, o caso 4 do Quadro 1 apresenta um estudo que avaliou a qualidade do serviço
oferecido pelos profissionais de saúde treinados em Atenção Integrada às Doenças
Prevalentes na Infância (AIDPI), em comparação com os profissionais não treinados. As
dimensões avaliadas envolvem, entre outras coisas, aspectos qualitativos, como a
capacidade do profissional de avaliar a criança doente e a comunicação com os pais das
crianças atendidas. Portanto, o estudo se abre para formas qualitativas de evidências
usadas para subsidiar decisões de políticas públicas, “dialogando” assim com um conceito
mais amplo de evidência, para além das evidências meramente causais-experimentais-
quantitativas.
No entanto, nem sempre políticas públicas alcançam os resultados que seus formuladores
desejam, porquanto ainda é pouco transparente e sistemático o processo de tomada de
decisão para a formação da agenda decisória e escolha dos problemas prioritários. Por
exemplo, é comum que a alternância de gestores produza a descontinuidade das
prioridades estatuídas anteriormente. Por essa razão, o conjunto de intervenções que
comporão uma política pública e apoiarão sua implementação muitas vezes carece de
consistência e efetividade.
Além das revisões sistemáticas que abordam perguntas relacionadas aos efeitos
comparativos de diferentes tecnologias em saúde – indispensáveis para apoiar escolhas
de incorporação e gestão de tecnologias – tem havido crescente disponibilidade de sínteses
de evidências globais sobre diferentes tópicos e arranjos de sistemas de saúde
(governança, financiamento, prestação de serviços e implementação etc.). Tais sínteses
representam uma fonte de alto valor para informar as discussões no âmbito nacional e local
na formulação, implementação e avaliação de políticas e programas de saúde.
Assim, o termo “avaliação de impacto” poderia ser usado para referir-se tanto à avaliação
dos resultados prováveis das intervenções previstas nos programas e políticas – mesmo
na sua fase de formulação – quanto àquelas planejadas para avaliar a implementação e os
15
Exemplos de repositórios de sínteses de evidências para Sistemas de Saúde e Saúde Pública:
https://www.healthsystemsevidence.org/; https://healthevidence.org/; https://sites.bvsalud.org/pie/pt/biblio;
https://africacentreforevidence.org/evidence-synthesis/; https://www.veredas.org/publicacoes/. Exemplos de
repositórios de mapas de evidência: https://www.3ieimpact.org/what-we-offer/evidence-mapping;
https://mtci.bvsalud.org/pt/mapas-de-evidencia-2/; https://www.unicef-irc.org/evidence-gap-maps; e
https://www.campbellcollaboration.org/evidence-gap-maps.html.
O valor da evidência para as políticas públicas advém de sua aplicabilidade ser passível de
O valor da evidência para as políticas públicas advém de sua aplicabilidade ser passível de
avaliação. Para isso, é necessário não apenas adotar uma perspectiva crítica sobre a
avaliação. Para isso, é necessário não apenas adotar uma perspectiva crítica sobre a
confiança a ser depositada nos achados desse tipo de estudo, mas, acima de tudo, uma
confiança a ser depositada nos achados desse tipo de estudo, mas, acima de tudo, uma
análise sistemática sobre o quanto esses têm sentido para o contexto político-social em
análise sistemática sobre o quanto esses têm sentido para o contexto político-social em
que uma nova política será formulada e implementada. Além disso, mecanismos e
que uma nova política será formulada e implementada. Além disso, mecanismos e
estratégias de tradução do conhecimento podem melhorar a disseminação dos resultados
estratégias de tradução do conhecimento podem melhorar a disseminação dos resultados
das AIPS e é essencial que se possa incluir esse tipo de estudo em sínteses de evidências
das AIPS e é essencial que se possa incluir esse tipo de estudo em sínteses de evidências
futuras que abordem as intervenções avaliadas.
futuras que abordem as intervenções avaliadas.
Por fim, é importante que as AIPS adotem uma perspectiva compreensiva sobre as
Por fim, é importante que as AIPS adotem uma perspectiva compreensiva sobre as
evidências, considerando-se a diversidade das questões de interesse envolvidas, as quais
evidências, considerando-se a diversidade das questões de interesse envolvidas, as quais
podem requerer diferentes abordagens metodológicas para serem respondidas e
podem requerer diferentes abordagens metodológicas para serem respondidas e
problematizadas. Também é importante se reconhecer que as AIPS integram o
problematizadas. Também é importante se reconhecer que as AIPS integram o
ecossistema de evidências como um dos tipos de evidência científica de alto valor para a
ecossistema de evidências como um dos tipos de evidência científica de alto valor para a
tomada de decisão, à medida que provê informações importantes sobre os efeitos de
tomada de decisão, à medida que provê informações importantes sobre os efeitos de
diferentes naturezas que uma política proporcionou em diferentes contextos de
diferentes naturezas que uma política proporcionou em diferentes contextos de
implementação.
implementação.
Esse processo de autocrítica e ampliação conceitual parece ter abrangido também as AIPS
em certa medida. Em vez de restringir-se a mensurar estatisticamente os efeitos de
determinada intervenção a posteriori, as AIPS passaram a avaliar os efeitos prováveis das
intervenções previstas nos programas e políticas de saúde. Para isso, pode-se usar variada
gama de ferramentas e métodos e incluírem-se as simulações computacionais.
Para uma crítica profunda ao conceito de causalidade, vide capítulo 7 desta coletânea (ALMEIDA-FILHO;
16
COUTINHO, 2022).
Para evitar que o policymaker caia em tais “armadilhas”, é preciso partir de uma visão mais
abrangente acerca das evidências. Com esse intuito, este capítulo propõe a ampliação do
conceito de evidências para subsidiar decisões em políticas de saúde, de tal forma que as
AIPS integrem coerentemente com essa visão ampla. As AIPS constituem-se de uma forma
(dentre outras) do ecossistema de evidências em políticas de saúde, o qual, por sua vez,
compõe-se, pelo menos, das oito formas citadas no Relatório da Comissão Global de
Evidências para Enfrentar Desafios Sociais (2022) mencionadas anteriormente e
mostradas na Figura 1. A ideia de um “ecossistema de evidências” é muito relevante aqui
e sugere que as AIPS são uma forma que deve conviver cooperativamente –
“simbioticamente”, se quisermos – com as outras formas de evidências.
A proposta deste capítulo, porém, não se limita à esfera conceitual, mas abarca também
um conjunto de normas para o uso de evidências. Faz sentido, assim, falar-se de um
sistema de governança para o uso de evidências em políticas de saúde. Esse sistema deve
constituir-se pelo menos das seguintes partes: i) um sistema de conceitos e princípios
(LEJANO, 2006; OXMAN, 2010; PARKHURST, 2017) (sistematicidade, transparência,
contextualidade, adequação, qualidade, rigor, administração, representação, deliberação,
contestabilidade); ii) instituições; iii) ferramentas (sistemas e plataformas, como uma
plataforma de tradução e intermediação do conhecimento); iv) atividades (sínteses,
disseminação e intercâmbio de conhecimentos). Refere-se aqui a medidas de alcance mais
amplo (além do meramente “organizacional”) e de caráter mais duradouro, que orientem o
uso das evidências para subsidiar as decisões em políticas de saúde. O princípio
fundamental desse sistema de governança é a conciliação entre o valor das boas práticas
científicas com o valor da representatividade democrática dos valores (necessidades,
interesses, preferências etc.) dos diversos atores sociais interessados.
Obviamente o presente capítulo não tem a intenção de fornecer soluções prontas para um
problema tão complexo e relativamente pouco estudado no Brasil. Não obstante, para
desenvolver o tema da boa governança no uso das evidências em políticas de saúde,
elenca-se a seguir uma série de tópicos prioritários para promover mais integração das
AIPS ao ecossistema de evidências relacionado com políticas de saúde. A lista abaixo foi
adaptada das “estratégias para apoiar o uso das melhores evidências”, apresentadas no
Relatório da Comissão Global de Evidências (2022).
Facilitar o acesso e uso das AIPS pelos tomadores de decisão e outros stakeholders
As evidências de AIPS precisam estar acessíveis aos seus usuários, por meio de
repositórios de evidências adaptados e focados nas necessidades dos tomadores
de decisão e outros stakeholders (por exemplo, organizar ou integrar-se a
continua
666 Ministério da Saúde
conclusão
ANDERMANN, A. et al. Evidence for health III: making evidence-informed decisions that
integrate values and context. Health Research Policy Systems, v. 14, n. 16, p. 1-8,
2016. Disponível em: https://health-policy-systems.biomedcentral.com/articles/10.1186/s
12961-016-0085-4. Acesso em: 20 out. 2022.
ARMSTRONG, R. et al. The role and theoretical evolution of knowledge translation and
exchange in public health. Journal of Public Health, v. 28, n. 4, p. 384-389, 2006.
Disponível em: https://academic.oup.com/jpubhealth/article/28/4/384/1622772. Acesso
em: 28 ago. 2022.
COOKSON, R. Evidence-based policy making in health care: what it is and what it isn't.
Journal Health Services Research and Policy, v. 10, n. 2, p. 118-121, 2005. DOI:
https://journals.sagepub.com/doi/10.1258/1355819053559083.
CRUZ, M.; ZIEGELHOFER, Z. Beyond the income effect: impacts of conditional cash
transfer programs on private investments in human capital. The World Bank -
Development Prospects Group Global Modeling and Analytics Team, 2014. 111p. (World
Bank Policy Research Working Paper, n. 6867). Disponível em:
http://documents.worldbank.org/curated/en/756371468020374714/pdf/WPS6867.pdf.
Acesso em: 28 ago. 2022.
LASSWELL, H. D. The policy orientation. In: LERNER, D.; LASSWELL, H. D. (eds.) The
science of public policy: evolution of policy sciences. Stanford: Stanford University
Press, 1951.
LAVIS, J. N. et al. Guidance for evidence-informed policies about health systems: linking
guidance development to policy development. PLoS Medicine, v. 9, n. 3, p. 1-7, 2012.
Disponível em: https://journals.plos.org/plosmedicine/article?id=10.1371/journal.Pmed.
1001186. Acesso em: 26 ago. 2022.
LEJANO, R. P. Frameworks for policy analysis: merging text and context. New York-
London: Routledge-Taylor & Francis Group, 2006.
LESTER, L. et al. Evaluation of the performance and achievements of the WHO Evidence-
informed Policy Network (EVIPNet) Europe. Health Research Policy Systems, v. 18, n.
109, p. 1-19, 2020. Disponível em: https://health-policy-systems.biomedcentral.com/
articles/ 10.1186/s12961-020-00612-x. Acesso em: 20 ago. 2022.
MACINKO, J.; LIMA COSTA, M. F. Access to, use of and satisfaction with health services
among adults enrolled in Brazil’s Family Health Strategy: evidence from the 2008 National
Household Survey. Tropical Medicine & International Health, v. 17, n. 1, p. 36-42, 2012.
Disponível em: https://onlinelibrary.wiley.com/doi/full/10.1111/j.1365-3156.2011.02866.x.
Acesso em: 20 ago. 2022.
MOAT, K. A. et al. Evidence briefs and deliberative dialogues: perceptions and intentions
to act on what was learnt. Bulletin of the World Health Organization, v. 92, p. 20-28,
2013. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3865546/pdf/
BLT.12.116806.pdf/. Acesso em: 20 ago. 2022.
OXMAN, A. D. et al. A framework for mandatory impact evaluation to ensure well informed
public policy decisions. The Lancet, v. 375, n. 9712, p. 427-431, Jan. 2010. Disponível
em: https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(09)61251-4/fulltext.
Acesso em: 20 ago. 2022.
PARKHURST, J. Prefácio: Improving evidence use in public policy. In: KOGA, N. M. et al.
Políticas públicas e usos de evidências no Brasil: conceitos, métodos, contextos e
práticas. Brasília, DF: IPEA, 2022. p. 13-27. Disponível em: http://repositorio.ipea.gov.br/
bitstream/11058/ 11121/1/Politicas_publicas_e_usos.pdf. Acesso em: 28 ago. 2022.
SEN, A. K. Desenvolvimento como liberdade. São Paulo: Companhia das Letras, 2000.
STEWART, R. et al. The evidence ecosystem in South Africa: growing resilience and
institutionalisation of evidence use. Palgrave Communications, v. 5, 90, p. 2019.
Disponível em: https://www.nature.com/articles/s41599-019-0303-0. Acesso em : 28 ago.
2022.
TOMA, T. S. et al. Síntese de evidências para políticas de saúde. In: TOMA, T. S. et al.
(orgs.). Avaliação de tecnologias de saúde e políticas informadas por evidências.
São Paulo: Instituto de Saúde, 2017. p. 183-208. (Temas Saúde Coletiva, 22) Disponível
em: https://www.arca.fiocruz.br/bitstream/icict/42957/2/avaliacao_tecnologia_saude
polticas_inf_evidencias.pdf. Acesso em: 28 ago. 2022.
WALLS, H. et al. The many meanings of evidence: a comparative analysis of the forms
and roles of evidence within three health policy processes in Cambodia. Health Research
Policy and Systems, v. 15, n. 1, p. 1-13, 2017. Disponível em: https://health-policy-
systems.biomedcentral.com/articles/10.1186/s12961-017-0260-2. Acesso em: 28 ago.
2022.
A tradução do conhecimento e a
avaliação de impacto de políticas e
programas de saúde
1
Instituto de Saúde Coletiva, Universidade Federal da Bahia
Coordenação Geral de Evidências em Saúde, Departamento de Ciência e Tecnologia, Secretaria
2
RESUMO:
Este capítulo discute o conceito, as potencialidades e os limites da tradução do conhecimento como
ferramenta para promover o uso de conhecimento científico no processo de formulação e implantação
de políticas de saúde. Destina-se, primordialmente, a gestores e pesquisadores envolvidos em projetos
de avaliação de impacto de políticas de saúde, considerando, portanto, as características próprias das
organizações de saúde. Buscando apoiar, concretamente, os interessados na disseminação e no uso de
evidências científicas por tomadores de decisão, o capítulo apresenta estratégias práticas inovadoras
para aplicação do conhecimento. Assim, espera-se que possa orientar gestores e pesquisadores na
reflexão sobre a tradução do conhecimento como possibilidade de fortalecer a racionalidade técnico-
científica das políticas de saúde, de acordo com o público e contexto de interesse.
PALAVRAS-CHAVE:
Tradução do conhecimento. Barreiras e facilitadores. Estratégias práticas em tradução do
conhecimento.
Essa importância fica visível na definição de gestão da saúde, adotada pela célebre
Assembleia Mundial da Saúde de 1978 (OMS, 1978), que aprovou a meta de “Saúde para
Todos no ano 2000”:
[...] processo integrado para a definição de políticas sanitárias, a formulação
de programas prioritários que permitam pôr em prática essas políticas, a
habilitação de créditos preferentes nos orçamentos da saúde para esses
programas prioritários, a execução desses programas por meio do sistema
sanitário geral, a vigilância, a fiscalização e a avaliação desses programas
de saúde e dos serviços e instituições que os executam, e o aporte de uma
base adequada de informação para o processo em geral e cada um de seus
elementos [...] (tradução livre).
Claramente, a Assembleia optou por uma conceituação ampla de gestão, que incorpora o
conceito de administração como conjunto de técnicas usadas para o funcionamento de uma
organização, inclusive o planejamento, o financiamento, a contabilidade, a direção de
pessoal, a análise de sistemas etc., mas ultrapassa a sua abrangência ao incluir o processo
de tomada de decisão política também como objeto da gestão.
Vale acrescentar que não são somente as organizações de saúde que possuem atributos
que dificultam a utilização do conhecimento científico. Curiosamente, as próprias
instituições de pesquisa adotam práticas que geram obstáculos a uma utilização ampla do
conhecimento que produzem. Com efeito, podem ser rapidamente elencados vários
aspectos das práticas científicas que interferem sobra a possibilidade de uso do
conhecimento.
Destaca-se aqui um modelo específico muito utilizado, cuja classificação das estratégias
de TC é feita por domínios ou categorias de ações (KT Actions) (WOLFENDEN et al., 2022),
a saber:
1. Envolver o usuário final – em cada fase do processo de produção da pesquisa
os usuários do conhecimento poderão ou deverão se engajar;
BRIEFING note: decisions, rationale and key findings summary. Health Evidence, 2009.
Disponível em: https://healthevidence.org/practice-tools.aspx#PT6. Acesso em: 10 jul.
2022.
CVITANOVIC, C. et al. Strategies for building and managing ‘trust’ to enable knowledge
exchange at the interface of environmental science and policy. Environmental Science &
Policy, v. 123, p. 179-189, 20221. Disponível em:
https://www.sciencedirect.com/science/article/pii/S1462901121001465. Acesso em: 24
out. 2022.
DAVIDSON, B. Storytelling and evidence-based policy: lessons from the grey literature.
Palgrave Communications, v. 3, n. 17093, p. 1-10, 2017. Disponível em:
https://www.nature.com/articles/palcomms201793. Acesso em: 24 out. 2022.
ELLEN, M. E. et al. Barriers, facilitators and views about next steps to implementing
supports for evidence-informed decision-making in health systems: a qualitative study.
Implement Science, v. 9, n. 179, p. 1-12, 2014.
GRIMSHAW, J. M. et al. Knowledge for knowledge translation: the role of the Cochrane
Collaboration. Journal Continuing Education Health Professions, v. 26, n. 1, p. 55-62,
2006. Disponível em: https://pubmed.ncbi.nlm.nih.gov/19270848/. Acesso em: 24 out.
2022.
LAVIS, J. N. et al. How can research organizations more effectively transfer research
knowledge to decision makers? Milbank Quarterly, v. 81, n. 2, p. 221-248, 2003.
Disponível em: https://onlinelibrary.wiley.com/doi/full/10.1111/1468-0009.t01-1-00052?sid
=nlm %3 Apubmed. Acesso em: 24 out. 2022.
MOORE, G.; TODD, A.; REDMAN, S. Strategies to increase the use of evidence from
research in population health policy and programs: a rapid review. Glebe: Sax
Institute, 2009. Disponível em: https://www.health.nsw.gov.au/research/Documents/10-
strategies-to-increase-research-use.pdf. Acesso em: 24 out. 2022.
SNILSTVEIT, B. et al. Evidence gap maps: a tool for promoting evidence-informed policy
and prioritizing future research. Washington, DC: World Bank, 2013. (Policy research
working paper; n° 6725). Disponível em:
https://openknowledge.worldbank.org/handle/10986/16941. Acesso em: 20 jul. 2022.
UNITED NATIONS. Climate action now: summary for policymakers 2018. Bonn, GE:
United Nations, Climate Change Secretariat, 2018.
Fabiana Mascarenhas1
Luciano Máximo2
1
Assessoria de Comunicação (Ascom) da Fundação Oswaldo Cruz - Brasília
2
Gerente de projetos de formação de talentos e geração de empregos no
mercado de tecnologia brasileiro do setor privado
RESUMO:
Este capítulo aborda o papel e a importância da comunicação de evidências científicas como
ferramenta essencial para subsidiar a tomada de decisão em saúde e, à luz da literatura sobre as áreas
da tradução do conhecimento e comunicação em saúde, propõe estratégias para tornar a comunicação
mais acessível, compreensível e útil aos diferentes atores sociais envolvidos no processo decisório.
Tais estratégias, que incluem conteúdo sobre como lidar com infodemia e desinformação, têm como
público de interesse, principalmente, aqueles que determinam as ações, programas e políticas de
saúde, os gestores/as das diferentes esferas governamentais brasileiras: municipal, estadual e federal.
Espera-se que esse trabalho possa colaborar para orientar as ações de comunicação realizadas por
diferentes grupos e instituições, sobretudo as envolvidas na gestão pública.
PALAVRAS-CHAVE:
Tomada de decisão em saúde. Comunicação em saúde. Tradução do conhecimento. Comunicação de
evidências.
Há, no entanto, estratégias que se podem adotar com o objetivo de tornar a comunicação
mais acessível, compreensível e útil para os diferentes atores sociais envolvidos no
processo decisório. Este artigo aborda essas estratégias, tendo como público de interesse,
principalmente, aqueles que determinam as ações, programas e políticas de saúde, os
gestores/as das esferas governamentais brasileiras: municipal, estadual e federal. Espera-
se que este trabalho possibilite contribuir para orientar as ações de comunicação efetuadas
por diferentes grupos e instituições, especialmente aquelas incluídas na gestão pública.
O país tem acumulado uma série de iniciativas com o objetivo de incentivar e promover o
uso de evidências científicas na gestão público-governamental. Entre as principais estão o
desenvolvimento da Rede de Políticas Informadas por Evidências (Rede EvipNet) (DIAS;
Na tentativa de minimizar esse problema, Dias et al. (2015), Brasil (2015) apontam quatro
estratégias principais para estimular o uso de evidências científicas por tomadores de
decisão em saúde: (1) produzir e disseminar sínteses de evidência com linguagem
adaptada a diferentes públicos; (2) usar plataforma virtual on-line para disseminação do
conhecimento científico; (3) utilizar o jornalismo e outras formas de comunicação social
para ampliar a disseminação do conhecimento científico; e (4) promover a interação entre
pesquisadores e tomadores de decisão.
Os resultados de um estudo mais recente não foram muito diferentes. O trabalho investigou
tipos e condicionantes de usos de evidências por servidores de órgãos federais brasileiros
e identificou experiências de políticas públicas baseadas em evidências em áreas
específicas (KOGA et al., 2020). Como parte desse projeto desenvolveu-se um policy brief
Brasil (2021), o qual buscou analisar a visão dos servidores públicos federais sobre o uso
e não uso de evidências científicas nas políticas públicas.
O estudo revelou, entre outros resultados, que as fontes científicas estão entre as menos
utilizadas por esse público para acessar evidências: 54% desses servidores afirmam que
nunca ou raramente fazem uso de relatórios de pesquisas científicas e 72% afirmaram que
Os contextos mundial e nacional revelam que tão importante quanto incentivar e promover
o uso de evidências científicas na tomada de decisão é pensar em como comunicar o
conhecimento científico e os resultados das pesquisas aos gestores/as de saúde
(SANTANA; MENDONÇA; SOUSA, 2022). Para isso, é fundamental desenvolver
estratégias adaptadas a diferentes contextos institucionais e sociais e considerar a
comunicação como parte essencial de um processo que envolve desde a produção até a
implementação da evidência (BARRETO; SOUZA, 2013; BRASIL, 2015; FERRAZ;
PEREIRA; PEREIRA, 2019; DIAS et al., 2015; CANADIAN, 2012).
Isso significa não haver garantia de que, uma vez que o conhecimento tenha sido
comunicado ou transferido, será implementado posteriormente. Mas para que esse
processo ocorra de forma efetiva é preciso praticar uma comunicação integrada e
institucionalizada na estrutura do governo em questão, o que envolve a elaboração de
Outro ponto fundamental diz respeito ao uso das evidências científicas como fator
determinante à tomada de decisão em saúde. As evidências científicas são fontes de
informação importantes utilizadas para apoiar as ações e decisões na área da saúde, mas,
conforme afirmam Oxman e colaboradores, não são por si mesmas soluções (OXMAN et
al., 2009). Portanto, não se pode afirmar que o uso de evidências produz necessariamente
melhores decisões, Lomas (1997) embora sejam alicerces fundamentais para subsidiar
decisões em saúde (LOMAS, 1997; MARTINEZ-SILVEIRA, 2015).
Atualmente, existem diferentes modelos propostos por Andrade (2019), Bezerra et al.
(2019) para representar os componentes ou cada uma das etapas necessárias à tradução
do conhecimento, apontada como uma das principais ferramentas para tentar reduzir a
histórica lacuna existente entre o conhecimento científico gerado no campo da saúde e a
utilização desse conhecimento na prática pelos diferentes públicos.
Para Bueno (1985; 2010), no entanto, o conceito de difusão tem limites bastante amplos e,
nesse sentido, incorpora a divulgação científica, a disseminação científica e o jornalismo
científico, considerando-os como suas espécies. O autor emprega o termo difusão para se
referir a todo e qualquer recurso utilizado para a veiculação de informações científicas e
tecnológicas.
Esses mecanismos passivos são importantes, mas, muitas vezes, não levam a
mudanças comportamentais ou que possam influenciar no desenvolvimento de
ações efetivas, uma vez que se concentram na disseminação de evidências sem
fazer conexão sobre como as evidências podem ser aplicadas pelos usuários do
conhecimento em diferentes contextos. Por isso, é fundamental adaptar as possíveis
intervenções ao contexto sociocultural no qual o público de interesse está inserido e
isso inclui orientar – na prática – de que forma as evidências encontradas podem ser
utilizadas.
4 Iniciativas e exemplos
O Veredas iniciou suas atividades em 2016 – com o objetivo de construir pontes entre
gestão pública, academia e sociedade civil – e apresentou alternativas que geram mais
acesso ao conhecimento técnico e científico na execução de políticas públicas. A instituição
atua na área da tradução do conhecimento e das políticas informadas por evidências (PIE)
e apoia intervenções sociais. Tem como missão construir pontes para que políticas e
intervenções sociais sejam mais efetivas e colaborativas e garantir os direitos da população
brasileira.
Abaixo estão alguns exemplos de produtos elaborados pelo Instituto Veredas, em parceria
com diferentes instituições, como a Fundação Oswaldo Cruz (Fiocruz). As publicações e os
Assim como as sínteses, os mapas de evidências também têm sido utilizados como uma
importante ferramenta de tradução do conhecimento para subsidiar gestores de saúde na
tomada de decisão. Esse método busca sintetizar, identificar, descrever e caracterizar
graficamente a evidência científica que existe para determinada temática e mapear
possíveis lacunas de conhecimento (BIREME, 2020).
Fonte: 3ie.
Dentro desse contexto, cabe destacar ainda o trabalho realizado pela organização
Cochrane, rede global independente formada por pesquisadores, pacientes, cuidadores e
pessoas interessadas em saúde. A organização atua em mais de 130 países e conta com
o trabalho de voluntários dedicados a realizarem sistemas de tomada de decisão com a
metodologia Cochrane para apresentação da melhor evidência científica em todo o mundo.
Como se pôde notar, o problema da infodemia e fake news é hercúleo e não existe bala de
prata para resolvê-lo. A busca por soluções passa não por um, mas por toda uma cadeia
de atores do ciclo das políticas públicas, que devem agir de forma coordenada e
Com o objetivo de estabelecer um canal aberto e direto com a população para ajudar a
desmentir notícias falsas, o Ministério da Saúde lançou, em agosto de 2018, um serviço de
combate às fake news. As dúvidas são encaminhadas por meio do aplicativo WhatsApp e
esclarecidas pelas áreas técnicas da pasta. Em seu primeiro ano de funcionamento, a conta
recebeu mais de 10 mil mensagens para verificação (PRUDENTE; OLIVEIRA-COSTA,
2020).
6 Considerações finais
Nesse sentido, a comunicação pode ser uma ferramenta estratégica essencial para
subsidiar gestores/as de saúde. Para isso, no entanto, é preciso pensá-la não como uma
atividade isolada, mas como uma ação estruturante e integrada ao processo que envolve
desde a geração até a implementação da evidência.
BARTLETT, G.; GAGNON, J. Physicians and knowledge translation of statistics: Mind the
gap. CMAJ: Canadian Medical Association Journal, v. 188, n. 1, p. 11–12 2016.
Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4695343. Acesso em: 23
out. 2022.
FIELD, B. et al. Using the knowledge to action framework in practice: a citation analysis
and systematic review. Implementation Science, v. 9, n. 172, p. 1-14, 2014. Disponível
em: https://implementationscience.biomedcentral.com/articles/10.1186/s13012-014-0172-
2. Acesso em: 23 out. 2022.
GALVAO, M. C. et al. The clinical relevance of information index (CRII): Assessing the
relevance of health information to the clinical practice. Health Information and Libraries
Journal, v. 30, n. 2, p. 110-120, 2013.
KOGA, N. M. et al. O que informa as políticas públicas: survey sobre o uso e o não uso
de evidências pela burocracia federal brasileira. Brasília, DF: Instituto de Pesquisa
Econômica Aplicada - IPEA, 2020. (Texto para Discussão, n° 2619). Disponível em:
http://repositorio.ipea.gov.br/bitstream/11058/10376/1/td_2619.pdf. Acesso em: 23 out.
2022.
LAVIS, J. N. et al. Knowledge transfer study group. How can research organizations more
effectively transfer research knowledge to decision makers? Milbank Quarterly, v. 81, n.
2, p. 221-248, 2003. Disponível em: https://pubmed.ncbi.nlm.nih.gov/12841049/ Acesso
em: 23 out. 2022.
NATIONAL CENTER FOR HEALTH STATISTICS. Healthy People 2010: final review.
Hyattsville, 2012. (PHS Publication no. 2012-1038). Disponível em: https://www.cdc.gov/nchs
/data/hpdata2010/hp2010_final_review.pdf. Acesso em: 23 out. 2022.
PAN AMERICAN HEALTH ORGANIZATION - PAHO. Health agenda for the Américas
2008 - 2017. Washington, DC: PAHO, 2007. 25p. (Presented by the Ministers of Health of
the Americas in Panama City, June 2007). Disponível em:
https://www1.paho.org/hq/dmdocuments/2009/Health_Agenda_for_the_Americas_2008-
2017.pdf. Acesso em: 23 out. 2022.
PEARSON, A.; WEEKS, S.; STERN, C. Translation science and the JBI model of
evidence-based healthcare. Australia: Lippincott Williams & Wilkins, 2011. (Synthesis
Science in Healthcare Series: Book 1) Disponível em: https://nursing.lsuhsc.edu/JBI/docs/
JBIBooks/JBI_Model.pdf. Acesso em: 23 out. 2022.
PRUDENTE, L.; OLIVEIRA-COSTA, M. Ponto de vista: o desafio das fake news para os
gestores de políticas públicas. Nexo Políticas Públicas, dez. 2020. Disponível em:
https://pp.nexojornal.com.br/ponto-de-vista/2020/O-desafio-das-fake-news-para-os-
gestores-de-pol%C3%ADticas-p%C3%BAblicas. Acesso em: 23 out. 2022.
SÃO PAULO. Governo do Estado. SP contra o novo coronavírus - sem fake news.
2020. Disponível em: https://www.saopaulo.sp.gov.br/coronavirus/sem-fake-news/.
Acesso em: 23 out. 2022.
SCHIAVO, R. Health communication: from theory to practice. Nova Jersey: John Wiley
& Sons, 2007.
WOLTON, D. Informar não é comunicar. Porto Alegre: Sulina, 2010. Disponivel em:
http://imprensasindical.org.br/wp-content/uploads/2019/03/88202667-Informar-nao-
comunicar.pdf. Acesso em: 23 out. 2022.