Mais Que Boas Intenções: Técnicas Quantitativas e Qualitativas Na Avaliação de Impacto de Políticas Públicas

MAIS QUE BOAS INTENÇÕES
Técnicas quantitativas e qualitativas na avaliação de

impacto de políticas públicas*
Mariana Batista
Universidade Federal de Pernambuco (UFPE), Recife – PE, Brasil. E-mail: mariana.bsilva@gmail.com
Amanda Domingos
Universidade Federal de Pernambuco (UFPE), Recife – PE, Brasil. E-mail: ardlima4@gmail.com
DOI: 10.17666/329414/2017
Médicos usam evidências quando prescrevem raciocínio por trás do que ficou conhecido como
tratamentos. Formuladores de políticas “políticas baseadas em evidências” (evidence-based
deveriam usar também.1
policy-making) (Gertler et al., 2011).
The Economist
Num contexto de limitação da capacidade de
intervenção do Estado, tanto por razões orçamen-
tárias quanto por razões relacionadas com os custos
Introdução
de mobilização de informação e tomada de decisão,
torna-se importante estabelecer critérios que orien-
Formular políticas públicas é uma constante
tem as escolhas de políticas públicas. Contudo, es-
da atividade governamental. Contudo, o conteú-
ses parâmetros podem ser muitos. Adotando uma
do dessas políticas pode variar bastante. Quando
perspectiva racionalista do processo de formulação
escolhas devem ser feitas, decisões tomadas e áreas
de políticas, uma das formas de realizar tais esco-
priorizadas, o foco passa a ser a base do julgamento
lhas é por meio de resultados de avaliação.2 Para essa
sobre quais políticas devem ser formuladas e quais
perspectiva o processo das políticas públicas pode ser
devem ser interrompidas ou reformuladas. Esse é o
visto como um ciclo, organizado em estágios com-
* O título desse artigo é inspirado no livro de Kaplan e postos pela formação da agenda, formulação da po-
Appel (2011), More than good intentions: how a new lítica, tomada de decisão, implementação e avaliação
economics is helping to solve global poverty.
(Anderson, 1974).3 Esse último estágio é considera-
Artigo recebido em 12/07/2016 do o momento de renovação do ciclo. Com base nos
Aprovado em 23/01/2017 resultados da avaliação das políticas, subsídios são
RBCS Vol. 32 n° 94 junho/2017: e329414
2 REVISTA BRASILEIRA DE CIÊNCIAS SOCIAIS - VOL. 32 N° 94
identificados para justificar a manutenção, reformu- nicas que se aproximam desse ideal experimental
lação ou até interrupção das políticas. como o pareamento, o modelo de diferença-em-
A avaliação pode ser de vários tipos e classifica- -diferença e a regressão descontínua. Todas essas
da de várias formas diferentes. Quanto ao tempo, técnicas se preocupam em “isolar” o efeito causal
a avaliação pode ser ex-ante ou ex-post. Quanto a do programa, lidando com problemas de viés de se-
quem avalia, a avaliação pode ser feita internamen- leção. Para a abordagem qualitativa apresentamos
te, pelos próprios gestores do programa, externa- o uso de técnicas etnográficas, entrevistas em pro-
mente, por avaliadores independentes, ou partici- fundidade e grupos focais como formas de captar
pante, contando com o input dos beneficiários do a perspectiva dos atores na avaliação de políticas,
programa. Quanto ao objeto, a avaliação pode ser preocupando-nos com relatos e experiências que
concentrada nos processos da política, nos resulta- remetam à qualificação do impacto.
dos, nos impactos ou ainda na eficiência (Cohen e Longe de estabelecer uma divisão entre abor-
Franco, 2013; Rossi, Lipsey e Freeman, 2004). dagens quantitativas e qualitativas na avaliação
O foco do presente trabalho está na avaliação de políticas públicas, este artigo busca mostrar as
de impacto. Especificamente, nas diferentes técnicas possibilidades e as limitações de cada técnica, ar-
que podem ser mobilizadas para responder às ques- gumentando a favor da abordagem multimétodo
tões da avaliação. Isto é, o problema foi resolvido? como forma de estabelecer avaliações mais comple-
O programa funcionou? Tais questões, no entanto, tas. O pressuposto é o de que diferentes técnicas
requerem sofisticação metodológica. Isso porque li- respondem a diferentes questões, mas em conjunto
dam com problemas diversos, desde a identificação buscam o mesmo objetivo, que é a formulação de
ou o estabelecimento da relação de causalidade entre políticas baseada em evidências.
a política pública e o resultado social de interesse, Para atingir os objetivos estabelecidos, este ar-
passando por dificuldades de mensuração de efeitos tigo está organizado da seguinte forma: a próxima
importantes –, como empoderamento e capital so- seção apresenta os fundamentos da avaliação de im-
cial –, até às diferenças entre os efeitos quantitativos pacto. Em seguida discutimos a abordagem quanti-
dos programas e a percepção dos beneficiários sobre tativa de avaliação, com foco no experimento con-
como foram afetados pela política. trolado como “padrão de ouro” e as técnicas quase
Para oferecer uma visão pluralista, mas não exaus- experimentais. Na terceira seção apresentamos as
tiva, das técnicas disponíveis para avaliar o impacto abordagens de qualificação do impacto das políticas,
das políticas públicas, o presente artigo discute abor- com foco em técnicas de observação, entrevista em
dagens quantitativas e qualitativas através da apresen- profundidade e grupos focais. Na quarta, discutimos
tação das técnicas e da exposição de resultados exem- as possibilidades de combinação de métodos na ava-
plares de avaliação de políticas utilizando cada uma liação de políticas. Por fim, a conclusão. Esperamos
das abordagens. Argumentamos que a avaliação de que esta discussão contribua para a leitura crítica de
impacto de políticas públicas envolve duas perspec- resultados de avaliação e também para a utilização
tivas ou objetivos diferentes. A primeira busca quan- das referidas técnicas em novos esforços avaliativos.
tificar o impacto das políticas e identificar de forma
precisa a mudança nos indicadores de resultado, esta-
belecendo o programa como causa da mudança ob- Fundamentos da avaliação de impacto
servada. A segunda parte da perspectiva dos atores en-
volvidos, beneficiários e implementadores da política, Políticas públicas existem para alterar condi-
buscando compreender o efeito das políticas sobre os ções vigentes na sociedade classificadas como ne-
indivíduos a partir da sua própria percepção. A abor- gativas. Espera-se que intervenções governamentais
dagem quantitativa identifica o impacto e a aborda- apresentem resultados, e para identificar se esses re-
gem qualitativa explica como e por quê. sultados de fato ocorreram é preciso se voltar para a
Na abordagem quantitativa discutimos avalia- avaliação. A avaliação é considerada o último está-
ções com base em experimentos controlados e téc- gio no ciclo de políticas públicas. Uma vez que um
MAIS QUE BOAS INTENÇÕES 3
problema social é identificado, uma política públi- ocupa-se com a identificação da relação causal entre o
ca é formulada e aprovada nas instituições políticas programa e o resultado na população. Em suma, a
e, após a devida implementação do programa, che- avaliação de impacto tem por base uma relação de
ga o momento de identificar os resultados de fato causalidade entre política pública e o resultado de in-
do programa (Anderson, 1974). teresse. “Colocando de forma simples, uma avalia-
A avaliação de impacto é um tipo complexo de ção de impacto acessa as mudanças no bem-estar dos
avaliação, que se diferencia de outros tipo como o indivíduos que podem ser atribuídas a um projeto,
monitoramento da implementação e a avaliação de programa ou política em particular” (Gertler et al.,
resultados, podendo ser considerada um estágio fi- 2011, p. 4).4
nal do processo avaliativo. De acordo com Rossi, O raciocínio por trás da avaliação de impacto é
Lipsey e Freeman (2004), a avaliação de processos o de que a própria política pública pode ser expres-
observa as atividades do programa que de fato foram sa por meio de uma cadeia causal de ações inter-
concretizadas e os serviços que foram entregues ao -relacionadas que buscam atingir o público-alvo e
público-alvo, com foco na cobertura do programa e assim gerar resultados. Dessa forma, para formular
vieses na entrega. A avaliação de resultados é o acom- a pergunta da avaliação corretamente é preciso es-
panhamento da mudança na situação (outcome) do pecificar quais resultados o programa busca alcan-
público-alvo que o programa busca afetar. O foco çar e através de quais canais/ações. Essa especifica-
dela são as características da população e não as do ção é conhecida como a “teoria da mudança” de um
programa, como na avaliação de implementação, e programa ou, simplesmente, “teoria do programa”.
normalmente são observadas através de metas pré-es- Segundo Gertler et al. (2011), “teoria da mudança
tabelecidas. A avaliação de impacto, por sua vez, pre- é uma descrição de como se espera que uma inter-
Figura 1
Cadeia de Resultados
Insumos Atividades Produtos Resultados Resultados Finais
Recursos fiscais, Ações tomadas ou Produtos resultantes Utilização dos Objetivos finais do
humanos e de trabalhos realizados da conversão produtos pelo programa
outros tipos para transformar de insumos em público alvo -
mobilizados para insumos em resultados tangíveis Metas de longo
apoiar as atividades produtos específicos prazo
Orçamento, Séries de atividades Bens e serviços Não totalmente Mudanças

equipes e empreendido para produzidos e sob o controle nos resultados
outros recursos produzir bens e entregues sob o da agência com múltiplos
disponíveis serviços controle da agência implementadora condutores
implementadora
IMPLEMENTAÇÃO (o lado da oferta) RESULTADOS (Demanda+oferta)
Adaptado de Gertler et al. (2011).

venção entregue os resultados desejados. Descreve a va que busca, através do desenho de pesquisa ou
lógica causal de como e por que um projeto, pro- de modelos estatísticos, estimar o que aconteceria
grama ou política vai alcançar os resultados preten- se o programa não existisse. Essa é uma das razões
didos” (Idem, p. 22). que fazem a maioria dos trabalhos sobre avaliação
A teoria da mudança pode ser modelada como de impacto de políticas públicas ser exclusivamente
uma cadeia de resultados, de forma a especificar os quantitativo (Adato, 2008).
insumos, atividades, produtos, resultados e resul- Contudo, para além da identificação do efei-
tados finais. A Figura 1 apresenta os elementos de to médio programa, é possível pensar a avaliação
uma cadeia de resultados. Nela pode-se notar que de impacto também a fim de entender ou explicar
o que é aprovado pelas instituições políticas como o porquê desse impacto sob o ponto de vista dos
a política pública deve primeiro ser traduzido em atores envolvidos. Essa abordagem busca de alguma
insumos – recursos financeiros e não financeiros, forma qualificar o impacto, concentrando-se nas
como pessoal – para em seguida ser concretizada pessoas. Segundo Patton (2002), os avaliadores
em atividades – ações que transformam recursos
em produtos a serem entregues ao público-alvo. Devem estar interessados nas histórias, experiên-
Esses produtos podem ser identificados como a cias e percepções dos participantes dos progra-
concretização da política pública na perspectiva do mas para além de saber simplesmente quantos
público-alvo. Trata-se, até aqui, de elementos que entraram no programa, quantos o completaram
representam o lado da implementação da política e e quantos fizeram o quê depois. Achados quali-
estão sob direto controle da agência implementado- tativos na avaliação iluminam as pessoas por trás
ra. Uma vez que os produtos começam a interagir dos números e colocam rostos nas estatísticas,
com o contexto e idiossincrasias dos beneficiários, nâo para apelas aos corações, apesar de isso po-
eles passam a produzir os resultados intermediários der acontecer, mas para aprofundar o entendi-
e os resultados finais, que correspondem aos objeti- mento (Idem, p. 10).
vos finais do programa.
O ponto-chave da avaliação de impacto é que Essa perspectiva, apesar de ser minoritária na
ela busca identificar se o programa atingiu os seus avaliação de impacto, vem ganhando força por di-
objetivos finais, sendo que estes são a interação en- versas razões, seja por contribuir para a avaliação
tre as ações do programa e o contexto social e as quantitativa numa espécie de triangulação, seja
particularidades dos beneficiários, de forma que por avaliar efeitos do programa sobre indicadores
não está sob direto controle da agência implemen- de difícil mensuração quantitativa, seja ainda por
tadora.5 Ou seja, a avaliação de impacto busca iso- ajudar a entender por que em algumas situações o
lar o efeito do programa sobre a mudança no re- programa não funciona como deveria ou como
sultado de interesse, excluindo variações causadas o programa interage e afeta a cultura local, produzin-
por outros fatores, como, por exemplo, flutuações do resultados heterogêneos.
das condições socioeconômicas ou de variação das A avaliação de impacto é um dos momentos
características dos beneficiários. mais críticos do ciclo de políticas públicas por se
Essa preocupação com a identificação de rela- referir às mudanças de fato observadas e sentidas
ções de causa e efeito fazem da avaliação de impac- pela população. Por essa razão se torna uma ativi-
to uma atividade metodologicamente desafiadora. dade que envolve grandes desafios. Segundo Rossi,
Afirmar que o resultado final observado deve-se ao Lipsey e Freeman (2004), a avaliação “é um função
programa é afirmar implicitamente que se o pro- que os avaliadores devem desempenhar com gran-
grama não tivesse sido implementado o resultado de cuidado para assegurar que os achados sejam
não seria observado. Para isso seria necessário o válidos e devidamente interpretados. Pelas mesmas
chamado contrafactual. Esse foco no contrafactu- razões, é uma das tarefas mais difíceis desempenha-
al na avaliação de impacto de políticas públicas fez das pelos avaliadores e, frequentemente, carregadas
surgir um forte programa de pesquisa quantitati- politicamente (Idem, p. 204).
Nas próximas seções alguns desses desafios se- sido implementada. Seriam “falsos contrafactuais”
rão abordados, apresentando-se sistematicamente (counterfeit counterfactuals) porque oferecem uma
as principais técnicas utilizadas para quantificar estimativa do impacto da política pública contami-
o impacto de políticas públicas ou para explicar o nada por outros fatores (Gertler et al., 2011).
porquê desses efeitos, concluindo com a perspecti- No primeiro caso, da comparação entre os tra-
va de integração de métodos como a possibilidade balhadores que receberam e os que não receberam
mais completa para a avaliação de intervenções go- o treinamento, a origem da “contaminação” seria o
vernamentais. problema de viés de seleção. Isto é, por que alguns
trabalhadores receberam o treinamento e outros
não receberam? Existe alguma característica siste-
Técnicas quantitativas: quantificando mática que diferencie esses dois grupos? No exem-
o impacto plo, poderíamos pensar em características dos
próprios indivíduos que fariam com que alguns
Suponha uma política que busca aumentar a procurassem participar do programa e outros não.
renda de trabalhadores através de programas de Isso faria com que a diferença na renda entre os
treinamento. A avaliação de impacto teria como dois grupos fosse gerada não só pelo treinamento,
objetivo identificar em quanto a renda dos traba- mas também por essas características pessoais que
lhadores foi aumentada por causa da sua partici- fizeram com que os participantes procurassem a
pação no programa. Para avaliar esse impacto seria política. Dessa forma, a simples comparação entre
necessário observar variação. Isto é, para afirmar beneficiários e não beneficiários da política geraria
que a mudança observada foi causada pela política uma estimativa equivocada porque não é capaz de
seria preciso observar o que aconteceria com a ren- isolar o efeito da política de outros fatores.
da dos trabalhadores caso a política não existisse. No segundo, o da comparação da renda dos
Esse é o chamado contrafactual. trabalhadores antes e depois do treinamento, a esti-
De modo intuitivo é possível pensar em dois mativa seria “contaminada” por alguma outra coisa
tipos de comparação para avaliar o impacto de uma que varie no tempo. Por exemplo, a renda dos traba-
política pública (Gertler et al., 2011). A primeira lhadores pode ter aumentado depois do treinamento
é a comparação entre os indivíduos que receberam simplesmente porque a localidade está passando por
a política e os indivíduos que não receberam. No crescimento econômico e a renda em geral está au-
exemplo, compararíamos trabalhadores que fize- mentando. Aqui a mudança na renda seria resultado
ram o treinamento com trabalhadores que não o do treinamento e do desenvolvimento econômico.
fizeram. A diferença de renda observada entre esses O contrafactual representa o que aconteceria
dois grupos depois da implementação da política com esses mesmos trabalhadores que participaram
seria considerado seu impacto. A segunda compara- do treinamento caso eles não tivessem participado.
ção é entre os mesmos indivíduos antes e depois da Isso quer dizer que estaríamos comparando indiví-
política. Isto é, comparar a renda dos trabalha- duos com exatamente as mesmas características e no
dores antes e depois de participarem do programa mesmo contexto socioeconômico. “Para estimar o
de treinamento. impacto de um programa, nós precisamos examinar
Essas dois desenhos mostram-se intuitivos, como as pessoas que participaram do programa se
mas são considerados equivocados pela literatu- sairiam comparadas com como elas se sairiam se elas
ra de avaliação de impacto (Khandker, Koolwal não tivessem participado do programa” (Glenners-
e Samad, 2010; Gertler et al., 2011; Glennester e ter e Takavarasha, 2013, p. 24). A Figura 2 mostra a
Takavarasha, 2013). Isso porque nem o grupo de comparação entre esses dois grupos.
trabalhadores que não recebeu o treinamento nem A comparação ideal para a identificação do
o dos trabalhadores antes do programa de treina- efeito causal seria entre o grupo que recebeu a po-
mento oferecem o contrafactual, isto é, a estima- lítica e esse mesmo grupo sem ter recebido a polí-
tiva do que aconteceria caso a política não tivesse tica. Contudo, essa situação é claramente inviável.
Figura 2
Identificação do Impacto: O Contrafactual
2.000
1.500
Salário
1.000 Impacto
500
Contrafactual
100
Antes Programa Depois
Elaboração própria.
Porém, há diferentes formas de se aproximar desse A aleatorização na construção dos grupos de

ideal hipotético, e um forte programa de pesquisa tratamento e controle garante que o único fator
quantitativa foi desenvolvido para lidar com esse a distinguir os dois grupos é justamente o recebi-
problema. Apresentamos a seguir o experimento mento ou não da política pública. Dessa forma,
controlado e as abordagens quase-experimentais é possível isolar o efeito do programa, excluindo
que de uma forma ou de outra estabelecem um outros fatores que possam influenciar o resultado
grupo de comparação para estimar o efeito causal de interesse e que se confundam com o programa.
das políticas públicas. Dado que os grupos são equivalentes, o efeito do
programa seria justamente a diferença entre os dois
Experimentos controlados: randomização como o grupos em termos do resultado de interesse.
“padrão de ouro” No experimento controlado, o desenho da ava-
liação é estabelecido já no momento da formulação
No chamado “padrão de ouro” da avaliação da política, uma vez que para a avaliação alcançar
de políticas, a forma de estabelecer o contrafactual os resultados desejados é necessário ter informações
seria através do desenho de pesquisa experimen- sobre as características dos grupos antes da políti-
tal. Dessa forma, os participantes são distribuídos ca (baseline) e também que a distribuição entre os
aleatoriamente em dois grupos. Um dos grupos grupos seja aleatória, isto é, não obedeça nenhum
recebe o tratamento (grupo de tratamento), neste outro critério sistemático. Isso porque se o rece-
caso a política pública, e o outro grupo (de con- bimento do benefício for associado a uma outra
trole) não recebe. A aleatorização estabelece que os característica sistemática, a diferença observada de-
participantes tenham a mesma probabilidade de pois da intervenção foi causada pela política e por
alocação em qualquer um dos dois grupos e que essa característica anterior ao programa. Em suma,
tenham também as mesas características na média. se a alocação entre os grupos for aleatória e não se
Os grupos são então equivalentes, significando que observar diferença sistemática entre os grupos, a di-
não existem diferenças sistemáticas que possam es- ferença observada entre os grupos depois da políti-
tar correlacionadas com o programa. ca pode ser atribuída ao programa.
Figura 3
Avaliando o Impacto por Meio do Experimento Controlado
2.000
1.500 Tratamento
Impacto = T - C
Salário
1.000 Controle
500
100
Antes Programa Depois
Em termos de técnica estatística, a análise pode tipo II (falso negativo, não rejeitar a hipótese nula
ser simplesmente a diferença de média entre o gru- quando deveria). No primeiro caso o avaliador afir-
po de tratamento e de controle. Pode-se realizar um maria que o programa tem efeito quando na verda-
teste de diferença de média ou uma regressão na de esse efeito é nulo. No segundo caso o avaliador
qual a variável dependente é o resultado de interes- afirmaria que o programa não tem efeito quando
se e a variável independente uma variável binária na verdade tem. Note-se a implicação normativa
que assume valor 0 para o grupo de controle e valor e responsabilidade do avaliador, já que o resultado
1 para o grupo de intervenção. Claro que em expe- da avaliação diretamente recomenda a manutenção da
rimentos no campo vários problemas tornam a in- política ou sua interrupção. Nesse caso, deve-se
terpretação dos resultados mais complicada, como considerar a importância da power analysis,(análise
compliance, attrition e spillovers. Problemas de com- de poder) a qual permite definir o tamanho da
pliance existem quando uma parcela dos indivíduos amostra requerido para detectar um efeito de de-
a quem são oferecidos o programa não o utilizam e/ terminada magnitude com um nível de confiança
ou quando indivíduos no grupo de controle rece- especificado. Dessa forma, não somente o desenho,
bem o benefício mesmo não tendo sido oferecidos. mas também o cálculo específico do tamanho da
Attrition surge quando indivíduos “saem” do grupo amostra necessário são fundamentais para uma aná-
de tratamento. Já problemas de spillovers são obser- lise experimental bem-sucedida (Gerber e Green,
vados quando o tratamento “transborda” também 2012; Glennerster e Takavarasha, 2013).
para o grupo de controle. Esses problemas fazem Pode parecer difícil pensar a avaliação de polí-
com que a comparação entre grupo de tratamento ticas públicas com base na distribuição aleatória de
e grupo de controle seja dificultada, mas não im- benefícios sociais. A randomização pode parecer ar-
possibilitada (Khandker, Koolwal e Samad, 2010). bitrária ou antiética. Contudo, alguns governos vêm
Outra preocupação central é que a amostra superando essa resistência inicial ao usar a aleatori-
seja grande o suficiente não só para evitar o erro do zação como critério mais justo na alocação de bene-
tipo I (falso positivo, rejeitar a hipótese nula quan- fícios quando esses são limitados. “Uma das regras
do não deveria), mas também para evitar o erro do mais justas e transparentes na alocação de recuros
escassos para populações igualmente merecedoras liação tem de existir no momento da formulação da
acaba por ser dar a todos aqueles que são elegíveis política, antes da sua implementação. Isso porque a
igual oportunidade de participar no programa. Uma estratégia de inferência sobre o impacto da política
forma de fazer isso é simplesmente conduzir uma lo- se dá com base no desenho (aleatorização) e não em
teria” (Gertler et al., 2011, p. 49). modelos estatísticos. Dessa forma, quando a polí-
Utilizando esse princípio, uma das principais tica pública já foi implementada e sua distribuição
formas de implementar uma avaliação com de- já foi realizada (de forma não aleatória), a avaliação
senho experimental é a implementação em fases por meio do experimento controlado logicamente
(phased-in implementation), na qual os indivíduos não é mais possível. A próxima seção discute técni-
elegíveis são divididos em grupos (normalmente cas estatísticas criadas para lidar com essa situação.
geográficos), os quais recebem o tratamento numa
ordem aleatória. Assim, a aleatorização entre grupo O que fazer quando o experimento não é possível?
de tratamento e de controle é garantida e todos os
elegíveis receberão a política no final do processo. Quando o experimento não é possível ou a po-
Um dos principais experimentos na área de lítica já foi implementada não há a separação ex-ante
avaliação de políticas públicas foi desenvolvido por entre grupo de tratamento e de controle e, por isso,
Miguel e Kremer (2004), que avaliaram o Primary a identificação do efeito causal da política se torna
School Deworming Project (PSDP) no Quênia. O mais difícil. Quando o que está disponível para o
experimento consistiu em randomizar o tratamento analista são dados observacionais, é possível trabalhar
contra parasitas em 75 escolas, dividindo-as em três com técnicas estatísticas quase-experimentais para
grupos de 25. A intervenção aconteceu durante os “emular” um grupo de controle ou o contrafactual.
anos de 1998 a 2001. No primeiro ano, o Grupo Discutiremos três das principais técnicas estatísticas
1 recebeu a intervenção fazendo com que os outros usadas para estabelecer um grupo de controle a par-
dois fossem grupos de controle. Em 1999 o Grupo tir de dados observacionais: pareamento, diferença-
2 recebeu a intervenção, transformando-se em tra- -em-diferença e regressão descontínua.6
tamento, e o Grupo III, em controle. Por último,
o Grupo III recebeu o tratamento. Os resultados Pareamento
apontaram que as crianças que participaram da polí- Uma dessas técnicas é o pareamento (matching),
tica de desparasitação tiveram melhores resultados de em que se constrói um grupo de comparação usan-
saúde e, por conseguinte, maior frequência escolar. do características observáveis. Isto é, quando não é
Outro exemplo é o de King et al. (2009), uma possível distribuir de forma aleatória os indivíduos
avaliação do programa Seguro Popular, que foi uma no grupo de tratamento e de controle, o pareamento
série de reformas implementadas pelo governo mexi- utiliza as informações sobre os indivíduos como ren-
cano a fim de viabilizar o acesso de pessoas de baixa da, gênero, escolaridade ou outras de acordo com o
renda aos serviços de saúde. Os autores utilizam a propósito da política para identificar indivíduos bas-
implementação por estágios para randomizar grupos tante semelhantes nessas características e estabelecer
entre tratamento e controle. Cem clusters foram ana- que os dois grupos sejam “balanceados”.
lisados para garantir maior similaridade entre trata- A ideia dessa abordagem é bastante intuitiva:
mento e controle. Os resultados indicaram que os uma vez que o objetivo é isolar o efeito da política
gastos com saúde diminuíram em 23% em todas as pública de outros fatores que possam influenciar o re-
famílias no grupo de tratamento e 55% nas famílias sultado de interesse, a partir de dados observacionais
efetivamente tratadas dentro do grupo de tratamento é possível identificar unidades que participaram e que
(compliers). O programa, no entanto, não apresentou não participaram do programa bastante semelhantes
efeito substantivo na utilização de serviços médicos. antes da implementação da política, diferindo apenas
Como pode-se notar nos exemplos aqui apre- no recebimento da política, de maneira que as dife-
sentados, para uma avaliação experimental ser im- renças entre os grupos depois da implementação da
plementada, a preocupação com o desenho da ava- política possam ser atribuídas ao programa.
Figura 4
Pareamento Exato
Unidades Tratadas Unidades não Tratadas
Idade Gênero Meses de Diploma Idade Gênero Meses de Diploma
trabalho ensino médio trabalho ensino médio
19 1 3 0 24 1 8 1
35 1 12 1 38 0 2 0
41 0 17 1 58 1 7 1
23 1 6 0 21 0 2 1
55 0 21 1 34 1 20 0
27 0 4 1 41 0 17 1
24 1 8 1 46 0 9 0
46 0 3 0 41 0 11 1
33 0 12 1 19 1 3 0
40 1 2 0 27 0 4 0
Adaptado de Gertler et al. (2011).
Nessa técnica, o ponto fundamenteal passa ser base nas quais se pretende parear unidades parti-
a definição do que seria “semelhante”. A ideia inicial cipantes do programa, é possível se deparar com
seria o pareamento exato. Ou seja, identificar partici- o que é chamado de “maldição da dimensionali-
pantes que tenham exatamente os mesmos atributos dade” (Idem, p. 106).
diferindo apenas no recebimento da política. A Fi-
gura 4 apresenta um exemplo de pareamento exato. Para lidar com essa limitação, Rosenbaum e Ru-
A ideia de identificar unidades idênticas tem bin (1983) apresentaram um método de pareamento
forte apelo na avaliação por se mostrar bastante baseado na “propensão” dos indivíduos de receberem
apropriada para a identificação do efeito causal. Se o tratamento. O método ficou conhecido como Pro-
as unidades tem exatamente as mesmas característi- pensity Score Matching (PSM) e vem sendo bastante
cas antes da política (baseline), sendo o recebimen- utilizado na avaliação de políticas públicas.
to do tratamento (política pública) o único elemen- Os indivíduos semelhantes – um participante e
to a diferenciá-las, então qualquer diferença ex-post outro (ou outros) não participante da política – são
pode ser atribuída à política. Contudo, por mais pareados de acordo com a “propensão” de partici-
intuitiva que seja, geralmente é bem difícil encon- par. O pesquisador não identifica dois indivíduos
trar um número grande de observações exatamente iguais, mas é possível identificar indivíduos seme-
iguais em várias dimensões. Sobre o pareamento lhantes o suficiente para fazer a comparação e assim
exato, Gertler et al. (2011) argumentam: identificar o efeito da política. O efeito do progra-
ma é então a diferença entre os grupos.
Infelizmente, isso é mais fácil de falar do que de A utilização do PSM depende de dois pressu-
fazer. Se a lista de características observáveis rele- postos. Primeiro, fatores não observáveis, como a
vantes é muito grande, ou se cada característica autoestima do indivíduo, não podem afetar a par-
assumir muitos valores, pode ser muito difícil ticipação. O segundo pressuposto é o de que exista
de identificar pares para cada unidade no grupo de uma região comum relativamente grande. Ou seja,
tratamento. Na medida em que se aumenta o é preciso ter sobreposição dos valores de propensão,
número de características ou dimensões com significando que há indivíduos semelhantes partici-
Figura 5
Propensity Score Matching (PSM) e a Região Comum
Controle Tratamento
Densidade
0 Região Comum 1
Propensity Score
pando e não participando da política para ser pos- tores separaram os grupos de tratamento e controle. A
sível fazer a combinação. A Figura 5 apresenta um partir da comparação entre os grupos os autores não
exemplo de região comum. encontraram efeitos positivos do programa.
Em termos de técnica estatística, primeiramen- Outro exemplo é a avaliação do Programa Bol-
te é realizada uma regressão logística que estima a sa Família pelo governo brasileiro (MDS, 2007). O
probabilidade de participar do programa e na qual estudo estima o impacto do programa sobre gasto
as variáveis independentes são as características dos de consumo, educação e trabalho infantil, antropo-
indivíduos levantadas como relevantes. Em segui- metria, saúde e poder de barganha das mulheres.
da, os valores preditos para cada indivíduo são esti- Fora estabelecido um grupo de tratamento, com-
mados e é identificada a região comum, ou a região posto por famílias que declararam receber o bene-
de sobreposição da propensão entre participantes e fício e dois grupos de comparação: (c1) elegíveis,
não participantes. Os dois grupos são então combi- que não recebem o benefício, mas recebem outros
nados. Por último, o impacto é identificado a partir programas; (c2) não elegíveis, que nunca receberam
da diferença no resultado entre participantes e não nenhum tipo de benefício. Os resultados indicam
participantes combinados. que os participantes tiveram melhor desempenho.
Um exemplo de utilização do PSM na avalia- Apesar de ter se tornado uma das técnicas mais
ção é apresentado em Jalan e Ravallion (2003), que populares na avaliação de políticas públicas, o PSM
analisam o programa Trabajar, do governo argenti- vem sendo alvo de críticas. King e Nielsen (2016) ar-
no, durante a crise econômica de 1997. Os autores gumentam que propensity scores não devem ser usados
examinaram os ganhos de renda dos beneficiários. O para pareamento porque o pareamento aleatório que o
PSM foi feito com base em variáveis que resumem as PSM oferece na verdade aumenta o desbalanceamen-
condições socioeconômicas das famílias, como carac- to entre as unidades pareadas. Esse desbalanceamento
terísticas do domicílio, dados demográficos e histórico também aumenta quando cresce o número de vari-
educacional. Com base nos escores estimados, os au- áveis incluídas no procedimento, reduzindo assim a
Figura 6
Diferença-em-Diferença em Prática
Renda
Participantes Não Participantes
Antes Intervenção 80 90
Depois Intervenção 125 120
Adaptado de Khandker, Koolwal e Samad (2010).
principal contribuição do PSM como ferramenta. Em A avaliação é feita simplesmente a partir dessas
outras palavras, o pareamento tem como objetivo “po- diferenças, antes e depois para os que receberam a
dar” as observações de forma que o restante das obser- política menos antes e depois para os que não rece-
vações apresentem o melhor balanceamento entre os beram. Essa dupla diferença é justamente o impacto
grupos de tratamento e controle. Como o PSM colo- da política. Em termos de técnica estatística é pos-
ca em primeiro lugar o tamanho da amostra pareada, sível calcular as diferenças ou usar uma regressão na
o método não é explicitamente desenhado para garan- qual uma das variáveis independentes é a interação
tir balanceamento, e o processo precisaria ser repetido (multiplicação) entre a variável binária participou/
e ajustado até que se chegasse a um resultado aceitável. não participou e a variável binária antes/depois. O
O problema com balanceamento surge porque o pa- coeficiente da interação é então o efeito da política.
reameno pode ser feito facilmente para algumas vari- A Figura 6 apresenta um exemplo dessa dupla
áveis, mas pode piorar o balanceamento em outras, comparação: tratamento versus controle, antes versus
gerando a situação na qual o pareamento acaba por depois da política.
aumentar o viés (Iacus, King e Porro, 2012). Como O DD é uma abordagem para isolar o efeito
alternativa, Iacus, King e Porro (2011) apresentam causal de uma política pública que se baseia nos
o Coarsened Exact Matching (CEM), que retoma a dois “falsos contrafactuais” apresentados na pri-
abordagem do pareamento exato, mas com um pro- meira seção. Na Figura 6, aplicando a equação da
cedimento de estratificação dos valores das variáveis dupla diferença tem-se como efeito do programa o
como maneira de facilitar o pareamento. O CEM in- aumento de 15 na renda. Contudo, se a avaliação
verte o foco e garante que o desbalanceamento entre for feita com base na comparação antes/depois esse
os grupos pareados não seja maior que um valor esco- efeito é de 45, ou, se for feita com base na com-
lhido ex-ante pelo usuário. paração entre participantes e não participantes, é
de 5. Assim, os dois “falsos contrafactuais” se dis-
Diferença-em-diferença tanciam da estimativa do impacto da política, no
A diferença-em-diferença (DD) tem por base a primeiro caso superestimando o efeito e no segun-
comparação entre indivíduos participantes e não par- do caso subestimando. É importante notar que
ticipantes da política antes e depois do programa, daí isso aumenta a discricionariedade do avaliador, de
o seu nome remeter à dupla diferença. Essa técnica forma que se pode recomendar a manutenção ou
parte do pressuposto de que características não obser- interrupção da política, dependendo da técnica de
váveis existem e podem afetar a propensão de partici- avaliação escolhida.
par do programa. Com base nisso, a técnica incorpora A avaliação da Lei Maria da Penha (Cerqueira
a heterogeneidade não observável, mas apenas a que et al., 2015) é um exemplo de avaliação de impacto
não varia no tempo. Dessa forma, tem-se um grupo utilizando o DD. A política tem como objetivo úl-
de tratamento e um grupo de controle (participantes e timo reduzir os homicídios de mulheres por razões
não participantes), antes e depois da política. vinculadas ao gênero. Como se trata de uma lei na-
cional, parece impossível num primeiro momento por trás desse critério de elegibilidade existe um ín-
estabelecer um grupo de controle, isto é, um gru- dice no qual os indivíduos logo acima e logo abaixo
po de indivíduos que não tenha sido beneficiado do critério de elegibilidade são bastante similares.
pela política. Isso porque, uma vez que a política O principal atrativo da RDD é que ela permite re-
foi aprovada, os seus benefícios estão disponíveis alizar a avaliação de impacto sem excluir beneficiá-
para todas as mulheres em todo o território nacio- rios: o grupo de comparação são indivíduos logo
nal. Para resolver esse problema os autores identifi- acima do valor de corte de elegibilidade (cutoff).
caram o grupo de controle com base no homicídio Dessa forma, a técnica estabelece uma comparação
de homens. Isto é, um grupo de indivíduos que está válida com base na distribuição “aleatória” dos in-
sujeito às outras causas da violência em geral, como divíduos em torno do cutoff. O pressuposto é o de
as condições socioeconômicas, e que não é benefi- que quanto mais próximo desse corte, os indivídu-
ciário da política em questão. O resultado de inte- os são bastante semelhantes, sendo o recebimento
resse é a taxa de homicídio, o grupo de tratamento do tratamento o único fator a diferenciá-los.
são as mulheres7 e o grupo de controle, os homens. “De fato, quando nos aproximamos extrema-
O DD é calculado a partir da interação entre ser do mente perto do escore de corte, as unidades à es-
grupo de tratamento, depois da política. Os resul- querda e à direita da linha serão tão semelhantes que
tados mostram que a lei se mostrou efetiva (Idem). a comparação será tão boa quanto se tivéssemos
O DD é uma importante ferramenta para a ava- escolhido os grupos de tratamento e de controle
liação porque é preciso ter apenas informações antes usando atribuição aleatória do tratamento” (Gertler
e depois da política, observar variação quanto ao re- et al., 2011, p. 91).
cebimento, ou seja, um grupo que recebeu a política Como exemplo, podem-se citar os programas
e um grupo que não recebeu e que os dois grupos de transferência de renda que estabelecem um deter-
tenham a mesma tendência pós-tratamento (Khan- minado valor, acima do qual o indivíduo não é ele-
dker, Koolwal e Samad, 2010). A priori, para o uso gível para o programa. No caso da linha de extrema
do DD os dois grupos não precisam ser balanceados pobreza de 77 reais, indivíduos recebendo até esse
nas características pré-tratamento. Exige-se apenas valor são elegíveis ao programa, mas indivíduos rece-
que essa heterogeneidade seja constante no tempo. bendo 78 reais já não são elegíveis. Contudo, o que
Em situações em que essas condições pré-tratamento diferencia esses indivíduos tão próximos? A lógica é
variam no tempo é preciso lidar com o problema que dentro desse limiar pode-se dizer que os indi-
para não gerar um viés de variável omitida. Uma for- víduos foram distribuídos aleatoriamente. Então os
ma de lidar com essa situação é combinar o PSM participantes e os não participantes podem ser com-
com o DD. Isto é, primeiro parear as unidades e de- parados como um grupo de tratamento e um grupo
pois calcular a dupla diferença entre os pares (Idem). de controle. A Figura 7 apresenta essa comparação.
A RDD é uma ferramenta extremamente po-
Regressão descontínua derosa, sendo necessários apenas dois pré-requisitos
A última técnica quantitativa a ser apresentada para o seu uso: 1) um índice de elegibilidade que
e que vem adquirindo muita atenção recentemente é seja contínuo; 2) um valor de corte claramente
a regressão descontínua (RDD). Diferentemente do definido. Contudo, existem algumas limitações.
PSM e do DD, a RDD é considerada um “experi- A primeira diz respeito ao fato das estimativas da
mento natural”, porque nela a distribuição dos in- RDD serem apenas quanto ao efeito local (em tor-
divíduos entre grupo de tratamento e grupo de con- no do cutoff )e não generalizáveis. Isso quer dizer
trole é feita de forma aleatória, mas essa aleatorização que quanto mais distante do valor de corte, mais
não está sob controle do avaliador (Dunning, 2012). heterogêneas serão as observações e por essa razão
O foco está nas regras de elegibilidade do pro- unidades tratadas e não tratadas não são mais com-
grama. Quando os programas são desenhados esta- paráveis. A segunda limitação diz respeito à neces-
belecem com base em qual critério um indivíduo sidade de muitas observações em torno do cutoff,
pode participar do programa. O pressuposto é que uma vez que as estimativas são apenas locais.
Figura 7
Descontinuidade na Avaliação de um Programa de Transferência Condicionada de Renda (PTCR)
Resultado Pré-Intervenção Resultado Pós-Intervenção

Linha da Extrema Pobreza Linha da Extrema Pobreza
Renda
Renda
Pobre Não Pobre Pobre Não Pobre
S* S*
Em termos de técnica estatística, apesar do a outras características acabou gerando essa forte
nome, a RDD não precisa ser uma regressão. O sofisticação metodológica, na qual o desenho expe-
primeiro passo é avaliar se as observações abaixo e rimental ou as técnicas quase-experimentais são as
acima do cutoff estão “balanceadas”, isto é, não apre- mais recomendadas. O uso de técnicas quantitati-
sentam diferenças sistemáticas além do recebimento vas para a avaliação de políticas é a mais difundi-
do tratamento. O impacto da política seria então o da já que quantifica o impacto sobre os resultados.
tamanho da descontinuidade (Dunning, 2012). Outras características da metodologia quantitativa
Buddelmeyer e Skoufias (2004) utilizam a regres- também contribuem para a sua difusão, como a
são descontínua para analisar a primeira experiência análise sistemática, a possibilidade de generaliza-
de transferência condicionada de renda: o Programa ção dos resultados, a transparência dos métodos e a
Progresa, do México, que visa diminuir a pobreza nas possibilidade de replicação dos achados.
áreas rurais e recém urbanizadas. O objetivo é acessar Contudo, algumas críticas são feitas à análise
o impacto do programa na dimensão de educação. A estritamente quantitativas. Primeiro, a busca de re-
descontinuidade utilizada é a elegibilidade da criança gularidades e generalização acaba se preocupando
para o recebimento do benefício. Os resultados são com o “efeito médio” ou com o que é comum e não
em relação ao grupo de inelegíveis para a mesma loca- com o que é específico dos indivíduos. A segunda
lidade do grupo de tratamento e sugerem que houve crítica é que o foco nos números acaba por inibir o
um aumento de 5% na presença escolar dos meninos, foco nas pessoas, suas histórias, valores, símbolos e
embora não tenha resultado significativo. A presença como elas interpretam o mundo. Há ainda a crítica
escolar das meninas, por sua vez, teve um aumento da concentração na explicação e não na interpreta-
de 8,9% em relação ao grupo de controle em 1998 e ção, além da constante exclusão das análises de fa-
de 9,9% em 1999. No que diz respeito ao trabalho, tores que não são passíveis de mensuração, mas que
o programa parece eliminar a maior participação de ainda assim são relevantes como empoderamento ou
meninas pobres em atividades de trabalho. capital social (Patton, 2002; Garbarino e Holland,
Na avaliação de políticas, a dificuldade de iso- 2009; Schutt, 2015). A próxima seção discute como
lar o efeito do programa e poder estabelecer que a técnicas qualitativas podem contribuir para o debate,
mudança no resultado se deve ao programa e não respondendo algumas dessas limitações.
Técnicas qualitativas: qualificando o impacto significado que as pessoas atribuem aos fenômenos
(ações, decisões, crenças, valores, etc.) no âmbito
Qual é o desenho da avaliação a partir da pers- dos seus mundos sociais” (Ritchie e Lewis, 2003,
pectiva qualitativa e quais as técnicas utilizadas? p. 3). Com foco no que é particular, no contexto
Partimos do pressuposto de que técnicas quanti- e no conteúdo da percepção e entendimento dos
tativas e qualitativas respondem a diferentes ques- atores, a abordagem qualitativa oferece elementos
tões na avaliação. A abordagem quantitativa busca para interpretação de como as políticas afetam os
identificar a magnitude do impacto e a abordagem indivíduos envolvidos. Contudo, por essas mesmas
qualitativa é mais inclinada para a profundidade. características essa abordagem envolve a análise de
Enquanto uma busca o geral ou o “efeito médio”, poucos casos, não representativos estatisticamente
a outra busca o que é específico e como o padrão da população. Como então a pesquisa qualitativa
de significação dos atores faz com que a percepção pode ser desenvolvida e contribuir para a avaliação
desse efeito seja bem diferente de um indivíduo de políticas, a qual geralmente se preocupa com a
para outro. Patton (2002) sumariza: generalização e com recomendações abrangentes de
manutenção ou interrupção de programas governa-
Algumas perguntas se prestam a respostas nu- mentais?
méricas; algumas não. Se você quer saber quan- A representatividade na perspectiva qualitativa
to as pessoas pesam, use uma escala. Se você tem a ver com o conteúdo ou mapeamento das vi-
quer saber se são obesas, mensure a gordura cor- sões, experiências e resultados. A ideia é de inclusão e
poral em relação à altura e peso e compare os representação simbólica das diferentes posições com
resultados com normas populacionais. Se você relação ao fenômeno em questão (Idem). Dificilmen-
quer saber o que o peso significa para as pessoas, te se conseguirá realizar entrevistas em profundidade
como afeta elas, como elas pensam sobre isso e com uma amostra representativa da população do
o que elas fazem com relação a isso, você preci- ponto de vista estatístico, como se faz com surveys.
sar questioná-las, descobrir as suas experiências Contudo, é possível identificar representantes de
e ouvir suas histórias. Um entendimento com- diferentes grupos, diferentes características socioe-
preensivo e multifacetado do peso na vida das conômicas ou políticas, e a partir dessas diferenças
pessoas requer tanto os seus números quanto as reconstruir ou mapear o fenômeno em questão.
suas histórias (Idem, pp. 13-14). Muitos trabalhos recentes têm partido da pers-
pectiva de que “ poucos, se houver algum, estudos
A análise qualitativa do efeito das políticas bus- avaliativos estariam completos sem incluir algu-
ca primeiramente identificar a qualidade da mudança ma informação qualitativa” (Worthen, Sanders e
gerada pela política. Isto é, como as pessoas percebem Fitzpatrick, 1997, p. 371). Contudo, buscamos
que sua vida foi melhorada (ou não) pelo programa. ressaltar aqui que a perspectiva qualitativa na pes-
O foco está em como os indivíduos percebem a im- quisa avaliativa deve ter um papel em si mesma e
plementação, como foram afetados pelos instrumen- não apenas como um “complemento” ao desenho
tos do programa e quais efeitos foram gerados. A aná- quantitativo.
lise é feita em termos de valores e significados. Isto é, A vantagem comparativa da pesquisa qualitativa
o que significa para os participantes serem envolvidos está em analisar e explicar o impacto (Worthen, San-
numa determinada política, o que significa para eles, ders e Fitzpatrick, 1997). “Trabalho qualitativo pode
por exemplo, aprender a ler ou participar de um pro- ajudar a explicar por que certos resultados são ob-
grama de treinamento para colocação no mercado de servados na análise quantitativa, e podem ser usados
trabalho. O foco vai muito além dos objetivos e metas para abrir a caixa-preta do que aconteceu no progra-
previstos pelo programa e o interesse está em cada ator ma” (Gertler et al., 2011, p. 17). Argumenta-se que
como único, com padrão de significação próprio. a abordagem qualitativa na avaliação é importante
“Pesquisa qualitativa é uma abordagem natura- por pelo menos quatro razões: 1) parte da perspec-
listica e interpretative, preocupada com entender o tiva dos atores para reconstruir a política; 2) identi-
fica impactos diferenciados sobre diferentes grupos a observação por muito tempo ficou marcada como
e indivíduos; 3) analisa dimensões não diretamente uma abordagem que somente se adequa a temas es-
quantificáveis do impacto das políticas; 4) explica pecíficos desse campo. Contudo, a observação foi re-
por que em algumas situações as políticas atingem os descoberta como abordagem que pode ser utilizada
seus objetivos e em outras não. virtualmente para o entendimento de qualquer gru-
A perspectiva qualitativa na avaliação vem cha- po social, desde comunidades urbanas vistas como
mando mais atenção recentemente devido a um reno- caóticas na década de 1930 (Whyte, 1943) até gru-
vado interesse em técnicas como entrevista em pro- pos marginalizados no século XXI (Goffman, 2015),
fundidade e observação participante para entender passando por qualquer comunidade, grupo, família,
o processo de implementação da política, além de beneficiário ou envolvido numa política pública.
na interação entre os instrumentos da política e o De acordo com Patton (2002), “a observa-
público-alvo varia de acordo com o contexto e com ção sistemática e rigorosa envolve muito mais do
os padrões de significacão de cada ator (Adato, que simplesmente estar presente e olhar ao redor”
2008). Aqui analisamos técnicas de entrevista e de (Idem, p. 5). Esperam-se de um trabalho de ob-
observação tendo em vista o seu uso bastante di- servação a análise e a descrição do espaço físico, o
fundido no campo de avaliação.8 desenvolvimento de relações com os observados, o
acompanhamento e observação de comportamen-
Observação tos, seguidos de perguntas e esclarecimentos quan-
do o pesquisador não compreender totalmente o
“Observações: descrições de campo de ativida- que está acontecendo. O tempo aqui é um fator
des, comportamentos, ações, conversas, interações fundamental, tendo em vista que somente observar
interpessoais, processos organizacionais ou comu- comportamentos esporádicos num período muito
nitários ou qualquer outro aspecto da experiência curto pode gerar interpretações parciais. Observa-
humana observável. Os dados consistem em notas ções por longos períodos também são recomenda-
de campo, descrições ricas e detalhadas, incluindo das para diminuir o problema da reflexividade do
o contexto no qual as observações são feitas” (Pat- objeto de estudo. Como o que está sendo observa-
ton, 2002, p. 4). do são seres humanos, espera-se que eles reajam ao
A observação tem por base a integração do pes- observador se comportando de forma diferente do
quisador na comunidade pesquisada. O objetivo é normal. Para isso, recomenda-se que o pesquisador
a imersão direta na cultura de um grupo. A técni- se mantenha na comunidade por períodos prolon-
ca de coleta da informação (observação), forma de gados, uma vez que o tempo faz com que o ob-
analisar (etnografia) e a teoria subjacente (cultura) servado naturalize a presença do pesquisador, que
normalmente andam em conjunto. A observação acaba se tornando “invisível” (Berg, 2001).
pode ser não participante, quando o pesquisador A observação pode ser realizada de maneira
apenas observa, mas não se torna funcional no gru- menos estruturada na forma de visitas aos locais
po, mantendo-se externo, ou pode ser participante, onde os programas são implementados ou, ainda,
quando o pesquisador se torna um membro funcio- para entender como os instrumentos do programa
nal do grupo, como, por exemplo, um pesquisador interagem com a cultura local e como sua imple-
que assume a função de professor na avaliação de mentação e seus efeitos variam de acordo com tra-
uma política educacional (Berg, 2001). ços da comunidade (Patton, 2002). No primeiro
O pressuposto da observação como técnica de caso a análise é feita com base em descrições densas.
pesquisa é o de que se o objetivo é entender um No segundo caso essas descrições assumem uma
povo ou uma comunidade, nada mais apropria- narrativa cultural e são classificadas como etnogra-
do do que conviver com esses indivíduos, observar fias: “etnografia é o trabalho de descrever uma cul-
seus comportamentos, fazer perguntas e ter experi- tura ” (Berg, 2001, p. 133).
ências. Devido a sua origem na antropologia, com Na avaliação de políticas a observação é bas-
o objetivo de compreender comunidades indígenas, tante útil principalmente para identificar como a
política pública é percebida no cotidiano do grupo, como elegíveis e outras não. Outro achado é em
como ela se adequa ao contexto local, como as pes- relação ao suplemento de ferro obrigatório como
soas reagem aos seus instrumentos e por quê. condicionalidade de saúde. Nesse caso os resultados
quantitativos indicavam a distribuição do suple-
As observações são essenciais para quase todas mento, mas o impacto sobre a saúde das crianças
as avaliações. No mínimo, tais métodos in- não era observado. A observação ajudou a explicar
cluem visitas ao local para observar o programa por que o programa não surtiu efeito, uma vez que
em operação e o uso de habilidades de obser- as mães não administravam o suplemento para as
vação para observar questões contextuais em crianças por achar que ele faria mal. Outro resul-
qualquer interação com as partes interessadas. tado interessante é o da pesagem obrigatória das
A observação pode ser usada mais amplamente crianças para acompanhar o aumento no peso. A
para aprender mais sobre as operações e resul- observação revelou que as crianças eram superali-
tados do programa, as reações e comportamen- mentadas no dia anterior à pesagem como forma
tos dos participantes, as interações e relações de “passar no teste”. Por último, a observação em
entre as partes interessadas e outros fatores vi- conjunto com entrevistas revelou um efeito inespe-
tais para o estudo (Worthen, Sanders e Fitzpa- rado do programa. O PTCR tem no seu desenho
trick, 1997, p. 375). a preocupação com o empoderamento feminino e
por essa razão as transferências são feitas diretamen-
Worthen, Sanders e Fitzpatrick (1997) apro- te para as mães. Contudo, os homens tinham uma
veitam para criticar avaliações realizadas por ava- percepção positiva dessa regra por acharem que o
liadores que conhecem o programa somente no cuidado das crianças seria mesmo “obrigação” das
papel e de fato não têm uma perspectiva de campo mulheres. Dessa forma, esse desenho acabou refor-
de como o programa é entregue ao público-alvo e çando uma noção enraizada (Adato, 2008).
como essa interação entre os implementadores e os
beneficiários pode afetar o impacto dele. Entrevistas em profundidade e grupos focais
Como exemplo do uso de técnicas de observação
na avaliação de políticas podemos citar o trabalho “Entrevistas: perguntas abertas e sondagens
de Adato (2008), que, numa perspectiva multimé- produzem respostas aprofundadas sobre as experiên-
todo, faz uma análise de programas de transferência cias, percepções, opiniões, sentimentos e conheci-
condicionada de renda (PTCRs) na Nicarágua e na mentos das pessoas. Os dados consistem em cita-
Turquia. Surveys, etnografia e entrevistas em pro- ções textuais com contexto suficiente para serem
fundidade são usados para averiguar o impacto do interpretáveis” (Patton, 2002, p. 4).
programa sobre saúde, educação e outras variáveis. A entrevista em profundidade é outra fonte de
Três pesquisadores nativos de cada país passaram dados comum na avaliação de políticas. Na entre-
entre quatro e cinco meses ajudando os habitantes vista a palavra do participante é o foco, sendo as
no trabalho, observando e criando confiança para as perguntas abertas e flexíveis no sentido de capturar
futuras abordagens de pesquisa. Para a etnografia foi a interpretação do entrevistado, opondo-se assim
adotado o estudo de caso em nível familiar. aos questionários fechados da pesquisa quantitati-
Os resultados mostram diferentes situações va. O objetivo é mapear e compreender o mundo
com relação aos achados quantitativos. Por exem- dos respondentes. O pressuposto é o de que a per-
plo, os resultados quantitativos indicavam que o cepção que as pessoas têm da realidade se constitui
programa da Nicarágua era extremamente bem fo- na realidade objetiva delas. O foco está em cren-
calizado, atendendo o seu público-alvo. Contudo, a ças, atitudes, valores e motivações (Bauer e Gaskell,
percepção dos indivíduos na comunidade é de que 2010; Ritchie e Lewis, 2003).
o critério de elegibilidade é arbitrário, porque não A entrevista pode ser semiestruturada, na qual
compreendem como pessoas com renda tão pare- tópicos predefinidos são estabelecidos. Contudo,
cida são diferenciadas, algumas sendo classificadas entrevistas semiestruturadas geralmente mantêm a
flexibilidade ao permitir inclusão de novos tópicos (Bauer e Gaskell, 2010; Ritchie e Lewis, 2003).
e permitir a fala do entrevistado. Na entrevista não Patton (2002) apresenta resultados de entrevis-
estruturada não há tópicos predefinidos, garantin- tas em profundidade para compreender o impacto
do o máximo de liberdade na fala do entrevistado. diferenciado de um programa de escolarização para
A narrativa é um tipo especial de entrevista na qual jovens e adultos sobre a qualidade de vida dos seus
o pesquisador estabelece um fato específico da vida beneficiários. Essas entrevistas foram feitas com
do entrevistado e pede que este narre um determi- grupos de beneficiários que concluíram o progra-
nado processo histórico (Bauer e Gaskell, 2010; Ri- ma. A pergunta de interesse foi: que diferença fez
tchie e Lewis, 2003). nas suas vidas o que vocês estão aprendendo? A se-
Independentemente do tipo, uma entrevista guir reproduzimos algumas das respostas.
em profundidade dá centralidade ao entrevistado
e não ao questionário como no caso de surveys. O – Me ajuda com meu remédio. Agora eu pos-
objetivo é sempre explorar a percepção dos indiví- so ler os frascos e as instruções! Eu estava com
duos e para isso o entrevistador precisa estabelecer medo de dar remédios para as crianças antes,
uma relação de confiança, construir um tópico-guia porque eu não tinha certeza;
coeso e com progressão lógica plausível de forma a – Sim, você não sabe o quão embaraçoso é ir às
incentivar o entrevistado a expor o seu ponto de compras e não ser capaz de ler a lista de produ-
vista. Assim, uma entrevista não é algo tão simples tos da esposa;
ou espontâneo como pode parecer num primeiro – Não tenho medo de ler a Bíblia agora na aula
momento. “Um bom entrevistar é uma habilidade” bíblica. É realmente importante para mim ser
(Worthen, Sanders e Fitzpatrick, 1997, p. 380) e, capaz de ler a Bíblia (Idem, pp. 16-17).
portanto, numa entrevista em profundidade, mais
que na aplicação de um questionário, o entrevista- Os resultados quantitativos indicavam que
dor deve estar preparado e ser bem treinado. 77% dos beneficiários estavam “muito satisfeitos”
Quanto ao número de entrevistados, a entre- com o programa, embora se note nas falas que por
vista individual busca a profundidade e deve ser razões bem diferentes. Em comum temos que a ên-
utilizada principalmente quando se busca o apro- fase no empoderamento em atividades cotidianas e
fundamento em determinado tema, o mapeamento não em situações relacionadas com a colocação no
da percepção específica do indivíduo ou quando o mercado de trabalho, como seria o objetivo prin-
tema é de alguma forma sensível. A entrevista co- cipal do programa. Em suma, o resultado quan-
letiva tem sua origem na pesquisa de marketing, titativo indicou a avaliação positiva do programa
quando profissionais usam grupos para avaliar um através de um indicador geral, e as entrevistas em
determinado produto. Esse tipo de entrevista evo- profundidade explicaram como exatamente a vida
luiu para o que ficou conhecido como grupo focal. dessas pessoas foi afetada e por que o programa foi
O grupo focal não é simplesmente a junção de avaliado positivamente.
entrevistas individuais; o grupo é diferente da soma Outro exemplo de uso de grupos focais e entre-
de suas partes. O foco está na discussão e na delibe- vistas individuais na avaliação de políticas é o trabalho
ração e não na interação direta entre entrevistador de Hunter e Sugiyama (2014) sobre o Programa Bolsa
e entrevistados. O entrevistador assume o papel de Família (PBF). Três municípios do Nordeste brasilei-
moderador do grupo, interferindo para fomen- ro foram selecionados para a realização dos grupos:
tar a discussão, limitar participantes dominantes, Camaragibe, Jaboatão dos Guararapes e Pau-Brasil. A
incentivar participantes relutantes e, por último, análise enfocou o Nordeste pela sua histórica associa-
para manter o foco da discussão no tema preesta- ção ao clientelismo e personalismo. Foram realizados
belecido. O uso de grupos focais é especialmente onze grupos focais nos três municípios e entrevistas
interessante quando se tem por objetivo explorar o com os gestores e implementadores da política. Os
espectro de atitudes, opiniões e comportamentos e resultados sugerem que o PBF possibilitou que as fa-
para observar processos de consenso e divergência mílias obtivessem dignidade, por meio da compra de
comida suficiente, roupas e materiais escolares. Afetou para saber precisamente o efeito do programa, mas
também a percepção de independência econômica precisamos também da qualidade para saber por
e que não há constrangimentos por ser beneficiário. que tal efeito foi gerado e o que se pode fazer a res-
De acordo com os grupos focais, houve uma associa- peito. Nesse contexto, as limitações de cada técnica
ção entre o PBF e o ex-presidente Luiz Inácio Lula específica começaram a ser notadas e a combinação
da Silva e o governo federal, impossibilitando a coop- passou a ser vista como o caminho mais frutífero
tação para o clientelismo por políticos locais. Houve, para resolver problemas práticos.
também, a percepção do voto como mecanismo de De acordo com Greene et al. (2001), “O pro-
accountability ao possibilitar a punição aos políticos pósito geral de combinar métodos é proporcionar
que se opusessem ao programa. Em suma, portanto, uma maior redução na incerteza e alcançar uma me-
os grupos evidenciaram expresso senso de empodera- lhor compreensão dos fenômenos sociais estudados”
mento dos beneficiários (Idem). (Idem, p. 30). Há diversas contribuições da aborda-
Algumas críticas são comuns à análise qualita- gem multimétodo para a avaliação de políticas: 1)
tiva como a subjetividade e especificidade dos resul- aumentar a validade e credibilidade das inferências,
tados, a ausência de regularidades ou generalização quando usada para mensurar o mesmo fenômeno
dos resultados, a menor precisão e ainda a dificulda- buscando a convergência; 2) aumentar a compreen-
de de replicação. Contudo, oferece um método de sividade dos resultados, na medida em que captu-
avaliação menos intrusivo e preocupado com a visão ra diferentes dimensões sob diferentes perspectivas,
dos atores. Menos intrusivo justamente porque não apresentando uma descrição mais completa do fenô-
impõe uma avaliação exógena, considerando a per- meno estudado; 3) facilitar a descoberta de fatores
cepção dos próprios atores envolvidos, oferece ainda inesperados; 4) aumentar a diversidade (Idem).
a possibilidade de captar aspectos não considerados Contudo, apesar do relativo consenso em tor-
na análise quantitativa por falta de medidas. Por fim, no da importância da abordagem mutimétodo, há
é responsável pelo conhecimento mais aprofundado, diferentes formas de combinação na pesquisa ava-
concentrando-se no efeito específico sobre a vida das liativa. Em algumas situações uma técnica pode
pessoas, para além do efeito “médio”. Essas contri- claramente sobrepor a outra, enquanto em outras
buições da análise qualitativa em conjunto com os igual importância é atribuída às diferentes formas
resultados da avaliação quantitativa podem trazer re- de analisar o problema em questão. Segundo Ca-
sultados mais robustos e completos sobre o efeito das racelli e Greene (1997), os desenhos de pesquisa
políticas sobre a vida das pessoas, de forma que o uso avaliativa multimétodo podem ser coordenados ou
de “métodos mistos” se torna uma das principais vias integrados. Quando há coordenação, a combinação
no debate metodológico de avaliação. de métodos acontece no final do estudo, e um con-
junto de evidências é usado para ilustrar, explicar
ou refinar os achados de um outro conjunto de evi-
Discussão: combinando métodos dências. No caso de integração, há pontos de inte-
ração entre os métodos ao longo de todo o estudo,
“A maioria dos avaliadores agora concorda que desde a formulação dos instrumentos de interven-
nenhum método ou abordagem é sempre apro- ção, passando pelo desenho da amostra, coleta de
priado. Em vez disso, o método deve ser selecio- dados e interpretação dos resultados finais.
nado com base na pergunta que se está tentando Quando há coordenação, por definição uma téc-
responder” (Worthen, Sanders e Fitzpatrick, 1997, nica se sobrepõe à outra, de forma que o estudo pode
p. 342). Essa citação reflete a preocupação recen- ser predominantemente quantitativo ou qualitativo.
te de que a avaliação tem de consistir num projeto Quando o estudo é predominantemente quantitati-
integrado, no qual o impacto do programa é iden- vo, a evidência qualitativa é usada para mapear o con-
tificado e também explicado. Isto é, para fazer mais texto social, formular os instrumentos de pesquisa e,
e melhores políticas precisamos saber quanto foi mais comummente, entender o explicar os resultados
modificado e o porquê. Precisamos da quantidade quantitativos encontrados. Quando o estudo é predo-
Figura 8
Combinando Métodos
Abordagem Funcionamento da abordagem Funcionamento da abordagem

predominante predominante complementar
Quantitativa Questionários estruturados são aplicados a Entrevistas, observação e grupos focais são
uma amostra aleatória de respondentes e a usados para ajudar a formulação do questionário.
análise é baseada em testes estatísticos. Pequenas amostras são analisadas para dar maior
entendimento às relações estatísticas encontradas
na análise quantitativa.
Integrada Questionários quantitativos são combinados com formas qualitativas de coleta de dados. Em
(quantitativa alguns casos as técnicas qualitativas são usadas para dar contexto e entendimento ao processo em
e qualitativa) estudo e em outros casos são usadas na mesma unidade de análise como forma de triangulação.
Qualitativa Estudos de caso, entrevistas, observação Questionários são usados para identificar temas e
e grupos focais são usados em pequenas grupos para serem explorados na análise qualitativa.
amostras de indivíduos. Questionários também são usados para mostrar
que a amostra coberta na análise qualitativa é
representativa dos grupos na população.
Adaptado de Bamberger (2012).
minantemente qualitativo, a evidência quantitativa é entender o contexto e percepções dos dois grupos.
usada para selecionar casos e grupos de interesse, evi- A análise quantitativa é predominante e é usada
tando um possível viés na análise. Com a evidência para identificar o uso de métodos de planejamento
quantitativa é possível mapear a população e identi- familiar e contracepção e o efeito desses hábitos so-
ficar casos e grupos de interesse para observação, en- bre a probabilidade de ter filhos e sobre a atuação no
trevistas em profundidade e grupos focais. A ideia é mercado de trabalho. A evidência qualitativa é usa-
mostrar antes ou depois da análise qualitativa que os da para dar substância e entendimento aos achados
grupos analisados são representativos dos grupos pre- quantitativos, mostrando também fatos não eviden-
sentes na população, sendo representatividade aqui tes na análise quantitativa, principalmente com rela-
sinônimo de variabilidade e não de representatividade ção a temas sensíveis como estupro e incesto.
estatística. No caso de estudos que combinam méto- Clert e Woden (2001) analisam a focalização
dos através da integração, o uso de técnicas quantita- de programas sociais no Chile, isto é, se os progra-
tivas e qualitativas é feito em cada estágio da pesquisa, mas estão de fato sendo entregues à população mais
com uma técnica alimentando e ajudando a outra. A pobre. A abordagem quantitativa também é predo-
Figura 8 sistematiza os tipos de estudos que utilizam minante nesse estudo e um survey representativo da
métodos mistos na pesquisa avaliativa. população nacional é usado para identificar a focali-
São muitos os trabalhos que utilizam alguma zação do programa. Os resultados da análise quanti-
das abordagens acima apresentadas de combinação tativa apontam para um grande sucesso na focaliza-
de métodos, principalmente do primeiro tipo, no ção. Combinados ao survey, grupos focais são usados
qual a abordagem quantitativa é predominante. Por para dar significado ao achado quantitativo. Nesse
exemplo, Guacituá-Marió, Sians e Wodon (2001) caso, o foco é a percepção dos próprios beneficiários
analisam saúde reprodutiva na área rural da Argenti- e os achados mostram falhas no programa que não
na. Nessa avaliação, a análise estatística é combinada são captadas na análise quantitativa. Os beneficiários
a grupos focais com homens e mulheres para melhor demonstram falta de entendimento das regras, o que
por consequência acaba gerando um sentimento de Conclusão

injustiça na distribuição dos benefícios sociais.
Baker (2001) analisa exclusão social no Uru- O presente artigo buscou apresentar as principais
guai e combina técnicas qualitativas e quantita- técnicas quantitativas e qualitativas na avaliação de
tivas, sendo as primeiras dominantes no estudo. impacto de políticas públicas. Iniciamos apresentan-
O foco do estudo está na relação entre exclusão e do os fundamentos da avaliação de impacto e como
pobreza. Métodos quantitativos são a base para a a busca pelo contrafactual acabou por enfatizar uma
escolha das áreas geográficas onde a análise quali- tradição de pesquisa quantitativa. O experimento
tativa será desenvolvida e para a identificação dos controlado aparece como o “padrão de ouro” para
principais grupos em situação de vulnerabilida- identificação do efeito causal das políticas públicas.
de. A análise qualitativa é desenvolvida por meio Esse desenho, apesar de ser o ideal, muitas vezes não
de entrevistas em profundidade e grupos focais é viável, tanto por razões éticas como por razões prag-
e explora as dimensões da exclusão social, bem máticas. Principalmente quando a avaliação não é
como as percepções sobre a exclusão em diferen- pensada no momento da formulação da políticas, o
tes contextos. experimento controlado deixa de ser possível. Por essa
Como exemplo de abordagem integrada po- razão técnicas quase-experimentais foram desenvolvi-
demos citar a avaliação do programa de desenvol- das para estimar o impacto das políticas. Nesse ponto
vimento comunitário na Índia (Bamberger, 2012). apresentamos como principais técnicas o pareamento,
A avaliação utilizou a combinação de métodos de a diferença-em-diferença e a regressão descontínua.
forma sequencial. Primeiro foram selecionadas O foco na identificação do efeito causal fez
duzentas comunidade de forma aleatória para surgir essa sofisticação metodológica, que do pon-
designar o tratamento, depois foi realizada uma to de vista da metodologia quantitativa contribuiu
pesquisa exploratória para entender o contexto para a precisão das análises. Contudo, a abordagem
da política em termos de direito a terra, partici- quantitativa enfoca o “efeito médio” e, por essa ra-
pação e redes sociais. Depois, um survey foi im- zão, acaba deixando de lado a percepção dos ato-
plementado nas comunidades, seguido de análise res, suas histórias e como esses efeitos variam de
em profundidade de cinco projetos que receberam um indivíduo para o outro. Para suprir essa lacuna,
o tratamento e cinco projetos no grupo de con- técnicas qualitativas vêm sendo cada vez mais usa-
trole para observar mudanças na organização das das. Discutimos o uso de técnicas de observação, de
comunidades. O survey foi conduzido após dois entrevista em profundidade e de grupos focais para
anos do tratamento e, por último, técnicas quanti- a análise de como e por quê as políticas afetam a
tativas e qualitativas foram usadas como forma de qualidade de vida dos atores envolvidos.
triangulação para maior entendimento dos resul- A conclusão à qual chegamos é que as avaliações
tados alcançados.9 são sempre limitadas enquanto estiverem concentra-
Esses exemplos mostram o potencial de das em apenas uma dessas abordagens. É importante
combinar métodos quantitativos e qualitativos ter uma estimativa precisa do impacto, principalmen-
na avaliação de políticas públicas. A abordagem te para fundamentar decisões quanto à manutenção
quantitativa oferece a precisão necessária para o ou à extinção de programas governamentais. Contu-
julgamento do funcionamento das políticas, en- do, essa estimativa está “na média” e não envolve as
quanto a abordagem qualitativa oferece o enten- pessoas por trás dos números. É preciso saber também
dimento dos resultados alcançados, mostrando o o porquê dos resultados alcançados. Não pretende-
porquê. Usadas em conjunto, as duas abordagens mos afirmar a superioridade de uma técnica ou de
oferecem elementos para o desenvolvimento de outra, mas de argumentar a favor da combinação de
mais e melhores avaliações e julgamentos substan- métodos na avaliação. Combinar métodos aumenta a
ciados, de forma que as políticas alcancem os seus contribuição de cada um deles, provendo dados mais
objetivos e de fato melhorem a vida daqueles que ricos e um maior poder analítico do que seria possível
são o seu público-alvo. utilizando os métodos isoladamente.
O objetivo foi apresentar essas técnicas e argu- 7 Para uma estimativa ainda mais precisa os autores cal-
mentar a favor da combinação de métodos. Tenta- culam a taxa de homicídios de mulheres que tenham
mos ser o mais abrangentes e pluralistas possível, como local de ocorrência o próprio domicílio, como
dada a limitação de espaço. Não buscamos uma uma forma de alcançar uma medida mais próxima de
homicídio relacionado com questões de gênero.
descrição exaustiva desses métodos e tampouco
das formas de combiná-los na pesquisa avaliativa. 8 Outras técnicas da chamada “nova metodologia qualita-
tiva”, como o Qualitative Comparative Analysis (QCA)
Literalmente, centenas de livros já foram escritos
ou o Process Tracing, também podem ser utilizadas na
sobre cada um desses pontos. Pretendemos apenas análise de políticas, mas ainda com pouca inserção no
contribuir com a sistematização de parte desse co- campo de avaliação. Por essa razão e por limitação de
nhecimento para incentivar a produção de mais espaço não trataremos aqui dessas técnicas. Para mais
e melhores avaliações de impacto, especialmente informações sobre esses métodos ver Beach e Pedersen
no Brasil. (2013), sobre Process Tracing, Ragin e Rihoux (2008)
sobre QCA em geral, e Rihoux, Rezsöhazy e Bol (2011)
sobre o uso do QCA na análise de políticas públicas.
Notas 9 Para mais exemplos de combinação de métodos na
pesquisa avaliativa, ver www.interaction.org/resour-
1 Do original em inglês: “Doctors use evidence when ces/training/annex-10-case-studies-mm-evaluation-
prescribing treatments. Policy-makers should, too” -designs-predominant-quant-qual-and-balanced-
(“In praise of human guinea pigs”. The Economist, 12 -orientations (consultado em 30/10/2016).
dez. 2015).
2 Enfatizamos que o resultado de avaliações é apenas uma
das formas de decidir acerca da manutenção e reformu- BIBLIOGRAFIA
lação de políticas públicas. Em muitas situações o acor-
do entre os atores envolvidos pode ser um outro critério ADATO, Michelle. (2008), “Integrating survey
que não será explorado por não ser o foco do presente
and ethnographic methods to evaluate condi-
trabalho. Em suma, este trabalho apenas discute as téc-
nicas disponíveis para a realização da avaliação uma vez
tional cash transfer programs”. International
que essa já foi decidida pelos atores políticos. Food Policy Research Institute. Disponível em
3 Importante destacar, no entanto, que o ciclo de polí-
core.ac.uk/download/files/153/6337617.pdf,
ticas públicas é, muito mais, um tipo ideal do policy consultado em 30/5/2016.
process do que uma representação fidedigna ao que ALA-HARJA, Marjukka & HELGASON, Sigur-
acontece na realidade (Jann e Wegrich, 2006). dur. (2000), “Em direção às melhores práticas
4 Nas citações deste artigo, todas as traduções foram fei- de avaliação”. Revista do Serviço Público, 51
tas pelas autoras, salvo quando indicado outra autoria. (4): 5-59.
5 Apesar de importante instrumento, a utilização da ANDERSON, James. (1974), Public policy-
avaliação de impacto pelo governo pode não estar -making. Nova York, Holt, Rinehart, and
garantida automaticamente, uma vez que as avalia- Winston.
ções podem ser um problema para os governantes, ATTANASIO, Orazio; MEGHIR, Costas &
executores e gerentes de projetos porque os resultados SANTIAGO, Ana. (2012), “Education choi-
podem causar constrangimentos públicos (Trevisan e ces in Mexico: using a structural model and
Bellen, 2008). No entanto, sua importância é justifi- a randomized experiment to evaluate Progre-
cada por ser um mecanismo de melhoria da tomada sa”. The Review of Economic Studies, 79 (1):
de decisão, aumento do fluxo de informação e presta-
37-66.
ção de contas (Ala-Harja e Helgason, 2000).
BAKER, Judy, (2001), “Social exclusion in urban
6 As três técnicas foram escolhidas por serem as mais
Uruguay”, in E. Gacitua-Mario e Q. Wodon
difundidas na avaliação de políticas. Outras técnicas,
como o uso de variáveis instrumentais, também são
(orgs.), Measurement and meaning: combining
usadas com certa frequência, mas não serão aqui tra- quantitative and qualitative methods for the
tadas por limitação de espaço. analysis of poverty and social exclusion in Latin
America, Washington, World Bank (Technical experiments: design, analysis, and interpretation.
Paper n. 518). Nova York, W. W. Norton.
BAMBERGER, Michael. (2012), “Introduction to GERTLER, Paul J. et al. (2011), Impact evaluation
mixed methods in impact evaluation”. Impact in practice. Washington, World Bank.
Evaluation Notes, 3: 1-38. GLENNERSTER, Rachel & TAKAVARASHA,
BAUER, Martin W. & GASKELL, George. Kudzai. (2013), Running randomized evalua-
(2010), Qualitative researching with text, image tions: a practical guide. Princeton (NJ), Prince-
and sound: a practical handbook for social resear- ton University Press.
ch. Londres, Sage. GREENE, Jennifer & CARACELLI, Valerie.
BEACH, Derek & PEDERSEN, Rasmus (1997), Advances in mixed-method evaluation:
Brun. (2013), Process-tracing methods: Founda- the challenges and benefits of integrating diverse
tions and guidelines. Ann Arbor (MI), Univer- paradigms. Nova York, Jossey-Bass.
sity of Michigan Press. GREENE, Jennifer; CARACELLI, Valerie &
BERG, Laurence. (2001), Qualitative research me- GRAHAM, Wendy. (1989), “Toward a con-
thods for the social sciences. Boston, Pearson. ceptual framework for mixed-method evalua-
BUDDELMEYER, Hielke & SKOUFIAS, Em- tion designs”. Educational Evaluation and Po-
manuel. (2004), An evaluation of the perfor- licy Analysis, 11 (3): 255-274.
mance of regression discontinuity design on PRO- GREENE, Jennifer; BENJAMIN, Lehn & GOO-
GRESA. Washington, World Bank. DYEAR, Leslie. (2001), “The merits of mixing
CAIRNEY, Paul. (2011), Understanding public po- methods in evaluation”. Evaluation, 7 (1): 25-44.
licy: theories and issues. Basingstoke, Palgrave GOFFMAN, Alice. (2015), On the run: fugitive
Macmillan. life in an American city. Nova York, Picador.
CERQUEIRA, Daniel; MATOS, Mariana; MAR- GACITUA-MARIB, Estanislao, SIAENS, Corin-
TINS; Ana Paula & PINTO JÚNIOR, Jony. ne, & WODON, Quentin. (2001), “Repro-
(2015), “Avaliando a efetividade da Lei Maria ductive health in Argentina’s poor rural areas”,
da Penha”. Brasília, Ipea (Texto para Discussão in E. Gacitua-Mario e Q. Wodon (orgs.), Me-
n. 2048). Disponível em www.ipea.gov.br/por- asurement and meaning: Combining quantita-
tal/images/stories/PDFs/TDs/td_2048.pdf, tive and qualitative methods for the analysis of
consultado em 5/5/2016. poverty and social exclusion in Latin America,
CLERT, Carine & WODON, Quentin. (2001), Washington, World Bank (Technical Paper n.
“The targeting of government programs in Chi- 518).
le”, in E. Gacitua-Mario e Q. Wodon (orgs.), HUNTER, Wendy & SUGIYAMA, Natasha Bor-
Measurement and meaning: Combining quantita- ges. (2014), “Transforming subjects into citi-
tive and qualitative methods for the analysis of po- zens: insights from Brazil’s Bolsa Família”. Pers-
verty and social exclusion in Latin America, Wa- pectives on Politics, 12 (4): 829-845.
shington, World Bank (Technical Paper n. 518). IACUS, Stefano & KING, Gary. (2011), “Causal
COHEN, Ernesto & FRANCO, Rolando. (2013), inference without balance checking: coarsened
Avaliação de projetos sociais. Petrópolis (RJ), Vozes. exact matching”. Political Analysis, 20: 1-24.
DUNNING, Thad. (2012), Natural experiments in JALAN, Jyotsna & RAVALLION, Martin. (2011),
the social sciences: a design-based approach. Cam- “Estimating the benefit incidence of an antipover-
bridge (MA), Cambridge University Press. ty program by propensity-score matching”. Jour-
GARBARINO, Sabine & HOLLAND, Jeremy. nal of Business & Economic Statistics, 21 (1): 19-30.
(2009), Quantitative and qualitative methods in KHANDKER, Shahidur R; KOOLWAL, Gayatri
impact evaluation and measuring results. Birmin- B. & SAMAD, Hussain A. (2010), Handbook
gham, Governance and Social Development on impact evaluation: quantitative methods and
Resource Centre/University of Birmingham. practices. Washington, World Bank.
GERBER, Alan & GREEN, Donald. (2012), Field KING, Gary et al. (2009), “Public policy for the
poor? A randomised assessment of the Mexi- dbook of public policy analysis: theory, politics,
can universal health insurance programme”. and methods, Boca Raton (FL), CRC Press.
The Lancet, 373 (9673): 1447-1454. WHYTE, William Foote. (1943), Street corner so-
KING, Gary & NIELSEN, Richard. (2015), ciety: the social structure of an Italian slum. Chi-
“Why propensity scores should not be used cago, University of Chicago Press.
for matching” [Working paper]. Cambrid- WORTHEN, Blaine R; FITZPATRICK, Jody
ge (MA), Harvard University. Disponível em L. & SANDERS, James R. (1997), Program
gking.harvard.edu/files/gking/files/psnot.pdf, evaluation: alternative approaches and practical
consultado em 8/7/2016. guidelines. Londres, Longman.
MDS – Ministério do Desenvolvimento Social e
Combate à Fome. (2007), Avaliação do impac-
to do Programa Bolsa Família. Brasília, MDS.
MIGUEL, Edward & KREMER, Michael. (2004),
“Worms: identifying impacts on education
and health in the presence of treatment exter-
nalities”. Econometrica, 72 (1):159-217.
PATTON, Michael Quinn. (2002), Qualitative re-
search and evaluation methods. Sage (CA), Sage.
RIHOUX, Benoît & RAGIN, Charles C. (2009),
Configurational comparative methods: Qualitati-
ve comparative analysis (QCA) and related tech-
niques. Sage (CA), Sage.
RIHOUX, Benoît; REZSÖHAZY, Ilona & BOL,
Damien. (2011), “Qualitative comparative analy-
sis (QCA) in public policy analysis: an extensive
review”. German Policy Studies, 7 (3): 9-82
RITCHIE, Jane & LEWIS, Jane. (2003), Quali-
tative research practice: a guide for social science
students and researchers. Sage (CA), Sage.
ROSENBAUM, Paul R. & RUBIN, Donald B.
(1983), “The central role of the propensi-
ty score in observational studies for causal
effects”. Biometrika, 70 (1): 41-55,
ROSSI, Peter H; LIPSEY Mark W & FREEMAN,
Howard E. (2004), Evaluation: a systematic ap-
proach. Sage (CA), Sage.
SCHUTT, Russell (2011). Investigating the social
world: the process and practice of research. New-
bury Park (CA), Pine Forge Press.
TREVISAN, Andrei Pittol & VAN BELLEN,
Hans Michael. (2008), “Avaliação de políticas
públicas: uma revisão teórica de um campo em
construção”. Revista de Administração Pública,
42 (3): 529-550.
WEGRICH, Kai & JANN, Werner. (2006),
“Theories of the policy cycle”, in Frank Fischer,
Gerald J. Miller e Mara S. Sidney (orgs.), Han-
MAIS QUE BOAS INTENÇÕES: MORE THAN GOOD DAVANTAGE QUE DE

TÉCNICAS QUANTITATIVAS E INTENTIONS: QUANTITATIVE BONNES INTENTIONS :
QUALITATIVAS NA AVALIAÇÃO AND QUALITATIVE TECHNICS TECHNIQUES QUANTITATIVES
DE IMPACTO DE POLÍTICAS IN THE IMPACT EVALUATION OF ET QUALITATIVES DANS
PÚBLICAS PUBLIC POLICIES L’ÉVALUATION DE L’IMPACT DES
POLITIQUES PUBLIQUES
Mariana Batista e Mariana Batista and Mariana Batista et

Amanda Domingos Amanda Domingos Amanda Domingos
Palavras-chave: Avaliação de impacto; Keywords: Impact evaluation; Experi- Mots-clés: Évaluation de l’impact; Expé-
Experimentos; Quase-experimentos; Ob- ments; Quasi-experiments; Observation; riences; Quasi-expériences; Observation;
servação; Entrevistas. Interviews. Entretiens.
Como técnicas quantitativas e qualitati- How can quantitative and qualitative De quelle façon les techniques quan-
vas podem ser mobilizadas para avaliar techniques be mobilized to assess the im- titatives et qualitatives peuvent être
o impacto de políticas públicas? Este pact of public policies? This paper aims employées pour évaluer l’impact des
trabalho tem por objetivo apresentar os to present the basics of impact evaluation politiques publiques ? Cet article a
fundamentos da avaliação de impacto e and discuss the main techniques used to pour objectif de présenter les bases de
discutir as principais técnicas utilizadas quantify or qualify the impact of policies. l’évaluation d’impact et de discuter les
para quantificar ou para qualificar o im- Therefore, we present the controlled expe- principales techniques utilisées pour
pacto das políticas. Para tanto, apresenta- riment and quasi-experimental techniques quantifier ou pour qualifier l’impact de
mos o experimento controlado e técnicas as tools to identify the causal effect of ces politiques. Ainsi, nous présentons
quase-experimentais como ferramentas policies, and observation, in-depth inter- l’expérience contrôlée et les techniques
de identificação do efeito causal das po- views, and focus groups as ways to observe quasi-expérimentales tels que les outils
líticas e técnicas de observação, entrevista the impact on the beneficiaries’ quality of d’identification de l’effet causal des po-
em profundidade e grupos focais como life. Different techniques are presented litiques et des techniques d’observation,
formas de compreender o seu impacto with practical examples of public policies. des entretiens approfondis et des groupes
sobre a qualidade de vida dos beneficiá- The results indicate that quantitative and de discussion comme des moyens pour
rios. As diferentes técnicas são apresen- qualitative approaches answer to different comprendre leur impact sur la qualité de
tadas com exemplos práticos de políticas questions in the evaluation. However, vie des bénéficiaires. Les différentes tech-
públicas. Os resultados indicam que as both are fundamental to evidence-based niques sont présentées avec des exemples
abordagens quantitativa e qualitativa res- policy making. pratiques de politiques publiques. Les
pondem à questões diferentes na avalia- résultats indiquent que les approches
ção. Contudo, ambas são fundamentais quantitatives et qualitatives répondent
para a formulação de políticas baseada aux différentes questions de l’évaluation.
em evidências. Toutes deux sont, cependant, essentielles
à la formulation de politiques fondées
sur des données probantes.

Mais Que Boas Intenções: Técnicas Quantitativas e Qualitativas Na Avaliação de Impacto de Políticas Públicas

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Mais Que Boas Intenções: Técnicas Quantitativas e Qualitativas Na Avaliação de Impacto de Políticas Públicas

Enviado por

Direitos autorais:

Formatos disponíveis

MAIS QUE BOAS INTENÇÕES

Técnicas quantitativas e qualitativas na avaliação de

Insumos Atividades Produtos Resultados Resultados Finais

Orçamento, Séries de atividades Bens e serviços Não totalmente Mudanças

IMPLEMENTAÇÃO (o lado da oferta) RESULTADOS (Demanda+oferta)

Adaptado de Gertler et al. (2011).

Porém, há diferentes formas de se aproximar desse A aleatorização na construção dos grupos de

Adaptado de Gertler et al. (2011).

Resultado Pré-Intervenção Resultado Pós-Intervenção

Abordagem Funcionamento da abordagem Funcionamento da abordagem

Adaptado de Bamberger (2012).

por consequência acaba gerando um sentimento de Conclusão

MAIS QUE BOAS INTENÇÕES: MORE THAN GOOD DAVANTAGE QUE DE

Mariana Batista e Mariana Batista and Mariana Batista et

Você também pode gostar