Você está na página 1de 14

Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

SESSÃO REVISÃO DE LITERATURA

METODOLOGIAS DE AVALIAÇÃO DE POLÍTICAS PÚBLICAS: ANÁLISE E APLICAÇÃO


DOS PRINCIPAIS MÉTODOS NO CONTEXTO DO BANCO DO NORDESTE

Public policy evaluation methodologies: analysis and application of the main


methods in the Banco do Nordeste context
Jaqueline Nogueira Cambota
Economista. Doutorado em Economia pela Universidade de São Paulo (2012). Coordenadora de Estudos e Pesquisas
do Escritório Técnico de Estudos Econômicos do Nordeste - ETENE. Banco do Nordeste do Brasil S/A. jacquelinenc@
bnb.gov.br

Diego Rafael Fonseca Carneiro


Economista. Doutorado em Economia pela Universidade Federal do Ceará (2018). Bolsista de Inovação SET-CNPq/
ETENE. Banco do Nordeste do Brasil S/A. dr.carn@gmail.com

Resumo: O objetivo deste artigo é apresentar os prin- Abstract: The aim of this article is to present the main
cipais parâmetros de interesse e métodos de avaliação parameters of interest and evaluation methods in social
em programas sociais. Também se resgata algumas das programs. It also rescues some of the main applications
principais aplicações desses métodos aos Programas ope- of these methods to the Programs operated by Banco do
racionalizados pelo Banco do Nordeste. A estimativa de Nordeste. The estimated impact of a Program will de-
impacto de um Programa dependerá da forma que ocor- pend on how the treatment designation happened. When
reu a designação ao tratamento. Quando a designação the designation does not occur randomly, the assessment
não acontece de forma aleatória, os métodos de avaliação methods are based on the selection of observable and
baseiam-se na seleção de observáveis e não observáveis unobservable for valid counterfactual construction. The
para construção de contrafactual válido. As evidências empirical evidence found in the evaluations of the Pro-
empíricas encontradas nas avaliações dos Programas ope- grams operationalized by the BNB reinforces that one
racionalizados pelo BNB reforçam que uma das maiores of the greatest difficulties in estimating the impact of
dificuldades na estimação do impacto de um Programa a Program is in the construction of a valid comparison
está na construção de um grupo comparação válido. As group. Evaluations, both internal and external, of these
avaliações, tanto internas quanto externas, desses Progra- Programs have addressed this limitation, as well as sou-
mas têm abordado essa limitação, bem como buscado for- ght ways to circumvent it through these methodologies.
ma de contorná-la por meio dessas metodologias. Keywords: Evaluation; Public Police; Banco do Nor-
Palavras-chave: Avaliação; Políticas Públicas; Banco deste.
do Nordeste.

Recebido em 17 de setembro de 2018 Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018
Aceito em 19 de outubro de 2018
9
Sessão revisão de literatura

Desse modo, quando não é possível a aleatori-


1 INTRODUÇÃO zação do tratamento, os métodos não experimen-
Os métodos econométricos de avaliação de im- tais oferecem alternativa por meio do controle das
pacto baseiam-se na ideia de resultados potenciais. características observadas ou não dos indivíduos
Essa abordagem preconiza que para se obter o que afetam a decisão de participação do tratamen-
efeito causal de determinado tratamento, a princí- to. O problema desses métodos é que muitas vezes
pio, seria necessário comparar o mesmo indivíduo se baseiam em suposições fortes acerca da forma
nas situações em que ele recebe e não recebe o tra- como o grupo de tratamento foi selecionado, a
tamento. Contudo, apenas uma dessas situações é exemplo disso, alguns deles assumem que a par-
observável de cada vez. Desse modo, todo o esfor- ticipação do indivíduo depende exclusivamente de
ço nos processos de avaliação se dá pela obtenção suas características observadas e independem de
de um grupo de comparação válido, ou seja, que seu resultado potencial, a chamada ignorabilidade
simule o contrafactual das unidades tratadas. (ROSENBAUM; RUBIN, 1983). Portanto, “um
avaliador deve escolher um estimador de manei-
A construção do grupo de comparação é
ra cuidadosa considerando a natureza dos dados
cercada de potenciais problemas, mas que podem
avaliados, a natureza institucional do programa e o
ser circunscritos ao chamado viés de seleção.
parâmetro de interesse” (SMITH, 2004, p. 9).
Esse decorre fundamentalmente da forma como o
tratamento foi distribuído, ou de outra maneira, como Diante disso, o objetivo deste artigo é apresentar
foram selecionados para participar do programa. Um os principais parâmetros de interesse das avaliações,
caso bastante comum, principalmente, nos progra- bem como discutir os métodos de avaliação utiliza-
mas de crédito, é a auto-seleção1, em que as unida- dos em suas estimações. Também são recuperadas
des escolhem participar ou não de acordo com análi- as principais experiências de avaliação aplicadas
se custo-benefício do recebimento do tratamento. A aos Programas operacionalizados pelo BNB.
auto-seleção dificulta, portanto, a construção de um Além desta introdução, o artigo está divido em
grupo comparação adequado para estimação do im- mais cinco seções. Na segunda seção, é feita a des-
pacto do tratamento, uma vez que os indivíduos que crição dos quatro principais parâmetros de interesse
podem tirar maior proveito do tratamento são tam- em avaliação de programas. Na terceira seção, são
bém aqueles com maior interesse na participação. discutidos os principais métodos de estimação dos
Os métodos para lidar com esse problema efeitos tratamentos, expondo suas aplicações e limi-
podem ser divididos em duas abordagens: expe- tações. Na quarta, também são discutidas, na medida
rimental e não experimental. O método experi- do possível, aplicações desses métodos nas avalia-
mental consiste na aleatorização da distribuição ções dos Programas operacionalizados pelo BNB.
do tratamento2. Quando bem conduzida, a aleato- Por fim, são realizadas as considerações finais.
rização proporciona um grupo comparação ade-
quado, com as mesmas características do grupo de 2 RESULTADOS POTENCIAIS E OS
tratamento, permitindo estimar consistentemente o PARÂMETROS DE INTERESSE NA
efeito do programa. A aleatorização do tratamento,
apesar de ser considerado o “padrão ouro” das ava-
AVALIAÇÃO DE PROGRAMAS
liações impacto, é pouco frequente por exigir uma A definição de impacto de um programa pode
preparação ex ante a implementação da política, o tomar diferentes conotações a depender do de-
que a torna mais complexa e dispendiosa, além das senho da política e do método aplicado em sua
questões éticas e/ou políticas inerentes a distribui- avaliação. Contudo, o ponto de partida para to-
ção do tratamento por critérios fortuitos. das as abordagens é o arcabouço de resultados
potenciais, em que cada unidade i é observada
em apenas um estado, tratado (Yi1) ou não tratado
1 Para maiores detalhes ver Roy (1956) (Yi0), mas o par (Yi1, Yi0) nunca é observado si-
2 Nos casos em que a aleatorização não foi bem realizada ou
quando o grupo comparação não é um contrafactual válido, os
multaneamente para uma mesma unidade, o que
métodos baseados em seleção sob observáveis ou não observáveis é definido por Holland (1986) como o problema
fornecem estimativas mais confiáveis do que as obtidas por fundamental da inferência causal. Portanto, como
experimento natural. Isso porque a avaliação experimental só pode Yi0 não é observado, o avaliador precisa encontrar
ser realizada em programas em que o tratamento foi aleatorizado.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018


10
Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

um grupo contrafactual válido, o qual deve potencial, ou seja, o tratamento não foi atribuído aos
possuir características indistinguíveis do grupo que mais se beneficiariam dele, de modo que o dife-
dos tratados, diferindo apenas por não serem rencial de resultados entre os grupos se deve, além do
expostos ao tratamento. Dessa forma, Heckman próprio tratamento, as diferenças nessas característi-
et al. (2001) definiram os principais parâmetros cas. Apesar de ser uma hipótese forte, a maior parte
de interesse como ATE, ATT3, MATE e LATE, dos métodos de avaliação depende de sua validade.
que serão detalhados nas próximas seções. Assim, sob ignorabilidade consegue-se estimar
consistentemente o efeito médio do tratamento,
2.1 O Efeito Médio do Tratamento (ATE) condicional as características observáveis, por:

Esse parâmetro mede o efeito do tratamento so- ATE (x)= E(Yi1 – Yi0∨ x)=
bre todas as unidades em uma população, incluin- (2)
do participantes e não-participantes do programa. E(Yi1∨ x)– E(Yi0∨ x)
Sua obtenção se dá a partir da comparação do re-
sultado médio entre os dois status de tratamento, 2.2 O Efeito Médio do Tratamento sobre os
o que empiricamente se traduz na diferença média
Tratados (ATT)
entre tratados e não tratados. De maneira formal é
possível definir o ATE como: Diferente do ATE, que mede o efeito sobre toda
a população, o ATT mede o efeito do programa
ATE = E(Yi1 – Yi0)=E(Yi1)– E(Yi0)=
apenas sobre as unidades que efetivamente parti-
1 ∑(y (1) –y (0)) (1)
ciparam do tratamento. Conceitualmente, o ATT
i i
N pode ser entendido como:
A Equação 1 pressupõe a uniformidade das ca- ATT = E(Yi1 – Yi0∨ d =1)=
racterísticas, observáveis e não observáveis, entre (3)
tratados e não tratados, ou seja, ausência do viés de E(Yi1∨ d =1)– E(Yi0∨ d =1)
seleção. Mas quando essa condição não é razoável,
Onde d=1 quando há participação no progra-
em função do desenho do programa, suposições
adicionais fazem-se necessárias para a obtenção ma, d =0 caso contrário.
do ATE. Nesses casos, a hipótese de identificação Mas, como já discutido, não é possível visualizar
mais frequente é a de ignorabilidade do tratamento, o resultado dos indivíduos tratados na ausência do tra-
ou seja, (Yi1, Yi0) são independentes do tratamento tamento, de modo que o termo E(Yi0∨ d =1)não pode
quando condicionados às covariadas relevantes. ser observado. Assim, desde que exista um grupo
Em outras palavras, assume-se que a escolha de comparação fiel ao contrafactual das unidades
dos indivíduos tratados baseou-se apenas nas ca- tratadas, é possível utilizar o seu resultado médio,
racterísticas observáveis, e não no seu resultado E(Yi0∨ d =0) para estimar o ATT. Mas note que:

E(Yi1|d =1) – E(Yi0|d =0)=[E(Yi1|d =1) – E(Yi0|d =1)]+[E(Yi0|d =1) – E(Yi0|d =0)]=
(4)
ATT+Viés de seleção
Assim, na ausência de viés de seleção, é possí- 2.3 O Efeito Médio do Tratamento Local (LATE)
vel estimar o ATT pela simples diferença dos resul-
tados médios dos grupos de tratamento e controle. Conforme Imbens e Angrist (1994), o LATE
pode ser entendido como efeito médio do tratamento
Alternativamente, quando não é possível afas-
para as unidades, cujo status do tratamento é influen-
tar a possibilidade de ausência de viés, mais uma
ciado por mudanças em uma variável instrumental,
vez recorre-se a hipótese de ignorabilidade para
Z, satisfazendo uma restrição de exclusão. Nesse
obter um estimador condicionado as característi-
caso, a VI determina, em parte, a participação no
cas observáveis na forma:
tratamento, mas não é correlacionada com o seu re-
ATT(x) = E(Yi1 | x,d =1) – E(Yi0| x,d =0) (5) sultado potencial, de modo que é possível utilizá-la
para aferir o efeito médio do tratamento. Contudo,
3 Algum avaliador podem ainda está interessado no efeito do
tratamento sobre os não tratados, ATNT = E(Yi1|d=0)-E(Yi1∨d=1). esse efeito médio refere-se apenas ao subconjunto

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018

11
Sessão revisão de literatura

dos indivíduos cujo comportamento foi alterado em grupo será aquele cujo resultado será afetado, e con-
função de Z, por isso o efeito é local, sendo, via de sequentemente integrará o LATE.
regra, não expansível a população como um todo.
Uma forma mais simples de compreender o pro- Quadro 1 – Ilustração do caso com Z binário.
blema é tomando o exemplo de uma variável ins- Z=0 Z=1
trumental binária que quando assume valor igual a Participou
complier/never-taker never-taker
do programa
um aumenta a chance de participação no programa
Não participou
(monotonicidade). Assim, podem-se delimitar três always-taker complier/always-taker
do programa
casos: (i) os aways-takers, que participariam do pro- Fonte: Elaborado pelos autores.
grama independentemente da variável instrumental;
(ii) os never-takers, que nunca participariam do pro- Adicionando a hipótese de restrição de exclu-
grama; e, finalmente, (iii) os compliers, que seguem são, de que o resultado depende apenas do status
exatamente a orientação da variável Z. Esse último do tratamento, o efeito médio do tratamento para o
grupo dos compliers é dado por:

E(Yi|Zi=1) – E(Yi|Zi=0)
LATE(Z)=E(Yi|Zi=1, Ti=1) – E(Yi|Zi=0, Ti=0)= (6)
P(Ti=1|Zi=1) – P(Ti=1|Zi=0)

2.4 O Efeito Marginal do Tratamento (MTE) tros são iguais, portanto, se a Cov(U1 – U0, UD)=0
todos os quatro parâmetros se reduzem ao ATE.
Se o custo de participação for definido como Neste caso, não existe nada não observado pelo
C=Zθ+UD, em que Z é a variável instrumental avaliador que influencie o individuo na decisão
definida anteriormente e UD é o componente não de participação do tratamento. Por outro lado, se a
observado deste custo, o MTE avalia o efeito do Cov(U1 – U0, UD)>0, o ATT será maior que o ATE.
tratamento para indivíduos, cujo componente não Portanto, as pessoas se selecionam para o tratamen-
observado do custo de participação, UD, é igual a to com base em seu ganho idiossincrático, sendo
um determinado valor. o ganho dos indivíduos observados no estado de
tratamento maior do que de um indivíduo médio.
MTE(x) = E(Yi1–Yi0∨x,Ud =ud)
(7)
E(Yi1–∨x,Ud =ud) – E(Yi0–∨x,Ud =ud) 3 MÉTODOS DE AVALIAÇÃO
A avaliação do MTE para um valor baixo de ud 3.1 Experimentos Aleatórios5
mensura o ganho no resultado para indivíduos, cujo
fator não observado os tornam menos prováveis a A necessidade de aleatorização surge do pro-
participar, enquanto que a avaliação do MTE para blema da inferência causal, uma vez que, em mui-
valores altos de ud é o ganho para os indivíduos, tos casos, torna-se difícil estimar o impacto do
cujo fator não observado os tornam mais prováveis tratamento sobre um grupo de indivíduos, dado
a participar. O MTE também pode ser expresso em que outros fatores que afetam o resultado podem
termos do LATE, sendo o efeito marginal do tra- ter sofrido mudança desde a introdução do trata-
tamento avaliado em termos de ganhos dos indiví- mento. Dessa forma, o resultado pode, em parte,
duos que estão indiferentes entre participar ou não ser decorrente da mudança nessas variáveis e, não
do tratamento. Esse caso ocorre quando o custo de devido ao tratamento.
participação é igual a zero, ou seja, Ud = (–Zθ). A aleatorização também é justificável em pro-
gramas já existentes como, por exemplo, quando
MTE(x) = E(Yi1–Yi0|x,Ud =–Zθ]) (8) a demanda pelo tratamento excede a oferta ou
quando o tratamento é dado de forma progressiva.
Heckman et al. (2001) mostraram que sob inde- Nesse último caso, o grupo comparação pode ser
pendência entre UD e U1 – U0,4 todos os parâme- afetado por sua participação futura no tratamento
4 Termo do erro aleatório para as equações de resultados potenciais, 5 Duflo et al. (2006) forneceram um guia prático para avaliação de
definidas na seção 3.2.1. experimentos aleatórios.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018


12
Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

deixando, portanto, de ser um contrafactual válido. Por sua vez, se uma determinada covariada
Outros exemplos em que, mesmo com a aleatori- exerce maior influência sobre a variável resultado,
zação, o grupo comparação pode não ser um con- a estratificação da amostra dentro de grupos que
trafactual válido surgem quando há compliance possuem valores similares de certas características
imperfeito (parcial), externalidades ou atrito. observadas pode aumentar a precisão das estima-
Se apenas parte das unidades do grupo de trata- tivas. Assim, a aleatorização dentro dos estratos
mento é tratada ou, inversamente, quando algumas pode ser usada tanto quando se deseja reduzir a
unidades do grupo comparação recebem o trata- variância, como quando se deseja estudar o efeito
mento, se diz que o compliance é imperfeito. Uma tratamento sobre um subgrupo específico. Uma es-
das explicações para existência de compliance im- timativa do efeito tratamento é obtida ao estimar:
perfeito é a dificuldade em controlar as escolhas do
grupo comparação. Yij = αi + ßd di + Eij+ ~ ~ij (11)
vj + w
As externalidades surgem quando os resultados
Por OLS, em Eij é um conjunto de variáveis
das unidades não tratadas são afetados pelo trata-
dummies indicando o estrato de cada observação.
mento. A literatura tem encontrado diversos efeitos
spillovers como efeitos físicos, mudanças de preços A avaliação experimental, entretanto, é difícil
ou na forma de aprendizagem e efeitos imitação. O de ser implantada. Muitas vezes requer parcerias
atrito se refere à perda de dados que fizeram parte com os responsáveis pela implantação do
da amostra original. Se o atrito for aleatório ele so- programa, estando a aleatorização inserida dentro
mente reduzirá o poder do teste. Entretanto, se ele de um projeto piloto. No entanto, avaliação com
estiver relacionado ao tratamento pode resultar em parceria governamental é rara, pois requer um
estimativas viesadas. Ou seja, se o atrito for maior alto nível de cooperação política, o que faz muitos
entre as unidades beneficiadas pelo programa e o avaliadores buscarem parcerias com ONGs e
pesquisador ignorar essa informação, as estimativas empresas privadas para sua realização.
do efeito do programa podem ser sobreestimadas.
O estimador de mínimos quadrados ordinários 3.2 Métodos Não experimentais
providencia uma estimativa não viesada do impacto Se o tratamento não foi aleatório, as unidades
do programa sobre a população de tratados, quando não podem ser diretamente comparadas, pois aque-
a avaliação aleatória foi corretamente desenhada e las expostas ao tratamento diferem em algumas
implantada. Neste caso, o AT ^E pode ser obtido por
características das que não foram expostas, o que
uma regressão de mínimos quadrados ordinários poderia afetar a variável resultado. Com base nessas
Yi = αi + ßd di + Ui (9) diferenças alguns métodos fornecem estimativas de
impacto de programas baseadas em hipóteses en-
Em que di é a uma dummy para participação no volvendo características observáveis ou não.
grupo tratamento, e ß =E^ (Y ∨d =1)–E^ (Y ∨d =0)
ols i1 i0
3.2.1 Seleção sob Observáveis
mensura o efeito do tratamento.
O controle sob covariadas que, provavelmente, Os métodos de seleção sob observáveis baseiam-
alterem o resultado pode não afetar o valor esperado -se na hipótese de que, dado o vetor de caracterís-
do estimador ßols, mas reduzem sua variância. Assim, ticas X, os resultados potenciais são independentes
o controle por variáveis que possuem um extenso do tratamento, ou seja, (Y1, Y0)T ∨X. Portanto, a
impacto sobre os resultados podem ajudar a reduzir probabilidade de ser tratado dependeria somente de
o erro-padrão das estimativas. Isso é especialmente X, podendo ser expressa com uma função probabi-
útil quando se está trabalhando com amostras peque- lidade condicional p(X). Neste sentido, admite-se a
nas. Neste caso, deve-se considerar a equação: existência do viés de seleção, mas o avaliador obser-
va todas as características relevantes para a seleção.
Yij = αi + ßd di + Xij γ+ ~ ~ij (10)
vj + w Métodos de Regressão
Como discutido anteriormente, o efeito médio
Em que: Xij é um conjunto de variáveis de con-
do tratamento, condicional sob as covariadas rele-
trole e, ~ ~ij representam a variância não expli-
vj e w
vantes, é dado por:
cada após controlar por Xij.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018

13
Sessão revisão de literatura

ATE(x) = Yi= di Yi1+(1– di)Yi0 (12) No entanto, ao contrário do método de regressão o


matching não é eficiente, pois utiliza apenas uma
Supondo que as equações de resultados potenciais parte da amostra.
tenham a forma linear e a seguinte especificação:
Pareamento por Escores de Propensão
Yi1= α1+δdi+Xi ß1+Ui1, se di > 0 (Propensity Score Matching)
(13) O problema do enfoque de regressão é que ele
Yi0= α0+δdi+Xi ß0+Ui0, se di ≤ 0 impõe uma suposição de normalidade sobre os ter-
mos do erro, E(Ui1∨x) e E(Ui0∨x), que são ter-
Desse modo, a formação do grupo comparação
mos desconhecidos. No matching, o problema é a
requer uma média de unidades desconhecidas, que
condicionalidade, que corresponde ao agrupamen-
sob ignorabilidade pode ser obtida pela média das
to das observações sobre as covariadas relevantes.
observações do grupo controle que possuam X
Em casos de covariadas contínuas, esse agrupa-
iguais aos do grupo tratamento, portanto, a equa-
mento pode tornar-se impossível.
ção para a variável resultado observada poderá en-
tão ser escrita na forma: Alternativamente, o propensity scores se baseia
na suposição de ignorabilidade do tratamento para
Yi= α0+δdi+Xi ß1+εi (14) propor um estimador para o ATE(x) que não im-
põe a restrição da forma funcional, e que também
que sob ignorabilidade estima o efeito trata- reduz a dimensionalidade dos condicionantes. Ro-
mento por mínimos quadrados ordinários: senbaum e Rubin (1983) a partir da suposição de
ignorabilidade ofereceram uma solução potencial
E(Yi ∨ di Xi)= α0+δdi +Xi ß1 (15) para os problemas dos outros enfoques. Seja p(Xi)
a probabilidade da unidade i ter sido destinada ao
Método de Pareamento (Matching) tratamento, definido como:
No matching, o grupo comparação é construído
p(Xi)=P(Ti =1|Xi)=E(Ti|Xi), em que
por meio de um pareamento, ou seja, busca-se for-
mar pares de comparação formados entre cada in- 0< p(Xi)<1, portanto (Yi1,Yi0)T (17)
i/Xi
divíduo do grupo tratamento. Para cada individuo implica (Yi1, Yi0)Ti/p(Xi)
i, se Y1i(1) é observado (Ti=1), então Y1i(0) é um
missing (Ti=0). Desse modo, buscam-se indivídu- De acordo com Rosenbaum e Rubin (1983),
os j, tais que Tj=0, e que satisfaçam: se a participação no tratamento é fortemente ig-
norada, dado o vetor X, então as diferenças entre
||Xi – Xj||≤||Xi – Xl||, l tal que Tl=0 (16) as médias dos tratados e comparação, naquele
escore de balanceamento, é uma estimativa con-
Em geral, ||Xi – Xj|| será diferente de zero fiável do efeito do tratamento para aquele valor,
tornando as estimativas do ATE e ATT viesadas consequentemente, o propensity scores produz
assintoticamente em decorrência da imperfeição estimativas não viesadas do efeito médio do tra-
do matching. O estimador de matching também tamento. Portanto, a probabilidade de participar
não é eficiente, uma vez que não utiliza toda a do tratamento condicional as covariadas pode
amostra, mas apenas aquelas unidades com o X ser denotada por:
mais próximo do grupo tratamento. Existe tam-
bém trade-off entre viés e variância nesse esti- e(x) = pr(d=1|x)
mador, visto que o aumento no número de obser-
vações a servir de par para uma mesma unidade pr(d1...dn|X1...Xn)= (18)
observada aumenta o viés, pois aumenta a dis- n
tância, enquanto diminui a variância por utilizar Π e(Xi)di{1–e(Xi)}1–di
i=1
mais informações.
Neste caso, a função propensity scores, e(x),
O matching também pode ser visto como um
é sempre desconhecida e não existe nenhuma es-
caso particular da regressão, que quando estima-
pecificação previamente aceita, podendo e(x) ser
do pelo vizinho mais próximo e número de vizi-
estimada por logit.
nhos fixo, é algebricamente idêntico à regressão.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018


14
Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

Propensity Score Generalizado No entanto, este estimador só será consisten-


O método de pareamento por escore de propen- te quando não houver tendências temporais ou
são assume que o tratamento é atribuído de ma- mudanças macroeconômicas agregadas, ou seja,
neira uniforme entre os participantes do programa, somente se E(Y0t /d=1)=E(Y0t' /d=1), onde t’ re-
contudo, existem situações em que cada unidade presenta o período após a implantação do progra-
recebe diferentes “dosagens” do tratamento. Nesse ma. Na presença de tais fontes de inconsistências,
intuito, Imbens (2000) e Hirano e Imbens (2004) o estimador de diferença em diferenças será mais
propuseram uma generalização do PSM, que robusto. Tal método avalia o efeito do tratamento
considerasse os diferentes níveis de tratamento. pela comparação entre as mudanças antes e depois
das unidades tratadas com as mudanças antes e de-
Sobre a hipótese de ignorabilidade, assume que
pois das unidades não tratadas.
X⊥1{T=t}∨r(t, X), em que r é o escore de propen-
são generalizado, e ainda que T∨X N(ß0 + ß1X, σ2).
DD=[E(Y1t|d=1)–E(Y1t|d=0)]–
Assim, é possível estimar r em um primeiro está-
gio pelo método de máxima verossimilhança. No (21)
[E(Y0t|d=1)–E(Y0t|d=0)]
segundo estágio, por sua vez, modela-se a expec-
tativa condicional de Y dado r e T, a partir de uma Modelos de dados em painel providenciam
forma flexível, com a forma quadrática: uma forma geral para estes estimadores:

E(Y |r,T)= α0+α1T+α2T 2+α3r̂+α4r̂ 2+α5 T×r̂ (19) Yit=α0+µi+µt+ßd dit+Xit ß1+Uit (22)

Dessa forma, é possível obter o efeito do Sendo que ßd é o estimador de impacto do pro-
tratamento para cada nível t, assim como ob- grama para dados em painel, µi é o termo especi-
ter o efeito marginal do tratamento tomando fico da unidade i, µt é o termo tempo invariante,
θ(t)= E[Y (t+ε )]–E[Y(t)]. ß1 são os impactos das outras covariadas e εit é o
termo do erro.
3.2.2 Seleção sob não Observáveis Variável Instrumental
Em alguns casos, a escolha de participar do tra- Imbens e Angrist (1994), seguindo os avaliado-
tamento é determinada por características não ob- res que criticam os métodos de avaliação baseados
serváveis, o que torna o controle das observáveis em regressão, propuseram um método para esti-
insuficiente para eliminar o viés de seleção. Nesse mação dos efeitos causais em termos de resultados
sentido, os métodos de seleção sob não observá- potenciais ou contrafactuais, em vez de parâme-
veis fornecem alternativas para formação de um tros dos modelos de regressão. Os estimadores de
grupo comparação. variável instrumental possuem a vantagem de re-
quererem suposições mais fracas que os métodos
Métodos Longitudinais
de regressão linear. Contudo, seus resultados não
Uma forma simples de avaliação consiste em
podem ser generalizados para a população, sendo
examinar os resultados das unidades tratadas an-
restritos a indivíduos que estão no limiar para rece-
tes e após a implantação do programa. A suposição
ber o tratamento, sendo diferenciados apenas pelo
implícita deste método é que as unidades tratadas
vetor de variável instrumental, Z.
deveriam apresentar os mesmos resultados, caso
Assim, os autores adotam uma estratégia de
não tivessem sido submetidos ao tratamento. As-
variável instrumental para identificar o efeito do
sim sendo, os resultados antes da implantação do
tratamento. Essas estimativas serão consistentes
programa fornecem um bom grupo comparação.
desde que a variável instrumental, zi, seja indepen-
Desse modo, os métodos longitudinais estimam
dente das variáveis de resultados potenciais Y1i e
o efeito do tratamento sobre as unidades tratadas,
ou seja, o ATT. O estimador antes-depois se baseia
Y0i, e correlacionada com o indicador de partici-
pação di. Quando os instrumentos são binários, o
nesta suposição para formar um grupo comparação:
LATE pode ser estimado por Wald:
BA = E(Y1t|d=1)–E(Y0t|d=1) (20) E (Y ∨ Z=1)–E (Y ∨ Z=0)
VI= (23)
Pr (d=1∨Z=1)–Pr(d=0∨Z=0)

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018

15
Sessão revisão de literatura

Modelos de variável latente, por sua vez, são regra de participação ao tratamento é arbitrária,
frequentemente empregados para instrumentos por isso proporciona um bom experimento.
contínuos ou múltiplos instrumentos em que a de- Em programas que se caracterizam como dese-
cisão de participação é modelada por: nhos RD, a participação do tratamento é definida
por uma variável de designação, sendo o tratamen-
di*=γ0+Ziγ1 + vi (24) to uma função contínua dessa variável. No entanto,
a existência do tratamento como uma função con-
Desse modo, a equação de resultado é relaciona- tínua da “variável de designação” não é suficiente
da com o tratamento pela decisão de participação: para aplicação de RD, uma vez que esse desenho
é inválido, se indivíduos são capazes de manipular
Yi=ß0 + di ß1 + Ui (25)
precisamente essa variável.
Em que: Não existe um consenso na literatura sobre a
forma funcional desses desenhos, sendo utilizadas
di= 1 se di* > 0 (26) estimações paramétricas ou não paramétricas. Po-
0 se di* ≤ 0
rém, ambas podem viesar as estimativas do efeito
tratamento. A estimação paramétrica precisa da su-
3.3 Desenhos de Regressão com posição de linearidade da forma funcional, no en-
Descontinuidade tanto, não existe nenhuma razão a priori para acre-
ditar que a verdadeira forma funcional seja linear.
Os desenhos de RD6, originalmente introduzi-
dos por Thistlethwaite e Campbell (1960), são ou- Uma forma de relaxar essa suposição é incluir
tro tipo de estimador de LATE, cuja estimação se funções polinomiais na “variável de designação”
dá pela comparação entre aqueles que estão logo do modelo de regressão, o que corresponde ao en-
abaixo e logo acima do ponto de corte para o rece- foque de regressão em séries. A desvantagem deste
bimento do tratamento. enfoque é que ele providencia estimativas globais,
enquanto que o desenho de RD depende de esti-
Existem dois tipos de desenho de RD, sharp e
mativas locais ao redor do ponto de corte. A re-
fuzzy. O desenho sharp é um caso de seleção sob
gressão de kernel, que também é um estimador não
observáveis, enquanto o fuzzy é um tipo de esti-
paramétrico, é um método local para estimação da
mador de variável instrumental. No desenho sharp,
função de regressão em um ponto particular. En-
a participação no tratamento depende da “variável
tretanto, regressão de kernel pode não possuir um
de designação” de forma determinística. No dese-
bom desempenho em desenhos de RD, em que o
nho fuzzy, a dependência é probabilística e deter-
ponto de corte representa um ponto de fronteira.
minada por um propensity scores. Mesmo que a
elegibilidade dependa de uma regra de ponto de Por fim, pode-se afirmar que o mais importante
corte, nem todos os elegíveis são tratados, pois a na aplicação dos desenhos de RD é analisar a ro-
regra nem sempre é satisfeita. bustez das estimativas à inclusão de termos poli-
nomiais de ordem superior, na regressão em série,
A suposição básica para formação do grupo
ou a mudanças na largura da janela ao redor do
comparação é que os agentes são incapazes de
ponto de corte, na regressão kernel.
controlar precisamente a “variável de designação”
ao tratamento próximo ao ponto de corte. Como
resultado dessa suposição, os desenhos de RD são 3.4 Controle Sintético
frequentemente definidos como um quase-experi-
O método do controle sintético, desenvolvido
mento7, já que o tratamento é considerado como
por Abadie e Gardeazabal (2003), utiliza como es-
localmente aleatório. Portanto, a hipótese de iden-
tratégia para a construção do grupo comparação,
tificação de RD é baseada na suposição de que a
uma média ponderada das outras regiões que não
receberam intervenções, a qual deverá ser compa-
rada com a região que efetivamente recebeu in-
6 Lee e Lemieux (2010) discutiram exaustivamente aplicações de
RDD em economia.
tervenção. Essa média é denominada de grupo de
7 Os experimentos aleatórios, assim como os desenhos de RD, controle “sintético”.
devem ser considerados como um processo gerador de dados e,
não como um método.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018


16
Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

De acordo com Abadie (2015), pode-se assumir Portanto, os estimadores de controle sintético de
sem perda de generalidade, que o primeiro país ŶNit e τ1t são, respectivamente:
(j=1) é afetado pela intervenção política de inte-
resse e que j=2,...,J é uma coleção de regiões não ŶNit = w2Y2t+...+wjYjt e:
afetadas pela intervenção. Assume-se também que (28)
o conjunto de dados compreende T períodos e que τ̂ 1t= Y1t – ŶNit
T0 ocorre antes da intervenção. Para cada região, j,
Portanto, a distância entre a variável de interes-
e tempo, t, assume-se um resultado de interesse yjt.
se efetiva e a variável de interesse sintética fornece
Também, assume-se para cada região j, um con-
o efeito decorrente da intervenção.
junto de k preditores do resultado: X1j,...,Xkj (que
podem incluir valores pré-intervenção de Yjt). Para As principais limitações para aplicação desse
cada região afetada pela intervenção, j=1 e perí- método se referem: (i) ao tamanho do impacto e a
odo pós-intervenção, t >T0, em que os resultados volatilidade da variável de interesse, uma vez que
potenciais devem ser observados com e sem inter- pequenos efeitos de intervenção podem não ser iso-
venção, Y 1tI e Y 1tN, respectivamente. Desse modo, o lados de choques aleatórios; (ii) o grupo placebo
efeito da intervenção para a região afetada no perí- deve ser formado apenas por variáveis que não ti-
odo t (com t >T0) é dado por: veram intervenção; (iii) inexistência de efeitos não
antecipados da política, ou seja, o efeito da política
τ1t= Y 1tI – Y 1tN (27) deve ocorrer após sua intervenção; (iv) ausência de
efeitos transbordamentos, ou seja, os benefícios de
Como a região 1 é exposta ao tratamento após uma unidade tratada ultrapassam sua fronteira geo-
o período T0, tem-se que para t >T0, Y 1t – Y1tI. Para gráfica e (v) a combinação de unidades não tratadas
a região afetada pela intervenção, observam-se no consegue aproximar as características pré-interven-
período pós-intervenção um resultado potencial ção na unidade afetada pela política.
sobre intervenção. A mudança na política é dada
pela estimação do contrafactual, Y tN para t >T0, ou 4 EVIDÊNCIAS EMPÍRICAS
seja, como se comportaria Y tN na localidade afeta-
da na ausência de tratamento. Isso é um resultado
APLICADAS AO CONTEXTO DOS
contrafactual, uma vez que a região afetada foi, por PROGRAMAS OPERACIONALIZADOS
definição, exposta a intervenção após t >T0. Fica PELO BANCO DO NORDESTE
claro, portanto, que Y1tI é observado, o problema de
estimação do efeito da intervenção é equivalente No contexto dos programas operacionalizados
ao problema de estimar Y1tN. pelo Banco do Nordeste, a aplicação de métodos
de avaliação de impacto foi, inicialmente, motiva-
A estimação do efeito da intervenção consiste,
da pela dificuldade de expansão das ações de apoio
portanto, na estimação de Y1tN, o qual corresponde
ao crédito. Desse modo, com objetivo de subsi-
ao valor da variável resultado na ausência da in-
diar ações de incremento e qualidade de acesso ao
tervenção, usando uma unidade não afetada ou um
crédito nas atividades microempresariais urbanas
pequeno número de unidades não afetadas que te-
nordestinas, o Banco do Nordeste encomendou a
nham características similares com aquelas da uni-
Fundação Getúlio Vargas – FGV8 estudo para ava-
dade afetada no momento da intervenção.
liação do Crediamigo, principal programa de mi-
O método de controle sintético baseia-se, por- crocrédito do País.
tanto, na suposição, de que a combinação de uni-
O estudo deu origem ao livro “Microcrédito, o
dades no grupo com características semelhantes
mistério nordestino e o Grameen brasileiro: perfil
da unidade tratada são um grupo comparação sig-
e performance dos clientes do Crediamigo”, or-
nificativamente melhor do que qualquer unidade
ganizado pelo professor Marcelo Neri, reunindo
afetada sozinha. Formalmente, o controle sintéti-
onze artigos. Dentro dessa perspectiva, o artigo
co pode ser representado por um vetor (Jx1) de
de Neri e Medrado (2008) utilizou o método de
pesos W=(w2,...wj), com 0 ≤ wj ≤ 1 para j=2,...,J e
w2+...+wj =1. A escolha de um valor particular para
8 O CrediAamigo (Programa de Microcrédito Produtivo Orientado)
W é equivalente a escolher um controle sintético. foi concebido, em 1997, como projeto piloto em cinco unidades no
Nordeste. No ano seguinte, foi expandido com a criação de 45 unidades.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018

17
Sessão revisão de literatura

diferenças em diferenças para analisar o impacto ingressantes como grupo de comparação pode en-
do Crediamigo sobre o microcrédito. Após con- viesar as estimativas9.
trolar por outras variáveis relevantes que afetam A limitação da construção de um grupo com-
a variável de interesse, os autores estimam que, paração formada por indivíduos não beneficiados
entre 1997 e 2003, aumentou a chance de crédito também foi retratada na avaliação do PRONAF re-
no Nordeste tanto no agregado quanto no fluxo, alizado pela consultoria Datamétrica (2013) para
aumentou a chance de estar endividado e diminuiu o Banco do Nordeste. De acordo com Relatório, o
a chance de se reclamar da falta de crédito, bem ideal seria utilizar agricultores beneficiados pelo
como diminuiu a chance de se reclamar da falta de programa para constituírem a categoria tratamen-
crédito somada à falta de capital. to, e agricultores não beneficiados para constituí-
Em avaliação do CrediaAmigo para os empre- rem a categoria comparação.
endimentos dos municípios atendidos pelo Banco Na impossibilidade dessa estratégia, dada a
do Nordeste no norte de Minas Gerais, Capobiango, inexistência de cadastros com nomes e endereços
Silveira e Braga (2012) usaram a metodologia de de agricultores não beneficiários, optou-se por for-
propensity scores matching. Os autores a partir da mar a categoria comparação pelos beneficiários
base do programa identificaram a primeira e última mais recentes do programa, ou seja, aqueles que
operação para formar o grupo controle e o grupo possuem um único contrato de crédito com o Ban-
comparação. Desse modo, formaram o grupo trata- co. A hipótese implícita para adoção desse crité-
mento com os clientes cujo prazo entre a primeira rio é a de que o impacto do crédito concedido aos
e a última operação foi de pelo menos 180 dias, agricultores é pequeno devido ao pouco tempo de
e que estavam ativos em 31/12/2010, enquanto, os exposição ao Programa.
clientes que fizeram sua primeira operação entre ju-
A política de desenvolvimento regional
nho e dezembro de 2010 foram considerados como
(PNDR) também tem sido extensamente avaliada
grupo controle. Encontrou-se como resultado geral
por essas metodologias. Silva, Resende, Silveira
impacto positivo e significativo nas variáveis de re-
Neto (2006) realizaram avaliação econômica dos
sultado dos empreendimentos atendidos.
Fundos Constitucionais de Financiamento do Nor-
Dentro da mesma motivação do que foi reali- deste (FNE) e do Norte (FNO) a partir de estima-
zado para o CrediAmigo, o Banco do Nordeste, tivas de propensity scores das firmas beneficiadas
na condição de principal financiador do Pronaf na por esses fundos e de um conjunto de firmas não
região Nordeste e norte de Minas Gerais e Espírito beneficiadas. Os autores focaram a avaliação de
Santo, realizou em parceria com a Fundação Insti- impacto nas variáveis taxa de variação do empre-
tuto de Pesquisas Econômicas (Fipe), estudo para go e a taxa de variação dos salários médios pagos
avaliação do Agroamigo e do Pronaf B tradicional. pelas firmas, entre os anos de 1995 e 1998. Além
O referido estudo foi publicado na forma de livro, disso, a análise se restringiu às empresas tomado-
intitulado “Cinco anos de Agroamigo: retrato do ras dos recursos do fundo, identificadas na RAIS
público e efeitos do Programa”. (Relação Anual de Informações Sociais) de 1995.
Nesse estudo, Abramovay et al. (2012) utili- O trabalho apresenta como resultado geral, impac-
zaram o método de diferenças em diferenças para to positivo sobre a taxa de variação do número de
estimar o impacto do Programa em indicadores empregados e ausência de impacto sobre a taxa de
relacionados à produção, vendas e acumulação de variação do salário médio pago pelas firmas.
riqueza. A estimativa de impacto do Programa é
realizada comparando a evolução das variáveis 9 Os autores argumentam que a utilização dos ingressantes do
de interesse em dois grupos: os indivíduos com Agroamigo como grupo comparação pode refletir apenas
mais tempo de exposição ao programa (grupo de tendências comuns a toda população, podendo não ter relação com
o Programa. Para tentar isolar o efeito dessas outras variáveis e
tratamento), e os indivíduos ingressantes no Agro- diminuir o viés nas estimativas de impacto, os autores controlam
amigo (grupo comparação). A metodologia sugere por outras variáveis que podem afetar as variáveis de interesse. Os
efeitos positivos entre os clientes expostos a mais autores argumentam, ainda, que os resultados da análise de impacto
tempo em comparação aos ingressantes para todas devem ser interpretados com cautela, porque existem características
não observadas entre clientes mais antigos e clientes ingressantes
as variáveis estudadas, entretanto, a utilização dos que são difíceis de mensurar, e que poderia estar influenciando um
crescimento mais rápido em indicadores como produção, vendas e
riqueza, o que tenderia a superestimar os efeitos do Programa.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018


18
Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

Posteriormente, os mesmos pesquisadores autores para tentar captar o efeito dose-resposta da


(SILVA; RESENDE; SILVEIRA NETO, 2009) política. Os resultados da estimação de efeitos fi-
realizaram avaliação para os três Fundos Consti- xos mostraram um efeito positivo de 2,5 p.p. sobre
tucionais - FNE, FNO e FCO – comparando a efi- o salário médio pago pelas empresas beneficiadas
cácia dos gastos desses Fundos na taxa de variação pelos empréstimos do FNE, quando comparadas às
do número de empregados e na taxa de variação não beneficiadas. Essa abordagem não mostrou di-
do salário médio pago pelas firmas por meio de ferença estatisticamente relevante no volume total
estimativas de propensity scores das firmas bene- de emprego entre as empresas. Da mesma forma, o
ficiadas por esses fundos e de um conjunto de fir- modelo de propensity score matching também não
mas não beneficiadas, identificadas na RAIS, entre encontrou qualquer efeito do Fundo sobre o salário
2000 e 2003. Em relação ao FNE, tem-se como ou o nível de emprego. Por fim, a função dose res-
resultado geral que não foi possível encontrar im- posta resultante do método generalizo sugere um
pacto positivo da aplicação dos recursos para taxa efeito positivo, mas não linear do FNE sobre os
de variação do salário médio; por outro lado, ve- salários, mas não é conclusiva.
rificou-se impacto positivo para a taxa de variação O PRODETUR/NE-II10 programa de fomento
do número de empregados. ao turismo na região Nordeste, cuja operacionali-
Soares, Sousa e Pereira Neto (2009) expandi- zação foi realizada, em conjunto, pelo Banco do
ram a análise de Silva, Resende e Silveira Neto Nordeste, Banco Interamericano de Desenvolvi-
(2009) com a inclusão de mais períodos de ava- mento (BID) e os governos federal, estadual e mu-
liação para observar a evolução de impactos, ano nicipal, teve avaliação de impacto realizada pelo
a ano, após a concessão dos financiamentos nas método de controle sintético. Para ser avaliado por
variáveis, estoque de emprego, massa salarial e esse método, o programa tem que satisfazer a dois
salário médio, entre 1999 e 2005. Os resultados requisitos: i) a formação de unidade de controle e
indicam impacto considerável do FNE no estoque tratamento e ii) definição de um marco lógico tem-
de emprego das empresas do Nordeste e da massa poral de implementação de política.
salarial, mas não se encontra impacto no salário Em relação ao primeiro requisito, observa-se que
médio. Ou seja, o aumento das contratações ocor- os polos não tratados são, realmente, potenciais com-
reu sob os salários vigentes. ponentes sintéticos dos polos beneficiados. Como
Análise semelhante foi realizada por Soares et características comuns observa-se que a maioria dos
al. (2014), os autores aplicaram a metodologia de polos está localizada em regiões costeiras, sugerin-
matching com propensity scores para avaliar os do o mesmo tipo de estrutura turística, além de bai-
impactos do FNE (Fundo Constitucional de Finan- xo efeito transbordamento dada a pequena área de
ciamento do Nordeste) em variáveis do mercado fronteira comum entre os polos beneficiados.
de trabalho formal. Foi avaliado o crescimento no O segundo requisito é cumprido com alguma
estoque do emprego, do salário médio e da massa limitação, dado que os recursos e serviços nos po-
salarial ao longo de cinco anos, utilizando como los beneficiados foram sendo realizados ao longo
base de dados a RAIS, a qual foi desagregada por dos anos, dificultando a definição de um marco
setores de atividade e por áreas específicas do Nor- lógico temporal, pois embora o programa tenha
deste (Semiárido fora do Semiárido, e regiões da começado, em 2004, uma soma mais expressiva
Política Nacional de Desenvolvimento Regional - dos recursos apenas foi investida a partir de 2007,
PNDR). Encontrou-se, como resultado, geral, que e uma soma superior a de 2007, foi liberada, em
os diferenciais são favoráveis às empresas bene- 2010 (Gráfico 1).
ficiadas pelo FNE, e que esse diferencial cresce à
A despeito do PRODETUR/NE-II atender aos
medida que o período de tempo aumenta.
requisitos exigidos pelo método de controle sintéti-
Além da abordagem usual de efeitos fixos e co, mesmo que, parcialmente, apenas em 28 situa-
pareamento por Escore de Propensão, Oliveira et
al. (2017) avaliaram o efeito dos Fundos Consti- 10 O PRODETUR-II teve como objetivo ampliar as ações
tucionais sobre o volume de emprego e produti- voltadas para o Programa de Desenvolvimento do Turismo
(PRODETUR-I), iniciado em 1995, com objetivo de incrementar
vidade do trabalho (salário médio). A técnica de a atividade turística nordestina na área de atuação da SUDENE,
propensity score Generalizado é utilizada pelos o que envolve os nove estados nordestinos e à região norte do
Estado de Minas Gerais.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018

19
Sessão revisão de literatura

ções das setenta e duas possibilidades de utilização observação cuidadosa do processo de participação
do método (dadas pelos nove polos de tratamento no tratamento, a fim de fundamentar a hipótese de
e as oito variáveis de resultados selecionadas), foi identificação do método adotado.
possível encontrar um grupo de controle sintético. Quando a designação aleatória ao tratamen-
Na maior parte dos casos em que não foi possível to é bem realizada, o pesquisador não precisa se
encontrar resultados, a condição de convexidade preocupar com o viés de seleção, uma vez que a ale-
não foi atendida, ou seja, o polo tratado possuía atorização torna o tratamento independente dos re-
valores muito mais alto ou muito mais baixo em sultados potenciais. Entretanto, quando as unidades
alguma variável de interesse que todos aqueles não participam de um programa de forma voluntária,
tratados, de tal forma que a formação de grupo de existe um viés de seleção que precisa ser isolado.
controle sintético não conseguiu ser dada pela con-
Nesses casos, métodos não experimentais for-
dição de convexidade11.
necem como alternativa o controle por caracterís-
No geral, isso aconteceu para as variáveis que ticas que influenciam na decisão de participação
são influenciadas diretamente pelo tamanho dos do tratamento. Se a participação do tratamento é
pólos como PIB, PIB per capita, valor adicionado definida por características observadas pelo ava-
dos serviços, empresas, empregos e arrecadação liador, métodos de seleção sob observáveis forne-
de impostos todas em nível. Para as variáveis da- cem uma boa solução para o problema de viés de
das em termos de participação, tal como a partici- seleção. Mas, se existirem fatores não observados,
pação dos serviços no valor adicionado e o salário que são decisivos para a participação do tratamen-
médio, foi possível estimar resultados. to, a estimação do efeito tratamento dependerá de
hipóteses adicionais, identificadas por métodos de
Gráfico 1 – Evolução do Valor Adicionado dos Ser- seleção sob não observáveis.
viços Costa do Delta versus Sintético
Por fim, as evidências empíricas encontradas
nas avaliações dos Programas operacionalizados
pelo Banco do Nordeste reforçam que uma das
maiores dificuldades na estimação do impacto
de um Programa está na construção de um grupo
comparação válido. As avaliações, tanto internas
quanto externas, desses programas têm abordado
essa limitação, bem como buscado maneiras de
contorná-la por meio dessas metodologias.

REFERÊNCIAS
Fonte: Relatório de avaliação de impacto do Programa de Desenvol-
vimento do Turismo do Nordeste (Banco do Nordeste do Brasil).
ABADIE, A; DIAMOND; A.; HAINMUEL-
LER, J. Comparative Politics and the Synthetic
Control Method. American Journal of Polit-
5 CONSIDERAÇÕES FINAIS ical Science, v. 59, n. 2, p. 495–510, 2015.
A literatura de avaliação mostra diversas al- ABADIE, A; GARDEAZABAL, J. The Eco-
ternativas para estimação do impacto de um Pro- nomic Costs of Conflict: A Case Study of
grama. A seleção do método dependerá de muitas the Basque Country. The American Econo-
questões, em especial, de como é definida a par- mic Review, v. 93, n. 1. p. 113-132, 2003.
ticipação no tratamento, que pode ser aleatória
ou baseada em características observadas ou não ABRAMOVAY, R et al. Cinco Anos de Agroa-
pelo avaliador. A inferência correta do parâmetro migo: retrato do público e efeitos do Programa.
de interesse dependerá da validade da hipótese de Fortaleza: Banco do Nordeste, 113 p., 2012.
identificação de cada método. Portanto, o avalia-
DATAMÉTRICA – CONSULTORIA, PES-
dor deverá escolher o método com base em uma
QUISA E TELEMARKETING. Avaliação
11 Principalmente, para aqueles pólos que incluem as grandes do PRONAF – Relatório Final. Datamé-
capitais do Nordeste.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018


20
Metodologias de avaliação de políticas públicas: análise e aplicação dos principais métodos no contexto do Banco do Nordeste

trica – Consultoria, Pesquisa e Telemarke- dos clientes do Crediamigo. NERI, M. (orgs).


ting. Recife: Datamétrica, 216p., 2013. Rio de Janeiro: Editora FGV, 2008. 376 p.

BANCO DO NORDESTE DO BRASIL. OLIVEIRA, G. R.; RESENDE, G. M.; GON-


Relatório de avaliação de impacto do Pro- ÇALVES, C. N.; SILVA, D. F.; Efeitos Não
grama de Desenvolvimento do Turismo Lineares dos Fundos Constitucionais de Fi-
do Nordeste – Segunda fase (PRODETUR/ nanciamento entre 2000 e 2012. 45º Encontro
NE-II): Condicionalidades metodológicas, Nacional de Economia, 2017. Disponível em:
resultados exploratórios e perspectivas. For- <https://www.anpec.org.br/encontro/2017/
taleza: Banco do Nordeste, 60p., 2016. submissao/files_I/i10-88c58a83d6d4c2fe7e-
83012477f3141c.pdf>. Acesso em: 16/07/2018.
CAPOBIANGO, R. P.; SILVEIRA, S. de F.
R.; BRAGA, M. J. Avaliação do Impacto do ROY, A. D. Some Thoughts on the Distri-
Programa CrediAmigo nos Empreendimen- bution of Earnings. In: Oxford Economic
tos de Municípios no Norte de Minas Gerais. Papers, v. 3, n. 2, p. 135-146, 1951.
In: Encontro da ANPAD, 36., Rio de Janeiro:
22 a 26 de setembro de 2012. Disponível em: ROSENBAUM, P; RUBIN, D. The Cen-
< http://www.anpad.org.br/admin/pdf/2012_ tral Role of the Propensity Score in Ob-
APB1936.pdf>. Acesso em: 13 de set. 2016. servational Studies for Causal Effects. In:
Biometrika, v. 70, n. 1, p. 41-55, 1983.
DUFLO, E; GLENNESTER, R; KREMER,
M. Using Randomization in Development SMITH, J. Evaluating Local Economic
Economics Research: A Toolkit. 2006. Development Policies: Theory and Prac-
tice. In: Alistair Nolan and Ging Wond
IMBENS, G; ANGRIST, J. Identification and (eds). Paris: OECD, p. 287-332, 2004.
Estimation of Local Average Treatment Effects.
In: Econometrica, v. 62, n. 2, p. 467-475, 1994. SILVA, A. M. A. DA; RESENDE, G. M.; SIL-
VEIRA NETO, R. M. Avaliação econômica dos
HECKMAN, J; TOBIAS, J; VYTLACIL. Fundos Constitucionais de Financiamento do
Four Parameters of Interest in the Evaluation Nordeste (FNE) e do Norte (FNO). IPEA, Bra-
of Social Programs. In: Southern Econo- sília, Texto para discussão, n. 1207, p. 1-37, 2006.
mic Journal, v. 68, n. 2, p. 210-223, 2001.
______. Eficácia do Gasto Público: Uma
HIRANO, K.; IMBENS, G. The propensity score Avaliação do FNE, FNO e FCO. Estudos Eco-
with continuous treatments. In: GELMAN, A.; nômicos, São Paulo, v. 39, n. 1, p. 89-125, 2009.
MENG, X.-L. (Eds.). Applied Bayesian mo- Disponível em:< http://www.scielo.br/pdf/ee/
deling and causal inference from incomplete- v39n1/v39n1a04.pdf>. Acesso em: 15 set. 2016.
-data perspectives. Nova Iorque: Wiley, 2004.
SOARES, R. B. et al. Avaliações de Impac-
HOLLAND, P. Statistics and Causal Infer- to e Eficiência das Empresas Beneficiadas
ence. In: Journal of the America Statisti- pelo FNE: Geração de emprego, massa sa-
cal Association, n. 84, p. 862-880, 1986. larial e salário médio 2000-2008. Fortaleza:
Banco do Nordeste do Brasil, 103 p., 2014.
LEE, D. S.; LEMIEUX, T. Regression discon-
tinuity designs in economics. Journal of eco- SOARES, R.B; SOUSA, J. M. P; PEREI-
nomic literature, v. 48, n. 2, p. 281-355, 2010. RA NETO, A. Avaliação de Impacto do
FNE no Emprego, na Massa Salarial e
IMBENS, G. The role of the propensity score
no Salário Médio em Empreendimentos
in estimating dose-response functions. Bio-
Financiados. Revista Econômica do Nor-
metrika, v. 87, n. 3, p. 706-710, 2000.
deste, v. 40, n. 1, p. 217-234, 17p., 2009.
NERI, M; MEDRADO, A. O Mistério Nordes-
THISTLETHWAITE, D; CAMPBELL, D. Re-
tino. In: Microcrédito, o Mistério Nordestino
gression-Discontinuity Analysis: An Alternative
e o Grameen Brasileiro: Perfil e performance
to the Ex Post Facto Experiment. In: Journal of
Educational Psychology, v. 54, p. 309-17, 1960.

Rev. Econ. NE, Fortaleza, v. 49, n. 4, p. 9-21, out./dez., 2018

21

Você também pode gostar