Escolar Documentos
Profissional Documentos
Cultura Documentos
Belo Horizonte
Abril de 2011
*
Tradução de: RAVALLION, Martin The mystery of vanishing benefits: Ms Speedy Analyst’s introduction to
evaluation., The World Bank Economic Review, v. 15, n. 1, p. 115-140, 2001.
Este artigo objetiva prover uma introdução aos conceitos e métodos da Avaliação de Impacto. O artigo pressupõe
que os leitores estejam familiarizados com a estatística básica até o estágio da análise de regressão (que pode ser
satisfeita com textos introdutórios de econometria). Pelos comentários e discussões agradeço a Judy Baker, Kene
Ezemenari, Emanuela Galasso, Paul Glewwe, Jyotsna Jalan, Emmanuel Jimenez, Aart Kraay, Robert Moffitt,
Rinku Murgai, Pedro Olinto, Berk Ozler, Laura Rawlings, Dominique van de Walle e Michael Woolcock (N.A.).
†
Victor Maia Senna Delgado é economista da Fundação João Pinheiro, MG. Mestre em economia pela
Universidade Federal de Minas Gerais e membro da Rede Brasileira de Monitoramento e Avaliação. Doutorando
no departamento de Demografia na UFMG.
Prefácio do tradutor
2
Introdução
3
Ligeirinha redarguiu mais profundamente. “Eu entendo. O dinheiro da transferência
objetiva reduzir a atual pobreza, enquanto que ao mesmo tempo exigindo que os beneficiários
das transferências deixem suas crianças na escola, o programa objetiva reduzir a pobreza
futura.”
“Sim, está certo, Ligeirinha.”
“Então acho que preciso conhecer duas coisas sobre o programa: primeiro, saber se as
transferências estão indo prioritariamente para as famílias de baixa renda e segundo, saber
quanto o programa aumenta as taxas de matrículas escolares.”
“Pode fazer isso, Ligeirinha, aqui está um arquivo do programa que conseguimos do
Ministério do Desenvolvimento Social.”
Assim começou o treinamento da Analista Ligeirinha no trabalho de avaliar o impacto
de um programa social. A primeira anotação resume os métodos que ela vai aplicar nos dias
seguintes.
O desenrolar de um mistério
De volta a sua sala, Ligeirinha descobriu que o arquivo do MDS incluía algumas
descrições muito úteis sobre o material que envolvia o PROSCOL. A determinação do público
alvo é feita com uma série de “medidas aproximadas de pobreza” (proxies de pobreza, como
ela havia aprendido na UNL), que incluíam o número de pessoas em um domicílio, a
escolaridade do chefe de família, e vários atributos de moradia. O PROSCOL paga uma
quantia fixa por criança em idade escolar para todas as famílias sob a condição de que as
crianças frequentem pelo menos 85% das aulas, o que tem de ser verificado por um laudo
obtido da escola.
4
Anotação 1: Métodos de avaliação de impactos dos programas
O problema essencial da avaliação de impacto é o de que nós não observamos resultados para
os participantes caso eles não houvessem participado. Logo, a avaliação é essencialmente um
problema de dados faltantes. Um “grupo de comparação” é usado para identificar o
contrafatual do que poderia ter acontecido sem o programa. O grupo de comparação é
designado para ser representante dos participantes do “grupo de tratamento”, com uma
diferença-chave: o grupo de comparação não participa do programa. Os principais métodos
disponíveis são os seguintes:
• Aleatorização, método no qual a seleção entre os grupos de tratamento e comparação são
aleatórios em um bem definido subconjunto de pessoas. Não haverá nenhuma diferença
(em esperança estatística) entre os dois grupos além do fato de que os tratados estão no
programa (podem remanescer diferenças devido ao erro de amostragem: quanto maior o
tamanho das amostras de tratamento e controle, menor o erro de amostragem).
• Pareamento, método em que o ideal é escolher um grupo de comparação de uma grande
coleta primária de dados (survey). O grupo de comparação é pareado ao grupo de
tratamento com base em um conjunto de características observáveis, ou usando o “escore
de propensão”‡ (a probabilidade predita da participação no programa dado determinadas
características); quanto mais próximos os escores de propensão, melhor o pareamento. Um
bom grupo de comparação provém do mesmo ambiente econômico e é comparado com o
mesmo questionário e pelo mesmo tipo de preparo dos entrevistadores a que foram
submetidos participantes do grupo de tratamento.
• Comparações reflexivas, método em que uma pesquisa prévia, a “linha de base”§, é feita
antes da intervenção, e uma pesquisa de acompanhamento é feita depois. A linha de base
provê um grupo de comparação, e o impacto é medido pela mudança nos indicadores de
resultado antes e depois da intervenção.
• Dupla diferença (ou “diferença na diferença”), compara-se o grupo de tratamento e
comparação (primeira diferença), antes e depois do programa (segunda diferença). Os
comparados podem ser deixados de lado caso eles possuam escores de propensão fora do
intervalo observado para o grupo de tratamento.
• Variáveis Instrumentais são variáveis que importam para a participação, mas não nos
resultados de uma dada participação. Se tais variáveis existem, elas identificam uma fonte
de variação exógena em resultados que podem ser atribuídos ao programa – reconhecendo
que a distribuição não é aleatória mas sim proposital. As variáveis instrumentais são
primeiramente usadas para predizer a participação no programa, podendo-se ver como o
indicador de resultado varia com os valores preditos.
Nenhum método é perfeito. A aleatorização sofre de problemas práticos. A viabilidade
política é às vezes um problema. E mesmo quando a seleção do programa pode ser feita
aleatoriamente, pode haver seletividade na não-participação. Os métodos de pareamento lidam
apenas com diferenças observáveis; envolve o problema de resolver a heterogeneidade latente,
que pode levar a um possível viés em estimar o impacto do programa. A “atrição seletiva”
afeta de forma negativa tanto as estimativas advindas da aleatorização quanto da dupla
diferença. É sempre desejável uma triangulação entre os métodos.
‡
Do original propensity score, probabilidade de pertencimento a um ou outro grupo. O método de propensity
score matching de Rosenbaum e Rubin (1983) foi traduzido como pareamento por escore de propensão. N.T.
§
O termo inglês baseline é usado na área de monitoramento e avaliação para designar uma referência inicial. O
termo tem sido geralmente traduzido ao pé da letra como “linha de base” que foi aqui mantido para manter-se com
a literatura em português do Brasil para área, mas outras denotações são possíveis tais como pesquisa de
referência, pesquisa do status inicial ou pesquisa-base. N.T.
5
O arquivo incluía o relatório: “PROSCOL: perspectiva dos participantes”,
comissionado pelo MDS e elaborado por um consultor local. O relatório baseava-se em
entrevistas qualitativas com gestores do programa e grupos focais dos participantes. Ligeirinha
não sabia dizer se aqueles que foram entrevistados eram representativos dos participantes do
PROSCOL, ou quão pobres eles eram em relação àqueles que não foram incluídos no
programa e não foram entrevistados. O relatório indicava que as crianças iam à escola, mas
Ligeirinha se perguntava se eles já não iriam caso o programa não existisse.
Ligeirinha pensou consigo mesma: “este relatório é um começo, mas ele não me diz
quão pobres são os participantes do PROSCOL e qual o impacto do programa na escolarização.
Eu preciso de dados mais sólidos”. Depois Ligeirinha preparou a segunda anotação, resumindo
os tipos de dados mais comumente empregados nas avaliações de impacto.
• Conheça bem o programa. É arriscado embarcar em uma avaliação sem conhecer detalhes
administrativos/institucionais do programa; essa informação usualmente vêm dos responsáveis pela
administração do programa.
• Também ajuda ter um razoável conhecimento firme e apurado de “fatos estilizados” sobre o
problema, como incluir um mapa da pobreza, a maneira com que o mercado de trabalho opera, as
principais divisões étnicas, outros programas públicos relevantes, etc.
• Seja eclético sobre os dados. As fontes podem ser informais, não estruturadas, entrevistas com os
participantes do programa, assim como dados quantitativos de amostras representativas.
• Mas tenha em mente que é extremamente difícil fazer perguntas contrafatuais em entrevistas ou
grupos focais; tente perguntar para alguém que atualmente participa de um programa público: “o
que você estaria fazendo agora se este programa não existisse?” Conversas com participantes dos
programas podem ser valiosas, mas dificilmente lhe fornecerão avaliações críveis por si mesmas.
• São também necessários dados sobre indicadores de resultados e variáveis explicativas relevantes.
Você necessita destas últimas para lidar com a heterogeneidade nos resultados, que são
condicionados na participação do programa. Os resultados podem diferir, digamos, dependendo se
uma pessoa é educada ou não. Pode não ser possível ver o impacto, a menos que se controle pela
heterogeneidade.
• Dependendo dos métodos usados (anotação 1), você poderá também precisar de dados de variáveis
que influenciam na participação mas não influenciam os resultados dado que o beneficiário já
participa. Essas variáveis instrumentais podem ser valiosas em revelar os efeitos causais mais
prováveis em programas não-aleatórios (anotação 1).
• Os dados dos resultados e das outras variáveis explicativas podem ser quantitativos ou qualitativos.
Porém é importante a possibilidade de organizá-los em um tipo sistemático de banco de dados
estruturado. Um simples e comum exemplo é aquele em que há valores das diferentes variáveis,
incluindo um ou mais indicadores de resultados, e para várias unidades de observação (indivíduos,
domicílios, firmas, comunidades).
• As variáveis que constam no banco de dados e as unidades de observação são escolhidas como
parte do método de avaliação. Essas escolhas devem estar ancoradas a um conhecimento a priori
sobre o programa (seus objetivos é claro, mas também com o programa opera) e o contexto no qual
foi introduzido.
• A fonte específica dos dados dos resultados e seus determinantes, incluindo a participação no
programa, comumente são provenientes de pesquisas de algum tipo. As unidades de observação
6
podem ser o domicílio, firmas, área geográfica, dependendo do tipo de programa que está sob
estudo.
• Dados de pesquisas podem ser também complementados por suplementos com outras informações
sobre o programa (tais como a base de dados do monitoramento do projeto) ou sobre o lugar
(informações de dados geográficos).
7
As tabelas de contenção sugerem que as transferências de renda do programa estão
bem focalizadas para os pobres. Pela linha de pobreza oficial do ILE, cerca de 30% da
população do Nordeste de Labas é pobre. De sua tabela, ela computou que os 30% mais pobres
da amostra da PPV recebem 70% das transferências do PROSCOL, o que parece boa notícia
para o PROSCOL, pensou Ligeirinha.
E quanto ao impacto da escolarização? Ela fez outra tabela, mostrando a taxa média
de atendimento de vários grupos de idade das famílias participantes do PROSCOL versus as
famílias não participantes do programa. A tabela lhe sugeriu que quase não há diferença entre
os dois grupos; a taxa média de atendimento para crianças de 6-18 anos é cerca de 80% em
ambos os casos.
Ligeirinha calculou os anos médios de estudo para cada idade e fez um gráfico dos
resultados separadamente para famílias do PROSCOL e famílias fora do PROSCOL. As duas
figuras não eram idênticas, mas eram muito próximas.
“Será que realmente não existia nenhum impacto sobre a escolarização, ou teria eu
feito algo errado?” perguntou a si mesma. Essa questão é apenas o início da história de como
Analista Ligeirinha resolveu o mistério dos benefícios perdidos da escolarização do
PROSCOL.
Ligeirinha decidiu mostrar seus resultados curiosos a uma dupla de colegas confiáveis.
Primeiro ela visitou o Estatístico Sem-Vícios, um experiente estatístico do ILE. Ligeirinha
gosta do Estatístico, e se sente confortável perguntando a ele sobre problemas de estatística.
“Sr Estatístico, meus cálculos usando a PPV me sugerem que as crianças do
PROSCOL não possuem maior probabilidade de estarem na escola do que as crianças que não
estão no PROSCOL. Eu fiz algo de errado?”
Estatístico respondeu-lhe sem rodeios: “Ligeirinha, eu acho que você tem um sério
viés aqui. Para saber qual impacto o PROSCOL possui, você precisa conhecer o que teria
acontecido sem o programa. O ganho na escolarização atribuível ao programa é só a diferença
entre a verdadeira taxa de atendimento das crianças que participam do programa e a taxa de
atendimento para aquelas mesmas crianças caso o programa não existisse.”
“O que você está fazendo, Ligeirinha, é usando famílias não-PROSCOL como um
grupo de comparação para inferir qual poderia ser a escolarização dos participantes do
PROSCOL caso o programa não existisse. Está assumindo que os não-participantes revelam
8
corretamente, ao menos na média, a escolarização sem o programa. Um pouco de álgebra
simples pode ajudar a tornar esse problema mais simples.”
Estatístico começou escrevendo. “Façamos com que Pi represente a participação no
PROSCOL da i-ésima criança. Isto pode ter dois valores possíveis, digamos que Pi =1 quando
a criança participa do PROSCOL e Pi = 0 quando ela não participa. Quando a i-ésima criança
não participa, seu nível de escolarização é S0i, que indica a escolarização S para a criança i
quando P=0. Quando a criança participa sua escolarização é S1i. O ganho em escolarização
devido ao PROSCOL para uma criança que de fato participa é:
Gi = S1i - S0i | Pi =1
Pode-se pensar nisso como outra maneira de dizer ‘média’. No entanto, isto não
precisa ser necessariamente igual à média que você calculou dos dados da sua amostra, dado
que haverá algum erro de amostragem. Na literatura de avaliação, E(S1i - S0i | Pi =1) é as vezes
chamado de ‘efeito do tratamento’ ou o ‘efeito médio do tratamento nos tratados’.”
Ligeirinha pensou consigo mesma que o governo não gostaria muito de chamar o
PROSCOL de “tratamento”. Mas ela estava empolgada com a última equação do Sr.
Estatístico. “Sim, Sr. Estatístico, isto é exatamente o que eu quero saber.”
“Ah, mas não foi isso que você calculou, Ligeirinha. Você não calculou G, mas uma
diferença de média de crianças de famílias no PROSCOL e famílias não-PROSCOL. Essa é a
estimação amostral de:
9
D = E(S1i | Pi = 1) - E(S0i | Pi = 0)
D=G+B
B = E(S0i | Pi = 1) - E(S0i | Pi = 0)
10
significante na distribuição da escolaridade entre participantes e não-participantes é devida ao
programa.”
Relembrando o que tinha lido no arquivo do PROSCOL, Ligeirinha percebeu que ela
não precisava olhar novamente o desenho do programa para ver que a participação das famílias
não era aleatória. Na verdade, haveria sérias críticas ao PROSCOL caso a participação fosse
aleatória. É exultante fato de que o programa intenta se dirigir às famílias pobres, que são
presumivelmente menos propensas a mandar suas crianças para escola, o que criaria o viés.
Ela falou ao Sr. Estatístico sobre o propósito estabelecido pelo programa.
“Então, Ligeirinha, se o PROSCOL está atuando bem, você deve esperar participantes
que teriam pior escolaridade na ausência do programa. Isto é, E(S0i | Pi =1) < E(S0i | Pi =0), e a
sua conta subestimará o ganho devido ao programa. Você deverá encontrar pouco ou nenhum
benefício, mesmo sabendo que o programa está funcionando bem.”
Ligeirinha voltou ao seu escritório desapontada. Ela via agora que a magnitude do viés
que preocupava Sem-Vícios poderia ser grande. A razão para ela acreditar nisso era a seguinte:
Suponha que as famílias pobres ponham suas crianças para trabalhar ao invés de pô-las na
escola; por serem pobres, elas não podem obter empréstimo facilmente, necessitam de dinheiro
extra no presente. As famílias que não são pobres mandam as crianças para a escola. Alguém
poderia observar diferença negligenciável na média das taxas de escolarização das famílias do
PROSCOL e famílias não-PROSCOL. De fato, temos que E(S1i | Pi =1) = E(S0i | Pi =0), dada a
expectância. Entretanto, o impacto do programa é positivo e dado por E(S0i | Pi =0) - E(S0i | Pi
11
1).5 O erro está no ponto de que, ao apurar o propósito do programa, sua característica pró-
pobres e sua focalização podem muito bem levar a uma substancial subestimação dos
benefícios do PROSCOL, o que Ligeirinha havia feito naquela conta de comparação da média
de escolarização entre as famílias PROSCOL e não PROSCOL.
5
A equação pode ser também transcrita como E(S1i | Pi =1) - E(S0i | Pi =1). No artigo homônimo do The World
Bank Economic Review, vol. 15 no.I, Ravallion mostra, de maneira a deixar mais claro para o leitor, a equação em
duas formas. Ocorre neste caso é que escolaridade S1i dos grupos de participantes E(S1i | Pi =1) é igual à
escolaridade S0i dos não-participantes E(S0i | Pi =0). Pode-se também reescrever E(S0i | Pi =0) – E(S0i | Pi =1) = –
B, que é igual a G – D. Como na situação descrita Ligeirinha encontrou que D = 0, temos que –B = G, a
verdadeira diferença entre tratados e não tratados. N.T.
infantil tenta resolver as duas coisas, porém com sentidos contrários. Então, o PROSCOL
possui um trade-off.”
Ligeirinha percebeu que esta era uma boa segunda razão para ela obter uma boa
estimativa do impacto da escolarização. Apenas então seria possível determinar a renda não
ganha que preocupava tanto Tangência. Talvez o tempo extra na escola venha das horas que já
não eram mesmo destinadas ao trabalho infantil.
Logo depois, Ligeirinha contou à Tangência as preocupações do Sr. Estatístico sobre
sua segunda tabela, para sondar o que ela pensava.
“Eu acho que o seu problema principal aqui é que você não abriu possibilidades para
todos os outros determinantes que influenciam na escolarização, além da participação no
PROSCOL. Você deveria “rodar” uma regressão de anos de escolaridade com um conjunto de
variáveis controle como “sim” ou “não” para a família da criança estar sendo atendida pelo
PROSCOL. Por que não tenta essa regressão?” Tangência escreveu, “para cada criança i da sua
amostra façamos:
Si = a + bPi + c Xi +ei
Aqui o a, b e c são parâmetros, o X serve para as variáveis de controle, tal como idade
da criança, educação da mãe e do pai, o tamanho para a composição demográfica da família, e
características da escola, enquanto que e é o resíduo que inclui outros determinantes da
escolarização e erros de medição. Como você pode ver, Ligeirinha, o valor estimado de ‘b’
fornece o impacto do PROSCOL na escolarização.
“Não, eu não posso ver isso,” ela interrompeu.
“Bem, se a família da i-ésima criança participa do PROSCOL, então P=1 e a
escolarização será a + b + cXi +ei. Se ela não participa, então P=0 e a escolarização será a +
cXi +ei. A diferença entre os dois é o ganho de escolarização dado o programa, o qual é apenas
b.”
Essa conversa deixou Ligeirinha mais esperançosa, assim que retornou a sua sala para
tentar a equação sugerida pela Tangência. Ela escreveu o comando REGRESS no SAPS para
uma regressão com e sem as variáveis de controle sugeridas por Tangência. Quando ela
“rodou” sem os controles, encontrou que b não era estatisticamente diferente de zero (não
significante, usando o teste t padrão dado pelo SAPS). Suspeitou de que parecia com o
primeiro resultado que ela tinha obtido fazendo a diferença entre as médias dos participantes e
não participantes – sugerindo que o PROSCOL não tinha impacto na escolaridade. Entretanto,
ao colocar um punhado de variáveis de controle na regressão, ele imediatamente viu um
13
positivo e significante coeficiente da participação no PROSCOL. Ela calculou que para idade
de 18 anos o programa havia incrementado dois anos para a escolaridade.
Ligeirinha pensou que aquilo estava começando a ficar mais convincente. Mas ela
sentia ainda uma pequena incerteza sobre o que estava fazendo. “Por que essas variáveis de
controle fazem tanta diferença? Eu usei os controles corretos? Preciso de mais ajuda para
entender exatamente o que está acontecendo aqui para que eu possa acreditar nessa regressão.”
Ligeirinha decidiu visitar o professor Qui-quadrado, que foi um dos professores dela
na UNL. Qui-quadrado é um pequeno homem engraçado, que usa ternos e gravatas fora de
moda e que muitas vezes não combinam muito bem. “Não é normal ser tão quadrado”, ela
relembra ao pensar nas aulas de econometria. Ligeirinha também se lembra do medo de
perguntar qualquer coisa para o professor Qui-quadrado, porque suas respostas eram algumas
vezes muito difíceis de entender. “Mas ele conhece mais de regressões do que qualquer outro”,
refletiu.
Ela marcou uma reunião. Tendo escutado pelo telefone qual era o problema dela, Qui-
quadrado felicitou sua ex-aluna com uma longa lista de artigos para ler, a maioria deles com
títulos indecifráveis, e publicados em lugares aparentemente obscuros.
“Muito obrigada, professor, mas acho que não vou ter tempo de ler tudo isso antes do
relatório ficar pronto. Eu poderia dizer o meu problema e pegar suas impressões agora?”
Qui-quadrado concordou. Ligeirinha mostrou a ele as regressões, pensando que ele
ficaria satisfeito ao saber que a ex-aluna dele estava “rodando” regressões. Ele lhe formulou
algumas poucas questões sobre o que ela havia feito e se recostou em sua cadeira, depois de um
tempo, parecia que iria pronunciar julgamentos pelos esforços desempenhados por Ligeirinha e
por ela ter ido tão longe.
“Uma preocupação que eu tenho com sua regressão de escolarização de P e X é que
isso não permite o impacto do programa variar com X; o impacto é o mesmo para todo mundo,
o que não me parece muito plausível.”
“Sim, eu pensei nisso,” atalhou Ligeirinha. “Pais com mais escolaridade poderiam ser
mais propensos a levar seus filhos à escola, e os ganhos do PROSCOL seriam menores.”
“Muito provavelmente, Srta. Analista. Para permitir os ganhos variarem com X,
deixemos a média de escolarização dos não participantes ser a0 + c0Xi enquanto a dos
participantes seria a1 + c1Xi, sendo que o nível de escolarização observado fica:
14
Si = (a1 + c1Xi + e1i) Pi + (a0 + c0Xi + e0i)(1-Pi)
Em que e0 e e1 são erros aleatórios, cada qual com média zero e não correlacionado
com X. Para estimar esse modelo, tudo o que se há de fazer é acrescentar um termo extra para
os efeitos de interação entre a participação no programa e as características observadas da
regressão que você já rodou. Dessa forma, a regressão aumentada é:
Em que ei = e1i Pi + e0i(1-Pi). E assim, (a1 - a0) + (c1 - c0)X é a média do impacto do
programa para qualquer valor dado de X. Se você usar a média de X dos participantes de sua
amostra irá obter o ganho médio do programa obtido por eles.
“Uma segunda preocupação, senhorita Analista, é sobre como foi estimada sua
regressão. O comando REGRESS do SAPS é apenas de Mínimos Quadrados Ordinários
(MQO). Você deve se lembrar da aula do meu curso de econometria em que falei que as
estimativas de MQO são viesadas mesmo em amostras muito grandes, a menos que todas
variáveis do lado direito sejam todas exógenas.”
“Sim, creio que me lembro disto, mas você poderia me lembrar o que quer dizer
mesmo‘exógenas’?”
“Significa que as variáveis do lado direito são determinadas independentemente das
escolhas de escolarização e não são correlacionadas com os erros na regressão de escolaridade.
A participação no PROSCOL é exógena senhorita Ligeirinha?”
Ligeirinha pensou rápido, relembrando a conversa com o Sr. Estatístico. “Não. A
participação é propositalmente endereçada aos mais pobres. Como isso afeta meu cálculo do
impacto do programa?”
Sua equação para anos de escolaridade é:
Si = a + bPi + cXi + ei
15
Ligeirinha agora havia entendido que o viés devido a uma seleção não aleatória dos
benefícios que preocupava o Sr. Estatístico poderia atrapalhar a regressão estimada com base
no modelo sugerido pela Sra. Economista de Tangência. “Isto significa que os meus resultados
estão muito fora de propósito?”
“Não necessariamente,” respondeu Qui-quadrado, à medida que ia para o seu quadro
branco. “Vamos escrever uma equação que explicita o P, digamos:
Pi = d + eZi + ?i
16
“Porque seu X deve incluir variáveis que estão entre as proxies de pobreza usadas para
a focalização, ou estão correlacionadas com elas, e há variáveis que também influenciam na
escolarização.”
“Não obstante, senhorita Analista, tudo isso só funciona se os pressupostos são
válidos. Há dois problemas para os quais você tem que estar alerta. Primeiramente, o método
acima falha completamente se há variáveis não observadas que determinam a participação; em
outras palavras, se o termo de erro ‘?’ possui variância zero, e todos os determinantes que
afetam a participação afetam também a escolarização. Então, não há variação independente na
participação no programa para permitir uma identificação de impacto na escolarização; você
pode predizer P perfeitamente dado X, e a sua regressão não será estimada. Este problema é
difícil de acontecer, dado que quase sempre há determinantes não observados para a
participação no programa.”
“O segundo problema é mais comum e mais preocupante. O termo de erro e da
regressão de escolarização provavelmente contém variáveis que não são encontradas na PPV,
mas podem muito bem influenciar a participação no programa, i.e., podem estar
correlacionadas com o termo de erro ‘?’ na equação de participação. Se é este o caso, o termo
de erro e não terá média zero dados X e P, e então os métodos de regressão de mínimos
quadrados continuarão viesados nas suas estimativas para a escolaridade. Portanto, o ponto-
chave é a extensão dessa correlação entre o termo de erro na equação de participação e aquele
na equação para escolarização.”
17
dado que eu posso ter muitas dessas variáveis. Pode não haver ninguém entre os não-
participantes que possua exatamente os mesmos valores em todas as características observadas
de um participante do PROSCOL.”
“Ah”, falou Qui-quadrado, “alguns estatísticos espertos descobriram como você pode
simplificar enormemente o problema. Em vez de tentar garantir que o controle pareado de cada
participante tenha o mesmo valor de X, você pode obter o mesmo resultado pelo pareamento
feito em um valor predito P dado X, que é chamado de escore de propensão de X. Você deve
ler os artigos de Rosenbaum e Rubin da lista de artigos que preparei para você. O artigo deles
na Biometrika 1983 mostra que se (no seu caso) escolarização sem o PROSCOL é
independente da participação dado X, então haverá também independência da participação
dado o escore de propensão de X. Por conta do escore de propensão ser apenas um número, é
bem mais fácil controlar por ele do que por X, que pode ter muitas variáveis, como você disse.
E já que o pareamento por escore de propensão é suficiente para eliminar o viés existente, isso
corresponde a independência em relação a X.”
“Deixe-me ver se eu lhe entendi, professor. Primeiro devo regredir P em X para obter
o valor predito para cada valor de X possível, faço isso para toda minha amostra. Para cada
participante, acharei o não-participante com o valor mais próximo da probabilidade predita. A
diferença na escolarização é portanto o ganho estimado para o programa para aquele
participante.”
Isto está basicamente correto, senhorita Analista. Você pode pegar a média de todas
essas diferenças para estimar o impacto. Ou então, digamos, você pode tirar a média para
diferentes grupos de renda. Mas você terá de ser cuidadosa com a maneira com que irá estimar
o modelo de participação. Um modelo linear pode lhe dar probabilidades preditas muito
estranhas, acima de um ou mesmo negativas. É melhor usar o comando LOGIT no SAPS. Esse
comando pressupõe que o termo de erro ‘?’ na equação tem uma distribuição logística, e estima
os parâmetros de forma consistente com as hipóteses dos métodos de máxima verossimilhança.
Você se lembra de minhas aulas sobre estimação de máxima verossimilhança com modelos de
respostas binárias, não é mesmo, senhorita Analista?”
“Sim, lembro!”, falou Ligeirinha, da forma mais convincente que conseguiu.
“Outro assunto para o qual você deve estar atenta, senhorita Ligeirinha, é de que
alguns dos não-participantes devem ser retirados de um potencial pareamento desde o começo.
Alguns serão inelegíveis de acordo com as regras de elegibilidade. Outros serão elegíveis, mas
possuirão características observadas que tornariam a seleção impossível. Na verdade, há
importantes resultados na literatura que indicam que a falha para comparar tratados e controles
18
com valores em comum no pareamento é uma das maiores fontes de viés nas avaliações. Veja
o artigo de Heckman et al. (1998) na minha lista de leitura.”
“A intuição é fazer com que o grupo de comparação seja o mais similar possível ao
grupo de tratamento nos termos da verossimilhança de participar do programa, tal como é
resumido pelo escore de propensão. Você poderá encontrar que alguns dos não-participantes da
amostra possuem um escore de propensão mais baixo do que aqueles no grupo de tratamento.
Isto é às vezes chamado de ‘carência de suporte comum’.6 Na formação do grupo de
comparação, você deve eliminar estas observações do conjunto de não-participantes para
garantir que você está comparando ganhos apenas para um mesmo intervalo de escores de
propensão. Você certamente deverá excluir aqueles não participantes cuja probabilidade de
participar é zero. É também boa ideia relaxar um pouco a amostra, digamos que 2% abaixo do
piso e acima do topo da distribuição de não participantes que estão em uma região comum de
pareamento. Eu lhe recomendo tirar uma média de mais ou menos cinco vizinhos mais
próximos em termos da diferença absoluta dos escores de propensão.”
“O que eu poderia incluir no X?”, perguntou Ligeirinha.
“Bem, evidentemente, você poderia incluir todas as variáveis do seu banco de dados
que são, ou poderão ser, proxies para os indicadores de pobreza e que foram usados pelo MDS
ao selecionar os participantes do PROSCOL. Então, novamente, os X poderiam incluir as
variáveis em Z.”
“No entanto, você tocou em um ponto fraco do pareamento por escore de propensão.
Com a aleatorização, os valores não dependem do X que você escolhe. Com o pareamento, um
X diferente vai levar a uma diferente estimativa do impacto. A randomização também não
exige que você especifique algum modelo para a participação, seja logito ou qualquer outro.”
“Sim, professor, estou convencida de que um experimento aleatório é ideal.
Infelizmente, esse não é o caso do PROSCOL.”
Ligeirinha preparou sua terceira anotação, resumindo os passos de que ela precisa
realizar ao fazer o escore de propensão.
6
Do original: ‘lack of common support’. N.T.
19
Anotação 3: Passos para o pareamento
Esta é a forma mais simples de pareamento por escore de propensão. Na prática podem
aparecer algumas complicações. Por exemplo, caso haja uma sobre-amostra de participantes
então você poderá usar métodos de amostragem baseados na escolha para corrigir isto (Manski
and Lerman, 1978); alternativamente você poderá usar a chance probabilística (P/(1-P), em
que P é o escore de propensão) para obter o pareamento. Ao invés de se basear nos vizinhos
mais próximos, pode-se usar no lugar todos os não-participantes como pares em potencial,
porém ponderados diferentemente, de acordo com quão próximos eles estão (Heckman et al.,
1998).
20
Algumas incômodas variáveis não-observáveis e outras não tão incômodas
“Agora eu possuo uma ideia bem melhor de como obter um grupo de comparação,
professor Qui-quadrado. Isto me poderá dar uma estimação muito melhor dos impactos do
programa.”
“Ah, não há garantia disso. Lembre-se de meu alerta de que todos esses métodos que
eu lhe descrevi até agora só vão eliminar o viés se houver a independência condicionada, tal
que os determinantes não-observáveis de escolarização – aqueles não inclusos no seu conjunto
de variáveis de controle X – são não correlacionadas com os atributos do programa. Há duas
fontes distintas de viés, aquela dada pela diferença nas observáveis e aquela devida a diferença
nas não-observáveis; a última é chamada de ‘viés de seleção’.”
A quarta anotação de Ligeirinha desenvolve sobre essa diferença.
O viés descrito pelo Sr. Estatístico é a diferença esperada na escolarização sem o PROSCOL
entre as famílias selecionadas para o programa e aquelas não escolhidas. Isto pode ser
repartido em duas fontes de viés:
• Viés devido a diferenças nas características observáveis. Isso surge por duas maneiras.
Primeiramente, pode não existir suporte comum. O suporte é um o conjunto de variáveis
de controle para os quais os produtos e a participação no programa é observada. Se o
suporte é diferente entre a amostra de tratamento e o grupo de comparação, isto viesará os
resultados. Na verdade, não se estará comparando iguais com iguais. Secundariamente,
mesmo com um suporte comum, a distribuição de características observáveis poderá ser
diferente dentro da região de suporte comum; os dados do grupo de comparação usados
estão ponderados erroneamente. Uma seleção cuidadosa do grupo de comparação pode
eliminar esta fonte de viés.
• Viés devido a diferenças nas não observáveis. O termo “viés de seleção” é às vezes
limitado somente a este caso (há alguns autores que usam este termo para o viés total em
uma avaliação não experimental). A fonte do viés aparece no momento em que, para os
valores de X dados, há uma relação sistemática entre a participação no programa e os
resultados na ausência do programa. Em outras palavras, há algumas variáveis não
observadas que influenciam conjuntamente a escolarização e a participação no programa
condicionada nas variáveis observadas nos dados.
Não há nada que garanta que essas duas fontes de viés funcionarão na mesma direção. Então,
eliminando-se um deles não significa que o viés total será reduzido em seu valor absoluto. Esta
é uma questão empírica. Em um dos poucos estudos que discutem esta questão, o verdadeiro
impacto, medido por um bem desenhado experimento, foi comparado com várias estimativas
não experimentais (Heckman et al. 1998). O viés das estimativas naïve foi grande, mas um
pareamento cuidadoso do grupo de comparação baseado nas variáveis observáveis pode
reduzir bastante o viés.
21
O professor Qui-quadrado apontou para a última equação. “Claramente, a
independência condicional estará garantida se P é exógeno, desse modo E(ei| Xi,PI) = 0.
Entretanto, o estabelecimento endógeno do programa dado a um foco propositado em variáveis
não observáveis pode ainda deixar um viés. Isto é, às vezes, chamado de ‘seleção nas não-
observáveis’.”
Ligeirinha interjeitou: “Então, as verdadeiras condições necessárias para justificar o
método sugeridas pela Sra. Economista de Tangência não são menos restritivas do que aquelas
necessárias para justificar uma versão de meu primeiro método de comparação de famílias do
PROSCOL com famílias não-PROSCOL de valores similares para os X. Os dois se
fundamentam na crença de que essas não-observáveis não estão conjuntamente influenciando a
escolarização e a participação no programa, condicionados em X.”
“Correto, senhorita Analista. Intuitivamente se poderia pensar que um pareamento
cuidadoso reduz o viés, mas não necessariamente. O pareamento elimina parte do viés da sua
primeira estimativa naïve do impacto do PROSCOL. Isto deixará o viés totalmente a cargo de
algumas variáveis não observáveis que podem causar problemas. Contudo, essas duas fontes de
viés poderiam compensar uma à outra, sendo uma positiva e a outra negativa. Heckman et al.
(1998) trata sobre isso. Então, as estimativas após pareamento podem, na verdade, ter mais viés
do que uma estimativa naïve. Ninguém pode saber, a priori, quão melhor está mesmo após um
muito bem escolhido grupo de comparação. Esta é uma questão empírica.”
Ligeirinha lamenta que uma pesquisa de ‘linha de base’ não tenha sido feita
22
Qui-quadrado voltou à sua lousa branca e de novo, apontando uma de suas primeiras
equações, acrescentou: “Para ver como isso funciona, vamos adicionar subscritos de tempo, ‘a’
para ‘antes’ do programa e ‘d’ para ‘depois’ do programa. A escolarização depois de
introduzido o programa é:
Onde temos que etai é um efeito invariante no tempo, em que se permite estar
correlacionado com Pi, e muit é um erro de inovação, que não é correlacionado com Pi (ou Xi).”
“A ideia principal aqui é a de usar os dados da ‘linha de base’ para nos revelar
algumas daquelas incômodas variáveis não-observáveis. Como a pesquisa de base é para os
mesmos domicílios que você possui agora, o i-ésimo domicílio na equação Sid é o mesmo
domicílio que você encontrará na equação Sia. Você poderá, então, tirar a diferença entre as
equações de ‘depois’ e ‘antes’ e obter:”
23
Professor Qui-quadrado anuiu. “Sim, na medida em que as não-observáveis são
invariantes no tempo, as mudanças de escolarização no tempo para o grupo de comparação
revelarão o que poderia ter ocorrido ao tratamento se não houvesse o programa.”
Ligeirinha pensou consigo mesma que isso significa que se deve conhecer o programa
bem, e estar apta para que as avaliações feitas no tempo estejam coordenadas com o programa.
De outra maneira, haveria margem para existirem mudanças não observadas depois da pesquisa
de base que influenciariam quem obtém o programa. Isso criaria diferenças que se alterariam
entre as duas pesquisas.
Alguma coisa na última equação do professor Qui-quadrado a estava preocupando.
“Como eu estou entendendo, professor, nessa última equação as características do domicílio e
da criança em X não são importantes para a mudança na escolarização, se estas características
não mudam com o tempo. O ganho de escolarização depende da educação dos pais (e não
apenas alguma mudança na educação deles) e possivelmente o local onde a família mora, já
que isso determinará o acesso às escolas.”
“Sim, senhorita Analista, pode haver situações para as quais as mudanças dos
resultados ao longo do tempo são influenciadas pelas condições iniciais. Então, será preciso
controlar pelas diferenças nas condições iniciais. Você pode fazer isso simplesmente
adicionando Xd e Xb na regressão separadamente, de maneira que a regressão fique na forma:
Assim, mesmo que uma (ou todas) variável em X não varie com tempo, pode-se
permitir que o nível de X afete a escolarização ao longo dos anos.”
“O método de pareamento por escores de propensão que eu te falei pode ajudar a
garantir um grupo de comparação similar ao grupo de tratamento antes de fazer a dupla
diferença. Em um interessante estudo sobre o programa de emprego norte-americano,
descobriu-se que a falha em garantir uma comparação sobre uma região de ‘suporte comum’ é
uma das maiores fontes de viés na estimação de dupla diferença quando comparada com um
grupo de controle aleatório. Dentro da região de suporte comum, no entanto, o viés
condicionado em X não varia muito no tempo. Então, fazer a dupla diferença faz sentido depois
que o pareamento está feito. Veja o artigo de Heckman na econometrica 1998, na minha lista
de leitura.”
Ligeirinha tinha alguma experiência em fazer pesquisas, e estava preocupada com essa
ideia de acompanhamento (follow up) dos moradores. “Quando fazemos uma pesquisa de
acompanhamento, não é muito fácil encontrar todos aqueles moradores que estavam
24
originalmente inclusos na pesquisa de ‘linha de base’. Algumas pessoas da pesquisa anterior
podem não querer serem entrevistadas novamente, ou terem se mudado para uma localidade
desconhecida. Isto é um problema?”
“Se essas perdas no acompanhamento são puramente aleatórias, a pesquisa de
acompanhamento continuará sendo representativa da mesma população da pesquisa ‘linha de
base’. Entretanto, se há alguma tendência sistemática para pessoas com certas características a
deixar a amostra, isto será um problema. Isso é chamado de ‘viés de atrição’. Por exemplo, o
PROSCOL pode ajudar algumas famílias pobres a se mudarem para habitações melhores. E
mesmo quando a seleção do participante é baseada em informações disponíveis do momento,
ou um pouco depois da data da pesquisa inicial (o efeito etai invariante no tempo),
participantes selecionados poderão deixar voluntariamente as informações incompletas
sabendo que vão mudar depois daquela data. Tal atrição do grupo de tratamento será
claramente um viés para a estimação por dupla diferença do impacto do programa.”
Depois disso, Ligeirinha escreveu sua quinta anotação, sobre os passos da estimação
de dupla diferença.
25
Anotação 5: Fazendo a dupla diferença.
Passo 1: Será necessária uma pesquisa ‘linha de base’ antes que a intervenção esteja a
caminho, e a amostra deve cobrir participantes e não-participantes. Se não se sabe quem vai
participar, você terá de dar um palpite com base em alguma informação do programa.
Converse com os administradores do programa.
Passo 2: Você precisará de uma ou mais pesquisas de acompanhamento, depois do programa
em andamento. Elas devem ter uma boa base de comparação com as pesquisas de referência da
‘linha de base’ (em termos de questionário, métodos de entrevista, entrevistadores, etc).
Idealmente as pesquisas de acompanhamento devem ser com as mesmas observações
amostradas na pesquisa de base. Se isto não for possível, poderão ser dados de um mesmo
conglomerado (cluster) geográfico, ou estratificados em termos de alguma outra variável.
Passo 3: Calcule a diferença média entre os valores indicadores de resultado “depois” e
“antes” para cada um do grupo de tratados e comparação.
Passo 4: Calcule a diferença entre essas duas diferenças médias. Esta será sua estimativa de
impacto para o programa.
Esta é a versão mais simples do método de dupla-diferença. Você pode desejar controlar
também por diferenças nas condições iniciais exógenas, ou por mudanças nas variáveis
exógenas, possivelmente permitindo algum efeito de interação no programa (de maneira que o
ganho com a intervenção seja uma função de variáveis observáveis). Um modelo de regressão
apropriado pode permitir trabalhar com essas variações.
“Dupla diferença é o que há, professor Qui-quadrado. Mas eu não tenho uma pesquisa
de ‘linha de base’ das famílias. Eu acho que quando começaram o programa ninguém pensou
que o PROSCOL pudesse ser avaliado. Há alguma coisa a mais que se possa fazer para evitar
as problemáticas variáveis não observáveis?”
“O que você precisa é de uma variável instrumental (VI)” ele falou para Ligeirinha.
Você deve certamente se lembrar de minhas aulas, quando disse que essa é uma solução
clássica para o problema de um regressor endógeno.”
“O Sr. poderia me lembrar, professor Qui-quadrado?”
“Uma variável instrumental é nada mais que uma fonte observável de variação na
participação no programa. Em outras palavras, isto é correlacionado com o P, mas na regressão
não está correlacionado com a escolarização, tampouco é correlacionado com o termo de erro
na equação de escolarização, e. Então, você deverá ter ao menos uma variável em Z que não
está em X, e não correlacionada com e. Portanto, as estimativas do impacto do programa por
26
variáveis instrumentais são obtidas ao substituir P pelos seus valores preditos condicionados
em Z. Dado que o valor predito depende apenas de Z (que é exógeno), e Z é não correlacionado
com e, é razoável então aplicar os mínimos quadrados ordinários a esta nova regressão.”
“Entendo,” assentiu Ligeirinha. “Como os valores preditos dependem só de uma
variação exógena da variável instrumental e as outras variáveis exógenas, as não-observáveis
não são mais um problema, elas estarão não correlacionadas com o termo de erro na regressão
de escolarização.”
“Sim, você compreendeu, senhorita Ligeirinha. Isto também sugere outra, mais
eficiente, maneira com a qual você pode lidar com o problema. Lembre que a fonte de viés na
sua estimativa do impacto do programa vem da correlação entre o termo de erro na regressão
de escolarização e aquela na regressão de participação. É isto que cria a correlação entre
participação e o termo de erro na equação de escolarização. Logo, a maneira natural de lidar
com esse problema quando existe uma variável instrumental é acrescentar os resíduos da
equação de primeiro estágio de participação para a equação de escolarização. Você ainda
deixará a verdadeira participação na regressão de escolaridade. Mas já que agora se
acrescentou à regressão de escolaridade o valor estimado do termo de erro da equação de
participação, pode-se tratar a participação como exógena e ‘rodar’ um MQO. É claro, isto só
vai funcionar se houver um instrumento válido, sem o qual a regressão não funcionará, dado
que o resíduo da participação será perfeitamente predito com a verdadeira participação e o X,
em um modelo linear.”
“Uma VI pode também lhe ajudar se levarmos em conta que pode haver um erro de
medição considerável nos seus dados de participação no programa. Esta é outra possível fonte
de viés. Erros de medição significam que você acha que a participação no programa varia mais
do que na verdade se observa. Essa sobrestimação da variância de P leva naturalmente a uma
subestimação do seu coeficiente b.”
“Sim, o Sr. chamou isso de ‘viés atenuante’ na sua aula. Eu me lembro porque esse
viés atenua o coeficiente estimado da regressão.”
“Isso mesmo. Então, você entendeu como pode ser útil uma variável instrumental.
Entretanto, você deve ter um pouco de cuidado na prática. Quando apenas se substitui a
verdadeira participação com os valores preditos e “roda” uma MQO, não se obtém os valores
corretos dos erros-padrão, já que o computador não tem como saber que você usou
anteriormente valores dos parâmetros estimados para obter os valores preditos. É necessária
uma correção aos erros-padrão do MQO, há pacotes estatísticos que lhe permitem fazer isso
facilmente, pelo menos no que concerne aos modelos lineares”.
27
“Mais ainda, se você possui uma variável dependente que pode ter apenas dois valores
possíveis, digamos, ‘está na escola’ e ‘não está na escola’, então, você deverá usar um modelo
não-linear de resposta binária, como o logito ou o probito. O hábito de testar a exogeneidade da
participação é similar nesse caso. Há um artigo de Rivers e Vuong (1988) que discute o
problema para tais modelos; Blundell e Smith (1993) fornecem uma revisão bastante útil de
vários modelos não lineares para os quais há um regressor endógeno. Eu escrevi uma
programação em uma linguagem de programa chamada Gauss, que pode fazer um probit com
um regressor endógeno e posso lhe dar uma cópia.”
“Muito obrigada. Eu acho que poderei avançar esse limite quando eu conseguir fechar
esta questão do programa. Mas o que eu poderia usar como variável instrumental?”, perguntou
Ligeirinha.
“Ah, isso você vai ter que descobrir por si mesma, senhorita Analista”.
Ligeirinha resumiu depois o que ela havia aprendido sobre os métodos alternativos,
como está disponível na anotação 1.
Ligeirinha começa a se perguntar se sua tormenta irá ter fim. “Eu estou aprendendo
bastante, mas o que vou dizer para o meu chefe?”
Ligeirinha tentou pensar em uma variável instrumental. Mas todas as possibilidades
em que ela podia pensar já estavam consideradas com as variáveis de X. Ela agora se lembra da
aula do professor Qui-quadrado. O problema era encontrar uma “restrição de exclusão” válida
que justificasse colocar uma variável na equação de participação, mas não na equação de
escolaridade.
Ligeirinha decidiu tentar o “método de escore de propensão” sugerido pelo prof. Qui-
quadrado. Seu modelo logito para a participação pareceu bem consistente, e sugeriu que o
PROSCOL estava bem focalizado (Virtualmente, todas as variáveis que ela esperaria estarem
associadas com a pobreza tinham um coeficiente positivo e significativo). Isto era interessante
por si só. Ela fez o pareamento por escore de propensão, tal como o professor Qui-quadrado
havia aconselhado. Na comparação das médias de taxas de atendimento, Ligeirinha detectou
que crianças do grupo de comparação possuíam uma taxa de 60%, ante uma taxa de 80% das
famílias do PROSCOL.
Ela agora pensou novamente nos comentários que a Sra. Economista de Tangência
tinha feito sobre os rendimentos não ganhos. Ela descobriu que o Instituto de Estatística fez
28
uma pesquisa especial sobre o trabalho infantil que perguntava sobre a renda. (Há uma
proibição legal para as crianças menores que 16 anos não trabalharem em Labas, mas o
governo tem muito trabalho para fazer valer a lei; não obstante, salário infantil é um assunto
delicado). Com isso, ela conseguiu descobrir quanto uma criança conseguiria ganhar caso não
tivesse ido à escola.
Ligeirinha poderia agora subtrair do dinheiro dado aos participantes do PROSCOL a
quantia devida aos rendimentos não ganhos, e trabalhar com a transferência de renda líquida.
Retirando esta transferência líquida da renda total, ela poderia encontrar de que estrato de
renda os participantes do PROSCOL provinham antes da intervenção do programa. Eles não
eram tão pobres quanto ela havia primeiramente pensado (quando ignorava a renda não
contabilizada), mas ainda assim continuavam bastante pobres; por exemplo, dois terços deles
estavam abaixo da linha de pobreza oficial de Labas.
Tendo calculado o ganho de renda líquida recebida por todos os participantes,
Ligeirinha poderia calcular agora a taxa de pobreza com e sem o PROSCOL. A linha de
pobreza “pós-intervenção” (com o programa) é apenas a proporção de pessoas vivendo em
domicílios com uma renda por pessoa abaixo da linha de pobreza, em que “renda” é a ‘renda
observada’ (incluindo-se a transferência bruta proveniente do PROSCOL). Ligeirinha calculou
diretamente da PPV. Subtraindo-se o ganho líquido de renda (dinheiro transferido do
PROSCOL menos a renda não-ganha do trabalho das crianças) de todos os rendimentos
observados, ela conseguiu uma nova distribuição de renda pré-intervenção. A taxa de pobreza
sem o programa é a proporção de pessoas vivendo em domicílios pobres, baseados nessa nova
distribuição. Ligeirinha encontrou que a taxa de pobreza no Nordeste de Labas, que era 32%,
poderia ter sido 36% caso o PROSCOL não tivesse existido. O programa permitiu que 4% da
população escapasse da pobreza. Os ganhos na escolarização pressupunham que ainda haveria
ganhos pecuniários e não-pecuniários para os pobres no futuro.
29
Anotação 6: Medições de pobreza
A percentagem de pobres não diz nada sobre a distribuição de renda abaixo da linha de
pobreza: uma pessoa pobre pode estar pior, mas a contagem de incidência não altera, nem
reflete o ganho dos mais pobres a menos que eles cruzem a linha de pobreza.
O índice do hiato da pobreza diz quão grande é o impacto que o programa obteve na
intensidade da pobreza, mas não refletirá nenhuma mudança na distribuição entre os pobres
devida ao programa. Por exemplo, se o programa leva a um pequeno ganho para uma pessoa
pobre que está acima da média de rendimentos das pessoas pobres, às custas de uma igual
redução para alguém abaixo daquela média, o índice se alterará.
Há várias medidas de pobreza que são sensíveis à distribuição entre os pobres. Uma dessas
medidas é hiato da pobreza ao quadrado (Foster et al., 1984). Ela é calculada da mesma
maneira que o índice de hiato da pobreza com a exceção de que os hiatos individuais em
relação à linha de pobreza são elevados ao quadrado antes de se retirar a média (novamente
pobres e não-pobres). Outro exemplo de medição sensível à medição de pobreza é o índice de
Watts. Este índice é dado pela média do logaritmo da razão entre a linha de pobreza e a renda
obtida, essa razão é estabelecida como sendo igual a um para os não-pobres. Atkinson (1987)
descreve outros exemplos na literatura.
Ligeirinha reconheceu que havia alguma imprecisão sobre a linha de pobreza do ILE.
De maneira que ela reproduziu o cálculo sobre um grande número de linhas de pobreza. Ela
encontrou que para uma linha de pobreza na qual 50% da população era pobre com os cálculos
após a intervenção, a proporção seria de 52% sem o PROSCOL. Com outra linha de pobreza
em que 15% da população era pobre com o programa, essa proporção seria 19% sem a
intervenção. Repetindo esses cálculos para uma grande variedade de rendas, Ligeirinha
percebeu que ela havia traçado quase que totalmente as “curvas de incidência de pobreza” com
e sem o programa, que era justamente aquilo que os estatísticos chamam de “função de
distribuição acumulada”.
30
A sétima anotação resume os passos que Ligeirinha obteve ao fazer comparações da
pobreza com e sem o PROSCOL.
Usando os métodos descritos no texto principal e nas primeiras anotações é possível obter uma
estimativa dos ganhos para cada família e a proporção de pobres com e sem o programa. Nas
avaliações mais simples isto se resume a apenas um número que diz a diferença com e sem o
programa. Mas é melhor permitir alguma variação da linha de pobreza de acordo com as
características familiares, agrupando essas informações na forma de ‘curvas de incidência da
pobreza’ (CIP’s), com e sem o programa.7
Passo 1: Você já deve ter a renda pós-intervenção (ou outro indicador de bem-estar) para cada
família em toda a amostra (incluindo os participantes e não-participantes), cujos os dados vai
utilizar. Você também já deve saber quantas pessoas estão em cada casa. E, evidentemente,
sabe qual o total de pessoas na amostra (N; este pode ser também o tamanho da população
estimada, se os pesos são do tipo inverso da probabilidade, é possível utilizá-los para
"expandir" cada observação da amostra).
Passo 2: Você pode fazer um gráfico dessas informações na forma das CIP’s. Isto lhe
fornecerá (no eixo vertical) o percentual da população vivendo em domicílios com renda igual
ou inferior ao valor da renda presente no eixo horizontal. Para
fazer este gráfico, deve-se começar com a família mais pobre, marcar o valor de sua renda no
eixo horizontal e, em seguida, colocar no eixo vertical o número de pessoas dessa família
multiplicado por 100 e divisá-lo por N. O próximo ponto será a proporção de pessoas que
vivem na segunda família mais pobre, e assim por diante. Esses passos lhe fornecem a CIP
pós-intervenção.
Passo 3: Agora calcule a distribuição de renda pré-intervenção. Para isso, subtraia da renda
pós-intervenção o ganho estimado de cada domicílio. Você obterá, então, uma relação de
rendimentos pré-intervenção, uma para cada família da amostra. Repita, em seguida, a Etapa 2
e terá a CIP pré-intervenção.
Se se pensar em cada nível de renda do eixo horizontal como uma “linha de pobreza”, a
diferença entre as duas CIP’s em cada ponto lhe dará o impacto da incidência de pobreza para
aquela ‘linha de pobreza’ (anotação 6). Alternativamente, olhando horizontalmente, observa-se
o ganho de renda para aquele percentil. Se nenhum dos ganhos é negativo, a CIP pós-
intervenção deve estar sempre abaixo da CIP pré-intervenção. A pobreza terá reduzido não
importando qual “linha de pobreza” se empregue. Na verdade, isso ocorre para grande
variedade de medições de pobreza; ver Atkinson (1987). Se alguns ganhos forem negativos,
então as CIP’s vão se cruzar. A comparação de pobreza se torna ambígua; a resposta
dependerá de qual linha de pobreza e medições de pobreza se usa. (Para mais detalhes sobre
esses casos, ver Ravallion, 1994).
Podem-se usar restrições a priori para o elenco admissível de linhas de pobreza. Por exemplo,
você pode estar segura de que a linha de pobreza não excede um valor máximo, e se por acaso
a interseção das curvas ocorre acima daquele valor, a comparação não se torna ambígua. Se o
ponto de interseção (e pode haver mais de um) é abaixo de uma linha de pobreza admissível,
será preciso alguns ajustes. As curvas de incidência de pobreza acumuladas (CIPA’s) são
7
Do original: poverty incidence curves (PIC’s). N.T.
31
obtidas formando-se a soma acumulada para cada ponto da CIP (dessa forma, o segundo ponto
da CIPA é o primeiro ponto da CIP mais o segundo ponto, e assim por diante).
Ligeirinha marcou uma reunião com o Sr. Subsecretário, para apresentar a ele a
avaliação do PROSCOL.
32
“Isto seria sensato” ponderou Socióloga Engajada. “Outra coisa que eu percebi,
Ligeirinha, é que para uma família pobre ter acesso ao PROSCOL, interessa bastante saber em
qual distrito escolar ela vive.8 Todos os distritos escolares recebem os recursos centrais do
PROSCOL, mesmo os que possuem muito poucas famílias pobres. Se a família é pobre mas
mora perto de um distrito escolar bem-de-vida, há maior probabilidade de obter ajuda do
PROSCOL do que se vivesse em um distrito pobre. Eu acho que eles gostam de permitir que
todos os distritos participem por razões políticas. Como resultado, é a pobreza relativa –
relativa aos demais que vivem na sua área – que interessa, muito mais do que o nível absoluto
do padrão de vida.”
“Eu não sabia disso”, admitiu Ligeirinha, um pouco embaraçada por não tê-la
procurado para conversar antes, dado que isso poderia ser importante.
“Isso me deu uma ideia, Engajada. Eu sei a qual distrito pertence cada um dos
domicílios na pesquisa do ILE, e sei o quanto que a central distribuiu a cada um dos distritos.
Sabendo disto que me contou, essas alocações podem influenciar a participação no PROSCOL,
mas não se pode esperar que isso afete para a taxa de atendimento escolar, que deve depender
mais em um nível absoluto de padrão de vida, circunstâncias familiares, e intuo que talvez as
características da escola. Logo, a alocação dos recursos do PROSCOL entre os distritos
escolares pode ser usada como uma ‘variável instrumental’ para remover o viés de seleção em
minhas estimativas do impacto do programa.”
Os olhos da Socióloga Engajada começaram a se revirar novamente, e Ligeirinha
despediu-se e correu de volta para sua sala. Ela primeiro olhou o arquivo original que possuía
para ver quais regras a central usou para a distribuição dos fundos do PROSCOL entre os
distritos. Um memorando do ministro indicava que a alocação de recursos baseava-se no
número de crianças em idade escolar, com um ‘fator de ajuste’ para o quão pobre se supunha
ser o distrito. Entretanto, a regra era vaga.
Ligeirinha rodou novamente sua regressão para escolarização. Mas agora ela
substituiu a participação no PROSCOL pelo seu valor predito da regressão para a participação
(o escore de propensão), que agora incluía a alocação orçamentária para os distritos.
Compreendeu que tinha sido de muita ajuda o número maior possível de características para a
regressão de participação. Apesar das características escolares oficialmente não serem
relevantes para decidir como os recursos do PROSCOL são alocados, Ligeirinha percebeu que,
qualquer característica que influenciasse conjuntamente a distribuição distrital dos recursos do
8
Distrito escolar no original é school board área. Poderia ser traduzido também como vizinhança escolar ou área
envolta da escola. N. T.
33
PROSCOL e os resultados de escolarização individuais, deixaria um viés nas estimativas de
‘variáveis instrumentais’. Ela compreendeu que nunca conseguiria descartar totalmente a
possibilidade de viés, mas com bastante controle das características geográficas esse método
poderia ao menos oferecer uma comparação crível para suas estimativas de pareamento.
Assim que obteve os resultados, consistentes com as observações de Engajada, a
alocação de recursos dos distritos escolares possuíam um coeficiente positivo na regressão
logito para a participação no PROSCOL. Agora a participação no PROSCOL (predita) é
significante na regressão de taxa de atendimento escolar, na qual ela incluiu todas as variáveis
(as mesmas que havia usado) da regressão logito, exceto a distribuição dos recursos dos
distritos escolares. O coeficiente encontrado implica que a taxa de atendimento para os
participantes do PROSCOL é 15 pontos percentuais maior do que seria em caso contrário. Ela
também rodou regressões para anos de escolaridade por sexo separadamente. Tanto para os
meninos quanto para as meninas, seus resultados mostravam que os estudantes teriam deixado
a escola quase dois anos mais cedo se não fosse pelo PROSCOL.
Ligeirinha maravilhou-se com o que o professor Qui-quadrado iria pensar disto. Ela
tinha certeza de que ele questionaria seus métodos. “Pergunto-me se teria eu usado os erros-
padrão corretos ou deveria usar os métodos lineares”. Ligeirinha decidiu que solicitaria para
compra aquele novo programa de que ela tinha ouvido falar, o MEM (Métodos Econométricos
Mirabolantes). Mas isto ia ter que esperar. Por ora, Ligeirinha estava feliz com o fato de os
resultados não serem muito diferentes daqueles que ela conseguiu usando o método de
pareamento por escore de propensão. E ela reafirmou, de alguma forma, os comentários da
Socióloga Engajada que haviam sido baseados em suas observações no campo. “Isto não pode
estar tudo errado”.
34
anos, poderemos cobrir todo o país. Porém, eu quero você para continuar monitorando o
programa, Ligeirinha.”
“Eu gostaria de fazer isso, ministro. No entanto, eu aprendi algumas coisinhas com
essas avaliações. Eu poderia recomendar ao Sr. que excluísse aleatoriamente algumas famílias
elegíveis para o PROSCOL no restante de Labas. Nós poderíamos então fazer uma pesquisa de
acompanhamento dos dois tipos de famílias, daquelas que de fato participam e daquelas que
foram aleatoriamente excluídas da participação. Isto poderia nos dar uma estimativa mais
precisa dos benefícios”.
O ministro soltou um olhar congelante para Ligeirinha, e o Sr. Subsecretário começou
a se mexer e se sentir desconfortável no seu assento. Subitamente, o ministro rompeu com uma
gargalhada. “Você deve estar brincando Srta. Analista Ligeirinha! Eu já posso ver as primeiras
páginas dos jornais de Labas clamando: “O Governo Aleatoriamente nega o PROSCOL para
famílias com necessidades desesperadoras. Você não quer que eu seja reconduzido?”
“Eu vejo seu ponto, Sr. ministro. Mas sabendo-se que o Sr. não terá o dinheiro
suficiente para cobrir o ano inteiro em um ano, o senhor terá de fazer escolhas sobre quem
obterá o benefício primeiro. Por que não fazer essa escolha ser aleatoriamente entre os
participantes elegíveis? O que poderia ser mais justo?”
O ministro pensou sobre o que ela dissera. “O que me diz se nós escolhermos as
escolas ou os distritos escolares aleatoriamente na primeira onda?”
Ligeirinha concordou. “Sim, isto com certeza poderia fazer com que a escolha da
escola ou do distrito escolar fosse uma boa ‘variável instrumental’ para a entrada no
programa”, manifestou ela com entusiasmo.
“Instrumento de quê?”, indagou o Sr. ministro, enquanto o Sr. Subsecretário
novamente se sentiu desconfortável em seu assento. “Não se importe. Se isso pode funcionar
para você, verei se podemos fazer desse jeito. O ministro do Desenvolvimento Social terá de
concordar, é claro.”
“Se isto não funcionar, Sr. ministro, seria possível ainda fazer mais alguma coisa antes
do programa começar no sul do país? Uma pesquisa de ‘linha de base’ das áreas nas quais é
muito provável obtermos alta concentração de participantes do PROSCOL? Eu gostaria de
realizar isso ao mesmo tempo em que ocorre a próxima rodada da pesquisa nacional que usei
para avaliar o Norte de Labas. Há também algumas pequenas questões que eu gostaria de
acrescentar à pesquisa, por exemplo, se as crianças realizam algum trabalho pago.”
“Sim, isto parece ser um pedido razoável, senhorita Ligeirinha. Vou conversar
também com o secretário de estatísticas”.
35
Epílogo
36
bem razoável, considerando-se também o fato de que os benefícios se destinam aos mais
pobres.
Uma grande diferença em relação à primeira avaliação do PROSCOL, é que
Ligeirinha gasta muito mais tempo entendendo como cada programa funciona antes de se
chafurdar nos números. Agora ela prolonga a avaliação por um período muito mais longo, por
vezes incluindo pesquisas de base e de acompanhamento com os mesmos domicílios.
Nem tudo são flores. Inicialmente ela teve muitos problemas para fazer os principais
ministérios cooperar. Foi também difícil obrigá-los a definir os objetivos de cada programa que
ela estava avaliando. Ligeirinha considera que cobrar dos ministérios os objetivos de seus
gastos públicos é uma importante contribuição por si só. Mas eventualmente os ministérios
percebem que eles podem aprender muito com as avaliações e com o fato de que elas estão
sendo conduzidas com seriedade pelo Ministério da Fazenda.
A política interna do governo é, às vezes, um problema. Ainda bem que do lado das
informações e dos dados está tudo funcionando bem. O ministro teve a boa ideia de fazer do
secretário de estatísticas um orientador da unidade, e o Sr. Estatístico é o representante.
Ligeirinha às vezes comissiona novas pesquisas do LBS e os ajuda na formulação dos
questionários e desenho da amostra.
Ligeirinha começou também a aconselhar outros países e agências internacionais
(incluindo o Banco Mundial) que embarcaram na avaliação de impacto de programas sociais. E
ela descobriu que trocar informações com outros analistas de programas pode ser valioso. Por
exemplo, eu aprendi sobre a interessante experiência de Ligeirinha com PROSCOL numa
recente missão em Labas, e também contei aqui sobre um recente trabalho que avaliou um
programa antipobreza na Argentina, avaliação que contou com o auxílio do Banco Mundial
(Jalan e Ravalion, 1999; a anotação 8 resume os métodos e resultados do estudo). Ligeirinha
reconhece que há muitos mistérios em Labas e em qualquer lugar – mistérios cujas ferramentas
ela aprendeu a usar para desvendá-los lançando luz sobre eles.
37
Anotação 8: Exemplo de outro programa antipobreza
Os métodos de pareamento descritos na nota 3 foram usados para retirar um grupo de controle
da grande amostra da pesquisa de corte transversal nacional. A amostra de participantes possui
uma média de escore de propensão de 0,40, enquanto que na amostra nacional era de 0,075. A
amostra nacional é claramente não representativa dos participantes do Trabajar. Depois do
pareamento, entretanto, o grupo de comparação retirado da amostra nacional obteve também
um escore de 0,40.
Os resultados indicaram que os ganhos de renda do trabalho foram por volta de metade do
salário bruto no programa (a diferença dada pela perda de renda do trabalho que adviria da
desistência em participar do programa). Cerca de 80% das famílias dos trabalhadores
participantes advêm dos 20% mais pobres de todas as famílias da Argentina, em termos de
renda por pessoa (antes da intervenção). Um teste para o viés de seleção no estimador de
pareamento resultante foi feito utilizando variáveis instrumentais. O viés nas estimações de
pareamento foi insignificante.
38
Referências (inclui a lista de sugestões de leitura do professor Qui-quadrado para
Ligeirinha).
Atkinson, Anthony, 1987, “On the Measurement of Poverty”, Econometrica, 55: 749-64.
Blundell, Richard W. and R.J. Smith, 1993, “Simultaneous Microeconometric Models with
Censoring or Qualitative Dependent Variables”, in G.S. Maddala, C.R. Rao and H.D.
Vinod (eds) Handbook of Statistics Volume 11 Amsterdam: North Holland.
Foster, James, J. Greer, and Erik Thorbecke, 1984, “A Class of Decomposable Poverty
Measures”, Econometrica, 52: 761-765.
Grossman, Jean Baldwin, 1994, “Evaluating Social Policies: Principles and U.S. Experience”,
World Bank Research Observer, 9(2): 159-80.
Heckman, James and Richard Robb, 1985, “Alternative Methods of Evaluating the Impact of
Interventions: An Overview”, Journal of Econometrics, 30: 239-67.
Heckman, J., H. Ichimura, J. Smith, and P. Todd, 1998, “Characterizing Selection Bias using
Experimental Data”, Econometrica, 66: 1017-1099.
Jalan, Jyotsna and Martin Ravallion, 1999, “Income Gains from Workfare and their
Distribution”, Policy Research Working Paper, World Bank, Washington DC.
Meyer, Bruce D., 1995, “Natural and Quasi-Experiments in Economics”, Journal of Business
and Economic Statistics, April.
Manski, Charles and Irwin Garfinkel (eds), 1992, Evaluating Welfare and Training Programs,
Cambridge, Mass: Harvard University Press.
Manski, Charles and Steven Lerman, 1977, “The Estimation of Choice Probabilities from
Choice-Based Samples”, Econometrica, 45: 1977-88.
Moffit, Robert, 1991, “Program Evaluation with Nonexperimental Data”, Evaluation Review,
15(3): 291-314.
Rivers, Douglas and Quang H. Vuong, 1988, “Limited Information Estimators and Exogeneity
Tests for Simultaneous Probit Models”, Journal of Econometrics, 39: 347-366.
39
Rosenbaum, P. and D. Rubin, 1983, “The Central Role of the Propensity Score in
Observational Studies for Causal Effects”, Biometrica, 70: 41-55.
40