Escolar Documentos
Profissional Documentos
Cultura Documentos
Abstract: The aim of this paper is to estimate the impact of education on wages
between South and Paraná. We use the number of schools in the state and year
when the individual was born as instruments for his education level. We also make a
description of the main educational policies which affected the education system
since president Dutra´s term until president Figueiredo´s. The results show that the
number of schools in the individual´s year of birth bears a positive relationship with
his education, and the returns to education decrease quite substantially when the
method of instrumental variables is used.
Key-Words: Mincer, Wages, IV, Education.
1
Universidade Estadual de Maringá (UEM). Endereço eletrônico: teixeir@usp.br
1
1 - Introdução
2 - Metodologia
2
Ver Angrist & Krueguer (1999)
2
Na equação de rendimentos, a forma funcional mais comum é a baseada em
Mincer (1974), no qual considerando dados observacionais, supõe-se que a questão
de interesse seja estimar uma relação do logaritmo do salário (lw) e uma variável x,
tal como lw = f(x).
O primeiro ponto a ser admitido a respeito desta relação e que impõe
restrições à análise, refere-se a assumir que a relação é log-linear, e que ela é a
mesma para todos os indivíduos. Cabe ressaltar que a especificação log-linear da
equação de salários é pelo fato de que em muitos casos a distribuição desta variável
aproxima-se bem de uma distribuição log-normal.
Assim, de acordo com o modelo de Mincer (1974), o logaritmo do
rendimento individual em um dado período de tempo pode ser decomposto dentro
de uma função aditiva e linear de um termo da educação (S), um termo de
experiência (X) e um termo de experiência quadrática (X2) 3. Geralmente adota-se a
forma funcional em que os ganhos se elevam à medida que os anos passam. Além
disto, esses ganhos seriam crescentes a taxas decrescentes ao longo dos anos de
vida do indivíduo, então, há a adoção da seguinte equação:
log y = α + βS + βX + βX 2 + ε it (1)
3
Um trabalho clássico que envolve a relação entre rendimentos e idade pode ser considerado por
Murphy and Welch (1990) os quais atestam sobre a especificação quadrática da equação de
rendimentos.
3
principais determinantes (observáveis) dos salários, como escolaridade, ocupação,
região de domicílio, ramo de atividade, etc. Isso faz com que haja uma invalidação
da interpretação causal dos coeficientes estimados.
O método mais fácil de lidar com o problema de causalidade é a inclusão de
variáveis de controle observáveis que capturem a correlação entre o regressor de
interesse e os componentes aleatórios. No caso do efeito da educação sobre os
salários, por exemplo, vários estudos incluem resultados de testes de Quociente de
inteligência4.
O problema dessa metodologia é que dificilmente podemos admitir que uma
variável de controle capture toda correlação entre o regressor e o erro para auferir
rendimentos. Isso só vale quando se conhece o processo que gera o regressor de
interesse. Os problemas adicionais dessa metodologia são que se a variável de
interesse for medida com erro, a inclusão de controles tenderá a agravar o viés
atenuador decorrente desse erro. A idéia do trabalho é utilizar variações exógenas
para aproximar os experimentos aleatórios.
O grande problema desse método é a procura por instrumentos exógenos
que claramente satisfaçam as condições citadas anteriormente. Deste modo, seria
necessária uma variável que fosse correlacionada com educação, porém não
correlacionada com a capacidade de obtenção de rendimentos do trabalho, tal como
número de escolas, por exemplo. Grande parte da literatura americana trabalha com
episódios esporádicos como sorteio para serviço militar5 ou mudanças nas regras
que definem tamanho de classes para identificar seu efeito sobre rendimento
escolar. Para motivar e obter uma estimativa de uma estimação pelo método de
variáveis instrumentais, de acordo com Wooldridge (2002), considere as seguintes
hipóteses:
y = β 0 + β1 + β 2 x 2 + ... + β K x K + u (2)
E (u ) = 0, Cov( x j , u ) = 0, j=1,2,...,K-1 (3)
4
Ver Card (1995)
5
Ver Angrist (1990)
4
equação 2. A endogeneidade vem do fato da variável x j ser correlacionada com u .
E (u / x1 , x 2 ,..., x K ) = E (u / x) = 0 (4)
Cov ( z1 , u ) = 0 (5)
x k = δ 0 + δ 1 + δ 2 x 2 + ... + δ K −1 x K −1 + θ1 z1 + rK (6)
θ1 ≠ 0 (7)
5
Se x K é a única variável explanatória da equação 2, então a projeção linear
y = α 0 + α 1 x1 + α 2 x 2 + ... + α K −1 x K −1 + λ1 z1 + υ (8)
y = xβ + u (9)
6
Onde x = (1, x 2 ,..., x k ) e o vetor de todas as variáveis exógenas pode ser
E ( z´u ) = 0 (10)
Multiplicando a equação 9 por z´, aplicando esperança, e usando 10 tem-se:
[ E ( z´x)]β = E ( z´ y ) (11)
β = [ E ( z´x)]−1 E ( z´ y ) (13)
^ N N
β = ( N −1 ∑ z i´ xi ) −1 ( N −1 ∑ z i´ y i ) = ( z´x) −1 z´ y
i =1 i =1 (14)
z
Onde e x são matrizes N vezes K e y é um vetor y i . A consistência deste
estimador baseia-se na lei dos grandes números. A hipótese básica do modelo de
variáveis instrumentais é que a única razão pela qual lw (logaritmo dos salários,
7
Quadrados Ordinários em dois estágios, que usa os valores previstos de uma
8
Modelo MQO (Mínimos Quadrados Ordinários)
educa = α + β 1 esc + β 2 pib + β 3 pop + β 4 idade + β 5 idade 2 + β 6 raca + β 7 sex 1
Sendo:
educa = Variável dependente
α = Constante
esc = número de escolas anual em cada estado quando o indivíduo nasce.
pop = População anual em cada estado quando o indivíduo nasce.
PIB = Participação estadual no PIB nacional anual em cada estado quando
o indivíduo nasce.
raça = raça do indivíduo sendo igual a 1 quando o mesmo é branco, e 0
caso contrário.
sex1 = Sexo do indivíduo sendo igual a 1 quando o mesmo é homem, e 0
caso contrário
dummies de Coorte (presidentes da república) = Figueiredo, Geisel,
Médici, CostaeSilva, Castelo, Quadros-Goulart, Kubitschek, VargasCafé e Dutra.
dummies de estados = PR, SC e RS
dummies de ano = 1995,1996,1997, 1998, 1999, 2001 e 2002
εit = erro aleatório.
No segundo estágio, vamos estimar os retornos à educação considerando-
se o impacto da variável idade, idade ao quadrado, sexo, cor e dummies de estado.
Desta forma, temos a seguinte especificação:
9
sex1 = Variável que admite 1 se o sexo for masculino, 0 caso contrário.
dummies de estado = PR, SC e RS
dummies de coorte = Figueiredo,..,Dutra
dummies de ano = 1995,1996, 1997,1998,1999, 2001 e 2002
εit = erro aleatório
10
4 - Resultados
11
verificando-se que há um avanço recente na educação brasileira, pois as dummies
de ano em todos os modelos apontam para uma relação positiva e crescente entre
ano e educação.
A tabela 3 mostra as estimações dos modelos de Mínimos Quadrados
Ordinários que utilizam como controles, o número de escolas, a participação do PIB
estadual e a população. Abaixo de cada um dos modelos estimados foram
considerados os erros padrões entre parêntese com o respectivo nível de
significância estatística. Neste subitem, há uma junção das PNADS de 1995, 1996,
1997, 1998, 2000, 2001, 2002. Houve a tentativa de modelar as variáveis: sexo,
educação, raça, idade, idade ao quadrado, dummies de ano e dummies de coorte. A
amostra irá considerar indivíduos com mais de 18 anos. Não foi estimado um painel
pelo fato de não ser a mesma população ao longo do tempo e pelo fato de haver
problema de identificação na estimação de um painel que considere sexo, raça e
educação. As dummies de estado consideram o estado do Paraná como estado de
comparação e serão importantes para diferenciar o retorno à educação no Paraná
com relação aos demais estados da Região Sul, ou seja, na última tabela do
trabalho.
As dummies de presidente da república, as quais representam as coortes,
são dummies de geração que mostram o impacto da aprovação escolar de
determinado presidente em determinada série quando o indivíduo nasce. Nesta
parte do trabalho, foram utilizados, além das PNADS acima referidas, dados do
IBGE referentes a número de escolas, população e participação estadual no PIB. Ao
identificar-se o modelo, considerou-se o impacto do sexo masculino (sex1) na
aprovação escolar em relação ao sexo feminino e o impacto da raça branca (raca2)
sobre as demais raças.Um fato bem interessante pode ser observado durante
algumas gestões do regime militar (Costa e Silva até Geisel), pois se observa que
apenas as gerações de Costa e Silva, Médici e Geisel estariam numa situação pior
que a geração de Figueiredo quando se considera o modelo de mínimos quadrados
ordinários.
O período da ditadura, que começa em Castelo Branco, é marcado pela
abolição dos percentuais mínimos a educação, junto com isso, há um aumento na
faixa de escolarização sem haver uma noção clara de que setor se deveria tirar o
dinheiro para promover educação e quanto mais o erário teria que gastar com isso.
Há um conjunto de políticas que, se não prejudicaram, não ajudaram no avanço
12
escolar quando se comparam as coortes, as gerações de Costa e Silva, Médici e
Geisel estariam numa pior situação do que a geração de Figueiredo.
13
comparação para um modelo que instrumentaliza a variável educação. Os
resultados interessantes dos modelos mostram no modelo 2 da tabela 4, logo há
uma atenuação do impacto da educação sobre a economia, deste modo, ao se
instrumentalizar a educação tem-se resultados menores para cada ano de educação
em relação ao modelo que considera apenas o primeiro estágio. É preciso frisar que
de acordo com as coortes que o retorno à educação cresce ao longo do tempo.
Verifica-se que os rendimentos crescem para as gerações mais novas comparado
às mais velhas no modelo 2 da tabela 4.
Assim, foi estimada uma equação de rendimentos convencional que
considerou as PNADS de 1995 a 2002 e foi ponderada pelo peso do indivíduo na
amostra. Após isso, procurará instrumentalizar a educação pelo número de escolas
por estado, população por estado e PIB estadual no ano de nascimento do indivíduo.
Logo, há a preocupação de trazer à tona o problema de endogeneidade e utilizar
instrumentos, tendo como conseqüência uma equação de segundo estágio.
Ao se estimar as equações de rendimento convencional e com os
instrumentos número de escolas, a população e o PIB para a variável educação,
foram obtidos dois modelos com seus respectivos resultados: i) O primeiro modelo
considera a equação de salários que não instrumentaliza por número de escolas,
população e PIB. ii) O segundo modelo é estimado por variáveis instrumentais e
considera as dummies de coorte e o peso do indivíduo nos dois estágios.
De acordo com a tabela 4 observou-se no primeiro modelo que um ano de
escola contribui em mais de 12% do rendimento do indivíduo. No que se refere ao
sexo pode-se afirmar, segundo os modelos estimados, que homens ganhariam mais
do que mulheres em ambos os modelos. No que se refere ao efeito de raça, pode-se
afirmar que brancos ganham mais que não brancos no modelo agregado e
ponderado. Considerando as dummies de estado, pode-se afirmar que a dummy do
Rio Grande de Sul apresenta um resultado negativo em relação a Paraná, e a
dummy de Santa Catarina apresenta um resultado positivo com relação ao Paraná.
14
Tabela 4 – Segundo Estágio: Equações de rendimento
Modelo I II
Educa .1210 .0482
(.0005)*** (.0243)**
Idade .1029 .1138
(.0028)*** (.0047)***
idade2 -.0010 -.0013
(4.44e-05)*** (9,22e-05)**
sex1 .5382 .4567
(.0042)*** (.0275)***
Raça .1457 .2990
(.0056)*** (.0484)***
Geisel .0386 .0319
(.0081)*** (.0086)***
Médici .0371 .0240
(.0091)*** (.0106)**
CostaeSilva -.0175 -.0334
(.0122) (.0141)**
Castelo -.0678 -.0777
(.0174)*** (.0190)***
JânioJoão -.1055 -.1133
(.0202)*** (.0219)***
Kubitschek -.1358 -.1360
(.0241)*** (.0259)***
VargasCafé -.1331 -.1304
(.0306)*** (.0329)***
Dutra -.1501 -.1503
(.0380)*** (.0410)***
SC .1201 .1097
(.0057)*** (.0071)***
RS -.0428 -.0307
(.0046)*** (.0060)***
Dummies de Ano Sim Sim
Constante 2.480 2.964
(.0423)*** (.1540)***
*** significante a 1%; ** significante a 5 %; * significante a 10%
15
considerar o problema de endogeneidade, controlar por dummies de coorte e ser
ponderado pelo peso do indivíduo na PNAD, pois participa o peso do indivíduo em
cada uma das Pesquisas Nacionais por Amostra Domiciliares. Quanto ao resultado
de sexo e cor, há uma atenuação em relação aos resultados da variável sexo, e um
aumento do impacto da cor quando se compara com os resultados do primeiro
estágio. Logo, verifica-se que há discriminação de sexo e cor no mercado de
trabalho do Sul do País6.
6 – Conclusões
6
Para referências de Brasil ver Kassouf (1998); Lovell (1992) e Cavalieri e Fernandes (1998)
16
A escolha dos instrumentos: número de escolas, população, e participação
do PIB estadual no PIB regional, advieram do fato dos mesmos ser exógenos. Não
se utilizou painel pelo fato de controlar por características observáveis, pois
controlando por efeito fixo poder-se ia não estar encontrando o resultado correto
pelo fato de não se estar trabalhando com os mesmos indivíduos ao longo do
tempo.Um resultado novo no trabalho seria o de mostrar que Os ganhos de salário
real no Paraná estariam crescendo mais do que os ganhos no Rio Grande do Sul.
7 – Referências bibliograficas
Angrist, J. Lifetime earning and the Vietnam era draft lottery: evidence from social
security administrative records. American Economic Rewiew, v. 80, no 3, 313-
335, 1990.
Angrist, J. and Krueger, A. Why do World War II Veterans Earn More than
Nonveterans?. Journal of Labor Economics, Vol.12, no 1, 74-97, 1994.
Angrist, J ; Imbens, G and Krueguer, A. Jackknife instrumental variables estimation.
Journal of applied econometrics, 14. 57-67, 1999
Bound and Jager. On the Validity of season of birth as an instrument in wage
equation. NBER. Working Paper no 5835, November, 1996.
Brasil. Constituição federal, vários anos. Disponível em: < http://
www.senado.gov.br/sf/legislacao/BasesHist > acesso em 2006.
Card, D. Earnings, Schooling, and Ability Revisited. Research in Labor Economics,
vol. 14, Greenwich Connecticut: JAI Press, 1995
Cavalieri, C & Fernandes, R. Diferenciais de salários por gênero e cor: uma
comparação entre regiões metropolitanas brasileiras. Revista de Economia
Política., v 18, n.1, 1998.
Hahn, J & Hausman, J. Weak Instruments: Diagnosis and Cures in Empirical
Econometrics. AEA Papers and Proceedings. Recent Advances in Econometric
Methodology. Vol. 93, No 2, may, 2003
IBGE. Estatísticas do Século XX. Disponível em http:\\ www.ibge.gov.br. Acesso
em agosto de 2004.
Kassouf. Wage Gender discrimination and segmentation in the Brasilian labor
market. Economia Aplicada., v.2, 1998
Koenker and Basset . Regression Quantiles. Econometrica, v.46, p 33-50, 1978
Lovell. Raça, Gênero e discriminação salarial no Brasil. Estudos Afro-Asiáticos,
n.22. p. 85-98, 1992.
Maddala, G and Jeong, J. On the exact small sample distribuition of the instrumental
variable estimator, econometrica. vol 60, no 1, 1981-1983, 1992.
Murphy, K and Welch, F. Empirical Age-Earning Profiles. Journal of Labor
Economics, Vol 8. no 2. 202 -229, 1990.
17
Mincer, J. Schooling, experience e earnings. Columbia University Press, 1974.
Menezes-Filho, N. Aceleração Recente da Educação no Brasil. Seminários
Acadêmicos de 5ª feira. Seminário nº 15. Universidade de São Paulo.
Instituto de Pesquisas Econômicas. (mimeo), 2003
______.Equações de Rendimentos: Questões Metodológicas. In: Corseuil et alli
(2002) Estrutura Salarial: Aspectos Conceituais e Novos Resultados para o
Brasil. IPEA. Pág 51-66, 2002.
Menezes-Filho, N; Fernandes, R; Pichetti. Wage inequality in Brazil; some
stylized facts. Anais do XVI Encontro de Econometria, Belém-PA, 1999.
Savedoff, W. Wage dynamics in urban Brazil: evidence of regional segmentation or
national markets. Revista econometrica, v.11, n.2, 1991.
Staigner, D & Stock, J. Instrumental Variables regression with weak instruments.
Econometrica, v. 65, n. 3, 1997.
Wooldridge, J. Econometric Analysis of Cross Section and Panel Data. The MIT
Press. Cambridge, Massachusetts, London, England. 2002.
18