Você está na página 1de 5

Econometria I

Lista de exercícios # 3

Alisson Souza de Lima – RA: 11201721962

A lista deve ser entregue online no dia 29/10

(Texto para as questões 1 a 3) Os governos dos estados brasileiros estão interessados


em implementar ações com o intuito de melhorar o desempenho dos alunos de
escolas estaduais no ENEM. Resultados de estudos econométricos previamente
realizados apontam que a qualidade da escola pública em que foi cursado o ensino
médio é uma das principais causas do desempenho do aluno no ENEM. Seja assumido
que é possível obter, a partir dos dados disponíveis, uma medida razoavelmente
precisa para a qualidade das escolas públicas, denotada por “quali_pub”. Também será
assumido que os governos estaduais são capazes de alterar a variável em questão.
Com base nisso, seja, por simplicidade, considerada uma política pública estadual que
procura melhorar o desempenho no ENEM explorando, para isso, a via de aumento da
qualidade das escolas públicas de ensino médio. Você foi contratado para estimar o
impacto provável desta política como subsídio à decisão que definirá se ela vai ou não
ser implementada. Os dados disponíveis compreendem três variáveis, (i) desempenho
dos alunos de escolas estaduais de ensino médio no ENEM, nota_ENEM, (ii) quali_pub,
(iii) nível educacional dos pais dos alunos, educ_pais. A partir destes dados é possível
estimar duas FRPs distintas.

(FRP 1) Nota_ENEMi = α0 + α1quali_pubi + ei

(FRP 2) Nota_ENEMi = β0 + β1quali_pubi + β2educ_paisi + ui

Ao comparar as duas FRPs, deve-se levar em conta a existência de correlação entre


quali_pub e educ_pais, justificada pela conjectura de que a capacidade de selecionar a
melhor escola para os filhos é diretamente proporcional ao nível educacional. Além
disso, há evidência de que o desempenho no ENEM é positivamente correlacionado
com a educação dos pais.

1
(Q.1) No enunciado acima, há três relações que conectam as três variáveis. Represente
essas relações a partir de um diagrama de flechas tal como o que consta na nota de
aula 4. Para isso, considere duas convenções, quais sejam: (a) a causalidade deve ser
indicada com uma flecha unidirecional, “→”, em cujo início está a variável-causa e, em,
cujo término, a variável-consequência e; (b) a correlação deve ser indicada com uma
flecha bidirecional ,“↔”.

(Q.2) Explique porque o coeficiente β1 é uma medida mais adequada do que o


coeficiente α1 para o impacto da política pública. Tome por base (i) o diagrama
elaborado na questão anterior, (ii) a interpretação ceteris paribus da regressão
múltipla (nota de aula 4) e (iii) o teorema de Frisch-Waugh (nota de aula 4).

O coeficiente β1 seria uma medida mais adequada do que o coeficiente α1, pois traria
uma precisão maior em indicar a medida de influência de quali_pub sobre
Nota_ENEM, Algo que facilitaria para que os Governos enxergassem com maior clareza
os impactos de suas políticas (alteração da variável correspondente quali_pub)
trariam.

O próprio diagrama da Questão 1 ilustra quase que de maneira clara a


eficiência que o uso do coeficiente β1 teria para medir o impacto da política pública.
Isso ocorreria, pois, lançando mão do coeficiente β1 e lançando mão do teorema de
Frisch-Waug, teríamos uma regressão múltipla ao qual o coeficiente de uma explicativa
capta a influência dela liquida, i.e., sem a influência das demais variáveis explicativas
do modelo. Além disso, e dado sob os efeitos dessas condições, o coeficiente se daria
também sob os termos da clausula “ceteris paribus”, já que estaríamos “mantendo
todas as demais condições (ou variáveis) inalteradas”.

2
(Q.3) O que ocorreria caso os resultados da estimação da FRP 1 fossem tomados por
base para decidir quanto à implementação da política?

A decisão por realizar ou não realizar uma política pública poderia se dar de
maneira equivocada. Como o próprio enunciado da questão diz, são duas variáveis
explicativas com alto grau de influência sobre Nota_ENEM. Lançar mão de uma
regressão simples e incluir uma dessas variáveis no termo de perturbação poderia,
apesar de ainda estar incorporado no modelo, fazer com que fosse incorporado nas
estimativas da variável quali_pub a influência de variáveis que a política dos Governos
não possui efeito. Dessa forma, a decisão de realizar ou não políticas para alterar
quali_pub se daria a partir de parâmetros pouco claros e com menor precisão.

(Q.4) Uma medida para a discriminação racial no mercado de trabalho é dada pela
estimativa pontual para o parâmetro δ na FRP a seguir, em que Wi é o salário recebido
pelo i-ésimo indivíduo, “educ” capta o nível educacional e X contém explicativas
socioeconômicas adicionais. Os indivíduos que se auto-declararam brancos são
indicados com d_bca = 1, e indivíduos os que se auto declararam não brancos, d_bca =
0.

log(Wi) = β0 + β1educi + xi’β3 + δd_bcai

Argumente porque a estimativa pontual de δ é uma medida para a porção do


diferencial salarial associada à discriminação racial. Embase sua resposta no teorema
de Frisch-Waugh e no conceito do coeficiente de uma variável binária.

A medida para a “discriminação racial no mercado de trabalho” descrita é


construída a partir de um modelo de regressão que define muito bem os coeficientes
de alta influencia explicativa, utilizando uma métrica que quantifica os coeficientes
excluindo aquilo que se dá sob a influência de outras variáveis explicativas, tal como é
descrito pelo teorema de Frisch-Waugh. Além disso, faz um bom emprego dos
coeficientes qualitativos (d_bca = 0 e d_bca=1) ao qual é responsável por atribuir as
categorias sob a qual os resultados irão se distribuir. Como a medida se dá afim e
compreender a discriminação racial no mercado de trabalho, nada mais justo que
incluir um coeficiente explicativo capaz de definir o quanto a expectativa condicional
de quem se declara branco e quem se declara negro diferem entre si.

3
(Q.5) Um pesquisador estimou uma FRP em que a variável dependente é o escore Z
para a defasagem de altura para a idade de crianças, uma medida de desnutrição.
Trata-se da equação escore_Z = β0 + β1renda_fami + β2d_sani + β2d_SEi + ui, a qual será
referida, doravante, como “equação original”. Em que renda_fam ≡ renda familiar per
capita mensal, d_san ≡ binária indicando com valor unitário o acesso a saneamento
básico e d_SE ≡ binária indicando com valor unitário residência na região sudeste do
País. Apenas crianças de até cinco anos foram consideradas como parte da amostra.
Uma vez obtidos os resultados, o pesquisador decidiu fazer um teste, ampliando a FRP
com a inclusão de uma binária indicando acesso a postos de saúde, d_psaude. Ao
comparar os resultados da FRP original e da FRP ampliada, detectou-se que (i) ambas
apresentaram a mesma SQR e, (ii) a FRP ampliada apresentou menor R2 ajustado.
Explique porque (ii) ocorreu.

Isso basicamente ocorreu, pois, a nova variável incluída pode ser detentora de
uma baixa explicativa para a “defasagem de altura para a idade de crianças”. Dado a
definição de R2, poderíamos compreender que a queda de R2 poderia se dar a partir de
alterações na Soma dos Quadrados Residuais (SQR) e na Soma dos Quadrados Totais
(SQT):

Como o enunciado nos diz que a SQR se permaneceu constante após a


implementação de uma nova variável binária na equação, temos que a redução em R2
só poderia ter se dado a partir de uma redução na SQT. Como a SQT reduziu e temos
SQR constante, e SQT = SQE + SQR a redução só poderia ser dada a partir de uma
redução de SQE, a “Soma dos Quadrados Explicados”. Isso indica que realmente a nova
variável incluída na FRP ampliada não faz melhorar a precisão da FRP estimada.

(Q.6) Enuncie e explique a serventia das sete hipóteses do MCRL. Por “serventia”
entenda (i) propriedades estatísticas cuja validade depende das hipóteses, (ii)
simplificações de estatísticas permitidas pelas hipóteses e, (iii) condições exigidas pelos
estimadores de MQO cuja verificação é garantida pelas hipóteses.

As hipóteses MCRL são de muita importância pois permitem que se tenha uma
compreensão adequada dos estimadores e o que eles norteiam e possibilita. As
hipóteses 1, 2,3 e 4, ao qual dizem respeito às condições, respectivamente, (1) “o
modelo de regressão ser linear nos parâmetros”, (2) “os valores da variável explicativa
e da variável explicada serem oriundas de uma amostra aleatória”, (3) “valores da
variável explicada não podem ser constantes” e (4) a “média condicional do erro ser
igual a 0”. Quando essas 4 condições são atendidas, temos que os estimadores de
MQO para os parâmetros do modelo de regressão é não-viesado. Podendo parte

4
dessas suposições falharem em alguns casos, como por exemplo quando ocorre uma
omissão de variável explicativa relevante e correlacionada, quando ocorre um erro de
medida ou quando há simultaneidade entre a variável explicada e a variável
explicativa.

Quando os estimadores assumem as 4 suposições descritas anteriormente, mas


também assume a suposição 5, de que os erros são homocedásticos, i.e. com
Var(u|x)= α², a partir disso teríamos que os parâmetros para o modelo de regressão
não só não é viesado mas é também eficiente.

Quando é assumida todas as 5 suposições anteriores e é assumido a 6º


suposição, de que os erros são normalmente distribuídos. Dessa forma, temos que os
parâmetros não só não são viesados, mais o modelo de regressão é construído sob
parâmetros eficientes e normalmente distribuído. Algo de extrema importância já que
dessa forma, de acordo com todas as condições de MQO, é possível identificar quando
os estimadores atendem as condições para poder ser realizadas inferências a partir
deles.

(Q.7) Quais dos seguintes itens podem fazer que os estimadores de MQO sejam
viesados? Explique sua escolha.
(a) Heterocedasticidade;
(b) Omitir uma variável importante.

Mesmo com a presença de (a) heterocedasticidade nos erros, os estimadores


de MQO continuam sendo não viesados e consistentes. Como os estimadores não
possuem variância mínima, apenas deixam de ser eficientes.

Por outro lado, (b) omitir uma variável importante de fato pode fazer com que
os estimadores de MQO sejam viesados. Isso é observado a partir da suposição
fundamental MCRL 4, na qual se tem definido que a média condicional do erro deve
atender a condição de ser igual a 0 (i.e. “E(u|x) = 0”) e x ser exógeno. Essa suposição é
tida como uma das 4 fundamentais para que os estimadores MQO sejam não viesados.
De acordo com algumas formulações a respeito dessa condição, temos que ela pode
falhar em caso e que ocorra justamente a omissão de variável explicativa relevante e
correlacionada com a variável x. Além disso, em outros casos, como na construção de
uma formulação incorreta , ter erro de medida em x ou houver simultaneidade entre x
e y, podem influenciar para que MCRL 4 fosse viesado.

Você também pode gostar