Escolar Documentos
Profissional Documentos
Cultura Documentos
Lista de exercícios # 3
1
(Q.1) No enunciado acima, há três relações que conectam as três variáveis. Represente
essas relações a partir de um diagrama de flechas tal como o que consta na nota de
aula 4. Para isso, considere duas convenções, quais sejam: (a) a causalidade deve ser
indicada com uma flecha unidirecional, “→”, em cujo início está a variável-causa e, em,
cujo término, a variável-consequência e; (b) a correlação deve ser indicada com uma
flecha bidirecional ,“↔”.
O coeficiente β1 seria uma medida mais adequada do que o coeficiente α1, pois traria
uma precisão maior em indicar a medida de influência de quali_pub sobre
Nota_ENEM, Algo que facilitaria para que os Governos enxergassem com maior clareza
os impactos de suas políticas (alteração da variável correspondente quali_pub)
trariam.
2
(Q.3) O que ocorreria caso os resultados da estimação da FRP 1 fossem tomados por
base para decidir quanto à implementação da política?
A decisão por realizar ou não realizar uma política pública poderia se dar de
maneira equivocada. Como o próprio enunciado da questão diz, são duas variáveis
explicativas com alto grau de influência sobre Nota_ENEM. Lançar mão de uma
regressão simples e incluir uma dessas variáveis no termo de perturbação poderia,
apesar de ainda estar incorporado no modelo, fazer com que fosse incorporado nas
estimativas da variável quali_pub a influência de variáveis que a política dos Governos
não possui efeito. Dessa forma, a decisão de realizar ou não políticas para alterar
quali_pub se daria a partir de parâmetros pouco claros e com menor precisão.
(Q.4) Uma medida para a discriminação racial no mercado de trabalho é dada pela
estimativa pontual para o parâmetro δ na FRP a seguir, em que Wi é o salário recebido
pelo i-ésimo indivíduo, “educ” capta o nível educacional e X contém explicativas
socioeconômicas adicionais. Os indivíduos que se auto-declararam brancos são
indicados com d_bca = 1, e indivíduos os que se auto declararam não brancos, d_bca =
0.
3
(Q.5) Um pesquisador estimou uma FRP em que a variável dependente é o escore Z
para a defasagem de altura para a idade de crianças, uma medida de desnutrição.
Trata-se da equação escore_Z = β0 + β1renda_fami + β2d_sani + β2d_SEi + ui, a qual será
referida, doravante, como “equação original”. Em que renda_fam ≡ renda familiar per
capita mensal, d_san ≡ binária indicando com valor unitário o acesso a saneamento
básico e d_SE ≡ binária indicando com valor unitário residência na região sudeste do
País. Apenas crianças de até cinco anos foram consideradas como parte da amostra.
Uma vez obtidos os resultados, o pesquisador decidiu fazer um teste, ampliando a FRP
com a inclusão de uma binária indicando acesso a postos de saúde, d_psaude. Ao
comparar os resultados da FRP original e da FRP ampliada, detectou-se que (i) ambas
apresentaram a mesma SQR e, (ii) a FRP ampliada apresentou menor R2 ajustado.
Explique porque (ii) ocorreu.
Isso basicamente ocorreu, pois, a nova variável incluída pode ser detentora de
uma baixa explicativa para a “defasagem de altura para a idade de crianças”. Dado a
definição de R2, poderíamos compreender que a queda de R2 poderia se dar a partir de
alterações na Soma dos Quadrados Residuais (SQR) e na Soma dos Quadrados Totais
(SQT):
(Q.6) Enuncie e explique a serventia das sete hipóteses do MCRL. Por “serventia”
entenda (i) propriedades estatísticas cuja validade depende das hipóteses, (ii)
simplificações de estatísticas permitidas pelas hipóteses e, (iii) condições exigidas pelos
estimadores de MQO cuja verificação é garantida pelas hipóteses.
As hipóteses MCRL são de muita importância pois permitem que se tenha uma
compreensão adequada dos estimadores e o que eles norteiam e possibilita. As
hipóteses 1, 2,3 e 4, ao qual dizem respeito às condições, respectivamente, (1) “o
modelo de regressão ser linear nos parâmetros”, (2) “os valores da variável explicativa
e da variável explicada serem oriundas de uma amostra aleatória”, (3) “valores da
variável explicada não podem ser constantes” e (4) a “média condicional do erro ser
igual a 0”. Quando essas 4 condições são atendidas, temos que os estimadores de
MQO para os parâmetros do modelo de regressão é não-viesado. Podendo parte
4
dessas suposições falharem em alguns casos, como por exemplo quando ocorre uma
omissão de variável explicativa relevante e correlacionada, quando ocorre um erro de
medida ou quando há simultaneidade entre a variável explicada e a variável
explicativa.
(Q.7) Quais dos seguintes itens podem fazer que os estimadores de MQO sejam
viesados? Explique sua escolha.
(a) Heterocedasticidade;
(b) Omitir uma variável importante.
Por outro lado, (b) omitir uma variável importante de fato pode fazer com que
os estimadores de MQO sejam viesados. Isso é observado a partir da suposição
fundamental MCRL 4, na qual se tem definido que a média condicional do erro deve
atender a condição de ser igual a 0 (i.e. “E(u|x) = 0”) e x ser exógeno. Essa suposição é
tida como uma das 4 fundamentais para que os estimadores MQO sejam não viesados.
De acordo com algumas formulações a respeito dessa condição, temos que ela pode
falhar em caso e que ocorra justamente a omissão de variável explicativa relevante e
correlacionada com a variável x. Além disso, em outros casos, como na construção de
uma formulação incorreta , ter erro de medida em x ou houver simultaneidade entre x
e y, podem influenciar para que MCRL 4 fosse viesado.