Você está na página 1de 10

ENAP – MPAM3

André Maurício Penha Brasil

Trabalho Final de Métodos Quantitativos


Questão 1:
Regressão por Mínimos Quadrados Ordinários no RStudio:

Tabela Exercício 1:
Observa-se que a variável lwage (que o logaritmo do salário/hora) varia em 10,2% em
relação à variável educ (que mede os anos de educação). O p-value inferior a 0,01 indica
uma evidência muito forte contra a hipótese nula. O R² (0,115) é relativamente baixo,
indicando que existem outras variáveis envolvidas.
A principal hipótese da relação entre o regressor e o termo de erro pode ser expressada pela
seguinte fórmula:

𝐸 𝜀 |𝑒𝑑𝑢𝑐 =0

Ou seja, que a esperança do valor do termo de erro em qualquer valor do regressor é zero,
que é a 4ª hipótese de Gauss-Markov
Questão 2
Regressão supondo a Homoscedasticidade vs. Heterocedasticidade:
A homoscedasticidade assume a variância constante do termo não observado:

𝑉𝑎𝑟 𝜀 |𝑒𝑑𝑢𝑐 =𝜎

Summary do Exercício 1, que supõe homocedasticidade:

Utilizando a regressão robusta a erros heterocedásticos:

O erro padrão cresce com a suposição de heterocedasticidade, mas isso afeta apenas a
inferência estatística, não afeta a consistência do coeficiente (inferência causal). Em ambas
as suposições, o coeficiente continua sendo muito significativo.
Questão 3
A consistência do estimador é demonstrada quando o estimador fica cada vez mais
próximo dos parâmetros verdadeiros à medida que o tamanho da amostra cresce.
Formalmente:

𝑝𝑙𝑖𝑚 𝛽 = 𝛽

Prova:

1 1
𝛽 = 𝛽 + (𝑋 𝑋) 𝑋 𝑢 = 𝑋 𝑋´ 𝑋 𝑢
𝑛 𝑛

𝑝𝑙𝑖𝑚 𝛽 = 𝛽 = 𝛽 + 𝐸 𝑋 𝑋 ´ 𝐸[𝑋 𝑢 ] = 𝛽, 𝑝𝑜𝑖𝑠 𝐸[𝑋 𝜇 ] = 0

Para o modelo em questão:


𝐶𝑜𝑣(𝑒𝑑𝑢𝑐 , 𝑙𝑜𝑔𝜔 )
𝛽=
𝑉𝑎𝑟(𝑒𝑑𝑢𝑐 )
𝐶𝑜𝑣(𝑒𝑑𝑢𝑐 𝛼 + 𝛽𝑒𝑑𝑢𝑐 + 𝑣 + 𝜖 ´ )
=
𝑉𝑎𝑟(𝑒𝑑𝑢𝑐 )

Questão 4
Considerando o modelo log 𝑤 = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 + 𝑣 + 𝜖 , em que i indexa o indivíduo e p
o par de gêmeos:

 𝑙𝑜𝑔(𝑤 ) = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 +𝑣 +𝜖
 𝑙𝑜𝑔(𝑤 ) = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 +𝑣 +𝜖

Em primeira diferença:

𝛽= 𝛥𝑒𝑑𝑢𝑐 𝛥𝑒𝑑𝑢𝑐′ 𝛥𝑒𝑑𝑢𝑐 𝛥𝑤

= 𝐶𝑜𝑣 𝑙𝑜𝑔(𝑤 − 𝑙𝑜𝑔(𝑤 ), 𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐 )


𝑉𝑎𝑟(𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐 )

𝛽𝐶𝑜𝑣 𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐


=
𝑉𝑎𝑟(𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐 )

𝛽 ∗ 𝑉𝑎𝑟 𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐


=
𝑉𝑎𝑟(𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐 )

=𝛽
Questão 5

A base de dados pubtwins já possui o campo dlwage, que é a diferença de lwage, facilitando
a regressão. A base dt2 é criada para evitar a dupla contagem dos gêmeos (680 observações
correspondem a 340 pares).
Summary do Exercício 5:

Percebe-se que o coeficiente diminuiu significativamente (de 0,10 para 0,06).


Questão 6
Efeitos fixos (transformação within)

𝑙𝑜𝑔(𝑤 ) − 𝑙𝑜𝑔(𝑤 ) = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 +𝑣 +𝜖 − 𝛼 + 𝛽𝑒𝑑𝑢𝑐 +𝑣 +𝜖

= 𝛽 𝑒𝑑𝑢𝑐 − 𝑒𝑑𝑢𝑐 +𝜖 −𝜖

Observa-se que o efeito do erro 𝑣 foi removido da equação.

Questão 7

Utilizando fixed_effects no RStudio:

O erro padrão manteve-se em 0,06 mas o R² aumentou muito, indicando um ajuste bem
melhor do modelo estimado por efeitos fixos.
Questão 8
Considerando o modelo 𝑙𝑜𝑔(𝑤 ) = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 + 𝑣 + 𝜖

A suposição de erro clássico nas varáveis é que o erro de medida é não correlacionado com
a variável explicativa não observada (idiossincrático):

𝐶𝑜𝑣 𝑣 , 𝜖 =0

Utilizando a primeira diferença, o erro 𝑣 é eliminado:

𝑙𝑜𝑔(𝑤 ) = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 + 𝜖

Se o erro de medida em 𝑒𝑑𝑢𝑐 é 𝑒𝑑𝑢𝑐 + 𝜏 , 𝑙𝑜𝑔(𝑤 ) = 𝛼 + 𝛽𝑒𝑑𝑢𝑐 + 𝜏 + 𝜖

1 − 𝑉𝑎𝑟 𝛽𝑒𝑑𝑢𝑐 + 𝜏, 𝛽𝑒𝑑𝑢𝑐 𝜖


𝛽 = 1 − 𝑉𝑎𝑟 𝛽𝑒𝑑𝑢𝑐 + 𝜏, 𝛽𝑒𝑑𝑢𝑐 𝜖
𝑉𝑎𝑟(𝛽𝑒𝑑𝑢𝑐 + 𝜏)

Considerando que:

𝑐𝑜𝑣(𝑥, 𝑦) 𝛽𝑒𝑑𝑢𝑐 𝜎
𝛽 = =
𝜎 𝑒𝑑𝑢𝑐 𝜎 + 𝜎

A atenuação dos coeficientes ocorre então:

𝛽𝑒𝑑𝑢𝑐 𝜎 𝛽𝑒𝑑𝑢𝑐 𝜎
𝛽 −𝛽 = − 𝛽= −
𝑒𝑑𝑢𝑐 𝜎 + 𝜎 𝑒𝑑𝑢𝑐 𝜎 + 𝜎

Questão 9
Erro de reporte da educação (erro de medida) implica na atenuação do coeficiente. Utiliza-
se a variável instrumental educt_t, que é o reporte do irmão gêmeo sobre a educação do seu
irmão.

Através da IV, corrige-se o viés de efeito de atenuação e os coeficientes aumentam.


Questão 10
log 𝑤 = 𝛼 + 𝛽𝐶𝑜𝑙 + 𝑣 + 𝜖 , onde Col é uma variável binária (dummy) que mede se o
indivíduo terminou o ensino superior (college) ou não e Col_t é a mesma reportada pelo
irmão gêmeo.

Questão 11
Estimativa por MQO:

Estimativa por LOGIT, considerando a variável dependente = Col e o regressor = Col_T


Estimativa por PROBIT considerando a variável dependente = Col e o regressor = Col_T

A utilização da IV dummy é forte em todos os modelos, demonstrado pelos baixos p-values


(***).
Questão 12
Utilizando o Exercício 11a(LOGIT), gerando a variável ajustada col.hat:
Novamente observa-se os p-values muito baixos para o modelo, demonstrando o alto grau
de confiança da utilização do regressor proposto.
Questão 13
A utilização da variável col.hat2 como IV também apresentou p-values baixos, mostrando
que o modelo é adequado.

Você também pode gostar