Você está na página 1de 3

EAE 0324 - Econometria I/2022 Docente: Paula Carvalho Pereda

FEA/USP Monitor: Gustavo Romero e João Corrêa


Data de Entrega: 23/09

Lista 2 - Regressão Linear Simples1

1. Um professor decide realizar um experimento sobre o efeito da pressão do tempo sobre a nota
dos alunos em um exame final. Ele aplica a cada um dos seus 400 alunos o mesmo exame final,
mas alguns alunos possuem 90 minutos para completar o exame enquanto outros possuem 120
minutos. Cada aluno recebe o seu tempo de forma aleatória baseado em um jogo de moeda (se
cara, ele tem 90 minutos para terminar o exame; se coroa, 120 minutos). Denote por Yi O número
de pontos obtidos pelo aluno i no exame (0 ≤ Yi ≤ 100) e por Xi a quantidade de tempo que o
aluno tem para completar o teste (Xi = 90 ou 120). Considere o seguinte modelo de regressão:

Yi = α + βXi + ui

(a) Explique o que o termo ui representa. Por que alunos diferentes terão valores de ui diferentes?
(b) Explique porque devemos assumir E[ui |Xi ] = 0 nesse modelo.
(c) A regressão estimada é: Ŷi = 49 + 0.24Xi
i) Compute a nota predita dos alunos que tiveram 90 minutos para completar o teste.
Repita para 120 minutos.
ii) Compute o ganho estimado na nota para 10 minutos adicionais para realizar o exame.

2. Seja (X1 , ..., Xn ) uma amostra aleatória de X com função densidade de probabilidade dada por:

fX (x; θ) = θ x(θ−1) 1(0,1 (x), θ > 0

(a) Obtenha um estimador de θ pelo método dos momentos. Denote-o por θ̂mom .
(b) Obtenha o Estimador de Máxima Verossimilhança de θ. Denote-o por θ̂M V .

3. Encontre estimadores para o modelo de regressão linear simples sem intercepto (yi = β1 xi + ui )
usando o Método de Máxima Verossimilhança e o de Mı́nimos Quadrados Ordinários, onde ui |xi ∼
N (0, σ 2 ). Mostre que os estimadores obtidos pelos 2 métodos são os mesmos.

4. Considere o modelo de regressão linear: yi = α + βxi + ui

(a) Derive o estimador de Mı́nimos Quadrados Ordinários e prove que a reta de regressão passa
pelo ponto (x̄, ȳ)
(b) Mostre que ŷ¯ = ȳ
P
(c) Mostre que ŷi ûi = 0
(d) Mostre que o R2 pode ser escrito como corr(x, y)2
(e) Mostre que β̂ = 0 ⇔ R2 = 0
(f) No modelo sem intercepto, α, mostre que o R2 pode estar fora do intervalo [0,1].

5. Seja o modelo yi = β + ui . Encontre o estimador de OLS


1
A entrega pode ser feita em ambos os formatos: fı́sico (monitoria) ou digital (moodle)

1
6. Considere o seguinte modelo de regressão linear simples: y = β0 + β1 x + u. Para uma amostra
com 32 observações são observados os seguintes resultados:

i) ȳ = 30
ii) x̄ = 10
P32 2
iii) i=1 (yi − ȳ) = 90
P32 2
iv) i=1 (xi − x̄) = 60
P32
v) i=1 (yi − ȳ)(xi − x̄) = 30

Qual a Soma dos Quadrados dos Resı́duos correspondente aos estimadores de MQO para esse
modelo?

7. Considere o seguinte modelo de regressão linear simples: yi = β1 +β2 xi +ui , i = 1, 2, ..., n. Suponha
que xi é não estocástico e que E(ui ) = 0, E(u2i ) = σ 2 , E(ui uj ) = 0 para todo i ̸= j. Considere os
dois estimadores alternativos de β2 :
Pn Pn
xi yi (xi − x) (yi − y)
b2 = Pn 2 e β̂2 = i=1
i=1
Pn 2
i=1 xi i=1 (xi − x)

(a) Mostre que b2 é um estimador viesado de β2 . Qual é o viés?


(b) Mostre que b2 é um estimador não viesado de β2 se, para qualquer amostra de tamanho n,
x̄ = 0.

8. Uma estatı́stica comum a ser reportada nas tabelas de regressão é o R2

(a) Defina essa estatı́stica. Interprete o R2 .


(b) Qual a importância do R2 para estimação de efeitos causais? E quando a preocupação é
apenas prever os valores da variável dependente?

9. Suponha que você está interessado em estimar o efeito de horas dedicadas a um curso preparatório
para o Enem na nota do aluno neste exame. Suponha que você tenha acesso aos dados de todos
os estudantes do último ano de ensino médio para determinado ano.

(a) Considere que os estudante escolhem quantas horas se dedicam no curso preparatório e que
a amostra dos alunos é aleatória. Escreva o modelo como

enem = α + β horas + u
Podemos assumir E[u] = 0, como é usual em um modelo com intercepto. Liste pelo menos
dois fatores inclusos em u. Esses fatores estão possivelmente correlacionados com a variável
horas? De forma positiva ou negativa?
(b) Em sua opinião, qual seria o sinal de β?
(c) Qual a interpretação de α?

10. A base de dados 401k é um subconjunto de uma base analisada por Papke(1995) para estudar
a relação entre a participação em um plano de pensão 401(k) e a generosidade do plano. A
variável prate é o percentual de trabalhadores elegı́veis com uma conta ativa; esta é a variável que
gostarı́amos de explicar. A medida de generosidade é a taxa de correspondência do plano, mrate.
Essa variável fornece o valor médio que a empresa contribui para o plano de cada trabalhador para
cada 1 dólar de contribuição feito pelo trabalhador. Por exemplo, se mrate = 0.50, então uma
contribuição de 1 dólar do trabalhador é igualada a uma contribuição de 50 centavos da firma.

2
(a) Encontre a média de prate e mrate
(b) Estime a regressão linear simples a seguir:

[ = βˆ0 + βˆ1 mrate


prate
Reporte os valores obtidos de: βˆ0 , βˆ1 , R2 e o tamanho da amostra
(c) Interprete o β0 encontrado. Interprete o coeficiente de mrate
(d) Encontre o valor previsto de prate quando mrate = 3.5. Essa previsão é razoável?
(e) Quanto da variação de prate é explicado pelo mrate. Em sua opinião, isso é muito?

1 # Pode utilizar o comando de instalar o pacote diretamente no console do R


2 # install . packages (" wooldridge ")
3

4 library ( wooldridge )
5 dados <- wooldridge :: k401k
Listing 1: Instruções para importar base de dados

Você também pode gostar