Você está na página 1de 16

Lista 1 - Econometria

Marco Silva

10/08/2020

Questão 1
Revise individualmente o modelo de regressão simples apresentado na Atividade em
Grupo. Você faria alguma modificação no modelo proposto? Se sim, qual? Justifique.
Propomos dois modelos em aula como resposta da atividade em grupo, o primeiro
relacionando o salá rio como variá vel a ser explicada pelos anos de estudo e o segundo
visando explicar a variaçã o percentual do salá rio também utilizando os anos de
estudo. Os resultados obtidos foram:
##
## Resultados
## =========================================
## Dependent variable:
## ----------------------------
## log_salario salario
## (1) (2)
## -----------------------------------------
## anos_estudo 0.103*** 221.257***
## (0.0004) (1.535)
##
## Constant 6.090*** -258.379***
## (0.005) (17.402)
##
## -----------------------------------------
## Observations 196,738 196,738
## R2 0.214 0.096
## Adjusted R2 0.214 0.096
## =========================================
## Note: *p<0.1; **p<0.05; ***p<0.01

O modelo utilizando log_salario se mostrou mais eficiente quando comparamos o R²


de cada um, e por este motivo entendemos que este seria o melhor modelo com uma
variá vel independente. Testamos outras variá veis e nã o obtivemos melhores
resultados, além disso os resultados se alinharam ao que acreditá vamos
intuitivamente, sendo assim nã o faria nenhuma alteraçã o.
Questão 2
Seja f ilhos o número de filhos de uma mulher e educ os anos de educação da
mulher.Um modelo simples que relaciona a fertilidade a anos de educação é:

filhos = β0 + β1educ + u . Em que u é um erro não observável


a) Que tipos de fatores estão contidos em u? É provável que eles estejam
correlacionados com o nível de educação?
u representa todos os outros fatores nã o observá veis, ou seja, tudo que poderia
influenciar no nú mero de filhos de uma mulher excluindo os anos de educaçã o, que já
está sendo observado no modelo. Existe a possibilidade de encontrarmos variá veis
correlacionadas com o nível de educaçã o, já que o nível educacional pode ser
influenciado por diversos fatores. Posso citar exemplos como renda familiar, distâ ncia
da residência e a escola e nível de educaçã o dos pais. No entanto, nã o podemos
afirmar com certeza que estes fatores afetariam o nível de educaçã o de uma mulher,
mas intuitivamente podemos acreditar que ao rodar testes de correlaçã o, estes
deveriam confirmar tal fato.

b) Uma análise de regressão simples mostrará o efeito ceteris paribus da educação


sobre a fertilidade? Explique
Sim, a ideia de incluir a educaçã o como variá vel independente para explicar a
fertilidade é justamente isolar o efeito de todos os outros fatores da aná lise. O
resultado de um teste de regressã o com estas variá veis é examinar o poder de
explicaçã o dos anos de estudo na fertilidade mantendo todo o resto constante.

Questão 3
A tabela seguinte contém as variáveis GPA (nota média em curso superior nos EUA) e
ACT (nota do teste de avaliação de conhecimentos para ingresso em curso superior nos
EUA) para oito estudantes de curso superior. A nota GPA está baseada em uma escala
de quatro pontos e foi arredondada para um dígito após o ponto decimal.
## Estudante GPA ACT
## 1 1 2.8 21
## 2 2 3.4 24
## 3 3 3.0 26
## 4 4 3.5 27
## 5 5 3.6 29
## 6 6 3.0 25
## 7 7 2.7 25
## 8 8 3.7 30
(a) Estime a relação entre GPA e ACT usando MQO; isto é, obtenha as estimativas de
intercepto e de inclinação da equação:

GPA = β0 + β1ACT
Comente a direção da relação. O intercepto tem uma interpretação útil aqui? Explique.
Qual deveria ser o valor previsto da GPA se a nota ACT aumentasse em cinco pontos?
##
## Resultados
## ========================================
## Dependent variable:
## ---------------------------
## GPA
## ----------------------------------------
## ACT 0.102**
## (0.036)
##
## Constant 0.568
## (0.928)
##
## ----------------------------------------
## Observations 8
## R2 0.577
## Adjusted R2 0.507
## ========================================
## Note: *p<0.1; **p<0.05; ***p<0.01

Analisando os resultados, a interpretaçã o do intercepto aqui seria que um aluno com


nota zero no ACT tiraria 0,57 pontos de média GPA. Esta interpretaçã o nã o é ú til na
prá tica, uma vez que um aluno com nota zero no ACT provavelmente nã o ingressaria
no curso superior, mas serve como baseline do modelo.
Quanto à influência da nota do ACT no GPA, a cada 1 ponto adicional no ACT, adiciona-
se 0,102 pontos no GPA. Dessa forma ao adicionarmos 5 pontos no ACT estaríamos
adicionando 0,511 pontos no GPA, independente do nível em que estaria o aluno.

(b) Calcule os valores estimados e os resíduos de cada observação e verifique que a


soma dos resíduos é (aproximadamente) zero.
Tabela com os resíduos calculados:
## Estudante GPA ACT residuos
## 1 1 2.8 21 0.08571429
## 2 2 3.4 24 0.37912088
## 3 3 3.0 26 -0.22527473
## 4 4 3.5 27 0.17252747
## 5 5 3.6 29 0.06813187
## 6 6 3.0 25 -0.12307692
## 7 7 2.7 25 -0.42307692
## 8 8 3.7 30 0.06593407
Soma dos resíduos de fato se aproxima a zero:
## [1] -2.775558e-17

c) Qual é o valor previsto da GP A quando ACT = 20?


GPA: 0.56813 + 0.10220 * 20 = 2.61213

(d) Quanto da variação da GPA dos 8 estudantes é explicada por ACT? Explique.
O r² é a estatística que nos mostra o poder de explicaçã o da nossa varíavel
independente incluída no modelo.Neste caso, o valor encontrado foi:
## [1] 0.5774238

Sendo assim, podemos dizer que 57,8% da variaçã o do GPA dos 8 estudantes pode ser
explicada pelo ACT.

Questão 4
Usando dados de casas vendidas em 1988 em Andover, Massachusetts (Kiel e
McClain(1995)), a equação seguinte relaciona os preços das casas (preço) à distância de
um incinerador de lixo recentemente construído (dist):

log(preço) = 9,40 + 0,312log(dist)


n=135, R²=0,162
(a) Interprete o coeficiente de log(dist). O sinal dessa estimativa é o que você esperava?
O coeficiente de log(dist) nos diz que o preço de uma casa aumenta 0,312% quando a
distâ ncia entre a casa e o incinerador aumenta em 1%. O sinal do coeficiente é
positivo e parece fazer sentido, uma que vez que é preferível morar mais distante de
um incinerador de lixo, já que este pode causar mau odor a quem está pró ximo.

(b) Você considera que a regressão simples oferece um estimador não-viesado da


elasticidade ceteris paribus de preço em relação a dist? (Pense na decisão da cidade
sobre onde colocar o incinerador.)
Certamente o preço das casas é afetado por outros fatores nã o observados na
regressã o, visto que o poder de explicaçã o da distâ ncia do incinerador é de 16,2%. No
entanto o modelo apresenta um efeito negativo do incinerador no preço, que indica
que idealmente a cidade deveria localizar o incinerador o mais longe possível das
casas. Nã o podemos afirmar com precisã o qual a distâ ncia em metros, mas sim que
quanto maior, melhor.
(c) Quais outros fatores relativos a casas afetam seu preço? Eles poderiam estar
correlacionados com a distância do incinerador?
Cito alguns fatores que poderiam afetar o preço das casas: tamanho, proximidade com
o centro (urbanizaçã o), nível de violência do bairro, disponibilidade de transporte
pú blico.
Podemos ter alguns desses fatores correlacionados com a distâ ncia do incinerador,
uma vez que este dificilmente estaria localizado em uma regiã o central ou muito
desenvolvida.

Exercício Empírico
1. A base de dados (ceo) contém informações sobre CEOs de empresas americanas. A 2
variável salary é a remuneração anual, em milhares de dólares, e a variável ceoten é o
número de anos como CEO da empresa.

(a) Encontre o salário médio e o tempo médio de mandato na amostra.


Salá rio médio (medido em milhares de dó lares e anual):
## [1] 865.8644

Tempo médio de mandato (em anos):


## [1] 7.954802

(b) Quantos CEOs estão em seu primeiro ano como CEO (ou seja, ceoten = 0)? Qual é o
mandato mais longo como CEO?
Quantidade de CEO´s em seu primeiro ano:
## [1] 5

Mandato mais longo:


## [1] 37
Estime o modelo de regressão simples “log(salary) = β0 + β1ceoten + u”, e reporte seus
resultados da forma usual. Qual é o aumento percentual previsto (aproximado) no
salário dado um ano a mais como CEO?
##
## Resultados
## ========================================
## Dependent variable:
## ---------------------------
## lsalary
## ----------------------------------------
## ceoten 0.010
## (0.006)
##
## Constant 6.505***
## (0.068)
##
## ----------------------------------------
## Observations 177
## R2 0.013
## Adjusted R2 0.008
## ========================================
## Note: *p<0.1; **p<0.05; ***p<0.01

Com os valores obtidos na regressã o observamos que a cada ano adicional no


mandato de um CEO o seu salá rio aumenta em 0,1%.

Comente o valor do R² da regressão


Vemos que o R² encontrado foi de 1,3%. Este valor é muito baixo e indica que o tempo
como CEO é uma variá vel que tem pouco poder explicativo sobre o salá rio.
Có digo do R:
---
title: "Lista 1 - Econometria"
author: "Marco Silva"
date: "10/08/2020"
output: word_document
---

```{r setup, include=FALSE}


knitr::opts_chunk$set(echo = TRUE)
library(haven)
library(psych)
library(stargazer)

mydata <- read_dta("c:/Users/macds/Desktop/FGV/Econometria/base_mqo.dta")

```

## Questã o 1 ##
#### Revise individualmente o modelo de regressã o simples apresentado na
Atividade em Grupo. Você faria alguma modificaçã o no modelo proposto? Se sim,
qual? Justifique. ####

Propomos dois modelos em aula como resposta da atividade em grupo, o primeiro


relacionando o salá rio como variá vel a ser explicada pelos anos de estudo e o segundo
visando explicar a variaçã o percentual do salá rio também utilizando os anos de
estudo. Os resultados obtidos foram:
```{r,include=FALSE}

#Salá rio e anos_estudo


modelo_salario_anosestudo <- lm(salario ~ anos_estudo, mydata)
summary(modelo_salario_anosestudo)
R²_anos_estudo <- summary(modelo_salario_anosestudo)$r.squared

#Log_Salá rio e anos_estudo


modelo_log_salario_anosestudo <- lm(log_salario ~ anos_estudo, mydata,
na.action=na.exclude)
summary(modelo_log_salario_anosestudo)
R²_log_salario_anosestudo <- summary(modelo_log_salario_anosestudo)$r.squared

```

```{r,echo=FALSE}
stargazer(modelo_log_salario_anosestudo, modelo_salario_anosestudo,
title="Resultados", align=TRUE, omit.stat=c("ser","f"), type="text")

```

O modelo utilizando log_salario se mostrou mais eficiente quando comparamos o R²


de cada um, e por este motivo entendemos que este seria o melhor modelo com uma
variá vel independente.
Testamos outras variá veis e nã o obtivemos melhores resultados, além disso os
resultados se alinharam ao que acreditá vamos intuitivamente, sendo assim nã o faria
nenhuma alteraçã o.
## Questã o 2 ##
#### Seja f ilhos o nú mero de filhos de uma mulher e educ os anos de educaçã o da
mulher.Um modelo simples que relaciona a fertilidade a anos de educaçã o é: ####
### filhos = β0 + β1educ + u . Em que u é um erro nã o observá vel###

#### a) Que tipos de fatores estã o contidos em u? É prová vel que eles estejam
correlacionados com o nível de educaçã o? ####

u representa todos os outros fatores nã o observá veis, ou seja, tudo que poderia
influenciar no nú mero de filhos de uma mulher excluindo os anos de educaçã o, que já
está sendo observado no modelo.
Existe a possibilidade de encontrarmos variá veis correlacionadas com o nível de
educaçã o, já que o nível educacional pode ser influenciado por diversos fatores. Posso
citar exemplos como renda familiar, distâ ncia da residência e a escola e nível de
educaçã o dos pais.
No entanto, nã o podemos afirmar com certeza que estes fatores afetariam o nível de
educaçã o de uma mulher, mas intuitivamente podemos acreditar que ao rodar testes
de correlaçã o, estes deveriam confirmar tal fato.

#### b) Uma aná lise de regressã o simples mostrará o efeito ceteris paribus da
educaçã o sobre a fertilidade? Explique ####

Sim, a ideia de incluir a educaçã o como variá vel independente para explicar a
fertilidade é justamente isolar o efeito de todos os outros fatores da aná lise. O
resultado de um teste de regressã o com estas variá veis é examinar o poder de
explicaçã o dos anos de estudo na fertilidade mantendo todo o resto constante.

## Questã o 3 ##

#### A tabela seguinte contém as variá veis GPA (nota média em curso superior nos
EUA) e ACT (nota do teste de avaliaçã o de conhecimentos para ingresso em curso
superior nos EUA) para oito estudantes de curso superior. A nota GPA está baseada
em uma escala de quatro pontos e foi arredondada para um dígito apó s o ponto
decimal. ####

```{r,echo=FALSE}
Estudante <- c(1,2,3,4,5,6,7,8)
GPA <- c(2.8,3.4,3,3.5,3.6,3,2.7,3.7)
ACT <- c(21,24,26,27,29,25,25,30)

tabela_gpa <- data.frame(Estudante,GPA,ACT)


print(tabela_gpa)
```

#### (a) Estime a relaçã o entre GPA e ACT usando MQO; isto é, obtenha as
estimativas de intercepto e de inclinaçã o da equaçã o: ####

## GPA = β0 + β1ACT ##

#### Comente a direçã o da relaçã o. O intercepto tem uma interpretaçã o ú til aqui?
Explique. Qual deveria ser o valor previsto da GPA se a nota ACT aumentasse em cinco
pontos? ####

```{r,echo=FALSE}

regressao_gpa <- lm(GPA~ACT,tabela_gpa)


stargazer(regressao_gpa, title="Resultados", align=TRUE, omit.stat=c("ser","f"),
type="text")

```
Analisando os resultados, a interpretaçã o do intercepto aqui seria que um aluno com
nota zero no ACT tiraria 0,57 pontos de média GPA. Esta interpretaçã o nã o é ú til na
prá tica, uma vez que um aluno com nota zero no ACT provavelmente nã o ingressaria
no curso superior, mas serve como baseline do modelo.

Quanto à influência da nota do ACT no GPA, a cada 1 ponto adicional no ACT, adiciona-
se 0,102 pontos no GPA.
Dessa forma ao adicionarmos 5 pontos no ACT estaríamos adicionando 0,511 pontos
no GPA, independente do nível em que estaria o aluno.

#### (b) Calcule os valores estimados e os resíduos de cada observaçã o e verifique


que a soma dos resíduos é (aproximadamente) zero. ####

Tabela com os resíduos calculados:

```{r,echo=FALSE}

tabela_gpa$residuos <- summary(regressao_gpa)$residuals

print(tabela_gpa)

```

Soma dos resíduos de fato se aproxima a zero:

```{r,echo=FALSE}
print(sum(tabela_gpa$residuos))

```

#### c) Qual é o valor previsto da GP A quando ACT = 20? ####

GPA:
0.56813 + 0.10220 * 20
= 2.61213

#### (d) Quanto da variaçã o da GPA dos 8 estudantes é explicada por ACT? Explique.
####

O r² é a estatística que nos mostra o poder de explicaçã o da nossa varíavel


independente incluída no modelo.Neste caso, o valor encontrado foi:
```{r,echo=FALSE}

summary(regressao_gpa)$r.squared

```

Sendo assim, podemos dizer que 57,8% da variaçã o do GPA dos 8 estudantes pode ser
explicada pelo ACT.

## Questã o 4 ##
#### Usando dados de casas vendidas em 1988 em Andover, Massachusetts (Kiel e
McClain(1995)), a equaçã o seguinte relaciona os preços das casas (preço) à distâ ncia
de um incinerador de lixo recentemente construído (dist): ####

### log(preço) = 9,40 + 0,312log(dist) ###


### n=135, R²=0,162 ###

#### (a) Interprete o coeficiente de log(dist). O sinal dessa estimativa é o que você
esperava? ####

O coeficiente de log(dist) nos diz que o preço de uma casa aumenta 0,312% quando a
distâ ncia entre a casa e o incinerador aumenta em 1%.
O sinal do coeficiente é positivo e parece fazer sentido, uma que vez que é preferível
morar mais distante de um incinerador de lixo, já que este pode causar mau odor a
quem está pró ximo.

#### (b) Você considera que a regressã o simples oferece um estimador nã o-viesado
da elasticidade ceteris paribus de preço em relaçã o a dist? (Pense na decisã o da cidade
sobre onde colocar o incinerador.) ####

Certamente o preço das casas é afetado por outros fatores nã o observados na


regressã o, visto que o poder de explicaçã o da distâ ncia do incinerador é de 16,2%. No
entanto o modelo apresenta um efeito negativo do incinerador no preço, que indica
que idealmente a cidade deveria localizar o incinerador o mais longe possível das
casas. Nã o podemos afirmar com precisã o qual a distâ ncia em metros, mas sim que
quanto maior, melhor.

#### (c) Quais outros fatores relativos a casas afetam seu preço? Eles poderiam estar
correlacionados com a distâ ncia do incinerador? ####
Cito alguns fatores que poderiam afetar o preço das casas: tamanho, proximidade com
o centro (urbanizaçã o), nível de violência do bairro, disponibilidade de transporte
pú blico.

Podemos ter alguns desses fatores correlacionados com a distâ ncia do incinerador,
uma vez que este dificilmente estaria localizado em uma regiã o central ou muito
desenvolvida.

## Exercício Empírico ##

#### 1. A base de dados (ceo) contém informaçõ es sobre CEOs de empresas


americanas. A 2 variá vel salary é a remuneraçã o anual, em milhares de dó lares, e a
variá vel ceoten é o nú mero de anos como CEO da empresa.

#### (a) Encontre o salá rio médio e o tempo médio de mandato na amostra. ####

```{r, include=FALSE}

setwd("c:/Users/macds/Desktop/FGV/Econometria")
base_ceo <- readRDS(file="ceo.RDS")

```

Salá rio médio (medido em milhares de dó lares e anual):

```{r, echo=FALSE}

mean(base_ceo$salary)
```

Tempo médio de mandato (em anos):

```{r, echo=FALSE}

mean(base_ceo$ceoten)

```

#### (b) Quantos CEOs estã o em seu primeiro ano como CEO (ou seja, ceoten = 0)?
Qual é o mandato mais longo como CEO? ####

Quantidade de CEO´s em seu primeiro ano:

```{r, echo=FALSE}

z <- base_ceo$ceoten == 0
sum(z)

```

Mandato mais longo:

```{r, echo=FALSE}

max(base_ceo$ceoten)
```

#### Estime o modelo de regressã o simples "log(salary) = β0 + β1ceoten + u", e


reporte seus resultados da forma usual. Qual é o aumento percentual previsto
(aproximado) no salá rio dado um ano a mais como CEO? ####

```{r, echo=FALSE}

regressao_ceo <- lm(lsalary~ceoten, base_ceo)

stargazer(regressao_ceo, title="Resultados", align=TRUE, omit.stat=c("ser","f"),


type="text")

```

Com os valores obtidos na regressã o observamos que a cada ano adicional no


mandato de um CEO o seu salá rio aumenta em 0,1%.

#### Comente o valor do R² da regressã o ####

Vemos que o R² encontrado foi de 1,3%. Este valor é muito baixo e indica que o tempo
como CEO é uma variá vel que tem pouco poder explicativo sobre o salá rio.

Você também pode gostar