Você está na página 1de 6

LISTA DE EXERCICIOS DE ECONOMETRIA 1 - 2023

Profa. Ana Hermeto

1. Um pesquisador coloca a hipótese de que uma variável Y seja determinada por uma variável X, por
meio da seguinte relação:
Y = β0 + β1X + u

a) Explique como, em princípio, é derivado o estimador de Mínimos Quadrados Ordinários (MQO) para
ˆ1 .
b) Explique porque o método MQO é o melhor procedimento de estimação se o termo de erro no
modelo satisfaz os pressupostos do método.
c) Com base na teoria econômica, o pesquisador não supõe que β1 seja positivo. Contudo, quando ele
ajusta a relação para uma amostra de 100 observações, a estimativa de β1 é positiva e a estatística t é 3,0.
Como este pesquisador explicaria o resultado não esperado?

2. Um pesquisador coloca a hipótese de que, para uma empresa típica, o logaritmo do valor adicionado
por trabalhador, V, seja relacionado ao logaritmo do capital por trabalhador, K, e ao logaritmo dos anos
médios de estudo dos trabalhadores, S:
logV = β0 + β1log(K) + β2log(S) + u
Este pesquisador ajusta a relação para uma amostra de 25 empresas do setor industrial (1) e para uma
amostra de 100 empresas do setor de serviços. A tabela abaixo fornece dados sobre estas amostras:
(1) (2)
Indústria Serviços
Tamanho da amostra 25 100
Estimativa da variância de u ( ˆ )
2
0,16 0,64
Desvio quadrático médio (variância) de K 4,00 16,00
Correlação entre K e S 0,60 0,60

O pesquisador estimou o erro padrão do coeficiente de K para ambas as amostras e encontrou o valor
de 0,050 para o setor industrial e 0,025 para o setor de serviços.
a) Com base em todas as informações contidas na tabela, explique a diferença entre estes valores
estimados dos erros padrões de K. (Obs.: explique o que significa o erro padrão de um coeficiente de
regressão. Uma representação gráfica pode ser útil.)
b) como você interpretaria os coeficientes estimados ˆ1 e ˆ 2 .

3. Três pesquisadores, investigando os determinantes dos salários, obtiveram dados para uma amostra
de 10400 indivíduos no Brasil em 2020, sobre as seguintes variáveis:
E = salários, em reais
S = anos de estudo
N = nota no teste de matemática, em uma escala entre 0 e 100
V = nota no teste de português, em uma escala entre 0 e 100
A correlação entre as notas de matemática e português é de 0,81.
O pesquisador 1 ajustou a seguinte regressão, onde os valores entre parênteses são os erros-padrões:
log(Ê) = 2,02 + 0,063 S + 0,0044 N + 0,026 V
(1,81) (0,007) (0,0011) (0,0010)
SQR=2000
O pesquisador 2 definiu uma nova variável de escala de notas (T) como a média entre N e V e ajustou a
seguinte regressão:
log(Ê) = 1,72 + 0,050 S + 0,0068 T
(1,78) (0,005) (0,0010)
SQR=2045
O pesquisador 3 ajustou a seguinte regressão:
log(Ê) = 2,02 + 0,063 S + 0,0088 T – 0,0018V
(1,81) (0,007) (0,0022) (0,0012)
SQR=2000

Compare os resultados dos três pesquisadores, incluindo a discussão sobre os valores estimados dos
parâmetros e sobre suas significâncias estatísticas individuais.

----------------------------------------------------------------------------------------------------------------
4. Nas questões a seguir, marque, de acordo como o comando de cada uma delas: itens VERDADEIROS
na coluna V; itens FALSOS na coluna F.

4.1: É correto afirmar a respeito do modelo de regressão linear clássico multivariado na forma matricial:
Y= X +, com n observações e k > 2 variáveis explicativas, incluindo-se o intercepto.
V F
Para testar a hipótese conjunta de que 2 = 3 = ... = k = 0, pode-se utilizar o teste
𝑅2 /(𝑘−1)
𝐹𝛼;(𝑘−1),(𝑛−𝑘) = [(1−𝑅2 )/(𝑛−𝑘)] , em que R2 é o coeficiente de determinação do modelo.
Sempre que o modelo tiver pelo menos duas variáveis explicativas além do intercepto, o R 2
será menor que o R2 ajustado.
Um pressuposto básico é: nenhuma das variáveis independentes deve estar perfeitamente
correlacionada com qualquer outra variável independente ou com qualquer combinação
linear de outras variáveis independentes.
Quando testamos a existência do modelo de regressão, fazemos as seguintes hipóteses sobre
os coeficientes  da regressão (sendo 1  0 , ou seja, a regressão não passa pela origem):
Hipótese nula => H0: 2 = 3 =... =  k = 0
Hipótese alternativa => H1: Todos os i  0 , para i = 2, 3,…, k.
A comparação do poder explicativo de modelos envolvendo número diferente de variáveis
explicativas deve ser feita com base no R 2 ajustado.

4.2: Foram encontrados os seguintes resultados para estimar uma regressão linear com duas variáveis
explicativas para uma amostra de tamanho 10.
Variáveis Coeficiente Erro Padrão Estatística p-valor
Explicativas T
Constante 223,3 254,8 0,88 0,410
X2 -1,26 0,8263 -1,52 0,172
X3 -1,03 3,213 -0,32 0,752
R2 = 81,2%; R2 ajustado = 76,1%; Valor calculado da estatística F=15,1. Podemos afirmar que:
V F
A equação de regressão estimada é y = 223,3 + 1,26X2 + 1,03X3.
A um nível de significância de 5% podemos afirmar que a regressão existe. Porém, após
elaborarmos os testes de hipóteses para os coeficientes individuais, aceitamos a hipótese (a
um nível de significância de 1%) de que o coeficiente para a variável X2 é zero.
O coeficiente de determinação indica que 81,2% da variação amostral de Y podem ser
atribuídos as variações de X2 e X3.
Os valores teóricos das estatísticas t utilizadas para testar os coeficientes das variáveis
explicativas devem ser calculados para 10 graus de liberdade.
Se adicionarmos um novo regressor X k+1 à equação acima então o coeficiente de
determinação, R 2 pode ou não aumentar.

4.3. Com relação à inferência estatística e aos testes de hipóteses, é correto afirmar que:
V F
O erro tipo I consiste em aceitar a hipótese nula ( H0 ) quando esta é falsa.
Quanto maior o p-valor, maior a credibilidade da hipótese alternativa.
A conclusão do teste é sensível à forma como se define a hipótese nula.
Quanto menor for o nível de significância de um teste, mais extremo deve ser o valor
calculado da estatística do teste para que se rejeite H0 .

------------------------------------------------------------------------------------------------------

5. Considere os seguintes modelos alternativos da Curva de Phillips


Yt = 1 + 2 X2t + i (5.1)
e com acréscimos de expectativas:
Yt = 1 + 2 X2t + 3 X3t + i (5.2)

onde Yt é a taxa efetiva de inflação (%) no instante t, X2t é a taxa de desemprego (%) no instante t e X 3t
é a taxa esperada ou prevista de inflação (%) no instante t. Utilizando os dados da tabela a seguir, foram
obtidos os resultados das estimações pelo método de mínimos quadrados.

Ano Taxa de Taxa de Taxa Esperada


Inflação Desemprego de Inflação
2008 5,92 4,9 4,78
2009 4,30 5,9 3,84
2010 3,30 5,6 3,13
2011 6,23 4,9 3,44
2012 10,97 5,6 6,84
2013 9,14 8,5 9,47
2014 5,77 7,7 6,51
2015 6,45 7,1 5,92
2016 7,60 6,1 6,08
2017 11,47 5,8 8,09
2018 13,46 7,1 10,01
2019 10,24 7,6 10,81
2020 5,99 9,7 8,00
MODELO 5.1
Variáveis Coeficiente Erro padrão ESTATÍSTICA p-valor
preditoras T
Constante 6.1272 4.2853 1.4298 0.1806
X2 0.2449 0.6305 0.3885 0.7051
R = 0.0135; R ajustado = -0.0761; Valor calculado da estatística F = 0.1509
2 2

MODELO 5.2
Variáveis Coeficiente Erro padrão ESTATÍSTICA p-valor
preditoras T
Constante 7.1933 1.5948 4.5105 0.0011
X2 -1.3925 0.3050 -4.5652 0.0010
X3 1.4700 0.1758 8.3626 0.0000
R = 0.8766; R ajustado = 0.8519; Valor calculado da estatística F = 35.5152
2 2

Escreva e interprete as equações das regressões. Interprete as estatísticas de ajuste dos modelos e os
compare.

6: Para analisar o comportamento do consumo pessoal pode ser usado o seguinte modelo, que sugere
que o consumo se relaciona linearmente com a renda e o tempo (ou tendência).
Yt = t + 2X2t + 2X3t + t

Onde, Y = despesa de consumo per capita (CONS), X 2 = renda disponível per capita (REND) e X3 =
tempo medido em anos (T).

Resumindo, foram encontrados os seguintes resultados da regressão:

Variáveis Coeficiente Desvio ESTATÍSTICA p-valor


preditoras padrão t
Constante 300,2863 78,3176 3,8342 0,0008
X2 0,7420 0,0475 15,6108 0,0000
X3 8,0436 2,9835 2,6960 0,0036
R2 = 99,76%; R2 ajustado = 99,72%; Valor calculado da estatística F2,12 = 2513,52

(a) Descreva os passos da estimação do modelo de regressão.


(b) Escreva e interprete a equação da regressão. Interprete as estatísticas de ajuste do modelo.

7: Considere a seguinte tabela da Análise de Variância referente a um modelo linear:


Fonte de Fonte Graus de Soma Média dos Quadrados
Variação Liberdade (Fonte/Graus de Liberdade)
Regressão (SQE) 3
Resíduo (SQR) 38,5
Total (SQT) 921,4 16

(a) Complete a tabela acima.


(b) A partir da tabela acima, teste se a equação de regressão é estatisticamente significante (teste F).
Estabeleça a hipótese que está sendo testada.
(c) Calcule e interprete o coeficiente de determinação (R2).

SQT=SQE+SQR
R2 = SQE / SQT = 1 – (SQR/SQT)
R2ajustado = 1 – [(SQR/n-k) / (SQT/n-1)] = 1 – (n-1/n-k) (1-R2)

F = (SQE/k-1) / (SQT/n-k) ~ Fk-1,n-k ➔ F = (R2/k-1) / (1-R2/n-k)


(para H0: 2 = 3 = ... = k = 0)

8. Para estudar a participação na força de trabalho de famílias pobres urbanas, foram utilizadas
observações de 15 municípios brasileiros para os seguintes modelos de regressão, onde Y é a
porcentagem na força de trabalho, X2 é a renda familiar média, X3 é o tamanho médio das famílias e X4
é taxa de desemprego:

Modelo 1: Yi = 1 + 2X2i + i
Modelo 2: Yi = 1 + 2X2i + 3X3i + i
Modelo 3: Yi = 1 + 2X2i + 3X3i + 4X4i + i
As estimativas dos parâmetros dos modelos foram as seguintes:
Modelo 1 Modelo 2 Modelo 3
Intercepto 0,2088 -0,0990 -0,0781
(0,1804) (0,2279) (0,2519)
Renda Familiar Média 0,2743 ** 0,2509 ** 0,2475 **
(0,1030) (0,0943) (0,0992)
Tamanho Médio das Famílias 0,0910 * 0,0903 *
(0,0469) (0,0489)
Taxa de Desemprego -0,2446 ***
(0,0068)

Valor da Estatística F 7,10 ** 6,19 ** 3,82 **


R2 0,3531 0,5077 0,5105
R2 Ajustado 0,3033 0,4257 0,4470
Obs.: Erros padrões entre parênteses.
Níveis de significância: *** 1%; ** 5%; * 10%.

(a) Como está sendo testada a hipótese de que o tamanho médio das famílias tem efeito sobre a
participação dos pobres na força de trabalho?

(b) Escolha o melhor modelo, justifique sua escolha e interprete os resultados deste modelo.

9. Em relação a um modelo de regressão simples (yi = 0+ 1X1i + ui), explique:


a) Como o princípio dos mínimos quadrados é usado para ajustar uma reta a um conjunto de dados e,
subsequentemente, como predizer o valor y, dados qualquer valor de x e o modelo de regressão
ajustado. Faça a demonstração gráfica.
b) Como é feita a decomposição de uma variável observável y em seus componentes sistemático e
aleatório, que se desdobra na decomposição da soma de quadrados total da variável dependente y
em uma regressão em seus componentes: soma dos quadrados explicada e soma dos quadrados dos
resíduos. Faça a demonstração gráfica.
c) Como calcular a variância 2 do erro, usando os resíduos de mínimos quadrados. Explique.

d) Como estimar as variâncias e a covariância de ˆ 0 e ˆ1 e quais as circunstâncias sob as quais as


variâncias dos coeficientes tendem a ser relativamente altas e relativamente baixas.
e) O significado dos pressupostos contidos na seguinte expressão: û ~ N (0, 2).
f) O teorema de Gauss-Markov.
g) O significado de ausência de viés dos estimadores de mínimos quadrados.
h) Como a elasticidade de y em relação a x é calculada no modelo de regressão linear.

10: O banco de dados de uma amostra cross-section de 1519 famílias em 1996 foi usado para estimar
como a proporção do orçamento doméstico gasto com transporte (transp) depende do log da renda total
(logrenda), da idade do chefe da família (idade e idade2) e do número de filhos (nfilh). Os resultados
estimados foram:
Variáveis Coeficiente Erro padrão
explicativas
Constante -0.0315 0.0322
Logrenda 0.0414 0.0071
Idade 0.0178 0.0044
Idade2 -0.0002 0.0000
Nfilh -0.0130 0.0055
R2 = 0,2472
(a) Faça os testes de hipóteses sobre a significância dos parâmetros individuais e sobre a significância
geral da regressão, ambos ao nível de 5%.
t = (bk - k) / ep (bk) ~ tn-k
(para H0: k=0)
tcrítico para α=0,05 e n = 1519 → 1,96

(b) Construa e interprete o intervalo de confiança para um dos parâmetros.

(c) Interprete as estimativas dos parâmetros ˆ j .

Você também pode gostar