Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Um pesquisador coloca a hipótese de que uma variável Y seja determinada por uma variável X, por
meio da seguinte relação:
Y = β0 + β1X + u
a) Explique como, em princípio, é derivado o estimador de Mínimos Quadrados Ordinários (MQO) para
ˆ1 .
b) Explique porque o método MQO é o melhor procedimento de estimação se o termo de erro no
modelo satisfaz os pressupostos do método.
c) Com base na teoria econômica, o pesquisador não supõe que β1 seja positivo. Contudo, quando ele
ajusta a relação para uma amostra de 100 observações, a estimativa de β1 é positiva e a estatística t é 3,0.
Como este pesquisador explicaria o resultado não esperado?
2. Um pesquisador coloca a hipótese de que, para uma empresa típica, o logaritmo do valor adicionado
por trabalhador, V, seja relacionado ao logaritmo do capital por trabalhador, K, e ao logaritmo dos anos
médios de estudo dos trabalhadores, S:
logV = β0 + β1log(K) + β2log(S) + u
Este pesquisador ajusta a relação para uma amostra de 25 empresas do setor industrial (1) e para uma
amostra de 100 empresas do setor de serviços. A tabela abaixo fornece dados sobre estas amostras:
(1) (2)
Indústria Serviços
Tamanho da amostra 25 100
Estimativa da variância de u ( ˆ )
2
0,16 0,64
Desvio quadrático médio (variância) de K 4,00 16,00
Correlação entre K e S 0,60 0,60
O pesquisador estimou o erro padrão do coeficiente de K para ambas as amostras e encontrou o valor
de 0,050 para o setor industrial e 0,025 para o setor de serviços.
a) Com base em todas as informações contidas na tabela, explique a diferença entre estes valores
estimados dos erros padrões de K. (Obs.: explique o que significa o erro padrão de um coeficiente de
regressão. Uma representação gráfica pode ser útil.)
b) como você interpretaria os coeficientes estimados ˆ1 e ˆ 2 .
3. Três pesquisadores, investigando os determinantes dos salários, obtiveram dados para uma amostra
de 10400 indivíduos no Brasil em 2020, sobre as seguintes variáveis:
E = salários, em reais
S = anos de estudo
N = nota no teste de matemática, em uma escala entre 0 e 100
V = nota no teste de português, em uma escala entre 0 e 100
A correlação entre as notas de matemática e português é de 0,81.
O pesquisador 1 ajustou a seguinte regressão, onde os valores entre parênteses são os erros-padrões:
log(Ê) = 2,02 + 0,063 S + 0,0044 N + 0,026 V
(1,81) (0,007) (0,0011) (0,0010)
SQR=2000
O pesquisador 2 definiu uma nova variável de escala de notas (T) como a média entre N e V e ajustou a
seguinte regressão:
log(Ê) = 1,72 + 0,050 S + 0,0068 T
(1,78) (0,005) (0,0010)
SQR=2045
O pesquisador 3 ajustou a seguinte regressão:
log(Ê) = 2,02 + 0,063 S + 0,0088 T – 0,0018V
(1,81) (0,007) (0,0022) (0,0012)
SQR=2000
Compare os resultados dos três pesquisadores, incluindo a discussão sobre os valores estimados dos
parâmetros e sobre suas significâncias estatísticas individuais.
----------------------------------------------------------------------------------------------------------------
4. Nas questões a seguir, marque, de acordo como o comando de cada uma delas: itens VERDADEIROS
na coluna V; itens FALSOS na coluna F.
4.1: É correto afirmar a respeito do modelo de regressão linear clássico multivariado na forma matricial:
Y= X +, com n observações e k > 2 variáveis explicativas, incluindo-se o intercepto.
V F
Para testar a hipótese conjunta de que 2 = 3 = ... = k = 0, pode-se utilizar o teste
𝑅2 /(𝑘−1)
𝐹𝛼;(𝑘−1),(𝑛−𝑘) = [(1−𝑅2 )/(𝑛−𝑘)] , em que R2 é o coeficiente de determinação do modelo.
Sempre que o modelo tiver pelo menos duas variáveis explicativas além do intercepto, o R 2
será menor que o R2 ajustado.
Um pressuposto básico é: nenhuma das variáveis independentes deve estar perfeitamente
correlacionada com qualquer outra variável independente ou com qualquer combinação
linear de outras variáveis independentes.
Quando testamos a existência do modelo de regressão, fazemos as seguintes hipóteses sobre
os coeficientes da regressão (sendo 1 0 , ou seja, a regressão não passa pela origem):
Hipótese nula => H0: 2 = 3 =... = k = 0
Hipótese alternativa => H1: Todos os i 0 , para i = 2, 3,…, k.
A comparação do poder explicativo de modelos envolvendo número diferente de variáveis
explicativas deve ser feita com base no R 2 ajustado.
4.2: Foram encontrados os seguintes resultados para estimar uma regressão linear com duas variáveis
explicativas para uma amostra de tamanho 10.
Variáveis Coeficiente Erro Padrão Estatística p-valor
Explicativas T
Constante 223,3 254,8 0,88 0,410
X2 -1,26 0,8263 -1,52 0,172
X3 -1,03 3,213 -0,32 0,752
R2 = 81,2%; R2 ajustado = 76,1%; Valor calculado da estatística F=15,1. Podemos afirmar que:
V F
A equação de regressão estimada é y = 223,3 + 1,26X2 + 1,03X3.
A um nível de significância de 5% podemos afirmar que a regressão existe. Porém, após
elaborarmos os testes de hipóteses para os coeficientes individuais, aceitamos a hipótese (a
um nível de significância de 1%) de que o coeficiente para a variável X2 é zero.
O coeficiente de determinação indica que 81,2% da variação amostral de Y podem ser
atribuídos as variações de X2 e X3.
Os valores teóricos das estatísticas t utilizadas para testar os coeficientes das variáveis
explicativas devem ser calculados para 10 graus de liberdade.
Se adicionarmos um novo regressor X k+1 à equação acima então o coeficiente de
determinação, R 2 pode ou não aumentar.
4.3. Com relação à inferência estatística e aos testes de hipóteses, é correto afirmar que:
V F
O erro tipo I consiste em aceitar a hipótese nula ( H0 ) quando esta é falsa.
Quanto maior o p-valor, maior a credibilidade da hipótese alternativa.
A conclusão do teste é sensível à forma como se define a hipótese nula.
Quanto menor for o nível de significância de um teste, mais extremo deve ser o valor
calculado da estatística do teste para que se rejeite H0 .
------------------------------------------------------------------------------------------------------
onde Yt é a taxa efetiva de inflação (%) no instante t, X2t é a taxa de desemprego (%) no instante t e X 3t
é a taxa esperada ou prevista de inflação (%) no instante t. Utilizando os dados da tabela a seguir, foram
obtidos os resultados das estimações pelo método de mínimos quadrados.
MODELO 5.2
Variáveis Coeficiente Erro padrão ESTATÍSTICA p-valor
preditoras T
Constante 7.1933 1.5948 4.5105 0.0011
X2 -1.3925 0.3050 -4.5652 0.0010
X3 1.4700 0.1758 8.3626 0.0000
R = 0.8766; R ajustado = 0.8519; Valor calculado da estatística F = 35.5152
2 2
Escreva e interprete as equações das regressões. Interprete as estatísticas de ajuste dos modelos e os
compare.
6: Para analisar o comportamento do consumo pessoal pode ser usado o seguinte modelo, que sugere
que o consumo se relaciona linearmente com a renda e o tempo (ou tendência).
Yt = t + 2X2t + 2X3t + t
Onde, Y = despesa de consumo per capita (CONS), X 2 = renda disponível per capita (REND) e X3 =
tempo medido em anos (T).
SQT=SQE+SQR
R2 = SQE / SQT = 1 – (SQR/SQT)
R2ajustado = 1 – [(SQR/n-k) / (SQT/n-1)] = 1 – (n-1/n-k) (1-R2)
8. Para estudar a participação na força de trabalho de famílias pobres urbanas, foram utilizadas
observações de 15 municípios brasileiros para os seguintes modelos de regressão, onde Y é a
porcentagem na força de trabalho, X2 é a renda familiar média, X3 é o tamanho médio das famílias e X4
é taxa de desemprego:
Modelo 1: Yi = 1 + 2X2i + i
Modelo 2: Yi = 1 + 2X2i + 3X3i + i
Modelo 3: Yi = 1 + 2X2i + 3X3i + 4X4i + i
As estimativas dos parâmetros dos modelos foram as seguintes:
Modelo 1 Modelo 2 Modelo 3
Intercepto 0,2088 -0,0990 -0,0781
(0,1804) (0,2279) (0,2519)
Renda Familiar Média 0,2743 ** 0,2509 ** 0,2475 **
(0,1030) (0,0943) (0,0992)
Tamanho Médio das Famílias 0,0910 * 0,0903 *
(0,0469) (0,0489)
Taxa de Desemprego -0,2446 ***
(0,0068)
(a) Como está sendo testada a hipótese de que o tamanho médio das famílias tem efeito sobre a
participação dos pobres na força de trabalho?
(b) Escolha o melhor modelo, justifique sua escolha e interprete os resultados deste modelo.
10: O banco de dados de uma amostra cross-section de 1519 famílias em 1996 foi usado para estimar
como a proporção do orçamento doméstico gasto com transporte (transp) depende do log da renda total
(logrenda), da idade do chefe da família (idade e idade2) e do número de filhos (nfilh). Os resultados
estimados foram:
Variáveis Coeficiente Erro padrão
explicativas
Constante -0.0315 0.0322
Logrenda 0.0414 0.0071
Idade 0.0178 0.0044
Idade2 -0.0002 0.0000
Nfilh -0.0130 0.0055
R2 = 0,2472
(a) Faça os testes de hipóteses sobre a significância dos parâmetros individuais e sobre a significância
geral da regressão, ambos ao nível de 5%.
t = (bk - k) / ep (bk) ~ tn-k
(para H0: k=0)
tcrítico para α=0,05 e n = 1519 → 1,96