Você está na página 1de 7

Universidade Federal de Santa Catarina

Centro Sócio-Econômico
Curso de Ciências Econômicas
Estatística Econômica
Prof.: Gueibi Peres Souza

LISTA DE EXERCÍCIOS – 0

1) Dada uma amostra de dez pares de valores, admitindo que as variáveis X e Y estão relacionadas de
acordo com o modelo Yi = α + βXi + ui, onde os ui são variáveis aleatórias independentes com
distribuição normal de média zero e variância constante:

X Y X Y
-2 0 0 4
-2 0 1 5
-1 2 1 6
-1 3 2 8
0 4 2 8

a) Determine as estimativas dos parâmetros da regressão linear.


R.: a = 4; b = 1,9.
b) Teste H0: β = 0 ao nível de significância de 5%.
R.: t = 17,91, ttab. = 2,306, rejeita-se H0.
c) Calcule o coeficiente de determinação e teste sua significância estatística.
R.: R2 = 0,976, F = 320,89, Ftab. = 5,32, rejeita-se H0.
d) Determine a estimativa de Y para X = 3.
R.: Ŷ = 9,7.
2) Dados os valores de X e Y na tabela abaixo (admitindo-se que estão relacionados de acordo com o
modelo Yi = α + βXi + ui, onde os ui são variáveis aleatórias independentes com distribuição normal
de média zero e variância constante):

X Y X Y
2 6,9 3 8,2
3 8,7 4 10,8
-2 -5,8 1 -1,6
1 3,4 -2 6

a) Determine as estimativas dos parâmetros da regressão linear.


R.: a = 2,34; b = 1,78.
b) Construa a tabela de análise de variância.
R.:
CV Gl SQ’s Qme F
Regressão 1 113,05 113,05
Resíduo 6 110,45 18,41 6,14
Total 7 223,50 31,93

c) Faça os testes t e F (α = 0,05).


R.: ta = 1,33, tb = 2,48, ttab. = 2,447, aceita-se H0 para a e rejeita-se H0 para b. F =
6,14, Ftab. = 5,99, rejeita-se H0.
3) Os resultados de uma regressão entre preço de imóveis e suas áreas foram as seguintes:
Preço estimado = 200 + 1,2 Área, onde “a” apresentou desvio padrão de 150 e “b” de 0,3. Teste a
significância dos parâmetros sabendo que foi utilizada uma amostra de 20 observações (GC = 80%).
R.: ta = 1,333, tb = 4, ttab. = 1,33, rejeita-se H0 para ambos.
4) Considere a amostra abaixo para as vendas de VW Fusca no Brasil de janeiro de 1994 a julho de
1996.
Tempo (Xt) Vendas (Yt) Tempo (Xt) Vendas (Yt)
1 1370 17 1722
2 1679 18 1793
3 1820 19 1492
4 933 20 1346
5 1186 21 1699
6 1426 22 1488
7 1709 23 1407
8 1740 24 1181
9 1205 25 573
10 1581 26 1060
11 1735 27 1075
12 935 28 1408
13 1081 29 1286
14 1136 30 1122
15 1436 31 78
16 1666 - -
Fonte: Anfavea.

a) Estime os parâmetros para a relação das vendas com o tempo.


R.: a = 1537,50; b = -10,40.
b) Construa uma conclusão breve e original (máximo cinco linhas) a respeito da quantificação feita
através da reta de regressão linear simples da relação ceteris paribus entre estas variáveis.
R.: F = 2,70, Ftab. = 2,89 (α= 0,1); 4,20 (α= 0,05); 7,34 (α= 0,01); aceita-se H0 para
ambos, ou seja, regressão não válida.
5) Porque podemos afirmar com relativa segurança que é improvável a ocorrência de R2 = 0 em uma
análise de regressão?
R.: R2 = 0: SQE = 0, ou seja, QMeE = 0 .: Fcalc = 0, isto apenas se não houver uma relação
de causalidade entre X e Y.
6) Qual a situação característica assumida pelo conjunto de dados resultaria em uma soma dos
quadrados total igual à soma dos quadrados explicados?
R.: Todos os dados observados estarem exatamente em cima da reta estimada (Ŷ = Y :.
R2 = 1).
7) Qual a razão do teste F (análise de variância – ANOVA) ser obrigatoriamente um teste de hipóteses
unilateral (superior) e o teste t (significância dos parâmetros) geralmente ser um teste de hipóteses
bilateral?
R.: Teste F: devido a sua Ha ser QMeE > QMeR, significando que somente devemos aceitar
um modelo cujo componente que representa o quanto se consegue explicar da variância
de Y seja maior que o componente que representa o quanto não se consegue explicar do
mesmo. Teste t: devido ao fato de não se diferir, no momento de estipular as hipóteses,
se as variáveis possuem um relacionamento direto ou inverso com o Y.
8) Em que tipo de situação um teste t de significância de parâmetros poderia/deveria ser unilateral?
R.: Quando estivéssemos testando se o parâmetro estimado é superior ou inferior a um
pré-estabelecido, ou seja, Ha: parâmetro > do que determinado valor ou ainda, Ha:
parâmetro < do que determinado valor e não o tradicional ≠.
9) Com base na tabela abaixo, responda qual a influência que X exerce em Y e com que grau de
confiança se pode considerar e, consequentemente, divulgar o modelo estimado como válido?

n ∑Y ∑X1 ∑YX1 ∑y2 ∑X12 ∑x12


107 46,46 46,80 1474,81 1438,48 5964,08 5943,61
R.: a influência de X em Y é aproximadamente 0,245%, pois b = 0,0245 e o grau de
confiança pode ser até acima de 99%, pois Fcalculado = 34,64 E o Ftabelado é algo em torno de
3,95 (para α = 0,05), 2,8 (para α = 0,1) e 7 (para α = 0,01).
10) Explique de forma resumida o que é um teste “t” em uma análise de regressão.
R.: é um teste que avalia, a partir de determinado grau de confiança, a significância
estatística do(s) coeficiente(s) estimado(s).
11) Explique de forma concisa e completa a hipótese testada em uma análise de variância (ANOVA) de
uma análise de regressão.
R.: a hipótese testada é de o QMeE = QMeR, ou seja, da parte da variância de Y explicada
com a análise ser igual a parte da variância de Y não explicada com a mesma a partir de
um determindo grau de confiança. Daí a colocação de ser um teste de validade do
modelo, pois apenas devemos considerar válidos/úteis modelos cuja parte da variância
de Y explicada por ele é maior que a parte não explicada.
12) Sabendo que os dados abaixo geraram o modelo de MQO IPCÂ = 7,84 – 0,455 t, teste a validade
desta equação.

Data 2003 2004 2005 2006 2007 2008 2009 2010


IPCA (% a.a.) 9,3 7,6 5,69 3,14 4,46 5,9 4,31 5,91
n 1 2 3 4 5 6 7 8
Fonte: Ipea.
13) Comprove quantitativamente a validade e o poder de explicação da análise realizada na questão
anterior.
R.: Análise válida com 99% de confiança (Fcalc.:88,78) e R2 de ~96%.
14) Comente o significado e a significância dos parâmetros da equação log Yt = 1 (0,63) - 0,6 log X
(0,35) sabendo que os valores entre parênteses são os erros padrão e que a amostra continha 57
observações.
R.: Intercepto inválido e b válido apenas a 90% de confiança. A interpretação é a de a
cada 1% de variação em X o Y se reduz em 0,6%.
15) Cite e exemplifique a razão para se considerar útil a estimativa do intervalo de confiança de um
parâmetro.
R.: Revelar a fidedignidade/fragilidade da estimativa pontual em relação à intervalar. Por
exemplo,...
16) Com base no relatório abaixo, gerado para dados de corte (sessão cruzada) de consumo (R$) e renda
(R$) de uma amostra de 40 observações coletada em uma determinada população, responda:

Modelo: MQO, usando as observações 1-40


Variável dependente: Consumo

Coeficiente Erro Padrão razão-t p-valor


Const 40,5828 22,0152 1,8434 0,07308 *
Renda 0,128732 0,0303689 4,2389 0,00014 ***

Média var. dependente 130,4380 D.P. var. dependente 45,03651


Soma resíd. Quadrados 53707,20 E.P. da regressão 37,59451
Fonte: Gretl.

a) Qual o grau de confiança que fundamentaria todo e qualquer comentário acerca das informações
contidas no mesmo? Fundamente objetivamente (com cálculos) sua resposta.
R.: 99%. F = 17,97 e F (1;38; 0,01) ~7,4 (SQT = 79103,31; SQE = 25396,11; QMeR =
1413,35).
b) Imaginando que a resposta da letra “a” desta questão tenha sido considerada aceitável pelo seu
cliente interno na organização, na intenção de comparar esta proposta de análise (modelo) com
alternativas igualmente sugeridas para embasar o processo decisório em discussão (outros
modelos), qual seria o grau de ajuste mínimo aos dados dentre as demais propostas (outros
modelos) que lhe incentivaria a descartar a proposta (modelo) apresentada acima?
Fundamente objetivamente (com cálculos) sua resposta.
R.: A partir de 32,11%, pois a proposta (modelo) possui um R 2 de 32,10%.
c) Imaginando que a proposta de análise (modelo) acima tenha sido a adotada pela organização em
que trabalha, com base naquelas informações e também nas contidas no relatório abaixo, que
traz estimativas adicionais dos parâmetros investigados, construa um comentário conciso e
completo (máximo 05 linhas) acerca do comportamento esperado para os elementos desta
população a respeito do que foi analisado.
R.: t(38, 0,025) = 2,024

Variável Coeficiente 95% Intervalo de Confiança

const 40,5828 -3,98457 85,1502


Renda 0,128732 0,0672537 0,190211
Fonte: Gretl.
R.: O aluno deve interpretar os valores dos coeficientes estimados e compará-los com
os limites do seu intervalo de confiança para um grau 95%.
17) Com base no relatório abaixo, gerado a partir de uma amostra de dados de corte (ou sessão cruzada)
referentes ao consumo semanal com alimentação (R$) e renda semanal (R$) de uma determinada
população, responda:
Modelo: MQO, usando as observações 1-40
Variável dependente: Consumo Semanal com Alimentação (R$)

Coeficiente Erro Padrão


Const 40,5828 22,0152
Renda Semanal (R$) 0,128732 0,0303689

R-quadrado 0,321049
F(1, 38) 17,96869
Fonte: Gretl.
a) (2,0) Qual o grau de confiança que fundamentaria todo e qualquer comentário acerca das
informações contidas no mesmo? Fundamente objetivamente (com cálculos) sua
resposta.
R.: 99%. F (1;38; 0,01) ~7,4.
b) (2,0) Imaginando que a resposta da letra “a” desta questão tenha sido considerada aceitável pelo
seu cliente interno na organização em que trabalha, construa um comentário conciso e completo
(máximo 5 linhas) que complemente a interpretação do restante das informações contidas no
referido relatório. Fundamente objetivamente (com cálculos) sua resposta onde for
possível.
R.: A partir disto, colocar que independentemente da renda, com 90% de confiança, o
consumo semanal de cada elemento da população será em média de R$ 40,58 e, com
99% de confiança, a cada real acrescido na renda semanal destas pessoas,
aproximadamente R$ 0,13 será destinado ao consumo e que esta equação consegue
explicar, em média, 32% da variância do Consumo semanal com alimentação desta
população.
c) (2,0) Imaginando que a proposta de análise (modelo) acima tenha sido a adotada pela
organização, com base naquelas informações construa uma estimativa de consumo semanal
máximo, com 95% de confiança, para o caso de uma pessoa que possua uma renda semanal de
R$ 200,00.
R.: R$ 123,15. O aluno deve construir uma equação com os limites superiores dos
parâmetros estimados a partir deste intervalo de confiança (R$ 85,15 para o
intercepto ou coeficiente linear e R$ 0,19 para o coeficiente angular) e aplicar esta
equação a um X = 200.
18) Avalie a equação Ŷt = 2 (1) + Xt (1) estimada por MQO sabendo que os valores entre parênteses
são os erros padrão, que a amostra utilizada continha mais de 52 observações/dados e que a cultura
organizacional que contextualiza a análise exige que se adote um grau de confiança de ao menos
95%.
R.: Aqui o aluno deve realizar o teste t de significância dos parâmetros antes de comentar
os valores. Como apenas o intercepto é estatisticamente significante não deve escrever
nada além de que o modelo é inválido em seu comentário.
19) Construa um comentário crítico conciso (máximo de 7 linhas) e completo (mencionando o principal
viés disto) quando em análises quantitativas na área de ciências econômicas preferimos testes de
hipóteses que apresentam 99% de confiança a testes que apresentam 90% de confiança.
R.: O comentário deve conter a situação de que é comum em economia, apesar de ser
uma ciência que já há algum tempo sofre uma crise de paradigmas, ainda creditar muita
veracidade à suas hipóteses nulas. Parece ser mais constrangedor para um economista
cometer um erro tipo I (rejeitar uma H0 verdadeira) do que um erro tipo II (aceitar uma
H0 falsa). 99% de confiança minimiza a probabilidade de cometermos erro Tipo I, mas
maximiza a probabilidade de cometermos erro Tipo II.
20) Sabendo que uma análise de regressão estimada por MQO para as exportações de soja do Brasil (com
dados anuais de 1998 a 2011) em função da taxa de câmbio (do mesmo período) gerou a equação
log Ŷt = 12,05 (0,97) + 1,14 log Xt (0,11), onde os valores entre parênteses são os respectivos erros
padrão, que o desvio padrão da variável dependente é 0,68 e que a soma do quadrado dos resíduos
desta análise é 0,58; construa um comentário conciso e completo (com base no que foi discutido em
sala) desta análise.
R.: Modelo válido com 99% de confiança (F(1,12) = 111,74); parâmetros significantes com
99% de confiança (t(a) = 12,38 e t(b) = 10,57); para cada variação de 1% no câmbio
teremos uma variação de 1,14% nas X de soja e independentemente da variação do
câmbio as X de soja variarão +12%; a equação possui um grau de ajuste de 90,3%.
21) Qual a influência do tamanho da amostra para o resultado de um teste de hipóteses que avalia a
significância do valor estimado para o coeficiente de correlação? Justifique sua resposta.
R.: É direta, quanto maior a amostra mais provável é que o coeficiente seja aceito como
significante. Justificativa: quanto maior a amostra mais próximo do censo, portanto,
maior é a aceitação de valores menores.
22) Qual a influência do tamanho do grau de confiança para o resultado de um teste de hipóteses que
avalia a significância do valor estimado para o coeficiente de correlação? Justifique sua resposta.
R.: É inversa, quanto maior o grau de confiança (menor o nível de significância), mais
rígido é o teste e menor é a probabilidade de que o coeficiente seja aceito como
significante. Justificativa: quanto maior o grau de confiança menor é a área de rejeição
da hipótese nula de que a correlação é nula.
23) Em que tipo de situação um teste t de significância de parâmetros (coeficientes de correlação)
poderia/deveria ser unilateral?
R.: quando a hipótese alternativa fosse de o coeficiente ser > ou < a um determinado
valor pré-estabelecido.
24) Qual a diferença entre o coeficiente de determinação (R2) e o coeficiente angular (b) em uma análise
de regressão linear simples?
R.: o coeficiente de determinação nos fornece o grau de explicação da reta de regressão
estimada, ou seja, a porcentagem da variância de Y que é explicada com a equação e o
“b” nos fornece a influência de X em Y.
25) A partir das questões discutidas em sala comente o modelo estimado abaixo.

Modelo: Estimativas Mínimos Quadrados (OLS) usando as 9 observações 2001-2009


Variável dependente: log PIB

Coeficiente Erro Padrão razão-t p-valor


Const 13,9895 0,0160172 873,4068 <0,00001 ***
Tempo 0,114956 0,00284633 40,3876 <0,00001 ***

Média var. dependente 14,56429 D.P. var. dependente 0,315495


Soma resíd. Quadrados 0,003403 E.P. da regressão 0,022048
R-quadrado 0,995727 R-quadrado ajustado 0,995116
F(1, 7) 1631,156 P-valor(F) 1,49e-09
Log da verossimilhança 22,69145 Critério de Akaike -41,38291
Critério de Schwarz -40,98846 Critério Hannan-Quinn -42,23413
Rô 0,194274 Durbin-Watson 1,230329
R.: como em toda e qualquer análise de regressão o aluno deve comentar: a) o significado
de “b”(valor principalmente); b) a significância de “b” (resultado teste “t”); c) a validade
do modelo (teste F e pressuposições básicas – sendo esta última não apresentada na
questão) e d) grau de ajuste do modelo (R 2). Como se trata de um modelo Log-Linear
deve comentar que o “b” é a taxa média de variação de Y, ou seja, a taxa de crescimento
médio do PIB nominal ao ano (para amostra considerada) foi de aproximadamente
11,5%.
26) A partir das questões discutidas em sala comente o modelo estimado abaixo.

Modelo: Estimativas Mínimos Quadrados (OLS) usando as 14 observações 1998-2011


Variável dependente: log Exportações Soja

Coeficiente Erro Padrão razão-t p-valor


Const 12,047 0,972812 12,3837 <0,00001 ***
log Taxa Câmbio 1,14018 0,107863 10,5706 <0,00001 ***

Média var. dependente 22,31135 D.P. var. dependente 0,678861


Soma resíd. Quadrados 0,581013 E.P. da regressão 0,220040
R-quadrado 0,903020 R-quadrado ajustado 0,894939
F(1, 12) 111,7371 P-valor(F) 1,96e-07
Log da verossimilhança 2,409135 Critério de Akaike -0,818269
Critério de Schwarz 0,459845 Critério Hannan-Quinn -0,936582
Rô 0,485628 Durbin-Watson 1,028064
R.: como em toda e qualquer análise de regressão o aluno deve comentar: a) o significado
de “b”(valor principalmente); b) a significância de “b” (resultado teste “t”); c) a validade
do modelo (teste F e pressuposições básicas – sendo esta última não apresentada na
questão) e d) grau de ajuste do modelo (R 2). Como se trata de um modelo Log-Log deve
comentar que o “b” é a estimativa da verdadeira elasticidade entre taxa de câmbio e
Exportações de Soja no Brasil (com base na amostra coletada), ou seja, para cada
variação de 1% na taxa de câmbio anual no Brasil isto se reflete em uma variação de
1,14% nas exportações de soja.
27) (ANPEC – 2012) Julgue como falsa ou verdadeira a afirmativa: Se o p-valor de um teste é maior do
que o nível de significância adotado rejeita-se a hipótese nula. Justifique sua resposta.

28) (ANPEC 2009) Com relação aos testes de hipótese, é correto afirmar que o teste “t” em regressões
envolvendo variáveis não estacionárias não será válido caso a regressão seja espúria? Justifique sua
resposta.
29) Qual a razão que fundamenta a sugestão de utilizarmos o R 2 ajustado e não o R2 “convencional” para
avaliarmos o grau de explicação de um modelo de regressão múltipla?

30) O que acontece com o R2 ajustado quando há um aumento no número de variáveis independentes?
Justifique sua resposta.
R.: Ele aumenta, porém, menos que o R 2.
31) O que uma pesquisadora está buscando fazer ao tornar um teste de hipóteses, baseado na
distribuição t de Gosset, unilateral?
R.: Aumentar a área de rejeição de H0, uma vez que isto traz o valor mínimo para que
esta decisão seja tomada para mais próximo de zero.
32) Interprete os resultados fornecidos nas figuras 3 e 4 abaixo e comente a decisão tomada pelos
autores acerca do grau de confiança escolhido em ambas.

Figura 3 – Teste de significância dos parâmetros do modelo

Fonte: Laudo de Avaliação N°7128.7128.632314/2012.01.01.01 SEQ.002 da Caixa Econômica Federal (p. 13 do


referido processo).
Figura 4 – Teste ANOVA do modelo

Fonte: Laudo de Avaliação N°7128.7128.632314/2012.01.01.01 SEQ.002 da Caixa Econômica Federal (p. 13 do


referido processo).

33) Porque pode ser considerado uma boa prática realizarmos uma análise descritiva da variável
dependente antes de iniciarmos um processo de análise com abordagem quantitativa?

34) O que se observa em um “teste t” de significância de parâmetros em uma análise de regressão por
MQO? Que intenção justificaria se admitir níveis de significância maiores do que 10% em sua
aplicação?

35) O que se observa em um teste ANOVA (“teste F”) de significância do modelo em uma análise de
regressão por MQO? Porque pode ser considerado insuficiente para determinar a validade do mesmo?
O que justificaria se admitir níveis de significância maiores do que 10% em sua aplicação?

36) Com suas palavras explique o que é o p-valor e qual sua aplicação e importância em análises
quantitativas.

37) O que se observa no cálculo do coeficiente de determinação? O que justifica se considerar esta
medida tanto como ineficaz quanto como ineficiente para a definição de “sucesso” ou “fracasso” em
uma análise de regressão?

38) Como se interpreta cada um dos valores abaixo de coeficientes angulares de análises de regressão
simples por MQO:

a) A variável X é o tempo, a variável Y está em logaritmo do PIB real, e o beta estimado da


regressão é igual a 0,08.

b) Ambas variáveis, X e Y, estão em variação percentual e o coeficiente angular da regressão é igual


a 0,5.
c) A variável X é o preço em R$ de determinado produto, Y é a quantidade demandada em
unidades deste mesmo produto, e o coeficiente angular da regressão é igual a -2.

d) Ambas as variáveis, X e Y, estão em logaritmo e o coeficiente angular da regressão é 0,5.

39)

Você também pode gostar