Escolar Documentos
Profissional Documentos
Cultura Documentos
Centro Sócio-Econômico
Curso de Ciências Econômicas
Econometria
Prof.: Gueibi Peres Souza
LISTA DE EXERCÍCIOS – 1
1) Cite duas diferenças entre uma análise de correlação e uma análise de regressão.
R.: o que mensuram (semelhança entre variâncias e influência de uma na
outra/elasticidade) e quantidade de variáveis envolvidas no processo de estimação
(correlação é sempre ceteris-paribus); robustez da análise; a definição de quem
influencia em quem; realização de previsões.
2) Cite duas semelhanças entre uma análise de correlação e uma análise de regressão.
R.: análises causais, direção/sinal do relacionamento, causalidade presumida,
necessidade de satisfação de determinadas pressuposições básicas, quantidade de
variáveis envolvidas quando a análise de regressão for simples.
3) Com base na tabela abaixo e no que foi discutido em sala, escreva o modelo conceitual/geral de uma
análise de regressão para estes dados.
Matriz de Correlação
Variáveis Nº obs. Y X1 X2 X3
Y 60 1,0000 0,2044 0,2201 0,2158
X1 60 1,0000 0,2204 0,1929
X2 60 1,0000 0,2011
X3 60 1,0000
R.: Com 90%G.C. r mínimo ~ 21%. Modelo: Y = a + bX2.
4) Qual a utilidade prática em se realizar uma análise de auto-correlação antes de se iniciar uma análise
de regressão de uma série temporal?
R.: Considerar as defasagens significativas do Y no lado direito da equação (modelo Auto
regressivo) evitando uma possível auto correlação nos resíduos.
5) Qual a dificuldade prática em se utilizar a covariância entre duas variáveis para mensurar se o
relacionamento é forte ou fraco entre variáveis?
R.: O fato de ser difícil definir se o relacionamento entre as variáveis é forte ou fraco
tendo em vista que ela varia de + a - ∞.
6) Qual a razão de coeficientes de correlação, entre duas variáveis distintas, iguais a ±1 serem poucos
prováveis em situações práticas?
R.: Devido ao fato deste resultado exigir uma igualdade entre suas variâncias (pois
significa relacionamento perfeito).
7) Quais as cinco características básicas que uma amostra de pares de variáveis deve apresentar para
que se possa realizar uma análise de correlação baseada no coeficiente linear de Pearson de forma
adequada?
R.: Linearidade; mesma unidade de medida (ou adimensionais); normalidade;
homoscedasticidade; e estacionaridade.
8) Em uma análise de correlação criteriosa, o que determina quais variáveis podem ser incluídas em uma
análise de regressão e quais não podem?
R.: O resultado do seu teste de hipóteses de significância estatística do coeficiente
estimado (o fato de ser superior ou não ao coeficiente de correlação mínimo).
9) Se o coeficiente de correlação entre duas variáveis, que sabidamente possuem uma relação de
causalidade, não for significativo segundo um teste de hipóteses realizado para a amostra, quais as
duas alternativas à sua disposição da pesquisadora que poderiam ser utilizadas para permitir a
inclusão da variável em uma análise de regressão sem desconsiderar os resultados obtidos na análise
prévia de correlação?
R.: Aumentar o tamanho da amostra e/ou reduzir o grau de confiança (aumentando o
nível de significância).
10) Imagine que estejamos trabalhando com um conjunto de dados que envolvem 100 variáveis de doze
observações cada. Ao realizar uma análise de correlação, no momento de avaliar a significância dos
coeficientes de correlação estimados decidimos adotar a ideia de calcular apenas um valor, ou seja,
para este tamanho de amostra qual o coeficiente de correlação mínimo para assumirmos significância
para 1%, 5% e 10% de significância?
R.: 70,79%, 57,60% e 49,72%, respectivamente (t G.C.99%=3,169; t G.C.95%=2,228; t
G.C.90%=3,169).
11) Descreva de forma sucinta o que diferencia uma análise de correlação de uma análise de correlação
cruzada e de uma análise de auto correlação.
R.: O período no tempo e as variáveis envolvidas. Correlação: mensuração do
relacionamento entre variáveis distintas (ambas no mesmo período de tempo);
Correlação Cruzada: mensuração do relacionamento entre variáveis distintas (ambas em
diferentes períodos de tempo); Auto correlação: mensuração do relacionamento entre a
mesma variável (em períodos de tempo diferentes).
12) Comente a importância de transformarmos variáveis que não respeitam uma distribuição normal, para
que passem a respeitar, antes de uma análise de correlação e/ou regressão.
R.: É a característica básica para que um teste de hipóteses paramétrico possa ser
considerado/validado.
13) Comente brevemente (máximo 5 linhas) a razão pela qual realizar uma desazonalização em um
conjunto de variáveis antes de uma análise de correlação pode ser útil.
R.: Pode evitar confusões interpretativas.
14) A partir dos dados divulgados na tabela abaixo (retirada do ensaio empírico “Análise quantitativa dos
fatores que influenciam a produção agrícola no Brasil” de Bolfe et al. 2009) defina qual ou quais os
coeficientes estimados são estatisticamente insignificantes considerando 99% de confiança.
Justifique suas respostas.
Tabela de Correlação
Variáveis N Produção-total Área Plantada Fluxo Créd. Cust. Venda Maq.
Produção-total 19 1,0000 0,6572 0,8006 0,7840
Área Plantada 19 0,6572 1,0000 0,5888 0,3670
Fluxo Crédito Custeio 19 0,8006 0,5888 1,0000 0,4710
Venda Maquinário 19 0,7840 0,3670 0,4710 1,0000
Fonte: BER.
R.: Os coeficientes insignificantes são 36,70% (Área Plantada e Venda de Maquinário) e
47,10% (Venda de Maquinário e Fluxo de Crédito para Custeio), tendo em vista que para
uma amostra de 19 observações (17g.l.) e alfa de 0,01 o coeficiente de correlação mínimo
é 57,5%.
15) Comente brevemente (máximo 10 linhas) acerca da importância de respeitarmos os pressupostos
básicos quando da realização de uma análise de correlação, destacando algumas das principais
consequências ao não se adotar tal postura, assim como da necessidade e utilidade da realização do
teste de hipóteses no(s) coeficiente(s) estimado(s).
R.: a resposta deve conter ao menos: 1- a colocação de que relações espúrias podem ser
estimadas (oriundas de variáveis covariadas); 2- sub ou superestimações nos coeficientes
são prováveis (gerando confusões interpretativas); e 3- somente com o teste de hipótese
é que podemos garantir se o coeficiente estimado é de fato estatisticamente diferente de
zero.
16) Qual a utilidade prática em se realizar uma análise de auto correlação antes de se iniciar uma análise
de regressão em séries temporais?
R.: a possibilidade de incluir defasagens de Y do lado direito da equação, contribuindo
assim para redução do erro e quem sabe até a eliminação de uma possível auto
correlação residual.
17) Cite duas utilidades práticas em se realizar uma análise de correlação cruzada antes de se iniciar uma
análise de regressão em séries temporais.
R.: Saber quais as defasagens de X são úteis incluir na análise (pode inclusive definir a
permanência de uma variável que seria excluída no tempo t) e também saber o sentido do
relacionamento, ou seja, se é X que mais influencia no Y de fato ou se é o Y que mais
influencia no X.
18) Qual a utilidade de se realizar uma análise de correlação entre um conjunto de variáveis antes de
iniciar uma análise de regressão linear simples?
R.: poder decidir qual a variável utilizar como explicativa.
19) Qual a diferença entre uma análise de correlação de uma análise de regressão linear simples?
R.: uma análise de correlação nos fornece o grau de semelhança entre as variâncias das
variáveis envolvidas e a analise de regressão nos fornece a influência de X em Y.
20) Sabendo que a variável “Dif_IAE_1” se trata da primeira diferença do Índice de Atividade Econômica
em Santa Cataria (de fev/92 a dez/10) e a variável “Dif_Combustivei” é a primeira diferença do Índice
de Vendas de Combustíveis e Lubrificantes no Estado (de fev/92 a dez/10), faça um comentário
conciso e completo acerca da figura abaixo.
Fonte: Gretl 18.0.
R.: aqui o aluno deve comentar acerca dos espeques significativos (correlações que
vazam os limites da área de aceitação de H0: ρ = 0 - linhas tracejadas), ou seja, as
defasagens de X significantes para explicar Y no período atual (X t-5, Xt-11 e Xt-12). Também
deve comentar as defasagens positivas de X significantes para explicar Y no período
anual, o que pode ser considerado igualmente como as defasagens de Y importantes para
explicar X no tempo atual (Yt-1, Yt-5, Yt-6, Yt-7 e Yt-12). Esta maior quantidade de defasagens
de Y importantes para explicar X em relação a quantidade de defasagens de X para
explicar Y, pode fundamentar a colocação de que a influência do IAE no índice de vendas
de combustível é maior do que a influência do que o contrário (Combustíveis no IAE). O
fato do primeiro espeque significativo (correlação significativa) que aparece do lado
direito da figura estar na primeira defasagem enquanto que no lado esquerdo aparece
apenas na quinta defasagem (com os maiores na décima primeira e décima segunda)
podem fundamentar a colocação de que no curto prazo é o IAE que influencia a venda de
Combustíveis e que é apenas no longo prazo que a Vendas de Combustíveis se reflete no
IAE. Comentários também podem ser feitos com relação ao sinais e intensidade dos
espeques.
21) Faça um comentário interpretativo do correlograma cruzado entre a primeira diferença do Índice de
Atividade Econômica de Santa Catarina e o ln do Índice das vendas no setor de produtos alimentícios
no Estado de Santa Catarina defasado.
Correlações de Dif_IAE_1_ e ln_Prod__Alimen defasada ("lagged")
+- 1,96/T^0,5
1
0.5
-0.5
-1
-10 -5 0 5 10
defasagem
Fonte: Gretl.
Tabela Correlação
Variáveis Nº obs. Y X1 X2 X3 X4 X5
Y 107 1,0000 0,4974 0,1691 0,3058 0,2483 0,2249
X1 107 1,0000 0,2804 0,3239 0,3444 0,1351
X2 107 1,0000 0,8211 0,9031 0,8692
X3 107 1,0000 0,8812 0,7544
X4 107 1,0000 0,8148
X5 107 1,0000
Fonte: Ber Lâmbda.
R.: aqui o aluno deve antes de tudo testar a validade (significância estatística) dos
coeficiente sde correlação. Certamente não precisa fazer 15 testes, pode aplicar a
sugestão exposta em BARBETTA e discutida em sala de calcular o coeficiente de
correlação mínimo para ser significativo com este tamanho de amostra (no caso 107) e
para o grau de confiança.
24) Qual a razão que fundamenta a transformação chamada de padronização antes de uma análise de
correlação?
R.: a intenção de termos as variáveis com diferentes unidades de medida aptas a serem
analisadas comparativamente (uma vez que tal transformação torna as variáveis
adimensionais), o que traz maior fidedignidade a análise evitando confusões
interpretativas.
25) Quando da realização de uma análise de correlação existe a necessidade de se respeitar as
pressuposições de linearidade, causalidade, normalidade e estacionaridade. Explique os motivos da
necessidade de satisfação de cada uma delas individualmente.
26) R.: Linearidade: estar utilizando o coeficiente de Pearson que é para relacionamentos
lineares; Causalidade: trata-se de uma análise causal, ou seja, que mensura o
relacionamento causal entre variáveis; Normalidade: validar o teste de hipótese que
prova a significância da mensuração do relacionamento; Estacionaridade: intenção de se
evitar a mensuração de uma relação espúria.
27) Com base no relatório abaixo, gerado para dados fictícios de séries temporais cuja reta de regressão
não passa pela origem dos pontos, sugira um modelo conceitual plausível de forma que permita o
desenvolvimento da análise, ou seja, admita a construção de uma proposta (modelo) que
possivelmente sirva de alternativa ao decorrente processo decisório. Fundamente objetivamente
(com cálculos) sua resposta.
Yt Yt-1 X1t X1t-1 X2t X2t-1 X3t X3t-1 X4t X4t-1 X5t X5t-1
1,0000 0,7027 -0,6725 -0,6825 0,6918 0,7118 -0,6809 -0,6819 0,6767 0,6908 -0,6691 -0,7624 Yt
1,0000 -0,3002 -0,2777 0,9110 0,2765 0,8204 -0,8469 0,2933 0,3426 0,3444 -0,0845 Yt-1
1,0000 0,2442 -0,1836 0,1984 0,8231 -0,9776 0,9046 -0,0853 0,3964 -0,5238 X1t
1,0000 -0,2342 0,7331 -0,0867 -0,7735 0,8820 -0,1862 0,2820 0,6751 X1t-1
1,0000 0,0950 -0,6902 -0,1179 0,1349 -0,5132 0,0122 -0,3813 X2t
1,0000 -0,6904 -0,5679 -0,3655 0,9722 0,6615 0,7576 X2t-1
1,0000 -0,4041 -0,3270 0,8657 -0,6124 -0,4442 X3t
1,0000 -0,3702 0,3757 0,5389 -0,8472 X3t-1
1,0000 -0,6549 0,9022 -0,5216 X4t
1,0000 0,9189 -0,3629 X4t-1
1,0000 -0,0325 X5t
1,0000 X5t-1
R.: Ŷt = a – b X5t-1 + b Yt-1 + et. Tendo em vista que o r mínimo (para α = 0,1) é
66,94% e n = 7 (admite o máximo de 3 parâmetros, ou seja, o intercepto e duas
variáveis explicativas).
28) Com base no relatório abaixo, gerado para dados fictícios de séries temporais, e considerando que a
reta de regressão não passa pela origem dos pontos e que o tamanho da amostra é de apenas 12
observações, sugira um modelo conceitual plausível de forma que permita o desenvolvimento da
análise, ou seja, admita a construção de uma proposta (modelo) que possivelmente sirva de
alternativa ao decorrente processo decisório. Fundamente objetivamente (com cálculos) sua
resposta.
+- 1,96/T^0,5 +- 1,96/T^0,5
1 1
0,5 0,5
0 0
-0,5 -0,5
-1 -1
-10 -5 0 5 10 -10 -5 0 5 10
defasagem defasagem
+- 1,96/T^0,5 +- 1,96/T^0,5
1 1
0,5 0,5
0 0
-0,5 -0,5
-1 -1
-10 -5 0 5 10 -10 -5 0 5 10
defasagem defasagem
Correlações de Y e X5 defasado
ACF para Y
+- 1,96/T^0,5 1
1 +- 1,96/T^0,5
0,5
0,5
-0,5
-1
0 2 4 6 8 10 12
defasagem
0
PACF para Y
1
+- 1,96/T^0,5
-0,5 0,5
-0,5
-1
-1
-10 -5 0 5 10 0 2 4 6 8 10 12
defasagem defasagem
Fonte: Gretl.
R.: Ŷt = a + b X1t – b X2t-11 – b X3t-11 – b X4t-11 – b Yt-1 + et. r mínimo definido pelos
limites pontilhados horizontais em cada correlograma (para 95% de confiança). Como gl
= n – p, o máximo é de 6 parâmetros (intercepto + 5 b’s, ou seja, no máximo cinco
variáveis explicativas).
29) Construa um comentário fundamentado em cálculos da análise abaixo e sugira dois procedimentos
que contribuiriam para aumentar a robustez da mensuração do relacionamento entre estas variáveis
no período em análise (Governo FHC).
0 0 0
-8 -6 -4 -2 0 2 4 6 8 -8 -6 -4 -2 0 2 4 6 8 -8 -6 -4 -2 0 2 4 6 8
defasagem defasagem defasagem
33) Comente brevemente (máximo 5 linhas) a intenção de considerar apenas variáveis estacionárias
quando da estimativa de coeficientes, seja de correlação ou angulares em uma análise de regressão
por MQO.
34) Mencione ao menos três informações extraídas de uma análise de correlação de dados de séries
temporais que justifiquem o propósito de a realizarmos antes mesmo de iniciar o planejamento do
processo de estimativa de um modelo de análise de regressão por MQO.
35) Explique o que é uma análise de correlação cruzada e mencione ao menos dois benefícios distintos a
uma abordagem quantitativa (por MQO).
37) O que são variáveis covariadas e porque trabalhar com variáveis estacionárias ajuda a identificá-las
tanto em análises de correlação quanto de regressão?
38) O que torna uma análise de correlação alternativa/similar a uma análise de regressão? O que as
diferencia?
39) Explique o teste de causalidade de Granger, mencionando o que significa, no que é baseado seu
cálculo, como se interpretam seus resultados, além de sua relevância/utilidade em estudos na área de
Ciências Sociais Aplicadas.
40) A partir dos dados abaixo construa a equação de um modelo geral de regressão adequado.
41) Com base nos correlograma cruzados abaixo (Correlação Cruzada do Índice de Atividade Econômica e
Índice do Volume de Vendas no Varejo de Tecidos, Vestuário e Calçados;
Hipermercados/Supermercados, Produtos Alimentícios, Bebidas e Fumo; e Combustíveis e
Lubrificantes, respectivamente), proponha os sete modelos conceituais de regressão possíveis para
95% de confiança (escreva as equações gerais identificando suas respectivas variáveis independentes
assim como a dependente).
+- 1,96/T^0,5 +- 1,96/T^0,5
1 1
0,5 0,5
0 0
-0,5 -0,5
-1 -1
-10 -5 0 5 10 -10 -5 0 5 10
defasagem defasagem
+- 1,96/T^0,5
1
0,5
-0,5
-1
-10 -5 0 5 10
defasagem
42) Explique o teste de causalidade de Granger, mencionando: 1) no que é pautada a relação causal; 2) o
que é testado em seu cálculo; 3) como se interpreta seus resultados e 4) qual sua
importância/relevância/utilidade para análises quantitativas em Ciências Sociais Aplicadas.
44) Comente os resultados expostos na matriz abaixo, sabendo que se referem a informações de uma
turma da disciplina Estatística Econômica, como: a) desempenho; b) número de faltas; c) número de
atrasos; d) número de atendimentos na monitoria; e) número de solicitações de atendimento do
Professor; e f) número de acessos à pasta Exemplos e Exercícios do ambiente virtual da disciplina.
Coeficientes de Correlação, usando as observações 1 – 29
45)