Escolar Documentos
Profissional Documentos
Cultura Documentos
Doutor em História Econômica pela Universidade de São Paulo – USP, bacharel em Ciências Econômicas pela
Pontifícia Universidade Católica de Campinas (PUC-Campinas) e bacharel em Estatística pela Universidade Estadual de
Campinas – Unicamp. É professor universitário desde 2000 e membro do Conselho Editorial da Revista de Economia
Política e História Econômica – REPHE. Tem atuado como analista nas áreas de Pesquisa de Mercado, Custos, Viabilidade
de Projetos, Planejamento e Gestão Empresarial, Análise Ambiental e Conjuntura Econômica. Trabalhou por 19 anos no
apoio de Planejamento Energético e tem cooperado em grupos especializados com publicações em revistas do ramo.
Na UNIP, desde 2010, ministra aulas nos cursos de graduação em Economia, Administração, Relações Internacionais,
Contabilidade, Turismo e Serviço Social.
CDU 330.115
U505.43 – 20
© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor
Comissão editorial:
Dra. Angélica L. Carlini (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Kátia Mosorov Alonso (UFMT)
Apoio:
Profa. Cláudia Regina Baptista – EaD
Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos
Projeto gráfico:
Prof. Alexandre Ponzetto
Revisão:
Lucas Ricardi
Juliana Mendes
Sumário
Econometria
APRESENTAÇÃO.......................................................................................................................................................7
INTRODUÇÃO............................................................................................................................................................8
Unidade I
1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS.................................................... 11
1.1 Fases da investigação econômica................................................................................................... 12
1.2 Formulação da teoria ou hipótese................................................................................................. 14
1.3 Especificação do modelo matemático do consumo............................................................... 16
1.4 Especificação do modelo econométrico do consumo............................................................ 19
1.5 Obtenção e preparação de dados................................................................................................... 21
2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)....................................................................... 23
2.1 Estimativa do modelo econométrico............................................................................................ 26
2.2 Método de estimação.......................................................................................................................... 29
2.3 Conceito de função de regressão populacional (FRP) e função de
regressão amostral (FRA)........................................................................................................................... 33
3 TESTE DE HIPÓTESES....................................................................................................................................... 35
4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA)......................... 37
4.1 O coeficiente de determinação (r2) ............................................................................................... 39
4.2 Análise de resíduos............................................................................................................................... 41
4.3 Previsão ou predição (utilização do modelo)............................................................................. 46
4.4 Multiplicador keynesiano da renda............................................................................................... 47
4.5 Uso do modelo para fins de elaboração de política econômica........................................ 48
Unidade II
5 MODELO DE REGRESSÃO LINEAR MÚLTIPLA (MRLM)....................................................................... 55
5.1 Hipóteses.................................................................................................................................................. 55
5.2 Covariância e coeficiente de correlação ..................................................................................... 64
5.3 Teste de hipótese para um coeficiente de correlação populacional................................ 66
5.4 Coeficiente de determinação (r2).................................................................................................... 68
5.5 Erro-padrão do coeficiente linear (ou do intercepto)............................................................ 73
5.6 Erro-padrão do coeficiente angular.............................................................................................. 74
5.7 Inferências sobre o coeficiente angular....................................................................................... 74
5.8 Teste de hipótese................................................................................................................................... 78
5.9 Intervalos de previsão.......................................................................................................................... 80
5.10 Anova (análise de variância)........................................................................................................... 82
6 AVALIAÇÃO DO CONTEÚDO INFORMACIONAL DOS RESÍDUOS.................................................... 84
6.1 Avaliando a homocedasticidade .................................................................................................... 92
6.2 Avaliando a normalidade................................................................................................................... 95
6.3 Intervalo de confiança para a regressão: duas alternativas................................................ 99
6.4 Variação em torno de uma reta de regressão.........................................................................101
Unidade III
7 ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO E INFERÊNCIA..............................................107
7.1 Testes para identificação de multicolinearidade....................................................................111
7.1.1 Teste de Farrar e Glauber.....................................................................................................................111
7.1.2 Teste da VIF (Variance Inflation Factor)........................................................................................ 112
7.1.3 Teste da Tolerance (TLk)........................................................................................................................113
8 DEMAIS ANÁLISES EM ECONOMETRIA..................................................................................................114
8.1 Quebras Estruturais e Variáveis Dummies.................................................................................114
8.2 Variáveis defasadas.............................................................................................................................136
8.3 Variáveis instrumentais.....................................................................................................................144
8.4 O básico da análise de regressão com dados de séries temporais ou
previsão de séries temporais..................................................................................................................155
APRESENTAÇÃO
Interpretar modelos estruturados será um dos nossos objetivos. Iremos compreender de forma
completa ou parcial um determinado fenômeno; perceber como os processos operam para gerar
padrões observáveis; e desenvolver simulações que examinem mudanças ao longo do tempo sobre
conjecturas específicas.
Nesse enfoque, estamos interessados em discutir sobre a natureza e as fontes de dados disponíveis
para análise econométrica a fim de que o aluno obtenha dos dados a maior quantidade possível de
informação e seja capaz de indicar possíveis modelos a serem utilizados.
Em um segundo momento, estudaremos como detectar a presença e estimar tais modelos com
multicolinearidade, heterocedasticidade, autocorrelação serial e erros de especificação.
Os exercícios resolvidos irão procurar mostrar, em detalhes, como os cálculos são desenvolvidos. Isso
será feito envolvendo a discussão dos pressupostos básicos que dão validade aos parâmetros estimados
dos modelos e os testes mais comuns usados para verificar a violação de cada um desses pressupostos.
Por fim, destacaremos algumas outras técnicas de estimação que possibilitem, em contextos
específicos, melhorar a significância do modelo básico.
7
Apresentaremos a regressão com as variáveis dependentes binárias (ou dummies). Serão expostas a
possibilidade de explorar modelos com variáveis qualitativas e as tratativas dos problemas de formulação,
estimação e testes de modelos com variáveis defasadas e instrumentais.
INTRODUÇÃO
A Teoria Econômica se preocupa com relações entre variáveis, e a Econometria é um tipo especial
de análise econômica na qual a abordagem teórica é combinada com formulações matemáticas,
procedimentos estatísticos e mensuração empírica dos fenômenos econômicos por meio de análise de
uma base de dados. Podemos dizer que a Econometria é aquele ramo da ciência econômica que trata
de quantificar, isto é, de representar numericamente as relações econômicas, o que se realiza mediante
uma combinação adequada da Teoria Econômica, da Matemática e da Estatística.
Nas últimas décadas, o levantamento de dados, a lógica e o raciocínio subjacentes à análise de dados
firmaram-se como um instrumental da pesquisa sociológica, em especial econômica – o raciocínio que
empresta apoio à operação analítica.
Inflação, desemprego, consumo, narcotráfico, violência, imigração etc.; vivemos em cidades de cifras,
solicitados a diagnosticar, a mensurar a verdadeira dimensão, o quantum de tudo isso, e a garantir suas decisões.
Muitas vezes deparamos com decisões no mundo profissional difíceis de serem tomadas e das quais
as consequências são importantes, e os resultados, incertos.
Conforme escreve o Dr. Morris Rosenberg (1976, p. 13), “importa que os dados sejam bons, mas
igualmente importante é o que se irá fazer com eles”.
O que vamos tratar nesta disciplina envolve o estudo e a aplicação de métodos e técnicas
econométricas e sua metodologia e aplicações: mostrar a viabilidade prática e teórica de construção
de modelos de previsão, com base em técnicas econométricas. Vamos tratar de modelos como
estrutura analítica construída de forma simplificada, já que são apenas representações esquemáticas
e aproximadas da economia real.
Analisaremos, de forma integrada, como cada abordagem trata a questão do antes (relação
teoria‑modelo, escolha de especificações, análise exploratória dos dados e temas correlatos), do
durante (técnicas econométricas, data mining e outros tópicos) e do depois da aplicação das técnicas
econométricas (interpretação dos modelos, apresentação e implicações para a formulação de políticas
buscando o menor erro possível e permitindo o julgamento da necessidade ou não de medidas corretivas).
8
Regressão é uma importante técnica para medir ou estimar relações entre variáveis econômicas. Ela
se ocupa do estudo da dependência de uma variável em relação a uma ou mais variáveis explicativas
utilizadas pelos economistas para fins de análise estrutural (verificação de teorias econômicas), avaliação
de políticas econômicas e previsão de valores futuros de variáveis de natureza econômica. Este estudo
consiste na construção e análise de uma relação matemática entre as variáveis, no geral, uma variável
em função das outras.
Então, imagine você, economista, ampliando seu potencial e suas habilidades, aprendendo a expandir
seus limites, sendo capaz de testar as proposições teóricas, de explicar o comportamento de variáveis já
observadas e/ou prever comportamentos ainda não observados. Isto é:
Portanto, o instrumental econométrico pode ser utilizado no estudo de qualquer fenômeno, desde
que se consiga expressar as formulações teóricas em bases matemáticas e existam dados amostrais
suficientes para a criação de um modelo.
Observação
9
ECONOMETRIA
Unidade I
1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS
Tão importante quanto estudar métodos e técnicas econométricas é estudar sua metodologia e
aplicações de acordo com cinco paradigmas diferentes:
A Matemática ensina a maneira de deduzir proposições de outros dados (coincide com a lógica
dedutiva); já a Estatística instrui o modo de obter proposições dos fatos observados (coincide com a
lógica indutiva).
11
Unidade I
A Teoria Econômica não fornece qualquer medida numérica da relação entre variáveis. Desse modo, a
análise de regressão é a técnica básica para medir ou estimar relações entre variáveis. O objetivo é testar
proposições teóricas nessas relações, procurando isolar, desagregar efeitos de relações de causalidades
e estimar parâmetros envolvidos na construção de modelos econométricos.
• Testar implicações de uma teoria através da correta tradução desta em proposições testáveis a
partir de modelagem econométrica.
• Prever, já que a Econometria pode ser usada para prever uma relação ou mesmo os valores de uma variável
de interesse – lembrando que a Teoria Econômica é que permite qualificar e explicar uma previsão.
• Caracterizar relações e fenômenos, pois a Econometria possibilita permitir uma visualização dos
dados de forma a revelar relações e fenômenos que às vezes não estão previstos nas teorias, pois
elas são continuamente testadas e se desenvolvem por meio da observação.
Esta técnica de modelagem utilizada para analisar a relação entre uma variável dependente (Y) e
uma ou mais variáveis independentes (X1, X2, X3, ..., Xn) tem como objetivo estimar uma função que
descreve, o mais próximo possível, a relação entre essas variáveis. É assim que poderemos predizer o
valor que a variável dependente (Y) irá assumir para um determinado valor da variável independente X.
O modelo estimado deve satisfazer os objetivos de explicar e/ou prever o comportamento das variáveis
envolvidas nessa análise.
• relevância;
• simplicidade;
12
ECONOMETRIA
• plausibilidade teórica;
• capacidade explicativa;
• capacidade preditiva.
Teoria econômica
Modelo matemático
Modelo econométrico
Avaliação do modelo
(Critério: estatístico, econométrico e econômico)
13
Unidade I
• teste de hipótese;
• previsão ou predição;
No exemplo a seguir, faremos um passo a passo utilizando o modelo de regressão linear simples
(MRLS) tendo como suporte a Teoria Keynesiana de Consumo.
O consumo das famílias é o componente mais importante do Produto Interno Bruto (PIB) de uma
economia, e sua dinâmica é fundamental para entender as alterações tanto em períodos de boom como
de crises. De acordo com a Penn World Table Version 7.0 (KNOEMA, [s.d.]), o consumo representa 70%
do PIB de todos os 190 países pesquisados. Com o intuito de verificar o nível de dependência entre elas,
coletamos os dados da economia brasileira, a preços constantes de 1995, no período de 1996 a 2014
(veja a tabela mais adiante) e estimamos o modelo de regressão linear simples (MRLS), relacionando os
resultados com a função keynesiana e de Milton Friedman.
De acordo com a Teoria Keynesiana (modelo simples de dois setores: economia fechada e sem
governo), numa economia muito simples, sem governo e sem setor externo, isto é, sem transações com
o exterior, a renda nacional (Y) será destinada apenas ao consumo das famílias (C) e à poupança (S), já
que, não havendo governo, não há impostos.
A função consumo mostra a relação existente entre o nível das despesas de consumo e o nível da
renda disponível.
Empiricamente, descobriu-se que o consumo corresponde a uma proporção estável da renda (veja a
figura a seguir, criada a partir de dados do IBGE).
14
ECONOMETRIA
350
300
Renda
250 Consumo
R$ bilhões
200
150
100
50
0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Ano
Será que podemos afirmar que o valor total do consumo é determinado somente pela renda
disponível corrente? Como explicar que pessoas desempregadas, que não dispõem de renda, consomem
um mínimo que seja? Olhando no agregado, percebe-se que uma parte do consumo total independe do
nível de renda (ou pelo menos do nível de renda corrente). Nesse contexto, podemos definir a função
consumo como:
C = α + βYd
Onde:
α = parte autônoma do consumo, isto é, a parcela que não depende da renda (são os que não são
relacionados ao nível de renda, como, no modelo keynesiano, o investimento, os gastos do governo
e a exportação);
β = fração da renda que é gasta, isto é, consumo induzido (questão de padrão de vida).
Essa parcela de renda que é gasta (β), denominada de propensão marginal a comsumir (PMgC), foi
um dos mais importantes conceitos introduzidos por Keynes. O termo “marginal” em economia, que
neste caso representa o adicional de consumo em função de um aumento na renda, expressa a ideia
de um “extra” qualquer decorrente de um acréscimo qualquer ocorrido em uma variável. Analisando
tecnicamente, a propensão marginal a consumir (PMgC) representa a razão entre a variação no consumo
(∆C) decorrente de uma variação na renda disponível (∆Yd) e essa variação na renda. Assim:
∆C
PMgC = β =
∆Yd
A propensão marginal a consumir (PMgC) ou taxa de variação do consumo é maior que zero e menor
que um ⇔ 0 < PMgC < 1, que expressa o comportamento dos agentes de uma determinada economia
em relação à renda obtida – quanto mais propensos estes forem a consumir, maior será o valor da PMgC.
15
Unidade I
Por exemplo, numa economia em que seus agentes estão dispostos a comprometer 75% da sua renda
com o consumo, a PMgC é igual a 0,75. Em decorrência, a propensão marginal a poupar (PMgS)
representa a parcela da renda dos agentes econômicos de uma determinada economia no qual estes se
comprometem a poupar, isto é, a não gastar (PMgC é 0,75 + PMgS é 0,25 = 100% da renda).
A propensão média a consumir (PMeC) é dada pela relação PMeC = C/Yd para diferentes níveis
de renda. A PMeC decresce continuamente à medida que aumenta a renda, com o detalhe de que C
aumenta menos do que proporcionalmente aos aumentos de Yd, pelo fato de β estar entre 0 e 1.
Temos que:
Logo, C/ Yd = α / Yd + β Yd / Yd.
PMeC = α / Yd + PMgC, e conclui-se que PMe > PMg. Essa simples demonstração já foi solução para
questões aparentemente complexas do modelo keynesiano simplificado.
Observação
Y = α + βX, 0<β<1
Onde:
Y = despesa de consumo;
X = renda.
16
ECONOMETRIA
Aqui, α e β são conhecidos como parâmetros do modelo. São o intercepto (que representa o ponto
em que a reta regressora corta o eixo dos ys, quando x = 0) e a declividade (que representa a inclinação
da reta regressora e é chamada de coeficiente de regressão ou coeficiente angular). Além disso, temos
que, para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta unidades.
• Segunda: a propensão média a consumir cai quando a renda aumenta (PMeC declinante).
β = PMgC
1
Renda X
Observação
• Contínuos: as variáveis têm valores que variam continuamente ao longo do tempo de simulação.
Equações fornecem o valor das variáveis em todos os instantes de tempo. Exemplos de modelos
contínuos: reações químicas, circuitos eletrônicos, modelos econométricos.
17
Unidade I
E=VxT
Onde:
X1 X2 X3 X
18
ECONOMETRIA
X1 X2 X3 X
Espera-se que o modelo estabeleça relações entre variáveis. Trataremos de dados exclusivamente
com relações estocásticas. Portanto, o modelo econométrico de interesse da função consumo não
pode ser puramente matemático, pressupondo que a relação entre as variáveis (consumo e renda) seja
determinística ou exata.
As relações sociais e de conteúdo econômico no contexto geral não são exatas; elas absorvem
um conceito complexo que trata de um conjunto de interações que se ligam com relacionamentos
de conteúdo jurídico, político, ético e ideológico, eminentemente sociais. Algumas dessas variáveis
que influenciam a compra (consumo) podem ser retratadas através de quatro fatores: culturais,
sociais, pessoais e psicológicos.
Partimos da ideia de que as relações entre duas variáveis podem ser afetadas pela introdução de
uma ou mais variáveis. Espera-se, com isso, que a compreensão dessa relação possa ser enriquecida
e aprofundada. Assim, ao se examinar o alcance das significações possíveis dessas relações e estudar
os fatores do porquê da existência dessas relações, as condições em que se manifestam as relações
e os problemas que advêm das influências conjuntas, o propósito é o de explicar, especificar a
relação, tornando-a mais significativa e/ou mais precisa.
Caso se obtenha a amostra de 700 famílias, espera-se que o comportamento dos consumidores não
seja linear, pois é caracterizado pelas atividades mentais e emocionais que ocorrem no momento da compra
e do uso – ou seja, não se comportarão de forma exatamente linear e podem até seguir uma tendência,
ditada pelos empresários, por meio de práticas de publicidade, sistemas de crédito, programas de expansão e
constituição de monopólios e oligopólios, resultando, muitas vezes, em concentração do poder econômico.
Em geral, definem-se para o modelo variáveis de entrada e variáveis de saída, que espelham as
interações do sistema com o Universo (veja a figura a seguir). O que se necessita ao elaborar um modelo
é descobrir princípios gerais que proporcione conhecimentos úteis da realidade econômica.
19
Unidade I
Espera-se que o modelo estabeleça relações entre essas variáveis. Para essa classe de sistema (função
de consumo keynesiana), é conveniente o seguinte modelo:
Xi Variáveis Variáveis Yi
de entrada Modelo econométrico
de saída
Estamos criando um modelo toda vez que tentamos explicar um conjunto complexo de
comportamentos, fenômenos e resultados empregando algumas variáveis explicativas e estabelecendo
relações entre elas.
Os modelos não visam captar toda a complexidade dos comportamentos, eles são criados para
retirar os fatores do acaso e da idiossincrasia (característica comportamental peculiar), de tal forma que
o foco recaia sobre os princípios gerais desenvolvidos.
Assim, um modelo econômico pode ser definido como uma expressão matemática de uma
determinada teoria econômica.
Y = α + βX + e, 0 < β < 1
Onde:
Y = despesa de consumo;
X = renda.
Por sua vez, e é o termo de perturbação e pode representar todos os fatores que afetam o consumo,
mas que não são considerados explicitamente (podem assumir valores positivos ou negativos, também
conhecidos como termo de erro estocástico ou perturbação estocástica). A equação anterior é um exemplo
de modelo econométrico (de regressão linear simples). O modelo é representado na figura a seguir:
Y Desvios
Consumo +
– Modelo: Y = α + βX + e
Desvios positivos (+) (reta ajustada)
+
–
+
–
e +
–
Desvios negativos (-)
X
Renda
Em resumo, o modelo aceita que o consumo se relaciona linearmente com a renda, mas a relação
entre ambos não é exata, estando sujeita a variação individual.
Observação
É essa teoria (keynesiana) que, em geral, nos diz qual variável é causa e
qual variável é efeito.
Para obter os valores numéricos, precisamos de dados. Os dados se referem a vários indivíduos? Ou
eles se referem a um mesmo país, mas em diversos espaços de tempo? As respostas a essas questões são
de extrema importância para a nossa análise econométrica. A estrutura dos dados econômicos utilizada
em Econometria é basicamente de três tipos:
• Séries temporais: conjunto de observações e valores que uma variável assume em diferentes
momentos. É o conjunto de dados sequenciais observados de uma mesma variável ao longo do
21
Unidade I
tempo (em intervalos de tempo). Exemplo: o consumo agregado no Brasil em diversos anos, os
retornos diários da Bovespa ou a taxa de desemprego mensal. Os dados são assumidos como
estacionários, a variância e a média não se alteram sistematicamente.
• Dados de corte transversal (cross-section): dados de variáveis coletadas num mesmo instante de
tempo (num único momento). Estudos transversais são apropriados para descrever características
das populações no que diz respeito a determinadas variáveis, e os seus padrões de distribuição
podem, também, ser utilizados para descrever associações entre variáveis. Exemplos: peso de
indivíduos selecionados aleatoriamente e num determinado instante de tempo ou PIB dos países
emergentes no primeiro trimestre de 2016. No exemplo dado, poderíamos observar o consumo e a
renda de diversas famílias num mesmo mês ou também o consumo agregado e a renda agregada
de diversos países num mesmo ano. Os dados apresentam problemas da heterogeneidade (alguns
são grandes demais e outros são pequenos demais).
• Dados em painel: consiste na observação de n entidades para dois ou mais períodos de tempo.
Combina características de séries temporais com dados em corte transversal permitindo o controle
da heterogeneidade presente nos elementos e são amplamente utilizados em estudos econométricos
e nas ciências sociais aplicadas. Há dados combinados, tanto de séries temporais como de corte, em
que temos uma série de tempo para cada unidade de corte transversal. Exemplos: consumo agregado
dos diversos estados brasileiros ao longo de vários anos, taxa de desemprego semestral dos países da
América Latina ou PIB trimestral dos municípios do estado de São Paulo nos últimos 15 anos.
Observação
Nesta fase inicial, que permite conhecer as caraterísticas das informações, devemos selecionar os
principais indicadores para mostrar as principais medidas estatísticas dessa amostra. Além de utilizar
esses dados, é necessário elaborar um box plot, gráfico que permite a visualização de como esses dados
estão distribuídos na amostra. Isso torna possível perceber se há a presença de outliers, o que gera uma
maior segurança para a construção dos modelos de regressão.
22
ECONOMETRIA
Observação
Dando início ao trabalho de criação do modelo, a primeira etapa consiste em analisar a matriz de
correlação das variáveis. Nessa matriz, observa-se entre todas as variáveis independentes selecionadas
a que possui a maior correlação com a variável dependente. Essa variável de maior correlação com a
variável a ser explicada (Y) é que deverá ser selecionada para a construção da equação de regressão
usando apenas uma variável independente.
Saiba mais
No exemplo a seguir, vamos utilizar dados mensurados no tempo (séries de tempo ou time series). A
ideia é construir um modelo de regressão para o período anual de 1996 a 2014 do Brasil relacionando
duas variáveis: renda (X) e consumo (Y).
Com base na tabela a seguir, elaborada a partir de diversos dados apresentados pela Coordenação
de Contas Nacionais da Diretoria de Pesquisas do IBGE, construímos um diagrama de dispersão entre as
variáveis renda (X) e despesa de consumo (Y):
23
Unidade I
A variável Y corresponde às despesas de consumo das famílias agregado (isto é, para a economia em
geral), e a variável X, ao produto interno bruto (PIB) (um indicador de renda agregada), ambos medidos
em bilhões de reais a preços constantes de 1995.
220
Despesa de consumo - R$ (bilhões)
200
180
160
140
120
100
150 200 250 300 350
Renda - R$ (bilhões)
O que se espera é que os gastos de consumo estejam diretamente relacionados com seus rendimentos.
Os dados estão apresentados no gráfico anterior, o que supõe, de modo razoável, a existência de uma
“relação linear” entre essas duas variáveis.
24
ECONOMETRIA
Com base no diagrama de dispersão, temos uma interpretação subjetiva da existência de correlação
entre duas variáveis, mas, pelo cálculo do coeficiente de correlação (r), temos uma maneira mais precisa
de mensuração, conforme fórmula a seguir:
n∑xy − ∑x ∑y
=r − 1 ≤ r ≤ +1
n∑x −2
( ∑x ) n∑y − ( ∑y )
2 2 2
Observação
A distribuição normal bivariada é uma distribuição de probabilidades com uma função densidade de
probabilidade f(x,y) para X e Y, tal que:
• X e Y apresentam, cada uma, distribuição normal com médias µX e µY e variâncias σ2X e σ2Y,
respectivamente;
Onde:
Com os dados observados (xi, yi), desejamos quantificar o grau de associação. Para isso estimamos ρXY.
Para facilitar o cálculo do coeficiente de correlação estimado (r), podemos utilizar uma tabela, com
base em dados do IBGE:
25
Unidade I
n∑xy − ∑x ∑y
r=
n∑x2 − ( ∑x )2 n∑y2 − ( ∑y )2
19 × 698.662,81 − 4.493,20 × 2.847,00
r ≅ 0,9907
19 × 1.098.893,80 − ( 4.493,20) × 19 × 444.685,02 − ( 2.847,00)
2 2
Existe uma forte correlação positiva entre renda (X) e consumo (Y). À medida que aumenta a renda,
crescem também as despesas de consumo.
26
ECONOMETRIA
de variável dependente. As variáveis utilizadas para elaborar a previsão são chamadas de variáveis
independentes. A análise de regressão também permite: identificar o tipo de relação matemática
que existe entre uma variável dependente e uma variável independente; quantificar o efeito que
alterações na variável independente exercem sobre a variável dependente; definir um valor adequado
para os parâmetros do nosso modelo; avaliar as propriedades estatísticas dessas estimativas, bem como
identificar observações incomuns.
Como proposta da estimativa do modelo econométrico com base na função consumo, vamos
discorrer sobre o modelo clássico, que é o da regressão linear simples. Com os dados da tabela, utilizamos
o modelo de regressão linear simples (MRLS), na qual uma única variável independente numérica (X:
renda) é utilizada para prever a variável dependente numérica (Y: consumo).
Yi = α + βXi + ei
• Linearidade:
Yi = α + βXi + ei
Significa dizer que não podemos utilizar modelos da forma Yi = α + Xiβ + ei.
• Exogeneidade:
E[ei | xi] = 0
• Homocedasticidade:
27
Unidade I
O erro de uma observação não pode estar correlacionado com o erro de outra observação. Portanto,
a covariância é igual a zero (o resultado em qualquer experimento não tem efeito no termo do erro de
qualquer outro experimento). Eles devem ser independentes.
Os dados são usados para estimar α e β, isto é, ajustar o modelo aos dados, para:
• usar a relação para predizer uma nova resposta Y0 para um dado valor de X0 (não incluído
no estudo);
• calibração:
— capacidade de predição de novas observações; pode ser feita usando uma nova amostra e
comparando os valores estimados com os observados.
— dado um valor de Y0, para o qual o correspondente valor de X0 é desconhecido, estimar o valor
de X0.
Lembrete
Outra questão envolvendo as variáveis observadas são as unidades de medida. Quando multiplicamos
os valores observados por uma constante k (exemplo: se a renda for medida em reais e depois quisermos
medi-la em milhares de reais, bastará dividir os valores por 1.000. Neste caso, k = 1/1.000), temos que
adotar as seguintes regras:
28
ECONOMETRIA
Existem alguns fenômenos que podem ser representados por um modelo linear depois de sofrer alguma
transformação de variáveis. A utilização do diagrama de dispersão pode nos auxiliar a decidir qual a melhor
transformação indicada para cada fenômeno em estudo – portanto, estamos optando por regressão com
variáveis transformadas. Exemplo: função exponencial ou semilogarítmica I: Y = a . bx (forma original, não
linear) aplicando a transformação indicada ln Y = Ina + blnX (forma linearizada por transformação),
tendo como restrições das variáveis na forma transformada Y>0 e X>0.
Seria desejável a existência de um método que levasse sempre a bons estimadores. Infelizmente, não
existe esse método geral aplicável a todas as situações. Entre os principais métodos de estimação (o dos
momentos, o da máxima verossimilhança e o dos mínimos quadrados), o mais utilizado é o estimador de
mínimos quadrados ordinários (MMQO), que tem como objetivo minimizar a soma do quadrado dos erros.
O critério dos mínimos quadrados é o seguinte: a “linha que melhor se ajusta” é aquela que minimiza
a soma dos desvios quadrados dos pontos do diagrama dos pontos da linha reta (desvios estes que são
medidos verticalmente).
N
Minimizar ∑(Yi − Ŷi )2
i=1
Y
Linha dos mínimos quadrados
Yi Y^ = a + bX
Desvio: Yi - Y^i
Y^i
Valores ajustados
X
Xi
Entre alguns métodos que existem para estimar os parâmetros a e b, o mais refinado é o método dos
mínimos quadrados (MMQ), que consiste em tornar mínima a soma dos desvios em torno da reta estimada.
Esse método encontra a reta que minimiza a distância vertical entre cada observação (ponto) e a própria reta.
Designando-se por ei o desvio entre um valor observado yi e um valor ajustado y^i, isto é, ei = (yi - y^i),
a e b são os valores que minimizam a soma de quadrados:
29
Unidade I
n n
( ) ∑ [ Yi − (a + bxi )]2
2
Minimizar ∑ Yi − Yˆi=
=i 1 =i 1
Sxy
b=
Sxx
a =y − bx =
∑y − b ∑x
n n
em que calculamos:
( ∑xi )( ∑yi )
=
Sxy ∑xiyi − n
Sxy =
698.662,81 −
( 4.493,20 × 2.847,00) =
25.392,26
19
( ∑x i ) 2
=
Sxx ∑i x2 −
n
Sxx = 1.098.893,80 −
( 4.493,20)
2
= 36.322,95
19
( ∑y i ) 2
=
Syy ∑i y2 −
n
Syy =444.685,02 −
( 2.847,00)
2
=18.084,55
19
30
ECONOMETRIA
a= y − bx =
∑y − b ∑x = 2.847,00
− 0,6991 ×
4.493,20
≅ −15,48
n n 19 19
y^ = - 15,48 + 0,6991x
• Os estimadores de MQO são não viesados, isto é, o valor esperado de cada estimador é igual
ao parâmetro que se deseja estimar: E(b0) = β0 e E(b1) = β1. Não viciado ou imparcial é uma
propriedade que assegura que, em média, o estimador é correto.
• Estimadores que são funções lineares e não são viesados – ou seja, os estimadores MQO – são
mais precisos (isto é, as suas distribuições amostrais têm a menor variância possível) do que
quaisquer outros estimadores pertencentes à classe dos estimadores não tendenciosos. Porém, o
teorema nada nos diz se o estimador de MQO é melhor do que um estimador não linear.
Um caso especial em que o intercepto da reta é 0 (zero) passa pela origem, isto é, α = 0. A equação
da reta se reduz a:
Yi = βXi + ei
O estimador para β (coeficiente angular da reta ou inclinação) expressa a taxa de mudança em Y, isto
é, a mudança em Y quando ocorre a mudança de uma unidade em X. Ele indica a mudança na média da
distribuição de probabilidade de Y por unidade de acréscimo em X:
N
∑ xi yi
β = iN=1
∑ i=1xi2
Neste caso específico, devemos considerar:
31
Unidade I
• Não se garante que a reta ajustada passe pelo ponto médio (X, Y).
σ2
()
Var β = N
∑ i=1xi2
N
σˆ 2 ∑ u
= i=1
ˆ i2
N −1
N
Podemos ter ∑ ui ≠ 0 .
i=1
Portanto, estamos interessados na relação entre as duas variáveis (Y: consumo e X: renda). Observamos
pares de valores X e Y em cada amostra e vamos usá-los para dizer alguma coisa sobre a relação:
y^ = - 15,48 + 0,6991x
Nota-se que as estimativas dos parâmetros dão um conteúdo empírico para a função consumo.
Dados observacionais: geralmente X e Y são variáveis aleatórias, e o acento circunflexo indica
uma estimativa.
Observação
A diferença entre estatística e estimativa é que a estatística é uma variável aleatória, enquanto a
estimativa é um particular valor dessa variável aleatória.
32
ECONOMETRIA
E(Y/Xi) = f(Xi)
A média condicional é uma função de Xi em que f(Xi) indica alguma função da variável explicativa Xi.
Essa equação é conhecida como função de regressão populacional (FRP) (ou equação de regressão
linear) de duas variáveis. Como uma primeira aproximação ou uma hipótese de trabalho, podemos supor
que FRP E(Y/Xi) seja uma função linear de Xi, do tipo:
E(Y/Xi) = β1 + β2Xi
Onde:
β1: intercepto;
Especificação estocástica:
Yi = β1 + β2Xi + ui
Onde:
ui é uma variável aleatória não observável que pode assumir valores positivos ou negativos, também
conhecida como termo de erro estocástico ou perturbação estocástica.
Já a função de regressão amostral (FRA), na maioria das situações práticas, é somente uma amostra
de valores Y correspondentes e alguns Xs fixos. A nossa tarefa é estimar a FRP com base nas informações
da amostra.
Y
Y^i = β^ 1 + β^ 2Xi
Xi
Onde:
β^ 1: estimador de β1;
β^ 2: estimador de β2.
Y^i = β^ 1 + β^ 2Xi + ui
População
(universo de análise)
Yi = α + βXi + ei (FRP)
Parâmetros: α, β
Estimação de
parâmetros
Amostra
(dados observados)
Y^i = α^ + β^ Xi + ei (FRA)
Estimados: α^ , β^
Por essa estimativa, podemos ver que o coeficiente de declividade é de aproximadamente 0,70, o que
sugere que um aumento de um real na renda real provocará em média um aumento de 0,70 centavos
na despesa real de consumo. Dissemos em média porque a relação entre o consumo e renda é inexata,
como mostra a reta de regressão. Veja a figura a seguir, conforme dados do IBGE:
220
Despesa de consumo - R$ (bilhões)
y = 0,6991x - 15,477
200 R2 = 0,9816
180
160
140
120
100
150 200 250 300 350
Renda - R$ (bilhões)
34
ECONOMETRIA
3 TESTE DE HIPÓTESES
Na hipótese nula, os valores de x não têm qualquer relacionamento com os valores de y. Veja:
H0 : β = 0
H0 : β ≠ 0 (teste bilateral)
A hipótese nula é confirmada pela equação Y^i = a +bXi + ei quando se constata que não haverá
qualquer relação entre x e y se o verdadeiro valor do coeficiente angular for zero.
Como
b−β
t=
∑ ( yi − yˆ ) / (n − 2)
2
∑ ( xi − x )
2
a equação tem distribuição t com n - 2 graus de liberdade. Decorre que, se β = 0, então a estatística será:
b
t=
∑ ( yi − yˆ ) / (n − 2)
2
∑ ( xi − x )
2
y^ = - 15,48 + 0,6991x
Testamos a existência do efeito de regressão entre duas variáveis em estudo. A hipótese nula é de
não existência de regressão, enquanto a hipótese alternativa é aquela que contempla a regressão. Assim,
o teste de hipótese será delineado:
35
Unidade I
Hipótese nula H0 : β = 0
b
tobs =
∑ ( yi − yˆ ) / (n − 2)
2
Valor da estatística de teste
∑ ( xi − x )
2
No teste para β, calculamos a região crítica (RC) ao nível de significância de 5%. Podemos calcular o
valor dessa estatística conforme a tabela a seguir, baseada em números do IBGE:
Renda Consumo
Ano xi Yi Y^i ei (Yi - Y^i)2 (Xi - X)2
1996 180,4 116,1 111 5,46 29,86 3145,44
1997 186,5 119,6 115 4,70 22,09 2498,42
1998 187,2 118,7 115 3,31 10,96 2428,93
1999 188,0 119,2 116 3,25 10,57 2350,72
2000 196,3 124,0 122 2,25 5,06 1614,77
2001 199,0 125,0 124 1,36 1,85 1405,07
2002 205,1 126,6 128 -1,30 1,70 984,97
2003 207,4 125,9 130 -3,61 13,03 845,89
2004 219,4 130,8 138 -7,10 50,40 291,87
2005 226,4 136,6 143 -6,19 38,35 101,69
2006 235,4 143,9 149 -5,18 26,88 1,18
2007 249,6 153,0 159 -6,01 36,13 172,02
2008 262,4 162,9 168 -5,06 25,59 671,63
2009 262,0 170,2 168 2,52 6,35 651,06
2010 281,8 180,8 182 -0,72 0,52 2053,52
2011 292,8 189,4 189 0,19 0,04 3171,47
2012 298,4 196,0 193 2,87 8,26 3833,56
2013 307,4 202,8 199 3,38 11,44 5029,05
2014 307,7 205,5 200 5,87 34,49 5071,69
∑ 4.493,20 2.847,00 2.847,00 0,00 333,5904 36,322,9453
36
ECONOMETRIA
b 0,6991
=t = ≅ 30,08
∑ ( yi − yˆ ) / (n − 2) 333,59 /17
2
36.322,95
∑ ( xi − x )
2
Para um teste bilateral no nível de significância de 5%, o valor crítico de uma distribuição t com
17 graus de liberdade é 2,11. Como 30 está na região de rejeição, bem acima do valor crítico, podemos
rejeitar com segurança a hipótese nula de que o coeficiente angular seja zero.
α α
2 2
-2,11 0 +2,11 t
Vamos compreender os três tipos de variação em torno de uma reta de regressão. São eles:
• Variação total: é a soma dos quadrados das diferenças entre o valor y de cada par ordenado e a
média de y.
37
Unidade I
• Variação explicada: é a soma dos quadrados das diferenças entre cada valor previsto de y e a
média de y (explicada pela relação X e Y).
• Variação inexplicada: é a soma dos quadrados das diferenças entre cada valor de y de cada par
ordenado e cada valor de y previsto correspondente (não pode ser explicada pela relação x e y, e
isso ocorre devido ao acaso ou a outras variáveis).
y
{
(xi; yi)
Desvio
{ inexplicado
yi - y^i
Desvio total
yi - y {
(xi; y^i)
y Desvio
explicado
(xi; y)
y^i - y
x
x
Uma propriedade importante é a de que a variabilidade total poderá ser decomposta em duas partes:
• uma, devida aos possíveis efeitos aleatórios (não controlados) que recaiam sobre cada experimento,
que será definida como variabilidade residual;
Podemos conduzir a análise de variância da regressão linear simples conforme a tabela a seguir:
38
ECONOMETRIA
Saiba mais
∑ ( yˆ i −=
y)
2
=r 2 SQReg b2 Sxx
= =
( 0,6991)2 × 36.322,95 ≅ 0,9816
∑ ( yi − y )
2 SQRTot Syy 18.084,55
Teremos uma relação de quanto o modelo de regressão está sendo útil para explicar toda a
variabilidade que aparece em cada uma das observações (é a porcentagem da variância total de y que
é explicada pela variável x).
39
Unidade I
Observação
O modelo de regressão linear simples mostra que as respostas Yi são oriundas de uma distribuição de
probabilidades com média E(Yi) = α + βXi e cujas variâncias são σ2, a mesma para todos os valores de X.
Além disso, quaisquer duas respostas Yi e Yj não são correlacionadas.
σ2 σ2
Var β
= () =N
∑ i=1(xi − x)2 N . Var(x)
Observação
σ2
Var ( α =
)
N
()
+ x 2 Var β ≅ 82,08 + 18.715.790,1 × 0,000473 ≅ 8.935
40
ECONOMETRIA
σ2
=
∑ i=1=
(ei )2 333,59
≅ 19,6229
N−2 17
s2 s2 19, 6229
Var(b ) = = = @ 0, 000544
å Ni=1(xi - x )
2 N . Var( x ) 19 x 1, 91173
σ2
Var ( α =
)
N
()
+ x 2 Var β ≅ 1,03263 + 55.922,78 × 0,00054 ≅ 31,24
Existem várias técnicas para analisarmos os resíduos, mas, nesta fase introdutória, iremos ressaltar
uma representação gráfica que é obtida plotando os pares (xi, ei). Obtido o gráfico dos resíduos,
precisamos saber como identificar possíveis causas que comprometem a confiabilidade do modelo. A
situação ideal para os resíduos é estarem distribuídos aleatoriamente em torno do zero, sem nenhuma
observação muito discrepante.
• descobrir se as hipóteses do modelo de regressão linear são válidas para o caso em questão;
• analisar se a correlação entre as duas variáveis é ou não forte, na qual utilizamos a relação
SQReg ou (1 − SQRes ) .
SQT SQT
41
Unidade I
Tabela 8 – Resíduos
Ano xi Yi Y^i ei
1996 180,4 116,1 111 5,46
1997 186,5 119,6 115 4,70
1998 187,2 118,7 115 3,31
1999 188,0 119,2 116 3,25
2000 196,3 124,0 122 2,25
2001 199,0 125,0 124 1,36
2002 205,1 126,6 128 -1,30
2003 207,4 125,9 130 -3,61
2004 219,4 130,8 138 -7,10
2005 226,4 136,6 143 -6,19
2006 235,4 143,9 149 -5,18
2007 249,6 153,0 159 -6,01
2008 262,4 162,9 168 -5,06
2009 262,0 170,2 168 2,52
2010 281,8 180,8 182 -0,72
2011 292,8 189,4 189 0,19
2012 298,4 196,0 193 2,87
2013 307,4 202,8 199 3,38
2014 307,7 205,5 200 5,87
∑ 4.493,20 2.847,00 2.847,00 0,00
4,00
2,00
2009
Resíduos
0,00
100 150 200 250 300 350
-2,00 Renda
-4,00
-6,00
-8,00 2004
42
ECONOMETRIA
Analisando as hipóteses citadas anteriormente a serem cumpridas pelo modelo, destacamos, com
base no comportamento dos resíduos (conforme o gráfico anterior), o pressuposto da homocedasticidade
(variância do erro ser constante), que não está sendo cumprido. Tal procedimento é importante para se
realizar inferências em relação aos parâmetros α e β. Havendo problemas na não confirmação da hipótese
de homocedasticidade, podemos utilizar, por exemplo, as transformações de dados, isto é, utilizar uma
segunda variável independente X2 no modelo assumindo os valores de X1 elevado ao quadrado. Ficaríamos,
portanto, com um modelo Y = α + β1X1 + β2X2, onde X2 = (X1)2, o que corresponde a uma função polinomial
de ordem 2 representada pela equação Y = α + β1X1 + β2X12, conforme apresentado a seguir:
α β1 β2
1996 - 2014 Yi = 135,61 - 0,5815.X1 + 0,0026.X12 R2=0,9957
Se = 2,21 (6,24) (-3,27) (7,22) R2ajustado=0,9951
(estatística t entre parênteses) F= 1.837,28
Resíduos
5 5
0 0
100 200 300 400 20.000 40.000 60.000 80.000 100.000
-5 Renda -5 Renda2
Nota-se também, através do comportamento dos resíduos, que podemos desmembrar a base de
dados em dois ciclos distintos (contração e expansão do consumo em relação à renda), conforme
indicado nos gráficos a seguir.
Através do gráfico superior, de período completo (1996 a 2014), conseguimos distinguir os dois
ciclos apresentados nos demais:
• I ciclo: contração do consumo em relação à renda (1996 a 2003), apresentando uma PMgC
de 0,40, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de
37 centavos na despesa de consumo.
• II ciclo: expansão do consumo em relação à renda (2004 a 2014), apresentando uma PMgC
de 0,83, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de
83 centavos na despesa de consumo.
43
Unidade I
128
126
y = 0,3966x - 45,048
124 R2 = 0,9504
Consumo 122
120
118
116
114
170 175 180 185 190 195 200 205 210
A) Renda
y = 0,8275x - 51,231
215 R2 = 0,9937
195
Consumo
175
155
135
115
210 230 250 270 290 310 330
B) Renda
220
y = 0,6991x - 15,477
200 R2 = 0,9816
180
Consumo
160
140
120
100
C) 170 190 210 230 250 270 290 310 330
Renda
Nota-se que a partir de 2004, no período em análise (1996-2014), o consumo no Brasil cresceu
muito. Uma das teorias que a economia nos oferece é a da propensão marginal a consumir (PMgC),
que analisa o que acontece com o consumo quando há um acréscimo na renda. Segundo essa teoria,
44
ECONOMETRIA
as duas coisas não crescem na mesma proporção. A partir de certo ponto, a renda pode até continuar
aumentando que o consumo tende a desacelerar.
A propensão marginal a consumir da chamada classe média brasileira, a maioria da nossa população,
é muito alta. Quando as condições de renda melhoram, naturalmente ela vai saciar a sua demanda
reprimida – aparenta estarmos no limite em que o aumento de consumo ainda é proporcional ao aumento
da renda. O consumo consciente, pelo modo de ser dos brasileiros, extremamente imediatista, voltado
ao desfrute do momento, foi deixado de lado. As pessoas não aprenderam a transformar aumento de
salário em poupança, em investimento para o futuro.
Nessa análise da variável residual da economia brasileira, no período de 1996 a 2014, além do
conhecimento teórico, é importante uma análise das especificidades em que as variáveis envolvidas
(Y: endógena e X: exógena) se relacionam. Devemos explicar se:
Por exemplo: os dados econométricos (no caso, o comportamento da variável residual) sugerem a
resposta de algumas questões (isto é, os dados perguntam):
• A crise de consumo, descrita dessa forma, é uma crise econômica ou se trataria de um período de
priorização do investimento em relação ao consumo?
No caso em questão, o que se observou foi a tendência de poupar ou de consumir, e sua variação no
tempo. “Crises” no consumo na verdade indicariam maior tendência a poupar no período em questão.
Lembrete
Friedman (1953, p. 7), ao esclarecer o significado do material empírico para as teorias, afirma que
“[...] a evidência empírica é vital em duas fases diversas, embora intimamente associadas: na fase de
elaboração das hipóteses e na do teste de sua validade” – portanto, para descobrir se nossas estimativas
obtidas satisfazem as expectativas da teoria que estamos testando. Segundo Hill, Griffithis e Judge
(2003), uma teoria ou hipótese que não seja verificável por meio de evidência empírica não pode ser
admitida como parte da investigação científica.
A economia positiva independe, em tese, de qualquer posição ética especial ou de juízos normativos.
Ela trata “do que é”, e não “do que deveria ser”. A tarefa dessa economia positiva é a de provar um sistema
45
Unidade I
de generalizações passível de ser utilizado para fazer previsões corretas acerca das consequências de
qualquer alteração das circunstâncias. O desempenho de uma tal economia será ajuizado em termos da
precisão e da experiência (FRIEDMAN, 1953, p. 2).
Verifica-se que o coeficiente β é menor do que um, sendo portanto concordante com a teoria. Temos
que verificar se o parâmetro β = 0,6991 é estatisticamente abaixo de um e diferente de zero (β ≠ 0), pois
se β for zero, os valores de x (renda) não têm relação com os valores de Y (consumo). Para tal, utilizamos
inferência estatística (teste de hipóteses).
Por exemplo, suponha uma expectativa de um PIB de 297 bilhões de reais para o ano seguinte.
Qual a previsão de consumo em um ano a ser projetado? Se acreditarmos que a função consumo irá se
manter, teremos:
y^ = - 15,48 + 0,6991x
Para o próximo ano, o governo pretende anunciar um plano de aumento dos tributos para pessoa
física, a retomada do imposto sobre operação financeira (IOF). Qual será o efeito disso na economia? Um
modelo econométrico pode se propor a estimar tais mudanças.
Observação
Ao utilizarmos um modelo de regressão para fins de previsão, precisamos considerar somente o intervalo
relevante da variável X: renda (inclui todos os valores, desde o menor até o maior valor de X que foram
utilizados no desenvolvimento do modelo de regressão). Há duas situações ao prever Y: consumo para um
determinado valor de X: renda, pois podemos interpolar dentro dos limites desse intervalo relevante de
valores de X, mas podemos extrapolar além do intervalo dos valores de X. Ao utilizarmos a variável X: renda
(em bilhões de reais), ela varia desde 180 até 308 (vide tabela de resíduos anteriormente apresentada). Por
conseguinte, devemos prever os consumos anuais somente para as rendas entre 180 e 308 bilhões de reais. É
necessária muita atenção na utilização da análise de regressão ao extrapolar (ir além do intervalo relevante),
pois quanto maior for a diferença (distância) entre x e x, maior será o intervalo de previsão.
Em geral, um modelo de regressão pode ser usado com alguma confiança dentro da gama de valores X
que participou para o cálculo dos parâmetros de regressão. Se sairmos um pouco do intervalo de X, estaremos
extrapolando o modelo. Uma extrapolação para valores de X pouco afastados do intervalo normalmente
não apresenta problemas, mas para valores longe do intervalo de X raramente são satisfatórias.
46
ECONOMETRIA
Podemos calcular previsões para novas observações mediante a construção de intervalos de previsão.
Para um novo valor da variável independente x, podemos prever em que intervalo de valores
esperamos encontrar y. Um intervalo de previsão para uma observação futura, com (1 – α) × 100% de
confiança, é dado por:
1 (x − x)2
IP ( 95% ) : Yˆ ± t α
. S 1 + +
n−2; n Sxx
2
1 (297 − 236,48)2
IP ( 95% ) : 192,15 ± 2,11. × 4,43 1 + +
19 36.322,95
Interpretação: para um dado x, prevê-se que y pertença ao intervalo indicado (1 – α) × 100%, isto é,
95% das vezes – chamamos intervalo de previsão ou intervalo de confiança [182,11; 202,19].
Nessa mesma fórmula, observa-se também que o multiplicador é determinado pelo inverso da
propensão marginal à poupança (1 - β) = S M = 1/S. Logo, quanto menor for o seu valor, considerando
ser este um número compreendido entre 0 e 1, maior será o multiplicador.
Que uma demanda por um paletó implica uma demanda por tecido; que
uma demanda por tecido implica uma demanda por fios e linhas, e também
por lã; que os serviços de fazendeiros, comerciantes, engenheiros, mineiros,
trabalhadores no transporte, secretários, estão todos envolvidos – esse é o
ABC da ciência econômica (KEYNES, 1929, p. 105-106).
47
Unidade I
Com base na PMgC de 0,6991, obtemos 3,32, como multiplicador. Ou seja, com um acréscimo de um
real no investimento, obtemos um aumento de quase 3,5 vezes na renda.
Suponha que o governo acredite que um nível de gastos de 225 bilhões de reais manterá o
desemprego em 7,5%:
y^ = - 15,48 + 0,6991x
X = 344 (aproximadamente)
Ou seja, um nível de renda de R$ 344 bilhões, com uma PMgC = 0,6961, produzirá um gasto de
R$ 240,5 bilhões.
Assim, o governo pode, por meio de políticas monetária e fiscal, manipular a variável de controle X
(PIB) para produzir o nível desejado de Y (consumo).
A atitude prospectiva significa olhar longe, preocupar-se com o longo prazo; olhar
amplamente, tomando cuidado com as interações; olhar a fundo, até encontrar
os fatores e tendências que são realmente importantes; arriscar, porque as visões
de horizontes distantes podem fazer mudar nossos planos de longo prazo; e levar
em conta o gênero humano, grande agente capaz de modificar o futuro (GASTÓN
BERGER, 1957 apud MARCIAL; GRUMBACH, 2007, p. 28).
Para elaboração das projeções, utiliza-se uma combinação de modelos econométricos e técnicas
de construção de cenários. Enquanto o modelo econométrico responde pela estimativa das variáveis
endógenas, as técnicas de cenários e as avaliações qualitativas permitem traçar hipóteses para o
comportamento das variáveis exógenas.
48
ECONOMETRIA
Observação
Resumo
49
Unidade I
Exercícios
Questão 1. (Enade 2006) Considere a tabela a seguir, advinda de uma análise de regressão associada
à função de consumo keynesiana
50
ECONOMETRIA
Tabela 9
R2 ajustado 0,2732
Número de
SQR 0,3016 120
observações
A) deve ser rejeitada a hipótese nula de que o intercepto da reta de regressão seja igual a zero.
B) deve ser rejeitada a hipótese nula de que o coeficiente angular da reta de regressão seja
igual a 0,45.
D) a estatística de Durbin-Watson deveria ser mais distante de 2 para que a não correlação dos
resíduos ficasse caracterizada.
A) Alternativa incorreta.
Justificativa: a análise de a hipótese nula do intercepto da reta de regressão (a) ser igual a zero
indica uma estatística de teste (estatística t) de -0,11. Por ser um número próximo de zero, não podemos
rejeitar a hipótese nula. Além disso, o valor obtido a = -0,005(46) pode ser nulo dentro do intervalo de
uma vez o desvio padrão. Logo, a hipótese não pode ser descartada.
51
Unidade I
B) Alternativa incorreta.
Obtivemos uma estatística t com um valor próximo a zero, o que não permite a rejeição da
hipótese nula.
Além disso, o valor obtido a = -0,4568(675) pode ser igual a 0,45 dentro do intervalo de uma vez o
desvio padrão. Logo, a hipótese não pode ser descartada.
C) Alternativa incorreta.
D) Alternativa incorreta.
Justificativa: para que não fique caracterizada a correlação entre os resíduos, o valor da estatística
Durbin-Watson tem de se aproximar de 2.
E) Alternativa correta.
Questão 2. (Enade 2015) Sabe-se que o aumento de anos de experiência em certas atividades
profissionais acarretam acréscimos salariais. Porém acredita-se que esses acréscimos sejam decrescentes
ao longo dos anos. Para estudar esse problema, foi obtida, a partir de uma amostra aleatória de 526
indivíduos, os dados de salário por hora (w), medidos em reais (R$), e a experiência (x), medida em anos
de experiência na profissão.
w 0 1x 2x2 u; u N 0, 2
52
ECONOMETRIA
wˆ 3, 73 0, 298x 0, 0061x2
0, 35 0, 041 0, 0009
Nessa expressão, a probabilidade exata do teste t para cada parâmetro estimado encontra-se,
respectivamente, entre parênteses (p-valor).
III – Ao serem representados graficamente os resultados acima, em que o salário por hora é função
da experiência, observa-se que, inicialmente, a experiência pode exercer uma influência crescente sobre
o salário, porém, após alguns anos, passa a ser decrescente.
A) I, apenas.
B) III, apenas.
C) I e II, apenas.
D) II e III, apenas.
E) I, II e III.
53
Unidade I
I – Afirmativa incorreta.
Justificativa: sempre é possível existir a rejeição. Para isso, basta que os resultados sejam maiores do
que o nível de significância. Com a hipótese de que a experiência não tem efeito sobre o salário ao longo
dos anos, qualquer resultado do teste t será maior do que a(0,05).
II – Afirmativa correta.
Justificativa: sempre é possível rejeitar o resultado. Para isso, basta que os resultados sejam maiores
do que o nível de significância. Com a hipótese de que a experiência não tem efeito sobre o salário ao
longo dos anos, qualquer resultado do teste t será maior do que o valor de , que, nesse caso, é 0,01.
Justificativa: a expressão de estimação é uma função do segundo grau com coeficiente negativo.
Isso significa que o vértice da parábola é o ponto de máximo, como pode ser observado na figura a
seguir, gráfico da função wˆ 3, 73 0, 298x 0, 0061x2 :
7,5
6,5
6
Salário por hora (w)
5,5
4,5
3,5
3
0 5 10 15 20 25 30 35 40
Experiência em anos (x)
Na figura anterior, é possível observar que o salário cresce com o tempo de experiência até que esse
tempo seja igual a 24 anos. A partir de 25 anos de experiência, o salário diminui.
54