Você está na página 1de 54

Econometria

Autor: Prof. Rubens Toledo Arakaki


Colaborador: Prof. Maurício Felippe Manzalli

Professor conteudista: Rubens Toledo Arakaki

Doutor em História Econômica pela Universidade de São Paulo – USP, bacharel em Ciências Econômicas pela
Pontifícia Universidade Católica de Campinas (PUC-Campinas) e bacharel em Estatística pela Universidade Estadual de
Campinas – Unicamp. É professor universitário desde 2000 e membro do Conselho Editorial da Revista de Economia
Política e História Econômica – REPHE. Tem atuado como analista nas áreas de Pesquisa de Mercado, Custos, Viabilidade
de Projetos, Planejamento e Gestão Empresarial, Análise Ambiental e Conjuntura Econômica. Trabalhou por 19 anos no
apoio de Planejamento Energético e tem cooperado em grupos especializados com publicações em revistas do ramo.
Na UNIP, desde 2010, ministra aulas nos cursos de graduação em Economia, Administração, Relações Internacionais,
Contabilidade, Turismo e Serviço Social.

Dados Internacionais de Catalogação na Publicação (CIP)

A659e Arakaki, Rubens Toledo.

Econometria. / Rubens Toledo Arakaki. – São Paulo: Editora


Sol, 2020.

192 p., il.

Nota: este volume está publicado nos Cadernos de Estudos e


Pesquisas da UNIP, ISSN 1517-9230.

1. Econometria. 2. Variáveis instrumentais. 3. Variáveis


defasadas. II. Título.

CDU 330.115

U505.43 – 20

© Todos os direitos reservados. Nenhuma parte desta obra pode ser reproduzida ou transmitida por qualquer forma e/ou
quaisquer meios (eletrônico, incluindo fotocópia e gravação) ou arquivada em qualquer sistema ou banco de dados sem
permissão escrita da Universidade Paulista.
Prof. Dr. João Carlos Di Genio
Reitor

Prof. Fábio Romeu de Carvalho


Vice-Reitor de Planejamento, Administração e Finanças

Profa. Melânia Dalla Torre


Vice-Reitora de Unidades Universitárias

Prof. Dr. Yugo Okida


Vice-Reitor de Pós-Graduação e Pesquisa

Profa. Dra. Marília Ancona-Lopez


Vice-Reitora de Graduação

Unip Interativa – EaD

Profa. Elisabete Brihy


Prof. Marcello Vannini
Prof. Dr. Luiz Felipe Scabar
Prof. Ivan Daliberto Frugoli

Material Didático – EaD

Comissão editorial:
Dra. Angélica L. Carlini (UNIP)
Dr. Ivan Dias da Motta (CESUMAR)
Dra. Kátia Mosorov Alonso (UFMT)

Apoio:
Profa. Cláudia Regina Baptista – EaD
Profa. Betisa Malaman – Comissão de Qualificação e Avaliação de Cursos

Projeto gráfico:
Prof. Alexandre Ponzetto

Revisão:
Lucas Ricardi
Juliana Mendes
Sumário
Econometria
APRESENTAÇÃO.......................................................................................................................................................7
INTRODUÇÃO............................................................................................................................................................8

Unidade I
1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS.................................................... 11
1.1 Fases da investigação econômica................................................................................................... 12
1.2 Formulação da teoria ou hipótese................................................................................................. 14
1.3 Especificação do modelo matemático do consumo............................................................... 16
1.4 Especificação do modelo econométrico do consumo............................................................ 19
1.5 Obtenção e preparação de dados................................................................................................... 21
2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)....................................................................... 23
2.1 Estimativa do modelo econométrico............................................................................................ 26
2.2 Método de estimação.......................................................................................................................... 29
2.3 Conceito de função de regressão populacional (FRP) e função de
regressão amostral (FRA)........................................................................................................................... 33
3 TESTE DE HIPÓTESES....................................................................................................................................... 35
4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA)......................... 37
4.1 O coeficiente de determinação (r2) ............................................................................................... 39
4.2 Análise de resíduos............................................................................................................................... 41
4.3 Previsão ou predição (utilização do modelo)............................................................................. 46
4.4 Multiplicador keynesiano da renda............................................................................................... 47
4.5 Uso do modelo para fins de elaboração de política econômica........................................ 48

Unidade II
5 MODELO DE REGRESSÃO LINEAR MÚLTIPLA (MRLM)....................................................................... 55
5.1 Hipóteses.................................................................................................................................................. 55
5.2 Covariância e coeficiente de correlação ..................................................................................... 64
5.3 Teste de hipótese para um coeficiente de correlação populacional................................ 66
5.4 Coeficiente de determinação (r2).................................................................................................... 68
5.5 Erro-padrão do coeficiente linear (ou do intercepto)............................................................ 73
5.6 Erro-padrão do coeficiente angular.............................................................................................. 74
5.7 Inferências sobre o coeficiente angular....................................................................................... 74
5.8 Teste de hipótese................................................................................................................................... 78
5.9 Intervalos de previsão.......................................................................................................................... 80
5.10 Anova (análise de variância)........................................................................................................... 82
6 AVALIAÇÃO DO CONTEÚDO INFORMACIONAL DOS RESÍDUOS.................................................... 84
6.1 Avaliando a homocedasticidade .................................................................................................... 92
6.2 Avaliando a normalidade................................................................................................................... 95
6.3 Intervalo de confiança para a regressão: duas alternativas................................................ 99
6.4 Variação em torno de uma reta de regressão.........................................................................101

Unidade III
7 ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO E INFERÊNCIA..............................................107
7.1 Testes para identificação de multicolinearidade....................................................................111
7.1.1 Teste de Farrar e Glauber.....................................................................................................................111
7.1.2 Teste da VIF (Variance Inflation Factor)........................................................................................ 112
7.1.3 Teste da Tolerance (TLk)........................................................................................................................113
8 DEMAIS ANÁLISES EM ECONOMETRIA..................................................................................................114
8.1 Quebras Estruturais e Variáveis Dummies.................................................................................114
8.2 Variáveis defasadas.............................................................................................................................136
8.3 Variáveis instrumentais.....................................................................................................................144
8.4 O básico da análise de regressão com dados de séries temporais ou
previsão de séries temporais..................................................................................................................155
APRESENTAÇÃO

Esta disciplina desenvolve o instrumental padrão para a estimação de modelos econométricos,


enfocando a aplicação de modelos de regressão linear múltipla e seus pressupostos básicos. Nesse sentido,
derivam-se os estimadores por mínimos quadrados ordinários e discutem-se todas as propriedades
inferenciais de tais modelos.

A construção de modelos é comumente utilizada em Econometria, e a sua correta interpretação é


fundamental para o bom entendimento da disciplina e da formação profissional do economista. Como
existem muitos modelos utilizados na ciência econômica, é necessário saber fazer, também, a distinção
entre os diversos modelos.

Apresentaremos conceitos básicos para o entendimento da abordagem teórico-prática e das


técnicas envolvidas na construção de modelos, sua especificação, estimação, verificação e previsão,
pois o trabalho econométrico necessita da Teoria Econômica como guia para determinar a direção
mais relevante e proveitosa na elaboração do modelo. Serão apresentados métodos de estimação que
permitam expressar a Teoria Econômica a partir de dados estatísticos e de uma metodologia que aponte
como aplicar os métodos de estimação aos dados estatísticos, permitindo ao aluno definir um bom
modelo e como encontrá-lo.

Interpretar modelos estruturados será um dos nossos objetivos. Iremos compreender de forma
completa ou parcial um determinado fenômeno; perceber como os processos operam para gerar
padrões observáveis; e desenvolver simulações que examinem mudanças ao longo do tempo sobre
conjecturas específicas.

Nesse enfoque, estamos interessados em discutir sobre a natureza e as fontes de dados disponíveis
para análise econométrica a fim de que o aluno obtenha dos dados a maior quantidade possível de
informação e seja capaz de indicar possíveis modelos a serem utilizados.

Realizaremos uma discussão mais extensa sobre as hipóteses do modelo-base da Econometria


(modelo clássico de regressão linear), enfatizando não só a utilização de dados da economia brasileira
em estudos e pesquisa, como também a interpretação de resultados obtidos a partir dos métodos e das
técnicas expostos, estimulando a aplicação teórica e prática, com o objetivo de complementar a base
teórica adquirida nas demais disciplinas do curso.

Em um segundo momento, estudaremos como detectar a presença e estimar tais modelos com
multicolinearidade, heterocedasticidade, autocorrelação serial e erros de especificação.

Os exercícios resolvidos irão procurar mostrar, em detalhes, como os cálculos são desenvolvidos. Isso
será feito envolvendo a discussão dos pressupostos básicos que dão validade aos parâmetros estimados
dos modelos e os testes mais comuns usados para verificar a violação de cada um desses pressupostos.

Por fim, destacaremos algumas outras técnicas de estimação que possibilitem, em contextos
específicos, melhorar a significância do modelo básico.
7
Apresentaremos a regressão com as variáveis dependentes binárias (ou dummies). Serão expostas a
possibilidade de explorar modelos com variáveis qualitativas e as tratativas dos problemas de formulação,
estimação e testes de modelos com variáveis defasadas e instrumentais.

A ideia geral é a de apresentar as ferramentas de regressão aos alunos e, através de análises


teórico-empíricas, aprender a utilizá-las como uma importante técnica de análise econômica para
estimar relações entre variáveis que possibilitem o equacionamento do comportamento em período
passado da relação entre as variáveis estudadas. O objetivo é fornecer previsões com alto nível de rigor
e sistematização na tentativa de antecipação do futuro, a partir de construção e análise de cenários,
gestão de políticas públicas e ações sociais que mudem resultados.

INTRODUÇÃO

A Teoria Econômica se preocupa com relações entre variáveis, e a Econometria é um tipo especial
de análise econômica na qual a abordagem teórica é combinada com formulações matemáticas,
procedimentos estatísticos e mensuração empírica dos fenômenos econômicos por meio de análise de
uma base de dados. Podemos dizer que a Econometria é aquele ramo da ciência econômica que trata
de quantificar, isto é, de representar numericamente as relações econômicas, o que se realiza mediante
uma combinação adequada da Teoria Econômica, da Matemática e da Estatística.

Nas últimas décadas, o levantamento de dados, a lógica e o raciocínio subjacentes à análise de dados
firmaram-se como um instrumental da pesquisa sociológica, em especial econômica – o raciocínio que
empresta apoio à operação analítica.

Inflação, desemprego, consumo, narcotráfico, violência, imigração etc.; vivemos em cidades de cifras,
solicitados a diagnosticar, a mensurar a verdadeira dimensão, o quantum de tudo isso, e a garantir suas decisões.

Muitas vezes deparamos com decisões no mundo profissional difíceis de serem tomadas e das quais
as consequências são importantes, e os resultados, incertos.

Conforme escreve o Dr. Morris Rosenberg (1976, p. 13), “importa que os dados sejam bons, mas
igualmente importante é o que se irá fazer com eles”.

O que vamos tratar nesta disciplina envolve o estudo e a aplicação de métodos e técnicas
econométricas e sua metodologia e aplicações: mostrar a viabilidade prática e teórica de construção
de modelos de previsão, com base em técnicas econométricas. Vamos tratar de modelos como
estrutura analítica construída de forma simplificada, já que são apenas representações esquemáticas
e aproximadas da economia real.

Analisaremos, de forma integrada, como cada abordagem trata a questão do antes (relação
teoria‑modelo, escolha de especificações, análise exploratória dos dados e temas correlatos), do
durante (técnicas econométricas, data mining e outros tópicos) e do depois da aplicação das técnicas
econométricas (interpretação dos modelos, apresentação e implicações para a formulação de políticas
buscando o menor erro possível e permitindo o julgamento da necessidade ou não de medidas corretivas).
8
Regressão é uma importante técnica para medir ou estimar relações entre variáveis econômicas. Ela
se ocupa do estudo da dependência de uma variável em relação a uma ou mais variáveis explicativas
utilizadas pelos economistas para fins de análise estrutural (verificação de teorias econômicas), avaliação
de políticas econômicas e previsão de valores futuros de variáveis de natureza econômica. Este estudo
consiste na construção e análise de uma relação matemática entre as variáveis, no geral, uma variável
em função das outras.

Vamos elaborar análise de variáveis de natureza macroeconômica (consumo, produto, taxa de


emprego) e de natureza financeira (retorno de ações, taxas de câmbio), porém com características
diferentes. As observações das séries temporais de natureza macroeconômica são geralmente mensais,
trimestrais ou anuais, e as de natureza financeira são dotadas de uma frequência muito superior:
normalmente, trabalha-se com dados diários ou mesmo intervalos de horas ou minutos entre duas
observações consecutivas – os chamados dados de alta frequência, voláteis (por exemplo: índices diários
da Bolsa de Valores de São Paulo – Ibovespa). Os dados macroeconômicos estão sujeitos a erros de
medição, apurados de acordo com certa metodologia e decorrentes de investigações preliminares; já
os dados financeiros resultam de valores efetivamente observados no mercado. Ao contrário das séries
macroeconômicas, as séries financeiras exibem habitualmente fortes efeitos não lineares e distribuições
não normais. Os modelos utilizados para descrever séries temporais (conjunto de observações ordenadas
no tempo) são processos estocásticos, isto é, processos controlados por leis probabilísticas.

Então, imagine você, economista, ampliando seu potencial e suas habilidades, aprendendo a expandir
seus limites, sendo capaz de testar as proposições teóricas, de explicar o comportamento de variáveis já
observadas e/ou prever comportamentos ainda não observados. Isto é:

• medir variáveis e agregados econômicos;

• estimar parâmetros de relações econômicas;

• formular testes de hipóteses sobre situações reais;

• prever valores de variáveis econômicas.

Portanto, o instrumental econométrico pode ser utilizado no estudo de qualquer fenômeno, desde
que se consiga expressar as formulações teóricas em bases matemáticas e existam dados amostrais
suficientes para a criação de um modelo.

Observação

Enfatizamos que as ferramentas e seu nível de aplicação são relevantes


para solucionar muitos problemas práticos do mundo atual.

9
ECONOMETRIA

Unidade I
1 A NATUREZA DA ECONOMETRIA E DOS DADOS ECONÔMICOS

A investigação econométrica se iniciou com a análise da demanda – Teoria de Cournot (1838) – e os


famosos Princípios de Marshall (1890). Mas também a Tinbergen (1939) se deve o desenvolvimento dos
modelos macroeconômicos multiequacionais inspirados na contabilidade nacional. Em 1930, funda-se
a Econometric Society, cuja necessidade já vinha sendo notada desde 1912. O apogeu do método é
atingido em 1950, quando a Cowles Comission publica a Statistical Inference in Dynamic Economic
Models. A hipótese básica desse trabalho é a de que os dados econômicos se geram por sistemas de
relações que são, em geral, estocásticos, dinâmicos e simultâneos. Portanto, dois fatos favoreceram
aquelas primeiras análises empíricas: de um lado, a existência de uma teoria bem-estruturada; de
outro, a possibilidade de obter facilmente dados estatísticos sobre preços e quantidades.

Tão importante quanto estudar métodos e técnicas econométricas é estudar sua metodologia e
aplicações de acordo com cinco paradigmas diferentes:

• a chamada abordagem “clássica” ou da Comissão Cowles, nos anos 1950-60;

• a abordagem “inglesa” ou da London School of Economics, nos anos 1970-80;

• a abordagem VAR, nos anos 1980;

• a abordagem da calibragem, nos anos 1990;

• a microeconometria e os experimentos quase naturais, que ganharam crescente notoriedade,


sobretudo na avaliação de políticas públicas e nos estudos do mercado de trabalho.

A Matemática ensina a maneira de deduzir proposições de outros dados (coincide com a lógica
dedutiva); já a Estatística instrui o modo de obter proposições dos fatos observados (coincide com a
lógica indutiva).

A missão do econômetra é exprimir as teorias econômicas em termos matemáticos para verificá-las


por métodos estatísticos e para medir o impacto de uma variável sobre outra, assim como para poder
prever os sucessos futuros ou aconselhar a política econômica que se deve seguir quando se deseja um
resultado determinado.

11
Unidade I

1.1 Fases da investigação econômica

As fases da investigação econômica são:

• formulação de hipótese e teorias;

• verificação dessas hipóteses e teorias.

A primeira fase corresponde à Teoria Econômica e a segunda constitui a Econometria (construção


de modelos, sua especificação, estimação, verificação e previsão).

A Teoria Econômica não fornece qualquer medida numérica da relação entre variáveis. Desse modo, a
análise de regressão é a técnica básica para medir ou estimar relações entre variáveis. O objetivo é testar
proposições teóricas nessas relações, procurando isolar, desagregar efeitos de relações de causalidades
e estimar parâmetros envolvidos na construção de modelos econométricos.

De acordo com Hoover (2006), a Econometria tem quatro funções:

• Testar implicações de uma teoria através da correta tradução desta em proposições testáveis a
partir de modelagem econométrica.

• Calibrar parâmetros de um modelo para mensurar parâmetros de um modelo já definido de uma


relação proposta pela Teoria Econômica (por exemplo, calcular a elasticidade-renda de uma
função consumo).

• Prever, já que a Econometria pode ser usada para prever uma relação ou mesmo os valores de uma variável
de interesse – lembrando que a Teoria Econômica é que permite qualificar e explicar uma previsão.

• Caracterizar relações e fenômenos, pois a Econometria possibilita permitir uma visualização dos
dados de forma a revelar relações e fenômenos que às vezes não estão previstos nas teorias, pois
elas são continuamente testadas e se desenvolvem por meio da observação.

Esta técnica de modelagem utilizada para analisar a relação entre uma variável dependente (Y) e
uma ou mais variáveis independentes (X1, X2, X3, ..., Xn) tem como objetivo estimar uma função que
descreve, o mais próximo possível, a relação entre essas variáveis. É assim que poderemos predizer o
valor que a variável dependente (Y) irá assumir para um determinado valor da variável independente X.
O modelo estimado deve satisfazer os objetivos de explicar e/ou prever o comportamento das variáveis
envolvidas nessa análise.

As propriedades desejáveis de um modelo estimado são:

• relevância;

• simplicidade;
12
ECONOMETRIA

• plausibilidade teórica;

• precisão dos coeficientes;

• capacidade explicativa;

• capacidade preditiva.

Antes de pensar em um modelo de previsão caracterizado por regressão linear, é conveniente


chamar a atenção para o seu processo de concepção (procedimento prévio a ser seguido). Uma sugestão
encontra-se ilustrada a seguir:

Teoria econômica

Modelo matemático

Modelo econométrico

Tabulação dos dados

Estimação dos parâmetros do modelo

Avaliação do modelo
(Critério: estatístico, econométrico e econômico)

Avaliação da teoria (se compátivel com os dados)


Compatível: aceita o modelo/Não compatível: rejeita o modelo

Figura 1 – Metodologia de pesquisa econométrica

Os passos para a elaboração de um modelo econométrico são (GUJARATI, 2000):

• formulação ou teoria da hipótese;

• especificação do modelo matemático da teoria;

13
Unidade I

• especificação do modelo econométrico da teoria;

• obtenção e preparação de dados;

• estimativa dos parâmetros do modelo econométrico;

• teste de hipótese;

• previsão ou predição;

• utilização do modelo para fins de controle ou política.

No exemplo a seguir, faremos um passo a passo utilizando o modelo de regressão linear simples
(MRLS) tendo como suporte a Teoria Keynesiana de Consumo.

1.2 Formulação da teoria ou hipótese

O consumo das famílias é o componente mais importante do Produto Interno Bruto (PIB) de uma
economia, e sua dinâmica é fundamental para entender as alterações tanto em períodos de boom como
de crises. De acordo com a Penn World Table Version 7.0 (KNOEMA, [s.d.]), o consumo representa 70%
do PIB de todos os 190 países pesquisados. Com o intuito de verificar o nível de dependência entre elas,
coletamos os dados da economia brasileira, a preços constantes de 1995, no período de 1996 a 2014
(veja a tabela mais adiante) e estimamos o modelo de regressão linear simples (MRLS), relacionando os
resultados com a função keynesiana e de Milton Friedman.

De acordo com a Teoria Keynesiana (modelo simples de dois setores: economia fechada e sem
governo), numa economia muito simples, sem governo e sem setor externo, isto é, sem transações com
o exterior, a renda nacional (Y) será destinada apenas ao consumo das famílias (C) e à poupança (S), já
que, não havendo governo, não há impostos.

Já a respeito da função consumo, seguindo o raciocínio de Keynes, parece razoável afirmar


que o principal determinante do consumo é a renda disponível (Yd), isto é, o montante de que as
pessoas dispõem para gastar. Como não existe governo nesta economia, não há impostos nem
transferências governamentais e, portanto, a renda disponível (Yd) é igual, por definição, à renda
nacional (Y). Assim, se a renda crescer ou se reduzir, o mesmo ocorrerá com o consumo, mas
não necessariamente no mesmo montante (o aumento da renda eleva o consumo, mas não em
proporção igual ao aumento dessa renda).

A função consumo mostra a relação existente entre o nível das despesas de consumo e o nível da
renda disponível.

Empiricamente, descobriu-se que o consumo corresponde a uma proporção estável da renda (veja a
figura a seguir, criada a partir de dados do IBGE).

14
ECONOMETRIA

350

300
Renda
250 Consumo
R$ bilhões

200

150

100

50

0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Ano

Figura 2 – Renda e consumo no Brasil (período entre 1996 e 2014)

Será que podemos afirmar que o valor total do consumo é determinado somente pela renda
disponível corrente? Como explicar que pessoas desempregadas, que não dispõem de renda, consomem
um mínimo que seja? Olhando no agregado, percebe-se que uma parte do consumo total independe do
nível de renda (ou pelo menos do nível de renda corrente). Nesse contexto, podemos definir a função
consumo como:

C = α + βYd

Onde:

α = parte autônoma do consumo, isto é, a parcela que não depende da renda (são os que não são
relacionados ao nível de renda, como, no modelo keynesiano, o investimento, os gastos do governo
e a exportação);

β = fração da renda que é gasta, isto é, consumo induzido (questão de padrão de vida).

Essa parcela de renda que é gasta (β), denominada de propensão marginal a comsumir (PMgC), foi
um dos mais importantes conceitos introduzidos por Keynes. O termo “marginal” em economia, que
neste caso representa o adicional de consumo em função de um aumento na renda, expressa a ideia
de um “extra” qualquer decorrente de um acréscimo qualquer ocorrido em uma variável. Analisando
tecnicamente, a propensão marginal a consumir (PMgC) representa a razão entre a variação no consumo
(∆C) decorrente de uma variação na renda disponível (∆Yd) e essa variação na renda. Assim:

∆C
PMgC = β =
∆Yd

A propensão marginal a consumir (PMgC) ou taxa de variação do consumo é maior que zero e menor
que um ⇔ 0 < PMgC < 1, que expressa o comportamento dos agentes de uma determinada economia
em relação à renda obtida – quanto mais propensos estes forem a consumir, maior será o valor da PMgC.

15
Unidade I

Por exemplo, numa economia em que seus agentes estão dispostos a comprometer 75% da sua renda
com o consumo, a PMgC é igual a 0,75. Em decorrência, a propensão marginal a poupar (PMgS)
representa a parcela da renda dos agentes econômicos de uma determinada economia no qual estes se
comprometem a poupar, isto é, a não gastar (PMgC é 0,75 + PMgS é 0,25 = 100% da renda).

O coeficiente β é denominado propensão marginal a consumir (PMgC). Vem a ser o aumento do


consumo a cada aumento unitário da renda.

A propensão média a consumir (PMeC) é dada pela relação PMeC = C/Yd para diferentes níveis
de renda. A PMeC decresce continuamente à medida que aumenta a renda, com o detalhe de que C
aumenta menos do que proporcionalmente aos aumentos de Yd, pelo fato de β estar entre 0 e 1.

Temos que:

PMeC = C/Yd e PMgC = ΔC/ΔYd.

Logo, C/ Yd = α / Yd + β Yd / Yd.

Daí, vem que:

PMeC = α / Yd + PMgC, e conclui-se que PMe > PMg. Essa simples demonstração já foi solução para
questões aparentemente complexas do modelo keynesiano simplificado.

Observação

Não devemos confundir o conceito de PMgC com um outro conceito


semelhante, que é a propensão média de consumo (PMeC), considerada
como a razão entre o consumo total e a renda disponível (PMeC = C/ Yd ou
PMeC = (α + β Yd) / Yd).

1.3 Especificação do modelo matemático do consumo

De modo simplificado, a seguinte expressão matemática representa a função de consumo keynesiana:

Y = α + βX, 0<β<1

Onde:

Y = despesa de consumo;

X = renda.

16
ECONOMETRIA

Aqui, α e β são conhecidos como parâmetros do modelo. São o intercepto (que representa o ponto
em que a reta regressora corta o eixo dos ys, quando x = 0) e a declividade (que representa a inclinação
da reta regressora e é chamada de coeficiente de regressão ou coeficiente angular). Além disso, temos
que, para um aumento de uma unidade na variável x, o valor E(Y|x) aumenta unidades.

O β mede a declividade e a PMgC. Geometricamente, a equação da função consumo com as três


propriedades propostas por Keynes é mostrada na figura a seguir:

• Primeira: a propensão marginal a consumir se situa entre 0 e 1.

• Segunda: a propensão média a consumir cai quando a renda aumenta (PMeC declinante).

• Terceira: o consumo é determinado pela renda corrente.


Y Y=α+βX 0<β<1
Dispêndio em
consumo Consumo Renda
Inclinação = PMgC

β = PMgC
1

Renda X

Figura 3 – Função consumo keynesiana

Observação

Simulação é o método de solução de problemas que se utiliza de


modelos matemáticos numéricos/algorítmicos.

Os modelos podem ser contínuos ou discretos:

• Contínuos: as variáveis têm valores que variam continuamente ao longo do tempo de simulação.
Equações fornecem o valor das variáveis em todos os instantes de tempo. Exemplos de modelos
contínuos: reações químicas, circuitos eletrônicos, modelos econométricos.

• Discretos: as variáveis são alteradas apenas em certos instantes de tempo. O comportamento


do modelo é dado por um conjunto de regras que determinam o tempo do próximo evento e as
alterações nos valores das variáveis. Exemplos de modelos discretos: controle de tráfego, sistemas
de produção, sistemas telefônicos, sistemas operacionais etc.

17
Unidade I

Diferença entre modelos determinísticos e estocásticos:

• Determinísticos (matemáticos): são totalmente previsíveis, predeterminados em função dos


dados de entrada. Cada elemento do domínio (x) se associa apenas com um elemento da imagem
(Y). Ou seja, em uma função Y = f(x) se para cada valor de x houver um valor de y. Conhecidos
como modelos estritamente matemáticos. Exemplo: espaço percorrido por um automóvel a uma
determinada velocidade constante num determinado espaço de tempo:

E=VxT

Onde:

E = espaço (variável de saída);

V = velocidade constante (variável de entrada);

T = tempo decorrido do deslocamento do automóvel (variável de entrada).

X1 X2 X3 X

Figura 4 – Modelo determinístico (matemático)

• Estocásticos (econométricos): contingenciais, não dependem somente dos dados de entrada,


mas também de outros fatores, normalmente aleatórios. Há uma indeterminação quanto
à predição de eventos futuros descrita por distribuições de probabilidade. Para cada valor do
domínio (x) existe uma distribuição de probabilidade total dos valores da imagem (Y). Assim,
para cada valor de X a variável Y pode assumir um intervalo específico. A análise estocástica
começa pela identificação da função de distribuição de probabilística que melhor se ajusta ao
elemento-base em estudo. Exemplos: uma lâmpada nova é ligada, e conta-se o tempo gasto até
queimar; em uma linha de produção, peças são fabricadas em série, e conta-se o número de peças
defeituosas produzidas num período contínuo de 24 horas; reação das pessoas em situação de
emergência. O modelo probabilístico tenta descrever o comportamento “aleatório” das entidades.

18
ECONOMETRIA

X1 X2 X3 X

Figura 5 – Modelo estocástico (econométrico)

1.4 Especificação do modelo econométrico do consumo

Espera-se que o modelo estabeleça relações entre variáveis. Trataremos de dados exclusivamente
com relações estocásticas. Portanto, o modelo econométrico de interesse da função consumo não
pode ser puramente matemático, pressupondo que a relação entre as variáveis (consumo e renda) seja
determinística ou exata.

As relações sociais e de conteúdo econômico no contexto geral não são exatas; elas absorvem
um conceito complexo que trata de um conjunto de interações que se ligam com relacionamentos
de conteúdo jurídico, político, ético e ideológico, eminentemente sociais. Algumas dessas variáveis
que influenciam a compra (consumo) podem ser retratadas através de quatro fatores: culturais,
sociais, pessoais e psicológicos.

Partimos da ideia de que as relações entre duas variáveis podem ser afetadas pela introdução de
uma ou mais variáveis. Espera-se, com isso, que a compreensão dessa relação possa ser enriquecida
e aprofundada. Assim, ao se examinar o alcance das significações possíveis dessas relações e estudar
os fatores do porquê da existência dessas relações, as condições em que se manifestam as relações
e os problemas que advêm das influências conjuntas, o propósito é o de explicar, especificar a
relação, tornando-a mais significativa e/ou mais precisa.

Caso se obtenha a amostra de 700 famílias, espera-se que o comportamento dos consumidores não
seja linear, pois é caracterizado pelas atividades mentais e emocionais que ocorrem no momento da compra
e do uso – ou seja, não se comportarão de forma exatamente linear e podem até seguir uma tendência,
ditada pelos empresários, por meio de práticas de publicidade, sistemas de crédito, programas de expansão e
constituição de monopólios e oligopólios, resultando, muitas vezes, em concentração do poder econômico.

Em geral, definem-se para o modelo variáveis de entrada e variáveis de saída, que espelham as
interações do sistema com o Universo (veja a figura a seguir). O que se necessita ao elaborar um modelo
é descobrir princípios gerais que proporcione conhecimentos úteis da realidade econômica.
19
Unidade I

Entradas Sistema econômico Saídas

Figura 6 – Sistema econômico

Espera-se que o modelo estabeleça relações entre essas variáveis. Para essa classe de sistema (função
de consumo keynesiana), é conveniente o seguinte modelo:

Xi Variáveis Variáveis Yi
de entrada Modelo econométrico
de saída

Figura 7 – Modelo econométrico

Estamos criando um modelo toda vez que tentamos explicar um conjunto complexo de
comportamentos, fenômenos e resultados empregando algumas variáveis explicativas e estabelecendo
relações entre elas.

Os modelos não visam captar toda a complexidade dos comportamentos, eles são criados para
retirar os fatores do acaso e da idiossincrasia (característica comportamental peculiar), de tal forma que
o foco recaia sobre os princípios gerais desenvolvidos.

Assim, um modelo econômico pode ser definido como uma expressão matemática de uma
determinada teoria econômica.

Para transformar relações inexatas (socioeconômicas), o econometrista modifica a função consumo.


Veja o modelo:

Y = α + βX + e, 0 < β < 1

Onde:

Y = despesa de consumo;

X = renda.

Aqui, α e β são conhecidos como parâmetros do modelo; são o intercepto e a declividade.


20
ECONOMETRIA

Por sua vez, e é o termo de perturbação e pode representar todos os fatores que afetam o consumo,
mas que não são considerados explicitamente (podem assumir valores positivos ou negativos, também
conhecidos como termo de erro estocástico ou perturbação estocástica). A equação anterior é um exemplo
de modelo econométrico (de regressão linear simples). O modelo é representado na figura a seguir:
Y Desvios
Consumo +

– Modelo: Y = α + βX + e
Desvios positivos (+) (reta ajustada)
+

+

e +

Desvios negativos (-)

X
Renda

Figura 8 – Modelo econométrico da função consumo keynesiana

Em resumo, o modelo aceita que o consumo se relaciona linearmente com a renda, mas a relação
entre ambos não é exata, estando sujeita a variação individual.

Observação

É essa teoria (keynesiana) que, em geral, nos diz qual variável é causa e
qual variável é efeito.

1.5 Obtenção e preparação de dados

A Econometria enfoca problemas inerentes à coleta e à análise de dados econômicos não


experimentais, também chamados de dados observacionais, os quais não são acumulados por meio
de experimentos controlados de indivíduos, firmas ou segmentos da economia.

Para obter os valores numéricos, precisamos de dados. Os dados se referem a vários indivíduos? Ou
eles se referem a um mesmo país, mas em diversos espaços de tempo? As respostas a essas questões são
de extrema importância para a nossa análise econométrica. A estrutura dos dados econômicos utilizada
em Econometria é basicamente de três tipos:

• Séries temporais: conjunto de observações e valores que uma variável assume em diferentes
momentos. É o conjunto de dados sequenciais observados de uma mesma variável ao longo do
21
Unidade I

tempo (em intervalos de tempo). Exemplo: o consumo agregado no Brasil em diversos anos, os
retornos diários da Bovespa ou a taxa de desemprego mensal. Os dados são assumidos como
estacionários, a variância e a média não se alteram sistematicamente.

• Dados de corte transversal (cross-section): dados de variáveis coletadas num mesmo instante de
tempo (num único momento). Estudos transversais são apropriados para descrever características
das populações no que diz respeito a determinadas variáveis, e os seus padrões de distribuição
podem, também, ser utilizados para descrever associações entre variáveis. Exemplos: peso de
indivíduos selecionados aleatoriamente e num determinado instante de tempo ou PIB dos países
emergentes no primeiro trimestre de 2016. No exemplo dado, poderíamos observar o consumo e a
renda de diversas famílias num mesmo mês ou também o consumo agregado e a renda agregada
de diversos países num mesmo ano. Os dados apresentam problemas da heterogeneidade (alguns
são grandes demais e outros são pequenos demais).

• Dados em painel: consiste na observação de n entidades para dois ou mais períodos de tempo.
Combina características de séries temporais com dados em corte transversal permitindo o controle
da heterogeneidade presente nos elementos e são amplamente utilizados em estudos econométricos
e nas ciências sociais aplicadas. Há dados combinados, tanto de séries temporais como de corte, em
que temos uma série de tempo para cada unidade de corte transversal. Exemplos: consumo agregado
dos diversos estados brasileiros ao longo de vários anos, taxa de desemprego semestral dos países da
América Latina ou PIB trimestral dos municípios do estado de São Paulo nos últimos 15 anos.

Observação

É importante observar que dados que tomamos como certo serem de


“corte transversal” podem apresentar uma interessante dependência entre
si quando observados com mais cuidado. Um exemplo são as notas de
prova de uma turma. Se os dados forem apresentados em ordem alfabética
ou por ordem dos assentos na sala, este último fará sugerir autocorrelação
positiva (notas altas estavam próximas de notas altas, e notas baixas, de
notas baixas, evidenciando que houve muita cola durante a prova).

Na análise de regressão, as ideias de causação na relação entre variáveis (X e Y) devem se originar


fora da Estatística, em última análise, em alguma teoria. Por exemplo, no nosso caso em estudo, a
Teoria Econômica aponta que o consumo depende da renda, e não o contrário. Portanto, devemos estar
atentos que correlação não implica relação causal entre variáveis, e simplesmente lembre que correlação
é diferente de causação (correlação não implica causação).

Nesta fase inicial, que permite conhecer as caraterísticas das informações, devemos selecionar os
principais indicadores para mostrar as principais medidas estatísticas dessa amostra. Além de utilizar
esses dados, é necessário elaborar um box plot, gráfico que permite a visualização de como esses dados
estão distribuídos na amostra. Isso torna possível perceber se há a presença de outliers, o que gera uma
maior segurança para a construção dos modelos de regressão.
22
ECONOMETRIA

Observação

O sucesso de qualquer análise econométrica depende basicamente da


disponibilidade de dados apropriados.

Dando início ao trabalho de criação do modelo, a primeira etapa consiste em analisar a matriz de
correlação das variáveis. Nessa matriz, observa-se entre todas as variáveis independentes selecionadas
a que possui a maior correlação com a variável dependente. Essa variável de maior correlação com a
variável a ser explicada (Y) é que deverá ser selecionada para a construção da equação de regressão
usando apenas uma variável independente.

Saiba mais

Sobre um instrumento fundamental da pesquisa econômica relacionada


ao planejamento e à coleta de dados de uma lógica – o raciocínio que
empresta apoio ao processo analítico –, leia a obra:

ROSENBERG, M. A lógica da análise do levantamento de dados. São


Paulo: Cultrix/Edusp, 1976.

2 O MODELO DE REGRESSÃO LINEAR SIMPLES (MRLS)

No exemplo a seguir, vamos utilizar dados mensurados no tempo (séries de tempo ou time series). A
ideia é construir um modelo de regressão para o período anual de 1996 a 2014 do Brasil relacionando
duas variáveis: renda (X) e consumo (Y).

Com base na tabela a seguir, elaborada a partir de diversos dados apresentados pela Coordenação
de Contas Nacionais da Diretoria de Pesquisas do IBGE, construímos um diagrama de dispersão entre as
variáveis renda (X) e despesa de consumo (Y):

Tabela 1 – Despesas de consumo pessoal (Y) e produto interno bruto (X)


de 1996 a 2014 (em bilhões de reais de 1995)

Abrangência: Brasil | Unidade: R$ bilhões


Valores constantes de 1995
X Y
Ano Renda Consumo
1 1996 180,4 116,1
2 1997 186,5 119,6
3 1998 187,2 118,7

23
Unidade I

Abrangência: Brasil | Unidade: R$ bilhões


Valores constantes de 1995
X Y
Ano Renda Consumo
4 1999 188,0 119,2
5 2000 196,3 124,0
6 2001 199,0 125,0
7 2002 205,1 126,6
8 2003 207,4 125,9
9 2004 219,4 130,8
10 2005 226,4 136,6
11 2006 235,4 143,9
12 2007 249,6 153,0
13 2008 262,4 162,9
14 2009 262,0 170,2
15 2010 281,8 180,8
16 2011 292,8 189,4
17 2012 298,4 196,0
18 2013 307,4 202,8
19 2014 307,7 205,5
4.493,20 2.847,00

A variável Y corresponde às despesas de consumo das famílias agregado (isto é, para a economia em
geral), e a variável X, ao produto interno bruto (PIB) (um indicador de renda agregada), ambos medidos
em bilhões de reais a preços constantes de 1995.
220
Despesa de consumo - R$ (bilhões)

200
180
160

140
120
100
150 200 250 300 350
Renda - R$ (bilhões)

Figura 9 – Renda e despesa de consumo no Brasil de 1996 a 2014

O que se espera é que os gastos de consumo estejam diretamente relacionados com seus rendimentos.
Os dados estão apresentados no gráfico anterior, o que supõe, de modo razoável, a existência de uma
“relação linear” entre essas duas variáveis.

24
ECONOMETRIA

Com base no diagrama de dispersão, temos uma interpretação subjetiva da existência de correlação
entre duas variáveis, mas, pelo cálculo do coeficiente de correlação (r), temos uma maneira mais precisa
de mensuração, conforme fórmula a seguir:

n∑xy − ∑x ∑y
=r − 1 ≤ r ≤ +1
n∑x −2
( ∑x ) n∑y − ( ∑y )
2 2 2

O intervalo de variação do coeficiente de correlação varia de -1 a 1. Se x e y tiverem forte correlação


positiva, r estará próxima de 1. Se x e y tiverem forte correlação negativa, r estará próximo de -1. Se não
existir correlação linear ou, ainda, se a correlação linear for fraca, r estará próximo de zero.

Observação

Uma distribuição de probabilidades dá uma descrição formal


(matemática) dos valores possíveis da população que podem ser observados
para a variável. Quando temos duas variáveis, a distribuição é denominada
bivariada. A fx,y (x,y) descreve como os valores de X e Y se comportam
conjuntamente.

A distribuição normal bivariada é uma distribuição de probabilidades com uma função densidade de
probabilidade f(x,y) para X e Y, tal que:

• X e Y apresentam, cada uma, distribuição normal com médias µX e µY e variâncias σ2X e σ2Y,
respectivamente;

• o relacionamento entre X e Y é medido pela quantidade ρXY tal que -1 ≤ ρXY ≤ 1;

• ρXY é o coeficiente de correlação entre as variáveis aleatórias X e Y e mede a associação linear


entre elas.

Onde:

ρXY = 1 correlação positiva perfeita;

ρXY = 0 correlação nula;

ρXY = -1 correlação negativa perfeita.

Com os dados observados (xi, yi), desejamos quantificar o grau de associação. Para isso estimamos ρXY.

Para facilitar o cálculo do coeficiente de correlação estimado (r), podemos utilizar uma tabela, com
base em dados do IBGE:
25
Unidade I

Tabela 2 – Renda (X) e consumo (Y)

Abrangência: Brasil | Unidade: R$ bilhões


Valores constantes de 1995
X Y X2 Y2 XY
Ano Renda Consumo Renda2
1 1996 180,4 116,1 32.544 13.479 20.944
2 1997 186,5 119,6 34.782 14.304 22.305
3 1998 187,2 118,7 35.044 14.090 22.221
4 1999 188,0 119,2 35.344 14.209 22.410
5 2000 196,3 124,0 38.534 15.376 24.341
6 2001 199,0 125,0 39.601 15.625 24.875
7 2002 205,1 126,6 42.066 16.028 25.966
8 2003 207,4 125,9 43.015 15.851 26.112
9 2004 219,4 130,8 48.136 17.109 28.698
10 2005 226,4 136,6 51.257 18.660 30.926
11 2006 235,4 143,9 55.413 20.707 33.874
12 2007 249,6 153,0 62.300 23.409 38.189
13 2008 262,4 162,9 68.854 26.536 42.754
14 2009 262,0 170,2 68.644 28.968 44.592
15 2010 281,8 180,8 79.411 32.689 50.949
16 2011 292,8 189,4 85.732 35.872 55.456
17 2012 298,4 196,0 89.043 38.416 58.486
18 2013 307,4 202,8 94.495 41.128 62.341
19 2014 307,7 205,5 94.679 42.230 63.232
∑ 4.493,20 2.847,00 1.098.893,00 444.685,02 698.662,81

n∑xy − ∑x ∑y
r=
n∑x2 − ( ∑x )2 n∑y2 − ( ∑y )2
19 × 698.662,81 − 4.493,20 × 2.847,00
r ≅ 0,9907
19 × 1.098.893,80 − ( 4.493,20) × 19 × 444.685,02 − ( 2.847,00)
2 2

Existe uma forte correlação positiva entre renda (X) e consumo (Y). À medida que aumenta a renda,
crescem também as despesas de consumo.

2.1 Estimativa do modelo econométrico

A análise de regressão possibilita o desenvolvimento de um modelo para prever os valores de uma


variável numérica com base no valor de outras variáveis. A variável que desejamos prever é chamada

26
ECONOMETRIA

de variável dependente. As variáveis utilizadas para elaborar a previsão são chamadas de variáveis
independentes. A análise de regressão também permite: identificar o tipo de relação matemática
que existe entre uma variável dependente e uma variável independente; quantificar o efeito que
alterações na variável independente exercem sobre a variável dependente; definir um valor adequado
para os parâmetros do nosso modelo; avaliar as propriedades estatísticas dessas estimativas, bem como
identificar observações incomuns.

Como proposta da estimativa do modelo econométrico com base na função consumo, vamos
discorrer sobre o modelo clássico, que é o da regressão linear simples. Com os dados da tabela, utilizamos
o modelo de regressão linear simples (MRLS), na qual uma única variável independente numérica (X:
renda) é utilizada para prever a variável dependente numérica (Y: consumo).

O modelo geralmente é escrito da seguinte forma:

Yi = α + βXi + ei

A variável dependente é Y (causada ou explicada) e a variável independente é X (explicativa), no


sentido de que esperamos que x explique y. Os parâmetros do modelo são α e β. Esses parâmetros são
desconhecidos e teremos que estimá-los. O subíndice i é utilizado para denotar as várias observações
que temos (para uma amostra de tamanho N, os valores de i variam de 1 a N observações) a fim de
definir os parâmetros do modelo, que são os mesmos para estimar e/ou prever todas as observações.

Para estimarmos os parâmetros desconhecidos do nosso modelo em questão, precisamos elaborar


algumas hipóteses. São elas:

• Linearidade:

Yi = α + βXi + ei

Significa dizer que não podemos utilizar modelos da forma Yi = α + Xiβ + ei.

• Exogeneidade:

E[ei | xi] = 0

É a exigência de que o erro e a variável explicativa sejam não correlacionados.

• Homocedasticidade:

Var[ei | xi] = E[ei2 | xi] = σ2

A variância do erro é constante.

27
Unidade I

• Não autocorrelação dos erros:

Cov[ei, xj | xi, xj] = E[ei, xj | xi, xj] = 0.

O erro de uma observação não pode estar correlacionado com o erro de outra observação. Portanto,
a covariância é igual a zero (o resultado em qualquer experimento não tem efeito no termo do erro de
qualquer outro experimento). Eles devem ser independentes.

Os dados são usados para estimar α e β, isto é, ajustar o modelo aos dados, para:

• quantificar a relação entre Y e X;

• usar a relação para predizer uma nova resposta Y0 para um dado valor de X0 (não incluído
no estudo);

• calibração:

— capacidade de predição de novas observações; pode ser feita usando uma nova amostra e
comparando os valores estimados com os observados.

— dado um valor de Y0, para o qual o correspondente valor de X0 é desconhecido, estimar o valor
de X0.

Lembrete

Quando falamos na hipótese de linearidade, estamos falando de


linearidade dos parâmetros. Não importa se temos como variável X, ex ou
log (X). O fundamental é que o parâmetro β esteja multiplicando qualquer
uma dessas variáveis.

Outra questão envolvendo as variáveis observadas são as unidades de medida. Quando multiplicamos
os valores observados por uma constante k (exemplo: se a renda for medida em reais e depois quisermos
medi-la em milhares de reais, bastará dividir os valores por 1.000. Neste caso, k = 1/1.000), temos que
adotar as seguintes regras:

Quadro 1 – Unidade de medidas das variáveis observadas

Somente X multiplicado por k Somente Y multiplicado por k X e Y multiplicado por k


α Não se altera Multiplique por k Multiplique por k
β Divida por k Multiplique por k Não se altera
r2
Não se altera

28
ECONOMETRIA

Existem alguns fenômenos que podem ser representados por um modelo linear depois de sofrer alguma
transformação de variáveis. A utilização do diagrama de dispersão pode nos auxiliar a decidir qual a melhor
transformação indicada para cada fenômeno em estudo – portanto, estamos optando por regressão com
variáveis transformadas. Exemplo: função exponencial ou semilogarítmica I: Y = a . bx (forma original, não
linear) aplicando a transformação indicada ln Y = Ina + blnX (forma linearizada por transformação),
tendo como restrições das variáveis na forma transformada Y>0 e X>0.

2.2 Método de estimação

Seria desejável a existência de um método que levasse sempre a bons estimadores. Infelizmente, não
existe esse método geral aplicável a todas as situações. Entre os principais métodos de estimação (o dos
momentos, o da máxima verossimilhança e o dos mínimos quadrados), o mais utilizado é o estimador de
mínimos quadrados ordinários (MMQO), que tem como objetivo minimizar a soma do quadrado dos erros.

O critério dos mínimos quadrados é o seguinte: a “linha que melhor se ajusta” é aquela que minimiza
a soma dos desvios quadrados dos pontos do diagrama dos pontos da linha reta (desvios estes que são
medidos verticalmente).

N
Minimizar ∑(Yi − Ŷi )2
i=1

Y
Linha dos mínimos quadrados
Yi Y^ = a + bX
Desvio: Yi - Y^i

Y^i

Valores ajustados

X
Xi

Figura 10 – Linha dos mínimos quadrados: desvios

Entre alguns métodos que existem para estimar os parâmetros a e b, o mais refinado é o método dos
mínimos quadrados (MMQ), que consiste em tornar mínima a soma dos desvios em torno da reta estimada.
Esse método encontra a reta que minimiza a distância vertical entre cada observação (ponto) e a própria reta.

Designando-se por ei o desvio entre um valor observado yi e um valor ajustado y^i, isto é, ei = (yi - y^i),
a e b são os valores que minimizam a soma de quadrados:

29
Unidade I

n n
( ) ∑ [ Yi − (a + bxi )]2
2
Minimizar ∑ Yi − Yˆi=
=i 1 =i 1

Com base nas fórmulas, podemos calcular, então, os coeficientes de regressão:

Sxy
b=
Sxx

a =y − bx =
∑y − b ∑x
n n

em que calculamos:

∑xi = 4.493,20 ∑yi = 2.847,00 ∑xiyi = 698.662,81

∑xi2 = 1.098.893,80 ∑yi2 = 444.685,02

( ∑xi )( ∑yi )
=
Sxy ∑xiyi − n

Sxy =
698.662,81 −
( 4.493,20 × 2.847,00) =
25.392,26
19

( ∑x i ) 2

=
Sxx ∑i x2 −
n

Sxx = 1.098.893,80 −
( 4.493,20)
2
= 36.322,95
19

( ∑y i ) 2

=
Syy ∑i y2 −
n

Syy =444.685,02 −
( 2.847,00)
2
=18.084,55
19

30
ECONOMETRIA

n∑xy − ∑x ∑y 19 × 698.662,81 − 4.493,20 × 2.847,00 482.452,99


=b = = ≅ 0,6991
n∑x − ∑x
2
( )
2
19 × 1.098.893,80 − (4.493,20)2 690.135,96

a= y − bx =
∑y − b ∑x = 2.847,00
− 0,6991 ×
4.493,20
≅ −15,48
n n 19 19

Portanto, a equação da reta de regressão é:

y^ = - 15,48 + 0,6991x

Respeitando as hipóteses do modelo de regressão linear, o Teorema de Gauss-Markov aponta que


os estimadores de mínimos quadrados são os melhores estimadores lineares não viesados (não viciados
ou imparciais). Isso quer dizer o seguinte:

• Os estimadores de MQO são não viesados, isto é, o valor esperado de cada estimador é igual
ao parâmetro que se deseja estimar: E(b0) = β0 e E(b1) = β1. Não viciado ou imparcial é uma
propriedade que assegura que, em média, o estimador é correto.

• Estimadores que são funções lineares e não são viesados – ou seja, os estimadores MQO – são
mais precisos (isto é, as suas distribuições amostrais têm a menor variância possível) do que
quaisquer outros estimadores pertencentes à classe dos estimadores não tendenciosos. Porém, o
teorema nada nos diz se o estimador de MQO é melhor do que um estimador não linear.

Um caso especial em que o intercepto da reta é 0 (zero) passa pela origem, isto é, α = 0. A equação
da reta se reduz a:

Yi = βXi + ei

O estimador para β (coeficiente angular da reta ou inclinação) expressa a taxa de mudança em Y, isto
é, a mudança em Y quando ocorre a mudança de uma unidade em X. Ele indica a mudança na média da
distribuição de probabilidade de Y por unidade de acréscimo em X:

N
∑ xi yi
β = iN=1
∑ i=1xi2
Neste caso específico, devemos considerar:

• O coeficiente de determinação (R2) não necessariamente é um valor entre 0 e 1, podendo


ser negativo.

31
Unidade I

• Não se confirma a conclusão de que R2 = Corr (X e Y)2.

• Não se garante que a reta ajustada passe pelo ponto médio (X, Y).

• O estimador de β será não viesado somente se α = 0.

Veja as fórmulas a seguir:

σ2
()
Var β = N
∑ i=1xi2
N
σˆ 2 ∑ u
= i=1
ˆ i2
N −1
N
Podemos ter ∑ ui ≠ 0 .
i=1
Portanto, estamos interessados na relação entre as duas variáveis (Y: consumo e X: renda). Observamos
pares de valores X e Y em cada amostra e vamos usá-los para dizer alguma coisa sobre a relação:

y^ = - 15,48 + 0,6991x

Nota-se que as estimativas dos parâmetros dão um conteúdo empírico para a função consumo.
Dados observacionais: geralmente X e Y são variáveis aleatórias, e o acento circunflexo indica
uma estimativa.

Observação

Estimador, também conhecido como uma estatística destinada a


estimar um parâmetro da população, é simplesmente uma regra, fórmula
ou método que nos diz como estimá-lo a partir de uma amostra. Dada uma
amostra, o valor assumido pelo estimador é chamado de estimativa ou
valor estimado do parâmetro. As estimativas obtidas por meio da estatística
variam de acordo com a amostra selecionada.

A diferença entre estatística e estimativa é que a estatística é uma variável aleatória, enquanto a
estimativa é um particular valor dessa variável aleatória.

32
ECONOMETRIA

2.3 Conceito de função de regressão populacional (FRP) e função de


regressão amostral (FRA)

A função de regressão populacional (FRP) é a seguinte:

E(Y/Xi) = f(Xi)

A média condicional é uma função de Xi em que f(Xi) indica alguma função da variável explicativa Xi.

Essa equação é conhecida como função de regressão populacional (FRP) (ou equação de regressão
linear) de duas variáveis. Como uma primeira aproximação ou uma hipótese de trabalho, podemos supor
que FRP E(Y/Xi) seja uma função linear de Xi, do tipo:

E(Y/Xi) = β1 + β2Xi

Onde:

β1: intercepto;

β2: coeficiente de inclinação.

Especificação estocástica:

Yi = β1 + β2Xi + ui

Onde:

ui é uma variável aleatória não observável que pode assumir valores positivos ou negativos, também
conhecida como termo de erro estocástico ou perturbação estocástica.

Já a função de regressão amostral (FRA), na maioria das situações práticas, é somente uma amostra
de valores Y correspondentes e alguns Xs fixos. A nossa tarefa é estimar a FRP com base nas informações
da amostra.

Analogamente à FRP, que fundamenta a reta de regressão da população, podemos desenvolver o


conceito de função de regressão amostral (FRA) para representar a reta de regressão amostral. A amostra
contrapartida da equação que acabamos de apresentar pode ser escrita como:

Y
Y^i = β^ 1 + β^ 2Xi
Xi
Onde:

Y^i: estimador de E(Y/Xi);


33
Unidade I

β^ 1: estimador de β1;

β^ 2: estimador de β2.

Podemos expressar a FRA por sua fórmula estocástica:

Y^i = β^ 1 + β^ 2Xi + ui

Nosso objetivo na análise de regressão é estimar a função de regressão populacional (FRP):

População
(universo de análise)

Yi = α + βXi + ei (FRP)
Parâmetros: α, β
Estimação de
parâmetros
Amostra
(dados observados)

Y^i = α^ + β^ Xi + ei (FRA)

Estimados: α^ , β^

Figura 11 – Estimadores e parâmetros

Por essa estimativa, podemos ver que o coeficiente de declividade é de aproximadamente 0,70, o que
sugere que um aumento de um real na renda real provocará em média um aumento de 0,70 centavos
na despesa real de consumo. Dissemos em média porque a relação entre o consumo e renda é inexata,
como mostra a reta de regressão. Veja a figura a seguir, conforme dados do IBGE:
220
Despesa de consumo - R$ (bilhões)

y = 0,6991x - 15,477
200 R2 = 0,9816
180
160

140
120
100
150 200 250 300 350
Renda - R$ (bilhões)

Figura 12 – Ajuste da reta: renda e despesa de consumo no Brasil de 1996 a 2014

34
ECONOMETRIA

3 TESTE DE HIPÓTESES

É importante também aplicarmos o teste de hipóteses ao nosso modelo de regressão.

Na hipótese nula, os valores de x não têm qualquer relacionamento com os valores de y. Veja:

H0 : β = 0

H0 : β ≠ 0 (teste bilateral)

A hipótese nula é confirmada pela equação Y^i = a +bXi + ei quando se constata que não haverá
qualquer relação entre x e y se o verdadeiro valor do coeficiente angular for zero.

Como

b−β
t=
∑ ( yi − yˆ ) / (n − 2)
2

∑ ( xi − x )
2

a equação tem distribuição t com n - 2 graus de liberdade. Decorre que, se β = 0, então a estatística será:

b
t=
∑ ( yi − yˆ ) / (n − 2)
2

∑ ( xi − x )
2

Podemos calcular o valor dessa estatística. Portanto, a equação da reta de regressão é:

y^ = - 15,48 + 0,6991x

Testamos a existência do efeito de regressão entre duas variáveis em estudo. A hipótese nula é de
não existência de regressão, enquanto a hipótese alternativa é aquela que contempla a regressão. Assim,
o teste de hipótese será delineado:

35
Unidade I

Tabela 3 – Teste de hipótese (H0 : β = 0)

Hipótese nula H0 : β = 0

b
tobs =
∑ ( yi − yˆ ) / (n − 2)
2
Valor da estatística de teste
∑ ( xi − x )
2

Hipótese alternativa Intervalo de rejeição (nível α)


H0 : β ≠ 0 tobs > tn - 2; α

No teste para β, calculamos a região crítica (RC) ao nível de significância de 5%. Podemos calcular o
valor dessa estatística conforme a tabela a seguir, baseada em números do IBGE:

Tabela 4 – Renda, consumo e resíduo

Renda Consumo
Ano xi Yi Y^i ei (Yi - Y^i)2 (Xi - X)2
1996 180,4 116,1 111 5,46 29,86 3145,44
1997 186,5 119,6 115 4,70 22,09 2498,42
1998 187,2 118,7 115 3,31 10,96 2428,93
1999 188,0 119,2 116 3,25 10,57 2350,72
2000 196,3 124,0 122 2,25 5,06 1614,77
2001 199,0 125,0 124 1,36 1,85 1405,07
2002 205,1 126,6 128 -1,30 1,70 984,97
2003 207,4 125,9 130 -3,61 13,03 845,89
2004 219,4 130,8 138 -7,10 50,40 291,87
2005 226,4 136,6 143 -6,19 38,35 101,69
2006 235,4 143,9 149 -5,18 26,88 1,18
2007 249,6 153,0 159 -6,01 36,13 172,02
2008 262,4 162,9 168 -5,06 25,59 671,63
2009 262,0 170,2 168 2,52 6,35 651,06
2010 281,8 180,8 182 -0,72 0,52 2053,52
2011 292,8 189,4 189 0,19 0,04 3171,47
2012 298,4 196,0 193 2,87 8,26 3833,56
2013 307,4 202,8 199 3,38 11,44 5029,05
2014 307,7 205,5 200 5,87 34,49 5071,69
∑ 4.493,20 2.847,00 2.847,00 0,00 333,5904 36,322,9453

36
ECONOMETRIA

b 0,6991
=t = ≅ 30,08
∑ ( yi − yˆ ) / (n − 2) 333,59 /17
2

36.322,95
∑ ( xi − x )
2

Para um teste bilateral no nível de significância de 5%, o valor crítico de uma distribuição t com
17 graus de liberdade é 2,11. Como 30 está na região de rejeição, bem acima do valor crítico, podemos
rejeitar com segurança a hipótese nula de que o coeficiente angular seja zero.

α α
2 2

-2,11 0 +2,11 t

Região de Região de não Região de


rejeição rejeição ou rejeição
aceitação
Valor crítico Valor crítico

Figura 13 – Região crítica para o teste t

4 O GRAU DE AJUSTAMENTO DO MODELO: ANOVA (ANÁLISE DE VARIÂNCIA)

Vamos compreender os três tipos de variação em torno de uma reta de regressão. São eles:

Tabela 5 – Tipos de variação em torno da reta

Variação total = Variação explicada + Variação inexplicada


∑(yi - y)2 = ∑(y^i - y)2 + ∑(yi - y^i)2
Soma do quadrado total = Soma do quadrado da regressão + Soma do quadrado do resíduo

SQTot = SQReg + SQRes

Syy = bSxy = b2Sxx + Syy - bSxy = Syy - b2Sxx

• Variação total: é a soma dos quadrados das diferenças entre o valor y de cada par ordenado e a
média de y.

37
Unidade I

• Variação explicada: é a soma dos quadrados das diferenças entre cada valor previsto de y e a
média de y (explicada pela relação X e Y).

• Variação inexplicada: é a soma dos quadrados das diferenças entre cada valor de y de cada par
ordenado e cada valor de y previsto correspondente (não pode ser explicada pela relação x e y, e
isso ocorre devido ao acaso ou a outras variáveis).
y

{
(xi; yi)
Desvio
{ inexplicado
yi - y^i
Desvio total
yi - y {
(xi; y^i)
y Desvio
explicado
(xi; y)
y^i - y

x
x

Figura 14 – Desvios para cada par de ponto (xi, yi)

Uma propriedade importante é a de que a variabilidade total poderá ser decomposta em duas partes:

• uma, devida aos possíveis efeitos aleatórios (não controlados) que recaiam sobre cada experimento,
que será definida como variabilidade residual;

• outra, a variabilidade atribuída ao efeito da regressão, se este realmente existir.

Podemos conduzir a análise de variância da regressão linear simples conforme a tabela a seguir:

Tabela 6 – Análise da variância

Causas de variação Graus de liberdade Soma de quadrados Quadrados médios


Regressão 1 b . Sxy = b2 . Sxx b . Sxy = b2 . Sxx

Syy − b.Sxy Syy − b2 .Sxx


Resíduo n-2 Syy - b . Sxy = Syy - b2 . Sxx =
n−2 n−2
Total n-1 Syy

Considerando o exemplo anterior, obtemos a seguinte tabela de análise de variância:

38
ECONOMETRIA

Tabela 7 – Análise de variância

Causas de variação Graus de liberdade Soma de quadrados Quadrados médios F


Regressão 1 17.750,96 17.750,96 904,60
Resíduo 17 333,59 19,62
Total 18 18.084,55

Ao nível de significância de 5% e para 1 e 17 graus de liberdade, o valor crítico de F é 4,45 (veja


a tabela da distribuição F de Fisher-Snedecor no AVA). O valor de F calculado, sendo superior ao valor
crítico, é significativo ao nível de 5%. Consequentemente, rejeitamos a hipótese H0 : β = 0 em favor da
hipótese alternativa H0 : β ≠ 0 a esse nível de significância.

Saiba mais

Um bom programa de análise de regressão para computador, além de


calcular o valor de F, apresenta outros parâmetros de avaliação do modelo por
meio do Microsoft Excel: em Opções do Excel, na barra Suplementos, instalar
Ferramentas de Análise e consultar opções Dados, Análise de Dados e
Regressão. Para saber mais sobre o uso de suas ferramentas, indicamos o livro:

LEVINE, D. M. et al. Estatística: teoria e aplicações – usando Microsoft


Excel em português. Tradução: Teresa Cristina Padilha de Souza. Rio de
Janeiro: LTC, 2013.

4.1 O coeficiente de determinação (r2)

O coeficiente de determinação r2 é a razão entre a variação explicada e a variação total. Portanto, r2


é uma medida descritiva da qualidade do ajustamento do modelo:

∑ ( yˆ i −=
y)
2
=r 2 SQReg b2 Sxx
= =
( 0,6991)2 × 36.322,95 ≅ 0,9816
∑ ( yi − y )
2 SQRTot Syy 18.084,55

Teremos uma relação de quanto o modelo de regressão está sendo útil para explicar toda a
variabilidade que aparece em cada uma das observações (é a porcentagem da variância total de y que
é explicada pela variável x).

Anteriormente calculamos o coeficiente de correlação (r). O quadrado desse coeficiente é o coeficiente


de determinação (r2). Para um número fixo n de observações, quanto melhor for o ajuste dos dados,
tanto maior será o valor de r2. Portanto, r2 pode ser visto como uma medida descritiva da qualidade do
ajuste obtido.

39
Unidade I

Observação

Se o coeficiente de correlação é r = 0,9907, então o coeficiente de


determinação r2 = (0,9907)2 ≅ 0,9815.

Isso significa que 98,15% da variação de y podem ser explicados


pela relação entre x e y. Os 1,85% (1 - 0,9815) restantes da variação são
inexplicados e se devem ao acaso, a erros amostrais ou a outros fatores.

Características do modelo de regressão linear simples (MRLS):

• Yi é uma variável aleatória (Yi = a + β1 X1 + ei);

• E(Yi) = E(a + β1 X1 + ei) = µi = a + β1 X1;

• σ2(Yi) = σ2 (a + β1 X1 + ei) = σ2(ei) = σ2 (variância constante);

• Yi e Yj não são correlacionados.

O modelo de regressão linear simples mostra que as respostas Yi são oriundas de uma distribuição de
probabilidades com média E(Yi) = α + βXi e cujas variâncias são σ2, a mesma para todos os valores de X.
Além disso, quaisquer duas respostas Yi e Yj não são correlacionadas.

Os parâmetros α e β não são variáveis aleatórias, são constantes desconhecidas. Entretanto,


^α e β^ são consideradas variáveis aleatórias, pois dependem da amostra considerada (em várias
amostras populacionais poderemos ter diferentes valores para as estimativas dos parâmetros).
Saber como esses estimadores se comportam (são ou não viesados) é importante, bem como saber
as suas variâncias:

σ2 σ2
Var β
= () =N
∑ i=1(xi − x)2 N . Var(x)

Observação

A variância de β^ diminui conforme aumenta a variância de X.

σ2
Var ( α =
)
N
()
+ x 2 Var β ≅ 82,08 + 18.715.790,1 × 0,000473 ≅ 8.935

40
ECONOMETRIA

As variações de α^ e β^ diminuem com o aumento do tamanho da amostra (se N tende ao infinito, as


duas variâncias tendem a zero).

Para procedermos aos cálculos das variâncias de α^ e β^ (estimadores de MQO), necessitamos de σ2


parâmetro, que nem sempre é conhecido. Mas, para estimá-lo, utilizaremos a seguinte fórmula:

σ2
=
∑ i=1=
(ei )2 333,59
≅ 19,6229
N−2 17

O estimador é considerado não viesado de σ2 ao utilizarmos σ2 para calcular as variâncias de α^ e β^ .


Assim, teremos também estimadores não viesados.

s2 s2 19, 6229
Var(b ) = = = @ 0, 000544
å Ni=1(xi - x )
2 N . Var( x ) 19 x 1, 91173

σ2
Var ( α =
)
N
()
+ x 2 Var β ≅ 1,03263 + 55.922,78 × 0,00054 ≅ 31,24

4.2 Análise de resíduos

Existem várias técnicas para analisarmos os resíduos, mas, nesta fase introdutória, iremos ressaltar
uma representação gráfica que é obtida plotando os pares (xi, ei). Obtido o gráfico dos resíduos,
precisamos saber como identificar possíveis causas que comprometem a confiabilidade do modelo. A
situação ideal para os resíduos é estarem distribuídos aleatoriamente em torno do zero, sem nenhuma
observação muito discrepante.

A análise de resíduos nos permite:

• descobrir se as hipóteses do modelo de regressão linear são válidas para o caso em questão;

• analisar se a correlação entre as duas variáveis é ou não forte, na qual utilizamos a relação
SQReg ou (1 − SQRes ) .
SQT SQT

Veja os dados a seguir, conforme apresentados pelo IBGE:

41
Unidade I

Tabela 8 – Resíduos

Ano xi Yi Y^i ei
1996 180,4 116,1 111 5,46
1997 186,5 119,6 115 4,70
1998 187,2 118,7 115 3,31
1999 188,0 119,2 116 3,25
2000 196,3 124,0 122 2,25
2001 199,0 125,0 124 1,36
2002 205,1 126,6 128 -1,30
2003 207,4 125,9 130 -3,61
2004 219,4 130,8 138 -7,10
2005 226,4 136,6 143 -6,19
2006 235,4 143,9 149 -5,18
2007 249,6 153,0 159 -6,01
2008 262,4 162,9 168 -5,06
2009 262,0 170,2 168 2,52
2010 281,8 180,8 182 -0,72
2011 292,8 189,4 189 0,19
2012 298,4 196,0 193 2,87
2013 307,4 202,8 199 3,38
2014 307,7 205,5 200 5,87
∑ 4.493,20 2.847,00 2.847,00 0,00

8,00 y = 0,0026 x2 - 1,28x + 151,09


R2 = 0,76
6,00

4,00

2,00
2009
Resíduos

0,00
100 150 200 250 300 350
-2,00 Renda

-4,00

-6,00

-8,00 2004

Figura 15 – Renda: plotagem de resíduos

42
ECONOMETRIA

Analisando as hipóteses citadas anteriormente a serem cumpridas pelo modelo, destacamos, com
base no comportamento dos resíduos (conforme o gráfico anterior), o pressuposto da homocedasticidade
(variância do erro ser constante), que não está sendo cumprido. Tal procedimento é importante para se
realizar inferências em relação aos parâmetros α e β. Havendo problemas na não confirmação da hipótese
de homocedasticidade, podemos utilizar, por exemplo, as transformações de dados, isto é, utilizar uma
segunda variável independente X2 no modelo assumindo os valores de X1 elevado ao quadrado. Ficaríamos,
portanto, com um modelo Y = α + β1X1 + β2X2, onde X2 = (X1)2, o que corresponde a uma função polinomial
de ordem 2 representada pela equação Y = α + β1X1 + β2X12, conforme apresentado a seguir:

α β1 β2
1996 - 2014 Yi = 135,61 - 0,5815.X1 + 0,0026.X12 R2=0,9957
Se = 2,21 (6,24) (-3,27) (7,22) R2ajustado=0,9951
(estatística t entre parênteses) F= 1.837,28

Apresentamos a seguir os gráficos dos resíduos do modelo atendendo o pressuposto da


homocedesticidade (variância constante dos resíduos), conforme dados do IBGE.
Renda plotagem de resíduos Renda2 plotagem de resíduos
10 10
Resíduos

Resíduos

5 5

0 0
100 200 300 400 20.000 40.000 60.000 80.000 100.000
-5 Renda -5 Renda2

Figura 16 – Plotagem de resíduos

Nota-se também, através do comportamento dos resíduos, que podemos desmembrar a base de
dados em dois ciclos distintos (contração e expansão do consumo em relação à renda), conforme
indicado nos gráficos a seguir.

Através do gráfico superior, de período completo (1996 a 2014), conseguimos distinguir os dois
ciclos apresentados nos demais:

• I ciclo: contração do consumo em relação à renda (1996 a 2003), apresentando uma PMgC
de 0,40, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de
37 centavos na despesa de consumo.

• II ciclo: expansão do consumo em relação à renda (2004 a 2014), apresentando uma PMgC
de 0,83, isto é, para esse período, a cada acréscimo de um real na renda, tem-se um acréscimo de
83 centavos na despesa de consumo.

43
Unidade I

128
126
y = 0,3966x - 45,048
124 R2 = 0,9504
Consumo 122
120

118
116
114
170 175 180 185 190 195 200 205 210
A) Renda

y = 0,8275x - 51,231
215 R2 = 0,9937
195
Consumo

175

155
135
115
210 230 250 270 290 310 330
B) Renda

220
y = 0,6991x - 15,477
200 R2 = 0,9816
180
Consumo

160

140
120
100
C) 170 190 210 230 250 270 290 310 330
Renda

Figura 17 – Ciclos de consumo em relação à renda.


A) 1º ciclo – contração (1996 a 2003); B) 2º ciclo - expansão (2004 a 2014); C) Ciclo completo (1996 a 2014)

A partir de 2004, a cada um real de acréscimo na renda tivemos 43 centavos a mais no


consumo, em relação ao período de 1996 a 2004, ou seja, saímos de uma PMgC de 0,40 para uma
PMgC igual a 0,83.

Nota-se que a partir de 2004, no período em análise (1996-2014), o consumo no Brasil cresceu
muito. Uma das teorias que a economia nos oferece é a da propensão marginal a consumir (PMgC),
que analisa o que acontece com o consumo quando há um acréscimo na renda. Segundo essa teoria,
44
ECONOMETRIA

as duas coisas não crescem na mesma proporção. A partir de certo ponto, a renda pode até continuar
aumentando que o consumo tende a desacelerar.

A propensão marginal a consumir da chamada classe média brasileira, a maioria da nossa população,
é muito alta. Quando as condições de renda melhoram, naturalmente ela vai saciar a sua demanda
reprimida – aparenta estarmos no limite em que o aumento de consumo ainda é proporcional ao aumento
da renda. O consumo consciente, pelo modo de ser dos brasileiros, extremamente imediatista, voltado
ao desfrute do momento, foi deixado de lado. As pessoas não aprenderam a transformar aumento de
salário em poupança, em investimento para o futuro.

Nessa análise da variável residual da economia brasileira, no período de 1996 a 2014, além do
conhecimento teórico, é importante uma análise das especificidades em que as variáveis envolvidas
(Y: endógena e X: exógena) se relacionam. Devemos explicar se:

• valores (-) representam contração do consumo em relação à renda;

• valores (+) representam expansão do consumo em relação à renda.

Por exemplo: os dados econométricos (no caso, o comportamento da variável residual) sugerem a
resposta de algumas questões (isto é, os dados perguntam):

• O aumento do consumo em relação à renda significa o quê? E a retração?

• A crise de consumo, descrita dessa forma, é uma crise econômica ou se trataria de um período de
priorização do investimento em relação ao consumo?

No caso em questão, o que se observou foi a tendência de poupar ou de consumir, e sua variação no
tempo. “Crises” no consumo na verdade indicariam maior tendência a poupar no período em questão.

Lembrete

É necessário ter conhecimento teórico do que uma variável significa


para outra.

Friedman (1953, p. 7), ao esclarecer o significado do material empírico para as teorias, afirma que
“[...] a evidência empírica é vital em duas fases diversas, embora intimamente associadas: na fase de
elaboração das hipóteses e na do teste de sua validade” – portanto, para descobrir se nossas estimativas
obtidas satisfazem as expectativas da teoria que estamos testando. Segundo Hill, Griffithis e Judge
(2003), uma teoria ou hipótese que não seja verificável por meio de evidência empírica não pode ser
admitida como parte da investigação científica.

A economia positiva independe, em tese, de qualquer posição ética especial ou de juízos normativos.
Ela trata “do que é”, e não “do que deveria ser”. A tarefa dessa economia positiva é a de provar um sistema
45
Unidade I

de generalizações passível de ser utilizado para fazer previsões corretas acerca das consequências de
qualquer alteração das circunstâncias. O desempenho de uma tal economia será ajuizado em termos da
precisão e da experiência (FRIEDMAN, 1953, p. 2).

Verifica-se que o coeficiente β é menor do que um, sendo portanto concordante com a teoria. Temos
que verificar se o parâmetro β = 0,6991 é estatisticamente abaixo de um e diferente de zero (β ≠ 0), pois
se β for zero, os valores de x (renda) não têm relação com os valores de Y (consumo). Para tal, utilizamos
inferência estatística (teste de hipóteses).

4.3 Previsão ou predição (utilização do modelo)

Por exemplo, suponha uma expectativa de um PIB de 297 bilhões de reais para o ano seguinte.
Qual a previsão de consumo em um ano a ser projetado? Se acreditarmos que a função consumo irá se
manter, teremos:

y^ = - 15,48 + 0,6991x

y^ = - 15,48 + 0,6991 x 297 = 192,15, ou cerca de 192 bilhões de reais.

Para o próximo ano, o governo pretende anunciar um plano de aumento dos tributos para pessoa
física, a retomada do imposto sobre operação financeira (IOF). Qual será o efeito disso na economia? Um
modelo econométrico pode se propor a estimar tais mudanças.

Observação

Geralmente é necessário restringir a abrangência do modelo para alguns


valores ou região da(s) variável(is) preditora(s).

Ao utilizarmos um modelo de regressão para fins de previsão, precisamos considerar somente o intervalo
relevante da variável X: renda (inclui todos os valores, desde o menor até o maior valor de X que foram
utilizados no desenvolvimento do modelo de regressão). Há duas situações ao prever Y: consumo para um
determinado valor de X: renda, pois podemos interpolar dentro dos limites desse intervalo relevante de
valores de X, mas podemos extrapolar além do intervalo dos valores de X. Ao utilizarmos a variável X: renda
(em bilhões de reais), ela varia desde 180 até 308 (vide tabela de resíduos anteriormente apresentada). Por
conseguinte, devemos prever os consumos anuais somente para as rendas entre 180 e 308 bilhões de reais. É
necessária muita atenção na utilização da análise de regressão ao extrapolar (ir além do intervalo relevante),
pois quanto maior for a diferença (distância) entre x e x, maior será o intervalo de previsão.

Em geral, um modelo de regressão pode ser usado com alguma confiança dentro da gama de valores X
que participou para o cálculo dos parâmetros de regressão. Se sairmos um pouco do intervalo de X, estaremos
extrapolando o modelo. Uma extrapolação para valores de X pouco afastados do intervalo normalmente
não apresenta problemas, mas para valores longe do intervalo de X raramente são satisfatórias.

46
ECONOMETRIA

Podemos calcular previsões para novas observações mediante a construção de intervalos de previsão.

Para um novo valor da variável independente x, podemos prever em que intervalo de valores
esperamos encontrar y. Um intervalo de previsão para uma observação futura, com (1 – α) × 100% de
confiança, é dado por:
1 (x − x)2
IP ( 95% ) : Yˆ ± t  α
. S 1 + +
n−2;  n Sxx
 2

1 (297 − 236,48)2
IP ( 95% ) : 192,15 ± 2,11. × 4,43 1 + +
19 36.322,95

IP(95%) : 192,15 ± 10,04

Interpretação: para um dado x, prevê-se que y pertença ao intervalo indicado (1 – α) × 100%, isto é,
95% das vezes – chamamos intervalo de previsão ou intervalo de confiança [182,11; 202,19].

4.4 Multiplicador keynesiano da renda

O conceito de propensão marginal ao consumo é de grande valia quando se observa o multiplicador


keynesiano M = 1 / (1 - PMgC), do qual este é uma das variáveis. No caso mais simples de uma economia
fechada e sem governo, definindo I para o investimento, Y para a renda e β para a propensão marginal
a consumir, tal multiplicador da renda, encontrado em qualquer manual de Macroeconomia, pode ser
dado por 1 / (1 - β). Quanto maior for o seu valor, maior será a renda final da economia em análise – o
consumo (demanda) estimula a produção, que emprega cada vez mais os meios de produção disponíveis,
empregando mais pessoas, que consumirão mais, formando um ciclo virtuoso. Nasceu da necessidade
de Keynes medir o que acontece com a renda quando há uma variação no investimento e diz que o
efeito da variação na renda decorrente da variação no investimento de uma unidade monetária é dado
pelo multiplicador:

M = 1 /( 1 - β) = 1 / (1 - PMgC) = 1 / (1 - 0,6991) = 1 / 0,3009 = 3,32

Nessa mesma fórmula, observa-se também que o multiplicador é determinado pelo inverso da
propensão marginal à poupança (1 - β) = S M = 1/S. Logo, quanto menor for o seu valor, considerando
ser este um número compreendido entre 0 e 1, maior será o multiplicador.

Que uma demanda por um paletó implica uma demanda por tecido; que
uma demanda por tecido implica uma demanda por fios e linhas, e também
por lã; que os serviços de fazendeiros, comerciantes, engenheiros, mineiros,
trabalhadores no transporte, secretários, estão todos envolvidos – esse é o
ABC da ciência econômica (KEYNES, 1929, p. 105-106).

47
Unidade I

Com base na PMgC de 0,6991, obtemos 3,32, como multiplicador. Ou seja, com um acréscimo de um
real no investimento, obtemos um aumento de quase 3,5 vezes na renda.

É frequentemente dito que na Grã-Bretanha um gasto de capital em obras


públicas custa £500 para que um homem seja empregado por um ano. Isso
é baseado no montante de trabalho diretamente empregado no local. Mas
é fácil perceber que os materiais usados e o transporte requerido também
geram emprego. Se nós consideramos isso, como deveríamos, o gasto de
capital por homem-ano de emprego adicional é usualmente estimado, no
caso da construção, por exemplo, em £200 (KEYNES, 1933, p. 339).

4.5 Uso do modelo para fins de elaboração de política econômica

Suponha que o governo acredite que um nível de gastos de 225 bilhões de reais manterá o
desemprego em 7,5%:

y^ = - 15,48 + 0,6991x

225 = - 15,48 + 0,6991x

X = 344 (aproximadamente)

Ou seja, um nível de renda de R$ 344 bilhões, com uma PMgC = 0,6961, produzirá um gasto de
R$ 240,5 bilhões.

Assim, o governo pode, por meio de políticas monetária e fiscal, manipular a variável de controle X
(PIB) para produzir o nível desejado de Y (consumo).

A atitude prospectiva significa olhar longe, preocupar-se com o longo prazo; olhar
amplamente, tomando cuidado com as interações; olhar a fundo, até encontrar
os fatores e tendências que são realmente importantes; arriscar, porque as visões
de horizontes distantes podem fazer mudar nossos planos de longo prazo; e levar
em conta o gênero humano, grande agente capaz de modificar o futuro (GASTÓN
BERGER, 1957 apud MARCIAL; GRUMBACH, 2007, p. 28).

Para elaboração das projeções, utiliza-se uma combinação de modelos econométricos e técnicas
de construção de cenários. Enquanto o modelo econométrico responde pela estimativa das variáveis
endógenas, as técnicas de cenários e as avaliações qualitativas permitem traçar hipóteses para o
comportamento das variáveis exógenas.

48
ECONOMETRIA

Observação

O pressuposto ceteris paribus (ou tudo o mais constante) é parte do


processo de abstração na construção de um modelo econômico. Ele nos
permite estudar a relação entre duas variáveis enquanto o valor de todas
as demais permanece constante.

Resumo

Nesta unidade, aprendemos que o campo de investigação da


econometria teve início com os estudos da análise da demanda efetuada
por Augustin Cournot e seus modelos de oligopólio, bem como com os
princípios de economia de Alfred Marshall. Mas é com a Econometric
Society e a publicação de trabalhos na área que se percebe que os dados
econômicos são gerados por sistemas de relações que se apresentam
estocásticos, dinâmicos e simultâneos.

Vimos que a econometria promove a junção de duas grandes áreas: a


matemática e a estatística; a primeira oferece condições para que seja possível
deduzir proposições baseadas na lógica dedutiva, enquanto a segunda instrui
a forma de obter tais proposições, só que apoiada na lógica indutiva. Daí que
surge o papel do econometrista – ou econômetra, como também pode ser
chamado o profissional da área: exprimir as teorias econômicas em termos
matemáticos para que seja permitido efetuar a verificação com o emprego
de métodos estatísticos no sentido de medir o impacto de uma variável sobre
qualquer outra com que haja alguma relação.

A unidade apresentou as diferentes fases da investigação econômica,


sendo uma delas a da construção de modelos apoiada pela fase ligada à
teoria econômica, em que as duas se completam, pois a teoria econômica
não consegue oferecer medidas numéricas da relação entre variáveis. Nesse
aspecto, vale relembrar as funções principais da econometria. Uma delas
é a de testar implicações de uma teoria por meio da interpretação desta
em proposições que possam ser testadas em linguagem econométrica.
Outra função é a de calibrar e de mensurar parâmetros de um modelo
econométrico, pois a previsão de uma relação entre variáveis – ou mesmo
os valores assumidos por uma variável – é outra função. Por fim, pode-se
destacar mais uma função da econometria: a capacidade de caracterizar
relações e fenômenos que muitas vezes não estão previstos em teorias
consagradas, desenvolvendo modelos econométricos que os explicam.

49
Unidade I

Com relação aos modelos, aprendemos que eles devem apresentar a


propriedade de serem relevantes para a análise e conclusões econômicas, o
mais simples possível do ponto de vista de seu entendimento; devem ter
plausibilidade teórica e apresentar precisão na apresentação dos coeficientes.
Ainda: devem reunir capacidade explicativa e preditiva.

Quanto aos modelos de previsão e ao desenvolvimento de uma


metodologia de pesquisa econométrica, foi possível perceber que eles iniciam
a partir da teoria econômica para depois buscar o modelo econométrico
mais apropriado apoiado no modelo matemático a ele atrelado. O próximo
passo é o da tabulação dos dados, estimação dos parâmetros estabelecidos
no modelo para que seja possível avaliá-lo segundo os critérios estatístico,
econométrico e econômico. O fim do processo culmina com a avaliação
da teoria e a verificação de sua compatibilidade ou não com os dados
disponíveis. Ainda no que diz respeito ao desenvolvimento de uma
metodologia em econometria, a unidade dedicou espaço ao tratamento da
formulação da teoria ou das hipóteses do modelo matemático a ser utilizado,
sua especificação, a preparação para obtenção de dados econômicos não
experimentais, chamados também de dados observacionais.

Outro destaque da unidade e de extrema importância ao entendimento


dos modelos econométricos está no modelo de regressão linear simples,
que possibilita o desenvolvimento de um modelo capaz de prever os valores
de uma variável numérica com base no valor assumido por outras variáveis.
Ainda: a análise de regressão permite identificar o tipo de relação matemática
que existe entre uma variável dependente e uma independente, quantificar
o efeito que alterações na variável independente exercem sobre a variável
dependente, sendo certo que o modelo apresenta outras possibilidades de
análise econômica e estatística.

A unidade avançou para a caracterização do que vem a ser o teste de


hipótese e sua importância para a análise econométrica, abordou a análise
de variância, o coeficiente de determinação como medida descritiva da
qualidade do ajustamento do modelo econométrico, passou para a análise
dos resíduos e finalizou a discussão com a utilização do modelo no sentido
de previsão e predição.

Exercícios

Questão 1. (Enade 2006) Considere a tabela a seguir, advinda de uma análise de regressão associada
à função de consumo keynesiana

50
ECONOMETRIA

∆Ct = a + b . ∆Rt + εt,

onde C é o consumo e R é a renda.

Tabela 9

Estimativa da função de consumo


Coeficiente Erro-padrão Estatística-t
a -0,0005 0,0046 -0,11
b 0,4568 0,0675 6,76

R2 0,2793 Durbin-Watson 1,88

R2 ajustado 0,2732

Número de
SQR 0,3016 120
observações

Uma possível conclusão dessa análise de regressão é que

A) deve ser rejeitada a hipótese nula de que o intercepto da reta de regressão seja igual a zero.

B) deve ser rejeitada a hipótese nula de que o coeficiente angular da reta de regressão seja
igual a 0,45.

C) a estimativa de β não é significantemente diferente de zero a um nível de confiança de 90%.

D) a estatística de Durbin-Watson deveria ser mais distante de 2 para que a não correlação dos
resíduos ficasse caracterizada.

E) o modelo proposto explicou 27,93% das flutuações da variação do consumo.

Resposta correta: alternativa E.

Análise das alternativas

A) Alternativa incorreta.

Justificativa: a análise de a hipótese nula do intercepto da reta de regressão (a) ser igual a zero
indica uma estatística de teste (estatística t) de -0,11. Por ser um número próximo de zero, não podemos
rejeitar a hipótese nula. Além disso, o valor obtido a = -0,005(46) pode ser nulo dentro do intervalo de
uma vez o desvio padrão. Logo, a hipótese não pode ser descartada.

51
Unidade I

B) Alternativa incorreta.

Justificativa: se não conhecermos o formulário do teste de hipótese nula, chegaremos à conclusão


errada, uma vez que a estatística t para o coeficiente angular (b) estimado apresenta um número bem
elevado (6,76), o que induziria a rejeitar a hipótese nula. Para a hipótese nula de 0,45, esse valor da
estatística t precisa ser recalculado:

c 0, 4568  0, 45 0, 0068


Estatística t (H 0 )     0,10
Erro  padrão 0, 0675 0, 0675

Obtivemos uma estatística t com um valor próximo a zero, o que não permite a rejeição da
hipótese nula.

Além disso, o valor obtido a = -0,4568(675) pode ser igual a 0,45 dentro do intervalo de uma vez o
desvio padrão. Logo, a hipótese não pode ser descartada.

C) Alternativa incorreta.

Justificativa: considerando uma distribuição bicaudal, na tabela da distribuição t de Student,


temos ttab = 1,66. Como ttab < tcalc, rejeitamos a hipótese nula de b ≈ 0 com 90% de confiança.

D) Alternativa incorreta.

Justificativa: para que não fique caracterizada a correlação entre os resíduos, o valor da estatística
Durbin-Watson tem de se aproximar de 2.

E) Alternativa correta.

Justificativa: como o coeficiente de determinação r2 é de 0,2793, o modelo proposto explica 27,93%


das flutuações observadas.

Questão 2. (Enade 2015) Sabe-se que o aumento de anos de experiência em certas atividades
profissionais acarretam acréscimos salariais. Porém acredita-se que esses acréscimos sejam decrescentes
ao longo dos anos. Para estudar esse problema, foi obtida, a partir de uma amostra aleatória de 526
indivíduos, os dados de salário por hora (w), medidos em reais (R$), e a experiência (x), medida em anos
de experiência na profissão.

O modelo econométrico foi especificado como:


w  0  1x  2x2  u; u  N 0, 2 

52
ECONOMETRIA

Os resultados encontrados para a estimação foram:

wˆ  3, 73  0, 298x  0, 0061x2
 0, 35  0, 041 0, 0009
Nessa expressão, a probabilidade exata do teste t para cada parâmetro estimado encontra-se,
respectivamente, entre parênteses (p-valor).

Considere as hipóteses a seguir.

• H0 = a experiência não tem efeito sobre o salário ao longo dos anos.

• H1 = a experiência tem efeito sobre o salário ao longo dos anos.

Observando o comportamento do salário em relação à experiência, tendo em conta os resultados


encontrados, avalie as afirmativas a seguir.

I – Não é possível rejeitar H0 ao nível de significância de 5%.

II – Em face dos resultados, ao nível de significância de 1%, rejeita-se H0.

III – Ao serem representados graficamente os resultados acima, em que o salário por hora é função
da experiência, observa-se que, inicialmente, a experiência pode exercer uma influência crescente sobre
o salário, porém, após alguns anos, passa a ser decrescente.

É correto o que se afirma em

A) I, apenas.

B) III, apenas.

C) I e II, apenas.

D) II e III, apenas.

E) I, II e III.

Resposta correta: alternativa D.

53
Unidade I

Análise das afirmativas

I – Afirmativa incorreta.

Justificativa: sempre é possível existir a rejeição. Para isso, basta que os resultados sejam maiores do
que o nível de significância. Com a hipótese de que a experiência não tem efeito sobre o salário ao longo
dos anos, qualquer resultado do teste t será maior do que a(0,05).

II – Afirmativa correta.

Justificativa: sempre é possível rejeitar o resultado. Para isso, basta que os resultados sejam maiores
do que o nível de significância. Com a hipótese de que a experiência não tem efeito sobre o salário ao
longo dos anos, qualquer resultado do teste t será maior do que o valor de , que, nesse caso, é 0,01.

III – Afirmativa correta.

Justificativa: a expressão de estimação é uma função do segundo grau com coeficiente negativo.
Isso significa que o vértice da parábola é o ponto de máximo, como pode ser observado na figura a
seguir, gráfico da função wˆ  3, 73  0, 298x  0, 0061x2 :
7,5

6,5

6
Salário por hora (w)

5,5

4,5

3,5

3
0 5 10 15 20 25 30 35 40
Experiência em anos (x)

Figura – Variação do salário hora em função do tempo de experiência

Na figura anterior, é possível observar que o salário cresce com o tempo de experiência até que esse
tempo seja igual a 24 anos. A partir de 25 anos de experiência, o salário diminui.

54

Você também pode gostar