Econometria

ECONOMETRIA
Unidade III
7 ANÁLISE DE REGRESSÃO MÚLTIPLA: ESTIMAÇÃO E INFERÊNCIA
Passamos pelas etapas de elaboração de um modelo de regressão linear simples (MRLS). Agora,
conforme fluxograma a seguir, avaliaremos os pressupostos básicos teóricos e metodológicos e
encontraremos algumas hipóteses que não foram atendidas, como o pressuposto da normalidade, em
que os resíduos não se comportaram como uma distribuição de probabilidade normal, o que vem a
comprometer os testes de significância e os intervalos de confiança das estimativas do modelo.
1ª etapa: especificação ou construção do modelo
Observação do
Teoria econômica mundo real
Formulação de hipóteses
Modelo matemático
Modelo econométrico
2ª etapa: estimação do modelo especificado
Coleta de dados apropriados
Estimação dos parâmetros
3ª etapa: avaliação da equação estimada
Avaliação dos resultados
Não Sim
As hipóteses são
aceitáveis?
Rejeição das hipóteses Aceitação das hipóteses
Revisão das Desistência das Previsão e/ou

hipóteses hipóteses decisões
Figura 42 – Passos para a elaboração de um modelo econométrico
107
Unidade III
Para solucionar o problema encontrado, o procedimento é selecionar as principais variáveis

explicativas, as de maior consistência entre os diversos modelos de regressão, e encontrar o de maior
eficiência técnica e teórica, o mais significativo.
A seguir, vamos nos dedicar à construção e análise de um modelo de regressão capaz de resolver o
problema encontrado na etapa anterior (MRLS), ampliar a eficácia e o grau de explicação nas variações
da produção de açúcar (r2) e garantir maior confiabilidade nas projeções futuras. Apresentamos um
modelo de regressão linear múltipla (MRLM), no caso em questão (da produção de açúcar), no qual a
variável dependente Y é explicada por duas variáveis independentes (X).
O modelo passa a incluir uma segunda variável: X2: Produção de etanol hidratado. O novo modelo
oferece um grau de explicação maior, isto é, de um coeficiente de determinação (ajustado) de 0,7450
passa para 0,9084, e de um erro-padrão de estimação de 2.005,91 passa para 1.202,09, uma queda de
40% em seu valor. Isso apresenta um grau de explicação (r2) de 93%, como detalhado na tabela a seguir,
conforme dados do IBGE:
Tabela 34 – Produção de açúcar e etanol hidratado
Preço do açúcar VHP Produção de etanol

Preço do açúcar (mercado externo) hidratado
Ano mil toneladas US$/saca de 50 quilos em mil litros
2005/06 26.420,0827 8,8975 7.746.040,5
2006/07 30.223,6000 14,4450 9.211.462,2
2007/08 31.279,7000 10,1283 14.367.117,5
2008/09 31.620,2000 11,1508 16.619.713,8
2009/10 33.074,7000 14,5258 18.812.782,8
2010/11 38.168,4000 19,6842 19.578.500,3
2011/12 38.271,8000 25,2400 13.749.286,0
2012/13 38.336,8761 23,3375 13.788,092,0
2013/14 37.878,2633 17,5258 16.132.283,8
2014/15 35.560,1797 16,4067 16.931.881,4
2015/16 33.489,1427 13,1275 19.253.024,1
108
ECONOMETRIA
Tabela 35 – Análise de variância (Anova)
Resumo dos resultados

Estatística de regressão
R múltiplo 0,9627
R-quadrado 0,9267
R-quadrado ajustado 0,9084
Erro-padrão 1.202,09
Observações 11
Anova
gl SQ MQ F F de significação
Regressão 2 146.234.836,98 73.117.418,49 50,60 0,0000288
Resíduo 8 11.560.075,67 1.445.009,46
Total 10 157.794.912,66
95%
Coeficientes Erro-padrão Stat t Valor-P 95% inferiores superiores
Interseção 18.179,933265 1.763,899430 10,31 0,0000068 14.112,37 22.247,49
Preço do açúcar VHP 607,225875 73,574330 8,25 0,0000349 437,56 776,89
(x1)
Produção de etanol (x2) 0,000412 0,000100 4,13 0,0032963 0,000182 0,000641
Resultados do Resíduos Resultados de Probabilidade
Resíduos
Observação Previsto(a) Yi Resíduos Percentil Yi
padrão
1 26.770,88 -350,80 -0,3263 4,55 26.420,08
2 30.742,62 -519,02 -0,4827 16,64 30.223,60
3 30.243,42 1.036,28 -0,9638 22,73 31.279,70
4 31.791,44 -171,24 -0,1593 31,82 31.620,20
5 34.473,47 -1.668,77 -1,5521 40,91 33.074,70
6 38.190,90 -22,50 -0,0209 50,00 33.489,14
7 39.165,32 -893,52 -0,8310 59,09 35.560,18
8 38.026,05 310,83 0,2891 68,18 37.878,26
9 35.461,89 2.416,37 2,2474 77,27 38.168,40
10 35.111,40 448,78 0,4174 86,36 38.271,80
11 34.075,56 -586.42 -0,5454 95,45 38.336,88
109
Unidade III
Ao nível de significância de 5% e para 2 e 8 graus de liberdade, o valor crítico de F é 4,6 (vide

tabela de distribuição F de Fisher-Snedecor no AVA). O valor de F calculado (50,6), sendo superior
ao valor crítico, é significativo ao nível de 5%. O coeficiente de determinação, ou R-quadrado, nos
diz que há forte correlação entre as variáveis (0,9267) e todos os valores-P (e o F de significação)
< 5%. Consequentemente, rejeitamos a hipótese H0 : β1 = β2 = 0 em favor da hipótese alternativa
H1 : β1 ≠ β2 ≠ 0 a esse nível de significância, indicando através do teste F de Snedecor que as variáveis
explicativas exercem conjuntamente efeito significativo sobre a variável dependente Y.
Preço do açúcar VHP (x1) Produção etanol (x2)
Plotagem de resíduos Plotagem de resíduos
-4.000 -4.000
Resíduos
Resíduos
2.000 2.000
0 0
-2.000 5 10 15 20 25 30 -2.000 10.000.000 20.000.000 30.000.000
Preço do açúcar VHP (x1) Produção etanol (x2)
Figura 43 – Plotagem dos resíduos X1 e X2
Graficamente, observamos que os valores estão bem dispersos. Podemos concluir que há
homocedasticidade, isto é, variância constante dos resíduos.
Para o modelo de regressão linear simples (MRLS), valem as hipóteses:
• distribuição normal dos resíduos;

• homocedasticidade;
• ausência de autocorrelação;
• linearidade nos parâmetros.
Para os modelos de regressão linear múltipla (MRLM), adicionalmente, devemos incluir a hipótese
de multicolinearidade. Ela ocorre com duas ou mais variáveis independentes do modelo explicando o
mesmo fenômeno, variáveis contendo informações similares, altamente correlacionadas. Encontramos
dificuldade na separação dos efeitos de cada uma delas. A multicolinearidade tende a distorcer os
coeficientes (βs) estimados. Como consequência, apresentam erros-padrões maiores, o que significa
menor eficiência no modelo e estimativas mais imprecisas, estimadores mais sensíveis a pequenas
variações dos dados e até mesmo a dificuldade na separação de seus efeitos. Exemplo: explicar preço de
consumo de energia elétrica em uma residência com regressão que tenha como variáveis explicativas a
área da casa e o número de cômodos, ou o número de pessoas e o número de camas.
Veja a tabela a seguir, elaborada a partir de números do IBGE:
110
ECONOMETRIA
Tabela 36 – Matriz de correlação
Yi Preço do açúcar VHP (X1) Prod. etanol (X2)

Yi 1 0,87778391 0,55042553
Preço do açúcar VHP (X1) 0,87778391 1 0,184492579
Prod. etanol (X2) 0,55042553 0,184492579 1
7.1 Testes para identificação de multicolinearidade
7.1.1 Teste de Farrar e Glauber
Veja a fórmula:
  1 r12 ….. r1k 

 1 
X 2teste =− n − 1 − × ( 2 × k + 5)  × Ln  Det r21 1….. r2k 
 6   
 rk1 rk2 ….. 1 
Onde:
n: número de observações;
k: número de variáveis independentes;
Ln: logaritmo neperiano;
Det: determinante;
rij: coeficiente de correlação parcial.
Calculando o valor da estatística X2teste, temos:
  1 0,87778 0,55043
 1  
X 2teste =− n − 1 − × ( 2 × k + 5)  × Ln  Det 0,87778 1 0,18449 
 6    
 1 
 0,55043 0,18449
Pela tabela, encontramos o valor crítico qui-quadrado, onde:
• nível de significância de 5% (α = 0,05);

k −1
• graus de liberdade igual a k . , sendo k = número de variáveis independentes.
2
Veja:
k −1 1
gl = k . = 2 × =1
2 2
111
Unidade III
Portanto:
X2crítico; 0,05; 1 = 0,0039
 1 
X 2teste =− n − 1 − × ( 2 × k + 5)  × Ln (0,070767)
 6 
 1 
X 2teste = − 11 − 1 − × ( 2 × 2 + 5)  × −2,64837
 6 
X2teste = - [10 - 1,5] x - 2,64837
X2teste = - [8,5] x - 2,64837 = 22,51
Teste de aceitação – teste de Farrar e Glauber:
H0: ausência de multicolinearidade;
H1: existe multicolinearidade.
Portanto, caso X2teste > X2crítico , rejeita-se a hipótese nula de ausência de multicolinearidade (há
correlação entre as variáveis).
7.1.2 Teste da VIF (Variance Inflation Factor)
Veja a fórmula:
1
VIFk =
(1 − rk2 )
Onde:
rk = coeficiente de correlação da variável k com as demais variáveis.
1 1
=
VIFk = 2
= 1,0352
(1 − 0,18449 ) 0,9660
112
ECONOMETRIA
Regra de decisão para o VIF:
Acima de 10
Multicolinearidade
problemática
De 1 até 10
multicolinearidade aceitável
VIFk = 1,0352
Até 1
Sem multicolinearidade
Figura 44 – Regra de decisão para o Teste VIF (Variance Inflation Factor)
7.1.3 Teste da Tolerance (TLk)
Veja a fórmula:
TLk = (1 - r2k)
Onde:
rk = coeficiente de correlação da variável k com as demais variáveis.
Calculando o índice: TLk = (1 - 0,184492) = 0,9660.
Regra de decisão para o TLk:
Acima de 1
Sem multicolinearidade
De 0,1 até 1
Multicolinearidade aceitável
TLk = 0,9660
Abaixo de 0,1
Multicolinearidade
problemática
Figura 45 – Regra de decisão para o teste TLk (Teste da Tolerance)
113
Unidade III
8 DEMAIS ANÁLISES EM ECONOMETRIA
8.1 Quebras Estruturais e Variáveis Dummies
É importante, ao escolher as variáveis que irão compor a base de dados para a elaboração de um
modelo, saber o nível de confiabilidade e o período que formará a base de estudo (conhecimento a
priori de uma teoria e métodos estatísticos). Essa fase inicial permite conhecer como se dá a distribuição
desses dados e também se a série testada é normal (teste de Kolmogorov-Smirnov para amostra maior
que 30 elementos). Além disso, possibilita selecionar os principais indicadores para mostrar as principais
medidas estatísticas dessa amostra, a qual podemos considerar como uma fase exploratória, que são:
amplitude, valor mínimo, valor máximo, média e desvio-padrão.
Além de analisar esses dados, deve-se elaborar um box plot, gráfico que permite a visualização
de como esses dados estão distribuídos na amostra. Isso torna possível perceber se há a presença de
outliers, o que gera uma maior segurança para a construção dos modelos de regressão. Segundo Gujarati
(2000), dependendo da amostra utilizada, é necessário tratar os outliers para que não distorçam os
resultados encontrados pela regressão. O método mais comum para esse tratamento é a eliminação
desses elementos da amostra.
A seguir, vamos nos lembrar dos pressupostos básicos que precisam ser seguidos para garantir a
qualidade do resultado dos modelos de regressão linear:
I – E(ε) = 0 (a esperança matemática dos resíduos é nula, ou seja, a média dos resíduos é nula).
II – Erros são normalmente distribuídos (os resíduos têm distribuição normal).
III – Os Xi são fixos (não estocásticos, não aleatórios).
IV – E(ε2) = σ2 (variância constante e igual a σ2, condição de homocedasticidade dos resíduos).
V – Os resíduos são independentes entre si: E(εi εj) = 0, i ≠ j (erros não são autocorrelacionados).
VI – As variáveis Xi não podem ser combinações lineares entre si.
Na maioria dos casos, quando o objeto de estudo envolve relações sociais, como as relações
econômicas, essas hipóteses são violadas, especialmente as quatro últimas.
A multicolinearidade (hipótese VI) traz correlações entre duas ou mais variáveis explicativas
(independentes) onde há correlação bem próxima ou igual a 1 (ou menos um), isto é, a variação de uma
delas é decorrente da variação de outra.
• Consequências: a variância dos coeficientes estimados das variáveis explicativas aumenta (é muito
grande) quando ocorre multicolinearidade (os testes t apresentam baixa significância, mas isso não
significa que sejam inválidos), podendo nos levar, do ponto de vista econômico, a conclusões erradas,
visto que seus valores ficam muito sensíveis quando se acrescenta ou se retira uma variável do modelo ou
114
ECONOMETRIA
quando há pequenas alterações no tamanho da amostra. Nesse contexto, as propriedades dos estimadores
não se alteram, continuam não viesados, eficientes e consistentes, bem como as previsões elaboradas.
• Identificação: obter um teste F bastante significante, um R2 alto acompanhado de estatísticas de

teste (t de Student) insignificantes, ou sinais de coeficientes diferentes do esperado é um indício
de multicolinearidade em um modelo. Outra forma de identificar a presença de multicolinearidade
é através de correlação entre as variáveis, duas a duas.
• Como corrigir: retirando variáveis correlacionadas do modelo; a escolha das variáveis é pela
permanência da(s) que possui(em) alta significância apresentada pelo(s) seu(s) coeficiente(s).
Outra opção é aumentando a amostra, pois se a amostra é pequena, a variância dos estimadores
será grande ou mesmo terá de reformular o modelo. Dependendo do objetivo proposto para o
modelo – por exemplo, previsões –, a retirada tende a reduzir a eficiência das previsões. Portanto,
não há necessidade de retirar, pois diante da multicolinearidade as propriedades dos estimadores
estão preservadas (não viés, eficiência, consistência).
Já a autocorrelação (hipótese V) é a correlação de uma variável com valores defasados (diferença

no tempo) dela mesma. Mas a hipótese fala de autocorrelação residual (do erro). É importante destacar
que o erro não é uma variável especificamente, mas um conjunto de diversas influências que são difíceis
de serem medidas e das quais se espera que não exerçam influência umas sobre as outras.
É importante observar que a omissão de uma variável relevante transfere sua influência sistemática
para o erro, podendo acarretar a autocorrelação residual. Um outro erro que se pode cometer na
existência de autocorrelação é a especificação errada na forma funcional do modelo.
No entanto, a autocorrelação pode ocorrer pela própria natureza do processo, casos em que a
autocorrelação é parte integrante do comportamento das variáveis distribuídas no tempo. Por exemplo,
na produção agrícola, a decisão de quanto se vai produzir não é simultânea à formação de preço (o
preço que influencia a quantidade produzida é o do período anterior, não o atual).
• Consequências: o estimador de mínimos quadrados ordinários (MQO) deixa de apresentar a

menor variância possível entre todos os estimadores (não é o mais preciso). Com esse problema, os
estimadores ainda sustentam a hipótese de que são não viesados e consistentes – que é a de que
os regressores (os X) não sejam correlacionados com o erro –; portanto, a hipótese não é violada
mesmo na presença de autocorrelação.
As exceções advêm dos modelos que incluem, entre as variáveis explicativas, defasagens da variável
dependente, em modelos do tipo:
Yt = α + β1Yt + β2Yt - 1 + ut
• Identificação: pela aplicação do teste de Durbin-Watson, que é a forma mais comum para
identificar a existência de autocorrelação.
115
Unidade III
• Como corrigir: se o problema da autocorrelação for de especificação do modelo, a correção será

feita pela inclusão de mais variáveis ou com a alteração da forma funcional do modelo. Caso
contrário, em que a autocorrelação é parte integrante do modelo estimado, será necessário um
conhecimento prévio de como é a estrutura da autocorrelação:
Yt = α + βXt + ut
Reduziremos a um modelo sem autocorrelação, que pode ser estimado pelo MQO e apresenta o
mesmo coeficiente β do modelo original, representado a seguir:
Yt* = α* + βXt* + ut
Onde:
DW = Durbin-Watson
Yt* = Yt - DW . Yt-1
Xt* = Xt - DW . Xt-1
Por sua vez, a heterocedasticidade (hipótese IV) estabelece que a variância dos resíduos deve ser
constante (homocedasticidade). Um exemplo é a poupança das famílias em relação à renda: as famílias de baixa
renda pouparão valores próximos entre si, enquanto entre as famílias de alta renda, mais ricas, a amplitude de
variação se torna maior, pois encontram-se famílias que tendem a gastar mais, e outras, a poupar mais.
• Consequências: podemos dizer que são as mesmas que acontecem na autocorrelação, pois os
estimadores de MQO continuam não viesados, porém não são mais os de menor variância.
• Identificação: através de um teste comum de comparação de variâncias (por exemplo, teste F), que
consiste em separar o modelo de regressão em duas partes – uma com valores menores de X e outra
com valores maiores –, faz-se o teste para comparar a variância em cada um dos modelos estimados.
Estima-se o modelo com o total das observações e, pelo comportamento dos resíduos num gráfico
nota-se que eles são mais espalhados quando os valores de X são maiores, por exemplo. Ao proceder
a divisão em dois grupos (valores dos extremos de X), é indicado, para obter maior eficiência, omitir
os dados do meio. Existem outros testes, tais como de White e o de Goldfeld-Quandt.
• Como corrigir: primeiro, é necessário tentar definir o padrão associado à heterocedasticidade. Partimos
de um modelo de regressão que é dado a seguir. Suponhamos que exista heterocedasticidade:
Yi = αi + β1Y1t + β2Y2t + β3Y3t + et
Se conhecermos que a variância dos erros é dada por:
var(et) = Ziσ2
116
ECONOMETRIA
isto é, que a variância não é constante, notaremos ser uma variável Zi multiplicada por uma constante.
Porém, se conseguirmos eliminar essa variável da variância, encontraremos uma variância constante,
portanto livre da heterocedasticidade.
A simultaneidade (hipótese III) estabelece que as variáveis independentes (X) num modelo de
regressão devem ser fixos (não estocásticos, não aleatórios). Se uma (ou mais) variável independente for
aleatória, será preciso que, pelo menos, ela não tenha correlação com o resíduo. Se tiver, significa que há
uma determinação mútua, onde se discute a relação de causa e efeito. Um exemplo clássico é entre as
duas variáveis preços e quantidades (vende mais porque o preço está baixo ou está com o preço baixo
porque vende mais?). A quantidade afeta o preço, que afeta a quantidade. Em economia, esse tipo de
situação ocorre com frequência.
Pelo lado da oferta (lei da oferta), a quantidade a ser produzida ou ofertada é dada como função
única do preço (P):
Qofertada_i = α0 + α1Pi + ui
sendo α1 > 0.
Pelo lado da demanda (lei da procura), na quantidade a ser consumida ou demandada, além do preço
(P), é levada em conta a renda (R), conforme a função:
Qdemandada_i = β0 + β1Pi + β2Ri + vi
Sendo β1 < 0.
O que se observa é a busca do equilíbrio de mercado, a quantidade que é consumida é a que

é vendida:
Qofertada_i = Qdemandada_i
Qi = α0 + α1Pi + ui
Qi = β0 + β1Pi + β2Ri + vi
Nota-se que P e Q se determinam mutuamente nesse modelo. Por esse motivo, são consideradas
variáveis endógenas, interagindo internamente dentro de um mesmo sistema. A renda (R) já é uma variável
independente no modelo; fora do sistema, seu valor já é predeterminado, sendo considerada uma
variável exógena.
• Consequências: a regressão por MQO dessas equações anteriormente apresentadas nos levará a
estimadores viesados e inconsistentes, visto que uma das variáveis explicativas, um dos regressores,
é uma variável endógena, determinada pelo próprio modelo representado aqui, e, portanto, está
correlacionada com os resíduos, levando a estimadores viesados e inconsistentes.
117
Unidade III
• Identificação: partindo do sistema de equações que apresentamos, vamos isolar as variáveis

endógenas (P e Q). Igualando a variável Q das equações Oferta e Demanda, encontraremos uma
equação que coloca o preço em função apenas das variáveis exógenas (R, no caso, uma só).
Substitui-se a equação do preço que acabamos de encontrar na equação de oferta (Qofertada_i),
chegando a isolar Q em função de R.
Passamos a ter um novo sistema de equações, que isola as variáveis endógenas em cada equação,
chamadas de equações na forma reduzida; o sistema original de equações recebe o nome de
forma estrutural do modelo.
O sistema de equações na forma reduzida deixa de ter os problemas de que um ou mais regressores
são correlacionados com os resíduos, o que permite serem estimados pelo MQO. Ao estimarmos as
equações na forma reduzida, os parâmetros estimados não se encontram na forma normal, sendo
preciso encontrar os da forma estrutural (original).
• Como corrigir: para estimar um modelo de equações simultâneas, estimam-se os parâmetros da

forma reduzida. A partir da identificação da relação entre os parâmetros da forma reduzida e
da forma estrutural, podemos encontrar os parâmetros na sua forma original. Existem critérios
a seguir ao aplicar os métodos para corrigir pelo fato de aparecer um dos regressores como uma
variável endógena que está correlacionada com os resíduos, levando a estimadores viesados e
inconsistentes. Para atender o nosso objetivo, vamos destacar o método dos mínimos quadrados
de dois estágios, um método aplicado a equações superidentificadas (onde o número de
variáveis endógenas incluídas – 1 é menor que o número de variáveis exógenas excluídas), que
consiste em estimar as equações da forma reduzida e encontrar os valores estimados para as
variáveis endógenas.
Saiba mais
Sobre o problema da simultaneidade, leia as páginas 321-329 da obra

a seguir:
SARTORIS, A. Estatística e introdução à econometria. São Paulo:

Saraiva, 2003.
Observando os aspectos já trabalhados até aqui, fica claro que o objetivo de qualquer modelo de
regressão é estimar os parâmetros de modo a alcançar o melhor valor de Y, isto é, minimizar os erros.
A introdução das variáveis dummies na análise de regressão amplia, de certa forma, o poder de
análise dos modelos, pois permite incorporar nos modelos variáveis importantes que se pretende analisar
e que não podem ser medidas quantitativamente.
118
ECONOMETRIA
Porém, algumas vezes queremos incluir no modelo de regressão variáveis qualitativas (ou categóricas,
binárias, ou dummies). Isso ocorre em fenômenos pouco usuais que poderão determinar viés nas
estimativas se não forem controlados. Esse tipo de fenômeno é conhecido na literatura como quebra
estrutural, e para controlá-lo são utilizadas as variáveis qualitativas dummies ou binárias. A seguir,
apresentamos um exemplo para análise desse fenômeno: a demanda por importações no Brasil entre
1995 e 2010, a partir de dados extraídos do IBGE:
200.000
180.000
160.000
140.000
US$ milhões
120.000
100.000
80.000
60.000
40.000
20.000
0
Ano
05
02
03
04
06
07
08
09
10
95
96
97
98
99
00
01
20
20
20
20
20
20
20
20
20
20
19
19
19
19
19
20
Figura 46 – Teste de hipótese de uma quebra estrutural na demanda por importações no Brasil (1995-2010). Dois períodos em
destaque: governo FHC (1996-2002) e governo Lula (2003-2010)
Nota-se na figura, aparentemente, um padrão sazonal, além de uma possível quebra estrutural
localizada no início do ano de 2003 indicada pela mudança de tendência a partir de 2004 na demanda
de importação. Um dos motivos para considerar isso como uma quebra estrutural foi que o fluxo de
capitais externos, o real, entrou em recuperação em movimento de valorização, enquanto a inflação se
encontrava em níveis reduzidos, e a indústria brasileira vinha apresentando dificuldade para aumentar
a participação dos produtos de conteúdo tecnológico mais elevados. Em consequência, a pauta de
exportações vinha sendo dominada por produtos de média e baixa intensidade tecnológica. Associado
a esse contexto, havia o crescimento da renda social, que contribuiu para aumentar a demanda por
importações (compras no exterior e/ou de produtos importados). Portanto, faz-se necessário testar a
hipótese da existência de uma quebra estrutural ou não no período em análise; caso aceita a hipótese,
justifica-se uma correção no modelo.
De acordo com Greene (2003), quando empregamos um modelo de regressão que envolve o uso de
séries temporais, pode acontecer que se verifique uma mudança estrutural na relação entre a variável
dependente, o regressando (a explicada), e as independentes, os regressores e os Xs (as explicativas).
Por mudança estrutural entendemos que os valores dos parâmetros do modelo não se mantêm iguais
durante todo o período considerado. As possíveis diferenças, isto é, as mudanças estruturais, podem ser
provocadas por diferenças no intercepto ou no coeficiente angular, ou em ambos. Para identificar essas
alterações, utiliza-se o teste de Chow, muito útil nesse tipo de análise.
O teste de Chow envolve a igualdade de coeficientes de diferentes regressões ou teste de

equivalência de duas regressões. Às vezes não sabemos ao certo se um dado modelo se aplica a dois
119
Unidade III
conjuntos diferentes de dados (1994-2003 e 2004-2008). Para testar, iniciaremos pela hipótese nula
de que a as regressões, respectivamente do primeiro e do segundo período, são idênticas, e veremos se
podemos rejeitar essa hipótese. Para aplicarmos o teste de Chow, devemos considerar os dois modelos
de regressão a seguir.
O modelo para que se verifique a existência ou não de quebra estrutural nas importações brasileiras no
período 1996-2010 envolve três variáveis, sendo a variável importações (US$ milhões) a ser explicada por
duas outras variáveis PIB (US$ milhões), conforme dados do IBGE:
Tabela 37 – Análise de quebra estrutural na demanda

por importação no Brasil (1995-2010)
Ano Importação PIB Taxa de câmbio LN (IM) LN (PIB) LN (câmbio)

1995 49.971,9 771 117,48 10,8192 6,6480 4,7662
1996 53.345,8 849 113,73 10,8845 6,7445 4,7338
1997 59.747,2 885 112,67 10,9979 6,7852 4,7244
1998 57.714,4 867 112,66 10,9633 6,7653 4,7243
1999 49.210,3 600 166,18 10,8039 6,3972 5,1131
2000 55.783,3 657 153,98 10,9292 6,4877 5,0368
2001 55.572,2 560 182,36 10,9254 6,3282 5,2060
2002 47.240,5 509 189,93 10,7630 6,2323 5,2467
2003 48.290,2 560 186,27 10,7850 6,3284 5,2272
2004 62.834,7 669 177,29 11,0483 6,5050 5,1778
2005 73.605,5 894 146,05 11,2065 6,7954 4,9839
2006 91.350,8 1.105 131,51 11,4225 7,0080 4,8791
2007 120.617,4 1.394 121,25 11,7004 7,2398 4,7979
2008 173.106,7 1.689 115,23 12,0617 7,4318 4,7469
2009 127.704,9 1.664 114,95 11,7575 7,4170 4,7445
2010 181.648,7 2.208 100,00 12,1098 7,7000 4,6052
Período 1: (1994-2003)
Yi = β1 + β2X2i + ... + βkXki + ei
IM1 = - 13.009,78 + 88,36.PIB + 76,38. Tx. câmbio
R12 = 0,6792
n1 = 10
k=2
120
ECONOMETRIA
SQR1 = 43.721.998,42
Período 2: (2004-2008)
Yi = δ1 + δ2X2i + ... + δkXki + ei
IM2 = - 77.311,91 + 104,30.PIB + 394,01. Tx. câmbio
R22 = 0,9348
n2 = 10
k=2
SQR2 = 1.124.264.737,77
Tendo estimado o modelo em estudo representado pelas duas equações, aplicando a cada uma,
individualmente, o MMQO, e por não ter estabelecido nenhuma restrição aos parâmetros do modelo,
podemos calcular a soma dos quadrados irrestrita como a soma dos quadrados dos resíduos das
equações individuais (SQRIR = SQR1 + SQR2). O número de graus de liberdade é a soma do número de
graus de liberdade em cada regressão individual, isto é, (n1 –k) + (n2 –k) = n1 + n2 – 2k.
Supondo que a hipótese nula seja verdadeira, temos que:
H0 = β1 = δ1, β2 = δ2 , … , βk = δk
e
Var(ei) = Var(ej).
Então, o modelo de regressão pode ser reescrito como uma única equação:
Yi = β1 + β2X2i + ... + βkXki + ei
em que o i passa a ser de i = 1 a n1 + n2.
Portanto, a equação do modelo (1996-2010):
IM1+2 = - 72.381.43 + 103,64.PIB + 365,73. Tx. câmbio

R2 = 0,9588 n2 = 16 k = 2 SQRR = 1.240.348.131,26
Nessa equação, estimada pelo método dos mínimos quadrados ordinários (MMQO), calculamos a soma
dos quadrados dos resíduos restrita SQRR. Se a hipótese nula for verdadeira, as restrições não prejudicarão
o poder explanatório do modelo, e SQRR não será muito maior que SQRIR. Portanto, podemos aplicar um
121
Unidade III
teste F (Fisher-Snedecor) para verificar se a diferença entre os dois valores para a soma dos quadrados dos
resíduos é significativa ao nível de 5%. Como o número dos graus de liberdade é n1 + n2 - 2k na regressão
irrestrita e existem k restrições, a estatística F adequada é a definida a seguir. Temos:
SQR IR = 43.721.998,42 + 1.124.264.737,77 =1.167.986.736,19
SQR R = 1.240.348.131,26
(SQRR − SQRIR ) / k
Fk, n1+ n2 −2k =
(SQRIR ) / (n1 + n2 − 2k)
(1.240.348.131,26 − 1.167.986.736,19) / 2
Fk, n1+ n2 −2k = 0,37
1.167.986.736,19 /12
250.000
Real
Previsto
200.000
US$ milhões
150.000
100.000
50.000
0
Ano
03
04
05
06
07
08
09
10
95
96
97
98
99
00
01
02
20
20
20
20
20
20
20
20
20
20
19
19
19
19
19
20
Figura 47 – Importações brasileiras (1995-2010)
Finalizando, temos que se a estatística F = 0,37 for menor do que o valor crítico da distribuição F
com k e n1 + n2 - 2k graus de liberdade F(0,05; 2,12) = 3,89, não se rejeitará a hipótese nula. Isso implica dizer
que não é preciso estimar duas regressões separadas: não existe quebra de estrutura, e os dados podem
ser usados em conjunto, conforme visualizado na figura anterior.
Lembrete
A estatística tem uma distribuição F porque cada soma de desvios
quadrados tem uma distribuição qui-quadrado, tendo o numerador k
graus de liberdade e o denominador n1 + n2 - 2k graus de liberdade. Como
as duas distribuições são independentes, a razão segue uma distribuição
F (Fisher-Snedecor).
O método dos mínimos quadrados pode modelar curvatura transformando as variáveis (funções
linearizáveis). É necessário especificar a forma funcional correta para modelar qualquer curva. Conforme
122
ECONOMETRIA
a curvatura apresentada na figura anterior, a função indicada a ser linearizável é a logaritma na sua
forma original Y = aXb e na sua forma linearizada (por transformação) lnY = lna + b . lnX. Portanto,
aplicando à função de demanda por importações a transformação logarítmica, propõe-se um melhor
ajuste assumindo o seguinte formato:
ln(Yi) = β1 + β2ln(X2i) + ... + βkln(Xki) + ei
Todas as variáveis se encontram transformadas para o seu logaritmo natural enquanto expressão de
taxa média de crescimento.
ln(IMi) = β1 + β2ln(PIBi) + βkln(Tax. Câmbioi) + ei
Assim, temos o resultado de um modelo linearizável (por transformação logarítmica) e a comparação

com o modelo anterior:
ln(IMi) = - 3,4572 + 1,3987 . ln(PIBi) + 1,0456 . ln(Tax. Câmbioi) + ei

(-3,14) (20,35) (7,47) (estatística t entre parênteses)
R2 = 0,9802 R2 (ajustado)= 0,9771 n2 = 16 k = 2 F = 321,62
IM = - 72.381 . 43 + 103,64 . PIB + 365,73. Tx. Câmbio

(-3,28) (14,21) (3,17) (estatística t entre parênteses)
R2 = 0,9588 R2 (ajustado) = 0,9524 n2 = 16 k = 2 F = 151,09
Notamos uma melhora no modelo transformado ou linearizável. Sabemos que o modelo de regressão só
fornece as melhores estimativas quando todas as pressuposições são atendidas, e é muito importante testá-las.
Observação
A variável dummy representa estados ou níveis de fatores, ou seja,
representa algo que não possui valores numéricos ou, caso possua, esses
valores não têm realmente um significado numérico.
Assim, uma variável dummy (D), pode ser descrita da seguinte maneira:
0, se a característica não estiver presente

D=
1, se a característica estiver presente
A variável dummy recebe este nome por ser uma variável explicativa (X) que assume apenas dois
valores, 0 e 1 (variável indicadora), ao longo de toda a amostra. Indica a presença (1) ou a ausência (0)
de um atributo. O funcionamento da variável é o seguinte:
123
Unidade III
Período sem a quebra: D = 0.
Yi = α + βXi + δD + ei
Portanto:
Yi = α + βXi + ei
Período da quebra: D = 1.
Yi = (α + δ) + βXi + ei
Outro formato possível que a variável dummy pode assumir refere-se a mudanças na inclinação.
A variável, assim, assume o valor zero para o período sem a mudança e o valor igual ao da variável cuja
inclinação mudou para o período com mudança.
O modelo passa a funcionar da seguinte forma:
Período sem a quebra: D = 0.
Portanto:
Yi = α + βXi + ei
Período da quebra: D = Xi
Yi = α + (β + δ)Xi + ei
Na análise de regressões múltiplas, os coeficientes de cada variável dummy (binária) medem

o impacto diferencial entre a categoria que recebe o valor 1 e a categoria que foi excluída da
regressão (que recebe o valor zero). Através do teste t-Student é que se avalia a hipótese nula de
que a participação nas categorias incluídas e excluídas terá o mesmo impacto. Quando se utilizam
dois ou mais conjuntos de variáveis dummies, os resultados da regressão se tornam mais difíceis
de serem interpretados.
Três formas de inserção das variáveis binárias em um modelo de regressão linear:
• Forma aditiva: Y = α + β1X1 + β2D + u
• Forma multiplicativa: Y = α + β1X1 + β2X1D + u
• Forma mista: Y = α + β1X1 + β2X1D1 + β3D2 + u

124
ECONOMETRIA
Na forma aditiva, a variável dummy (D) altera o termo constante (intercepto) do modelo de
regressão linear:
Onde:
Yi = consumo do indivíduo i;
Xi = renda do indivíduo i;
D = variável dummy: 1 para indivíduo do sexo masculino e 0 para indivíduo do sexo feminimo.
Por hipótese E(ei) = 0, portanto, temos:
Consumo previsto, em função da renda, para indivíduos do

Yi = (α + δ) + βXi
sexo masculino (D = 1).
Yi = α + βXi + ei
sexo feminino (D = 0).
Sendo δ o diferencial entre as rendas médias de homens e mulheres.
Consumo Y Yi = (α + δ) + βXi
Yi = α + βXi
(α + δ)
β
Renda X
Figura 48
Variáveis binárias, que são incorporadas num modelo de regressão para dar conta de um
deslocamento do intercepto como resultado de algum fator qualitativo, são chamadas de variáveis
binárias de intercepto ou, simplesmente, variáveis dummies de intercepto.
Observação
Interpretação dos coeficientes ligados às variáveis dummies
correspondem à diferença em relação ao valor do intercepto e, portanto, à
categoria que ele representa (ou categoria de referência).
125
Unidade III
Na forma multiplicativa (ou de inclinação), a variável dummy (D) altera o coeficiente de uma
variável explicativa do modelo de regressão linear:
Yi = α + βX1 + δDiX1 + ei
(DiX1: representa a interação de renda e sexo)
Onde:
Yi = α + βX1 + δDiX1
(DiX1: representa a interação de
renda e sexo)

Yi = α + (β + δ)Xi
Para as mulheres, cada aumento adicional de 100 reais acrescenta β reais ao consumo médio. Para
os homens, cada aumento adicional de 100 reais acrescenta β + δ reais ao consumo médio.
Consumo Y Yi = α + (β + δ)Xi
Yi = α + βXi
(α + δ)
β
Renda X
Figura 49
Portanto, apresenta o efeito de interação de variáveis explicativas.
126
ECONOMETRIA
Na forma mista, a variável dummy (D) altera o intercepto e o coeficiente de uma variável explicativa
do modelo de regressão linear:
Yi = α + βX1 + δDi + γDiX1 + ei
Onde:

Yi = (α + δ) + (β + y)Xi

Yi = α + βXi
Para as mulheres, cada aumento adicional de 100 reais acrescenta β reais ao consumo médio. Para
os homens, cada aumento adicional de 100 reais acrescenta β + δ reais ao consumo médio.
Consumo Y
Yi = (α + δ) + (β + y)Xi
Yi = α + βXi
(α + δ)
β
Renda X
Figura 50
Agora estendemos a noção de variável binária em que algumas das variáveis independentes são
contínuas, enquanto outras são binárias. Vamos utilizar o exemplo da função consumo e verificar se o
comportamento de consumo da economia no período do governo FHC comparado com o do governo
Lula se tornou diferente. Casos diferentes podem ser analisados a partir de uma função simples de
consumo agregado determinado pela renda agregada sem defasagem. Veja os dados a seguir, de acordo
com o IBGE:
127
Unidade III
Tabela 38 – Abrangência: Brasil (unidade: R$ 1.000.000,00 – valores constantes de 1995)
Y X
Ano Consumo Renda D DX
1996 116.080 180.397 0 0
1997 119.601 186.521 0 0
1998 118.739 187.151 0 0
1999 119.189 188.027 0 0
2000 123.995 196.278 0 0
2001 124.951 199.006 0 0
2002 126.599 205.082 0 0
2003 125.908 207.422 1 207.422
2004 130.848 219.369 1 219.369
2005 136.634 226.394 1 226.394
2006 143.855 235.364 1 235.364
2007 153.027 249.650 1 249.650
2008 162.919 262.367 1 262.367
2009 170.180 262.037 1 262.037
2010 180.781 281.764 1 281.764
Caso I:
Yy = α + β1X1 + ei
Yy = - 491,70 + 0,6270X1
Este modelo apresenta um comportamento de consumo idêntico, em todos os aspectos, para os dois
períodos de governo.
Caso II:
Yy = α + β1X1 + δ1Di + ei
Yy = - 20.943,25 + 0,7417Xi - 8,814,35D
A variável dummy D será igual a 0 se referente ao governo FHC e 1 se vinculada ao governo Lula.
Este caso corresponde à pressuposição de que o intercepto da função consumo mude no período do
governo Lula, mas que o parâmetro de inclinação permaneça o mesmo. Um modo de certificar
se de fato tal mudança é estatisticamente significativa é oferecido pelo teste da hipótese nula
de que δ1 = 0. Aplicando o teste t de Student, temos que o valor calculado de t-teste (stat-t = -3,50)
em módulo é maior que o t-crítico = 2,18 (tabela, com 5% de significância e gl II = 12). Portanto, o
coeficiente da variável dummy D é diferente de zero, isto é, a mudança de comportamento de consumo
é significativa estatisticamente entre os dois períodos de governo.
128
ECONOMETRIA
Caso III:
Yy = α + β1X1 + δ1(DiX1) + ei
Yy = 26.827,24 + 0,7719Xi - 0,418(DiXi)
Este caso corresponde à suposição de que o intercepto permaneceu constante, mas a

inclinação mudou. Um teste para certificar se de fato tal mudança é estatisticamente significativa
é oferecido pelo teste da hipótese nula de que o coeficiente de DiXi = 0. Aplicando o teste t de Student,
temos que o valor calculado de t-teste (stat-t = -3,1) em módulo é maior que o t-crítico = 2,18 (tabela,
com 5% de significância e gl II = 12). Portanto, o coeficiente da variável dummy DX é diferente de
zero, isto é, a mudança de comportamento de consumo é significativa estatisticamente entre os
dois períodos de governo.
Caso IV:
Yy = α + β1Xi + γDi + δ(DiXi) + ei
Yy = 35.799,03 + 0,4459Xi + 72.713,26XDi + 0,3253(DiXi)
Neste caso, é permitido mudar tanto a inclinação como o intercepto. Nota-se que o modelo
continua sendo expresso por uma única equação em que se supõe que a variância do termo de erro seja
igual nos dois períodos analisados.
Aplicando o teste t de Student, temos que o valor calculado de t-teste (stat-t para a variável dummy
D = -3,4 e para a dummy DX = 3,0) em módulo é maior que o t-crítico =2,20 (tabela, com 5% de
significância e gl II = 11). Portanto, o coeficiente das variáveis dummies D e DX é diferente de zero, isto
é, a mudança de comportamento de consumo é significativa estatisticamente, tanto para o intercepto
quanto para a inclinação, entre os dois períodos de governo.
A estimação através do método dos mínimos quadrados (MMQ) produz estimativas únicas do
erro-padrão da regressão e das distribuições dos parâmetros da regressão estimados.
Caso V:
YyFHC = αFHC + β1FHCXiFHC + eiFHC
YyLULA = αLULA + βiLULAXiLULA + eiLULA
Neste caso, a proposta é elaborar duas regressões, uma para cada período de governo, o que permite
acompanhar a variância dos erros dos parâmetros em cada um dos períodos e obter as estimativas
separadas dos erros-padrão das duas regressões em análise. O que se pretende é verificar se os parâmetros
estimados de regressão no caso IV (período 1996-2010) e no caso V (equação período FHC, de 1996 a
2002, e equação período Lula, de 2003 a 2010) são equivalentes.
129
Unidade III
No entanto, a escolha entre o modelo único para o período (Caso IV) e o modelo desmembrado nos
dois períodos (Caso V) vai depender de o comportamento da variância do erro ser constante ao longo
de todo o período considerado (1996-2010).
Saiba mais
Leia a obra a seguir:
SILVEIRA, F. G. et al. (Org.). Gasto e consumo das famílias brasileiras

contemporâneas. v. 2. Brasília: Ipea, 2007. Disponível em: http://ipea.gov.
br/portal/images/stories/PDFs/livros/Livro_completo2.pdf. Acesso em:
5 abr. 2017.
Veremos agora como podemos ajustar um modelo mais geral, no qual, por exemplo, também as
inclinações possam ser distintas. O modelo se propõe a explicar as variações dos rendimentos familiares
per capita (variável dependente Y) através da média de anos de estudos (variável independente X) de
62 municípios que compõem as três regiões metropolitanas: de Campinas (19), Ribeirão Preto (25) e
Sorocaba (18). Para representar as três regiões metropolitanas, utilizaremos duas variáveis dummies,
conforme tabela a seguir:
Tabela 39 – Valores das variáveis dummies
Variáveis dummies
Regiões metropolitanas
DR DS
Campinas 0 0
Ribeirão Preto 1 0
Sorocaba 0 1
Tabela 40
% de pessoas Rendimento Média de Média de

Taxa de D_
Seq. Região Cidade em domicílios familiar per anos de D>1.300 anos de DR
analfabetismo pobres
pobres capita (Y) estudos (X) estudos (X)
6 1 Holambra 8,1 3,7 1.820,91 6,57 1 6,57 0 0
1 1 Americana 6,0 5,1 1.634,62 7,92 1 7,92 0 0
18 1 Valinhos 7,4 5,4 2.016,13 7,89 1 7,89 0 0
19 1 Vinhedo 7,9 5,8 2.283,26 7,93 1 7,93 0 0
14 1 Pedreira 9,2 6,1 1.317,20 6,61 1 6,61 0 0
9 1 Itatiba 8,6 7,0 1.561,63 7,23 1 7,23 0 0
61 3 Tietê 6,4 7,5 1.526,03 7,14 1 7,14 0 0
12 1 Nova Odessa 7,7 7,6 1.212,54 7,40 0 7,40 0 0
32 2 Monte Alto 10,8 8,1 1.209,61 7,03 0 7,03 0 1
130
ECONOMETRIA

Taxa de D_
36 2 Ribeirão Preto 5,6 8,1 1.859,94 8,48 1 8,48 0 1
Santa Barbara
15 1 8,1 8,2 1.171,30 6,98 0 6,98 0 0
D’Oeste
10 1 Jaguariúna 10,4 8,2 1.474,52 7,39 1 7,39 0 0
13 1 Paulínia 8,0 8,3 1.861,36 7,46 1 7,46 0 0
22 2 Brodowski 9,8 8,4 1.138,65 6,66 0 6,66 0 1
8 1 Indaiatuba 8,4 8,7 1.611,46 7,44 1 7,44 0 0
43 2 Sertãozinho 10,1 9,1 1.452,87 6,96 1 6,96 0 1
51 3 Jumirim 8,1 9,3 941,86 6,46 0 6,46 0 0
3 1 Campinas 6,3 9,7 2.073,56 8,50 1 8,50 0 0
59 3 Sorocaba 6,0 9,9 1.619,19 7,96 1 7,96 0 0
26 2 Dumont 12,2 10,1 1.368,76 6,87 1 6,87 0 1
29 2 Jaboticabal 9,3 10,2 1.371,27 7,41 1 7,41 0 1
25 2 Cravinhos 11,2 10,7 1.319,22 6,72 1 6,72 0 1
56 3 Salto 8,1 10,8 1.247,73 7,15 0 7,15 0 0
55 3 Porto Feliz 9,5 11,1 1.068,90 6,44 0 6,44 0 0
50 3 Itu 9,4 11,6 1.554,78 7,20 1 7,20 0 0
30 2 Jardinópolis 10,1 11,9 1.203,78 6,71 0 6,71 0 1
35 2 Pradópolis 13,6 12,3 1.070,09 6,48 0 6,48 0 1
62 3 Votorantim 7,0 12,5 1.144,38 7,12 0 7,12 0 0
Engenheiro
5 1 12,1 12,8 1.101,26 6,44 0 6,44 0 0
Coelho
17 1 Sumaré 10,3 13,0 1.064,13 6,69 0 6,69 0 0
Araçoiaba da
47 3 11,6 13,2 1.108,24 6,66 0 6,66 0 0
Serra
2 1 Artur Nogueira 11,9 13,5 1.157,86 6,68 0 6,68 0 0
20 2 Altinópolis 10,8 13,6 1.415,15 6,37 1 6,37 0 1
44 2 Taquaral 14,3 14,4 787,06 5,12 0 5,12 0 1
40 2 São Simão 8,3 14,6 1.112,82 7,17 0 7,17 0 1
45 3 Alumínio 7,1 14,8 1.117,28 7,47 0 7,47 0 0
31 2 Luis Antônio 9,5 14,8 1.143,59 6,66 0 6,66 0 1
23 2 Cajuru 11,9 14,9 1.043,53 6,44 0 6,44 0 1
42 2 Serrana 11,5 14,9 901,53 6,14 0 6,14 0 1
34 2 Pontal 15,2 15,2 1.312,52 5,47 1 5,47 1 1
Santo Antonio
16 1 13,5 15,5 1.172,74 5,94 0 5,94 1 0
de Posse
58 3 São Roque 9,4 15,7 1.532,15 6,99 1 6,99 1 0
7 1 Hortolândia 7,6 15,9 971,65 6,62 0 6,62 1 0
Santa Rosa de
38 2 8,9 15,9 1.072,56 6,86 0 6,86 1 1
Viterbo
4 1 Cosmópolis 9,5 16,5 1.081,74 6,76 0 6,76 1 0
52 3 Mairinque 9,8 16,6 1.073,18 6,77 0 6,77 1 0
46 3 Araçariguama 10,0 16,8 1.040,25 5,79 0 5,79 1 0
131
Unidade III

Taxa de D_
Santo Antônio
39 2 11,3 17,1 945,09 6,01 0 6,01 1 1
da Alegria
33 2 Pitangueiras 15,7 18,4 894,45 6,17 0 6,17 1 1
Salto de
57 3 15,1 18,4 895,03 6,03 0 6,03 1 0
Pirapora
11 1 Monte Mor 13,3 18,9 969,25 6,11 0 6,11 1 0
27 2 Guariba 18,0 19,5 912,52 5,64 0 5,64 1 1
21 2 Barrinha 15,3 19,6 808,74 5,65 0 5,65 1 1
49 3 Iperó 10,2 21,1 863,76 6,45 0 6,45 1 0
Santa Cruz da
37 2 9,9 22,2 987,82 6,18 0 6,18 1 1
Esperança
48 3 Ibiúna 17,0 22,3 872,65 5,38 0 5,38 1 0
41 2 Serra Azul 15,9 23,0 830,35 5,94 0 5,94 1 1
28 2 Guatapará 12,5 23,2 872,98 5,97 0 5,97 1 1
Cássia dos
24 2 14,4 23,5 830,18 6,49 0 6,49 1 1
Coqueiros
53 3 Piedade 14,9 24,0 1.043,40 5,79 0 5,79 1 0
54 3 Pilar do Sul 15,9 24,2 1.204,80 5,89 0 5,89 1 0
60 3 Tapiraí 18,0 29,6 817,74 5,62 0 5,62 1 0
Fonte: IBGE (2000).
Sejam DR e DS as variáveis dummies dos municípios da região metropolitana de Ribeirão Preto e de

Sorocaba, respectivamente. Considere, ainda, o seguinte modelo:
y = β1 + β2 testud + DR (δ0 + δ1testud) + DS (δ2 + δ3testud) + ε
Assim, para cada uma das regiões metropolitanas, teríamos os seguintes modelos de regressão:
Y_cps = β1 + β2testud + ε
Y_rib = (β1 + δ0) + (β2 + δ1)testud + ε
Y_sor = (β1 + δ2) + (β2 + δ3)testud + ε
A variável dummy de inclinação, ou seja, o modelo de regressão linear
y = β1 + β2 testud + DR (δ0 + δ1testud) + + DS (δ2 + δ3testud) + ε
faz com que sejam ajustadas três retas com interceptos e inclinações diferentes.
Observe que o modelo anterior pode ser reescrito como:
132
ECONOMETRIA
y = β1 + β2testud + δ0DR + δ2DS + + δ1testudDR + δ3testudDS + ε
Os parâmetros associados às variáveis dummies DR e DS, isoladamente, serão responsáveis pela

alteração dos interceptos. Ainda, os parâmetros associados aos produtos de DR e DS por testud serão
responsáveis pela alteração dos coeficientes angulares. Finalmente, as variáveis testudDR e testudDS
são chamadas de variáveis de interação, pois são responsáveis por capturar o efeito de interação
envolvendo tempo médio de estudo (anos) e rendimento per capita. Traduzindo, trata-se do impacto na
variação do rendimento per capita esperado de municípios de regiões diferentes, dada a variação de um
ano no tempo médio de estudo desses municípios, que podem ser diferentes.
Tabela 41
Coeficientes Erro-padrão Stat-t valor-P

Interseção -1.837,25 503,68 -3,65 0,00058
Média de anos de estudos (X) 464,22 70,81 6,56 0,00000
DR 1.140,47 636,57 1,79 0,07861
DS 1.262,93 682,06 1,85 0,06935
DRX -183,99 92,74 -1,98 0,05217
DSX -202,11 99,28 -2,04 0,04651
(t-crítico = 2,00)
Assim:
Y^RM = - 1.837,25 + 464,22X + 1.140,47DR + 1.262,93DS - 183,99DRX - 202,11DSX
Esse é o modelo mais geral, no qual também as inclinações podem ser distintas. Portanto, os
resultados da estimação com média dos anos de estudos (X), regiões metropolitanas e interações são:
Y^RMCampinas = - 1.837,25 + 464,22X
Y^RMRibeirão Preto = - 696,78 + 280,23X
Y^RMSorocaba = - 574,32 + 262,11X
As três retas ajustadas simultaneamente (Y^RM), neste exemplo, são equivalentes às retas que
obteríamos se ajustássemos separadamente um modelo para cada região metropolitana (Y^RMCampinas,
Y^RMRibeirão Preto e Y^RMSorocaba). No entanto, este procedimento tem a vantagem de facilitar a construção dos
testes de hipóteses envolvendo simultaneamente parâmetros das três retas.
Poderíamos elaborar modelos envolvendo apenas as diferenças de intercepto entre os municípios

das três regiões metropolitanas:
133
Unidade III
Tabela 42

Interseção -875,00 282,24 -3,10 0,00298
DR -132,82 68,48 -1,94 0,05731
DS -134,73 72,04 -1,87 0,06649
(t-crítico = 2,00)
Assim:
Y^RM = - 875,00 + 328,35X - 132,82DR - 134,73DS
As variáveis binárias não apresentaram nenhum diferencial significativo quanto às diferenças de

intercepto (stat-t).
Portanto, os resultados da estimação com média dos anos de estudos (X), regiões metropolitanas e
interações são:
Y^RMCampinas = - 953,28 + 328,35X
Y^RMRibeirão Preto = - 1.007,82 + 328,35X
Y^RMSorocaba = - 1.009,73 + 328,35X
Poderíamos elaborar modelos envolvendo apenas as diferenças de inclinação entre os municípios

das três regiões metropolitanas:
Tabela 43

Interseção -953,28 260,71 -3,66 0,00055
DRX -21,02 9,90 -2,12 0,03803
DSX -21,36 10,40 -2,05 0,04442
(t-crítico = 2,00)
Assim:
Y^RM = - 953,28 + 340,48X - 21,02DRX - 21,36DSX
As variáveis binárias apresentaram diferenciais significativos quanto às diferenças de

inclinação (stat-t).
134
ECONOMETRIA
Portanto, os resultados da estimação com média dos anos de estudos (X), regiões metropolitanas e
interações são:
Y^RMCampinas = - 953,28 + 340,48X
Y^RMRibeirão Preto =-953,28 + 319,46X
Y^RMSorocaba = - 574,32 + 319,12X
Poderíamos utilizar apenas uma variável dummy D (D_pobres =1) indicando municípios com
porcentagem de pessoas em domicílios pobres igual a ou acima de 15% e D (D_pobres = 0) indicando
municípios com porcentagem de pessoas em domicílios pobres abaixo de 15%.
Tabela 44

Interseção 1.361,23 46,93 29,01 5,27358E-37
D_pobres -360,99 77,05 -4,69 1,64955E-05
(t-crítico = 2,00)
Assim:
Y^RM = 1.361,23 - 360,99D
A variável binária que representa os municípios com porcentagem de pessoas em domicílios pobres
acima de 15% foi significativa no nível de 5%. Como a renda familiar per capita média do grupo todo
dos municípios (62 municípios) representa R$ 1.227,32, a variável dummy nos informa que a renda
familiar per capita dos municípios com porcentagem de pessoas em domicílios pobres acima de 15% é
mais baixa em R$ 361,00 reais, o que representa uma queda em relação à média aproximada de 30%.
Esse diferencial significativo confirmado pelo teste t-Student da renda familiar desaparece quando
o modelo de regressão é expandido levando em conta a média de anos de estudos:
Tabela 45

Interseção -1.013,15 332,20 -3,05 0,003426683
Média de anos de estudos (X) 338,02 47,04 7,19 1,3078E-09
D_pobres -51,77 71,21 -0,73 0,47007873
(t-crítico = 2,00)
135
Unidade III
Assim:
Y^RM = - 1.013,15 + 338,02X - 51,77D_pobres
A variável binária não apresenta diferencial significativo quanto às diferenças de intercepto (stat-t).
Portanto, os resultados da estimação com média dos anos de estudos (X) e regiões metropolitanas são:
Y^RM % pessoas em domicilios pobres menores que 15% = - 1.013,15 + 338,02X
Y^RM % pessoas em domicilios pobres maiores que 15% = - 1.064,92 + 338,02X
No modelo expandido, a variável binária que representa os municípios com porcentagem de pessoas
em domicílios pobres acima de 15% não foi significativa no nível de 5%. Como a renda familiar per
capita média do grupo todo dos municípios (62 municípios) representa R$ 1.227,32, a variável dummy
nos informa que a renda familiar per capita dos municípios com porcentagem de pessoas em domicílios
pobres acima de 15%, que isoladamente era mais baixa em R$ 361,00 reais, passou a ser de R$ 52,00, o
que representa uma queda em relação à média aproximada de 4%.
O uso das variáveis dummies também permite distinguir o comportamento de um fenômeno em

períodos de tempo com características de sazonalidade, períodos anterior e posterior a uma medida
econômica etc. Por exemplo: para sazonalidade nas vendas representadas pelas quatro estações
do ano, podemos: usar três variáveis dummies (número de possibilidades menos 1), em que para
uma das estações todas as dummies assumem o valor zero; realizar dois processos de produção
em uma empresa para avaliar as diferenças na qualidade de fabricação dos produtos; distinguir
aspectos econômicos de diversas regiões; fazer a avaliação de políticas (grupo-controle e grupo de
tratamento); e notar diferenças de salários por sexo para avaliar se ocorre discriminação contra
as mulheres.
Lembrete
Qualquer variável expressa em categorias pode ser transformada em
uma variável dummy: por exemplo, variáveis envolvendo os três setores da
economia (primário, secundário e terciário).
8.2 Variáveis defasadas
Frequentemente, em análise de uma série temporal, é comum adotar modelos em que aparecem
variáveis defasadas, isto é, o valor de Yt referente ao t-ésimo período aparece como função de Xt1, Xt, Xt-1,
Xt-2 e/ou Yt-1 etc. Isso é útil para a análise de políticas públicas.
Variáveis defasadas são valores que estão fortemente correlacionados aos valores que os antecedem
e àqueles que os sucedem. Esse tipo de correlação é conhecido como autocorrelação. Na modelagem
136
ECONOMETRIA
autorregressiva, incluímos como variável independente uma componente defasada da variável

dependente – essa é uma técnica de previsão bastante utilizada para prever séries temporais que
apresentam autocorrelação. A ideia da autocorrelação serial é que os resíduos contêm mais informação
sobre a variável dependente do que aquilo que foi “filtrado” pelas variáveis explicativas. Em termos
técnicos, o resíduo ainda pode ser sistematizado:
• O modelo autorregressivo de primeira ordem é semelhante, no formato, ao modelo de regressão

linear simples:
Yt = α + β1Yt-1 + ut
• O modelo autorregressivo de segunda ordem é semelhante ao modelo de regressão múltipla,

com duas variáveis independentes:
Yt = α + β1Yt-1 + β2Yt-2 + ut
• O modelo autorregressivo de k-ésima ordem é semelhante ao modelo de regressão múltipla,

com k variáveis independentes:
Yt = α + β1Yt-1 + β2Yt-2 + ... + βkYt-k + ut
Em que:
Yt = o valor observado da série no período t;
Yt-1 = o valor observado da série no período t - 1;
Yt-2 = o valor observado da série no período t - 2;
Yt-k = o valor observado da série no período t-k;
α, β1, β2, … βk = parâmetros autorregressivos a serem estimados pelo MMQ;
ut = erro aleatório não autocorrelacionado (média zero e variância constante).
Ao utilizarmos variáveis defasadas em um modelo, precisamos ponderar as vantagens, que de um lado

representam a simplicidade; e, de outro, a preocupação de deixar de levar em conta uma autocorrelação
importante nos dados. Outro aspecto se refere à preocupação com a seleção de um modelo de ordem
elevada, com a proposta de inúmeras variáveis explicativas desnecessárias, especialmente se o número
de observações da série for pequeno. Sabendo que não existe nenhum valor registrado antes de Yt no
caso de um modelo autorregressivo de segunda ordem, dois valores são perdidos para efeito de análise de
regressão. Por exemplo, se o número de observações for igual a oito (n = 8), o modelo autorregressivo
de segunda ordem terá seis pares de valores (n = 8 – 2).
137
Unidade III
Depois de selecionado o modelo, devemos, através do MMQ, calcular as estimativas dos parâmetros
e validá-los. Para selecionar o modelo nos baseamos em experiências anteriores ou escolhemos um
modelo com diversos parâmetros e, em seguida, por meio do teste t (t0,05; n-2k-1), passo a passo, vamos
eliminando os parâmetros de ordem mais elevada que não contribuam significativamente para o modelo
(quando a hipótese nula é aceita, indicando que o parâmetro de maior ordem é igual a zero) e vamos
ajustando o modelo até que a hipótese nula (H0) seja rejeitada. Quando isso ocorrer, concluiremos que
esse modelo pode ser utilizado para fins de previsão.
Para demonstrar esse procedimento de escolha do modelo autorregressivo mais eficaz, retomemos
a série temporal do exemplo que trata da renda (X) explicando o consumo (Y) ao longo do período
de 1996 a 2010. Construímos a planilha conforme tabela a seguir, que apresenta os dados do IBGE
para os modelos autorregressivos de primeira a terceira ordem.
Considere a série a seguir, com n = 15 valores anuais consecutivos:
Tabela 46 – Consumo (defasados)
Ano Consumo (Yt) Yt-1 Yt-2 Yt-3
1996 116.080
1997 119.601 116.080
1998 118.739 119.601 116.080
1999 119.189 118.739 119.601 116.080
2000 123.995 119.189 118.739 119.601
2001 124.951 123.995 119.189 118.739
2002 126.599 124.951 123.995 119.189
2003 125.908 126.599 124.951 123.995
2004 130.848 125.908 126.599 124.951
2005 136.634 130.848 125.908 126.599
2006 143.855 136.634 130.848 125.908
2007 153.027 143.855 136.634 130.848
2008 162.919 153.027 143.855 136.634
2009 170.180 162.919 153.027 143.855
2010 180.781 170.180 162.919 153.027
138
ECONOMETRIA
Tabela 47

R múltiplo 0,9939
R-quadrado 0,9878
Erro-padrão 2.656
Observações 12
Anova
F de
gl SQ MQ F significação
Regressão 3 4.586.569.794 1.528.856.598 216,65 0,00000005
Resíduo 8 56.455.153 7.056.894
Total 11 4.643.024.946
Coeficientes Erro-padrão Stat-t valor-P 95% inferiores 95% superiores

Interseção -20.640,67 16.119,84 -1,28 0,2363 -57.813,09 16.531,75
Yt-1 1,3312 0,3256 4,09 0,0035 0,58 2,08
Yt-2 -0,3556 0,5207 -0,68 0,5139 -1,56 0,85
Yt-3 0,2155 0,4564 0,47 0,6494 -0,84 1,27
Partimos da ideia que não temos experiência para estabelecer o modelo de imediato. Assim, a
seleção do modelo autorregressivo que melhor se ajuste a séries temporais anuais deve ser iniciada com
o modelo autorregressivo de terceira ordem. A equação autorregressiva ajustada é:
Yî = -20.640,67 + 1,3312Yi-1 - 0,3556Yi-2 + 0,2155Yi-3
Nota-se que o primeiro ano da série é 1999.
Na sequência, vamos testar a significância de β3 = 0,2155 (parâmetro de ordem mais elevada), com
um erro-padrão de 0,4564. Para testar a hipótese nula:
H0 : β3 = 0
H1 : β3 ≠ 0
Utilizando o nível de significância de 5% (α = 0,05), o teste t bicaudal com 8 graus de liberdade

apresenta valores críticos de ± 2,31 – veja a tabela da distribuição t-Student (bilateral) no AVA.
139
Unidade III
α α
2 2
-2,31 0 +2,31 t
Região de Região de não Região de

rejeição rejeição ou rejeição
aceitação
Valor crítico Valor crítico
Figura 51 – Região crítica para o teste t
O valor de stat-t (estatística t calculada) é de 0,47 e se encontra na região de aceitação (veja a figura
anterior), pois o valor em módulo do stat-t é menor do que o valor t crítico = |0,47| = 0,47 < 2,31. Assim,
concluímos que devemos aceitar a hipótese nula H0, indicando que o parâmetro de maior ordem do
modelo autorregressivo é igual a zero, não sendo significativo, e, portanto, pode ser excluído.
Não sendo significativo o parâmetro de maior ordem (terceira), foi descartado. Prosseguimos no
ajuste do modelo autorregressivo de segunda ordem, conforme a tabela a seguir:
Tabela 48
Anova
Regressão 3 5.101.411.991 1.700.470.664 667,8 0,0000000001
Resíduo 9 22.918.546 2.546.505
Total 12 5.124.330.537

Interseção -17.545,42 5.748,60 -3,05 0,01 -30.549,67 -4.541,17
Renda (Xt) 0,2418 0,0577 4,1889 0,0023 0,1112 0,3725
Yt-1 0,7873 0,2156 3,6523 0,0053 0,2997 1,2750
Yt-2 -0,0255 0,2255 -0,1130 0,9125 -0,5356 0,4846
140
ECONOMETRIA
Assim:
Yî = - 20.085,56 + 1,2312Yi-1 - 0,0492Yi-2
Na sequência, vamos testar a significância de β2 = - 0,0492 (parâmetro de ordem mais elevada), com
H0 : β2 = 0
H1 : β2 ≠ 0

α α
2 2
-2,23 0 +2,23 t

aceitação
O valor de stat-t (estatística t calculada) é de -0,13 e se encontra na região de aceitação (veja a

figura anterior), pois o valor em módulo do stat-t é menor do que o valor t crítico = |- 0,13| = 0,13 < 2,23.
Assim, concluímos que devemos aceitar a hipótese nula H0, o que indica que o parâmetro de maior
ordem do modelo autorregressivo é igual a zero, não sendo significativo, e, portanto, pode ser excluído.
Não sendo significativo o parâmetro de maior ordem (segunda), foi descartado. Prosseguimos no
ajuste do modelo autorregressivo de primeira ordem, conforme a tabela a seguir:
141
Unidade III
Tabela 49

R múltiplo 0,9934
R-quadrado 0,9868
R-quadrado
ajustado 0,9857
Erro-padrão 2.463
Observações 14
Anova
Regressão 1 5.431.067.611 5.431.067.611 895,41 0,000000000001
Resíduo 12 72.785.837 6.065.486
Total 13 5.503.853.448

Interseção -19.394,43 5.313,3246 -3,65 0,0033 -30.971,17 -7.817,69
Yt-1 1,1796 0,0394 29,92 0,0000 1,09 1,27
Assim:
Yî = - 19.394,43 + 1,1796Yi-1
Na sequência, vamos testar a significância de β1 = 1,1796 (parâmetro de ordem mais elevada), com
H0 : β1 = 0
H1 : β1 ≠ 0

142
ECONOMETRIA
α α
2 2
-2,18 0 +2,18 t

aceitação
O valor de stat-t (estatística t calculada) é de 29,92 e se encontra na região de rejeição (veja a figura
anterior), pois o valor em módulo do stat-t é maior do que o valor t crítico = |29,92| = 29,92 > 2,18.
Assim, concluímos que devemos rejeitar a hipótese nula H0, indicando que o parâmetro de primeira
ordem do modelo autorregressivo é diferente de zero, sendo significativo, e, portanto, deve permanecer
no modelo.
Por esta técnica de construção de modelo, o modelo autorregressivo de primeira ordem foi o
selecionado como o mais apropriado:
Y^n+j = - 19.394,43 + 1,1796Yn+j-1
Valores projetados para 2011 e 2012:
• 2011 (um ano à frente de Y^15):
Y^16 = - 19.394,43 + 1,1796Y15 = - 19.394,43 + 1,1796 × 180.781 = 193.854,84
• 2012 (um ano à frente de Y^16):
Y^17 = - 19.394,43 + 1,1796Y16 = - 19.394,43 + 1,1796 × 193.854,84 = 209.276,74
Através do modelo autorregressivo de primeira ordem, a figura a seguir ilustra os valores reais e os
previstos do consumo (Y):
143
Unidade III
220.000,00
Previsto Consumo (Yt)
200.000,00 Realizado Consumo (Yt)
180.000,00
160.000,00
140.000,00
120.000,00
100.000,00
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012
Figura 54 – Gráfico de consumo real e previsto, a partir de um modelo autorregressivo de primeira ordem
Lembrete
O modelo defasado com variáveis independentes (uso de valores

defasados das variáveis exógenas) é ideal para analisar os impactos de uma
variação de uma das variáveis independentes sobre a dependente. Modelos
com variável dependente defasada têm sido muito usados em estudos da
oferta de produtos agrícolas.
Observação
Os modelos de regressão dinâmica combinam a dinâmica de séries

temporais e o efeito de variáveis explicativas. O termo regressão dinâmica
não indica que os parâmetros do modelo evoluem no tempo, mas que a
variável dependente é explicada por seus valores defasados e pelos valores
atuais e passados de variáveis causais ou exógenas. Uma estratégia usual
para construir modelo de regressão dinâmica é chamada de bottom-up, isto
é, considera-se inicialmente um modelo simples para depois melhorá-lo
incluindo novas variáveis, mas também as defasagens destas variáveis, até
encontrar um modelo apropriado.
8.3 Variáveis instrumentais
A utilização das variáveis instrumentais nos auxiliará na busca de estimadores consistentes quando
tivermos regressores endógenos presentes no modelo de regressão (regressores endógenos são variáveis
independentes X cujos valores são determinados dentro do sistema). Numa regressão com mais variáveis,
144
ECONOMETRIA
mesmo que a estatística R2 seja elevada, se uma única variável for endógena, todos os coeficientes
estimados (inclusive os das variáveis exógenas) poderão se tornar enviesados.
Considere a equação:
Y = α + βX + u
Onde:
E(u) = 0
Cov(X, u) ≠ 0
Mesmo não conhecendo o motivo para a existência de correlação entre X e u, o método de variáveis
instrumentais (VI) fornece um estimador consistente dos parâmetros de interesse.
O método se baseia na utilização de uma variável adicional Z, não incluída na fórmula anterior, que
satisfaça tais condições:
Cov(Z, u) = 0
Cov(Z, X) ≠ 0
O método de regressão por variáveis instrumentais (VI) é uma solução possível que fornece
estimadores consistentes dos parâmetros de interesse quando o erro (e) e uma variável regressora (X)
são correlacionados. Sabe-se que surgem problemas para os mínimos quadrados quando X é aleatório
e correlacionado com a perturbação aleatória E(xiei) ≠ 0. Sob essa condição, o método de mínimos
quadrados ordinários (MMQO) produz estimadores viesados e inconsistentes.
As razões mais comuns para a existência de correlação entre o erro (e) e alguma variável explicativa
(x) ou regressora são:
• omissão de variáveis relevantes para o modelo;
• erros de mensuração nas variáveis;
• simultaneidade.
O viés de omissão de variáveis surge quando uma variável (independente) que determina a
variável-resposta (dependente) é omitida da regressão e quando pelo menos uma das variáveis
explicativas é correlacionada com a variável omitida. Neste caso, o estimador de MMQO é inconsistente,
mesmo para grandes amostras.
145
Unidade III
Já o viés de erros de mensuração nas variáveis é originado quando uma variável explicativa (X)
é medida de forma imprecisa (resposta equivocada, digitação errada etc.). Neste caso, o estimador de
MMQO é viesado e inconsistente.
Por sua vez, o viés de simultaneidade surge quando existe simultaneidade na relação causal entre
a variável dependente (Y) e uma variável explicativa (X), isto é, de um lado, a variável explicativa (X)
determina a variável dependente (Y); do outro lado, a variável dependente (Y) determina uma variável
explicativa (X).
Vimos então que:
• sob a hipótese Cov(e,x) = 0, (I) MMQO é consistente;
• sob a hipótese E(e|x) = 0, (II) MMQO é não viesado.
Se essas hipóteses forem violadas, MQO será inconsistente e viesado. O método de regressão por
variáveis instrumentais (VI) é uma solução possível que fornece estimadores consistentes dos parâmetros
de interesse.
Portanto, esse método de um modelo com variáveis instrumentais se baseia na utilização de uma
variável adicional, Z, denominada variável instrumental, que satisfaça as duas condições a seguir:
• relevância: a variável Z deve ser correlacionada com a variável explicativa (X);
• exogeneidade: a variável Z não pode ser correlacionada com o erro (e).
Encontrar variáveis instrumentais adequadas (ou instrumentos válidos) para os nossos modelos nem
sempre é fácil, porque não se pode ter certeza de que elas sejam independentes do erro (e). Uma das
razões dessa dificuldade encontra-se nas duas condições a serem cumpridas, que na maioria das vezes
são conflitantes. Por exemplo, ao estimarmos a equação de salários em função do nível educacional,
uma variável omitida seria a própria habilidade da pessoa, o que iria viesar o coeficiente do nível
educacional. Um possível instrumento a ser escolhido seria a variável nível educacional da mãe, a qual
está correlacionada com o nível educacional da pessoa, mas, por sua vez, o nível educacional da mãe
também deve estar correlacionado com a habilidade da pessoa que está presente nos resíduos. Portanto,
por essa razão, o mais indicado é que devemos procurar um instrumento que tenha a mais alta correlação
possível com a variável independente X.
Observação
A variável X defasada (Xt-1), a qual substitui a variável X, que contém os

erros, é considerada a mais comum dentre as variáveis instrumentais. Visto
que uma das principais características das séries temporais econômicas
é registrar ciclos econômicos (parte da recessão à expansão) com
146
ECONOMETRIA
movimentos lentos de recuperação e impulsos que continuam e tendem a

desacelerar no decorrer do tempo, são observações sucessivas que tendem a
ser interdependentes.
Esses novos estimadores são consistentes se E(ziei) = 0. Em grandes amostras, os estimadores da

variável instrumental têm distribuições aproximadamente normais.
A variância do erro é estimada usando o estimador:
∑( )
2
^ − β xi
yi − α
σ^ 2 =
n−2
Para obtermos as estimativas dos parâmetros da regressão pelo método das variáveis instrumentais
(VI), multiplica-se a equação que corresponde à variável X, a qual contém os erros, pela respectiva
variável instrumental Z. Os procedimentos de cálculo, no modelo linear simples, de uma única variável
independente X consistem em multiplicar a segunda equação do sistema pela variável instrumental Z,
conforme a seguir:
∑Y = α^ n + β ∑X


 
∑YZ = α^ ∑Z + β∑XZ
Resolvendo o sistema, os estimadores α^ e β^ podem se expressar como:
∑Y∑Z
∑ YZ −
n ˆ
Cov(Z, Y)
=β =
∑X ∑Z Cov
ˆ (Z, X)
∑XZ −
n
Em grandes amostras, a covariância amostral converge para a verdadeira covariância (populacional):
Cov(Z, Y)
β →
Cov(Z, X)
Para que a variável instrumental seja válida, deve ser não correlacionada com o erro (e), mas
correlacionada com a variável explicativa X:
Cov(Z, Y) Cov(Z,e)
=β −
Cov(Z, X) Cov(Z, X)
147
Unidade III
Cov(Z, e) = 0 é uma condição que foi imposta para a escolha da variável instrumental Z, então o
estimador de variáveis instrumentais converge, em grandes amostras, para β:
Cov(Z, Y)
β → =β
Cov(Z, X)
Assim, se Cov(Z, e) = 0 e Cov(Z, X) ≠ 0, então o estimador de variável instrumental de β é consistente,

em uma situação na qual o estimador dos parâmetros no método dos mínimos quadrados (MMQ) não
o é, em função da existência de correlação entre X e os resíduos.
Assim temos, então,
α^ = Y - β^ X
Na ideia de tornar a variável instrumental comparável à variável X, é indicado expressá-la na mesma

unidade, cuja média seja igual à de X. Para tal, vamos substituir Z por:
 média de X  X
W=
Z×  =
Z×
 média de Z  Z
sem, portanto, alterar a correlação entre Z e X e entre Z e os resíduos (e).
Em geral, os erros são “não observáveis”. Desconhecemos o que está contido neles, são fatores não
coletados e/ou impossíveis de coletar ou mensurar. O termo residual representa tudo o que afeta Yi além de Xi.
Quaisquer que sejam os erros, devemos supor o que a teoria nos assegura: que eles não estejam
associados à variável independente X. Um resultado dessa independência é não haver correlação ou
covariância entre X e o erro (e). Isso implica que o valor esperado (a média) da multiplicação entre X e
o erro (e) é zero.
A ideia é isolar o vetor de coeficientes de regressão (os parâmetros), numa equação que não depende
dos erros, isto é, precisamos de um meio de “cancelar” os erros da equação com a proposta de obter
a relação com os “verdadeiros” parâmetros da equação (modelo). Através das variáveis instrumentais,
isolamos a parte da variável explicativa que não está correlacionada com o erro, com o propósito de
obtermos estimadores consistentes e não viesados dos parâmetros da regressão. A regressão linear que
representa o modelo da regressão de variáveis instrumentais é definida de forma geral da seguinte
maneira, sendo Y1, Y2 e Y3, as variáveis endógenas e X1 e X2 as variáveis exógenas:
Y1 = α2Y2 + α3Y3 + β1Y1 + β2Y2 + e1
Em suma, o estimador de variáveis instrumentais EVI é um estimador consistente dos parâmetros de um

modelo linear, quando a variável independente é estocástica e correlacionada com o termo aleatório.
148
ECONOMETRIA
Lembrete
Uma variável instrumental Z é aquela que é correlacionada com a

variável explicativa, mas não com os termos de erro.
A partir dos dados da tabela a seguir, vamos estimar a regressão pelo método dos mínimos quadrados
ordinários (MMQO) e comparar os resultados com a mesma função pelo método da variável instrumental
(VI), usando a variável X2 (consumo de energia elétrica industrial – TWh) como instrumento. Veja os
dados do IBGE:
Tabela 50 – Despesa de consumo, renda e consumo de energia elétrica

industrial no Brasil (1996 a 2005)
Seq. Ano Consumo Renda E. E. Ind. W

1 1996 116,1 180,4 117,13 177,2921
2 1997 119,6 186,5 121,72 184,2391
3 1998 118,7 187,2 121,98 184,6357
4 1999 119,2 188,0 123,89 187,5321
5 2000 124,0 196,3 131,28 198,7114
6 2001 125,0 199,0 122,54 185,4829
7 2002 126,6 205,1 130,93 198,1803
8 2003 125,9 207,4 136,22 206,1926
9 2004 130,8 219,4 154,16 233,3513
10 2005 136,6 226,4 158,61 240,0825
Média 124,25 199,57 131,85 199,5700
Total 1.242,50 1.995,70 1.318,45 1.995,70
Tabela 51 – Matriz de covariância
Consumo Renda E. E. Ind

Consumo 1
Renda 0,985826 1
E. E. Ind. 0,929935 0,95210693 1
Utilizando a variável consumo de energia elétrica industrial (E. E. Ind.) como instrumento no modelo
de regressão que define a relação de despesa de consumo (Y), sendo explicado pela renda (X), verifica-se
na matriz de correlação (veja as tabelas anteriores) que a variável instrumental a ser utilizada possui um
grau de correlação de 95,21% com a variável independente. Veja os dados do IBGE:
149
Unidade III
Tabela 52 – Despesa de consumo (Y), renda (X) e consumo de energia elétrica industrial (Z)
Y X Z YZ XZ
Seq. Ano Consumo Renda E. E. Ind. W YW XW
1 1996 116,1 180,4 117,13 177,2921 20583,61 31983,50
2 1997 119,6 186,5 121,72 184,2391 22035,00 34360,60
3 1998 118,7 187,2 121,98 184,6357 21916,26 34563,81
4 1999 119,2 188,0 123,89 187,5321 22353,82 35256,03
5 2000 124,0 196,3 131,28 198,7114 24640,21 39007,04
6 2001 125,0 199,0 122,54 185,4829 23185,36 36911,10
7 2002 126,6 205,1 130,93 198,1803 25089,63 40646,78
8 2003 125,9 207,4 136,22 206,1926 25959,65 42764,34
9 2004 130,8 219,4 154,16 233,3513 30522,35 51197,27
10 2005 136,6 226,4 158,61 240,0825 32795,27 54354,68
Média 124,25 199,57 131,85 199,5700
∑ 1.242,50 1.995,70 1.318,45 1.995,70 249.081,16 401.045,15
Modelo a ser estimado: Y1 = α + β1X1i + e1.
Primeiramente, vamos calcular a estimativa dos parâmetros pelo método dos mínimos quadrados
ordinários (MMQO). A estimativa por esse método é a seguinte:
Tabela 53

R múltiplo 0,9858
R-quadrado 0,9719
Erro-padrão 1,1075
Observações 10
Anova
Regressão 1 338,83 338,83 276,22 0,0000002
Resíduo 8 9,81 1,23
Total 9 348,65

Interseção 42,9395 4,9049 8,7545 0,0000 31,6289 54,2502
Renda 0,4074 0,0245 16,6199 0,0000 0,3509 0,4640
150
ECONOMETRIA
Assim:
Yi = 42,9395 + 0,4074X1i
Vamos obter as estimativas dos parâmetros da regressão pelo método das variáveis instrumentais (VI),
conforme cálculos a seguir:
Para compatibilizar as unidades entre as variáveis renda (X) e instrumental Z, usa-se a transformação
X 
Z ×  médio  , obtendo-se:
 Zmédio 
W = Z x (X / Z) (vide valores na quinta coluna da tabela anterior).
∑Y∑Z 1.242,50 × 1.995,70

n
∑YZ − 249.081,16 −
10= 1.115,4350
=β = = 0,4037
∑X ∑Z 401.045,15 − 1.995,70 × 1.995,70 2.763,3010
∑XZ − n 10
Outra maneira de proceder aos cálculos é por meio da matriz de covariância, apresentada a seguir:
Tabela 54
Consumo Renda E. E. Ind.

Consumo 34,8645
Renda 83,1635 204,1181
E.E. Ind. 111,54376 276,329738 412,6694
ˆ
Cov(Z, Y) 111,54376
=β = = 0,4037
ˆ (Z, X) 276,329738
Cov
Portanto, calculamos a estimativa de β de duas maneiras, utilizando Zi (consumo de energia elétrica

industrial) como variável instrumental.
α^ = Y - β^ X = 124,25 - 0,4037 × 199,57 = 43,6836
Yi = 43,6836 + 0,4037Xi
DW = 1,7132 (ausência de autocorrelação)
Nem sempre dispomos de uma variável instrumental, obtida dos dados observados. Com base no
modelo de regressão linear simples (Yj = α + βXj + uj), define-se uma forma de obtê-la que parte
151
Unidade III
inicialmente de que as observações estão ordenadas de acordo com os valores de Xj, em ordem crescente.
Se o número de observações (n) for par, estabeleceremos Zj = - 1 para as primeiras n/2 observações e
Zj = 1 para as n/2 últimas observações. Sendo n ímpar, estabelecemos Zj = - 1 para j = 1,2,..., (n-1)/2,
Zj = 0 para j = (n+1)/2 e Zj = 1 para j=(n+3)/2,...,n.
Temos que o estimador de β é, neste caso,
Y −Y
β = 2 1
X 2 − X1
Onde:
• X1 e Y1 são as médias dos valores de Xj e Yj, respectivamente, para as primeiras n/2 ou

(n - 1)/2 observações;
• X2 e Y2 são as médias dos valores de Xj e Yj, respectivamente, para as últimas n/2 ou

(n - 1)/2 observações.
O estimador (fórmula descrita anteriormente) foi proposto por Wald (1940). É denominado por
método do agrupamento das observações, obtido a partir das médias de X e Y para dois conjuntos
de observações.
Vamos elaborar o cálculo para o estimador proposto por Wald em relação ao modelo consumo (Y) e
renda (X), a seguir:
Tabela 55 – Consumo e renda (estimativa β por Wald)
Y X
Seq. Ano Consumo Renda Z XY X2
1 1996 116,1 180,4 -1 20944,44 32544,16
2 1997 119,6 186,5 -1 22305,40 34782,25
3 1998 118,7 187,2 -1 22220,64 35043,84
4 1999 119,2 188,0 -1 22409,60 35344,00
5 2000 124,0 196,3 -1 24341,20 38533,69
6 2001 125,0 199,0 1 24875,00 39601,00
7 2002 126,6 205,1 1 25965,66 42066,01
8 2003 125,9 207,4 1 26111,66 43014,76
9 2004 130,8 219,4 1 28697,52 48136,36
10 2005 136,6 226,4 1 30926,24 51256,96
Média 124,25 199,57
∑ 1.242,50 1.995,70 248.797,36 400.323,03
152
ECONOMETRIA
Tabela 56
Y X
Média 1 119,52 187,68
Média 2 128,98 211,46
Média (1+2) 124,25 199,57
Temos que o estimador de β é, neste caso,
Y2 − Y1 128,98 − 119,52 9,46

=β = = = 0,3978
X 2 − X1 211,46 − 187,68 23,78
α^ = Y - β^ X = 124,25 - 0,3978 × 199,57 ≅ 44,8584
Yi = 44,8584 + 0,3978Xi
DW =1,722 (ausência de autocorrelação)
Nessa mesma lógica de obter uma variável instrumental, Bartlett (1949) mostrou que a eficiência
do estimador aumentará se fizermos uma divisão em três grupos, de maneira equilibrada, com
aproximadamente o mesmo número de observações em cada um dos grupos.
Lembrando que as observações devem estar ordenadas de acordo com os valores crescentes de Xj,
estabelecemos Zj = - 1 para as observações do primeiro grupo, Zj = 0 para as observações do segundo
grupo e Zj = 1 para as observações do terceiro grupo. Assim, obtemos:
Y −Y
β = 3 1
X 3 − X1
Onde X1 e Y1, X3 e Y3 são as médias dos valores de Xj e Yj, respectivamente, para as observações do
primeiro e do terceiro grupo.
Apresentamos outro método de obter uma variável instrumental que pode ser estendido para o caso
de regressões múltiplas, como consta em Johnston (1972, p. 289-290).
Conforme o modelo de regressão linear simples Yj = α + βXj + uj, a estimativa de β, de acordo com
o MMQO, é:
1
n
∑x jy j
b=
1
n
∑x2j
153
Unidade III
Segue-se que o estimador de β
1
β = n
∑x jy j
1
n
∑ x2j − σu2
converge em probabilidade para β.
É necessário conhecer a variância (σ u2 ) do erro de medida da variável independente. Esse método

foi utilizado por Perez (1973) em um estudo da elasticidade-renda do consumo de alimentos em
Piracicaba, SP, no qual se admitiu que os dados sobre a renda mensal per capita apresentavam erros de
medida e que esses erros eram, em 95% dos casos, menores que 20% do valor dessa renda. Conclui-se que:
2
1 
σu2 = ln1,2
2 
Calculando:
2
1 
=σu2  =ln1,2 0,0083
2 
Temos que o estimador de β é, neste caso:
1 1
 n
∑ x jy j
10
× 248.797,36
24.879,7360
=β = = = 0,6215
1 1 40.032,2947
n
∑ x2j − σu2
10
× 400.323,03 − 0,0083
α^ = Y - β^ X = 124,25 - 0,6215 × 199,57 ≅ 0,2189
Yi = 0,2189 + 0,6215Xi
Observação
Podemos determinar a estimativa consistente de β admitindo, por
exemplo, que a variância do erro de medida de X seja de σ u2 = 1,5.
Se compararmos os resultados baseados nas estatísticas de avaliação, em termos de confiabilidade, as

estimativas obtidas com a utilização de variável instrumental foram as mais satisfatórias, especialmente
no modelo Yi = 43,6836 + 0,4037Xi, em que o valor do teste de Durbin-Watson é DW = 1,7132 (ausência
de autocorrelação).
154
ECONOMETRIA
Observação
O uso de valores defasados das variáveis exógenas (Xt-h, h = 1, 2, 3, ...)
não altera as propriedades teóricas dos estimadores. No entanto, a utilização de
valores defasados da variável endógena (Yt-h, h = 1, 2, 3, ...) no segundo membro
da equação, entre as variáveis independentes, exige uma análise especial.
Saiba mais
Sobre erros nas variáveis independentes e variáveis defasadas, leia as
páginas 229-247 da obra a seguir:
HOFFMANN, R. Análise de regressão: uma introdução à econometria.
São Paulo: Hucitec, 1977.
8.4 O básico da análise de regressão com dados de séries temporais ou

previsão de séries temporais
Nos tópicos anteriores, abordamos mais intensamente os métodos causais de previsão, aqueles que
envolvem a determinação de fatores que se relacionam à variável que tentamos prever, em especial a
regressão linear múltipla. A seguir, vamos abordar os métodos de previsão de séries temporais. Os métodos
quantitativos de previsão de séries temporais utilizam dados históricos, do passado e do presente, de
uma determinada variável, para prever valores futuros. Os modelos utilizados para descrever séries
temporais são processos estocásticos, isto é, processos controlados por leis probabilísticas. A construção
desses modelos depende de vários fatores, como o comportamento do fenômeno ou o conhecimento a
priori que temos de sua natureza e do objetivo da análise.
Veja o gráfico a seguir, de acordo com informações do site HC Investimentos (CARVALHO, 2013):
140
120
100,00
100
80
60
40
11,35
20
0
94 95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 10 11 12 13
Figura 55 – Evolução do preço diário do ouro BM&F (em R$)
155
Unidade III
Uma série temporal é um conjunto de observações ordenadas no tempo. Alguns exemplos de séries
temporais são:
• informações mensais dos valores exportados de um país;
• evolução do preço diário do ouro na BM&F;
• valores mensais de vendas registradas por uma empresa;
• preços diários de fechamento de uma determinada ação na Bolsa de São Paulo.
Uma série temporal é dita estacionária quando todas as características do comportamento do

processo não são alteradas no tempo, isto é, ela se desenvolve no tempo aleatoriamente ao redor de
uma média constante, refletindo alguma forma de equilíbrio estável. Na prática, a maioria das séries
que encontramos apresenta algum tipo de não estacionariedade, por exemplo, tendência – vide figuras
a seguir, conforme exemplos do Portal Action (ESTACIONARIEDADE, [s.d.]):
1
Observações
-1
-2
-3
A) 1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 151 161 171 181 191
156
ECONOMETRIA
14
12
Observações
10
B) 1 11 21 31 41 51 61 71 81 91 101 111 121 131 141 151 161 171 181 191
Figura 56 – Série temporal estacionária (a) e não estacionária (b)
Quanto ao estado estacionário, no que se refere ao crescimento econômico a longo prazo (os fatores
que impulsionam, como a divisão do trabalho, o aumento da produtividade, as inovações tecnológicas
e a crescente acumulação de capital), existe a possibilidade de que esse crescimento venha a ser
interrompido. O caráter progressivo da economia caminha inevitavelmente para um ponto de saturação:
o “Estado estacionário”. Previsão de modelos relacionados às taxas de crescimento que recebem o nome
de “princípio da dinâmica da transição” aponta que quanto mais “abaixo” do seu estado estacionário
estiver uma economia, tanto mais rápido deverá ser seu crescimento. Quanto mais “acima” ela estiver
do seu estado estacionário, mais lento será seu crescimento.
Nos modelos de regressão linear, supõe-se que os erros gerados pelo modelo possuam algumas
características, como média zero, variância constante, distribuição normal e independência, implicando,
assim, a inexistência de correlação. No entanto, ao se elaborar um modelo de regressão linear para
uma série temporal (conjunto de dados numéricos coletados ao longo do tempo), a hipótese de
independência dos resíduos acaba não sendo aceita, e os resultados e testes usados nos modelos
acabam não sendo significativos.
O que se pressupõe é que os fatores que influenciam atividades no passado e no presente tendam a
se repetir aproximadamente do mesmo modo, no futuro. Para elaborar as previsões, é preciso identificar
e isolar os fatores que compõem o modelo em estudo. Ao tentarmos descrever o comportamento de
uma série temporal, podemos decompô-la em três séries temporais, a seguir:
• tendência (Tt);
• sazonalidade (St);
• componente aleatória (at).
157
Unidade III
A tendência é um movimento geral, ascendente ou descendente, de longo prazo, em uma determinada

série temporal (tendência para cima ou tendência para baixo), conforme a figura a seguir:
Figura 57 – Linha de tendência, comprimento longo
Os ciclos são grandes desvios da tendência devido a fatores não sazonais. Eles demonstram oscilações
ou movimentos ascendentes ou descendentes ao longo de toda a série e ocorrem em um grande intervalo
de tempo, geralmente durando de dois a dez anos, e a duração dos intervalos entre picos sucessivos
ou ciclos não é necessariamente a mesma – portanto, diferem em intensidade e estão frequentemente
correlacionados a um ciclo econômico.
1,6
1,5
1,4
1,3
1,2 Ciclos
1,1 Sazonais
1 Irregulares
0,9
0,8
0,7
0,6
Tempo
Figura 58 – Componentes cíclicas, sazonais e irregulares ou aleatórias
Quanto ao movimento irregular ou componente aleatória (conforme a linha de cor verde no gráfico
anterior), em alguns períodos de tempo, os valores se mostram mais elevados e, em outros, mais abaixo
do que seria previsto por uma linha de tendência. São os movimentos restantes após explicação da
tendência e dos movimentos cíclicos e sazonais, dados que não seguem a tendência modificada pelo
componente cíclico e fazem parte do efeito aleatório ou irregular, chamados de ruído aleatório ou erro
em uma série temporal.
158
ECONOMETRIA
A sazonalidade é a flutuação periódica na série temporal durante um determinado período. Essas

flutuações formam um padrão que tende a se repetir de um período sazonal para o próximo. Veja a
figura, conforme dados do Portal Action (ESTACIONARIEDADE, [s.d.]):
Sazonalidade anual: 1949-1960

600
400
Observações
200
49
50
51
52
53
55
54
56
58
57
59
60
19
19
19
19
19
19
19
19
19
19
19
19
Anos
Figura 59 – Tendência com padrão sazonal, comprimento longo
Sejam {Zt, t = 1, ..., N} as observações de uma série temporal. Podemos decompor Zt em duas formas:
• Modelo aditivo:
Zt = Tt + St + at
• Modelo multiplicativo:
Zt = Tt x St x at
Onde:
Zt: observações da série temporal;
Tt: tendência;
St: sazonalidade;
at: uma componente aleatória, de média zero e variância σ 2a .
O ponto central será estimar Tt e St e obter uma série de sazonalidade ajustada e sem tendência ou
uma série livre de sazonalidade.
159
Unidade III
Observação
Em geral, as componentes Tt e St são bastante relacionadas, e a influência

da tendência sobre a componente sazonal pode ser muito forte.
Partimos de um modelo que não comtempla a componente sazonal (St), representado pela fórmula
a seguir:
Zt = Tt + at
Onde:
Zt: observações da série temporal;
Tt: tendência;
at: uma variável aleatória com média zero e variância σ 2a .
A partir do modelo livre da sazonalidade, estimamos a componente Tt através dos métodos mais
utilizados, como:
• ajuste da linha de tendência, em função do tempo, usando um modelo linear polinomial ou exponencial;
• suavização, ao redor de um ponto, para estimar a tendência naquele ponto, através de sucessivos
ajustes de mínimos quadrados ponderados.
Detalhamos alguns dos métodos mais utilizados nas análises de séries temporais:
• Para calcular a média de observações recentes e excluir observações mais antigas, use um método
de média móvel. Não use quando suas séries exibirem uma tendência.
• Para fornecer pesos decrescentes a observações mais antigas, quando suas séries temporais
não exibirem uma tendência ou um padrão sazonal, use um método de suavização
exponencial simples.
• Para fornecer pesos decrescentes para observações mais antigas, quando suas séries
temporais exibirem uma tendência, mas não um padrão sazonal, use um método de
suavização exponencial dupla.
• Para fornecer pesos decrescentes para observações mais antigas, quando suas séries
temporais exibirem um padrão sazonal, com ou sem uma tendência, use o método de
suavização de Winters.
160
ECONOMETRIA
• Crie uma nova coluna de dados para análises personalizadas e gráficos e armazene as diferenças
entre observações dentro de uma série.
• Para medir quão bem as observações em diferentes pontos de tempo se correlacionam entre si e
procurar um padrão sazonal, realize uma análise de autocorrelação.
• Para medir quão bem as observações passadas em uma série temporal se correlaciona com futuras
observações, enquanto explicam observações que estão entre o par de correlações, realize uma
análise de autocorrelação parcial.
• Para determinar se uma série prediz outra representando graficamente as correlações entre duas
séries, em diferentes pontos no tempo, realize uma análise de correlação cruzada.
• Para ajustar um modelo com componentes autorregressivos, diferença e média móvel, realize
uma ARIMA. Para ajustar um modelo ARIMA, você deve entender a autocorrelação e a estrutura
de autocorrelação parcial das suas séries.
Figura 60 – Média móvel, comprimento curto, linha plana
Figura 61 – Suavização exponencial simples, comprimento curto, linha plana
161
Unidade III
Figura 62 – Suavização exponencial dupla, comprimento curto, linha reta

com inclinações iguais às estimativas da última tendência
Figura 63 – Método de Winters, comprimento curto a médio, tendência com padrão sazonal
Após estimada a tendência em T^ t, podemos ter a série ajustada para tendência ou livre de tendência:
Yt = Zt - T^ t
Um procedimento que é normalmente utilizado para remover tendências é tomar sucessivas

diferenças da série original até encontrar uma série estacionária:
∆Zt = Zt - Zt-1
162
ECONOMETRIA
Saiba mais
Para mais detalhes sobre análise de séries temporais, consulte o Minitab,

software estatístico que oferece diversos métodos de previsão e suavização
simples, métodos de análise de correlação e técnicas de modelagem ARIMA
para analisar seus dados de séries temporais:
http://www.minitab.com/pt-br/
Sobre como calcular estimativa da componente de tendência (T^ t),

consulte o livro:
MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo:

Blucher, 2006.
Veja o gráfico a seguir, conforme dados do site Ilos (TÉCNICAS..., [s.d.]):

0,4
0,3
0,2
0,1
0
- 0,1
- 0,2
- 0,3
- 0,4
- 0,5
- 0,6
0
01
3
0
04
3
6
5
07
6
9
i/0
/0
/0
v/0
v/0
/0
i/0
v/0
i/0
/0
o/
o/
o/
fev
fev
fev
fev
ma
ma
ma
no
no
ag
no
ag
ag
Figura 64 – Variação das vendas de automóveis no Brasil
Uma série temporal é dita estacionária quando todas as características do comportamento do

processo não são alteradas no tempo, isto é, ela se desenvolve no tempo aleatoriamente ao redor de
uma média constante, refletindo alguma forma de equilíbrio estável. Na prática, a maioria das séries que
encontramos apresenta algum tipo de não estacionariedade (por exemplo, tendência).
163
Unidade III
Quantidade de encomendas
Tempo
Figura 65 – Evolução temporal da quantidade mensal de encomendas X entregues em determinada cidade
É preciso, inicialmente, desenhar um gráfico para os dados de uma série temporal e observar
quaisquer padrões que possam ocorrer ao longo do tempo. Caso não exista evidência de tendência
a longo prazo, podemos utilizar o método das médias móveis, ou método do ajuste exponencial, para
ajustar a série, bem como métodos de previsão de séries temporais.
Média móvel
Na sua forma mais simples, usam-se normalmente os dados mais recentes para gerar previsões através da
média móvel. Assim, a cada novo período de previsão, substituem-se os dados mais antigos pelos mais recentes.
Veja a seguir o exemplo do histórico de vendas de uma loja de roupas femininas nos últimos 12 meses:
Tabela 57
Seq. 1 2 3 4 5 6 7 8 9 10 11 12
Mês Jan. Fev. Mar. Abr. Maio Jun. Jul. Ago. Set. Out. Nov. Dez. Média
Vendas (R$ mil) 19,9 25,2 48,2 34,0 48,6 42,1 30,0 18,9 35,3 42,5 43,4 59,0 37,3
Para prever as vendas através da média móvel para o mês de janeiro/ano 2, devemos calcular a venda
média dos últimos doze meses: 37,3 mil reais.
Porém, se quisermos calcular a previsão para o mês de fevereiro/ano 2, consideraremos a média dos
últimos doze meses (fev./ano 1 a jan./ano 2), procedendo de igual modo nos meses sucessivos.
Média móvel ponderada
Podemos atribuir um peso a cada um dos dados; a soma dos pesos é 1 (um). O mais indicado é
atribuir peso maior aos períodos mais recentes.
164
ECONOMETRIA
Faremos a mesma previsão do exemplo anterior (jan./ano 2), porém de forma ponderada, escolhida a
ponderação trimestral com fator de ajuste de 0,5 para o mês de dezembro e 0,3 para o mês de novembro,
e o peso de 0,2 para o mês de outubro.
Então, a previsão para jan./ano 2 é: 0,5 x 59,0 + 0,3 x 43,4 + 0,2 x 42,5 = 51,02
Método do ajustamento sazonal
Diante da existência da sazonalidade, faremos a previsão baseada nas vendas dos quatro últimos anos:
100
90
80
70
R$ mil
60
50
40
30
20
10
0
J_ano 1
M
M
J
S
N
J_ano 2
M
M
J
S
N
J_ano 3
M
M
J
S
N
J_ano 4
M
M
J
S
S
Mês/ano
Figura 66 - Vendas em loja de vestuário feminino
O procedimento consiste em definirmos os períodos de sazonalidades:
• 1º trimestre (de liquidação de verão: janeiro a março);
• 2º trimestre (abril a junho);
• 3º trimestre (de liquidação de inverno: julho a setembro);
• 4º trimestre (de outubro a dezembro).
Tabela 58
Trimestre/Ano Ano_1 Ano_2 Ano_3 Ano_4

1º trimestre 93,3 85,3 75,1 85,6
2º trimestre 124,8 158,5 138,5 130,7
3º trimestre 84,1 125,4 116,8 76,1
4º trimestre 144,9 200,5 193,5 161,1
Total 447,1 569,6 523,8 453,6
Média 111,8 142,4 131,0 113,4
165
Unidade III
Calculando os coeficientes de sazonalidade e dividindo cada valor pela média do respectivo ano:
Tabela 59
Trimestre/Ano Ano_1 Ano_2 Ano_3 Ano_4 Média

1º trimestre 0,83 0,60 0,57 0,76 0,69
2º trimestre 1,12 1,11 1,06 1,15 1,11
3º trimestre 0,75 0,88 0,89 0,67 0,80
4º trimestre 1,30 1,41 1,48 1,42 1,40
Supondo que as vendas para o ano 5 alcançassem o valor total de R$ 498,53 mil, a média trimestral
seria de R$ 124,63 mil, o que proporcionaria uma previsão distribuída pelos quatro períodos sazonais,
conforme cálculos na tabela a seguir:
Tabela 60
Trimestre/Ano Previsão (R$ mil)

1º trimestre 124,63 x 0,6905 = 86,05
2º trimestre 124,63 x 1,11 = 138,34
3º trimestre 124,63 x 0,7989 = 99,57
4º trimestre 124,63 x 1,4006 = 174,56
Método de ajustamento sazonal pela média móvel centrada
O ciclo de sazonalidade é de três períodos MMC(3). Assim, a primeira média móvel centrada (31,10) se
situa na segunda linha, que consiste na média das três primeiras vendas (19,91 + 25,20 + 48,19) / 3 = 31,10.
O índice de sazonalidade para o mês de fevereiro (segunda linha) é a divisão do valor da venda pela sua
respectiva média móvel (25,20 / 31,10 = 0,81), e assim por diante.
Tabela 61
Mês Vendas Média móvel centrada MMC(3) Índice de sazonalidade

J_ano 1 19,91
F 25,20 31,10 0,810
M 48,19 35,80 1,346
A 34,01 43,62 0,780
M 48,64 41,60 1,169
J 42,13 40,25 1,047
J 29,96 30,34 0,988
A 18,93 28,05 0,675
S 35,25 32,23 1,094
O 42,52 40,38 1,053
N 43,36 48,29 0,898
166
ECONOMETRIA
Mês Vendas Média móvel centrada MMC(3) Índice de sazonalidade

D 58,98 41,87 1,409
J_ano 2 23,28 33,06 0,704
F 16,92 28,42 0,595
M 45,06 31,18 1,445
A 31,56 47,08 0,670
M 64,62 52,83 1,223
J 62,31 59,88 1,041
J 52,71 47,07 1,120
A 26,18 41,78 0,627
S 46,46 38,65 1,202
O 43,31 51,20 0,846
N 63,83 66,84 0,955
D 93,40 57,09 1,636
J_ano 3 14,03 39,97 0,351
F 12,49 25,02 0,499
M 48,54 37,04 1,310
A 50,09 49,04 1,021
M 48,50 46,18 1,050
J 39,94 46,46 0,860
J 50,94 41,66 1,223
A 34,11 38,92 0,876
S 31,73 36,09 0,879
O 42,44 46,08 0,921
N 64,06 64,49 0,993
D 86,96 58,18 1,495
J_ano 4 23,53 42,72 0,551
F 17,66 28,54 0,619
M 44,44 39,48 1,126
A 56,33 47,12 1,195
M 40,60 43,58 0,932
J 33,81 31,87 1,061
J 21,21 24,48 0,866
A 18,42 25,35 0,727
S 36,43 26,42 1,379
O 24,40 38,55 0,633
N 54,83 53,71 1,021
D 81,90
167
Unidade III
Devemos calcular o índice de sazonalidade padronizado para cada mês com base na média. Para o
mês de janeiro (0,704 + 0,351 + 0,551) / 3 = 0,54, e assim por diante.
Tabela 62
Índice de sazonalidade
Mês mensal (padrão)
Janeiro 0,54
Fevereiro 0,63
Março 1,31
Abril 0,92
Maio 1,09
Junho 1,00
Julho 1,05
Agosto 0,73
Setembro 1,14
Outubro 0,86
Novembro 0,97
Dezembro 1,51
Supondo que as vendas para o ano 5 alcançassem o valor total de R$ 498,53 mil, a média mensal seria
de R$ 41,54 mil, o que proporcionaria uma previsão distribuída pelos doze meses no ano 5, conforme
cálculos na tabela a seguir:
Tabela 63
Mês Previsão (R$ mil)

Janeiro 41,54 X 0,535 = 22,22
Fevereiro 41,54 X 0,631 = 26,21
Março 41,54 X 1,307 = 54,29
Abril 41,54 X 0,917 = 38,09
Maio 41,54 X 1,094 = 45,44
Junho 41,54 X 1,002 = 41,62
Julho 41,54 X 1,049 = 43,58
Agosto 41,54 X 0,726 = 30,16
Setembro 41,54 X 1,138 = 47,27
Outubro 41,54 X 0,863 = 35,85
Novembro 41,54 X 0,967 = 40,17
Dezembro 41,54 X 1,513 = 62,85
Os dados a seguir representam a despesa de consumo das famílias brasileiras (em bilhões de R$)
do primeiro trimestre de 2013 ao terceiro trimestre de 2015, conforme dados do IBGE:
168
ECONOMETRIA
Tabela 64
2013/T1 2013/T2 2013/T3 2013/T4 2014/T1 2014/T2 2014/T3 2014/T4 2015/T1 2015/T2 2015/T3
776 804 829 866 854 866 888 940 912 916 937
Médias móveis
Vamos calcular as médias móveis de cinco trimestres para essa série temporal trimestral. Inicialmente,
calcula-se o total da movimentação para cinco trimestres, e em seguida divide-se esse total por 5. A
primeira das médias móveis é:
Y1 + Y2 + Y3 + Y4 + Y5 776 + 804 + 829 + 866 + 854 4.129

1 ( 5)
MM= = = = 826
5 5 5
Para o cálculo da segunda das médias móveis para 5 anos, calcula-se o total da movimentação
partindo do segundo até o sexto trimestre e divide-se esse valor por 5:
Y2 + Y3 + Y4 + Y5 + Y6 804 + 829 + 866 + 854 + 866 4.219

2 ( 5)
MM= = = = 844
5 5 5
Essa média é centrada no valor do meio (o quarto trimestre da série temporal). As demais medias
móveis são:
Y3 + Y4 + Y5 + Y6 + Y7 804 + 829 + 866 + 854 + 866 4.219

3 ( 5)
MM= = = = 844
5 5 5
Y4 + Y5 + Y6 + Y7 + Y8 829 + 866 + 854 + 866 + 888 4.303

4 ( 5)
MM= = = = 861
5 5 5
Y5 + Y6 + Y7 + Y8 + Y9 866 + 854 + 866 + 888 + 940 4.414

5 ( 5)
MM= = = = 882,8
5 5 5
Y6 + Y7 + Y8 + Y9 + Y10 854 + 866 + 888 + 940 + 912 4.460

6 ( 5)
MM= = = = 892
5 5 5
Y7 + Y8 + Y9 + Y10 + Y11 866 + 888 + 940 + 912 + 916 4.518

7 ( 5)
MM= = = = 903,6
5 5 5
Y8 + Y9 + Y10 + Y11 + Y12 888 + 940 + 912 + 916 + 937 4.219

8 ( 5)
MM= = = = 917,8
5 5 5
169
Unidade III
Todas as sete médias móveis são centralizadas em seus respectivos valores do meio. Nota-se que quanto
mais extenso o período (no caso, igual a 5), menor o número de médias móveis que podemos calcular – a
extensão do período utilizada para a construção das médias é totalmente subjetiva, e caso haja oscilações
cíclicas, é indicado que ela corresponda ao período cíclico (de valor inteiro mais próximo) ou de seu múltiplo.
Caso não haja evidências de oscilação cíclica, os períodos mais escolhidos ficam em torno de três ou cinco,
chegando às vezes até sete, dependendo do tamanho (número) de observações da série temporal.
Ajuste exponencial
O ajuste exponencial em uma série temporal consiste em uma série de médias móveis exponencialmente
ponderadas baseada na equação definida a seguir:
E1 = Y1
Ei = WYi + (1 - W)Ei-1 i = 2, 3, 4, 5, ...
Onde:
• Yi: valor corrente na série temporal;

• Ei: valor da série exponencialmente ajustada, calculado no período de tempo i;
• Ei-1: valor exponencialmente ajustado, já calculado no período de tempo i - 1;
• W: coeficiente de ajuste, peso atribuído subjetivamente (0 < W < 1), porém em todas as aplicações
de natureza econômica (W ≤ 0,5).
Os pesos vão sofrendo modificações de tal modo que o valor mais recente recebe o maior peso, o valor
anterior recebe o segundo maior peso e assim sucessivamente, com o primeiro valor recebendo o menor
peso, em que cada um dos valores exponencialmente ajustados depende de todos os valores anteriores.
A atribuição subjetiva ou a escolha do coeficiente de ajuste (W) com valores próximos de zero tem
por objetivo somente eliminar as variações cíclicas e irregulares consideradas indesejáveis. Se o interesse
passar a ser em projeções (previsões de curto prazo), o indicado será escolher valores próximos de 0,5.
Baseados nos valores trimestrais da despesa de consumo das famílias brasileiras apresentados na
tabela a seguir, no período de 36 trimestres, de 1996 a 2014, calculamos os valores exponencialmente
ajustados, com a utilização da planilha do Microsoft Excel, atribuindo os valores do coeficiente de ajuste
W = 0,5 e W = 0,25, juntamente com os respectivos gráficos.
Iniciamos o procedimento de cálculo para o ajuste exponencial com coeficiente W = 0,25, tendo
como ponto de partida o valor inicial Y1996/T1 = 126 (primeiro valor ajustado), isto é:
E1 = Y1
E1996/T1 = Y1996/T1 = 126
170
ECONOMETRIA
Na sequência, devemos utilizar o segundo valor da série temporal correspondente ao segundo trimestre
de 2016 (Y1996/T2 = 133). Ajustamos a série para o segundo trimestre de 1996, procedendo ao cálculo:
Ei = WYi + (1-W)Ei-1 i = 2, 3, 4, 5, ...
E1996/T2 = WY1996/T2 + (1 - 0,25)E1996/T1 = 0,25 × 133 + (0,75) × 126 = 127,75
Ajustando a série para o terceiro trimestre de 1996 (1996/T3):
E1996/T3 = WY1996/T3 + (1 - 0,25)E1996/T2 = 0,25 × 143 + (0,75) × 127,75 = 131,56
Ajustando a série para o quarto trimestre de 1996 (1996/T4):
E1996/T4 = WY1996/T4 + (1 - 0,25)E1996/T3 = 0,25 × 156 + (0,75) × 131,56 = 137,67
Dando sequência aos ajustamentos dos demais valores, até o final da série, apresentamos os
resultados na tabela a seguir:
Tabela 65
Seq. (X) Período Consumo (Y) AJ_EX (W = 0,50) AJ_EX (W = 0,25)

0 1996/T1 126 126,0 126,0
1 1996/T2 133 129,5 127,8
2 1996/T3 143 136,3 131,6
3 1996/T4 156 146,1 137,7
4 1997/T1 148 147,1 140,3
5 1997/T2 154 150,5 143,7
6 1997/T3 158 154,3 147,3
7 1997/T4 162 158,1 151,0
8 1998/T1 157 157,6 152,5
9 1998/T2 159 158,3 154,1
10 1998/T3 163 160,6 156,3
11 1998/T4 163 161,8 158,0
12 1999/T1 165 163,4 159,7
13 1999/T2 170 166,7 162,3
14 1999/T3 179 172,9 166,5
15 1999/T4 190 181,4 172,4
16 2000/T1 176 178,7 173,3
17 2000/T2 190 184,4 177,5
18 2000/T3 200 192,2 183,1
19 2000/T4 208 200,1 189,3
20 2001/T1 203 201,5 192,7
21 2001/T2 210 205,8 197,1
22 2001/T3 211 208,4 200,5
171
Unidade III
Seq. (X) Período Consumo (Y) AJ_EX (W = 0,50) AJ_EX (W = 0,25)

23 2001/T4 218 213,2 204,9
24 2002/T1 216 214,6 207,7
25 2002/T2 226 220,3 212,3
26 2002/T3 234 227,1 217,7
27 2002/T4 246 236,6 224,8
28 2003/T1 257 246,8 232,8
29 2003/T2 260 253,4 239,6
30 2003/T3 267 260,2 246,5
31 2003/T4 277 268,6 254,1
32 2004/T1 274 271,3 259,1
33 2004/T2 285 278,1 265,6
34 2004/T3 302 290,1 274,7
35 2004/T4 318 304,0 285,5
320
270
Consumo
R$ bilhões
AJ_EX (W = 0,50)
220 AJ_EX (W = 0,25)
170
120
1996/T1 1997/T1 1998/T1 1999/T1 2000/T1 2001/T1 2002/T1 2003/T1 2004/T1 Ano/trimestre
Figura 67 - Médias móveis para despesas de consumo das famílias brasileiras
Para proceder ao ajuste com a finalidade de previsão, adotamos o valor ajustado no período de
tempo corrente como uma projeção para o valor no período de tempo seguinte (Yî+1):
Yî+1 = Ei
Vamos prever as despesas de consumo das famílias brasileiras para o ano seguinte apresentado na
série (primeiro trimestre de 2015). Com base no coeficiente de ajuste de W = 0,25, utilizamos o valor
ajustado para 2014/T4 como estimativa (285,5).
Previsãonova = (W)(Valor corrente) + (1 - W)(Previsãocorrente)
E2015/T1 = WY2015/T4 + (1 - 0,25)E2014/T4 = 0,25 × 318 + (0,75) × 285,5 = 293,63

172
ECONOMETRIA
Como previsão nova, para o primeiro trimestre de 2015 temos o valor de 293,63.
Tendência é o fator componente de uma série temporal mais frequentemente estudado para realizar
projeções de médio e de longo prazo. Ao plotar o gráfico da série histórica visualmente, temos uma ideia
das movimentações gerais de longo prazo em uma série temporal. Havendo a possibilidade de uma linha
reta ser ajustada aos dados da série, podemos utilizar o modelo de tendência linear (Yi = α + βXi + ei). Se
observarmos o tipo de movimento quadrático de longo prazo (ascendente ou descendente), poderemos
utilizar o modelo de tendência quadrática (Yi = α + β1Xi + β2Xi2 + ei). Caso os dados da série temporal
cresçam a uma taxa constante, podemos utilizar um modelo de tendência exponencial (Yi = βXiei), em
que α é o intercepto de Y e (β -1)100% é a taxa de crescimento composta (em %).
O modelo de tendência linear:
Yi = α + βXi + ei
Para simplificar os procedimentos de cálculo e as interpretações dos coeficientes através da utilização

do método dos mínimos quadrados (MMQ), ao ajustar o modelo de tendência, vamos atribuir valores
inteiros e consecutivos à variável X (tempo), iniciando no 0 (zero) no período da série considerada.
No exemplo a seguir, já vamos adotar esse procedimento. Nos dados da série temporal (conforme a
tabela anterior), notamos que os valores inteiros codificados a serem considerados para a variável (X) se
encontram na primeira coluna da tabela. O modelo ajustado através do MMQO é apresentado a seguir:
Tabela 66

R múltiplo 0,9730
R-quadrado 0,9467
Erro-padrão 11,9876
Observações 36
Anova
Regressão 1 86.719,70 86.719,70 603,47 0,0000000
Resíduo 34 4.885,86 143,70
Total 35 91.605,56

Interseção 120,2087 3,91 30,71 0,0000 112,25 128,16
Seq. (X) 4,7246 0,19 24,57 0,0000 4,33 5,12
173
Unidade III
Assim:
Yî = 120,2087 + 4,7246Xi
O intercepto α = 120,2087 corresponde ao consumo autônomo previsto (em bilhões de reais) para
as famílias durante o ano de origem (1996 = ano-base).
A inclinação β = 4,7246 indica que a previsão do consumo das famílias é de crescimento em R$ 4,72 bilhões
por trimestre.
350 y = 4,7246x + 120,21
Consumo (Y) R2 = 0,9467
300
Linear (Consumo (Y))
250
R$ bilhões
200
150
100
50
0
10 20 30 40
Ano codificado
Figura 68 - Tendência linear para o consumo
Existe uma forte tendência linear crescente. O r2 ajustado é de 0,9451, indicando que 94,51% das
variações no consumo são explicadas pela tendência linear ao longo da série temporal.
40 y = 0,1024x2 - 3,5845x + 20,312
R2 = 0,7184
20
Resíduos
0
10 20 30 40
- 20
- 40 Seq. (X)
Figura 69 - Seq. (X): plotagem de resíduos
Através da análise residual, notamos a possibilidade de testar um modelo de tendência quadrática e

um modelo de tendência exponencial entre os que poderiam proporcionar um melhor ajuste.
O modelo de tendência quadrática pode ser visto na equação a seguir:
Yi = α + β1Xi + β2Xi2 + ei
174
ECONOMETRIA
Onde:
α = intercepto estimado de Y;
β1 = efeito linear estimado em Y;
β2 = efeito quadrático estimado em Y.
O modelo ajustado através do MMQO é apresentado a seguir:
Tabela 67

R múltiplo 0,9925
R-quadrado 0,9850
Erro-padrão 6,4574
Observações 36
Anova
Regressão 2 90.229,5 45.114,8 1.081,9 0,0000
Resíduo 33 1.376,1 41,7
Total 35 91.605,6

Interseção 140,5209 3,0573 45,96 0,0000 134,30 146,74
Seq. (X) 1,1401 0,4042 2,82 0,0081 0,32 1,96
X2 0,1024 0,0112 9,17 0,0000 0,08 0,13
Assim:
Yi = 140,5209 + 1,1401Xi + 0,1024Xi2
Nota-se que o modelo de tendência quadrática com r2ajustado =0,9841 proporciona um ajuste melhor
que o da tendência linear, e a estatística de teste (stat-t) para a contribuição do termo quadrático é
significativa, de 9,17.
175
Unidade III
350
y = 0,1024x2 + 1,1401x + 140,52
Consumo (Y) R2 = 0,985
300
250
R$ bilhões
200
150
100
50
0
10 20 30 40
Ano codificado
Figura 70 - Tendência quadratica para o consumo
Modelo de tendência exponencial
A presença de uma tendência exponencial é observada quando a série temporal cresce a uma taxa
tal que a diferença percentual de um valor para outro é constante. A equação que define esse modelo é:
Yi = βXiei
Nota-se que o pressuposto da linearidade não está sendo aceito; a equação é não linear, sendo
necessário transformá-la em linear. Neste caso, podemos utilizar a transformação logarítmica de base 10
ou de base e. Assim, a equação do modelo de tendência exponencial, pela aplicação do logaritmo em
ambos os lados da equação transformada, resulta em:
In(Yi) = In(αβXiei)
= In(α) + In(βXi) + In(ei)
= In(α) + Xi In(β) + In(ei)
Pela transformação, a equação se tornou linear, aplicando o MMQO, sendo In(Yi) a variável dependente
e Xi a variável independente:
In(Y^) = In(α) + Xi In(β) + In(ei)
176
ECONOMETRIA
Tabela 68

R múltiplo 0,9876
R-quadrado 0,9753
Erro-padrão 0,0393
Observações 36
Anova
Regressão 1 2,1 2,1 1.342,8 0,0000
Resíduo 34 0,1 0,0
Total 35 2,1

Interseção 4,8780 0,0128 379,8 0,00 4,85 4,90
Seq. (X) 0,0231 0,0006 36,6 0,00 0,02 0,02
Assim:
In(Y^) = 4,8780 + 0,0231Xi
Não devemos esquecer que para o cálculo dos parâmetros estimados devemos aplicar o antilogaritmo
(e ) aos coeficientes da regressão:
x
α^ = e4,8780 = 131,3677
β^ = e0,0231 = 1,0326
Utilizando a equação original Yi = βXiei, obtemos a equação para a previsão de tendência exponencial
a seguir:
Yi = (131,3677)(1,0326)Xi
em que o ano codificado como zero é 1996.
O intercepto de Y, α^ = 131,38 bilhões de reais, corresponde à previsão para as despesas das famílias
brasileiras para o ano-base de 1996. O valor (β^ - 1)100% = 3,26% representa a taxa composta de
crescimento trimestral para as despesas das famílias brasileiras.
177
Para prever as despesas do primeiro trimestre de 2015 (ou seja, valor decodificado de X = 36),
podemos utilizar a equação:
ln(Yî) = 4,8780 + 0,0231Xi
ln(Yî) = 4,8780 + 0,0231 × 36 = 5,7096
Yî = e5,7096 = 301,75 bilhões de reais

350
y = 131,37e0,0231x
Consumo (Y) R2 = 0,9753
300
250
R$ bilhões
200
150
100
50
0
10 20 30 40
Ano codificado
Figura 71 - Tendência exponencial para o consumo
O r2ajustado correspondente ao modelo de tendência exponencial é igual a 0,9746. É mais alto do que
o r2ajustado correspondente ao modelo de tendência linear (0,9451), porém mais baixo que o modelo de
tendência quadrática (0,9841).
Além de analisar visualmente os gráficos e o r2ajustado de cada um dos modelos para verificar qual o
mais apropriado para a utilização de previsões, podemos calcular e examinar a primeira diferença, a
segunda diferença e diferenças percentuais da série temporal.
Se as primeiras diferenças em relação a uma série temporal forem constantes, irão proporcionar
um ajuste perfeito no modelo de tendência linear e, consequentemente:
(Y2 - Y1) = (Y3 - Y2) = (Y4 - Y3) = ... = (Yn - Yn-1)
Se as segundas diferenças em relação a uma série temporal forem constantes, irão proporcionar
um ajuste perfeito no modelo de tendência quadrática e, consequentemente:
[(Y3 - Y2) - (Y2 - Y1)] = [(Y4 - Y3) - (Y3 - Y2)] = ... = [(Yn - Yn-1) - (Yn-1 - Yn-2)]
178
Se as diferenças percentuais entre valores consecutivos de uma série temporal forem constantes,
irão proporcionar um ajuste perfeito no modelo de tendência exponencial e, consequentemente:
( Y3 − Y2 ) × 100% =
( Y2 − Y1 ) × 100% = ( Y4 − Y3 ) × 100% = (n − Y )
… =n−1 × 100%
Y1 Y2 Y3 Yn−1
Vale lembrar que o procedimento é só um norteador para encontrar um ajuste mais significativo
entre os três modelos que foram apresentados: os de tendências linear, quadrática e exponencial.
Ao desenhar um gráfico dos resíduos ao longo de n períodos de tempo após ter ajustado
adequadamente um modelo, o que se espera é uma distribuição aleatória dos resíduos ao longo do
tempo. Caso o modelo não esteja bem-ajustado, os resíduos tendem a demonstrar algum padrão
sistemático que expressa o fato de não se ter levado em conta alguma tendência, variação cíclica ou
variações sazonais, características básicas componentes de uma série temporal que não foram inclusas
na parte explicada do modelo.
Outro aspecto a ser observado é o erro-padrão da estimativa, medida que é baseada na soma das
diferenças ao quadrado entre os valores reais e os previstos de uma série temporal. Portanto, a opção do
melhor ajuste recai sobre o menor valor do erro-padrão da estimativa; porém, a desvantagem em usá‑lo
ocorre quando existe uma grande diferença sobre Yi (observado) e Yî (previsto): o valor do erro fica
superdimensionado em razão de sua elevação ao quadrado. Existe uma preferência pelo uso do desvio
médio absoluto (DMA) como a média aritmética das diferenças absolutas entre os valores observados e
os valores previstos em uma série temporal:
DMA =
∑ i=1 Yi − Yî
n
Um valor do DMA próximo de zero significa um modelo que possui um perfeito ajuste aos dados da
série temporal. Quer dizer que ao comparar dois ou mais modelos de previsão podemos selecionar como
o mais apropriado o que possui o menor valor. A orientação de escolha é pelo modelo com a menor
quantidade de variáveis independentes e a maior capacidade de previsão.
Observação
Sabemos que um indicador do nível de custo de vida é construído levando-
se em consideração não apenas os custos de aluguel, mas também outros
custos de moradia, bem como os itens educação, transporte, alimentação etc.
Nesse contexto, a análise de regressão possibilita, com base nos indicadores
dos níveis de custo de aluguel, devido à correlação entre os dois indicadores
ser muito alta, usá-lo como aproximação para um indicador do custo de vida.
Significa que os custos de aluguel são uma boa aproximação para o custo de
vida e de extrema importância para estudos de desigualdade regional.
179
Lembrete
Escolher um modelo de regressão adequado não é simplesmente levar

em conta a significância (bom ajuste) dos parâmetros, mas especialmente
certificar se os coeficientes estimados são coerentes, isto é, a existência de
uma estrutura lógica do modelo (base teórica).
Resumo
Destacamos os pressupostos básicos que precisam ser seguidos para

garantir a qualidade do resultado dos modelos de regressão linear, em
especial os que são os mais violados nos casos em que o objeto de estudo
envolve relações sociais, como as relações econômicas e suas consequências.
Vimos também a identificação e correção e a importância da escolha das
variáveis que irão compor a base de dados para a elaboração de um modelo
e o período que formará a base de estudo.
Abordamos a introdução das variáveis dummies na análise de regressão,

que amplia, de certa forma, o poder de análise dos modelos, pois permite
incorporar, nos modelos, variáveis importantes que se pretende analisar e
que não podem ser medidas quantitativamente, em especial quando estas
são consideradas variáveis independentes. Vimos também a utilização
das variáveis qualitativas (dummies ou binárias) para controlar um tipo
de fenômeno conhecido como quebra estrutural; o teste de Chow, que
envolve a igualdade de coeficientes de diferentes regressões, ou teste de
equivalência de duas regressões; e a interpretação dos coeficientes ligados
às variáveis dummies.
Na sequência, estudamos a adoção de modelos em que aparecem

variáveis defasadas em uma série temporal muito útil para a análise de
políticas públicas. São variáveis que estão fortemente correlacionadas
aos valores que as antecedem e àqueles que as sucedem. Tratamos de
técnicas de modelagem na qual incluímos como variável independente
uma componente defasada da variável dependente. Essa técnica de
previsão é bastante utilizada para prever séries temporais que apresentam
autocorrelação (modelo autorregressivo) e tem sido muito usada em
estudos da oferta de produtos agrícolas.
Tratamos do método de regressão por variáveis instrumentais, por

ser uma solução possível que fornece estimadores consistentes dos
parâmetros de interesse quando o erro (e) e uma variável regressora (X)
180
são correlacionados. O método tem como destaque a sua utilização em
séries temporais que registram ciclos econômicos, momentos de retração
e expansão com movimentos lentos de recuperação e impulsos que
continuam e tendem a desacelerar no decorrer do tempo – portanto,
observações sucessivas que são interdependentes.
Já havíamos abordado mais intensamente os métodos causais de

previsão, aqueles envolvendo a determinação de fatores relacionados à
variável que tentamos prever, em especial a regressão linear com variáveis
qualitativas (dummies), as variáveis defasadas e o método com variáveis
instrumentais. Nesta unidade, vimos os métodos de previsão de séries
temporais que utilizam dados históricos, do passado e do presente de uma
determinada variável para prever valores futuros. São modelos utilizados
para descrever séries temporais, processos estocásticos, isto é, processos
controlados por leis probabilísticas. Foram apresentados e discutidos
os fatores que compõem o modelo em estudo (tendência, sazonalidade,
ciclos e componentes aleatórios), as etapas da construção desses modelos
(como média móvel e ajuste exponencial e de tendência quadrática) que
dependem de vários fatores, como o comportamento do fenômeno ou o
conhecimento a priori que temos de sua natureza e do objetivo da análise.
Abordamos o núcleo essencial da matéria que envolve construção e

modelagem de regressão em seus principais aspectos quanto à escolha do
modelo mais adequado, a fim de analisar o passado e o presente, projetar o
futuro e avaliar políticas públicas.
Exercícios
Questão 1. (Enade 2009) Considere o modelo de regressão linear múltipla, com variável dependente
y e variáveis explicativas X1, X2, ..., Xk que pode ser expresso como
yt = b1 + b2 X2t + b3 X3t + . . .+ bk Xkt + εt
em que εt significa o fator de erro e t = 1,2, ..., no índice relativo às observações amostrais.
Nesse modelo,
I – O alto grau de multicolinearidade torna imprecisas as estimativas dos parâmetros populacionais

baseadas no método de mínimos quadrados.
II – O erro de especificação por inclusão de variável explicativa irrelevante torna tendencioso o

estimador de mínimos quadrados dos parâmetros populacionais.
181
III – Satisfeitas as hipóteses do modelo clássico de regressão linear, segue-se que os estimadores
de mínimos quadrados são consistentes e têm mínima variância entre todos os estimadores lineares
não tendenciosos.
IV – Ao se incluir uma variável explicativa irrelevante num modelo de regressão linear múltipla, o
valor de r2 ajustado não se elevará de forma significativa, mesmo que aumente o valor r2.
Estão corretas somente as afirmativas
A) I e III.
B) I, II e IV.
C) I, II e III.
D) I, III e IV.
E) II e III.
Resposta correta: alternativa D.
Análise das afirmativas
I – Afirmativa correta.
Justificativa: a multicolinearidade implica que variáveis explicativas interfiram entre si, na variável
dependente e na própria precisão dos estimadores.
II – Afirmativa incorreta.
Justificativa: a inclusão de variável explicativa irrelevante não torna tendencioso o estimador de

mínimos quadrados, pois, para o estimador ser tendencioso, é preciso que a diferença entre sua média
e o valor verdadeiro se amplie; isso, coeteris paribus, não ocorrerá com a adição de uma variável
explicativa irrelevante.
III – Afirmativa correta.
Justificativa: o método dos mínimos quadrados, respeitando-se os pressupostos do modelo clássico

de regressão linear como afirmado, garante tais condições.
IV – Afirmativa correta.
Justificativa: essa diferença esperada de impacto neutro no R2 ajustado frente à adição de uma
variável explicativa irrelevante é o que diferencia do R2 (que aumenta pela adição de variáveis explicativas,
mesmo irrelevantes).
182
Questão 2. (Enade 2015) A utilização de dados em painel para a análise de políticas públicas
tornou‑se bastante comum recentemente, dada a disponibilidade de informações para anos
consecutivos de variáveis de interesse. Ainda que se faça uma análise para apenas dois períodos,
no que se refere à variável dependente, a existência de informações anuais para vários períodos
consecutivos das variáveis explicativas permite a utilização de modelos de defasagem distribuída.
Para análise da ocorrência de crimes e da influência das prisões, foi realizado um estudo na Noruega
com dados para 53 distritos policiais, tendo sido medida a taxa de crimes (crime) para os anos 1972 e
1978. A variável explicativa foi definida como a porcentagem dos crimes que resultaram em prisão (pcp).
O modelo com controle para efeitos fixos foi especificado como segue.
log crime 0 0D78t 1pcpi,t1 2pcpi,t2 i ui,t
Na equação, D78t é uma variável dummy com valor igual a 1 para o ano de 1978 e zero para o ano
de 1972, αi corresponde ao controle para os efeitos fixos, e ui,t corresponde aos resíduos de regressão.
Utilizando-se a primeira diferença da equação acima, a estimação resultou em
log crime 0, 086 0, 004 pcp1 0, 0132pcp2

R2 0,193 1, 34 0, 85 2, 54
Os módulos dos valores entre parênteses são, respectivamente, as estatísticas t calculadas para cada
um dos coeficientes estimado,s e o valor t, tabelado ao nível de significância de 5%, é igual a 2,00.
Considerando os resultados do estudo descrito acima e a influência das prisões sobre a criminalidade,
conclui-se que:
A) O modelo explica 0,193% da variabilidade da variável dependente, conforme o coeficiente

de determinação.
B) Os crimes seriam declinantes, conforme a constante estimada, na ausência de prisões no

período considerado.
C) Um aumento de 10% nas prisões resultaria, em média, em uma queda de 1,32% na taxa de crimes
com dois períodos de defasagem.
D) As prisões efetuadas no ano de 1972 têm efeito negativo e são estatisticamente significativas, ao
nível de significância de 0,05, para a redução da criminalidade.
E) As prisões efetuadas com a defasagem de dois períodos têm efeito negativo e exercem efeito
significativo, ao nível de significância de 0,05, para redução da criminalidade.
Resposta correta: alternativa E.
183
Análise das alternativas
A) Alternativa incorreta.
Justificativa: o coeficiente de determinação (R²) igual a 0,193 indica que o modelo prevê (ou explica)
19,3% da variabilidade observada na variável dependente.
B) Alternativa incorreta.
Justificativa: como os resíduos û têm média zero, o valor previsto estimado pela equação (6) é
calculado por:

log crime 0 1pcp1 2pcp2
Se não há prisões no período, temos que pcpt-1 = pcpt-2 = pcpt-3 = 0. Assim, ∆pcp-1 =Δ∆pcp-2 = 0.
Substituindo esses valores na equação acima, temos que, se não há prisões:

log crime 0
No enunciado, temos que a constante da equação (6), (δ_0 ) ̂, foi estimada igual a 0,086. Assim:

log crime 0, 086
Nota-se que, na ausência de crimes, a tendência é de aumento na variável dependente, o que
contraria a afirmativa. Podemos calcular o efeito exato com algumas manipulações algébricas.

log crime t

log 
crime t log crime t1  0, 086
log crime
t 1
log crime t 0, 086 log crime t1
log crime t e0,086 log crime t1 1, 0898 log crime t1
Portanto, na ausência de prisões, espera-se que a taxa de criminalidade aumente aproximadamente

9%, o que indica que tendência de aumento, não de declínio, de tal taxa.
C) Alternativa incorreta.
Justificativa: pelos dados do enunciado, estimou-se que o coeficiente de Δ∆pcp-2 é igual a -0,0132.
Assim, espera-se que um aumento temporário de um ponto percentual (não de 10%) na taxa de
aprisionamento resulte em aproximadamente 1,32% de diminuição na taxa de crimes.
184
D) Alternativa incorreta.
Justificativa: tomando o ano de 1978 como referência, 1972 correspondente ao período t-1. O
coeficiente de Δ∆pcp-1, β1 , é igual a -0,004. A estatística t correspondente a esse coeficiente é, em
módulo, 0,85, menor que o valor crítico de 2,00 dado pelo enunciado para a distribuição t ao nível de
significância de 5%. Portanto, o efeito da taxa de aprisionamento em 1972, embora negativo, não é
estatisticamente significativo ao nível de 5%.
E) Alternativa correta.
Justificativa: o coeficiente de Δ∆pcp-2, β2 , é igual a -0,004. A estatística t correspondente a esse

coeficiente é, em módulo, 2,54, maior do que o valor crítico de 2,00 dado pelo enunciado para a
distribuição t ao nível de significância de 5%. Portanto, o efeito da taxa de aprisionamento defasada
em dois períodos é negativo e estatisticamente significativo ao nível de 5%.
185
REFERÊNCIAS
Textuais
BARTLETT, M. S. Fitting a straight line when both variables are subject to error. Biometrics, n. 5, 1949,
p. 207-242.
BERGER, G. Phénoménologie du temps et prospective. Paris: PUF, 1964.
BUSCARIOLLI, B.; EMERICK, J. Econometria com eviews. São Paulo: Saint Paul, 2011.
CARVALHO, H. Como investir em ouro com apenas R$ 1.000. HC Investimentos, 2013. Disponível em: http://
hcinvestimentos.com/2013/02/26/como-investir-em-ouro/?hvid=4AmjBx. Acesso em: 6 abr. 2017.
CIA, J. C. Econometria. São Paulo: Saint Paul, 2013.
DIAS, V. P. Econometria para concursos. Rio de Janeiro: Campus, 2012.
ESTACIONARIEDADE. Portal Action, [s.d.]. Disponível em: http://www.portalaction.com.br/series-

temporais/11-estacionariedade. Acesso em: 6 abr. 2017.
FRIEDMAN, M. The methodology of positive economics. In: FRIEDMAN, M Essays in positive economics
3.3. Chicago: University of Chicago Press, 1953.
GREENE, W. H. Econometric analysis. 5. ed. New Jersey: Prentice Hall/Upper Saddle River, 2003.
GUJARATI, D. N. Econometria básica. 4. ed. São Paulo: Makron Books, 2000.
HILL, C.; GRIFFITHS, W.; JUDGE, G. Econometria. São Paulo: Saraiva, 2003.
HOFFMANN, R. Análise de regressão: uma introdução à Econometria. São Paulo: Hucitec, 1977.
HOOVER, K. The methodology of Econometrics. In: MILLS, T. C.; PATTERSON, K. (Ed.). Palgrave handbook
of econometrics: econometric theory. Nova York: MacMillan, 2006.
INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA. Censo 2000: microdados. Brasília: IBGE, 2000.
JOHNSTON, J. Econometric methods. 2. ed. Nova York: McGraw-Hill, 1972.
KEYNES, J. M. (1929). Can Lloyd George do it? In: Essays in persuasion. Cambridge: Macmillan, 1972.
(The Collected Writings of John Maynard Keynes, v. IX).
KEYNES, J. M. (1933). The means to prosperity. In: Essays in persuasion. Cambridge: Macmillan, 1972.
(The Collected Writings of John Maynard Keynes, v. IX).
186
KNOEMA. Atlas mundial de dados. [s.d.]. Disponível em: http://pt.knoema.com/atlas/topics/Economia.
Acesso em: 14 mar. 2017.
LEVINE, D. M. et al. Estatística: teoria e aplicações – usando Microsoft Excel em português. Tradução:
Teresa Cristina Padilha de Souza. Rio de Janeiro: LTC, 2013.
MARCIAL, E.; GRUMBACH, R. J. dos S. Cenários prospectivos: como construir um futuro melhor. São
Paulo: FGV, 2007.
MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo: Blucher, 2006.
PEREZ, M. C. R. C. Contribuição ao estudo da elasticidade-renda do consumo de alimentos. Dissertação

(Mestrado) – Esalq-USP, Piracicaba, 1973.
ROSENBERG, M. A lógica da análise do levantamento de dados. São Paulo: Cultrix/Edusp, 1976.
SARTORIS, A. Estatística e introdução à Econometria. São Paulo: Saraiva, 2003.
SILVEIRA, F. G. et al. (Org.). Gasto e consumo das famílias brasileiras contemporâneas. v. 2. Brasília:
Ipea, 2007. Disponível em: http://ipea.gov.br/portal/images/stories/PDFs/livros/Livro_completo2.pdf.
Acesso em: 5 abr. 2017.
STOCK, J. H., WATSON, M. W. Econometria. São Paulo: Addison Wesley Brasil, 2004.
TÉCNICAS quantitativas de previsão de vendas. Ilos, [s.d.]. Disponível em: http://www.ilos.com.br/web/

tag/tecnicas-quantitativas-de-previsao-de-vendas. Acesso em: 6 abr. 2017.
WALD, A. The fitting of straight lines if both variables are subject to error. The Annals of Mathematical
Statistics, n. 11, 1940, p. 284-300.
WOOLDRIDGE, J. Introdução à Econometria: uma abordagem moderna. São Paulo: Thompson

Learning, 2005.
Sites
www.bcb.gov.br/
http://brasilemsintese.ibge.gov.br/
http://www.minitab.com/pt-br/
www.mme.gov.br/
187
Exercícios
Unidade I – Questão 1: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

TEIXEIRA (INEP). Exame Nacional de Desempenho dos Estudantes (ENADE) 2006: Ciências Econômicas.
Questão 36. Disponível em: http://download.inep.gov.br/download/enade/2006/Provas/PROVA_DE_
CIENCIAS_ECONOMICAS.pdf. Acesso em: 13 jan. 2020.
Unidade I – Questão 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

Questão 33. Disponível em: http://download.inep.gov.br/educacao_superior/enade/provas/2015/04_
ciencias_economicas.pdf. Acesso em: 13 jan. 2020.
Unidade II – Questão 1: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

Questão 24. Disponível em: http://public.inep.gov.br/enade2009/CIENCIAS_ECONOMICAS.pdf. Acesso
em: 13 jan. 2020.
Unidade II – Questão 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

Questão 37. Disponível em: http://download.inep.gov.br/download/enade/2006/Provas/PROVA_DE_
CIENCIAS_ECONOMICAS.pdf. Acesso em: 13 jan. 2020.
Unidade III. Questão 1: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

Questão 25. Disponível em: http://public.inep.gov.br/enade2009/CIENCIAS_ECONOMICAS.pdf. Acesso
em: 13 jan. 2020.
Unidade III. Questão 2: INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO

Questão 20. Disponível em: http://download.inep.gov.br/educacao_superior/enade/provas/2015/04_
ciencias_economicas.pdf. Acesso em: 13 jan. 2020.
188
189
190
191
192
Informações:
www.sepi.unip.br ou 0800 010 9000

Econometria - Livro-Texto - Unidade III

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Econometria - Livro-Texto - Unidade III

Enviado por

Direitos autorais:

Formatos disponíveis

1ª etapa: especificação ou construção do modelo

2ª etapa: estimação do modelo especificado

Coleta de dados apropriados

Estimação dos parâmetros

3ª etapa: avaliação da equação estimada

Avaliação dos resultados

Rejeição das hipóteses Aceitação das hipóteses

Revisão das Desistência das Previsão e/ou

Figura 42 – Passos para a elaboração de um modelo econométrico

Para solucionar o problema encontrado, o procedimento é selecionar as principais variáveis

Tabela 34 – Produção de açúcar e etanol hidratado

Preço do açúcar VHP Produção de etanol

Ano mil toneladas US$/saca de 50 quilos em mil litros

2005/06 26.420,0827 8,8975 7.746.040,5

2006/07 30.223,6000 14,4450 9.211.462,2

2007/08 31.279,7000 10,1283 14.367.117,5

2008/09 31.620,2000 11,1508 16.619.713,8

2009/10 33.074,7000 14,5258 18.812.782,8

2010/11 38.168,4000 19,6842 19.578.500,3

2011/12 38.271,8000 25,2400 13.749.286,0

2012/13 38.336,8761 23,3375 13.788,092,0

2013/14 37.878,2633 17,5258 16.132.283,8

2014/15 35.560,1797 16,4067 16.931.881,4

2015/16 33.489,1427 13,1275 19.253.024,1

Tabela 35 – Análise de variância (Anova)

Resumo dos resultados

Resultados do Resíduos Resultados de Probabilidade

Ao nível de significância de 5% e para 2 e 8 graus de liberdade, o valor crítico de F é 4,6 (vide

Figura 43 – Plotagem dos resíduos X1 e X2

Para o modelo de regressão linear simples (MRLS), valem as hipóteses:

• distribuição normal dos resíduos;

Veja a tabela a seguir, elaborada a partir de números do IBGE:

Tabela 36 – Matriz de correlação

Yi Preço do açúcar VHP (X1) Prod. etanol (X2)

7.1 Testes para identificação de multicolinearidade

7.1.1 Teste de Farrar e Glauber

  1 r12 ….. r1k 

Calculando o valor da estatística X2teste, temos:

Pela tabela, encontramos o valor crítico qui-quadrado, onde:

• nível de significância de 5% (α = 0,05);

X2crítico; 0,05; 1 = 0,0039

X2teste = - [10 - 1,5] x - 2,64837

X2teste = - [8,5] x - 2,64837 = 22,51

Teste de aceitação – teste de Farrar e Glauber:

H0: ausência de multicolinearidade;

H1: existe multicolinearidade.

7.1.2 Teste da VIF (Variance Inflation Factor)

rk = coeficiente de correlação da variável k com as demais variáveis.

Regra de decisão para o VIF:

Figura 44 – Regra de decisão para o Teste VIF (Variance Inflation Factor)

7.1.3 Teste da Tolerance (TLk)

rk = coeficiente de correlação da variável k com as demais variáveis.

Calculando o índice: TLk = (1 - 0,184492) = 0,9660.

Regra de decisão para o TLk:

Figura 45 – Regra de decisão para o teste TLk (Teste da Tolerance)

8 DEMAIS ANÁLISES EM ECONOMETRIA

8.1 Quebras Estruturais e Variáveis Dummies

II – Erros são normalmente distribuídos (os resíduos têm distribuição normal).

III – Os Xi são fixos (não estocásticos, não aleatórios).

IV – E(ε2) = σ2 (variância constante e igual a σ2, condição de homocedasticidade dos resíduos).

VI – As variáveis Xi não podem ser combinações lineares entre si.

• Identificação: obter um teste F bastante significante, um R2 alto acompanhado de estatísticas de