(8814 - 28949) Econometria Livro Completo

econometria.
pdf 1 13/01/16 10:00
w w w. u n i s u l . b r
Universidade do Sul de Santa Catarina
Econometria
UnisulVirtual
Palhoça, 2016
book_econometria.indb 1 13/01/16 11:27

Créditos
Universidade do Sul de Santa Catarina – Unisul

Reitor
Sebastião Salésio Herdt
Vice-Reitor
Mauri Luiz Heerdt
Pró-Reitor de Ensino, de Pesquisa e de Extensão

Mauri Luiz Heerdt
Pró-Reitor de Desenvolvimento Institucional
Luciano Rodrigues Marcelino
Pró-Reitor de Operações e Serviços Acadêmicos
Valter Alves Schmitz Neto
Diretor do Campus Universitário de Tubarão

Heitor Wensing Júnior
Diretor do Campus Universitário da Grande Florianópolis
Hércules Nunes de Araújo
Diretor do Campus Universitário UnisulVirtual
Fabiano Ceretta
Campus Universitário UnisulVirtual

Diretor
Fabiano Ceretta
Unidade de Articulação Acadêmica (UnA) – Ciências Sociais, Direito, Negócios e Serviços

Amanda Pizzolo (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Educação, Humanidades e Artes
Felipe Felisbino (coordenador)
Unidade de Articulação Acadêmica (UnA) – Produção, Construção e Agroindústria
Anelise Leal Vieira Cubas (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Saúde e Bem-estar Social
Aureo dos Santos (coordenador)
Gerente de Operações e Serviços Acadêmicos

Moacir Heerdt
Gerente de Ensino, Pesquisa e Extensão
Roberto Iunskovski
Gerente de Desenho, Desenvolvimento e Produção de Recursos Didáticos
Márcia Loch
Gerente de Prospecção Mercadológica
Eliza Bianchini Dallanhol

Joseane Borges de Miranda
Econometria
Livro didático
Designer instrucional
Carmelita Schulze
UnisulVirtual
Palhoça, 2016

Copyright © Nenhuma parte desta publicação pode ser reproduzida por
UnisulVirtual 2016 qualquer meio sem a prévia autorização desta instituição.
Livro Didático
Professora conteudista Diagramador(a)

Joseane Borges de Miranda Pedro Teixeira
Designer instrucional Revisor(a)

Carmelita Schulze Diane Dal Mago
Projeto gráfico e capa

Equipe UnisulVirtual
330.015195
M64
Miranda, Joseane Borges de
DEconometria : livro didático / Joseane Borges de Miranda ; design
instrucional Carmelita Schulze. – Palhoça : UnisulVirtual, 2016.
212 p. : il. ; 28 cm.
Inclui bibliografia.
1. Econometria. 2. Análise de regressão. I. Schulze, Carmelita. II.

Título.
Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

Sumário
Introdução | 7
Capítulo 1
Análise de Regressão | 9
Capítulo 2
Técnicas adicionais de análise de regressão | 49
Capítulo 3
Problemas de regressão | 101
Capítulo 4
Equações simultâneas | 135
Considerações Finais | 159
Referências | 161
Sobre a Professora Conteudista | 163

Introdução
Ferramentas estatísticas são poderosas aliadas para avaliação e tomada de

decisão. Nos dias atuais, além de tomar decisões acertadas, há a pressão para
que se reduza cada vez mais o gap de tempo para tomar essas decisões. A
econometria é um conjunto de conhecimentos que apresenta a utilização de
modelos matemáticos e estatísticos para avaliação e tomada de decisões a partir
de dados passados.
Ou seja, os dados passados das variáveis envolvidas na análise determinam um

padrão para prever o futuro. Note que é uma poderosa ferramenta porque, por
exemplo, prever gastos ou receitas futuras é essencial para decisões de qualquer
organização produtiva ou governamental.
Infelizmente, os modelos não são tão fáceis de serem aplicados, ou melhor, são
fáceis de aplicar, porém, devem passar por uma série de testes estatísticos para
sua validação e utilização. Estudaremos os métodos de regressão simples e
múltipla e seus possíveis problemas de consistência dos parâmetros estimados,
assim como aprenderemos a fazer projeção a partir da estimação do modelo.
Além de como calcular a função de regressão, vamos introduzir algumas

especificidades, tais como, defasagem temporal e inclusão de uma variável
dummy, o que aumenta o poder de previsão dos modelos. Incluir o tempo que
capta o efeito de uma variável defasada sobre a variável dependente, é uma
forma de diminuir o erro estocástico do nosso modelo. A variável dummy é uma
variável artificial, que auxilia a captar efeitos de variáveis qualitativas, tais como:
diferença de gênero, idade, entre outros.
Também estudaremos modelos em que teremos mais de uma equação

representativa, as equações simultâneas. Essas nos ajudam nos problemas em
que a variável dependente às vezes também pode ser explicativa.
A aplicação de modelos econométricos requer conhecimentos prévios de teoria

econômica, isso porque as variáveis envolvidas em modelos devem apresentar
relação teórica para maximização da utilidade dos modelos.
Desejo que todos realizem seus estudos com sucesso e muito aprendizado.
Profa. Josiane

Capítulo 1
Análise de Regressão
Seção 1
Introdução à econometria
Inicialmente, vamos entender o que significa a econometria nos estudos das
ciências econômicas. Para isso, destacaremos os principais conceitos discutidos
pela bibliografia pertinente quanto a essa área. Assim, comecemos por entender
o que significa a regressão linear em economia.
Apesar de dificilmente resolvermos problemas reais em uma economia moderna

com apenas uma variável explicativa, ou seja, um (X), vamos começar com o
modelo de regressão linear simples. Fazem parte desse modelo, os seguintes
parâmetros econômicos: o método dos mínimos quadrados, os testes estatísticos
e o teste de hipóteses, que, aqui, será adaptado para os modelos econométricos.
Você também vai aprender a utilizar o Excel para estimar os parâmetros

estudados. Essa é uma ferramenta importante para o desenvolvimento desta
Unidade de Aprendizagem, fica muito difícil estimar modelos múltiplos sem uma
ferramenta de cálculo mais avançada.
A econometria é uma poderosa ferramenta de análise e principalmente

de previsão do comportamento das variáveis econômicas, tanto das que
envolvem os conceitos de macroeconomia, como das que envolvem a
microeconomia.
Portanto, econometria envolve o cálculo dessas variáveis, geralmente com a

utilização de uma planilha eletrônica tipo Excel e conhecimento teórico das
variáveis envolvidas. Iniciaremos com os conceitos que envolvem a aplicação de
econometria nas ciências econômicas, e aplicação em regressão linear simples a
mais corriqueira, e finalizaremos com a aplicação em funções com duas variáveis.

Capítulo 1
A econometria tem se tornado fortemente identificada com a análise de

regressão. Essa relaciona uma variável dependente a uma ou mais variáveis
independentes ou explicativas. Considerando que as relações entre variáveis
econômicas são geralmente inexatas, uma perturbação ou probabilidade de erro
deve ser incluída na função de regressão.
Tomando em conta a amplitude de atuação da econometria, podemos

defini-la integração da teoria econômica, matemática, e técnicas
estatísticas, com o propósito de testar hipóteses sobre fenômenos
econômicos, estimação de coeficientes de relações econômicas, e
projeções ou predições de valores futuros das variáveis ou fenômenos
econômicos.
A teoria econômica nos proporciona uma base para identificar variáveis

econômicas importantes, bem como a compreensão da alocação de recursos
e da determinação de preço em uma economia capitalista. Segundo Hill et al.
(2010), para que essas informações sejam úteis na tomada de decisões, tanto
no âmbito governamental quanto empresarial, precisamos saber mais sobre
as relações entre variáveis econômicas, para responder a questões como as
seguintes:
•• Qual a relação entre a quantidade de dinheiro, digamos M1, e o nível

de atividade econômica?
•• Qual o impacto, no nível de investimento, de uma modificação do
imposto sobre ganhos de capital?
•• Qual o efeito, sobre a distribuição de renda, das modificações na
legislação tributária?
O desafio é como combinar a teoria econômica com a informação fornecida por

dados econômicos para estimar as incógnitas necessárias para a tomada de
decisões, ou seja, responder às questões como as que foram levantadas. Essa é
a função da econometria.
Segundo Gujarati (2011), a econometria refere-se à aplicação da teoria

econômica, matemática e técnicas estatísticas, com o propósito de testar
hipóteses e estimular, e estimar e projetar fenômenos econômicos.
Segundo Gujarati (2011), a metodologia econométrica tradicional segue o

caminho a seguir:
10

Econometria
a. formulação da teoria ou da hipótese;

b. especificação do modelo matemático da teoria;
c. especificação do modelo econométrico da teoria;
d. obtenção de dados;
e. estimativa dos parâmetros do modelo econométrico;
f. teste de hipótese;
g. previsão ou predição
h. utilização do modelo para fins de controle ou política.
De acordo com o autor, podemos esquematizar o aprendizado da econometria a

partir de dados econômicos da seguinte maneira:
•• Tudo começa com um problema.

•• A teoria econômica nos dá uma forma de pensar no problema.
Por exemplo, como utilizaríamos uma função de produção para
determinar a melhor combinação de fatores, o nível ótimo de
produção ou a demanda por um insumo?
•• Essa informação forma um modelo econômico eficiente, que leva em
conta nossas hipóteses fundamentais.
•• O modelo econômico ativo conduz-nos ao modelo estatístico que
descreve o processo pelo qual foram geradas as observações
amostrais, a classificação das variáveis e a forma funcional do
relacionamento.
•• Coletam-se observações amostrais coerentes com o modelo
econômico.
•• Dado o modelo estatístico e as observações amostrais, escolhe-
se ou estabelece-se uma regra de estimação que tenha boas
propriedades estatísticas.
•• Obtêm-se estimativas dos parâmetros desconhecidos com o auxílio
de um software de computador (Excel ou Statistica, dentre outros), a
partir de testes de hipóteses apropriadas.
•• Analisam-se e avaliam-se as consequências estatísticas e
econômicas e as implicações dos resultados empíricos. Por
exemplo, as varáveis explicativas eram todas importantes? Utilizou-
se a forma funcional correta? Que alocação de recursos econômicos
e que resultados de distribuição estão implícitos, e quais as
implicações numa escolha política?
11

Capítulo 1
•• Se não se obteve convergência entre os modelos econômicos e os

dados amostrais, quais são os pontos dúbios em potencial, e quais
são as sugestões para análise e avaliação futuras? Por exemplo,
os dados terão sido inadequados para fundamentar as questões
formuladas? As variáveis no modelo econômico foram classificadas
corretamente e foram apresentadas com os sinais e defasagens
corretos?
Gujarati (2011) dá-nos um exemplo de formulação da teoria ou da hipótese de um

modelo econométrico, a partir de conceitos macroeconômicos. Acompanhe!
A partir da teoria de Keynes, sabemos que o indivíduo, em média,

dispõe-se a aumentar seu consumo quando sua renda aumenta, mas
não tanto quanto o aumento em sua renda, ou seja, a propensão
marginal a consumir (PMgc) – a taxa de variação do consumo – é maior
que zero, mas menor que 1.
A relação entre consumo e renda é positiva, porém, não se sabe de

forma precisa a relação funcional entre os dois. Para Gujarati (2011),
um economista matemático poderia sugerir a seguinte forma da função
consumo Keynesiana:
(1)
Conforme apresentado acima, y = despesa de consumo e x = renda,

em que b0 e b1 , conhecidos como parâmetros do modelo, são,
respectivamente, os coeficientes de intercepto e declividade.
O coeficiente de declividade b1 mede a PMgc. A variável que aparece

à esquerda do sinal de igualdade se chama variável dependente e a
variável (ou variáveis) à direita se chama independente ou explicativa.
Depois de identificarmos uma teoria econômica plausível para nosso modelo de

investigação, podemos especificar o modelo econométrico. Note que diferente
de uma relação matemática direta, na economia temos muitas perturbações, ou
seja, o gasto com consumo além da renda depende de gostos, hábitos e demais
subjetividades difíceis de serem mensuradas, e é aí que entra o erro estatístico,
como veremos a seguir.
12

Econometria
Segundo Gujarati (2011), o modelo puramente matemático da função consumo

dado pela equação (1) tem interesse restrito para o econometrista, uma vez que
supõe uma relação exata ou determinista entre consumo e renda. Assim, se
quisermos obter dados sobre despesa de consumo e renda disponível (isto é,
após descontados os impostos) de uma amostra de 500 famílias, e representar
graficamente esse dados, com a despesa de consumo no eixo vertical e a
renda disponível no eixo horizontal, não podemos esperar que todas as 500
observações se situem exatamente na reta da equação (1). Isso porque, além da
renda, outras variáveis afetam o consumo. Por exemplo, o tamanho da família,
as idades de seus membros, a religião etc., provavelmente exercem alguma
influência sobre o consumo.
Para admitir relações inexatas entre as variáveis econômicas, o econometrista

modificaria a função consumo determinista (1) da seguinte forma:
(2)
em que e, conhecido como termo de perturbação ou erro, é uma variável

aleatória (estocástica), que possui propriedades probabilísticas bem definidas.
O termo de perturbação e pode representar bem todos os fatores que afetam o
consumo, mas que não são considerados explicitamente.
A equação (2) é um exemplo de modelo econométrico, tecnicamente um modelo

de regressão linear. A função consumo econométrica adota como hipótese que
a variável dependente Y (consumo) se relaciona linearmente com a variável
explicativa X (renda), mas que a relação entre os dois não é exata; está sujeita à
variação individual.
Graficamente temos:
Gráfico 1.1 – Diagrama de dispersão (XY)
Fonte: Elaborado pelo autor (2012).
13

Capítulo 1
Para reforçar a especificação do modelo, vamos ver os conceitos de Hill et

al. (2010), que além da relação renda e consumo, trabalha com mais algumas
relações econômicas.
Como qualquer tomada de decisão que ocorre em um mundo dinâmico,

os valores presentes, passados e futuros (esperados) dos preços podem
desempenhar papel relevante na formulação do modelo econômico de reação da
oferta.
•• Probabilidade de quanto? Grandeza.

•• Os valores de parâmetros econômicos não são conhecidos e devem
ser estimados por meio de uma amostra de dados econômicos, não
são os valores verdadeiros.
Num modelo estatístico, a primeira coisa a considerar é que as relações

econômicas não são exatas.
Hill et al. (2010) acredita que para expressarmos nossas ideias sobre relações
entre variáveis econômicas (baseadas na teoria econômica), lançamos mão do
conceito matemático de função.
Por exemplo, se acharmos que há um relacionamento entre a renda r e o

consumo c, que nos diz que o nível de consumo é uma certa função ,
ou , quantidade ofertada de um bem depende do preço.
Assim, o modelo matemático da função consumo agregado é acrescido do termo

e (erro). E, portanto, .
O erro aleatório expresso por e não só responde pelos diversos fatores que
afetam o consumo e que omitimos nesse modelo simples, como também reflete a
incerteza intrínseca na atividade econômica.
Modelo matemático
Modelo econométrico
Por inferência, queremos dizer que a utilização de informação contida com uma
amostra de dados pode “inferir” alguma coisa sobre o mundo real.
Para aplicarmos o modelo especificado após termos a forma funcional que

representa esta relação econômica, temos que obter os dados para trabalhar. Na
econometria, quanto maior a amostra melhor os resultados. Estamos falando
de algo maior que trinta dados, isso não significa que amostras menores não
possam ser trabalhadas.
14

Econometria
Grandes fontes de dados macroeconômicos são os sites do governo

brasileiro, tais como o IBGE, IPEA, entre tantos outros. Já para dados
microeconômicos, a fonte RAIS é muito útil.
Agora que já sabemos os objetivos da econometria e sua função, temos que

exercitar estimando inicialmente um modelo simples e linear.
Seção 2
Análise de regressão linear simples
Conforme Barbetta (2001), a análise de regressão estuda a relação causal entre
uma variável econômica a ser explicada (variável dependente Y) e uma ou mais
variáveis independentes ou explicativas (X).
Quando há uma única variável explicativa, nós temos uma regressão

simples. E quando temos mais de uma variável explicativa, temos uma
regressão múltipla.
O termo regressão, conforme é compreendido na Economia, surgiu fora dessa

área, com os trabalhos de Galton, por volta de 1885. Esses trabalhos procuravam
explicar certas características de um indivíduo a partir das características de
seus pais. Ele acreditava que os filhos de pais excepcionais com respeito à
determinada característica também a possuiriam, porém, numa intensidade,
geralmente, menor do que a média de seus pais.
A seguir vamos desenvolver a aplicação de regressão e explicar o método

desenvolvido.
a) Modelo linear de duas variáveis

Imagine duas variáveis Y e X (que poderiam ser, por exemplo, preço e consumo
de um produto), ou quaisquer duas variáveis que, supostamente, tenham relação
entre si. Em que X é a variável independente e Y a variável dependente, isto é, Y
que é afetado por X, e não o contrário. O processo de encontrar a relação entre
Y e X é chamado de regressão. Se esse processo é uma reta, é uma regressão
linear. E, se houver apenas uma variável independente (só tem um X), é uma
regressão linear simples. Para expressar isso, temos a seguinte fórmula:
Modelo estatístico: (1)
15

Capítulo 1
Sempre usamos a forma geral com o sinal de mais, ou seja, uma relação
positiva de X e Y, porém, o sinal do coeficiente de inclinação depende dos
cálculos desse parâmetro, como veremos ao desenvolver a aplicação do
modelo de regressão linear simples.
Podemos também substituir o Y pela letra inicial da variável envolvida, o mesmo

para X. Exemplo: consumo depende da renda, então, Y pode ser substituído por
C (consumo) e renda por r ou Yn renda nacional, do modelo Keynesiano.
Supõem-se que o termo erro ( ) seja:
1. Normalmente distribuído.
2. Com média ou valor esperado igual a zero: E( )=0
3. A variância do termo erro é constante em cada período e para todos
os valores de X, isto é:
Sumarizando:
4. O valor que o termo erro assume em um período é não

correlacionado com seu valor em algum outro período, isto é:
E( )=0 para i≠j com i, j=1,2,3,....,n
Essa hipótese assegura que o valor médio de Y depende somente de X e não de
e.
b) Método de mínimos quadrados (MMQ)

O MMQ é uma técnica para ajustamento da “melhor” linha reta para as
observações amostrais de XY. Ele envolve a minimização da soma dos quadrados
dos desvios (verticais) dos pontos em relação à reta:
(2)
Em que refere-se às observações reais e refere-se aos valores estimados

correspondentes, sendo que = ei (erro).
Note que o Y sem o chapéu é o Y verdadeiro, representa os dados da amostra

que estamos trabalhando e permitirá estimar a função para esses dados. Bom,
se voltarmos ao passado com a função estimada a partir dos dados reais, vamos
perceber o quanto o nosso modelo erra em relação aos dados verdadeiros. Se
parece com uma prova real e queremos que o erro seja minimizado, porque
quanto menor o erro do modelo, mais perto da realidade estará a nossa previsão.
Esse processo leva às duas equações seguintes:
(3)
16

Econometria
(4)
Dado que: e , e deve se as médias de X e Y. A equação

estimada de regressão, por meio dos mínimos quadrados (MMQ), é então:
(5)
Tanto os parâmetros como as variáveis com um chapéu (^) em cima

são parâmetros estatísticos, ou seja, não são os dados verdadeiros que
coletamos e sim os calculados pelo método que escolhemos. Representam
os valores estimados.
Propriedade dos estimadores de MMQ

•• O estimador mede a variação em Y para variação de uma unidade
em X1.
•• e são BLUE (Best Linear unbiased estimator) ou seja, os
estimadores de MMQ são os melhores estimadores lineares não
viesados.
•• Não apresentar viés significa: , ou seja, Viés = .
•• Um melhor estimador não viesado ou eficiente significa um
estimador de menor variância.
•• Desse modo, os estimadores de MMQ são os melhores entre todos
os estimadores lineares não viesados. Isto é, conhecido como o
teorema Gauss-Markov, e representa a mais importante justificativa
para utilizar-se o MMQ.
•• Um estimador é consistente se, quando o tamanho da amostra no
limite se aproxima do infinito, seu valor se aproxima do verdadeiro
parâmetro e sua distribuição colide com o verdadeiro parâmetro.
Depois de calcular a função de regressão, temos que fazer alguns testes

estatísticos para utilizar o modelo para previsão. Antes de estudar esses testes
vamos calcular um exemplo.
17

Capítulo 1
Exemplo:
A Tabela 1.1 mostra as toneladas de milho por hectare, Y, resultantes
do uso de vários montantes de fertilizantes em Kg por hectare, X,
produzidos em uma fazenda, em 10 anos, de 2001 a 2011.
Tabela 1.1 – Milho produzido e fertilizante utilizado
Ano Yi Xi
2001 40 6
2002 44 10
2003 46 12
2004 48 14
2005 52 16
2006 58 18
2007 60 22
2008 68 24
2009 74 26
2010 80 32
Passo 1:
Vamos colocar os dados no diagrama de dispersão (Gráfico 1.2). A

relação entre X e Y no Gráfico 2 é aproximadamente linear (isto é, os
pontos poderiam cair sobre ou próximo de uma linha reta).
Xi Yi
6 40
10 44
12 46
14 48
16 52
continua...
18

Econometria
18 58
22 60
24 68
26 74
32 80
Gráfico 1.2 – Demonstração da dispersão dos dados
Para inserir a linha de tendência, clique com o botão direito do seu

mouse (no Excel) e escolha a forma linear, em seguida, clique em ok.
Não é necessário plotar o gráfico sempre, mas é mais uma forma de

identificação da correlação das variáveis. Deve ser usado no caso de
surgir alguma dúvida ou falta de subsídios teóricos para determinar a
relação das variáveis estudadas.
Passo 2:
Para estimar a função de regressão vamos calcular os parâmetros.
19

Capítulo 1
Calcular os parâmetros b0 e b1:
Figura 1.1 – Demonstração dos cálculos de b0 e b1 no Excel
Nosso objetivo é calcular o b1 primeiro, portanto, vamos precisar da

média de Y e X para calcular os desvios x e y (minúsculo):
Figura 1.2 – Notas informativas no Excel
Note que você pode calcular as colunas posteriores usando sua

calculadora científica, ou funções do Excel, porém, na regressão
múltipla não será possível esta simplificação de cálculo.
20

Econometria
para iniciar uma operação matemática no Excel, sempre use = (igual)

para dividir use / (barra); e para multiplicar * (asterisco); para elevar a
potência 2, por exemplo, ^2 ou 3 ^3.
Agora que temos todas as somatórias necessárias para resolver as

equações de b0 e b1 estimadas, vamos calcular!
Da tabela apresentada na Figura 1.2, temos que a soma da coluna x

vezes y é 956 e que a soma da coluna de x ao quadrado é 576, note que
se utiliza-se o x e y minúsculo. Esses dados transpostos para a fórmula
b1 resultam no seguinte:
Agora que calculamos o coeficiente de inclinação, podemos calcular o

intercepto:
Passo 3:
Depois de calcularmos os parâmetros, podemos escrever a função que
representa esse exemplo:
Note que na função geral escrevemos o erro, na função calculada ou

estimada o erro desaparece, então, temos:
Estamos estimando uma função e não apenas números, então, o X inicial

permanece na função e a partir desses parâmetros e do valor da variável
X podemos calcular o Y para 2011, se, por exemplo, o X for igual 35,
como segue:
Porém, só poderemos investir nesse resultado após os testes

de significância e de determinação. O teste de significância nos
demonstrará se os parâmetros são estatisticamente diferentes de zero
e o coeficiente de determinação vai indicar o poder de explicação da
variação de X sobre a variação de Y.
21

Capítulo 1
Esses testes nos asseguram uma margem de erro aceitável para

estimação, então, além de estimar a função nosso objetivo final é atestar se
a função serve ou não para previsão
. <fim de destaque>
c) Testes de significância dos parâmetros estimados

A fim de testar a significância estatística dos parâmetros estimados da regressão,
precisamos da variância de e .
As estimativas não viesadas da variância de e são dadas por:
Desvio padrão ou erros

Parâmetros Variância
padrões das estimativas
(intercepto)
(coeficiente angular)
Note que a variância é muito parecida com a variância dos nossos casos mais
simples de estatística, assim como o desvio padrão tem o mesmo conceito, ou
seja, é a raiz quadrada da variância.
Desde que o erro (ei) é normalmente distribuído, Yi e portanto, e são também

normalmente distribuídos, e podemos usar a distribuição t com n-k graus de
liberdade, para testar hipóteses e construir intervalos de confianças para e .
A ideia é que quanto menor a variância, melhor. Dessa forma, os dados são mais
concentrados e menos dispersos, mais dispersos significam mais longe da nossa
reta de regressão que é a estimativa da verdadeira reta que representa todos os
verdadeiros valores de X e Y.
Como não podemos trabalhar com os verdadeiros valores das variáveis no futuro
usamos o método da regressão para estimar essa função. Menos variância
resultará em t calculado maior, aumentando a chance do parâmetro não aceitar
a hipótese nula do teste. Nosso objetivo é que ambos os parâmetros passem no
teste t, ou seja, aceitem o H1 e rejeitem o H0.
Como calcular e ?
22

Econometria
Já temos os valores de b0 e b1, então, precisamos dos valores dos desvios

padrões para calcular t.
Exemplo:
Continuando nosso exemplo, a Tabela 1.1 – Milho produzido e fertilizante
utilizado, mostra as toneladas de milho por hectare Y, resultantes do uso
de vários montantes de fertilizantes em KG por hectare X, produzidos em
uma fazenda, em 10 anos, de 2001 a 2010.
Temos que calcular as somatórias que faltam em ambas as equações

da variância. A primeira é a do erro ao quadrado. Para calcularmos o
erro (e), temos que calcular a função Y^ para cada X da tabela. Depois,
devemos subtrair o verdadeiro Y destes estimados. Temos também de
elevar o X maiúsculo ao quadrado. Note a diferença, X maiúsculo é um
dado verdadeiro e o minúsculo é o desvio, ou seja, o X menos a sua
média.
No Excel fica assim:
Figura 1.3 – Demonstração do cálculo do erro
O primeiro valor de Y^ é:
=27,12 +1,66*C2 (dar enter e arrastar para os demais valores)
23

Capítulo 1
O primeiro valor de e (erro):
=B2-H2
O primeiro valor de e^2:
=I2^2
O primeiro valor de X^2:
=C2^2
Calculando as variâncias no Excel:
Figura 1.4 – Demonstração do cálculo do erro
Na calculadora:
Agora vamos fazer o mesmo para a variância do coeficiente de

inclinação:
24

Econometria
No Excel fica assim:
Figura 1.5 – Demonstração do cálculo da variância de b1
Na calculadora fica assim:
Calculando o desvio padrão:
Calculando o t:
Com os valores do teste t calculado a partir dos dados do nosso

problema, podemos montar a curva normal para fazer o teste. Vamos
sempre usar o teste bilateral, isso significa que vamos sempre aceitar
25

Capítulo 1
valores positivos e também negativos para o t calculado.
Construindo o teste t (student) bilateral
Gráfio 1.3. Gráfico teste t (student) bilateral
Estabelecendo as hipóteses (H):
Para o teste de significância estatística de e , estabelecemos as

seguintes hipóteses, Ho e H1:
Ho : bo = 0 contra H1 : bo ≠ 0
H0 : b1 = 0 contra H1 : b1 ≠ 0
Queremos que os parâmetros aceitem H1 e rejeitem Ho, ou seja,

que fiquem na área de H1. Isso porque os parâmetros devem ser
estatisticamente diferentes de zero. Por exemplo, se b1 não aceita H1 e
seu intervalo de significância admite o zero, então, a função não é valida,
uma vez que qualquer valor de X multiplicado por zero será zero.
O grau de liberdade (gl) é dado por n - k, em que n é o número de

observações ou o tamanho da amostra, e k é o número de parâmetros,
neste caso 2, porque temos bo e b1 no nosso exemplo.
Sempre vamos usar 5% de significância ( ), ou seja, 0,05. Uma tabela

padrão do teste t tem no mínimo três níveis de significância 1%, 5% e
10%, então, vamos o usar o padrão mundial de 5%.
Para o nosso exemplo, o grau de liberdade é gl=10 - 2 = 8.
26

Econometria
Tabela 1.2 – Parte da tabela de distribuição t de Student (teste bilateral)
Grau de Probabilidade de um valor maior em valor absoluto que o

Liberdade valor tabelado
σ
gl
0,01 0,05 0,10
1 63,657 12,706 6,314
2 9,925 4,303 2,920
3 5,841 3,182 2,353
4 4,604 2,776 2,132
5 4,032 2,571 2,015
6 3,707 2,447 1,943
7 3,499 2,365 1,895
8 3,355 2,306 1,860
Fonte: Elaboração da autora (2012).
Gráfico 1.4 – Teste t para o exemplo
Fonte: Elaboração da autora (2012).
Como a curva é simétrica, o valor tabelado vale tanto para o lado

positivo como para o lado negativo.
Usualmente, após o cálculo dos t’s reescrevemos a função com o

t abaixo do seu respectivo parâmetro. E caso ele passe no teste,
colocamos um asterisco ao lado do teste que passou, como segue:
27

Capítulo 1
(13,70)* (16,60)*
Como tb0 e tb1 calculados excedem t = 2,306 com 8 graus de liberdade,

ao nível de significância de 5%, consideramos que tanto e são
estatisticamente significantes ao nível de 5%. Ambos aceitam H1 e
rejeitam H0, o que torna nossa função inicial confiável até aqui.
d) Teste de qualidade do ajustamento e correlação

Quanto mais próximas as observações caem da linha de regressão (isto é,
menor são os resíduos), maior é a “explicação” da variação de Y pela equação
de regressão estimada. A variação total de Y é igual à variação explicada mais a
variação residual:
Quadro 1.1 – Demonstração das variações
Variação Total de Y (ou Variação explicada de Y (ou Variação residual de Y (ou

soma total quadrados) soma dos quadrados da soma dos quadrados dos
regressão) erros)
VT VER VR
Dividindo ambos os lados por VT, temos:
O coeficiente de determinação ou R2 é, então, 1 menos o resultado da divisão

da variação residual de Y sobre a variação total de Y:
R2 pode ser calculada da forma seguinte:
28

Econometria
Em que o R2 varia de 0 (quando a equação da regressão estimada não explica

nada da variação de Y) até 1 (quando todos os pontos se situam sobre a linha de
regressão). Ou de zero por cento a cem por cento.
Calculando o R2 a partir do nosso exemplo:

Para o cálculo do R2, precisamos calcular mais uma coluna na nossa tabela, pois
a fórmula requer y2 (minúsculo):
No Excel:
Figura 1.6 – Demonstração do cálculo do R2
Um R2 de 0,97 ou 97% é um resultado muito bom, isso significa que as variações

de X explicam 97% das variações de Y e os demais determinantes que estão no
erro explicam somente 3%.
Como os parâmetros passaram no teste t e o R2 deu alto, sendo que

consideraremos alto ou bom para o modelo R2 acima de 60%, esse não é um
padrão consensual, mas serve como norte para as nossas análises futuras. Outro
fator importante é que devemos ter ambas as condições cumpridas, não basta
passar só no t ou no R2, deve passar em ambos para o modelo ser aceitável para
previsão.
O coeficiente de correlação, r, é dado por:
29

Capítulo 1
r varia de -1 (para correlação linear negativa perfeita) até +1 (para correlação linear
positiva perfeita). Ele é a raiz quadrada do R2, não é utilizado na análise, mas
serve para medir a força da relação entre as duas variáveis, no caso a inclinação
da reta de tendência que plotamos no Gráfico 1.1. Para o nosso exemplo ele foi
0,98, bem perto de um, o que indica uma forte correlação positiva entre o nosso X
e o nosso Y, isso implica que se X aumentar, Y aumentará também.
Escrevendo a equação final após o cálculo do R2:
(13,70)* (16,60)*
Desta forma, dada a análise de t e R2, temos que nosso modelo serve para
previsão.
Aprendemos a calcular passo a passo os parâmetros b0 e b1 de uma regressão

linear simples, verdade que não aparece tão simples assim, mas temos as
alternativas de cálculo à mão, utilizando uma calculadora científica e com Excel.
Além dos parâmetros da regressão, o teste t e o coeficiente de determinação são

conceitos que nos acompanharão até o último capítulo desse livro (ver tabela
do teste bilateral no final do livro, tabela cujo título é Distribuição t de Student
(teste bilateral). A seguir vamos simplificar os cálculos utilizando as ferramentas
de análise do Excel. Esse primeiro procedimento, com seu passo a passo, faz-se
necessário para identificação das variáveis calculadas.
Resolução de regressão linear simples no Excel

Exercitamos nosso exemplo no Excel, porém, calculamos cada etapa de forma
manual. Felizmente, o Excel e outras planilhas eletrônicas possuem o método
dos mínimos quadrados na sua programação, assim podemos obter os mesmos
resultados com apenas um clique.
Voltaremos ao mesmo exemplo do Milho para facilitar a comparação dos

resultados. Note que agora os resultados serão mais apurados, já que o Excel usa
todas as casas decimais possíveis, e na seção anterior arredondamos para duas
casas a maioria dos resultados.
30

Econometria
Exemplo:
Voltando ao nosso exemplo, a tabela mostra as toneladas de milho por
hectare, Y, resultantes do uso de vários montantes de fertilizantes em
KG por hectare, X, produzidos em uma fazenda, em 10 anos, de 2001 a
2010.
Ano Yi Xi
2001 40 6
2002 44 10
2003 46 12
2004 48 14
2005 52 16
2006 58 18
2007 60 22
2008 68 24
2009 74 26
2010 80 32
Passo 1:
Digite os dados em uma planilha no Excel.
Passo 2:
Clique em “Dados” e em seguida em “Análise de dados”.
Figura 1.7 – Demonstração das ferramentas do Excel
31

Capítulo 1
Após clicar, você terá esta caixa de diálogo:

Figura 1.8 – Análise de dados
Procure a ferramenta de análise “Regressão” e dê ok.
Na nova caixa de diálogo, o cursor vai piscar no “intervalo de Y de entrada

de y”, selecione toda a coluna dos valores de Y, inclusive o rótulo (nome
da coluna).
Figura 1.9 – Regressão
32

Econometria
Mesmo procedimento para X, selecione o box Rótulos, logo abaixo

na “opções de entrada”, e selecione “Intervalo de saída”. Escolha
uma célula abaixo da planilha para a saída dos dados. Como estamos
comparando dados, vamos selecionar “Resíduos” que é a tradução do
Excel para erro (e). Note que agora o erro já sai na estimativa, mas, como
calculamos antes, também é uma boa maneira de identificá-lo.
Depois clique em ok.
Figura 1.10 – Regressão de saída de dados
Passo 3:
Identificar os valores calculados.
Note que os resultados também são usados para regressão múltipla,

que ainda não estudamos, por isso alguns deles vamos, por enquanto,
desprezar.
O primeiro valor R múltiplo = r (coeficiente de correlação) é a raiz quadra

do R2 (R-quadrado), como o Excel não consegue colocar um número
elevado, ele escreve.
ANOVA
A sigla ANOVA significa análise de variância. Agora retornaremos à

análise do ANOVA em regressão simples. Note que gl é o grau de
liberdade, usamos o grau dos resíduos, que resulta de 10 (o tamanho da
amostra) menos k que é 2.
33

Capítulo 1
A SQ (sum of squares), soma dos quadrados, então, a soma do erro

elevado ao quadrado deu 47,31 que confere com nossos resultados
anteriores.
Interseção é a tradução para intercepto, então, todos os resultados

dessa linha referem-se ao b0.
Coeficientes são os valores de b0 e b1, assim, b0 = 27,13 e b1 = 1,66.

Ao lado, ver figura 1.10, temos o desvio padrão, mas note que aqui já
temos os valores de t calculados e por isso não usamos os desvios (erro
padrão). Os t´s calculados são denominados Start t, então tb0 = 13,70 e
tb1 = 16,38.
Também não precisamos dos valores dos erros já que o t está calculado,
mas a ferramenta calcula em caso de necessidade o erro, daí para obter
o quadrado, temos que fazer utilizando o mesmo procedimento anterior.
Figura 1.12 – Cálculo dos erros (resíduos)
Note que os valores são muito parecidos com os nossos cálculos

anteriores.
Dessa forma, a partir dos resultados diretos, podemos escrever a forma

funcional, que é o nosso objetivo.
(13,70)* (16,60)*
A análise geral do modelo é a mesma, só o método que é mais rápido.

Mas, lembre-se de que por traz da programação do Excel estão
exatamente as fórmulas que aprendemos anteriormente.
34

Econometria
Seção 3
Análise de regressão linear múltipla
A análise de regressão múltipla é usada para testar hipóteses sobre a relação
entre uma variável dependente, Y, e duas ou mais variáveis independente, X, e
para previsões.
O modelo de regressão linear de três variáveis pode ser escrito como:
(1)
Segundo Gujarati (2011), essa equação fornece o valor esperado de Y,

condicional a valores dados ou fixados das variáveis X1 e X2. Portanto, como
no caso de duas variáveis, a análise de regressão múltipla é uma análise de
regressão condicional a valores fixos das variáveis explicativas, e o que obtemos
é a média ou o valor esperado de Y, ou a resposta média de Y aos valores fixos
das variáveis X.
A hipótese adicional (além daquelas do modelo de regressão imples) é que

não há relação linear exata entre os X’s.
Relembrando os pressupostos do modelo linear

Supõe-se que o termo erro (ei) seja:
1. Normalmente distribuído
2. Com média ou valor esperado igual a zero:
3. A variância do termo erro é constante em cada período e para todos
os valores de X, isto é:
Sumarizando:
4. O valor que o termo erro assume em um período é não
correlacionado com seu valor em algum outro período, isto é:
E( )=0 para i≠j com i, j=1,2,3,....,n
Essa hipótese assegura que o valor médio de Y depende somente de X e não de e.
As estimativas dos parâmetros de mínimos quadrados simples (MMQ) ou

mínimos quadrados ordinários (MQO), para a equação (1), podem ser obtidas pela
minimização da soma dos quadrados dos resíduos (erros):
35

Capítulo 1
(2)
resulta:
(3)
(4)
(5)
1. O estimador mede a variação em Y para variação de uma unidade

em X1, enquanto X2 permanece constante.
2. é analogamente definido.
3. Os estimadores e são chamados de coeficientes parciais da
regressão.
4. , e são BLUE (os estimadores de MMQ são os melhores
estimadores lineares não viesados – Best Linear Unbiased
Estimator)
Não apresentar viés significa: E( ) = b, ou seja, Viés= E( ) – b.
Um melhor estimador não viesado ou eficiente significa um estimador de menor

variância. Desse modo, os estimadores de MMQ são os melhores entre todos
os estimadores lineares não viesados. Isso é conhecido como o teorema Gauss-
Markov, e representa a mais importante justificativa para utilizar-se o MMQ. Um
estimador é consistente se, quando o tamanho da amostra no limite se aproxima
do infinito, seu valor se aproxima do verdadeiro parâmetro e sua distribuição
colide com o verdadeiro parâmetro.
Note que agora as equações se tornam muito mais complexas do que o modelo
de regressão linear simples, por isso, temos que resolver a partir da planilha
Excel.
36

Econometria
Exemplo:
Fez-se um estudo durante vários meses em um bairro de uma grande

cidade, calculando-se o valor médio para o aluguel. Vamos estimar esses
valores como função da atividade econômica (renda) e da taxa de juros
de curto prazo.
Tabela 1.5 – Valor médio de aluguel
Mês/ano Renda Aluguel médio Taxa de juros
Jan./10 294 100 2,1
Fev./10 297 102 2,1
Mar./10 238 98 2,0
Abril/10 219 100 1,8
Maio/10 310 99 1,8
Jun./10 305 87 1,6
Jul./10 257 86 1,7
Ago./10 249 84 1,8
Set./10 253 91 1,8
Out./10 251 92 1,7
Nov./10 327 93 1,6
Dez./10 338 90 1,5
Jan./11 349 95 1,4
Fev./11 365 96 1,2
Mar./11 327 99 1,1
Abril/11 349 102 1,5
Maio/11 344 103 1,7
Jun./11 327 101 1,8
Jul./11 329 105 2,0
Ago./11 469 108 1,9
37

Capítulo 1
Passo 1:
Colar ou digitar a tabela no Excel.
Após isso, clique em fx e escolha “regressão”, é o mesmo procedimento

da análise de regressão linear simples, porém, agora selecionaremos
dois X ao mesmo tempo, conforme figura a seguir:
Figura 1.13 – Regressão linear múltipla
Clique em ok e obtemos os resultados, conforme Figura 2.2.
Figura 1.14 – Resultados da Regressão.
Fonte: Elaborado pela autora (2012).
38

Econometria
Passo 2:
Vamos escrever a função de regressão múltipla.
Como a primeira etapa é somente escrever a equação de regressão,

apenas transcrevemos os valores dos “coeficientes” da Figura 2.2.
A princípio, podemos dizer que o modelo é coerente com a teoria, já que

quanto maior a renda, há uma tendência de se pagar um aluguel maior,
assim como a relação entre aluguel e taxas de juros também é positiva.
Mas, para validar o modelo temos que fazer o teste t, como segue.
Teste de significância dos parâmetros estimados
O teste t (student) é o mesmo que deduzimos nos cálculos do modelo simples,

porém, note que o gl (grau de liberdade) é dado por n (número de observações da
amostra) menos k (número de parâmetros estimados), então, k agora é 3 ( , e
) o nível de significância é o mesmo, ou seja, 5%.
Temos mais um parâmetro para testar, porém, as hipóteses nula e alternativa do

teste não mudam:
Para o teste de significância estatística de ( , e ), estabelecemos as

seguintes hipótese: a Ho e a hipótese H1.
Ho : bo = 0 H0 : b1 = 0 H0 : b2 = 0
H1 : bo ≠ 0 H1 : b1 ≠ 0 H1 : b2 ≠ 0
As equações que retomam os valores também apresentam o mesmo princípio

para cada parâmetro dividido pelo erro padrão:
Graficamente, também teremos a mesma distribuição discutida para regressão

linear simples, porém, há outra maneira de verificar se o parâmetro passou ou não
sem apelar para o t (tabelado). Para demonstrar isso, vamos retornar ao nosso
exemplo dos aluguéis:
39

Capítulo 1
Figura 1.15 – Cálculo do t
Vamos escrever os testes na equação de regressão que representa nosso

modelo:
(4,74)* (3,24)* (2,23)*
Notem que o valor-p de cada coeficiente (grifado) nos dá o percentual do

nível de significância de cada parâmetro. O valor-p é nível de significância
observado. Como nosso limite é 5%, então, todos os resultados abaixo de
5% garantem que o parâmetro passa no teste, portanto, aceita a hipótese
alternativa, ou seja, H1.
No caso do nosso exemplo, para b0 o valor-p é 0,00019 que é menor que 0,05; b1
é 0,00485 que é menor que 5% e b2 é 0,0328 que também é menor, então, todos
os parâmetros passam no teste.
Podemos comparar os valores com o t tabelado para tirar a prova real. Como
temos 20 observações na nossa amostra, o gl será 20 - 3 = 17 então o t tabelado
é 2,110 (vide tabela t).
Notamos que os t’s calculados 4,74, 3, 23 e 2,23 são maiores que o tabelado
2,11, então, todos caíram dentro da área H1 no gráfico da distribuição t, ao lado
direito por serem positivos.
Analisando o modelo
Após calcularmos os testes t, que é uma das condições de aprovação do nosso
modelo de regressão múltipla para previsão do valor futuro do aluguel, podemos
dizer que o modelo é bom, dado que além das relações positivas entre as
variáveis, já mencionadas, todos os parâmetros passaram no t. Os parâmetros
estimados aceitam H1 e rejeitam Ho a um nível de confiança de 5%.
Mas, além de analisarmos os sinais das variáveis e o teste t, temos que calcular o
R quadrado ajustado e coeficiente global de regressão (F), esse é um coeficiente
novo que só é calculado para regressão múltipla.
40

Econometria
Coeficientes de determinação e global

Para completar a análise do modelo de regressão múltipla ainda falta calcular
o coeficiente de determinação. Para tanto, vamos ajustá-lo a partir da equação
da unidade anterior, o ajuste se faz necessário devido à alteração no grau de
liberdade do modelo.
Além, do coeficiente de determinação, vamos estudar o coeficiente de

correlação parcial que, apesar de não ser muito usado na análise geral do
modelo, é uma das medidas estatísticas que demonstra a relação entre as
variáveis X e o Y em questão.
Como temos mais parâmetros envolvidos, ou seja, estimados, além do coeficiente

de determinação, também calculamos o teste F. Esse teste reforça a validade do
teste t e ainda garante que o R2 também é estatisticamente diferente de zero.
O coeficiente de determinação múltipla

O coeficiente de determinação múltipla, , é definido como a proporção da
variação total em Y que é “explicada” pela equação de regressão estimada. Note
que agora escrevemos um traço em cima do R2, isso diferencia o coeficiente de
determinação da regressão múltipla do coeficiente da regressão simples (sem o
traço).
A inclusão adicional de variáveis independentes ou explicativas provavelmente

aumentará o VER para a mesma variação total VT, então o aumenta.
Considerando a redução dos graus de liberdade, quando adicionamos variáveis

independentes ou explicativas, o ajustado, ou , é calculado da forma a
seguir:
(6)
Em que:
n = número de observações e
k = número de parâmetros estimados.
41

Capítulo 1
No nosso exemplo:
Figura 1.16– Cálculo do R quadrado ajustado
No Excel é R-quadrado ajustado, no caso, deu 0,36 ou 36%, isso indica que as
variações conjuntas de X1 (renda) e X2 (taxas de juros) explicam somente 36% da
variação de Y (aluguel), resultando em um erro do modelo de estimação de 0,64
ou 64%. Dessa forma, o poder de explicação do erro é maior que os das
variáveis explicativas, assim não podemos usar o modelo para previsão.
Coeficiente de correlação parcial

O coeficiente de correlação parcial mede a correlação líquida entre a variável
dependente e uma variável independente, após a exclusão da influência comum
de outras variáveis independentes do modelo. Por exemplo, ryx1x2 é a correlação
parcial entre y e x1, após removida a influência de x2 tanto de y como de x1.
(7)
(8)
Em que:
ryx1 = coeficiente de correlação entre y e x1
ryx2 e rx1x2 são analogamente definidos.
Os coeficientes de correlação parcial variam em valor de -1 e +1 (como acontece

com os coeficientes de correlação simples), e têm o sinal do parâmetro estimado
correspondente, sendo usados para determinar a importância relativa das
diferentes variáveis explicativas em uma regressão múltipla.
42

Econometria
Para resolver as equações (7) e (8), primeiramente, calculamos os coeficientes de

correlação simples das equações (9, 10 e 11), depois substituímos em 7 e 8:
(9)
(10)
(11)
Como podemos perceber, é muito trabalhoso e colabora pouco para a análise

final do modelo. Caso o pesquisador tenha dúvidas sobre a relação das variáveis
iniciais do seu modelo, é interessante o cálculo do coeficiente de correlação para
se saber a relação causal entre as variáveis.
Distribuição F ver Teste de significância global da regressão

tabela referente ao final
do livro, que faz parte
A significância global da regressão pode ser testada
dos anexos desse pela razão da variância explicada com a variância não
capítulo. explicada. Essa apresenta uma distribuição F com
k-1 e n-k graus de liberdade, em que n é o número de
observações e o k o número de parâmetros estimados:
(12)
Se a razão F calculada excede o valor tabelado Ftabelado a um dado nível de

significância e graus de liberdade, aceita-se a hipótese que os parâmetros da
regressão não são todos iguais a zero, e que R2 é significativamente diferente de
zero. Assim, como em t utilizaremos o nível de significância de 5%.
43

Capítulo 1
No nosso exemplo:
Figura 1.17 – Cálculo do F
O F calculado para o nosso exemplo dos aluguéis deu 6,24.
Comparando com o F tabelado, temos:
k -1 = 3 - 1 = 2 e
n - k = 20 -3 = 17,
Note que esses gl estão na nossa tabela ANOVA
Então, temos um F(2/17), não é dois dividido por dezessete e sim uma indicação
para procurar o F na tabela, o numerador (2) é a coluna, e o denominador (17) é a
linha. Note que na mesma linha todos os níveis de significância 0,25, 0,10,0,05 e
0,01.
O F tabelado é 3,59. Como o F calculado 6,24 é maior que 3,59, o teste global da
regressão deu bom.
Note que temos uma contradição: quase todos os procedimentos resultaram

em valores esperados, mesmo o coeficiente de determinação ajustado, esse
que segundo o teste F é estatisticamente diferente de zero. Isso nos indica que
a regressão pode apresentar um problema, ou seja, quebra algum dos preceitos
do modelo. Veremos como testar os problemas de regressão posteriormente em
nossos estudos.
Se o coeficiente de determinação ajustado para o nosso exemplo fosse

superior a 60%, o modelo serviria para previsão. E caso o R2 ajustado fosse
superior a 60%, porém o X2 não passasse no teste, por exemplo, teríamos
que regredir o modelo sem esta variável e analisar novamente.
Análise de variância
Até agora utilizamos vários dados do ANOVA para a análise de variância. Vamos
identificá-los:
44

Econometria
Figura 2.6 – Análise de variância ANOVA
Vamos verificar os valores:
gl:
2 = k-1
17 = n-k
19 = n-1
SQ:
SQT (soma dos quadrados tratados) = 351,67
SQE (soma dos quadrados dos erros) = 479,28
SQ (soma dos quadrados) = 830,95
MQ:
MQ (média dos quadrados)
MQT (média dos quadrados tratados)
MQT = SQT/(k-1) = 351,67/ 2 = 175, 84
MQE (média do quadrado dos erros)
MQE = SQE/(n-k) = 479,28/17 = 28,1928
F:
F = MQT/MQE = 175, 836/28,1928 = 6,24
F de significação
O valor-p do teste F nos diz o percentual de significância do teste, no caso,

0,0093 que é menor que 0,05.
45

Capítulo 1
O coeficiente global de regressão, ou seja, o F, ajuda-nos a tomar decisões

sobre a validade de um modelo de regressão múltipla, ou seja, se as variáveis
explicativas são estatisticamente diferentes de zero.
Atividades de autoavaliação
Ao final de cada capítulo, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático. Mas, esforce-se para resolver
as atividades sem ajuda do gabarito, pois, assim, você estará promovendo
(estimulando) a sua aprendizagem.
1. A Tabela 1 mostra a renda disponível do Brasil e o consumo para os anos de

1999-2003.
Tabela 1 – Renda e Consumo
Ano Y X
1999 50 16
2000 54 20
2001 56 22
2002 58 24
2003 62 26
a. Estime a função de regressão, utilizando o cálculo parcial.

b. A partir dos dados das duas variáveis do item a, que representam
renda e consumo, calcule o teste t para os parâmetros b0 e b1.
c. Analise os testes calculados. Podemos dizer que o modelo serve
para previsão do consumo no Brasil? Por quê?
d. A partir dos dados das duas variáveis, que representam renda e
consumo, calcule o R2. Analise o resultado.
46

Econometria
2. Escreva a função de regressão entre a exportações do município de

Florianópolis e a taxa câmbio comercial entre reais e dólar norte americano. Utilize
a ferramenta de análise de dados do Excel.
Tabela 2 – Exportações do município de Florianópolis e taxa de câmbio comercial
Ano/Mês Exportação Taxa de

câmbio
US$ FOB R$/US$
2013
Maio 1.073.749 2,0233
Junho 551.937 2,1367
Julho 903.001 2,2548
Agosto 760.469 2,3434
Setembro 6.148.015 2,2785
Outubro 2.380.319 2,1818
Novembro 1.258.679 2,3289
Dezembro 3.071.154 2,3354
2014
Janeiro 1.553.032 2,3470
Fevereiro 2.528.891 2,3924
Março 1.587.785 2,3638
Fonte: Brasil, 2016.
47

Capítulo 1
3. A partir dos dados da tabela ,3 plote o gráfico de dispersão e insira a reta de

tendência linear.
4. Com os dados da tabela 1 estime a equação de demanda por energia elétrica.
Tabela 1– Brasil: índice da quantidade por demanda de energia elétrica (Q), da tarifa média (T) e do
produto real (Y)
Ano 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990
Q 69 76 81 90 94 100 103 108 113 115
T 143 134 117 111 109 100 137 122 85 90
Y 84 85 82 86 93 100 104 104 107 102
Fonte: Matos (1995, p. 92).
5. A partir dos dados da Tabela 1, apresentada na questão anterior, faça os testes

t para os parâmetros estimados do modelo de demanda de energia.
6. A partir do modelo da questão, calcule o coeficiente de determinação ajustado

e o teste F.
7. Vamos supor que para o ano de 1991 a tarifa é 100 e o índice de Y = 106,
quanto seria a quantidade de energia estimada para este ano?
48

Capítulo 2
Técnicas adicionais de análise

de regressão
Seção 1
Defasagens distribuídas
Vamos estudar os motivos teóricos plausíveis para defasar uma variável
explicativa em um modelo de regressão. Para Gujarati (2011), temos três razões
para as defasagens: psicológica, tecnológica e institucional.
A razão psicológica está baseada na dificuldade de as pessoas mudarem de

hábitos. Por exemplo, uma pessoa que se torna milionária pode não mudar seu
estilo de vida com que estava acostumada por um bom tempo, pois pode não
saber como reagir imediatamente a um ganho inesperado. Outro problema é
identificar se uma mudança no mercado ou de aumento de renda é permanente
ou transitória. Se for transitória, posso me comportar de forma conservadora,
poupando o excedente temporário, já outra pessoa pode gastar todo o
excedente.
Quanto à Razão tecnológica temos, por exemplo, o preço do capital em relação

ao trabalho diminuído, tornando economicamente viável a substituição de
trabalho por capital, ou seja, tornando viável diminuir a mão de obra e aumentar o
investimento em máquinas e equipamentos. Essa troca leva tempo, considerando,
por exemplo, que as máquinas sejam importadas. Às vezes, um conhecimento
imperfeito também é responsável por defasagem, por exemplo, a grande
variedade de celulares e de inovação contidas nos novos modelos de aparelhos
para telecomunicação pode fazer com que o consumidor espere mais um pouco
para uma possível queda no preço ou uma maior incorporação de tecnologia a
esses aparelhos.
49

Capítulo 2
Na Razão institucional, por exemplo, os contratos podem impedir as firmas de

mudar de uma fonte de trabalho ou matéria-prima para outra. Outro entrave é se a
firma aplicou seu recursos a longo prazo, nesse caso, a condição para usar esses
recursos fará que a firma perca rendimentos e, por vezes, é impossível dispor
desse montante antes do tempo pré-fixado da aplicação financeira.
Segundo Gujarati (2011), por essas razões, a defasagem ocupa um papel

importante na economia. Isso se reflete na metodologia de curto prazo/
longo prazo da economia. E, por isso, dizemos que a elasticidade-preço
ou a elasticidade-renda a curto prazo são geralmente menores do que as
elasticidades correspondentes a longo prazo, ou que a propensão marginal
a consumir a curto prazo é geralmente menor que a propensão marginal a
consumir a longo prazo.
Segundo Hill et al. (2010), uma mudança no nível de uma variável explanatória
pode ter implicações comportamentais além do período de tempo em
que ocorreram. Por exemplo, quando se aumenta o imposto de renda, os
consumidores passam a ter menos renda disponível, (Yd = Y – T), o que
reduz suas despesas com bens e serviços, que, por sua vez, reduz lucro dos
fornecedores, a demanda por insumos produtivos, os lucros dos fornecedores
de insumo e assim por diante. Os efeitos de um aumento de imposto refletem em
toda a economia, não se manifestando instantaneamente, mas se dispersando,
ou se distribuindo, por períodos futuros de tempo.
Na análise de regressão, se o modelo incluir variáveis defasadas das variáveis

explicativas (X) é chamado de modelo de defasagem distribuída:
(1)
Se o modelo incluir um ou mais valores defasados da variável dependente entre

suas variáveis explicativas, será chamado de modelo autorregressivo:
(2)
Ou
(3)
50

Econometria
Exemplo 1
Gujarati (2011) desenvolve um exemplo da função consumo. Eis o
exemplo: suponha que uma pessoa receba um aumento salarial de
US$ 2.000,00 em sua remuneração anual e que esse aumento seja
permanente. Qual será o efeito deste aumento da renda no consumo
anual da pessoa?
Após o ganho de renda referido no exemplo, as pessoas não gastarão

todo o aumento de renda imediatamente. Vamos supor que a pessoa
decida aumentar seu consumo em US$ 800 no primeiro ano, após o
aumento salarial na renda, em mais US$ 600 no ano seguinte e em
mais US$ 400 no ano subsequente, poupando o resto. Esses valores
são hipotéticos, mas refletem mais ou menos o comportamento do
consumidor de ter um estímulo positivo com o aumento de renda e
também poupar. Então, ao final do terceiro ano, o consumo anual da
pessoa terá aumentado em US$ 1.800.
Podemos escrever a função consumo como segue:
(4)
Em que Y é consumo e X é renda, na notação econômica consumo é C e

renda é Y, não confunda a ordem das variáveis explicativas.
O sinal de X e dos demais defasado é positiva, isso porque quanto mais

renda mais se consome. Essa regra é válida para grande maioria dos
bens, ou seja, para os bens normais.
Os coeficientes 0,4; 0,3 e 0,2 são, respectivamente, os percentuais

relativos da renda ganha, US$ 2.000, a partir da nossa hipótese de
distribuição ao longo do tempo, no caso três anos. Então, gastar US$
800 no primeiro ano significa 40% da renda total, ou seja, 0,4.
A equação (4) mostra que o efeito de um aumento na renda de US$

2.000 se espalha, ou se distribui, ao longo de um período de três anos.
Os modelos do tipo da equação (4) são chamados de modelos de
defasagem distribuídas, pois o efeito de um dado X, no caso renda,
prolonga-se em um número de períodos de tempo (t).
51

Capítulo 2
Geometricamente, o modelo de defasagens distribuídas é mostrado na

Figura 2.1.
Figura 2.1 – Exemplo de defasagen distribuídas, função consumo
Fonte: Gujarati (2011).
Genaralizando o nosso exemplo, temos:
Que é o modelo de defasagem distribuída com defasagem finita de k

períodos de tempo, no caso k = 2. O coeficiente b1 é conhecido como o
multiplicador de curto prazo, porque dá a alteração no valor médio de
Y devido a uma alteração de uma unidade em X, no mesmo período de
tempo.
Matematicamente, b1 é a derivada parcial de Y em relação a Xt, b2 em

relação a Xt-1, e assim por diante. Simbolicamente,
Se a alteração em X for mantida no mesmo nível disso, então, o

(b1 + b2) dá a alteração em valor médio do Y no próximo período e
(b1 + b2 + b3) no período seguinte, e assim por diante. Essas somas
parciais são denominadas de multiplicadores intermediários. A soma
total nos dá o multiplicador de defasagem distribída de longo prazo
ou total. Então, as somas do bi “padronizado” dão a proporção do
impacto de longo prazo (ou total), sentido em certo período de tempo.
52

Econometria
Voltando à equação (4), o multiplicador de curto prazo que é a propensão

marginal a consumir (PMgC) a curto prazo é 0,4, enquanto o multiplicador total ou
a propensão marginal a consumir a longo prazo é 0,4 + 0,3 + 0,2 = 0,9. Ou seja,
seguindo a um aumento de US$ 1 na renda, o consumidor aumentará seu nível
de consumo em cerca de US$ 0,40 no ano do aumento, mais US$ 0,30 no ano
seguinte e mais US$ 0,20 no ano subsequente. Assim, o impacto a longo prazo
de um aumento de US$ 1 na renda é de US$ 0,90. Dividindo cada bi por 0,90
obtemos, respectivamente, 0,44, 0,33 e 0,23, indica que 44% do impacto total de
uma mudança unitária em X sobre Y é sentido imediatamente, 77% depois de um
ano e 100% até o final do segundo ano.
Hill et al. (2010) desenvolve o conceito de modelos de defasagem distribuídas

finita, a partir de um modelo econômico envolvendo as apropriações de capital
e despesas de capital. Vamos às hipóteses com base nessa teoria: os autores
destacam que os investimentos das empresas originam-se de decisões de
apropriação de resultados tomadas em períodos anteriores. As decisões de
apropriação baseiam-se em projeções da lucratividade de projetos alternativos
de investimentos e da comapração da eficiência marginal dos investimentos com
o custo do capital.
Uma vez aprovado um projeto de investimento, apropriam-se, ou aprovam-se

os fundos necessários para tal. Os custos decorrentes de qualquer decisão
de apropriação são observados em trimestres subsequentes, à medida que
se completam os planos. Assim, se Xt é o valor das apropriações de capital
observadas em determinado tempo, podemos estar certos de que os efeitos
dessas apropriações, sob a forma de custos de capital Y, serão distribuídos pelos
períodos t, t+1, t=2 e seguintes, até que os projetos tenham sido completados.
Aqui se destaca também o tempo de maturação para qualquer projeto de
investiemento.
Como as apropriações de capital no instante t, designidas por Xt, afetam os

gastos com investimentos no período corrente e em períodos futuros até que
os projetos apropriados estejam completos, podemos dizer que as despesas
correntes Yt são função da apropriação corrente e de apropriações passadas, Xt,
Xt-1..... O que, numa fórmula, exprime-se assim:
Assim como no exemplo anterior, se supormos uma forma funcional linear,

podemos estimar a função que representa o modelo econômico por mínimos
quadrados:
53

Capítulo 2
Após a estimação, a análise dos resultados segue os parâmetros exigidos de

regressão múltipla. Note que quanto mais defasamos uma variável mais
perdemos informações.
Após discutirmos a importância das defasagens distribuídas na economia, ou

seja, da relevância do tempo ou dos efeitos do tempo para as decisões dos
agentes econômicos, vamos calcular um exemplo passo a passo, utilizando as
ferramentas de análise do Excel.
Exemplo 2
Na Tabela 2.1 temos dados do consumo de um bem normal (C) no
período de janeiro de 2009 a junho de 2010 e os Índices de preços,
no mesmo período. O índice de preço é a proxy da variável inflação. A
hipótese é que quanto maior for a inflação menos as famílias consomem
o bem. Mas, como a inflação não é percebida instantaneamente, vamos
supor uma defasagem de k=3, ou seja, três períodos, no caso, três
meses.
Tabela 2.1 – Consumo e índice de preço
Ano Mês C Índice de Preço
2009 Janeiro 408 132,3
Fevereiro 494 124,6
Março 556 119,4
Abril 659 114,9
Maio 741 106,3
Junho 761 113,2
Julho 795 100,7
Agosto 779 99,9
Setembro 897 100
Outubro 923 100
Novembro 893 84,5
Dezembro 548 91,8

continua...
54

Econometria
2010 Janeiro 556 101,8
Fevereiro 708 94
Março 632 86,2
Abril 702 80
Maio 772 82
Junho 511 98,6

Fonte: Elaboração do autor (2012).
Resolução:
Passo 1:
Vamos escrever a função de regressão admitindo as defasagens

distribuídas do modelo propostos.
Em que Y é consumo e X índice de preço representando inflação.
Passo 2:
Vamos criar a tabela com as variáveis defasadas.
Tabela 2.2 – Defasando a variável IP = índide de preços
Mês/Ano C IP IP t-1 IP t-2 IP t-3
Janeiro 408 132,3
Fevereiro 494 124,6 132,3
Março 556 119,4 124,6 132,3
Abril 659 114,9 119,4 124,6 132,3
Maio 741 106,3 114,9 119,4 124,6
Junho 761 113,2 106,3 114,9 119,4
Julho 795 100,7 113,2 106,3 114,9
Agosto 779 99,9 100,7 113,2 106,3

continua...
55

Capítulo 2
Setembro 897 100 99,9 100,7 113,2
Outubro 923 100 100 99,9 100,7
Novembro 893 84,5 100 100 99,9
Dezembro 548 91,8 84,5 100 100
Janeiro 556 101,8 91,8 84,5 100
Fevereiro 708 94 101,8 91,8 84,5
Março 632 86,2 94 101,8 91,8
Abril 702 80 86,2 94 101,8
Maio 772 82 80 86,2 94
Junho 511 98,6 82 80 86,2
98,6 82 80
98,6 82
98,6
Para criar a variável defasada, basta copiar a coluna de interesse, no

caso, é o nosso X, representado por IP (índice de preços), e: para uma
defasagem, colar na segunda célula abaixo do nome da variável (IPt-
1
); para duas defasagens, colar a terceira célula abaixo do nome da
variável, e assim por diante. Note que na variável IPt-1 o valor 132,3, que
representa o índice de preço do mês de janeiro, está relacionado na linha
de fevereiro, então, é relativo ao mês anterior.
Note que ao defasarmos as variáveis criamos dois problemas: o primeiro

são células inicias sem valores, o segundo, são células a mais em
algumas colunas comparado com as outras. O Excel não opera com
células em branco, nem com células com valores a mais no fim da
tabela. Temos que deletar as inicias e as finais. Dessa forma, modelos
de defasagens distribuídas sempre perdem informações, diminuem o
tamanho da amostra, isto pode acarretar em problema de regressão.
Após os ajustes de linha e tamanho nossa tabela ficou assim:
56

Econometria
Tabela 2.3 – Variáveis defasadas
Mês/Ano C IP IP t-1 IP t-2 IP t-3
Abril 659 114,9 119,4 124,6 132,3
Maio 741 106,3 114,9 119,4 124,6
Junho 761 113,2 106,3 114,9 119,4
Julho 795 100,7 113,2 106,3 114,9
Agosto 779 99,9 100,7 113,2 106,3
Setembro 897 100 99,9 100,7 113,2
Outubro 923 100 100 99,9 100,7
Novembro 893 84,5 100 100 99,9
Dezembro 548 91,8 84,5 100 100
Janeiro 556 101,8 91,8 84,5 100
Fevereiro 708 94 101,8 91,8 84,5
Março 632 86,2 94 101,8 91,8
Abril 702 80 86,2 94 101,8
Maio 772 82 80 86,2 94
Junho 511 98,6 82 80 86,2
Passo 3:
Após o ajuste na tabela, conforme Tabela 2.3, podemos regredir o

modelo, como segue.
Vamos selecionar a variável Y e os X na ferramenta regressão do Excel:
57

Capítulo 2
Figura 2.2 – Seleção das variáveis na ferramenta regressão do Excel
Resultado da regressão
Figura 2.3 – Seleção das variáveis na ferramenta regressão do Excel
58

Econometria
Passo 4:
Agora vamos escrever o modelo e analisar os resultados finais.
Análise dos resultados:
O modelo, a priori, não serve para previsão, pois nenhum dos parâmetros passa
nos devidos testes.
Vamos começar avaliando os sinais esperados. Nossa hipótese inicial era de que
quanto maior a inflação menor o consumo. Dessa forma, todos os parâmetros
estimados de IP deveriam apresentar o sinal negativo, mas isso ocorre somente
para as variáveis IP e IPt-2. Nenhum parâmetro passa no teste, uma vez que
todos os p-valor são superiores a 5%. Lembrando que na falta da informação do
p-valor devemos fazer o teste a partir da tabela do teste t (ver anexo).
O R2 ajustado também é muito pequeno, isso significa que as variações de IP

explicam somente 4% da variação do consumo e o modelo apresenta 96% de
erro. O teste F também não é bom, não passa do nível de significância de 5% (ver
anexo 2)).
Como os resultados não foram os esperados, vamos modificar o exemplo agora,

defasando apenas dois período.
59

Capítulo 2
Exemplo 3
A partir da Tabela 2.1 do exemplo 2, vamos supor uma defasagem de
k=2 ou seja, dois meses.
Passo 1:
Criar tabela defasada.
Tabela 2.4 – Variáveis defasadas
Mês/Ano C IP IP t-1 IP t-2
Abril 659 114,9 119,4 124,6
Maio 741 106,3 114,9 119,4
Junho 761 113,2 106,3 114,9
Julho 795 100,7 113,2 106,3
Agosto 779 99,9 100,7 113,2
Setembro 897 100 99,9 100,7
Outubro 923 100 100 99,9
Novembro 893 84,5 100 100
Dezembro 548 91,8 84,5 100
Janeiro 556 101,8 91,8 84,5
Fevereiro 708 94 101,8 91,8
Março 632 86,2 94 101,8
Abril 702 80 86,2 94
Maio 772 82 80 86,2
Junho 511 98,6 82 80
Passo 2:
Vamos regredir o modelo de regressão defasado no Excel.
Resumo dos resultados da regressão
60

Econometria
Figura 2.4 – Estatística de regressão
Agora vamos escrever o modelo e analisar os resultados finais.
Análise dos resultados
Novamente, o modelo não serve para previsão e não passa no teste t e F, o R2

ajustado continua muito baixo.
Nosso objetivo é testar modelos, o fato do modelo proposto não ser utilizado
para previsão do consumo desse bem, não invalida a tentativa de provar com
essa amostra, para esse caso específico, a teoria. Os modelos empíricos são
caracterizados pela teoria econômica e as hipóteses estabelecidas.
61

Capítulo 2
Seção 2
Variável Dummy
Na economia, a maioria dos modelos econômicos estão baseados em variáveis
medidas em grandezas físicas ou monetárias, o que chamamos de variáveis
quantitativas. As variáveis quantitativas discretas ou contínuas são grandezas
numéricas possíveis de trabalhar em modelagem econométrica sem grandes
problemas. Mas, além das variáveis discretas, a economia também trabalha
com variáveis qualitativas, tais como gênero, região etc. Na questão de gênero,
podemos perguntar como diferenciar os rendimentos em salários de homens
e mulheres ou em relação à região dos trabalhadores do sul se são melhores
remunerados que os do nordeste? As variáveis binárias ou Dummy auxiliam nos
modelos quando convertem variáveis como as citadas em qualitativas ou em
constructos numéricos.
2.1 Definição da variável Dummy

A variável dummy permite a inclusão de variáveis qualitativas no modelo de
regressão, representando uma variável explicativa. Segundo Gujarati (2011), tais
variáveis qualitativas, geralmente, indicam a presença ou a ausência de uma
qualidade ou atributo, tais como homem ou mulher, negro ou branco, católico
ou não católico, um método para quantificar tais atributos é construir variáveis
artificiais que assumam valores de 1 ou 0.
Então a variável dummy, também conhecida como variável binária; variável

artificial; variável indicador; variável categórica; variável dicotômica; ou variável
qualitativa – é aquela que indica a ocorrência ou não de um evento, ou a presença
ou a ausência de uma condição. Assume apenas dois valores: 1, que indica uma
situação, e 0, a outra.
Exemplo de construção da variável dummy:
Tempo de guerra = 1
EX
Tempo de paz = 0
Tais variáveis visam a captar:
•• efeitos temporais, como mudança de estações, mudanças de

políticas econômicas etc.;
•• efeitos de variáveis qualitativas, como sexo, cor, nacionalidade
estado civil etc.;
•• efeitos de variáveis quantitativas, em que apenas grandes
agrupamentos interessam à análise (população de até 14 anos
versus população com mais de 14 anos).
62

Econometria
Segundo Hill et al. (2010), as variáveis binárias são variáveis explanatórias que
podem tomar um de dois valores. Essas variáveis simples, segundo os autores,
constituem instrumento poderoso para representar características qualitativas
de indivíduos, como sexo, raça ou local de residência. Além da inclusão simples
da variável dummy no modelo, podemos ter interações de dummies a partir da
multiplicação de duas ou mais variáveis binárias.
Carmo e Diaz (2000) confirmam o conceito e natureza da dummy, destacando que

o artifício das dummies permite incluir o efeito de variáveis qualitativas, categorias
ou mesmo variável mensuráveis, quando o importante for a distribuição em
classes. Para fatores qualitativos ou categorias, os autores destacam como
exemplo:
•• processo de produção;
•• grupo social;
•• setor de atividade;
•• região;
•• religião;
•• gênero;
•• estado civil.
Para variáveis contínuas expressas em classes, destacam:
•• faixa etária;
•• classe de renda;
•• nível de escolaridade.
Os autores destacam que a aplicação mais comum é a inclusão da variável

dummy como variável explicativa e podem ser empregadas em modelos simples,
em que a única variável explicativa é uma dummy, e em modelos um pouco mais
complexos, em que uma mesma categoria é desdobrada em variáveis dummies,
como, por exemplo, faixas etárias, classes de renda.
63

Capítulo 2
2.2 Como incluir variáveis binárias no modelo

Podemos incluir uma variável dummy no nosso modelo de três maneiras: na
forma aditiva, incluindo como mais um X; na forma multiplicativa, captamos
mudanças no coeficiente angular; e a forma mista que combina as duas foram
anteriores.
A - Forma aditiva
Quando a mudança temporal ou a condição altera apenas o termo constante do

modelo, ou seja, o intercepto.
Exemplo:
Acrescentando a dummy (D):
Em que D:
1
D
0
Note-se que quando D = 0:
ou seja,
Mas quando D = 1:
ou seja,
Desse modo, o termo constante da equação passa de b0 para (b0 + b2),

caracterizando uma mudança no intercepto. Vamos ilustrar a partir de um
exemplo de Matos (2000):
64

Econometria
Exemplo1
Q = volume de exportação de produtos manufaturados
P = preço internacional (período de 1959 – 1978)
D = mudança da política cambial que ocorreu em 1967.
1 a partir de 1967
D
0 antes de 1967
Vamos ilustrar a mudança de intercepto graficamente. Note que na figura abaixo a

seguir, para a nossa função linear o intercepto se desloca de b0 para (b0+b2).
Figura 2.5 – Forma aditiva
Fonte: Adaptado de Matos (2000).
65

Capítulo 2
B - Forma multiplicativa
Capta a variação no coeficiente angular. Uma forma de levar em conta uma

variação no coeficiente angular é incluir no modelo uma variável explicativa
adicional igual ao produto de uma variável binária por uma variável contínua. Essa
nova variável explicativa é chamada de variável de interação ou variável binária de
inclinação.
A partir de um modelo simples, com um X explicativo, acrescentamos a dummy,

multiplicando pelo X:
ou seja,
Note que quando a dummy assume zero não muda nada no modelo inicial e essa
é a ideia, ou seja, quando é zero não tem efeito sobre nossa variável dependente.
Mas quando D = 1, então:
, ou seja,
Como temos dois parâmetros para a mesma variável X, colocamos os parâmetros

em evidência.
A partir do exemplo 1:
Note que:
antes de 1967, ou seja quando D =0:
já depois de 1967, ou seja quando a D = 1
Então, a função ficaria assim:
Na ilustração gráfica, notamos que ambas as retas saem do mesmo intercepto,

diferente do caso anterior, porém, o ângulo se modifica.
66

Econometria
Figura 2.6 – Forma multiplicativa
C- Forma mista
A forma mista é uma combinação das formas aditiva e multiplicativa, capta

variações tanto no intercepto quanto no coeficiente angular.
ou seja,
Mas quando D = 1:
ou seja,
67

Capítulo 2
Figura 2.7 – Forma mista
Acabamos de estudar como acrescentar a variável dummy que apresenta

características diferentes daquelas que representamos normalmente até aqui.
Vamos desenvolver um exemplo do setor elétrico, pois o consumo de energia

elétrica é muito importante para o crescimento de uma economia, tanto o
consumo das famílias como das indústrias. A implementação do horário de verão
pelo governo brasileiro a partir de 1985 visava a diminuir o consumo, já que a
oferta é limitada pelo o número de usinas do país e muitas vezes as intempéries
afetam as reservas de água das nossas usinas.
68

Econometria
Exemplo 2
Os dados da tabela abaixo são referentes ao Brasil de 1981 a 1990,
adaptado de Matos (2000). Nesta tabela, temos a variável dependente
Q (quantidade demanda de energia elétrica), T (tarifa média) de energia
elétrica e Y (produto real) representando a renda.
Tabela 2.5 – Demanda de energia elétrica
Ano Q T Y
1981 69 143 84
1982 76 134 85
1983 81 117 82
1984 90 111 86
1985 94 109 93
1986 100 100 100
1987 103 137 104
1988 108 122 104
1989 113 85 107
1990 115 90 102
Com base nestes dados, pede-se:
a. estimar a função de demanda por energia elétrica, usando

a forma linear;
b. incluir a variável dummy para captar o efeito do horário de
verão, na forma aditiva;
c. estimar a função de demanda por energia elétrica após a
inclusão da dummy;
d. analisar o modelo final.
69

Capítulo 2
Resolução:
a) estimar a função de regressão linear:
Figura 2.8 – Regressão linear no Excel
Fonte: Elaboração autor (2012).
A partir das estatísticas de regressão, podemos escrever a função:
(0,33) (-2,92)* (6,81)
b) Como o horário de verão começou em 1985, até este ano colocamos

0 (zero), a partir de 1985, a variável dummy assume o valor 1 (um), ou
seja, ocorre o evento.
Tabela 2.6 – Demanda de energia elétrica adição da dummy (D)
Ano Q T Y D
1981 69 143 84 0
1982 76 134 85 0
continua...
70

Econometria
1983 81 117 82 0
1984 90 111 86 0
1985 94 109 93 1
1986 100 100 100 1
1987 103 137 104 1
1988 108 122 104 1
1989 113 85 107 1
1990 115 90 102 1
A partir da tabela acima vamos regredir a função:
Figura 2.9 – Regressão linear no Excel
A partir das estatísticas de regressão podemos escrever a função:
(0,14) (-2,68)* (2,82)* (-0,07)
71

Capítulo 2
b) A análise do modelo sempre requer uma validação do sinal esperado

dos parâmetros, a validação dos testes, t, R2 e F.
A partir da função de regressão podemos concluir que todos os sinais

estão teoricamente corretos, apesar de a amostra ser de apenas 10
elementos. Em relação à demanda de energia elétrica, espera-se que a T
(tarifa), ou seja, preço tenha uma relação inversa, quanto maior o preço
menor a demanda. Assim como a relação teórica entre renda e demanda
é uma relação positiva. A variável dummy representando o impacto do
racionamento de energia proporcionado pelo o horário de verão também
apresenta um sinal coerente, uma vez que quanto maior o racionamento
menor a quantidade demandada.
Quanto à confiabilidade, ressalta-se que o coeficiente de determinação é alto,

ou seja, as três variáveis juntas explicam 90% da variação da quantidade
demandada de energia elétrica, o que significa elevado poder de explicação.
A hipótese de que as variáveis T, Y e D, conjuntamente, afetam Q é aceita

ao nível de significância de 5%, conforme indica o teste F. Isso significa que,
pelo menos, uma dessas variáveis influencia significativamente a quantidade
demandada, com uma probabilidade de erro de apenas 5%.
Já o teste t nos indica que apenas os parâmetros b2 e b3 passam no teste, ou

seja, aceitam H1 e rejeitam H0 a um nível de significância de 5%. Se o intercepto
não passar no teste, neste caso, é relevante, já que a adição da variável dummy
afeta o intercepto. A variável dummy também não passa no teste que indica,
mesmo apresentando sinal teoricamente correto, pois ela não contribui para
explicação da demanda de energia elétrica para essa amostra.
72

Econometria
Exemplo 3
Vamos modificar um pouco o modelo do exemplo anterior, agora
teremos apenas duas variáveis: Q (quantidade demanda de energia
elétrica) e T (tarifa média) de energia elétrica, como segue:
Tabela 2.7 – Demanda de energia elétrica e tarifa
Ano Q T
1981 69 143
1982 76 134
1983 81 117
1984 90 111
1985 94 109
1986 100 100
1987 103 137
1988 108 122
1989 113 85
1990 115 90
Com base nesses dados, pede-se:
e. Incluir a variável dummy para captar o efeito do horário de

verão na forma multiplicativa;
f. Estimar a função de demanda por energia elétrica após a
inclusão da dummy;
g. Analisar o modelo final.
Resolução:
a) Para incluir a variável dummy multiplicativa, devemos incluir primeiro

a variável dummy e depois criar uma nova coluna TD (tarifa multiplicado
pela dummy). Na primeira célula abaixo do título da coluna, digite
73

Capítulo 2
= (igual) para calcular, depois clique no primeiro valor de T, digite *

(asterisco) para multiplicar e clique no primeiro valor de D e tecle Enter
para calcular o primeiro valor, depois arrastar para os demais.
Figura 2.10 – Cálculo da variável dummy
O resultado final:
Figura 2.11 – Demanda de energia elétrica, tarifa e variáveis dummies
Ano Q T D TD
1981 69 143 0 0
1982 76 134 0 0
1983 81 117 0 0
1984 90 111 0 0
1985 94 109 1 109
1986 100 100 1 100
1987 103 137 1 137
1988 108 122 1 122
1989 113 85 1 85
1990 115 90 1 90
74

Econometria
b) Para estimar a função após a inclusão da dummy na forma

multiplicativa, devemos excluir a coluna D. Para não destruir o seu
cálculo na coluna TD, copie toda a tabela para outra planilha do Excel,
e usando da ferramenta cole especial só valores, você pode excluir a
coluna D, sem problemas.
Figura 2.12 – Demanda de energia elétrica, tarifa e variáveis dummy
Ano Q T TD
1981 69 143 0
1982 76 134 0
1983 81 117 0
1984 90 111 0
1985 94 109 109
1986 100 100 100
1987 103 137 137
1988 108 122 122
1989 113 85 85
1990 115 90 90
75

Capítulo 2
Resultados da regressão linear a partir da figura anterior:
Figura 2.13 – Regressão linear com variável dummy
A partir das estatíssticas de regressão, podemos escrever a função:
(9,00)* (-3,49)* (4,49)*
c) Análise do modelo:
A partir da função de regressão, podemos concluir que todos os sinais estão

teoricamente corretos. Em relação à demanda de energia elétrica, espera-se que
a T (tarifa), ou seja, preço tenha uma relação inversa, quanto maior preço menor a
demanda, o que justifica o sinal negativo. Não temos nenhuma evidência teórica
da relação ou influência da dummy horário de verão e o preço da energia elétrica
(T), porém, como exercício, podemos criar a hipótese de que o horário de verão,
de alguma forma, diminuiria o preço da energia elétrica, já que os consumidores
pouparam mais.
Quanto à confiabilidade, ressalta-se que o coeficiente de determinação é bom,

ou seja, as duas variáveis juntas explicam 83% da variação da quantidade
demandada de energia elétrica, o que significa bom poder de explicação,
sobrando 17% de erro no modelo de estimação.
76

Econometria
A hipótese de que as variáveis T e TD, conjuntamente, afetam Q é aceita

ao nível de significância de 5%, conforme indica o teste F. Isso significa
que, pelo menos, uma dessas variáveis influencia significativamente a
quantidade demandada, com uma probabilidade de erro de apenas 5%.
Os três parâmetros passaram no teste t, o que significa que ambos

aceitaram H1 ao um nível de significância de 5%.
Quando D=1
Temos alteração no coeficiente angular que aumenta de -0,40 para (-0,40

+0,18) = -0,22.
Seção 3
Previsões
Previsões ou projeções de valores futuros a partir da função de regressão é mais
uma ferramenta para auxílio da análise e tomada de decisão a partir de dados
passados. Além de projetar, ressaltaremos a importância das séries tempo e taxa
de crescimento.
As séries tempo são muito usadas na teoria econômica porque muitas das
variáveis, principalmente as macroeconômicas, são medidas ao longo do
tempo. Estudar o comportamento de tendências dessas variáveis auxilia o
economista na tomada de decisão.
Além da tendência, temos em alguns casos mudanças bem pontuais durante

o ano, como, por exemplo, a fruta de uma época, o que chamamos de
sazonalidade. Seu preço e oferta mudam dependendo do tempo ou do mês do
ano.
Na economia também estudamos os ciclos econômicos, esses formam uma série

temporal de longo tempo, ou seja, é uma tendência com prazo maior do que um
ano. Introduzir a tendência no nosso modelo de regressão é o objetivo desta
unidade. Além da forma tradicional linear para a tendência, vamos estudar a taxa
de crescimento que é uma função semilog, ou seja, usamos logaritmo natural e
linear na mesma função. A taxa de crescimento no tempo é uma medida muito
importante para análises conjunturais, por isso, vamos considerá-la. E, por fim,
vamos usar as funções regredidas para projetar valores futuros.
77

Capítulo 2
3.1 Séries de tempo

Uma série de observações registradas em instantes distintos e sucessivos de
tempo constitui uma série temporal. É todo conjunto de valores passível de
ordenação cronológica, ou seja, é o controle de uma variável no tempo.
Seja Y a variável observada e t a variável tempo.
Uma série temporal é definida pelos valores: Y1 ,Y2 , ... , Yn , nos tempos t1, t2, ...,
tn.
Função:
Movimento característico das séries de tempo:
Tendência (T)
Variações sazonais (S)
Variações cíclicas (C)
Gráfico 2.1- Séries Temporais
A influência do tempo pode ser incorporada no modelo mediante a utilização de

uma das seguintes formas:
Tendência T: caracteriza uma série segundo um movimento regular em

alguma direção específica. A reta de tendência pode ser representada pela
reta de regressão, e nos permite avaliar se há tendência de crescimento ou
decrescimento nos dados estudados ao longo do tempo.
Variações sazonais (S): são variações repetidas que se completam em um ano.

Como, por exemplo, frutas de época, artigos verde amarelo em época de copa do
mundo.
78

Econometria
Variações cíclicas (C): são variações repetidas em longo prazo, tais como ciclos
econômicos, índices ao longo do tempo.
3.2 Análise de tendência

Vamos estudar como inserir uma variável tendência no modelo linear e semilog. A
introdução implícita na equação de uma variável tempo ou tendência (T) medida
pelo número de períodos, contados do primeiro ao último período. A remoção da
tendência das variáveis, antes da estimação do parâmetro, por exemplo, retira
a sazonalidade de uma série. Uma sazonalidade se caracteriza por algo que só
ocorre uma vez ou outra, ou em períodos de tempos curtos. Para retirar tal efeito
usamos a média móvel.
A variável (T) num modelo indica a existência de uma tendência autônoma no

crescimento ou decrescimento da variável dependente. Nesse caso, o coeficiente
de (T) pode ser interpretado como uma medida dessa variação autônoma, isto
é, pode fazer a hipótese implícita de que o termo constante (b0) da equação
cresce ou decresce firmemente, embora os parâmetros das variáveis explicativas
permaneçam inalterados. Se, adicionalmente, existem informações a priori que
tais parâmetros também se alteram ao logo do tempo, poder-se-á acrescentar à
equação o termo multiplicativo (T.X) juntamente com a variável X.
Exemplo 1
A tabela
Abaixo mostra a variável tempo representada por meses do ano 2011

e 2012 e a taxa de juros, representada pela taxa SELIC, mensalizada. A
partir destes dados, analisar a tendência dos dados e prever a taxa de
juros para o mês de outubro de 2012.
Tabela 2.7 – Taxa de juro brasileiro
Mês Taxa Juros
jan/11 0,8859
fev/11 0,8212
mar/11 0,9455
abr/11 0,9235
continua...
79

Capítulo 2
mai/11 0,9659
jun/11 0,9481
jul/11 0,9931
ago/11 0,9999
set/11 0,9358
out/11 0,9523
nov/11 0,8987
dez/11 0,8903
jan/12 0,8717
fev/12 0,7943
mar/12 0,8042
abr/12 0,7436
mai/12 0,7333
jun/12 0,6709
jul/12 0,668
ago/12 0,6514
set/12 0,5946
Fonte: Banco Central (2012).
Resolução:
Passo 1:
Vamos plotar o gráfico de dispersão. Para plotar o gráfico de dispersão,

sempre selecionamos primeiro o X (mês) e depois o Y (taxa de juros),
diferente da regressão que sempre começamos com o Y, isso porque no
Excel o par do gráfico de dispersão é XY.
No Excel:
a. Selecionar os dados na tabela.

b. Selecionar gráfico de dispersão:
80

Econometria
Figura 2.15 – Plotar gráfico de dispersão
c) Selecionar o primeiro gráfico, ou seja, o que tem apenas pontos.
Resultado do gráfico:
Gráfico 2.2 – Gráfico de dispersão
Podemos perceber que os dados estão em um caminho bem desenhado

e pouco disperso.
Passo 2:
Regredir os dados e achar a função de regressão, antes de regredir

vamos transformar o nosso X em números de meses, porque não é
possível regredir com palavras na coluna X. Nossa tabela inicial fica
assim:
81

Capítulo 2
Taxa Juros Mês
0,8859 1
0,8212 2
0,9455 3
0,9235 4
0,9659 5
0,9481 6
0,9931 7
0,9999 8
0,9358 9
0,9523 10
0,8987 11
0,8903 12
0,8717 13
0,7943 14
0,8042 15
0,7436 16
0,7333 17
0,6709 18
0,668 19
0,6514 20
0,5946 21
Resultado da regressão no Excel:
82

Econometria
Figura 2.16 – Regressão taxa de juros no Excel
Com o resultado da reta de regressão podemos perceber que a relação

entre tempo medido em mês e a taxa de juros Selic é negativa, ou seja,
com o passar do tempo ela está diminuindo.
Agora podemos acrescentar uma reta de tendência no nosso gráfico,

que vai corroborar com essa conclusão.
Para tal, volte no gráfico de dispersão no Excel e clique com o botão

esquerdo do seu mouse:
Gráfico 2.2 – Inserir a reta de tendência
83

Capítulo 2
Clicar em Adicionar Linha de Tendência
Figura 2.17 – Adicionar a reta de tendência no Excel
Selecione Opções de Linha de Tendência, em seguida, tecle em Linear

e depois Fechar.
84

Econometria
O que resulta no gráfico com linha tendência
Gráfico 2.3 – Gráfico reta de tendência
Podemos perceber que a reta é levemente inclinada para baixo, o que

confirma a relação negativa do b1 da nossa reta de regressão.
Passo 3:
É responder a segunda questão do exemplo, ou seja, qual a projeção?
O mês de outubro de 2012 na nossa amostra é o vigésimo segundo,

então temos:
Dessa forma, a previsão para a taxa de juros em outubro de 2012 seria

0,58%.
Gujarati (2011) introduz o estudo de tendência junto com outras formas

funcionais, particularmente, vamos estudar o modelo log-lin, que mede
a taxa de crescimento. O autor destaca que os economistas, homens de
85

Capítulo 2
negócios e governos estão frequentemente interessados em saber a taxa

de crescimento de certas variáveis econômicas, tais como população,
PIB, oferta monetárias, emprego, produtividade, déficit comercial etc.
A partir dos dados do PIB para os Estados Unidos, de 1972-1991, o

autor desenvolve o modelo genérico.
Suponha que queiramos descobrir a taxa de crescimento do PIB nesse

período, sejam Yt = PIB no tempo t e Y0= valor inicial do PIB, isto é, no
ano de 1972 até 1991. Relembrando a fórmula de juros compostos de
matemática financeira, temos:
(1)
Em que r é a taxa de composta de crescimento de Y ao longo do tempo.

Calculando o logaritmo natural de (1), podemos escrever:
(2)
Sejam agora:
Podemos reescrever (2) como:
(3)
Acrescentando o termo erro temos:
(4)
86

Econometria
Note que a variável dependente está logaritmizada e a explicativa está na

sua forma linear; por isso, o modelo é chamado de log-lin. Esse modelo
é parecido com qualquer outro modelo de regressão linear, já que os
parâmetros são lineares. A única diferença é que o regressando é o
logaritmo de Y e o regressor é tempo, que assumirá valores 1, 2, 3 etc.
No modelo (4), o coeficiente de inclinação mede a variação proporcional

(ou relativa) constante em Y para uma dada variação absoluta no valor
do regressor (neste caso, a variável t), ou seja,
(5)
Se multiplicarmos a variação relativa Y por 100, a formula (5) fornecerá a

variação percentual, ou a taxa de crescimento, em Y para uma variação
absoluta em X, o regressor.
87

Capítulo 2
Exemplo 2
A tabela abaixo mostra a variável tempo representada por anos de 1972-
1991 e o PIB real para os Estados Unidos da América. Calcule a taxa de
crescimento para o PIB no período.
Tabela 2.9 – PIB americano em bilhões de dólares de 1987
Ano PIB
1972 3107,1
1973 3268,6
1974 3248,1
1975 3221,7
1976 3380,8
1977 3533,3
1978 3703,5
1979 3796,8
1980 3776,3
1981 3843,1
1982 3760,3
1983 3906,6
1984 4148,5
1985 4279,8
1986 4404,5
1987 4539,9
1988 4718,6
1989 4838,0
1990 4877,5
1991 4821,0
Fonte: Gujarati (2010).
88

Econometria
Resolvendo:
Passo 1:
Transformar os anos em tendência.
Tabela 2.10 – Inclusão da tendência
PIB T
3107,1 1
3268,6 2
3248,1 3
3221,7 4
3380,8 5
3533,3 6
3703,5 7
3796,8 8
3776,3 9
3843,1 10
3760,3 11
3906,6 12
4148,5 13
4279,8 14
4404,5 15
4539,9 16
4718,6 17
4838,0 18
4877,5 19
4821,0 20
89

Capítulo 2
Passo 2:
Calcular o logaritmo natura do PIB. Para isso, primeiro clique na célula

em branco abaixo do nome da nova variável, depois digite igual, e, para
calcular ,escreva LN. Clique no primeiro valor de PIB, no nosso caso,
está na célula A2, feche o parêntese e dê Enter.
Figura 2.18 – Cálculo do logaritmo natural de Y
A tabela completa fica assim:
Tabela 2.10 – Inclusão da tendência
PIB t lnPIB
3107,1 1 8,04
3268,6 2 8,09
3248,1 3 8,09
3221,7 4 8,08
3380,8 5 8,13
3533,3 6 8,17
3703,5 7 8,22
3796,8 8 8,24
3776,3 9 8,24
3843,1 10 8,25
3760,3 11 8,23
3906,6 12 8,27
continua...
90

Econometria
4148,5 13 8,33
4279,8 14 8,36
4404,5 15 8,39
4539,9 16 8,42
4718,6 17 8,46
4838,0 18 8,48
4877,5 19 8,49
4821,0 20 8,48
Passo 3:
Regredir a função log-lin.
Figura 2.19 – Regressão da função log-lin
(700,54)* (25,86)*
Todos os parâmetros passam no teste t, o R2 também é muito bom. No

período 1972-1991, o PIB dos EUA aumentou a uma taxa de 2,47% ao
ano. Chamamos essa taxa de taxa de crescimento constante.
91

Capítulo 2
3.3 Projeções
Em todos os casos que estudamos até aqui, após a regressão de uma função,
desde que passe nos testes que estabelecemos para um bom modelo de
previsão, ou seja, passar no teste de significância teste t apresentar o R2 superior
a 60%. E no caso da regressão múltipla apresentar um F significante, o modelo
serve para previsão de valores futuros
Dessa forma, a projeção ou previsão pode ser feita a partir da substituição do X

da função.
Agora veremos como calcular o erro que cometemos nessas projeções futuras e
o intervalo de confiança.
Segundo Salvatore (1983), uma projeção refere-se à estimação do valor da

variável dependente, YF , dado o valor atual ou projetado da variável independente,
XF, o F indica futuro. A variância do erro projetado é dada por:
Em que a variância do erro é dada por:
Em que:
= tamanho da amostra
= média de X
= X futuro
= o erro ao quadrado
= estimado a partir da função de regressão
= valor inicial de Y
= valor inicial de X
O intervalo de confiança de 95% para a projeção, YF, é:
t é a distribuição t com n-2 graus de liberdade. A tabela t está em anexo 1, ao

final do livro.
92

Econometria
Exemplo 3
A tabela mostra as toneladas de milho por hectare, Y, resultantes do uso

de vários montantes de fertilizantes em KG por hectare, X, produzidos
em uma fazenda, em 10 anos, de 2001 a 2010. Vamos projetar para 2011
um montante de fertilizante usado de XF=35, qual a quantidade de milho
produzida?
Ano Yi Xi
2001 40 6
2002 44 10
2003 46 12
2004 48 14
2005 52 16
2006 58 18
2007 60 22
2008 68 24
2009 74 26
2010 80 32
Resolvendo:
Passo 1:
Estimar a função de regressão:
93

Capítulo 2
Figura 2.20 – Função de regressão
Função de regressão:
(13,70)* (16,60)*
Passo 2:
Calculando a variância do erro (resíduos):
Este valor é dado no ANOVA, já que a somatória dos erros é 47,30 (SQ)
e o grau de liberdade é 8 (10-2), temos o valor de 5,91 (MQ). Vamos usar
este valor para calcular a variância da projeção:
Passo 3:
Calculo da somatória de X menos a média ao quadrado.
Vamos voltar para a tabela com os dados inicial e calcular a média de X

e depois a expressão acima:
94

Econometria
Tabela 2.12 – Média de X
Ano Yi Xi X- media (X - media)^2
2001 40 6 -12 144
2002 44 10 -8 64
2003 46 12 -6 36
2004 48 14 -4 16
2005 52 16 -2 4
2006 58 18 0 0
2007 60 22 4 16
2008 68 24 6 36
2009 74 26 8 64
2010 80 32 14 196
Media 18 576
Passo 4:
Calcular a variância da projeção
Lembrando que a hipótese é que XF = 35
95

Capítulo 2
Vamos tirar a raiz quadrada para calcular o desvio padrão:
Antes de calcular o intervalo de confiança, vamos projetar o novo valor

da produção do milho, a partir da função de regressão que representa o
modelo:
Para calcular o intervalo de confiança de previsão com 95:
O t com 5% retiramos da tabela t - a qual segue no anexo 1 desse livro-

com 8 de grau de liberdade.
(85,22+7,10) e (85,22 -7,10) = 92,32 e 78,12
Então, o intervalo de confiança ou de previsão de 95% para YF em 2011

está entre 78,12 e 92,32. Como em 2010 a tabela apresenta um valor
para a variável Y de 80, esse é um resultado bastante plausível.
96

Econometria
Ao final de cada capítulo, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático. Mas esforce-se para resolver
as atividades sem ajuda do gabarito, pois, assim, você estará promovendo
(estimulando) a sua aprendizagem.
1. A tabela abaixo mostra os dados para Estoques (Y) e Vendas(X) de um

determinado bem do setor industrial. Escreva o modelo autorregressivo,
considerando a variável dependente como explicativa com defasagem de um
período, ou seja, um modelo autorregressivo.
Tabela– Estoques e venda
Ano Y X
1991 52,9 30,3
1992 53,8 30,9
1993 54,9 30,9
1994 58,2 33,4
1995 60 35,1
1996 63,4 37,3
1997 68,2 41
1998 78 44,9
1999 84,7 46,5
2000 90,6 50,3
2001 98,2 53,5
2002 101,7 52,8
2003 102,7 55,9
2004 108,3 63
2005 124,7 73
2006 157,9 84,8
2007 158,2 86,6
2008 170,2 98,9
2009 180 110,8
2010 198 124,7

97

Capítulo 2
2. A partir dos dados e do modelo da questão 1 estime o modelo de defasagem

distribuída, escreva a função de regressão e analise o modelo de defasagem
distribuídas. O modelo serve para previsão?
3. Você concorda que a inclusão de variáveis defasadas no modelo de regressão

o torna mais dinâmico? Por quê?
4. Como ficaria a forma funcional do modelo de estoque e vendas se a defasagem fosse de

k=4 ?
5. A tabela abaixo mostra a quantidade ofertada de leite (em mil litros) por mês
por uma empresa, essa variável será apresentada pela letra Q, a vários preços
P, para um período de 14 meses. A partir desses dados estime a função de
regressão.
Tabela– Oferta de leite
Mês Q P
1 98 0,79
2 100 0,80
3 103 0,82
4 105 0,82
5 80 0,93
6 87 0,95
7 94 0,96
8 113 0,88
9 116 0,88
10 118 0,90
11 121 0,93
12 123 0,94
13 126 0,96
14 128 0,97
6. A partir do modelo desenvolvido na questão 5 vamos imaginar que empresa

enfrenta uma greve de suas unidades durante o quinto, sexto, e o sétimo mês de
produção. Insira uma variável dummy que represente uma mudança no intercepto.
Justifique.
98

Econometria
7. A partir do modelo desenvolvido na questão 6, vamos imaginar que empresa

enfrenta uma greve de suas unidades durante o quinto, sexto, e o sétimo mês de
produção. Também vamos acrescentar a relação entre o período de greve e os
preços. Insira uma variável dummy que represente uma mudança no coeficiente
angular da função linear geral. Estime a função de regressão linear e analise os
resultados.
8. Compare os resultados da função linear sem a inclusão da dummy e com a

dummy desenvolvida na questão anterior.
9. A partir dos dados de juros para o Brasil, calcule a taxa de crescimento no

período.
Taxa Juros Mês
0,8859 1
0,8212 2
0,9455 3
0,9235 4
0,9659 5
0,9481 6
0,9931 7
0,9999 8
0,9358 9
0,9523 10
0,8987 11
0,8903 12
0,8717 13
0,7943 14
0,8042 15
0,7436 16
0,7333 17
0,6709 18
continua...
99

Capítulo 2
0,668 19
0,6514 20
0,5946 21
10. A partir dos dados de PIB dos USA, vamos projetar o valor para o ano 1992 e
calcular o intervalo de confiança.
Tabela - Inclusão da tendência
PIB T
3107,1 1
3268,6 2
3248,1 3
3221,7 4
3380,8 5
3533,3 6
3703,5 7
3796,8 8
3776,3 9
3843,1 10
3760,3 11
3906,6 12
4148,5 13
4279,8 14
4404,5 15
4539,9 16
4718,6 17
4838,0 18
4877,5 19
4821,0 20
100

Capítulo 3
Problemas de regressão
Estudaremos um dos primeiros e mais importantes problemas possíveis de
ocorrer no modelo de regressão múltipla que é a correlação dos resíduos. Esse
é um problema que ocorre somente em séries temporais. Aprenderemos a testar
uma série para verificar se há esse problema e veremos um método possível de
correção.
Em vários casos, temos um bom modelo teórico e alguns parâmetros não se

comportam como deveriam para garantir a utilização do modelo para a previsão
e, nesses casos, pode ser devido a um problema de regressão.
Além da autocorreção dos resíduos que causa viés nos testes t, temos a
heteroscedasticidade e a multicolinearidade.
A autocorrelação dos resíduos é um típico problema de séries temporais, ou seja,

ocorre relacionada a anos, meses dias e as variáveis relativas a esses períodos.
Já a heteroscedasticidade é um problema de dados em croos section ou corte

no tempo. Nesses casos, temos um tempo e várias variáveis para esse mesmo
período. Por exemplo, os valores das ações em 20/03/2015, temos um dia e
uma lista de ações de várias empresas. Vamos ver a seguir o conceito e as
consequências de um problema heteroscedasticidade para o nosso modelo de
regressão.
A Multicolinearidade se resume a problemas na correlação entre duas variáveis

explicativas.
Vejamos com detalhes cada um desses problemas, bem como possíveis soluções
na área de economia para resolvê-los.
101

Capítulo 3
Seção 1
Autocorrelação dos resíduos
Para a previsão utilizando o método dos mínimos quadrados ordinários,
destacamos alguns pressupostos ou condições, entre eles, em que o valor que o
termo erro assume em um período não se correlaciona com seu valor em algum
outro período, isto é :
E (ei ej)= 0 para i≠j com i,j=1,2,3,....,n.
Essa hipótese assegura que o valor médio de Y depende somente de X e não de

e. Lembrando que nosso objetivo é minimizar o erro, ou seja, ele é considerado,
mas não queremos que ele se torne mais importante do que os X’s que compõem
nosso modelo. O poder de explicação das variações de X deve ser maior ou
próximo a 100%, e o erro, tendendo a zero, sempre que possível, isso garante a
utilização da função estimada para prever o Y estimado.
Em alguns casos, os dados apresentam essa correlação nos resíduos e a

correlação (relação causal) prejudica os resultados do modelo.
Um exemplo é o modelo apresentar sustentação teórica, passar no teste t e

apresentar um R2 ajustado muito baixo, ou o inverso, não passar no teste t e
apresentar um R2 ajustado alto e relevante. Esse é um problema de regressão
denominado autocorrelação dos resíduos.
Além da autocorrelação, temos o problema de heteroscedasticidade e de

multicolinearidade. É desejável que a variância dos resíduos seja constante, isto
chamamos de homoscedasticidade, ou seja, .
A violação desse pressuposto é a heteroscedasticidade, que se refere ao fato de

a variância de ,não ser constate, isto é, .
Já a multicolinearidade refere-se à correlação entre duas variáveis explicativas

incluídas na equação de modelo. Isso implica que a multicolinearidade ocorre,
quando, por exemplo, duas variáveis X1 e X2 medem aproximadamente a mesma
coisa, ou seja, a correlação entre elas é quase perfeita.
102

Econometria
1.1 O problema de autocorrelação dos resíduos
Conceitos e consequências
Autocorrelação significa dependência temporal dos valores sucessivos dos
resíduos, ou seja, os resíduos são correlacionados entre si.
Em termos formais e considerando-se inicialmente o modelo linear simples:
A autocorrelação dos resíduos implica que E (ei ej) ≠ 0 para i ≠ j. A ausência de

autocorrelação significa, portanto, E (ei ej) = 0 para i ≠ j.
Vamos ver uma demonstração gráfica para o problema:
Figura 3.1 – Correlação entre os resíduos et e et-1
Quando os resíduos são autocorrelacionados, as estimativas de MQO (mínimos

quadrados ordinários) dos parâmetros não são eficientes, isto é, não apresentam
variância mínima, além de seu erro-padrão viesado, o que conduz a testes e
intervalos de confiança incorretos.
Se a autocorrelação for positiva, os erros-padrões serão subestimados, e o valor

de t superestimado. Se a autocorrelação for, ao contrário, negativa, os erros-
padrões serão superestimados e, o valor de t, subestimado.
Portanto, a autocorrelação positiva é a mais danosa, porque existirá,

no caso do teste t, o risco de rejeitar-se a hipótese nula de ausência de
efeito, quando se deveria aceitá-la. A autocorrelação é positiva quando os
resíduos são diretamente relacionados entre si.
103

Capítulo 3
(1)
vt = erro (ruído branco normalmente distribuído e com variância mínima)
Nessa primeira equação, formulamos um modelo para o erro. Como é regressão

também um erro que chamaremos de v. A ideia é estimar o rô ( ) e analisar o
sinal.
Então se e , a autocorrelação é negativa.
Tal autocorrelação é dita de primeira ordem, porque o resíduo et é relacionado

com et-1, ou seja, resíduo em t é função do resíduo no período imediatamente
anterior (t -1).
A presença de autocorrelação nos resíduos gera:
1. estimadores dos parâmetros (b) não viesados, porém, não

eficientes;
2. as variâncias estimadas dos parâmetros são subestimadas,
gerando problemas com o teste de hipótese;
3. a autocorrelação nos resíduos é dita de 1ª ordem, ou seja, AR(1);
4. estimação por meio do método de Mínimos Ordinários
Generalizados (MOG).
Estimadores eficientes são aqueles que apresentam variância mínima e são

estatisticamente mais significantes que qualquer outro estimador. Um estimador
é não viesado se a média de sua distribuição amostral é igual ao verdadeiro
parâmetro E(b^) = b e um melhor estimador não viesado ou eficiente significa um
estimador de menor variância.
Fontes de autocorrelação
São fontes de autocorrelação a omissão de alguma variável importante, a má
especificação da forma matemática e do termo aleatório e ajustes imperfeitos de
observações estatísticas. Vejamos em detalhes cada um desses casos.
Omissão de variável explicativa (erro de especificação)
As variáveis econômicas tendem a ser autocorrelacionadas. Assim, a omissão

de uma ou mais variáveis explicativas refletirá, obviamente, no termo residual et,
cujos valores se tornam, por isso, correlacionados entre si.
104

Econometria
Má especificação da forma matemática (erro de especificação)
Os dados utilizados e a teoria podem sugerir, por exemplo, a forma quadrática em

vez da forma linear.
Má especificação do verdadeiro termo aleatório
Pode-se esperar, em muitos casos, que, para valores sucessivos, os verdadeiros

valores de et não sejam independentes. Mesmo fatores randômicos (guerras,
estiagem, greves etc.) poderão exercer efeitos que se propagam ao longo de
vários períodos de tempo.
Por exemplo, o efeito negativo de uma seca sobre o nível de produção de uma
lavoura pode perdurar por algum tempo, sob a forma de escassez e deterioração
de sementes.
Ajustes imperfeitos de séries estatísticas
Muitos dados publicados contêm interpolações ou suavização (smoothing), as

quais poderão tomar as disturbâncias aleatórias correlacionadas entre si ao longo
do tempo.
Teste para detectar a presença de autocorrelação

Teste de Durbin Watson
Esse é o teste mais comum para diagnosticar a autocorrelação serial pela primeira
ordem.
A estatística para teste de Durbin Watson (d) é definida pela seguinte expressão:
(2)
O desenvolvimento da equação (2) mostra que o somatório de et tende a ser igual

ao somatório de , quando n aumenta. Assim, para grandes amostras, ter-se-á:
, em que é a estimativa do parâmetro de na equação (1).
Portanto:
se = 0 então d = 2 (ausência de autocorrelação);
se = 1 então d = 0 (autocorrelação positiva);
se = -1 então d = 4 (autocorrelação negativa).
105

Capítulo 3
As hipóteses para o teste podem ser estabelecidas como segue:
H0 = 0 (ausência de autocorrelação);
H1 ≠
0 (presença de autocorrelação).
O valor calculado de d é comparado com os limites inferiores di e superiores ds de

valores, tabelados por Durbin Watson, como mostrado no gráfico:
Figura 3.2 – Teste Durbin Watson
Os limites di e ds são usados para testar a autocorrelação positiva (d < 2),

enquanto os limites (4 – ds) e (4 – di) permitem investigar a autocorrelação
negativa (d > 2).
•• Região I (d < di), rejeita-se a hipótese nula de ausência de

autocorrelação (H0) e se aceita a presença de autorrelação de
primeira ordem;
•• Região II, o teste é não conclusivo (di < d < ds);
•• Região III, (d > ds), aceita-se a hipótese nula (H0) e se rejeita H1;
•• Região IV se (4 – ds) < d < (4 – di), é não conclusivo;
•• Região V se d > (4 – di), rejeita-se a hipótese nula (H0) e a hipótese
alternativa (H1).
106

Econometria
Exemplo 1
Fez-se um estudo durante vários meses em um bairro de uma grande
cidade, calculando-se o valor médio para o aluguel. Estimou-se esses
valores como função da atividade econômica (renda) e da taxa de juros
de curto prazo.
Tabela 3.1 – Valores médios de aluguel
Mês/ano Renda Aluguel médio Taxa de juros
Jan./10 294 100 2,1
Fev./10 297 102 2,1
Mar./10 238 98 2,0
Abril/10 219 100 1,8
Maio/10 310 99 1,8
Jun./10 305 87 1,6
Jul./10 257 86 1,7
Ago./10 249 84 1,8
Set./10 253 91 1,8
Out./10 251 92 1,7
Nov./10 327 93 1,6
Dez./10 338 90 1,5
Jan./11 349 95 1,4
Fev./11 365 96 1,2
Mar./11 327 99 1,1
Abril/11 349 102 1,5
Maio/11 344 103 1,7
Jun./11 327 101 1,8
Jul./11 329 105 2,0
Ago./11 469 108 1,9
107

Capítulo 3
Passo 1
Regredir normalmente, mas como precisaremos dos resíduos para fazer

o teste de Durbin e Watson, vamos assinalar o box resíduos, como na
figura a seguir.
Figura 3.3 – Regressão com resíduos
O resultado será:
Figura 3.4 – Resultados da regressão
108

Econometria
Os erros (resíduos):
Figura 3.5 – Resultados dos Resíduos
A coluna “previsto” é o Y chapéu, que, no nosso caso, são os preços

dos aluguéis. Os resíduos ou erros são as diferenças entre cada Y
da amostra (valores da Tabela 3.1) menos Y chapéu. Utilizaremos os
resíduos para fazer o teste de autocorrelação.
Escrevendo a função de regressão do modelo, temos:
R2 ajustado = 0,36
(4,74)* (3,24)* (2,23)*
Como podemos perceber, o modelo apresenta contradições nos seus

resultados, os sinais dos parâmetros são os esperados, todos os
parâmetros passam no teste t, como se espera, porém, o R2 ajustado é
muito baixo, o que nos leva a descartar o modelo para previsão, já que
o erro é maior que o poder de explicação do modelo. O fato de ser uma
série temporal nos indica a possibilidade de problema de autocorrelação.
109

Capítulo 3
Passo 2
Agora vamos calcular o teste de Durbin Watson.
Para conseguirmos o d calculado, temos que defasar o e (erro), ou seja,

criar a variável defasada . Vamos criar a variável no Excel e depois
diminuir os valores e elevar ao quadrado.
Para criar a coluna et-1, você vai copiar a coluna et e colar uma célula
abaixo na , ou seja, na célula dois. Note que a segunda observação é
referente a fevereiro de 2010, um t (meses) menos 1 (de janeiro de 2010),
o que comprova a defasagem.
Observe que, ao defasar uma variável, perdemos uma observação da

amostra que tinha vinte dados e agora ficará com 19. Temos então que
apagar o último valor de que ficou fora da tabela.
Segue demonstração na figura:
Figura 3.6 – Cálculo de d
110

Econometria
O resultado d é obtido clicando em 387,81 que a soma de

dividido pelo SQ do ANOVA, que é o nosso erro ao quadrado (479,28).
Então temos:
Agora vamos fazer o gráfico do teste de Durbin Watson, para comparar

este valor de d calculado com o d tabelado:
A nossa amostra apresenta os seguintes dados:
n = 20
k = 2 (número de variáveis explicativas)
111

Capítulo 3
Consultando a tabela teste Gujarati, temos:
Cruzando as duas informações anteriores, vamos consultar a segunda

coluna k=2 e descer até o n igual a 20, temos:
112

Econometria
di = 1,100
ds =1,537
4 – ds = 4 – 1,537 = 2,463
4 – di = 4 – 1,100 = 2,900
Figura 3.7 – Teste de Durbin Watson
O d calculado é menor que 1,100 e cai na região I, ou seja, o modelo

apresenta autocorrelação positiva. Após a constatação de presença de
autocorrelação, vamos estudar um método para corrigir a autocorrelação
dos resíduos.
As causas e consequências da autocorrelação dos resíduos, como acabamos

de estudar, afetam nossos resultados e, principalmente, a decisão de usar ou
não usar a função de regressão para previsões futuras. O cálculo do d do teste
de Durbin Watson nos garante a verificação dos problemas. Na próxima seção,
vamos estudar o método de correção desse problema.
1.2 Método de correção

Para a correção do problema de autocorrelação, primeiro vamos mostrar como o
problema da autocorrelação pode ser tratado e depois apresentar métodos para
eliminá-lo.
Racionalização do problema
Uma vez diagnosticado o problema da autocorrelação serial, é possível eliminar

seus efeitos por meio da transformação das variáveis, essa transformação se
chama MOG (método dos Mínimos Ordinários Generalizados).
Vamos desenvolver o método!
113

Capítulo 3
Veja o seguinte modelo linear simples:
(4)
Em que:
et é gerado por um processo autorregressivo de primeira ordem, do tipo:
(5)
Desse modo, substituindo-se 5 em 4, obtém-se a seguinte equação:
(6)
Com uma defasagem, a equação 4 será:
, ou seja,
(7)
Portanto, substituindo-se 7 em 6 e reordenando os termos, tem-se a seguinte

equação:
(8)
Fazendo-se:
A equação 8 ficará (9)
O raciocínio pode ser entendido para casos de mais de uma variável explicativa.
Portanto, conhecendo-se o valor de e feitas as transformações requeridas por

(8), obtém-se uma estimativa corrigida da equação original (4). O parâmetro é,
no entanto, desconhecido.
Existem vários métodos para estimá-lo, sendo alguns deles apresentados a

seguir:
114

Econometria
Método de correção da autocorrelação

Método de dois estágios de Durbin:
•• transforma-se a equação 8
;
•• estima-se , que é o coeficiente de Yt-1 na equação anterior;

•• as transformações requeridas são realizadas por 8, obtendo-se a
expressão cuja estimativa será a equação corrigida:
Generalizando, tem-se:
Fazendo-se:
................
Dessa forma, a equação transformada será:
(10)
Vamos continuar resolvendo nosso exemplo.
Passo 3: calcular o
Modelo inicial:
Inclusão da variável defasada:
Note que nosso modelo tinha três variáveis, sendo uma dependente Y e duas
explicativas X1 e X2. Para estimar o , acrescentamos como variáveis explicativas
o X1 defasado (t-1) e o X2 defasado e também o Y defasado. Observe que o Y
agora se torna uma variável explicativa e o coeficiente estimado para esta variável
será o . Esse valor se faz necessário para transformar as variáveis originais
e eliminar o problema de autocorrelação.
115

Capítulo 3
Para calcular esse coeficiente, vamos incluir na nossa planilha os dados iniciais e
mais cada variável defasada.
Figura 3.9 – Inclusão das variáveis defasadas
Agora vamos regredir com as seis variáveis:
Antes de regredir, cole a tabela em outra planilha e delete a primeira linha.

Nessa regressão, estamos interessados somente no rô, ou seja, o coeficiente
de Aluguéis (t-1), e para tanto não se faz necessário testar os parâmetros e nem
avaliar o R2.
116

Econometria
Figura 3.10 – Resultado da regressão com as variáveis defasadas
Do resultado da regressão acima, temos que o = 0,75.
Com o rô estimado, podemos transformar o modelo como segue:
Fazendo-se:
Então, nossa função vai ficar:
Para estimar esta nova função derivada da anterior, temos que criar as três novas
variáveis dessa forma para o primeiro valor de W. Clique na célula em branco
abaixo da variável e digite igual (=), depois clique em Y (102) e em seguida digite o
sinal - (menos), colocando entre parênteses o valor de rô (0,75), pressione * (para
multiplicar) e clique no valor de Yt-1 que é 100. Dê um enter para calcular e depois
arraste para todos os valores. Repita o mesmo procedimento para as demais
variáveis e a tabela vai ficar desta forma:
117

Capítulo 3
Figura 3.11 – Novas variáveis
Agora sim podemos regredir novamente ao modelo após a transformação das

variáveis originais, como segue:
Figura 3.12 – Resultado da regressão com as variáveis transformadas
118

Econometria
Escrevendo a nova equação da função:
W^ = 18,79 + 0,03Z1 + 7,56Z2 R2 ajustado = 0,08

(5,77)* (1,49) (1,21)
Note que o modelo piorou significativamente, o R2 muito baixo e ambos os

parâmetros b1 e b2 não passam no teste t. O que atesta que o modelo não serve
para previsão mesmo sanando o problema de correlação, isso significa que o
problema do modelo pode ser de outra natureza.
Observe que o processo de testar e estimar os modelos nem sempre reportam

aos resultados que queríamos como comportamento teórico e relacional, porém,
não invalida o estudo do problema.
Seção 2
Heteroscedasticidade
É desejável que a variância dos resíduos ei seja constante, ou seja,
homoscedasticidade , a variância dos resíduos é igual a signa dois.
A violação desse pressuposto é a heteroscedasticidade que se refere ao fato de a
variância de ei, não ser constante, isto é,
Figura 3.13 - Gráficos típicos de heteroscedasticidade
A consequência da heteroscedasticidade é que o método dos mínimos quadrados

ordinários não gera estimativas de parâmetros eficientes ou de variância mínima,
o que implica erros padrões viesados e incorreção dos teste t e F. Tal problema é
mais frequente em séries não temporais, ou seja, cross section.
119

Capítulo 3
Pressupostos sobre a natureza do Heteroscedasticidade

Seja o modelo linear geral:
No caso de heterocesdasticidade, a , a variância é diferente de

sigma ao quadrado. Isso implica afirmar que . O caso
mais frequente é que ei, o erro, é, de algum modo, relacionada a Xi.
Para obtermos bons resultados no modelo de regressão, esses termos

devem ser independentes, ou seja, não podem apresentar correlação.
Uma forma especificativa plausível para a associação entre ei e Xi é a seguinte:
(1)
Tal forma especificativa envolve os parâmetros e c. O c é particularmente

importante, porque mede a força da heteroscedasticidade. Quanto mais próximo
de zero for o valor de c, menos expressiva será a dispersão dos resíduos ei. (c = 0
não haverá heterocesdasticiade).
A partir de (1), conclui-se que o desvio padrão (DP) de ei será:
Organizando a equação temos:
Dessa forma, para obter variância constante (homoscedestacidade), basta dividir

a equação original por Xc/2 .
No caso do modelo linear simples Y = b0 + b1X +e, a equação transformada, após

a divisão, será:
Dessa forma:
O que assegura a homoscedasticidade.
120

Econometria
Caso c = 2, a equação será:
Fazendo-se:
Y/X = W
1/X = S
e/X = u,
A equação, depois da transformação das variáveis será:
(2)
Quando c = -2, o fator de ponderação será X-1 = 1/X
Portanto:
(e)
(homoscedasticidade)
Fazendo-se:
YX = U
X2 = Z
eX =s, ter-se-á:
(3)
Aplicando-se mínimos quadrados às equações (2) e (3), obtém-se estimativas dos

parâmetros do modelo, trata-se do método de mínimos quadrados ponderados
(MQP). Estamos ponderando, ou seja, dividindo toda a equação pelo X, que pode
apresentar o problema de correlação com erro.
Vamos aprender a identificar o problema de heteroscedasticidade a partir de um

teste, e, caso o problema seja identificado, aprenderemos a corrigi-lo e estimar o
modelo com o MQP.
121

Capítulo 3
2.2 Método de correção do problema

Para identificar o problema de heroscedasticidade em um conjunto de dados,
vamos aplicar o teste de Quandt e Goldfeld, que envolve fazer duas regressões
parciais dos dados e classificar os resultados a partir dos limites dados pelo teste.
Teste de Quandt-Goldfeld
O teste consiste nos seguintes passos:
1. Ordenam-se as observações de X que, hipoteticamente, está correlacionada

com os resíduos.
2. Seleciona-se arbitrariamente certo número de observações centrais (c), que

serão omitidas da análise.
•• Em geral, omitem-se 1/5 das observações.

•• As (n – c) observações restantes são divididas em duas subamostras
de tamanhos iguais, uma incluindo valores menores de X e outra, os
maiores.
3. Estima-se regressões separadas e obtém-se a soma de quadrados dos

resíduos para cada subamostra:
•• SQRb = soma de quadrados dos resíduos mais baixos de X

•• SQRe = soma de quadrados dos resíduos mais elevados de X
4. Com essas informações, define-se a seguinte estatística F:
(4)
F* com (n – c-2k)/2 graus de liberdade tanto para o numerador quanto para

denominador.
Em que:
n = número de observações;
c = número de observações omitidas;
K= número de variáveis explicativas.
122

Econometria
Figura 3.14 -Gráfico teste de Grandt-Goldfeld
Se as variâncias das duas subamostras forem aproximadamente iguais, F tende

a 1 e a hipótese nula de ausência de heterocedasticidade (H0) será aceita. À
medida que a diferença entre as duas variâncias se amplia, o problema de
heteroscedasticidade vai ficando mais sério. Se F* observado > F crítico, a
hipótese nula de homocedasticidade será rejeitada.
123

Capítulo 3
Exemplo 2
Com os dados da tabela a seguir, faça a regressão dos salários
em função dos anos de estudo, levantamento feito em 2009, em
Florianópolis. Verifique a existência de heterocedsticidade, em caso
positivo, faça as correções devidas e reestime o modelo.
Tabela 3.2 – Salários e anos de estudo
Salários Anos de estudo
1099 5
1243 8
4305 23
220 0
1757 9
1842 10
2181 11
3464 17
120 0
2821 15
4140 22
1439 8
1847 11
130 0
251 1
1801 9
3788 22
145 0
467 2
861 4
continua...
124

Econometria
3692 21
2587 15
2900 15
507 2
1226 7
3259 17
2033 11
2029 11
1618 8
637 3
2216 12
3078 16
1160 6
2335 12
3223 16
1630 8
2367 13
Passo 1: Ordenar os dados
Para ordenar os dados, clique na coluna de dados de salário depois

clique no filtro do Excel (classificar e filtrar), conforme Figura 3.15,
selecione a primeira opção, classificar do menor para o maior. Na caixa
de Aviso de classificação, selecionar Expandir a seleção e clicar em
Classificação.
125

Capítulo 3
Figura 3.15 - Ordenar os dados
Passo 2: dividir a amostra em dados mais baixos e mais elevados
Antes de dividir a amostra em duas subamostras iguais, temos que

retirar 1/5 do meio da amostra. Como nosso exemplo tem 37 dados, um
quinto de 37 é 7,4 vamos arredondar para 7. Assim, 37 – 7 = 30. Dessa
forma, vamos trabalhar com 15 dados mais baixos, pulamos 7 e depois
com as últimas 15 observações mais elevadas.
Figura 3.16 - Cálculo do erro ao quadrado dos valores mais baixos
126

Econometria
Agora, vamos calcular o erro ao quadrado da amostra dos valores mais

alto da amostra, lembre-se de pular os valores centrais.
Figura 3.17 - Cálculo do erro ao quadrado dos valores mais elevados
Passo 3: Cálculo do F*
Graus de liberdade = (37 – 7 – (2*1))/2 = 28/2 = 14
Valor de F(tabelado)
F14/14=2,46 (como não temos 14 no numerador este é o valor do F14/15)
Como F calculado (3,17) é maior que F tabelado (2,46), a amostra

apresenta heteroscedasticidade.
Passo 4: Correção dos dados
Vamos transforma nossa equação inicial:
Em que: W é salários e E anos de estudo.
Vamos dividir toda a equação por E, nosso X, ou seja, a variável

explicativa.
127

Capítulo 3
Desta forma a nova equação será
Para regredir a nova equação, temos que criar as novas variáveis,

voltando à tabela original com todos os dados da amostra. Para calcular
Z, clique na primeira célula da coluna, em seguida em =, e depois no
primeiro valor W barra (/) para dividir, e clique no primeiro valor de E. Em
seguida, tecle enter para calcular o primeiro valor e basta arrastar para
calcular os demais. Repetir o mesmo procedimento para o cálculo de S.
Figura 3.18 - Cálculo das variáveis ponderadas
Salários Anos de estudo Z(W/E) S(1/E)
120 0 120 1
130 0 120 1
145 0 145 1
220 0 220 1
251 1 251,00 1,00
467 2 233,50 0,50
507 2 253,50 0,50
637 3 212,33 0,33
861 4 215,25 0,25
1099 5 219,80 0,20
1160 6 193,33 0,17
1226 7 175,14 0,14
1243 8 155,38 0,13
1439 8 179,88 0,13
1618 8 202,25 0,13
1630 8 203,75 0,13

continua...
128

Econometria
1757 9 195,22 0,11
1801 9 200,11 0,11
1842 10 184,20 0,10
1847 11 167,91 0,09
2029 11 184,45 0,09
2033 11 184,82 0,09
2181 11 198,27 0,09
2216 12 184,67 0,08
2335 12 194,58 0,08
2367 13 182,08 0,08
2587 15 172,47 0,07
2821 15 188,07 0,07
2900 15 193,33 0,07
3078 16 192,38 0,06
3223 16 201,44 0,06
3259 17 191,71 0,06
3464 17 203,76 0,06
3692 21 175,81 0,05
3788 22 172,18 0,05
4140 22 188,18 0,05
4305 23 187,17 0,04
Na Figura 3.18, temos as variáveis ponderadas calculadas. Note que

nesse caso temos uma peculiaridade: quando valores de X forem iguais
a zero, para esses casos, desconsidere o valor de erro e repita o valor
129

Capítulo 3
original da variável.
Resultado da regressão antes do teste de heteroscedasticidade.
(2,91)* (54,71)*
Notamos que os dados iniciais são bons, mas, como os dados

apresentam o problema de heteroscedasticidade, eles podem ser
viesados.
(-0,56) (32,53)*
Note que o modelo é bem pior que o inicial, o R2 é muito próximo do

zero e o teste da variável explicativa não passa. Dessa forma, o modelo
estimado pelo método dos mínimos quadrados ponderados não serve
para previsão.
No caso de um modelo de regressão múltipla, temos que fazer hipótese

sobre um dos X e testá-lo, e caso não apresente o problema de
heteroscedasticidade, testamos o X2, e assim por diante.
Agora vamos estudar o problema multicolineariadade dos dados, esse

não é um problema muito relevante, mas é importante estar ciente do
seu conceito.
130

Econometria
Seção 3
O problema de Multicolinearidade
Multicolinearidade refere-se à correlação entre duas variáveis explicativas
incluídas na equação de modelo. A multicolinearidade ocorre, quando, por
exemplo, duas variáveis X1 e X2 medem aproximadamente a mesma coisa, ou
seja, a correlação entre elas é quase perfeita. Quando tal correlação é elevada, a
eficiência dos parâmetros estimados é significativamente afetada, tornando-os
instáveis.
Os coeficientes estimados pelo MMQ podem ser estatisticamente não

significantes (e ainda ter sinal errado), ainda que R2 seja “alto”.
Em síntese, as consequências da multicolinearidade são:
1. Matriz de variância com valores muito elevados;

2. Possibilidade de conflito entre os resultados dos testes t, F e R2;
3. Grande sensibilidade dos parâmetros a pequenas mudanças na
amostra.
Identificação da existência de multicolinearidade

e tratamento
Para identificar multicolinearidade, podemos calcular o coeficiente de correlação
(r) entre cada par de variáveis explicativas. Se para algum (alguns) dos pares eles
forem superior a 0,8, deve-se considerar a existência do problema.
O tratamento da multicolinearidade
a. aumento do tamanho da amostra;

b. uso de informação a priori sobre o valor da estimativa dos
parâmetros, obtida de estudo prévio;
c. transformação da forma funcional;
d. exclusão das variáveis colineares;
e. uso de razão ou primeiras diferenças;
f. não fazer nada.
Às vezes é muito difícil conseguir aumentar o tamanho da amostra, ou seja,

conseguir mais dados passados. Dessa forma, optaremos por não fazer nada.
131

Capítulo 3
Atividades de Autoavaliação
1. A tabela a seguir demonstra as despesas com máquinas e equipamentos de
utilidade pública (Y) PNB e Índice de preço de produto (IPP).
Ano 1993 1994 1995 1996 1997 1998 1999 2000 2001
Y 14,9 15,0 15,5 16,3 17,4 18,7 20,2 21,6 23,1
PNB 573,8 604,7 645,7 698,1 763,0 806,3 878,5 945,5 992,4
IPP 102,8 103,8 104,6 105,7 108,2 110,0 113,7 118,4 123,5
Ano 2002 2003 2004 2005 2006 2007 2008 2009 2010
Y 25,3 27,0 28,7 30,6 30,1 32,3 35,8 39,5 43,2
PNB 1073,4 1181,1 1316,6 1422,9 1538,8 1712,2 1909,5 2137,6 2378,5
IPP 127,4 130,9 139,9 155,5 168,4 175,2 184,7 197,1 218,4
Faça o teste de Durbin Watson para detectar a autocorrelação.
2. A partir do exercício 1, corrija o problema de autocorrelação pelo método de

Durbin de dois estágios.
3. A partir do modelo estimado na questão dois, após as correções, analise os

resultados finais do modelo.
4. Redefina o modelo resultante na questão 3, para que se possa usar o modelo

para a previsão.
5. Podemos garantir que o novo modelo proposto em 4 não apresenta problema

de autocorrelação? Justifique a sua resposta.
6. Classifique as alternativas abaixo: V (verdadeiro) e F (falso). .
a) ( ) Multicolinearidade é um problema de dados apresentados exclusivamente

em cross section.
b) ( ) As principais fontes de autocorrelação serial são: a omissão de alguma
variável importante; a má especificação da forma matemática e do termo
aleatório e os ajustes imperfeitos de séries estatísticas.
c) ( ) Sempre que se localiza multicolinariedade em duas variáveis, deve-se
excluí-las da equação.
d) ( ) O principal tratamento da multicolinearidade e o aumento do tamanho da
amostra.
132

Econometria
7. A tabela abaixo demonstra os dados de consumo e renda de várias famílias

para o ano de 2015, na cidade de Imbituba. Observe que os dados já estão
ordenados.
Consumo Renda
55 80
65 85
70 90
74 100
75 105
79 110
80 115
84 120
90 125
95 130
98 140
108 145
110 150
113 160
115 165
120 180
125 185
130 190
135 200
137 205
140 210
140 220
144 225
145 230
152 240
continua...
133

Capítulo 3
175 245
178 250
180 260
189 265
191 270
A partir dos dados acima, faça o teste de heterocedasticidade, pondere as

variáveis e reestime o modelo.
134

Capítulo 4
Equações simultâneas
Em alguns casos na teoria econômica, uma variável pode assumir o papel de
variável dependente numa função e, ao mesmo tempo, ou simultaneamente, ser
uma variável independente em outra função.
A identidade macroeconômica de Keynes é um bom exemplo, pois a renda

(Y) depende, entre outras variáveis, do agregado do consumo. Por sua vez, o
consumo das famílias depende do nível de renda. Note que na função de renda,
o consumo é uma variável explicativa, ou seja, um X, e na função consumo é uma
variável dependente do nível de renda.
Para variáveis que apresentam essas características, não podemos estimar com
o método clássico de estimação de regressão. Para isso, vamos introduzir um
novo método de estimação que leva em consideração o sistema de equações
simultâneas.
Seção 1
Conceito e natureza
Até agora estudamos exclusivamente modelos de equação única, isto é,
modelos em que havia uma única variável dependente Y e uma ou mais variáveis
explicativas, os Xs. Em tais modelos, a ênfase foi na estimativa e/ou previsão do
valor médio de Y condicionado aos valores das variáveis Xs. A relação de causa e
efeito em tais modelos, portanto, flui dos Xs para o Y.
Segundo Gujarati (2011), em muitas situações, porém, não faz sentido tal relação
de causa e efeito de mão única, ou unidirecional. Isso ocorre se Y é determinado
pelos Xs, e alguns dos Xs são, por sua vez, determinados por Y. Ou seja, há uma
relação de mão dupla, ou simultânea, entre Y e (alguns dos) Xs. No modelo de
equações simultânea é possível reunir um conjunto de variáveis que possam ser
determinados simultaneamente pelo conjunto restante de variáveis.
135

Capítulo 4
Assim, ao contrário dos modelos de equação única, nos modelos de equações

simultâneas, não podemos estimar os parâmetros de uma única equação sem
levar em conta informações fornecidas por outras equações no sistema.
Em tais modelos, há mais de uma equação, uma para cada das variáveis
mutuamente ou conjuntamente dependentes, ou variáveis endógenas.
No contexto dos modelos de equações simultâneas, as variáveis conjuntamente

dependentes são chamadas de variáveis endógenas, e as variáveis
verdadeiramente não estocásticas, ou que possam ser assim consideradas, são
chamadas de variáveis exógenas ou predeterminadas. Endógena determinada
variável dentro do modelo e exógena fora do modelo.
Exemplo 1
Modelo de demanda e oferta
O preço, P, de uma mercadoria e a quantidade vendida, Q, são

determinados pela intersecção das curvas de demanda e oferta dessa
mercadoria. Assim, admitindo, por questão de simplicidade, que as
curvas de demanda e oferta sejam lineares, e acrescentando os termos
de perturbação estocástico, ou seja, o erro e1 e e2, segundo Gujarati
(2011), podemos escrever as funções demanda e oferta empíricas como:
Função demanda
Função oferta
Condições de equilíbrio
Em que:
Qd = quantidade demandada;
Qo = quantidade ofertada;
P = Preço;
t = tempo.
Espera-se que o sinal de b1 seja negativo, uma vez que a função

demanda é negativamente inclinada, ou seja, quanto maior o preço
menor a Qtd. Já a alta de preço tem um efeito contrário na curva de
oferta, que é positivamente inclinada. Nesse caso, as perturbações na
função de demanda mudam o preço e quantidade da demanda que, por
consequência, afetam a quantidade de oferta, e assim por diante.
136

Econometria
Exemplo 2
Modelo Keynesiano de determinação da renda.
Considere o modelo Keynesiano simples de determinação da renda:
Função consumo
Identidade de renda
Em que:
C = consumo;
Y = renda;
I = investimento (admitido como exógeno);
S= poupança;
t= tempo;
= termo de perturbação estocástica (erro);
= parâmetros;
= PMgC (propensão marginal a consumir)
A função consumo (C) depende de renda (Y), sendo que as famílias,

para consumirem, dependem de renda para tal. A identidade de renda
total é resultado da soma do consumo total mais investimentos totais,
considerando que investimento é igual à poupança. Dessa forma, as
variáveis C e Y são interdependentes, o consumo é determinado pelo
nível de renda, porém, também determina a renda total. Na primeira
equação, C é uma variável dependente, e, na segunda, é uma variável
independente ou explicativa.
Para os dois exemplos, não podemos estimar as funções pelo MQO (mínimos
quadrados ordinários), pois, se aplicarmos isso, os parâmetros estimados serão
inconsistentes, dessa forma, vamos aprender um método alternativo para esses
casos.
137

Capítulo 4
Seção 2
Método dos mínimos quadrados indiretos (MQI)
Os modelos de equações simultâneas pressupõem um sistema de equações
representantes do problema estudado. Desse pressuposto temos o problema de
identificação do sistema de equações. Quanto à estimativa de uma equação é
exatamente identificada, usamos o MQI para estimativa das equações reduzidas,
já quando a estimativa de uma equação é sobre identificada, usaremos o MQ2E,
o método de dois estágios para estimar as equações reduzidas. Primeiramente,
vamos desenvolver o método MQI.
Segundo Matos (2000), o termo identificação em econometria refere-se

à possibilidade ou não de se obter os parâmetros estruturais de uma
equação pertencente a um sistema simultâneo, a partir das equações
reduzidas. Tal equação é identificada se seus parâmetros podem ser
obtidos a partir dos parâmetros estimados das equações reduzidas. Se a
equação não for identificada, as estimativas de seus parâmetros podem
referir-se a outra equação do sistema ou constituir-se uma mistura das
duas.
Hill et al. (2010) destaca que a condição necessária para identificação em um

sistema de M equações simultâneas, que determinam conjuntamente os valores
de M variáveis endógenas, é que, ao menos, M-1 variáveis devem estar ausentes
de uma equação para que seja possível estimar seus parâmetros.
Quando é possível a estimação dos parâmetros de uma equação, essa se diz

identificada, e seus parâmetros podem ser estimados consistentemente. Se
s M-1 variáveis são omitidas de uma equação, essa é não identificada e seus
parâmetros não podem ser estimados.
Para uma equação simultânea, o método para obter as estimativas dos

coeficientes a partir das estimativas de MQO dos coeficientes na forma
reduzida é conhecido como método dos mínimos quadrados indiretos
(MQI), e as estimativas assim obtidas são conhecidas como estimativas
por mínimos quadrados indiretos.Uma equação na forma reduzida é a
que tem uma variável endógena unicamente em termos das variáveis
predeterminadas e perturbações estocásticas.
138

Econometria
Exemplo 3
Para ilustrar, considere o modelo Keynesiano de determinação de
renda.
Função consumo h (1)
Identidade de renda (2)
Neste modelo, C (consumo) e Y (renda) são as variáveis endógenas

e I (investimento) é tratado como uma variável exógena. Ambas as
equações anteriores são estruturais, sendo que (2) é uma identidade.
Vamos transformar as equações originais em reduzidas:
Passo 1:
Substituindo (1) em (2) temos:
Equação:
, como consumo é representado por , temos:
, juntando as variáveis iguais
colocando em evidência a renda
(3)
Em que:
A equação (3) é uma equação na forma reduzida; ela expressa a

variável endógena Y unicamente como uma função da variável exógena
(ou predeterminada) I e do termo de perturbação estocástico w. Os
parâmetros e são os coeficientes na forma reduzida.
139

Capítulo 4
Passo 2:
Substituindo (2) em (1) temos:
(4)
Em que:
A equação (4) é uma equação na forma reduzida; ela expressa a variável

endógena C, unicamente como uma função da variável exógena
(ou predeterminada) I e do termo de perturbação estocástico w. Os
parâmetros e são os coeficientes na forma reduzida.
Note que agora temos duas equações como no início, porém, ambas
são determinadas ou explicadas pelo mesmo X, ou seja, I (investimento)
e pela mesma quantidade de X, no caso um.
O método dos MQI envolve os três passos a seguir:
Passo 1: primeiro, obtemos as equações na forma reduzida;
Passo 2: aplicamos o método dos MMQ às equações na forma reduzida

individualmente;
Passo 3: obtemos estimativas dos coeficientes estruturais por meio dos

coeficientes estimados na forma reduzida, obtidos no passo 2.
140

Econometria
Exemplo 4
Na tabela abaixo temos os dados referentes ao mercado de um produto
agrícola. Em que Q representa quantidades em toneladas, P preço US$/
kg e Renda em número índice com base em 1977=100. Estime a oferta e
a demanda pelo MQI – método dos mínimos indiretos.
Tabela 4.1 – Mercado de um produto agrícola
Ano Q P Y
1977 236,2 20,06 100
1978 238,1 20,86 111
1979 245,3 20,68 110
1980 243,6 20,90 112
1981 250,1 19,60 114
1982 247,7 19,90 114
1983 249,6 20,22 118
1984 239,8 20,96 123
1985 240,9 19,30 110
1986 246,7 18,24 101
1987 228,9 18,62 85
1988 221,8 19,76 87
1989 226,8 20,58 96
1990 237,1 19,76 103
1991 253,9 19,02 117
1992 240,5 19,70 120
1993 248,4 17,30 110
1994 239,8 20,80 119
1995 252,5 21,16 126
1996 254,9 22,70 145
Fonte: Suganuma (2000).
141

Capítulo 4
Sistema de equações que representam o modelo:
Função Demanda (1)
Função oferta (2)
Em que:
Qd = quantidade demanda
Qs = quantidade ofertada
P = preço
Y = renda Suponha que Y seja exógeno.
= erro
Resolvendo:
Primeiro, obter as equações reduzidas
Passo 1: antes de substituir 1 em 2, temos que transformar a equação

oferta de Q para P.
Oferta (2)
(2)
Passo 2: Substituindo (1) em (2) temos:
(tirar o m.m.c. do coeficiente de P)
142

Econometria
(3)
(tirar o m.m.c. do coeficiente de

Q e do intercepto)
(4)
143

Capítulo 4
Dessa forma, as equações na forma reduzida correspondentes às

equações estruturais anteriores são:
(3)
(4)
Segundo, estimar as equações reduzidas por MQO
Observe que cada equação na forma reduzida contém uma variável

endógena, que é a variável dependente e que é uma função
exclusivamente da variável exógena Y(renda) e das perturbações
estocásticas, ou seja, do erro.
Por isso, os parâmetros das equações na forma reduzida anteriores

podem ser estimados por MQO.
Essas estimativas são:
Terceiro, a partir dos parâmetros estimados por MMQ, calculamos

os coeficientes estruturais
Como nosso objetivo primordial é determinarmos os coeficientes

estruturais, vejamos se podemos estimá-los pelos coeficientes na forma
reduzida. Portanto, seus parâmetros podem ser unicamente estimados
pelos coeficientes na forma reduzida como segue:
144

Econometria
Consequentemente, as estimativas desses parâmetros podem ser

obtidas das estimativas dos coeficientes na forma reduzida:
Note que os parâmetros da função demanda não podem ser estimados.
Resolvendo no Excel:
Passo 1:
Estimar a equação reduzida da Oferta:
Figura 4.1– Regressão função oferta
(7,70)* (2,91)*
Passo 2:
Estimar a equação reduzida da Demanda:
145

Capítulo 4
Figura 4.2 – Regressão função demanda
(16,74)* (5,16)*
Passo 3:
A partir das duas equações reduzidas podemos, calcular os parametros

estruturais.
Voltando para a função estrutural de oferta inicial, temos:
Dessa forma, temos coeficientes consistentes para a função oferta pelo

método dos quadrados indiretos.
146

Econometria
Seção 3
Método de dois estágios para estimação
de mínimos quadrados (MMQ2E)
Os dois estágios desse método são:
Primeiro: a estimação por mínimos quadrados da equação reduzida Y e o cálculo

de seu valor previsto (Y chapéu);
Segundo: a estimação por mínimos quadrados da equação estrutural em que a

variável endógena do lado direito Y é substituída por seu valor previsto .
Procedimento Geral de estimação de mínimos quadrados em dois estágios:
Podemos utilizar o método de estimação de mínimos quadrados em dois estágios

para estimar os parâmetros de qualquer equação identificada dentro de um
sistema de equações simultâneas. Em um sistema de M equações simultâneas,
sejam Y1, Y2, ....,Ym as variáveis endógenas e K variáveis exógenas X1, X2, ..., Xk,
suponha que a primeira equação estrutural dentro deste sistema seja:
(1)
Se essa equação é identificada, então, seus parâmetros podem ser estimados por
meio dos dois passos abaixo:
Passo 1: estimar por mínimos quadrados os parâmetros das equações em forma

reduzida:
Podemos obter os valores previstos:
Passo 2: substituindo as variáveis endógenas Y2 e Y3 no lado direito da equação

estrutural (equação 1) por seus valores previstos na equação 2:
(2)
Finalmente, estimamos por mínimos quadrados os parâmetros dessa equação.
147

Capítulo 4
As propriedades do estimador de MMQ2E:
•• o estimador MMQ2E é um estimador tendencioso, mas é

consistente;
•• em grandes amostras, o estimador MMQ2E tem distribuição
aproximadamente normal.
•• as variâncias e covariâncias do estimador MMQ2E são
desconhecidas em pequenas amostras, mas para grandes amostras
dispomos de expressões que podem servir como aproximações.
Essas fórmulas estão embutidas no software econométrico, que
dão desvio padrão e valores t precisamente como um programa de
regressão de mínimos quadrados comum.
Exemplo 5
As trufas, um tipo de cogumelo subterrâneo, são usadas na gastronomia.
Na França, são localizados por pessoas que utilizam porcos para fareja-
las. Hill et al. (2010):
Tabela 4.2 – Mercado de trufas
Obs. P q Ps rd Pf
1 9,88 19,89 19,97 21,03 10,52
2 13,41 13,04 18,04 20,43 19,67
3 11,57 19,61 22,36 18,70 13,74
4 13,81 17,13 20,87 15,25 17,95
5 17,79 22,55 19,79 27,09 13,71
6 12,84 6,37 15,98 24,89 24,95
7 18,11 15,02 17,94 22,94 24,17
8 13,52 10,22 17,09 21,96 23,61
9 22,45 23,64 22,72 38,85 19,52
10 16,55 16,12 15,74 31,69 20,03
11 19,39 24,55 24,64 26,23 15,38

continua...
148

Econometria
12 22,29 18,92 23,70 30,07 22,98
13 16,65 11,94 15,93 33,67 25,76
14 21,65 18,93 23,34 32,90 25,17
15 17,56 12,60 15,21 37,46 25,82
16 20,40 20,49 26,04 35,18 19,31
17 26,85 22,94 22,95 43,81 26,02
18 29,98 21,08 27,10 41,21 29,65
19 23,59 16,68 23,65 38,20 27,45
20 19,11 17,61 20,06 43,98 18,00
21 15,41 16,62 26,38 37,64 18,87
22 25,81 20,99 24,28 45,24 24,58
23 27,67 24,53 26,64 48,15 25,25
24 23,57 19,67 22,65 36,70 24,24
25 22,25 23,29 19,68 43,92 22,63
26 25,60 16,64 23,82 46,03 27,35
27 27,90 20,81 28,98 46,32 30,34
28 27,00 14,95 18,52 48,94 24,12
29 29,48 26,27 28,16 51,25 34,01
30 35,15 20,65 28,43 48,36 34,01
Fonte: Hill et al.(2010).
Considere um modelo de oferta e de demanda de trufas:
Demanda
Oferta
Nessa equação de demanda, q é a quantidade de trufas negociadas em

determinado mercado Francês no instante t;P é o preço de mercado das
trufas; Ps é o preço de mercado de um substituto das trufas reais, como
outro fungo de menor valor; e rd é a renda disponível per capita.
149

Capítulo 4
A equação de oferta contém o preço de mercado e a quantidade

ofertada. Inclui também Pf, o preço de um fator de produção, que em
nosso caso é o preço do aluguel, por hora, dos porcos usados no
farejamento.
Nesse modelo as variáveis exógenas são Ps, rd, Pf e o intercepto.
A regra para identificar uma equação é que, em um sistema de M

equações, ao menos M-1 variáveis sejam omitidas de cada equação,
para que ela seja identificada. Na equação de demanda, a variável
pf não está incluída e assim temos a condição M-1, ou seja, uma
variável é omitida. Na equação de oferta, estão ausentes tanto ps
como rd, situação mais do que suficiente para satisfazer a condição de
identificação.
Concluímos, portanto, que cada equação nesse sistema é identificada,

podendo, assim ser estimada por mínimos quadrados de dois estágios.
Por que razão as variáveis são omitidas de suas respectivas equações?
Porque a teoria econômica diz que o preço de um fator deve afetar a
oferta, mas não a demanda; e o preço de bens substitutos e a renda
devem afetar a demanda, mas não a oferta.
As equações em forma reduzida
As equações em forma reduzida expressam cada variável endógena, p e q,

em termos das variáveis exógenas, ps, pf e rd e o intercepto, mais o termo
estocástico (erro).
A partir das equações iniciais:
Demanda (1)
Oferta (2)
Obtivemos as forma reduzidas a partir da substituição de 1 em 2 e, em seguida, 2

em 1 conforme modelo MQI.
Formas reduzidas:
Demanda
Oferta
150

Econometria
Agora vamos regredir as equações reduzidas:
Demanda
Figura 4.3– Regressão função demanda
Função demanda:
Agora vamos regredir a função oferta:
Figura 4.4– Regressão função oferta
151

Capítulo 4
Função oferta:
Para o segundo estágio, usaremos esta função para calcular a variável
Passo 1:
Crie a coluna na tabela original dos dados, como segue:
Tabela 4.3 – Inclusão da variável
Q Ps rd Pf P^
19,89 19,97 21,03 10,52
13,04 18,04 20,43 19,67
19,61 22,36 18,7 13,74
17,13 20,87 15,25 17,95
22,55 19,79 27,09 13,71
6,37 15,98 24,89 24,95
15,02 17,94 22,94 24,17
10,22 17,09 21,96 23,61
23,64 22,72 38,85 19,52
16,12 15,74 31,69 20,03
24,55 24,64 26,23 15,38
18,92 23,7 30,07 22,98
11,94 15,93 33,67 25,76
18,93 23,34 32,9 25,17
12,6 15,21 37,46 25,82
20,49 26,04 35,18 19,31
22,94 22,95 43,81 26,02
21,08 27,1 41,21 29,65
16,68 23,65 38,2 27,45
17,61 20,06 43,98 18

continua...
152

Econometria
16,62 26,38 37,64 18,87
20,99 24,28 45,24 24,58
24,53 26,64 48,15 25,25
19,67 22,65 36,7 24,24
23,29 19,68 43,92 22,63
16,64 23,82 46,03 27,35
20,81 28,98 46,32 30,34
14,95 18,52 48,94 24,12
26,27 28,16 51,25 34,01
20,65 28,43 48,36 34,01
Fonte: Tabela 4.2, complementada pelo autor (2012).
Passo 2: calcular os valores de
Digite igual na primeira célula do Excel, abaixo do nome da variável (P^), e depois
digite -8,07 mais 0,47*(asterisco para multiplicar) e clique no primeiro valor de Ps;
em seguida, digite + seguido de 0,29* e clique no primeiro valor da variável rd;
digite + seguido de 0,37*e clique no primeiro valor de Pf; tecle Enter para finalizar
e arraste a fórmula até o fim da tabela.
No Excel:
Figura 4.5 – Calculo da variável P^
153

Capítulo 4
Tabela 4.4 – Cálculo da variável P^
Q Ps Rd Pf P^
19,89 19,97 21,03 10,52 11,31
13,04 18,04 20,43 19,67 13,61
19,61 22,36 18,7 13,74 12,95
17,13 20,87 15,25 17,95 12,80
22,55 19,79 27,09 13,71 14,16
6,37 15,98 24,89 24,95 15,89
15,02 17,94 22,94 24,17 15,96
10,22 17,09 21,96 23,61 15,07
23,64 22,72 38,85 19,52 21,10
16,12 15,74 31,69 20,03 15,93
24,55 24,64 26,23 15,38 16,81
18,92 23,7 30,07 22,98 20,29
11,94 15,93 33,67 25,76 18,71
18,93 23,34 32,9 25,17 21,75
12,6 15,21 37,46 25,82 19,50
20,49 26,04 35,18 19,31 21,52
22,94 22,95 43,81 26,02 25,05
21,08 27,1 41,21 29,65 27,59
16,68 23,65 38,2 27,45 24,28
17,61 20,06 43,98 18 20,77
16,62 26,38 37,64 18,87 22,23
20,99 24,28 45,24 24,58 25,56
24,53 26,64 48,15 25,25 27,76
19,67 22,65 36,7 24,24 22,19
23,29 19,68 43,92 22,63 22,29
16,64 23,82 46,03 27,35 26,59

continua...
154

Econometria
20,81 28,98 46,32 30,34 30,21
14,95 18,52 48,94 24,12 23,75
26,27 28,16 51,25 34,01 32,61
20,65 28,43 48,36 34,01 31,90

Agora, devemos voltar às equações estruturais e substituir P por :
Podemos, dessa forma, regredir as equações estruturais modificadas pelo MQO:
Função demanda:
Figura 4.6 – Regressão da função demanda
(-1,26) (5,71)* (3,27)* (-3,29)*
155

Capítulo 4
Função oferta:
Figura 4.7 – Regressão da função oferta
(6,94)* (-5,03)* (6,15)*
Como podemos perceber, em ambos os casos os parâmetros estimados são

consistentes, ou seja, passam no teste t. Os sinais também são os esperados. Na
equação da demanda, quanto maior for o preço do cogumelo substituto, espera-
se que a demanda de trufas aumente. A renda também tem um efeito positivo
no aumento de demanda e quanto maior for o preço menor será a demanda. Na
curva de oferta, quanto maior o preço do fator de produção menos se oferta e
quanto maior o preço mais se oferta.
As equações simultâneas pressupõem um conjunto de equações interligadas para

responder a teoria econômica. Como podemos perceber, por se tratar de modelos
determinados por um conjunto de equações, não podemos regredir apenas
uma das equações. Para tanto, temos dois métodos: o MQI e o MMQ2E. Para
ambos os casos, devemos calcular as equações reduzidas do modelo a partir de
substituição. Quando utilizamos esses modelos, os parâmetros estimados são
consistentes.
156

Econometria
1. A tabela abaixo mostra dados referentes à Y (produto interno bruto)
representando renda nesta economia, C (consumo pessoal) e I (investimento
doméstico privado bruto), em bilhões de dólares, para o período de 1970-1991.
Equações estruturais do modelo:
Função consumo
Identidade de renda
Ano C I Y
1970 1813,5 429,7 2873,9
1971 1873,7 475,7 2955,9
1972 1978,4 532,2 3107,1
1973 2066,7 591,7 3268,6
1974 2053,8 543,0 3248,1
1975 2097,5 437,6 3221,7
1976 2207,3 520,6 3380,8
1977 2296,6 600,4 3533,3
1978 2391,8 664,6 3703,5
1979 2448,4 669,7 3796,8
1980 2447,1 594,4 3776,3
1981 2476,9 631,1 3843,1
1982 2503,7 540,5 3760,3
1983 2619,4 599,5 3906,6
1984 2746,1 757,5 4148,5
1985 2865,8 745,9 4279,8
1986 2969,1 735,1 4404,5
1987 3052,2 749,3 4539,9
1988 3162,4 773,4 4718,6
1989 3223,3 784,0 4838,0
1990 3260,4 739,1 4877,5
1991 3240,8 661,1 4821,0

Fonte: Economic Report the President, 1993, tabela B-2, p. 350.
157

Capítulo 4
Determine as funções reduzidas do modelo.
2. A partir do modelo da questão anterior, regrida as funções reduzidas
3. A partir do modelo inicial, estime a equação simultânea pelo método de

mínimos quadrados indiretos.
158

Econometria
Anexos
Anexo 1
Tabela – Distribuição t de Student (teste bilateral).
Grau de
Probabilidade de um valor maior em
Liberdade valor absoluto que o valor tabelado
(gl)
0,01 0,05 0,10
1 63,657 12,706 6,314
2 9,925 4,303 2,920
3 5,841 3,182 2,353
4 4,604 2,776 2,132
5 4,032 2,571 2,015
6 3,707 2,447 1,943
7 3,499 2,365 1,895
8 3,355 2,306 1,860
9 3,250 2,262 1,833
10 3,169 2,228 1,812
11 3,106 2,201 1,796
12 3,055 2,179 1,782
13 3,012 2,160 1,771
14 2,977 2,145 1,761
15 2,947 2,131 1,753
16 2,921 2,120 1,746
17 2,898 2,110 1,740

continua...
159

Grau de
Probabilidade de um valor maior em
Liberdade valor absoluto que o valor tabelado
(gl)
0,01 0,05 0,10
18 2,878 2,101 1,734
19 2,861 2,093 1,729
20 2,845 2,086 1,725
21 2,831 2,080 1,721
22 2,819 2,074 1,717
23 2,807 2,069 1,714
24 2,797 2,064 1,711
25 2,787 2,060 1,708
26 2,779 2,056 1,706
27 2,771 2,052 1,703
28 2,763 2,048 1,701
29 2,756 2,045 1,699
30 2,750 2,042 1,697
∞ 2,576 1,960 1,645
160

Anexo 2
161

162

163

164

Gabarito das atividades
de autoaprendizagem
Capítulo 1
Questão 1:
a. Caminho de resposta:
Função:
b. Caminho de resposta:
(13,80) e (11,13)
165

c. Caminho de resposta:
Análise do teste t:
(13,80)* (11,13)*
* ambos os parâmetros b0 e b1 passam no teste t uma vez que o t (tabelado) com

gl = 3 é 3,182, com um nível de significância de 5%. Aceitam H1 e rejeitam Ho.
Sim, até o momento o sinal de b1 é compatível com a teoria, já quanto maior

a renda maior será o consumo e ambos os parâmetros passaram no teste t,
indicando um bom modelo para a previsão.
d. Caminho de resposta:
R2 = 0,98
A partir desse resultado, podemos inferir que 98% das variações de Y são
explicadas pelas variações de X, restando apenas 2% de erro, o que caracteriza
um ótimo modelo para a previsão.
Questão 2:
R2 = 0,04
(-0,43) (0,62)*
166

Econometria
Questão 3:
Primeiro passo, plotar o gráfico de dispersão:
Segundo passo, adicionar a reta de tendência:
167

Questão 4:
Questão 5:
(0,33) (-2,92)* (6,81)*
168

Econometria
* os parâmetros b1 e b2 passam no teste aceitando H1 e rejeitando H0, dado que

o valor-p de b1 é 0,02 < que 0,05 e de b2 é 0,00 também menor que 5%. O b0 não
passa no teste porque seu valor-p é 0,75>0,05, porém como ele é o intercepto da
equação, podemos relevar esta condição. A reta pode sair da origem sem maiores
problemas, ou seja, se o valor de b0 for zero não invalida nossa equação.
Questão 6:
O R2 ajustado é 0,91 ou 91%, o que significa que as variações de tarifa e renda

explicam 91% da variação da quantidade demanda de energia. O F deu 47,99.
Como seu F de significação (0,0000819) que equivale ao valor-p dos parâmetros
é bem menor que 5%, também podemos dizer que o R2 ajustado é diferente de
zero e, pelo menos, um dos parâmetros estimados é diferente de zero.
Questão 7:
A quantidade demanda de energia estimada para o ano de 1991 seria 113,33.
169

Capítulo 2
Questão 1:
A regressão que representa o modelo é a seguinte:
Questão 2:
Passo 1: Defasar a variável Y:
170

Econometria
Passo 2: Regredir as variáveis:
Passo 3: Escrever a função de regressão:
R2 ajustado= 0,99 F= 682,39*

(0,83) (4,07)* (3,01)*
Passo 4: Analisar o modelo:
Ambos os parâmetros passam no teste, apenas o intercepto não passa no teste

t, mas como a função não será prejudicada se o intercepto for zero, ou seja, a
reta passar na origem, relevamos este resultado. Como a inclusão da variável
dependente com uma defasagem passa no teste t, significa que faz sentido o
pressuposto que os estoques hoje dependem do estoque de t-1, no caso do ano
anterior. O R2 deu muito bom, 0,99, o que significa que 99% das variações de Y
são explicadas por Xt e Yt-1, resultando em apenas 1% de erro no modelo. O F
também passa.
Passo 5: O modelo serve para previsão?
Sim, por conta dos bons resultados dos testes.
Questão 3:
Sim, porque a inclusão de variáveis defasadas captam a mudança da variável

no tempo. O tempo na economia tem impactos nos resultados de políticas
econômicas e nas variáveis envolvidas.
171

Questão 4:
Questão 5:
A regressão que representa o modelo é a seguinte;
R2 = 0,06
(0,97) (0,86)
Questão 6:
Como a dummy deve afetar o intercepto, a forma de inclusão é a aditiva.
Dummy = 0 (períodos de não greve)
Dummy = 1 (períodos de greve)
Na tabela:
Mês Q P D
1 98 0,79 0
2 100 0,80 0
continua...
172

Econometria
3 103 0,82 0
4 105 0,82 0
5 80 0,93 1
6 87 0,95 1
7 94 0,96 1
8 113 0,88 0
9 116 0,88 0
10 118 0,90 0
11 121 0,93 0
12 123 0,94 0
13 126 0,96 0
14 128 0,97 0
Questão 7:
Como a dummy deve afetar o coeficiente angular, a forma de inclusão é a

multiplicativa.
Dummy = 0 (períodos de não greve)
Dummy = 1 (períodos de greve)
Na tabela:
Mês Q P D PD
1 98 0,79 0 0
2 100 0,80 0 0
3 103 0,82 0 0
4 105 0,82 0 0
5 80 0,93 1 0,93
6 87 0,95 1 0,95
7 94 0,96 1 0,96
8 113 0,88 0 0
continua...
173

9 116 0,88 0 0
10 118 0,90 0 0
11 121 0,93 0 0
12 123 0,94 0 0
13 126 0,96 0 0
14 128 0,97 0 0
Função:
R2 (ajustado) = 0,98 F=295,83

(-3,47)* (15,65)* (-23,59)*
Análise do modelo:
A partir da função de regressão, podemos concluir que todos os sinais estão

teoricamente corretos. Em relação à oferta de leite e preço, se espera uma
relação positiva, quanto maior preço maior a oferta. Já a dummy que representa
períodos de greve e, portanto, de redução ou total suspensão da produção, se
espera uma relação negativa, ou seja, quanto mais greve menor a produção.
Quanto à confiabilidade, ressalta-se que o coeficiente de determinação é muito

bom, ou seja, as duas variáveis juntas explicam 98% da variação da quantidade
de oferta de leite, o que significa um ótimo poder de explicação.
A hipótese de que as variáveis P e D, conjuntamente, afetam Q é aceita ao nível

de significância de 5%, conforme indica o teste F. Isso significa que, pelo menos,
174

Econometria
uma dessas variáveis influencia significativamente a quantidade demandada, com

uma probabilidade de erro de apenas 5%.
Os três parâmetros passaram no teste t, o que significa que ambos aceitaram H1

ao um nível de significância de 5%.
Questão 8
Podemos perceber que em termos de sinais, ambas são satisfatórias. Já em

relação à significância, percebemos que a primeira equação não representa um
bom modelo, uma vez que nenhum parâmetro passa no teste t e o R2 é muito
baixo, apenas 6%. O que corrobora para importância da ocorrência de greve na
quantidade ofertada deste produto neste período estudado.
Questão 9
Passo1:
Vamos transformar a variável taxa de juros em LN de taxa de juros:
Taxa Juros Mês LNJuros
0,8859 1 -0,12115
0,8212 2 -0,19699
0,9455 3 -0,05604
0,9235 4 -0,07958
0,9659 5 -0,03469
0,9481 6 -0,0533
0,9931 7 -0,00692
0,9999 8 -0,0001
0,9358 9 -0,06635
0,9523 10 -0,04888
0,8987 11 -0,10681
0,8903 12 -0,1162
0,8717 13 -0,13731
0,7943 14 -0,23029
0,8042 15 -0,21791
0,7436 16 -0,29625
175

0,7333 17 -0,3102
0,6709 18 -0,39914
0,668 19 -0,40347
0,6514 20 -0,42863
0,5946 21 -0,51987
Passo 2:
Estimar a função de regressão forma log-lin:
Escrever a função:
(1,01) (-6,17)*
O modelo é bom, passa no teste t e apresenta um poder de explicação de 67%. A

taxa de crescimento, que neste caso é de queda de 2% , corrobora com a reta de
tendência do modelo linear.
176

Econometria
Questão 10
Passo 1:
Estimar a função de regressão:
(57,97)* (23,13)*
Passo 2:
Calculando a variância do erro (resíduos):
Este valor é dado no ANOVA, já que a somatória dos erros é 213.298,36 (SQ) e o
grau de liberdade é 18 (20-2), temos o valor de 11.861,02 (MQ).
177

Passo 3:
Calculo da somatória de X menos a média ao quadrado.
PIB t (t-média)^2
3107,1 1 90,25
3268,6 2 72,25
3248,1 3 56,25
3221,7 4 42,25
3380,8 5 30,25
3533,3 6 20,25
3703,5 7 12,25
3796,8 8 6,25
3776,3 9 2,25
3843,1 10 0,25
3760,3 11 0,25
3906,6 12 2,25
4148,5 13 6,25
4279,8 14 12,25
4404,5 15 20,25
4539,9 16 30,25
4718,6 17 42,25
4838 18 56,25
4877,5 19 72,25
4821 20 90,25
Média 10,50 665
178

Econometria
Passo 4:
Calcular a variância da projeção:
Lembrando que a hipótese é que tF = 21:
Desvio padrão:
Calculando o YF:
Intervalo de confiança de previsão com 95%:
O t com 5% retiramos da tabela t do anexo 1, com 18 de grau de liberdade e 5%

de nível de significância.
(4.984,33 – 252,29) e (4.984,33 + 252,29) = 4.732,04 e 5.236,62
O intervalo de confiança de 95% para YF está entre 4.732,04 e 5.236,62
179

Capítulo 3
Questão 1:
Passo 1: Fazer a regressão linear múltipla:
R2 ajustado = 0,99
(4,04)* (6,14)* (-2,39)*
Passo 2: Calcular o d:
Teste de Durbin Watson
180

Econometria
Passo 3: Comparar o valor d calculado com d tabelado:
n = 18
k = 2 (número de variáveis explicativas)
Consultando a tabela do anexo, temos:
di = 1,046
ds =1,535
4 – ds = 4 – 1,537 = 2,465
4 – di = 4 – 1,100 = 2,954
181

O d calculado é menor que 1,046 e cai na região I, ou seja, o modelo apresenta

autocorrelação positiva.
Questão 2
Calcular o rô:
Para acharmos o rô, precisamos defasar as três variáveis do modelo, como

segue:
Delete a primeira linha antes de regredir:
182

Econometria
Passo 2
Regressão para achar o rô:
ρ=0,62
Passo 3
Transforme as variáveis:
Wt = b0’+ b1 ( Z1t ) + b2 ( Z2t ) + vt
183

Passo 4
Regredir o modelo a partir das variáveis transformadas:
W^ = 4,13 + 0,02Z1 – 0,07Z2 R2 ajustado = 0,96

(3,10)* (4,83)* (-1,16)
Questão 3
W^ = 4,13 + 0,02Z1 – 0,07Z2 R2 ajustado = 0,96

(3,10)* (4,83)* (-1,16)
Podemos perceber que os sinais dos parâmetros b1 e b2 estão corretos, já

que quanto maior for a renda, maior será a quantidade vendida. O índice de
preço também se comporta como o esperado, quanto maior o preço, menor
a quantidade vendida. O R2 ajustado também é um ótimo indicador, já que a
variação das variáveis X explicam 96% da variação de Y. Porém, o problema de
autocorreção afeta a significância do b3, ou seja, o parâmetro IPP não passa no
teste t após as transformações das variáveis, o que indica que o modelo não
serve para a previsão.
184

Econometria
Questão 4
A principal alteração possível de sanar o problema é retirar do modelo inicial a

variável IPP, como segue:
Y^= 6,38 + 0,016PNB R2 ajustado = 0,98

(9,32)* (30,23)*
O resultado é um ótimo modelo para previsão.
Questão 5
Não, para tanto devemos fazer a rodada de testes novamente calculando d,

comparando com os limites inferiores e superiores para o teste. Note que o
k do teste de Durbin agora é 1, isso porque reduzimos o número de variável
explicativa. Porém como os resultado não apresentam contradições entre o R2
ajustado e o testes t, não há indícios que o modelo apresente problemas de
autocorrelação dos resíduos.
Questão 6
a) F
b) V
c) V
d) V
185

Questão 7
Passo 1: Calcular os resíduos dos valores mais baixos:
Valores mais baixos:
Valores mais elevados:
186

Econometria
Graus de liberdade = (30 – 6 – (2*1))/2 = 22/2 = 11
Valor de F(tabelado)
F11/11=2,82
Como F calculado (5,55) é maior que F tabelado (2,82), a amostra apresenta

heteroscedasticidade.
Reestimando o modelo:
Ponderando as variáveis
C/Y 1/Y
0,6875 0,0125
0,7647 0,0118
0,7778 0,0111
0,7400 0,0100
0,7143 0,0095
0,7182 0,0091
0,6957 0,0087
0,7000 0,0083
0,7200 0,0080
0,7308 0,0077
0,7000 0,0071
0,7448 0,0069
0,7333 0,0067
0,7063 0,0063
0,6970 0,0061
0,6667 0,0056
0,6757 0,0054
0,6842 0,0053
0,6750 0,0050
0,6683 0,0049
continua...
187

0,6667 0,0048
0,6364 0,0045
0,6400 0,0044
0,6304 0,0043
0,6333 0,0042
0,7143 0,0041
0,7120 0,0040
0,6923 0,0038
0,7132 0,0038
0,7074 0,0037
188

Econometria
Capítulo 4
Questão 1
Função consumo (1)
Yt = (b0 + b1Yt + mt ) + It ,
Yt - b1Yt = b0 + mt + It,
Yt (1 - b1) = b0 + mt + It
Yt = b0/1 - b1 + mt/1 - b1 + It/1 - b1
Yt = π0 + π1It + w1t (3)
Ct = b0 + b1(Ct + It) + mt
Ct - b1Ct = b0 + b1It + mt
Ct (1- b1) = b0 + b1It + mt
Ct = b0/1- b1 + b1It/ 1- b1+ mt/ 1- b1
Ct = π2 + π3It + w2t (4)
189

Questão 2
Passo1 : estimar as funções reduzidas
Função renda:
Yt = π0 + π1It + w1t
Função consumo:
Ct = π2 + π3It + w2t
190

Econometria
Questão 3
Método de mínimos quadrados indiretos
Funções estruturais:
Função consumo (1)
Funções reduzidas:
Yt = π0 + π1It + w1t (3)
Ct = π2 + π3It + w2t (4)
Funções reduzidas estimadas:
Calculando os parâmetros pelo método dos mínimos indiretos:
Substituindo os parâmetros calculados na função consumo:
191

192

Considerações Finais
A teoria econômica apresenta várias formas de avaliar as variáveis econômicas.

Teoricamente, no campo da microeconomia e da macroeconomia temos vários
modelos matemáticos possíveis de averiguação empírica. A Econometria é a
ciência que permite estudar esses modelos e, a partir de um conjunto de variáveis
independentes, prever o comportamento futuro de uma variável independente.
A previsão é uma poderosa forma de resolver problemas, assim sendo, saber

elaborar uma boa previsão e variável uma econômica permite uma tomada
de decisão eficiente. Na atualidade, uma boa previsão minimiza erro e, por
consequência, minimiza custos e agiliza a tomada de decisão.
A econometria permite usar as ferramentas estatísticas com teoria econômica e

séries históricas, ou seja, séries temporais, como estudamos o comportamento
das variáveis ao longo do tempo. Essa análise de comportamento no tempo
permite um prognóstico das variáveis no futuro.
Esperamos que, com o que foi estudado nesta disciplina, você possa ter suporte
para análises e tomadas de decisões. Sucesso!
Prof. Joseane Borges de Miranda
193

Referências
ANDERSON, David R. Estatística Aplicada à Administração e Economia. São

Paulo: Pioneira Thomson Learning, 2002.
BARBETTA, Pedro Alberto. Estatística aplicada às Ciências Sociais. 4.ed.

Florianópolis: Ed. Da UFSC, 2001.
CARMO, Heron E. do; DIAZ, Maria Dolores M. In: VASCONCELLOS, M. S. de e

ALVES, D. (org.) Manual de Econometria. SP: Atlas, 2000.
GUJARATI, Damodar N. Econometria básica. São Paulo: Makron Books, 2011.
HILL, R. Carter; GRIFFITHS, William E.; JUDGE, George G. Econometria. São

Paulo: Saraiva, 2010.
MADDALA, G. S. Introdução a econometria. Rio de Janeiro: Prentice-Hall do

Brasil, 1992.5.
MATOS, Orlando Carneiro de. Econometria básica: Teoria e aplicações. São

Paulo: Atlas, 200.
SARTORIS, Alexandre. Estatística e Introdução à econometria. São Paulo:

Saraiva, 2003.
195

Sobre a Professora Conteudista
Joseane Borges de Miranda

é natural de Imbituba. É bacharel Ciências Econômicas na UFSC em 1998, seu
TCC objetivou analisar o Impacto da política cambial sobre os preços agrícolas
em Santa Catarina. É pós-graduada em Economia Industrial pela Universidade
Federal de Santa Catarina (2000), sua dissertação de Mestrado foi focado
nos aspectos macroeconômicos da competitividade sistêmica no setor de
revestimento de Santa Catarina. Créditos de doutorado do programa de pós-
graduação da UFSC chamado EGC (Engenharia e Gestão do Conhecimento),
a área de conhecimento é Engenharia do Conhecimento. É professora há
mais de 12 anos da disciplina Econometria nos cursos de Economia. Na
Unisul é professora presencial da Engenharias de Produção, Civil e Ambiental.
A maioria das disciplinas ministrada são de Probabilidade e Estatística,
Macroeconomia . Na UV (Unisul Virtual) é professora on-line das disciplinas de
Gestão do Conhecimento, Finanças Internacionais, Probabilidade e Estatística
e Econometria. É co-autora do Livro de Matemática nas Ciências Sociais, é
autora dos Livros: Engenharia Econômica; Econometria I e Econometria II e
coordenadora do curso de bacharelado “Ciências Econômicas” da UV.
197

econometria.pdf 1 13/01/16 10:00
w w w. u n i s u l . b r

(8814 - 28949) Econometria Livro Completo

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

(8814 - 28949) Econometria Livro Completo

Enviado por

Direitos autorais:

Formatos disponíveis

econometria.

pdf 1 13/01/16 10:00

book_econometria.indb 1 13/01/16 11:27

Universidade do Sul de Santa Catarina – Unisul

Pró-Reitor de Ensino, de Pesquisa e de Extensão

Diretor do Campus Universitário de Tubarão

Campus Universitário UnisulVirtual

Unidade de Articulação Acadêmica (UnA) – Ciências Sociais, Direito, Negócios e Serviços

Gerente de Operações e Serviços Acadêmicos

book_econometria.indb 2 13/01/16 11:27

book_econometria.indb 3 13/01/16 11:27

Professora conteudista Diagramador(a)

Designer instrucional Revisor(a)

Projeto gráfico e capa

1. Econometria. 2. Análise de regressão. I. Schulze, Carmelita. II.

Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

book_econometria.indb 4 13/01/16 11:27

Sobre a Professora Conteudista | 163

book_econometria.indb 5 13/01/16 11:27

Ferramentas estatísticas são poderosas aliadas para avaliação e tomada de

Ou seja, os dados passados das variáveis envolvidas na análise determinam um

Além de como calcular a função de regressão, vamos introduzir algumas

Também estudaremos modelos em que teremos mais de uma equação

A aplicação de modelos econométricos requer conhecimentos prévios de teoria

book_econometria.indb 7 13/01/16 11:27

Apesar de dificilmente resolvermos problemas reais em uma economia moderna

Você também vai aprender a utilizar o Excel para estimar os parâmetros

A econometria é uma poderosa ferramenta de análise e principalmente

Portanto, econometria envolve o cálculo dessas variáveis, geralmente com a

book_econometria.indb 9 13/01/16 11:27

A econometria tem se tornado fortemente identificada com a análise de

Tomando em conta a amplitude de atuação da econometria, podemos

A teoria econômica nos proporciona uma base para identificar variáveis

•• Qual a relação entre a quantidade de dinheiro, digamos M1, e o nível

O desafio é como combinar a teoria econômica com a informação fornecida por

Segundo Gujarati (2011), a econometria refere-se à aplicação da teoria

Segundo Gujarati (2011), a metodologia econométrica tradicional segue o

book_econometria.indb 10 13/01/16 11:27

a. formulação da teoria ou da hipótese;

De acordo com o autor, podemos esquematizar o aprendizado da econometria a

•• Tudo começa com um problema.

book_econometria.indb 11 13/01/16 11:27

•• Se não se obteve convergência entre os modelos econômicos e os

Gujarati (2011) dá-nos um exemplo de formulação da teoria ou da hipótese de um

A partir da teoria de Keynes, sabemos que o indivíduo, em média,

A relação entre consumo e renda é positiva, porém, não se sabe de

Conforme apresentado acima, y = despesa de consumo e x = renda,

O coeficiente de declividade b1 mede a PMgc. A variável que aparece

Depois de identificarmos uma teoria econômica plausível para nosso modelo de

book_econometria.indb 12 13/01/16 11:27

Segundo Gujarati (2011), o modelo puramente matemático da função consumo

Para admitir relações inexatas entre as variáveis econômicas, o econometrista

em que e, conhecido como termo de perturbação ou erro, é uma variável

A equação (2) é um exemplo de modelo econométrico, tecnicamente um modelo

Gráfico 1.1 – Diagrama de dispersão (XY)

Fonte: Elaborado pelo autor (2012).

book_econometria.indb 13 13/01/16 11:27

Para reforçar a especificação do modelo, vamos ver os conceitos de Hill et

Como qualquer tomada de decisão que ocorre em um mundo dinâmico,

•• Probabilidade de quanto? Grandeza.

Num modelo estatístico, a primeira coisa a considerar é que as relações

Por exemplo, se acharmos que há um relacionamento entre a renda r e o

Assim, o modelo matemático da função consumo agregado é acrescido do termo