Você está na página 1de 199

econometria.

pdf 1 13/01/16 10:00

w w w. u n i s u l . b r
Universidade do Sul de Santa Catarina

Econometria

UnisulVirtual
Palhoça, 2016

book_econometria.indb 1 13/01/16 11:27


Créditos

Universidade do Sul de Santa Catarina – Unisul


Reitor
Sebastião Salésio Herdt
Vice-Reitor
Mauri Luiz Heerdt

Pró-Reitor de Ensino, de Pesquisa e de Extensão


Mauri Luiz Heerdt
Pró-Reitor de Desenvolvimento Institucional
Luciano Rodrigues Marcelino
Pró-Reitor de Operações e Serviços Acadêmicos
Valter Alves Schmitz Neto

Diretor do Campus Universitário de Tubarão


Heitor Wensing Júnior
Diretor do Campus Universitário da Grande Florianópolis
Hércules Nunes de Araújo
Diretor do Campus Universitário UnisulVirtual
Fabiano Ceretta

Campus Universitário UnisulVirtual


Diretor
Fabiano Ceretta

Unidade de Articulação Acadêmica (UnA) – Ciências Sociais, Direito, Negócios e Serviços


Amanda Pizzolo (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Educação, Humanidades e Artes
Felipe Felisbino (coordenador)
Unidade de Articulação Acadêmica (UnA) – Produção, Construção e Agroindústria
Anelise Leal Vieira Cubas (coordenadora)
Unidade de Articulação Acadêmica (UnA) – Saúde e Bem-estar Social
Aureo dos Santos (coordenador)

Gerente de Operações e Serviços Acadêmicos


Moacir Heerdt
Gerente de Ensino, Pesquisa e Extensão
Roberto Iunskovski
Gerente de Desenho, Desenvolvimento e Produção de Recursos Didáticos
Márcia Loch
Gerente de Prospecção Mercadológica
Eliza Bianchini Dallanhol

book_econometria.indb 2 13/01/16 11:27


Joseane Borges de Miranda

Econometria

Livro didático

Designer instrucional
Carmelita Schulze

UnisulVirtual
Palhoça, 2016

book_econometria.indb 3 13/01/16 11:27


Copyright © Nenhuma parte desta publicação pode ser reproduzida por
UnisulVirtual 2016 qualquer meio sem a prévia autorização desta instituição.

Livro Didático

Professora conteudista Diagramador(a)


Joseane Borges de Miranda Pedro Teixeira

Designer instrucional Revisor(a)


Carmelita Schulze Diane Dal Mago

Projeto gráfico e capa


Equipe UnisulVirtual

330.015195
M64
Miranda, Joseane Borges de
DEconometria : livro didático / Joseane Borges de Miranda ; design
instrucional Carmelita Schulze. – Palhoça : UnisulVirtual, 2016.
212 p. : il. ; 28 cm.

Inclui bibliografia.

1. Econometria. 2. Análise de regressão. I. Schulze, Carmelita. II.


Título.

Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul

book_econometria.indb 4 13/01/16 11:27


Sumário

Introdução | 7

Capítulo 1
Análise de Regressão | 9

Capítulo 2
Técnicas adicionais de análise de regressão | 49

Capítulo 3
Problemas de regressão | 101

Capítulo 4
Equações simultâneas | 135

Considerações Finais | 159

Referências | 161

Sobre a Professora Conteudista | 163

book_econometria.indb 5 13/01/16 11:27


book_econometria.indb 6 13/01/16 11:27
Introdução

Ferramentas estatísticas são poderosas aliadas para avaliação e tomada de


decisão. Nos dias atuais, além de tomar decisões acertadas, há a pressão para
que se reduza cada vez mais o gap de tempo para tomar essas decisões. A
econometria é um conjunto de conhecimentos que apresenta a utilização de
modelos matemáticos e estatísticos para avaliação e tomada de decisões a partir
de dados passados.

Ou seja, os dados passados das variáveis envolvidas na análise determinam um


padrão para prever o futuro. Note que é uma poderosa ferramenta porque, por
exemplo, prever gastos ou receitas futuras é essencial para decisões de qualquer
organização produtiva ou governamental.

Infelizmente, os modelos não são tão fáceis de serem aplicados, ou melhor, são
fáceis de aplicar, porém, devem passar por uma série de testes estatísticos para
sua validação e utilização. Estudaremos os métodos de regressão simples e
múltipla e seus possíveis problemas de consistência dos parâmetros estimados,
assim como aprenderemos a fazer projeção a partir da estimação do modelo.

Além de como calcular a função de regressão, vamos introduzir algumas


especificidades, tais como, defasagem temporal e inclusão de uma variável
dummy, o que aumenta o poder de previsão dos modelos. Incluir o tempo que
capta o efeito de uma variável defasada sobre a variável dependente, é uma
forma de diminuir o erro estocástico do nosso modelo. A variável dummy é uma
variável artificial, que auxilia a captar efeitos de variáveis qualitativas, tais como:
diferença de gênero, idade, entre outros.

Também estudaremos modelos em que teremos mais de uma equação


representativa, as equações simultâneas. Essas nos ajudam nos problemas em
que a variável dependente às vezes também pode ser explicativa.

A aplicação de modelos econométricos requer conhecimentos prévios de teoria


econômica, isso porque as variáveis envolvidas em modelos devem apresentar
relação teórica para maximização da utilidade dos modelos.

Desejo que todos realizem seus estudos com sucesso e muito aprendizado.
Profa. Josiane

book_econometria.indb 7 13/01/16 11:27


book_econometria.indb 8 13/01/16 11:27
Capítulo 1

Análise de Regressão
Seção 1
Introdução à econometria
Inicialmente, vamos entender o que significa a econometria nos estudos das
ciências econômicas. Para isso, destacaremos os principais conceitos discutidos
pela bibliografia pertinente quanto a essa área. Assim, comecemos por entender
o que significa a regressão linear em economia.

Apesar de dificilmente resolvermos problemas reais em uma economia moderna


com apenas uma variável explicativa, ou seja, um (X), vamos começar com o
modelo de regressão linear simples. Fazem parte desse modelo, os seguintes
parâmetros econômicos: o método dos mínimos quadrados, os testes estatísticos
e o teste de hipóteses, que, aqui, será adaptado para os modelos econométricos.

Você também vai aprender a utilizar o Excel para estimar os parâmetros


estudados. Essa é uma ferramenta importante para o desenvolvimento desta
Unidade de Aprendizagem, fica muito difícil estimar modelos múltiplos sem uma
ferramenta de cálculo mais avançada.

A econometria é uma poderosa ferramenta de análise e principalmente


de previsão do comportamento das variáveis econômicas, tanto das que
envolvem os conceitos de macroeconomia, como das que envolvem a
microeconomia.

Portanto, econometria envolve o cálculo dessas variáveis, geralmente com a


utilização de uma planilha eletrônica tipo Excel e conhecimento teórico das
variáveis envolvidas. Iniciaremos com os conceitos que envolvem a aplicação de
econometria nas ciências econômicas, e aplicação em regressão linear simples a
mais corriqueira, e finalizaremos com a aplicação em funções com duas variáveis.

book_econometria.indb 9 13/01/16 11:27


Capítulo 1

A econometria tem se tornado fortemente identificada com a análise de


regressão. Essa relaciona uma variável dependente a uma ou mais variáveis
independentes ou explicativas. Considerando que as relações entre variáveis
econômicas são geralmente inexatas, uma perturbação ou probabilidade de erro
deve ser incluída na função de regressão.

Tomando em conta a amplitude de atuação da econometria, podemos


defini-la integração da teoria econômica, matemática, e técnicas
estatísticas, com o propósito de testar hipóteses sobre fenômenos
econômicos, estimação de coeficientes de relações econômicas, e
projeções ou predições de valores futuros das variáveis ou fenômenos
econômicos.

A teoria econômica nos proporciona uma base para identificar variáveis


econômicas importantes, bem como a compreensão da alocação de recursos
e da determinação de preço em uma economia capitalista. Segundo Hill et al.
(2010), para que essas informações sejam úteis na tomada de decisões, tanto
no âmbito governamental quanto empresarial, precisamos saber mais sobre
as relações entre variáveis econômicas, para responder a questões como as
seguintes:

•• Qual a relação entre a quantidade de dinheiro, digamos M1, e o nível


de atividade econômica?
•• Qual o impacto, no nível de investimento, de uma modificação do
imposto sobre ganhos de capital?
•• Qual o efeito, sobre a distribuição de renda, das modificações na
legislação tributária?

O desafio é como combinar a teoria econômica com a informação fornecida por


dados econômicos para estimar as incógnitas necessárias para a tomada de
decisões, ou seja, responder às questões como as que foram levantadas. Essa é
a função da econometria.

Segundo Gujarati (2011), a econometria refere-se à aplicação da teoria


econômica, matemática e técnicas estatísticas, com o propósito de testar
hipóteses e estimular, e estimar e projetar fenômenos econômicos.

Segundo Gujarati (2011), a metodologia econométrica tradicional segue o


caminho a seguir:

10

book_econometria.indb 10 13/01/16 11:27


Econometria

a. formulação da teoria ou da hipótese;


b. especificação do modelo matemático da teoria;
c. especificação do modelo econométrico da teoria;
d. obtenção de dados;
e. estimativa dos parâmetros do modelo econométrico;
f. teste de hipótese;
g. previsão ou predição
h. utilização do modelo para fins de controle ou política.

De acordo com o autor, podemos esquematizar o aprendizado da econometria a


partir de dados econômicos da seguinte maneira:

•• Tudo começa com um problema.


•• A teoria econômica nos dá uma forma de pensar no problema.
Por exemplo, como utilizaríamos uma função de produção para
determinar a melhor combinação de fatores, o nível ótimo de
produção ou a demanda por um insumo?
•• Essa informação forma um modelo econômico eficiente, que leva em
conta nossas hipóteses fundamentais.
•• O modelo econômico ativo conduz-nos ao modelo estatístico que
descreve o processo pelo qual foram geradas as observações
amostrais, a classificação das variáveis e a forma funcional do
relacionamento.
•• Coletam-se observações amostrais coerentes com o modelo
econômico.
•• Dado o modelo estatístico e as observações amostrais, escolhe-
se ou estabelece-se uma regra de estimação que tenha boas
propriedades estatísticas.
•• Obtêm-se estimativas dos parâmetros desconhecidos com o auxílio
de um software de computador (Excel ou Statistica, dentre outros), a
partir de testes de hipóteses apropriadas.
•• Analisam-se e avaliam-se as consequências estatísticas e
econômicas e as implicações dos resultados empíricos. Por
exemplo, as varáveis explicativas eram todas importantes? Utilizou-
se a forma funcional correta? Que alocação de recursos econômicos
e que resultados de distribuição estão implícitos, e quais as
implicações numa escolha política?

11

book_econometria.indb 11 13/01/16 11:27


Capítulo 1

•• Se não se obteve convergência entre os modelos econômicos e os


dados amostrais, quais são os pontos dúbios em potencial, e quais
são as sugestões para análise e avaliação futuras? Por exemplo,
os dados terão sido inadequados para fundamentar as questões
formuladas? As variáveis no modelo econômico foram classificadas
corretamente e foram apresentadas com os sinais e defasagens
corretos?

Gujarati (2011) dá-nos um exemplo de formulação da teoria ou da hipótese de um


modelo econométrico, a partir de conceitos macroeconômicos. Acompanhe!

A partir da teoria de Keynes, sabemos que o indivíduo, em média,


dispõe-se a aumentar seu consumo quando sua renda aumenta, mas
não tanto quanto o aumento em sua renda, ou seja, a propensão
marginal a consumir (PMgc) – a taxa de variação do consumo – é maior
que zero, mas menor que 1.

A relação entre consumo e renda é positiva, porém, não se sabe de


forma precisa a relação funcional entre os dois. Para Gujarati (2011),
um economista matemático poderia sugerir a seguinte forma da função
consumo Keynesiana:

(1)

Conforme apresentado acima, y = despesa de consumo e x = renda,


em que b0 e b1 , conhecidos como parâmetros do modelo, são,
respectivamente, os coeficientes de intercepto e declividade.

O coeficiente de declividade b1 mede a PMgc. A variável que aparece


à esquerda do sinal de igualdade se chama variável dependente e a
variável (ou variáveis) à direita se chama independente ou explicativa.

Depois de identificarmos uma teoria econômica plausível para nosso modelo de


investigação, podemos especificar o modelo econométrico. Note que diferente
de uma relação matemática direta, na economia temos muitas perturbações, ou
seja, o gasto com consumo além da renda depende de gostos, hábitos e demais
subjetividades difíceis de serem mensuradas, e é aí que entra o erro estatístico,
como veremos a seguir.

12

book_econometria.indb 12 13/01/16 11:27


Econometria

Segundo Gujarati (2011), o modelo puramente matemático da função consumo


dado pela equação (1) tem interesse restrito para o econometrista, uma vez que
supõe uma relação exata ou determinista entre consumo e renda. Assim, se
quisermos obter dados sobre despesa de consumo e renda disponível (isto é,
após descontados os impostos) de uma amostra de 500 famílias, e representar
graficamente esse dados, com a despesa de consumo no eixo vertical e a
renda disponível no eixo horizontal, não podemos esperar que todas as 500
observações se situem exatamente na reta da equação (1). Isso porque, além da
renda, outras variáveis afetam o consumo. Por exemplo, o tamanho da família,
as idades de seus membros, a religião etc., provavelmente exercem alguma
influência sobre o consumo.

Para admitir relações inexatas entre as variáveis econômicas, o econometrista


modificaria a função consumo determinista (1) da seguinte forma:

(2)

em que e, conhecido como termo de perturbação ou erro, é uma variável


aleatória (estocástica), que possui propriedades probabilísticas bem definidas.
O termo de perturbação e pode representar bem todos os fatores que afetam o
consumo, mas que não são considerados explicitamente.

A equação (2) é um exemplo de modelo econométrico, tecnicamente um modelo


de regressão linear. A função consumo econométrica adota como hipótese que
a variável dependente Y (consumo) se relaciona linearmente com a variável
explicativa X (renda), mas que a relação entre os dois não é exata; está sujeita à
variação individual.

Graficamente temos:

Gráfico 1.1 – Diagrama de dispersão (XY)

Fonte: Elaborado pelo autor (2012).

13

book_econometria.indb 13 13/01/16 11:27


Capítulo 1

Para reforçar a especificação do modelo, vamos ver os conceitos de Hill et


al. (2010), que além da relação renda e consumo, trabalha com mais algumas
relações econômicas.

Como qualquer tomada de decisão que ocorre em um mundo dinâmico,


os valores presentes, passados e futuros (esperados) dos preços podem
desempenhar papel relevante na formulação do modelo econômico de reação da
oferta.

•• Probabilidade de quanto? Grandeza.


•• Os valores de parâmetros econômicos não são conhecidos e devem
ser estimados por meio de uma amostra de dados econômicos, não
são os valores verdadeiros.

Num modelo estatístico, a primeira coisa a considerar é que as relações


econômicas não são exatas.

Hill et al. (2010) acredita que para expressarmos nossas ideias sobre relações
entre variáveis econômicas (baseadas na teoria econômica), lançamos mão do
conceito matemático de função.

Por exemplo, se acharmos que há um relacionamento entre a renda r e o


consumo c, que nos diz que o nível de consumo é uma certa função ,
ou , quantidade ofertada de um bem depende do preço.

Assim, o modelo matemático da função consumo agregado é acrescido do termo


e (erro). E, portanto, .

O erro aleatório expresso por e não só responde pelos diversos fatores que
afetam o consumo e que omitimos nesse modelo simples, como também reflete a
incerteza intrínseca na atividade econômica.

Modelo matemático

Modelo econométrico

Por inferência, queremos dizer que a utilização de informação contida com uma
amostra de dados pode “inferir” alguma coisa sobre o mundo real.

Para aplicarmos o modelo especificado após termos a forma funcional que


representa esta relação econômica, temos que obter os dados para trabalhar. Na
econometria, quanto maior a amostra melhor os resultados. Estamos falando
de algo maior que trinta dados, isso não significa que amostras menores não
possam ser trabalhadas.

14

book_econometria.indb 14 13/01/16 11:27


Econometria

Grandes fontes de dados macroeconômicos são os sites do governo


brasileiro, tais como o IBGE, IPEA, entre tantos outros. Já para dados
microeconômicos, a fonte RAIS é muito útil.

Agora que já sabemos os objetivos da econometria e sua função, temos que


exercitar estimando inicialmente um modelo simples e linear.

Seção 2
Análise de regressão linear simples
Conforme Barbetta (2001), a análise de regressão estuda a relação causal entre
uma variável econômica a ser explicada (variável dependente Y) e uma ou mais
variáveis independentes ou explicativas (X).

Quando há uma única variável explicativa, nós temos uma regressão


simples. E quando temos mais de uma variável explicativa, temos uma
regressão múltipla.

O termo regressão, conforme é compreendido na Economia, surgiu fora dessa


área, com os trabalhos de Galton, por volta de 1885. Esses trabalhos procuravam
explicar certas características de um indivíduo a partir das características de
seus pais. Ele acreditava que os filhos de pais excepcionais com respeito à
determinada característica também a possuiriam, porém, numa intensidade,
geralmente, menor do que a média de seus pais.

A seguir vamos desenvolver a aplicação de regressão e explicar o método


desenvolvido.

a) Modelo linear de duas variáveis


Imagine duas variáveis Y e X (que poderiam ser, por exemplo, preço e consumo
de um produto), ou quaisquer duas variáveis que, supostamente, tenham relação
entre si. Em que X é a variável independente e Y a variável dependente, isto é, Y
que é afetado por X, e não o contrário. O processo de encontrar a relação entre
Y e X é chamado de regressão. Se esse processo é uma reta, é uma regressão
linear. E, se houver apenas uma variável independente (só tem um X), é uma
regressão linear simples. Para expressar isso, temos a seguinte fórmula:

Modelo estatístico: (1)

15

book_econometria.indb 15 13/01/16 11:27


Capítulo 1

Sempre usamos a forma geral com o sinal de mais, ou seja, uma relação
positiva de X e Y, porém, o sinal do coeficiente de inclinação depende dos
cálculos desse parâmetro, como veremos ao desenvolver a aplicação do
modelo de regressão linear simples.

Podemos também substituir o Y pela letra inicial da variável envolvida, o mesmo


para X. Exemplo: consumo depende da renda, então, Y pode ser substituído por
C (consumo) e renda por r ou Yn renda nacional, do modelo Keynesiano.

Supõem-se que o termo erro ( ) seja:

1. Normalmente distribuído.
2. Com média ou valor esperado igual a zero: E( )=0
3. A variância do termo erro é constante em cada período e para todos
os valores de X, isto é:
Sumarizando:

4. O valor que o termo erro assume em um período é não


correlacionado com seu valor em algum outro período, isto é:
E( )=0 para i≠j com i, j=1,2,3,....,n
Essa hipótese assegura que o valor médio de Y depende somente de X e não de
e.

b) Método de mínimos quadrados (MMQ)


O MMQ é uma técnica para ajustamento da “melhor” linha reta para as
observações amostrais de XY. Ele envolve a minimização da soma dos quadrados
dos desvios (verticais) dos pontos em relação à reta:

(2)

Em que refere-se às observações reais e refere-se aos valores estimados


correspondentes, sendo que = ei (erro).

Note que o Y sem o chapéu é o Y verdadeiro, representa os dados da amostra


que estamos trabalhando e permitirá estimar a função para esses dados. Bom,
se voltarmos ao passado com a função estimada a partir dos dados reais, vamos
perceber o quanto o nosso modelo erra em relação aos dados verdadeiros. Se
parece com uma prova real e queremos que o erro seja minimizado, porque
quanto menor o erro do modelo, mais perto da realidade estará a nossa previsão.

Esse processo leva às duas equações seguintes:

(3)

16

book_econometria.indb 16 13/01/16 11:27


Econometria

(4)

Dado que: e , e deve se as médias de X e Y. A equação


estimada de regressão, por meio dos mínimos quadrados (MMQ), é então:

(5)

Tanto os parâmetros como as variáveis com um chapéu (^) em cima


são parâmetros estatísticos, ou seja, não são os dados verdadeiros que
coletamos e sim os calculados pelo método que escolhemos. Representam
os valores estimados.

Propriedade dos estimadores de MMQ


•• O estimador mede a variação em Y para variação de uma unidade
em X1.
•• e são BLUE (Best Linear unbiased estimator) ou seja, os
estimadores de MMQ são os melhores estimadores lineares não
viesados.
•• Não apresentar viés significa: , ou seja, Viés = .
•• Um melhor estimador não viesado ou eficiente significa um
estimador de menor variância.
•• Desse modo, os estimadores de MMQ são os melhores entre todos
os estimadores lineares não viesados. Isto é, conhecido como o
teorema Gauss-Markov, e representa a mais importante justificativa
para utilizar-se o MMQ.
•• Um estimador é consistente se, quando o tamanho da amostra no
limite se aproxima do infinito, seu valor se aproxima do verdadeiro
parâmetro e sua distribuição colide com o verdadeiro parâmetro.

Depois de calcular a função de regressão, temos que fazer alguns testes


estatísticos para utilizar o modelo para previsão. Antes de estudar esses testes
vamos calcular um exemplo.

17

book_econometria.indb 17 13/01/16 11:27


Capítulo 1

Exemplo:
A Tabela 1.1 mostra as toneladas de milho por hectare, Y, resultantes
do uso de vários montantes de fertilizantes em Kg por hectare, X,
produzidos em uma fazenda, em 10 anos, de 2001 a 2011.

Tabela 1.1 – Milho produzido e fertilizante utilizado

Ano Yi Xi

2001 40 6

2002 44 10

2003 46 12

2004 48 14

2005 52 16

2006 58 18

2007 60 22

2008 68 24

2009 74 26

2010 80 32

Fonte: Elaborado pelo autor (2012).

Passo 1:

Vamos colocar os dados no diagrama de dispersão (Gráfico 1.2). A


relação entre X e Y no Gráfico 2 é aproximadamente linear (isto é, os
pontos poderiam cair sobre ou próximo de uma linha reta).

Xi Yi

6 40

10 44

12 46

14 48

16 52
continua...

18

book_econometria.indb 18 13/01/16 11:27


Econometria

18 58

22 60

24 68

26 74

32 80

Gráfico 1.2 – Demonstração da dispersão dos dados

Fonte: Elaborado pelo autor (2012).

Para inserir a linha de tendência, clique com o botão direito do seu


mouse (no Excel) e escolha a forma linear, em seguida, clique em ok.

Não é necessário plotar o gráfico sempre, mas é mais uma forma de


identificação da correlação das variáveis. Deve ser usado no caso de
surgir alguma dúvida ou falta de subsídios teóricos para determinar a
relação das variáveis estudadas.

Passo 2:

Para estimar a função de regressão vamos calcular os parâmetros.

19

book_econometria.indb 19 13/01/16 11:27


Capítulo 1

Calcular os parâmetros b0 e b1:

Figura 1.1 – Demonstração dos cálculos de b0 e b1 no Excel

Fonte: Elaborado pelo autor (2012).

Nosso objetivo é calcular o b1 primeiro, portanto, vamos precisar da


média de Y e X para calcular os desvios x e y (minúsculo):

Figura 1.2 – Notas informativas no Excel

Fonte: Elaborado pelo autor (2012).

Note que você pode calcular as colunas posteriores usando sua


calculadora científica, ou funções do Excel, porém, na regressão
múltipla não será possível esta simplificação de cálculo.

20

book_econometria.indb 20 13/01/16 11:27


Econometria

para iniciar uma operação matemática no Excel, sempre use = (igual)


para dividir use / (barra); e para multiplicar * (asterisco); para elevar a
potência 2, por exemplo, ^2 ou 3 ^3.

Agora que temos todas as somatórias necessárias para resolver as


equações de b0 e b1 estimadas, vamos calcular!

Da tabela apresentada na Figura 1.2, temos que a soma da coluna x


vezes y é 956 e que a soma da coluna de x ao quadrado é 576, note que
se utiliza-se o x e y minúsculo. Esses dados transpostos para a fórmula
b1 resultam no seguinte:

Agora que calculamos o coeficiente de inclinação, podemos calcular o


intercepto:

Passo 3:
Depois de calcularmos os parâmetros, podemos escrever a função que
representa esse exemplo:

Note que na função geral escrevemos o erro, na função calculada ou


estimada o erro desaparece, então, temos:

Estamos estimando uma função e não apenas números, então, o X inicial


permanece na função e a partir desses parâmetros e do valor da variável
X podemos calcular o Y para 2011, se, por exemplo, o X for igual 35,
como segue:

Porém, só poderemos investir nesse resultado após os testes


de significância e de determinação. O teste de significância nos
demonstrará se os parâmetros são estatisticamente diferentes de zero
e o coeficiente de determinação vai indicar o poder de explicação da
variação de X sobre a variação de Y.

21

book_econometria.indb 21 13/01/16 11:27


Capítulo 1

Esses testes nos asseguram uma margem de erro aceitável para


estimação, então, além de estimar a função nosso objetivo final é atestar se
a função serve ou não para previsão
. <fim de destaque>

c) Testes de significância dos parâmetros estimados


A fim de testar a significância estatística dos parâmetros estimados da regressão,
precisamos da variância de e .

As estimativas não viesadas da variância de e são dadas por:

Desvio padrão ou erros


Parâmetros Variância
padrões das estimativas

(intercepto)

(coeficiente angular)

Note que a variância é muito parecida com a variância dos nossos casos mais
simples de estatística, assim como o desvio padrão tem o mesmo conceito, ou
seja, é a raiz quadrada da variância.

Desde que o erro (ei) é normalmente distribuído, Yi e portanto, e são também


normalmente distribuídos, e podemos usar a distribuição t com n-k graus de
liberdade, para testar hipóteses e construir intervalos de confianças para e .

A ideia é que quanto menor a variância, melhor. Dessa forma, os dados são mais
concentrados e menos dispersos, mais dispersos significam mais longe da nossa
reta de regressão que é a estimativa da verdadeira reta que representa todos os
verdadeiros valores de X e Y.

Como não podemos trabalhar com os verdadeiros valores das variáveis no futuro
usamos o método da regressão para estimar essa função. Menos variância
resultará em t calculado maior, aumentando a chance do parâmetro não aceitar
a hipótese nula do teste. Nosso objetivo é que ambos os parâmetros passem no
teste t, ou seja, aceitem o H1 e rejeitem o H0.

Como calcular e ?

22

book_econometria.indb 22 13/01/16 11:27


Econometria

Já temos os valores de b0 e b1, então, precisamos dos valores dos desvios


padrões para calcular t.

Exemplo:
Continuando nosso exemplo, a Tabela 1.1 – Milho produzido e fertilizante
utilizado, mostra as toneladas de milho por hectare Y, resultantes do uso
de vários montantes de fertilizantes em KG por hectare X, produzidos em
uma fazenda, em 10 anos, de 2001 a 2010.

Temos que calcular as somatórias que faltam em ambas as equações


da variância. A primeira é a do erro ao quadrado. Para calcularmos o
erro (e), temos que calcular a função Y^ para cada X da tabela. Depois,
devemos subtrair o verdadeiro Y destes estimados. Temos também de
elevar o X maiúsculo ao quadrado. Note a diferença, X maiúsculo é um
dado verdadeiro e o minúsculo é o desvio, ou seja, o X menos a sua
média.

No Excel fica assim:

Figura 1.3 – Demonstração do cálculo do erro

Fonte: Elaborado pelo autor (2012).

O primeiro valor de Y^ é:

=27,12 +1,66*C2 (dar enter e arrastar para os demais valores)

23

book_econometria.indb 23 13/01/16 11:27


Capítulo 1

O primeiro valor de e (erro):

=B2-H2

O primeiro valor de e^2:

=I2^2

O primeiro valor de X^2:

=C2^2

Calculando as variâncias no Excel:

Figura 1.4 – Demonstração do cálculo do erro

Fonte: Elaborado pelo autor (2012).

Na calculadora:

Agora vamos fazer o mesmo para a variância do coeficiente de


inclinação:

24

book_econometria.indb 24 13/01/16 11:27


Econometria

No Excel fica assim:

Figura 1.5 – Demonstração do cálculo da variância de b1

Fonte: Elaborado pelo autor (2012).

Na calculadora fica assim:

Calculando o desvio padrão:

Calculando o t:

Com os valores do teste t calculado a partir dos dados do nosso


problema, podemos montar a curva normal para fazer o teste. Vamos
sempre usar o teste bilateral, isso significa que vamos sempre aceitar

25

book_econometria.indb 25 13/01/16 11:27


Capítulo 1

valores positivos e também negativos para o t calculado.

Construindo o teste t (student) bilateral

Gráfio 1.3. Gráfico teste t (student) bilateral

Estabelecendo as hipóteses (H):

Para o teste de significância estatística de e , estabelecemos as


seguintes hipóteses, Ho e H1:

Ho : bo = 0 contra H1 : bo ≠ 0

H0 : b1 = 0 contra H1 : b1 ≠ 0

Queremos que os parâmetros aceitem H1 e rejeitem Ho, ou seja,


que fiquem na área de H1. Isso porque os parâmetros devem ser
estatisticamente diferentes de zero. Por exemplo, se b1 não aceita H1 e
seu intervalo de significância admite o zero, então, a função não é valida,
uma vez que qualquer valor de X multiplicado por zero será zero.

O grau de liberdade (gl) é dado por n - k, em que n é o número de


observações ou o tamanho da amostra, e k é o número de parâmetros,
neste caso 2, porque temos bo e b1 no nosso exemplo.

Sempre vamos usar 5% de significância ( ), ou seja, 0,05. Uma tabela


padrão do teste t tem no mínimo três níveis de significância 1%, 5% e
10%, então, vamos o usar o padrão mundial de 5%.

Para o nosso exemplo, o grau de liberdade é gl=10 - 2 = 8.

26

book_econometria.indb 26 13/01/16 11:27


Econometria

Tabela 1.2 – Parte da tabela de distribuição t de Student (teste bilateral)

Grau de Probabilidade de um valor maior em valor absoluto que o


Liberdade valor tabelado
σ
gl
0,01 0,05 0,10

1 63,657 12,706 6,314

2 9,925 4,303 2,920

3 5,841 3,182 2,353

4 4,604 2,776 2,132

5 4,032 2,571 2,015

6 3,707 2,447 1,943

7 3,499 2,365 1,895

8 3,355 2,306 1,860

Fonte: Elaboração da autora (2012).

Gráfico 1.4 – Teste t para o exemplo

Fonte: Elaboração da autora (2012).

Como a curva é simétrica, o valor tabelado vale tanto para o lado


positivo como para o lado negativo.

Usualmente, após o cálculo dos t’s reescrevemos a função com o


t abaixo do seu respectivo parâmetro. E caso ele passe no teste,
colocamos um asterisco ao lado do teste que passou, como segue:

27

book_econometria.indb 27 13/01/16 11:27


Capítulo 1

(13,70)* (16,60)*

Como tb0 e tb1 calculados excedem t = 2,306 com 8 graus de liberdade,


ao nível de significância de 5%, consideramos que tanto e são
estatisticamente significantes ao nível de 5%. Ambos aceitam H1 e
rejeitam H0, o que torna nossa função inicial confiável até aqui.

d) Teste de qualidade do ajustamento e correlação


Quanto mais próximas as observações caem da linha de regressão (isto é,
menor são os resíduos), maior é a “explicação” da variação de Y pela equação
de regressão estimada. A variação total de Y é igual à variação explicada mais a
variação residual:

Quadro 1.1 – Demonstração das variações

Variação Total de Y (ou Variação explicada de Y (ou Variação residual de Y (ou


soma total quadrados) soma dos quadrados da soma dos quadrados dos
regressão) erros)

VT VER VR

Fonte: Elaborado pelo autor (2012).

Dividindo ambos os lados por VT, temos:

O coeficiente de determinação ou R2 é, então, 1 menos o resultado da divisão


da variação residual de Y sobre a variação total de Y:

R2 pode ser calculada da forma seguinte:

28

book_econometria.indb 28 13/01/16 11:27


Econometria

Em que o R2 varia de 0 (quando a equação da regressão estimada não explica


nada da variação de Y) até 1 (quando todos os pontos se situam sobre a linha de
regressão). Ou de zero por cento a cem por cento.

Calculando o R2 a partir do nosso exemplo:


Para o cálculo do R2, precisamos calcular mais uma coluna na nossa tabela, pois
a fórmula requer y2 (minúsculo):

No Excel:

Figura 1.6 – Demonstração do cálculo do R2

Fonte: Elaborado pelo autor (2012).

Um R2 de 0,97 ou 97% é um resultado muito bom, isso significa que as variações


de X explicam 97% das variações de Y e os demais determinantes que estão no
erro explicam somente 3%.

Como os parâmetros passaram no teste t e o R2 deu alto, sendo que


consideraremos alto ou bom para o modelo R2 acima de 60%, esse não é um
padrão consensual, mas serve como norte para as nossas análises futuras. Outro
fator importante é que devemos ter ambas as condições cumpridas, não basta
passar só no t ou no R2, deve passar em ambos para o modelo ser aceitável para
previsão.

O coeficiente de correlação, r, é dado por:

29

book_econometria.indb 29 13/01/16 11:27


Capítulo 1

r varia de -1 (para correlação linear negativa perfeita) até +1 (para correlação linear
positiva perfeita). Ele é a raiz quadrada do R2, não é utilizado na análise, mas
serve para medir a força da relação entre as duas variáveis, no caso a inclinação
da reta de tendência que plotamos no Gráfico 1.1. Para o nosso exemplo ele foi
0,98, bem perto de um, o que indica uma forte correlação positiva entre o nosso X
e o nosso Y, isso implica que se X aumentar, Y aumentará também.

Escrevendo a equação final após o cálculo do R2:

(13,70)* (16,60)*

Desta forma, dada a análise de t e R2, temos que nosso modelo serve para
previsão.

Aprendemos a calcular passo a passo os parâmetros b0 e b1 de uma regressão


linear simples, verdade que não aparece tão simples assim, mas temos as
alternativas de cálculo à mão, utilizando uma calculadora científica e com Excel.

Além dos parâmetros da regressão, o teste t e o coeficiente de determinação são


conceitos que nos acompanharão até o último capítulo desse livro (ver tabela
do teste bilateral no final do livro, tabela cujo título é Distribuição t de Student
(teste bilateral). A seguir vamos simplificar os cálculos utilizando as ferramentas
de análise do Excel. Esse primeiro procedimento, com seu passo a passo, faz-se
necessário para identificação das variáveis calculadas.

Resolução de regressão linear simples no Excel


Exercitamos nosso exemplo no Excel, porém, calculamos cada etapa de forma
manual. Felizmente, o Excel e outras planilhas eletrônicas possuem o método
dos mínimos quadrados na sua programação, assim podemos obter os mesmos
resultados com apenas um clique.

Voltaremos ao mesmo exemplo do Milho para facilitar a comparação dos


resultados. Note que agora os resultados serão mais apurados, já que o Excel usa
todas as casas decimais possíveis, e na seção anterior arredondamos para duas
casas a maioria dos resultados.

30

book_econometria.indb 30 13/01/16 11:27


Econometria

Exemplo:
Voltando ao nosso exemplo, a tabela mostra as toneladas de milho por
hectare, Y, resultantes do uso de vários montantes de fertilizantes em
KG por hectare, X, produzidos em uma fazenda, em 10 anos, de 2001 a
2010.

Tabela 1.3 – Milho produzido e fertilizante utilizado

Ano Yi Xi

2001 40 6

2002 44 10

2003 46 12

2004 48 14

2005 52 16

2006 58 18

2007 60 22

2008 68 24

2009 74 26

2010 80 32

Fonte: Elaborado pelo autor (2012).

Passo 1:

Digite os dados em uma planilha no Excel.

Passo 2:

Clique em “Dados” e em seguida em “Análise de dados”.

Figura 1.7 – Demonstração das ferramentas do Excel

Fonte: Elaborado pelo autor (2012).

31

book_econometria.indb 31 13/01/16 11:27


Capítulo 1

Após clicar, você terá esta caixa de diálogo:


Figura 1.8 – Análise de dados

Fonte: Elaborado pelo autor (2012).

Procure a ferramenta de análise “Regressão” e dê ok.

Na nova caixa de diálogo, o cursor vai piscar no “intervalo de Y de entrada


de y”, selecione toda a coluna dos valores de Y, inclusive o rótulo (nome
da coluna).

Figura 1.9 – Regressão

Fonte: Elaborado pelo autor (2012).

32

book_econometria.indb 32 13/01/16 11:27


Econometria

Mesmo procedimento para X, selecione o box Rótulos, logo abaixo


na “opções de entrada”, e selecione “Intervalo de saída”. Escolha
uma célula abaixo da planilha para a saída dos dados. Como estamos
comparando dados, vamos selecionar “Resíduos” que é a tradução do
Excel para erro (e). Note que agora o erro já sai na estimativa, mas, como
calculamos antes, também é uma boa maneira de identificá-lo.

Depois clique em ok.

Figura 1.10 – Regressão de saída de dados

Fonte: Elaborado pelo autor (2012).

Passo 3:

Identificar os valores calculados.

Note que os resultados também são usados para regressão múltipla,


que ainda não estudamos, por isso alguns deles vamos, por enquanto,
desprezar.

O primeiro valor R múltiplo = r (coeficiente de correlação) é a raiz quadra


do R2 (R-quadrado), como o Excel não consegue colocar um número
elevado, ele escreve.

ANOVA

A sigla ANOVA significa análise de variância. Agora retornaremos à


análise do ANOVA em regressão simples. Note que gl é o grau de
liberdade, usamos o grau dos resíduos, que resulta de 10 (o tamanho da
amostra) menos k que é 2.

33

book_econometria.indb 33 13/01/16 11:27


Capítulo 1

A SQ (sum of squares), soma dos quadrados, então, a soma do erro


elevado ao quadrado deu 47,31 que confere com nossos resultados
anteriores.

Interseção é a tradução para intercepto, então, todos os resultados


dessa linha referem-se ao b0.

Coeficientes são os valores de b0 e b1, assim, b0 = 27,13 e b1 = 1,66.


Ao lado, ver figura 1.10, temos o desvio padrão, mas note que aqui já
temos os valores de t calculados e por isso não usamos os desvios (erro
padrão). Os t´s calculados são denominados Start t, então tb0 = 13,70 e
tb1 = 16,38.

Também não precisamos dos valores dos erros já que o t está calculado,
mas a ferramenta calcula em caso de necessidade o erro, daí para obter
o quadrado, temos que fazer utilizando o mesmo procedimento anterior.

Figura 1.12 – Cálculo dos erros (resíduos)

Fonte: Elaborado pelo autor (2012).

Note que os valores são muito parecidos com os nossos cálculos


anteriores.

Dessa forma, a partir dos resultados diretos, podemos escrever a forma


funcional, que é o nosso objetivo.

(13,70)* (16,60)*

A análise geral do modelo é a mesma, só o método que é mais rápido.


Mas, lembre-se de que por traz da programação do Excel estão
exatamente as fórmulas que aprendemos anteriormente.

34

book_econometria.indb 34 13/01/16 11:27


Econometria

Seção 3
Análise de regressão linear múltipla
A análise de regressão múltipla é usada para testar hipóteses sobre a relação
entre uma variável dependente, Y, e duas ou mais variáveis independente, X, e
para previsões.

O modelo de regressão linear de três variáveis pode ser escrito como:

(1)

Segundo Gujarati (2011), essa equação fornece o valor esperado de Y,


condicional a valores dados ou fixados das variáveis X1 e X2. Portanto, como
no caso de duas variáveis, a análise de regressão múltipla é uma análise de
regressão condicional a valores fixos das variáveis explicativas, e o que obtemos
é a média ou o valor esperado de Y, ou a resposta média de Y aos valores fixos
das variáveis X.

A hipótese adicional (além daquelas do modelo de regressão imples) é que


não há relação linear exata entre os X’s.

Relembrando os pressupostos do modelo linear


Supõe-se que o termo erro (ei) seja:

1. Normalmente distribuído
2. Com média ou valor esperado igual a zero:
3. A variância do termo erro é constante em cada período e para todos
os valores de X, isto é:
Sumarizando:
4. O valor que o termo erro assume em um período é não
correlacionado com seu valor em algum outro período, isto é:
E( )=0 para i≠j com i, j=1,2,3,....,n

Essa hipótese assegura que o valor médio de Y depende somente de X e não de e.

As estimativas dos parâmetros de mínimos quadrados simples (MMQ) ou


mínimos quadrados ordinários (MQO), para a equação (1), podem ser obtidas pela
minimização da soma dos quadrados dos resíduos (erros):

35

book_econometria.indb 35 13/01/16 11:27


Capítulo 1

(2)

resulta:

(3)

(4)

(5)

1. O estimador mede a variação em Y para variação de uma unidade


em X1, enquanto X2 permanece constante.
2. é analogamente definido.
3. Os estimadores e são chamados de coeficientes parciais da
regressão.
4. , e são BLUE (os estimadores de MMQ são os melhores
estimadores lineares não viesados – Best Linear Unbiased
Estimator)

Não apresentar viés significa: E( ) = b, ou seja, Viés= E( ) – b.

Um melhor estimador não viesado ou eficiente significa um estimador de menor


variância. Desse modo, os estimadores de MMQ são os melhores entre todos
os estimadores lineares não viesados. Isso é conhecido como o teorema Gauss-
Markov, e representa a mais importante justificativa para utilizar-se o MMQ. Um
estimador é consistente se, quando o tamanho da amostra no limite se aproxima
do infinito, seu valor se aproxima do verdadeiro parâmetro e sua distribuição
colide com o verdadeiro parâmetro.

Note que agora as equações se tornam muito mais complexas do que o modelo
de regressão linear simples, por isso, temos que resolver a partir da planilha
Excel.

36

book_econometria.indb 36 13/01/16 11:27


Econometria

Exemplo:

Fez-se um estudo durante vários meses em um bairro de uma grande


cidade, calculando-se o valor médio para o aluguel. Vamos estimar esses
valores como função da atividade econômica (renda) e da taxa de juros
de curto prazo.

Tabela 1.5 – Valor médio de aluguel

Mês/ano Renda Aluguel médio Taxa de juros

Jan./10 294 100 2,1

Fev./10 297 102 2,1

Mar./10 238 98 2,0

Abril/10 219 100 1,8

Maio/10 310 99 1,8

Jun./10 305 87 1,6

Jul./10 257 86 1,7

Ago./10 249 84 1,8

Set./10 253 91 1,8

Out./10 251 92 1,7

Nov./10 327 93 1,6

Dez./10 338 90 1,5

Jan./11 349 95 1,4

Fev./11 365 96 1,2

Mar./11 327 99 1,1

Abril/11 349 102 1,5

Maio/11 344 103 1,7

Jun./11 327 101 1,8

Jul./11 329 105 2,0

Ago./11 469 108 1,9

Fonte: Elaborado pelo autor (2012).

37

book_econometria.indb 37 13/01/16 11:27


Capítulo 1

Passo 1:

Colar ou digitar a tabela no Excel.

Após isso, clique em fx e escolha “regressão”, é o mesmo procedimento


da análise de regressão linear simples, porém, agora selecionaremos
dois X ao mesmo tempo, conforme figura a seguir:
Figura 1.13 – Regressão linear múltipla

Fonte: Elaborado pelo autor (2012).

Clique em ok e obtemos os resultados, conforme Figura 2.2.

Figura 1.14 – Resultados da Regressão.

Fonte: Elaborado pela autora (2012).

38

book_econometria.indb 38 13/01/16 11:27


Econometria

Passo 2:

Vamos escrever a função de regressão múltipla.

Como a primeira etapa é somente escrever a equação de regressão,


apenas transcrevemos os valores dos “coeficientes” da Figura 2.2.

A princípio, podemos dizer que o modelo é coerente com a teoria, já que


quanto maior a renda, há uma tendência de se pagar um aluguel maior,
assim como a relação entre aluguel e taxas de juros também é positiva.

Mas, para validar o modelo temos que fazer o teste t, como segue.

Teste de significância dos parâmetros estimados

O teste t (student) é o mesmo que deduzimos nos cálculos do modelo simples,


porém, note que o gl (grau de liberdade) é dado por n (número de observações da
amostra) menos k (número de parâmetros estimados), então, k agora é 3 ( , e
) o nível de significância é o mesmo, ou seja, 5%.

Temos mais um parâmetro para testar, porém, as hipóteses nula e alternativa do


teste não mudam:

Para o teste de significância estatística de ( , e ), estabelecemos as


seguintes hipótese: a Ho e a hipótese H1.

Ho : bo = 0 H0 : b1 = 0 H0 : b2 = 0

H1 : bo ≠ 0 H1 : b1 ≠ 0 H1 : b2 ≠ 0

As equações que retomam os valores também apresentam o mesmo princípio


para cada parâmetro dividido pelo erro padrão:

Graficamente, também teremos a mesma distribuição discutida para regressão


linear simples, porém, há outra maneira de verificar se o parâmetro passou ou não
sem apelar para o t (tabelado). Para demonstrar isso, vamos retornar ao nosso
exemplo dos aluguéis:

39

book_econometria.indb 39 13/01/16 11:27


Capítulo 1

Figura 1.15 – Cálculo do t

Fonte: Elaborado pelo autor (2012).

Vamos escrever os testes na equação de regressão que representa nosso


modelo:

(4,74)* (3,24)* (2,23)*

Notem que o valor-p de cada coeficiente (grifado) nos dá o percentual do


nível de significância de cada parâmetro. O valor-p é nível de significância
observado. Como nosso limite é 5%, então, todos os resultados abaixo de
5% garantem que o parâmetro passa no teste, portanto, aceita a hipótese
alternativa, ou seja, H1.

No caso do nosso exemplo, para b0 o valor-p é 0,00019 que é menor que 0,05; b1
é 0,00485 que é menor que 5% e b2 é 0,0328 que também é menor, então, todos
os parâmetros passam no teste.

Podemos comparar os valores com o t tabelado para tirar a prova real. Como
temos 20 observações na nossa amostra, o gl será 20 - 3 = 17 então o t tabelado
é 2,110 (vide tabela t).

Notamos que os t’s calculados 4,74, 3, 23 e 2,23 são maiores que o tabelado
2,11, então, todos caíram dentro da área H1 no gráfico da distribuição t, ao lado
direito por serem positivos.

Analisando o modelo
Após calcularmos os testes t, que é uma das condições de aprovação do nosso
modelo de regressão múltipla para previsão do valor futuro do aluguel, podemos
dizer que o modelo é bom, dado que além das relações positivas entre as
variáveis, já mencionadas, todos os parâmetros passaram no t. Os parâmetros
estimados aceitam H1 e rejeitam Ho a um nível de confiança de 5%.

Mas, além de analisarmos os sinais das variáveis e o teste t, temos que calcular o
R quadrado ajustado e coeficiente global de regressão (F), esse é um coeficiente
novo que só é calculado para regressão múltipla.

40

book_econometria.indb 40 13/01/16 11:27


Econometria

Coeficientes de determinação e global


Para completar a análise do modelo de regressão múltipla ainda falta calcular
o coeficiente de determinação. Para tanto, vamos ajustá-lo a partir da equação
da unidade anterior, o ajuste se faz necessário devido à alteração no grau de
liberdade do modelo.

Além, do coeficiente de determinação, vamos estudar o coeficiente de


correlação parcial que, apesar de não ser muito usado na análise geral do
modelo, é uma das medidas estatísticas que demonstra a relação entre as
variáveis X e o Y em questão.

Como temos mais parâmetros envolvidos, ou seja, estimados, além do coeficiente


de determinação, também calculamos o teste F. Esse teste reforça a validade do
teste t e ainda garante que o R2 também é estatisticamente diferente de zero.

O coeficiente de determinação múltipla


O coeficiente de determinação múltipla, , é definido como a proporção da
variação total em Y que é “explicada” pela equação de regressão estimada. Note
que agora escrevemos um traço em cima do R2, isso diferencia o coeficiente de
determinação da regressão múltipla do coeficiente da regressão simples (sem o
traço).

A inclusão adicional de variáveis independentes ou explicativas provavelmente


aumentará o VER para a mesma variação total VT, então o aumenta.

Considerando a redução dos graus de liberdade, quando adicionamos variáveis


independentes ou explicativas, o ajustado, ou , é calculado da forma a
seguir:

(6)

Em que:

n = número de observações e

k = número de parâmetros estimados.

41

book_econometria.indb 41 13/01/16 11:27


Capítulo 1

No nosso exemplo:

Figura 1.16– Cálculo do R quadrado ajustado

Fonte: Elaborado pelo autor (2012).

No Excel é R-quadrado ajustado, no caso, deu 0,36 ou 36%, isso indica que as
variações conjuntas de X1 (renda) e X2 (taxas de juros) explicam somente 36% da
variação de Y (aluguel), resultando em um erro do modelo de estimação de 0,64
ou 64%. Dessa forma, o poder de explicação do erro é maior que os das
variáveis explicativas, assim não podemos usar o modelo para previsão.

Coeficiente de correlação parcial


O coeficiente de correlação parcial mede a correlação líquida entre a variável
dependente e uma variável independente, após a exclusão da influência comum
de outras variáveis independentes do modelo. Por exemplo, ryx1x2 é a correlação
parcial entre y e x1, após removida a influência de x2 tanto de y como de x1.

(7)

(8)

Em que:

ryx1 = coeficiente de correlação entre y e x1

ryx2 e rx1x2 são analogamente definidos.

Os coeficientes de correlação parcial variam em valor de -1 e +1 (como acontece


com os coeficientes de correlação simples), e têm o sinal do parâmetro estimado
correspondente, sendo usados para determinar a importância relativa das
diferentes variáveis explicativas em uma regressão múltipla.

42

book_econometria.indb 42 13/01/16 11:27


Econometria

Para resolver as equações (7) e (8), primeiramente, calculamos os coeficientes de


correlação simples das equações (9, 10 e 11), depois substituímos em 7 e 8:

(9)

(10)

(11)

Como podemos perceber, é muito trabalhoso e colabora pouco para a análise


final do modelo. Caso o pesquisador tenha dúvidas sobre a relação das variáveis
iniciais do seu modelo, é interessante o cálculo do coeficiente de correlação para
se saber a relação causal entre as variáveis.

Distribuição F ver Teste de significância global da regressão


tabela referente ao final
do livro, que faz parte
A significância global da regressão pode ser testada
dos anexos desse pela razão da variância explicada com a variância não
capítulo. explicada. Essa apresenta uma distribuição F com
k-1 e n-k graus de liberdade, em que n é o número de
observações e o k o número de parâmetros estimados:

(12)

Se a razão F calculada excede o valor tabelado Ftabelado a um dado nível de


significância e graus de liberdade, aceita-se a hipótese que os parâmetros da
regressão não são todos iguais a zero, e que R2 é significativamente diferente de
zero. Assim, como em t utilizaremos o nível de significância de 5%.

43

book_econometria.indb 43 13/01/16 11:27


Capítulo 1

No nosso exemplo:
Figura 1.17 – Cálculo do F

Fonte: Elaborado pelo autor (2012).

O F calculado para o nosso exemplo dos aluguéis deu 6,24.

Comparando com o F tabelado, temos:

k -1 = 3 - 1 = 2 e

n - k = 20 -3 = 17,

Note que esses gl estão na nossa tabela ANOVA

Então, temos um F(2/17), não é dois dividido por dezessete e sim uma indicação
para procurar o F na tabela, o numerador (2) é a coluna, e o denominador (17) é a
linha. Note que na mesma linha todos os níveis de significância 0,25, 0,10,0,05 e
0,01.

O F tabelado é 3,59. Como o F calculado 6,24 é maior que 3,59, o teste global da
regressão deu bom.

Note que temos uma contradição: quase todos os procedimentos resultaram


em valores esperados, mesmo o coeficiente de determinação ajustado, esse
que segundo o teste F é estatisticamente diferente de zero. Isso nos indica que
a regressão pode apresentar um problema, ou seja, quebra algum dos preceitos
do modelo. Veremos como testar os problemas de regressão posteriormente em
nossos estudos.

Se o coeficiente de determinação ajustado para o nosso exemplo fosse


superior a 60%, o modelo serviria para previsão. E caso o R2 ajustado fosse
superior a 60%, porém o X2 não passasse no teste, por exemplo, teríamos
que regredir o modelo sem esta variável e analisar novamente.

Análise de variância
Até agora utilizamos vários dados do ANOVA para a análise de variância. Vamos
identificá-los:

44

book_econometria.indb 44 13/01/16 11:27


Econometria

Figura 2.6 – Análise de variância ANOVA

Fonte: Elaborado pelo autor (2012).

Vamos verificar os valores:

gl:
2 = k-1
17 = n-k
19 = n-1

SQ:
SQT (soma dos quadrados tratados) = 351,67
SQE (soma dos quadrados dos erros) = 479,28
SQ (soma dos quadrados) = 830,95

MQ:
MQ (média dos quadrados)
MQT (média dos quadrados tratados)
MQT = SQT/(k-1) = 351,67/ 2 = 175, 84
MQE (média do quadrado dos erros)
MQE = SQE/(n-k) = 479,28/17 = 28,1928

F:
F = MQT/MQE = 175, 836/28,1928 = 6,24
F de significação

O valor-p do teste F nos diz o percentual de significância do teste, no caso,


0,0093 que é menor que 0,05.

45

book_econometria.indb 45 13/01/16 11:27


Capítulo 1

O coeficiente global de regressão, ou seja, o F, ajuda-nos a tomar decisões


sobre a validade de um modelo de regressão múltipla, ou seja, se as variáveis
explicativas são estatisticamente diferentes de zero.

Atividades de autoavaliação
Ao final de cada capítulo, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático. Mas, esforce-se para resolver
as atividades sem ajuda do gabarito, pois, assim, você estará promovendo
(estimulando) a sua aprendizagem.

1. A Tabela 1 mostra a renda disponível do Brasil e o consumo para os anos de


1999-2003.

Tabela 1 – Renda e Consumo

Ano Y X

1999 50 16

2000 54 20

2001 56 22

2002 58 24

2003 62 26

Fonte: Elaborado pelo autor (2012).

a. Estime a função de regressão, utilizando o cálculo parcial.


b. A partir dos dados das duas variáveis do item a, que representam
renda e consumo, calcule o teste t para os parâmetros b0 e b1.
c. Analise os testes calculados. Podemos dizer que o modelo serve
para previsão do consumo no Brasil? Por quê?
d. A partir dos dados das duas variáveis, que representam renda e
consumo, calcule o R2. Analise o resultado.

46

book_econometria.indb 46 13/01/16 11:27


Econometria

2. Escreva a função de regressão entre a exportações do município de


Florianópolis e a taxa câmbio comercial entre reais e dólar norte americano. Utilize
a ferramenta de análise de dados do Excel.

Tabela 2 – Exportações do município de Florianópolis e taxa de câmbio comercial

Ano/Mês Exportação Taxa de


câmbio

  US$ FOB R$/US$

2013  

Maio 1.073.749 2,0233

Junho 551.937 2,1367

Julho 903.001 2,2548

Agosto 760.469 2,3434

Setembro 6.148.015 2,2785

Outubro 2.380.319 2,1818

Novembro 1.258.679 2,3289

Dezembro 3.071.154 2,3354

2014  

Janeiro 1.553.032 2,3470

Fevereiro 2.528.891 2,3924

Março 1.587.785 2,3638

Fonte: Brasil, 2016.

47

book_econometria.indb 47 13/01/16 11:27


Capítulo 1

3. A partir dos dados da tabela ,3 plote o gráfico de dispersão e insira a reta de


tendência linear.

4. Com os dados da tabela 1 estime a equação de demanda por energia elétrica.

Tabela 1– Brasil: índice da quantidade por demanda de energia elétrica (Q), da tarifa média (T) e do
produto real (Y)

Ano 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990

Q 69 76 81 90 94 100 103 108 113 115

T 143 134 117 111 109 100 137 122 85 90

Y 84 85 82 86 93 100 104 104 107 102

Fonte: Matos (1995, p. 92).

5. A partir dos dados da Tabela 1, apresentada na questão anterior, faça os testes


t para os parâmetros estimados do modelo de demanda de energia.

6. A partir do modelo da questão, calcule o coeficiente de determinação ajustado


e o teste F.

7. Vamos supor que para o ano de 1991 a tarifa é 100 e o índice de Y = 106,
quanto seria a quantidade de energia estimada para este ano?

48

book_econometria.indb 48 13/01/16 11:27


Capítulo 2

Técnicas adicionais de análise


de regressão

Seção 1
Defasagens distribuídas
Vamos estudar os motivos teóricos plausíveis para defasar uma variável
explicativa em um modelo de regressão. Para Gujarati (2011), temos três razões
para as defasagens: psicológica, tecnológica e institucional.

A razão psicológica está baseada na dificuldade de as pessoas mudarem de


hábitos. Por exemplo, uma pessoa que se torna milionária pode não mudar seu
estilo de vida com que estava acostumada por um bom tempo, pois pode não
saber como reagir imediatamente a um ganho inesperado. Outro problema é
identificar se uma mudança no mercado ou de aumento de renda é permanente
ou transitória. Se for transitória, posso me comportar de forma conservadora,
poupando o excedente temporário, já outra pessoa pode gastar todo o
excedente.

Quanto à Razão tecnológica temos, por exemplo, o preço do capital em relação


ao trabalho diminuído, tornando economicamente viável a substituição de
trabalho por capital, ou seja, tornando viável diminuir a mão de obra e aumentar o
investimento em máquinas e equipamentos. Essa troca leva tempo, considerando,
por exemplo, que as máquinas sejam importadas. Às vezes, um conhecimento
imperfeito também é responsável por defasagem, por exemplo, a grande
variedade de celulares e de inovação contidas nos novos modelos de aparelhos
para telecomunicação pode fazer com que o consumidor espere mais um pouco
para uma possível queda no preço ou uma maior incorporação de tecnologia a
esses aparelhos.

49

book_econometria.indb 49 13/01/16 11:27


Capítulo 2

Na Razão institucional, por exemplo, os contratos podem impedir as firmas de


mudar de uma fonte de trabalho ou matéria-prima para outra. Outro entrave é se a
firma aplicou seu recursos a longo prazo, nesse caso, a condição para usar esses
recursos fará que a firma perca rendimentos e, por vezes, é impossível dispor
desse montante antes do tempo pré-fixado da aplicação financeira.

Segundo Gujarati (2011), por essas razões, a defasagem ocupa um papel


importante na economia. Isso se reflete na metodologia de curto prazo/
longo prazo da economia. E, por isso, dizemos que a elasticidade-preço
ou a elasticidade-renda a curto prazo são geralmente menores do que as
elasticidades correspondentes a longo prazo, ou que a propensão marginal
a consumir a curto prazo é geralmente menor que a propensão marginal a
consumir a longo prazo.

Segundo Hill et al. (2010), uma mudança no nível de uma variável explanatória
pode ter implicações comportamentais além do período de tempo em
que ocorreram. Por exemplo, quando se aumenta o imposto de renda, os
consumidores passam a ter menos renda disponível, (Yd = Y – T), o que
reduz suas despesas com bens e serviços, que, por sua vez, reduz lucro dos
fornecedores, a demanda por insumos produtivos, os lucros dos fornecedores
de insumo e assim por diante. Os efeitos de um aumento de imposto refletem em
toda a economia, não se manifestando instantaneamente, mas se dispersando,
ou se distribuindo, por períodos futuros de tempo.

Na análise de regressão, se o modelo incluir variáveis defasadas das variáveis


explicativas (X) é chamado de modelo de defasagem distribuída:

(1)

Se o modelo incluir um ou mais valores defasados da variável dependente entre


suas variáveis explicativas, será chamado de modelo autorregressivo:

(2)

Ou

(3)

50

book_econometria.indb 50 13/01/16 11:27


Econometria

Exemplo 1
Gujarati (2011) desenvolve um exemplo da função consumo. Eis o
exemplo: suponha que uma pessoa receba um aumento salarial de
US$ 2.000,00 em sua remuneração anual e que esse aumento seja
permanente. Qual será o efeito deste aumento da renda no consumo
anual da pessoa?

Após o ganho de renda referido no exemplo, as pessoas não gastarão


todo o aumento de renda imediatamente. Vamos supor que a pessoa
decida aumentar seu consumo em US$ 800 no primeiro ano, após o
aumento salarial na renda, em mais US$ 600 no ano seguinte e em
mais US$ 400 no ano subsequente, poupando o resto. Esses valores
são hipotéticos, mas refletem mais ou menos o comportamento do
consumidor de ter um estímulo positivo com o aumento de renda e
também poupar. Então, ao final do terceiro ano, o consumo anual da
pessoa terá aumentado em US$ 1.800.

Podemos escrever a função consumo como segue:

(4)

Em que Y é consumo e X é renda, na notação econômica consumo é C e


renda é Y, não confunda a ordem das variáveis explicativas.

O sinal de X e dos demais defasado é positiva, isso porque quanto mais


renda mais se consome. Essa regra é válida para grande maioria dos
bens, ou seja, para os bens normais.

Os coeficientes 0,4; 0,3 e 0,2 são, respectivamente, os percentuais


relativos da renda ganha, US$ 2.000, a partir da nossa hipótese de
distribuição ao longo do tempo, no caso três anos. Então, gastar US$
800 no primeiro ano significa 40% da renda total, ou seja, 0,4.

A equação (4) mostra que o efeito de um aumento na renda de US$


2.000 se espalha, ou se distribui, ao longo de um período de três anos.
Os modelos do tipo da equação (4) são chamados de modelos de
defasagem distribuídas, pois o efeito de um dado X, no caso renda,
prolonga-se em um número de períodos de tempo (t).

51

book_econometria.indb 51 13/01/16 11:27


Capítulo 2

Geometricamente, o modelo de defasagens distribuídas é mostrado na


Figura 2.1.

Figura 2.1 – Exemplo de defasagen distribuídas, função consumo

Fonte: Gujarati (2011).

Genaralizando o nosso exemplo, temos:

Que é o modelo de defasagem distribuída com defasagem finita de k


períodos de tempo, no caso k = 2. O coeficiente b1 é conhecido como o
multiplicador de curto prazo, porque dá a alteração no valor médio de
Y devido a uma alteração de uma unidade em X, no mesmo período de
tempo.

Matematicamente, b1 é a derivada parcial de Y em relação a Xt, b2 em


relação a Xt-1, e assim por diante. Simbolicamente,

Se a alteração em X for mantida no mesmo nível disso, então, o


(b1 + b2) dá a alteração em valor médio do Y no próximo período e
(b1 + b2 + b3) no período seguinte, e assim por diante. Essas somas
parciais são denominadas de multiplicadores intermediários. A soma
total nos dá o multiplicador de defasagem distribída de longo prazo
ou total. Então, as somas do bi “padronizado” dão a proporção do
impacto de longo prazo (ou total), sentido em certo período de tempo.

52

book_econometria.indb 52 13/01/16 11:27


Econometria

Voltando à equação (4), o multiplicador de curto prazo que é a propensão


marginal a consumir (PMgC) a curto prazo é 0,4, enquanto o multiplicador total ou
a propensão marginal a consumir a longo prazo é 0,4 + 0,3 + 0,2 = 0,9. Ou seja,
seguindo a um aumento de US$ 1 na renda, o consumidor aumentará seu nível
de consumo em cerca de US$ 0,40 no ano do aumento, mais US$ 0,30 no ano
seguinte e mais US$ 0,20 no ano subsequente. Assim, o impacto a longo prazo
de um aumento de US$ 1 na renda é de US$ 0,90. Dividindo cada bi por 0,90
obtemos, respectivamente, 0,44, 0,33 e 0,23, indica que 44% do impacto total de
uma mudança unitária em X sobre Y é sentido imediatamente, 77% depois de um
ano e 100% até o final do segundo ano.

Hill et al. (2010) desenvolve o conceito de modelos de defasagem distribuídas


finita, a partir de um modelo econômico envolvendo as apropriações de capital
e despesas de capital. Vamos às hipóteses com base nessa teoria: os autores
destacam que os investimentos das empresas originam-se de decisões de
apropriação de resultados tomadas em períodos anteriores. As decisões de
apropriação baseiam-se em projeções da lucratividade de projetos alternativos
de investimentos e da comapração da eficiência marginal dos investimentos com
o custo do capital.

Uma vez aprovado um projeto de investimento, apropriam-se, ou aprovam-se


os fundos necessários para tal. Os custos decorrentes de qualquer decisão
de apropriação são observados em trimestres subsequentes, à medida que
se completam os planos. Assim, se Xt é o valor das apropriações de capital
observadas em determinado tempo, podemos estar certos de que os efeitos
dessas apropriações, sob a forma de custos de capital Y, serão distribuídos pelos
períodos t, t+1, t=2 e seguintes, até que os projetos tenham sido completados.
Aqui se destaca também o tempo de maturação para qualquer projeto de
investiemento.

Como as apropriações de capital no instante t, designidas por Xt, afetam os


gastos com investimentos no período corrente e em períodos futuros até que
os projetos apropriados estejam completos, podemos dizer que as despesas
correntes Yt são função da apropriação corrente e de apropriações passadas, Xt,
Xt-1..... O que, numa fórmula, exprime-se assim:

Assim como no exemplo anterior, se supormos uma forma funcional linear,


podemos estimar a função que representa o modelo econômico por mínimos
quadrados:

53

book_econometria.indb 53 13/01/16 11:27


Capítulo 2

Após a estimação, a análise dos resultados segue os parâmetros exigidos de


regressão múltipla. Note que quanto mais defasamos uma variável mais
perdemos informações.

Após discutirmos a importância das defasagens distribuídas na economia, ou


seja, da relevância do tempo ou dos efeitos do tempo para as decisões dos
agentes econômicos, vamos calcular um exemplo passo a passo, utilizando as
ferramentas de análise do Excel.

Exemplo 2
Na Tabela 2.1 temos dados do consumo de um bem normal (C) no
período de janeiro de 2009 a junho de 2010 e os Índices de preços,
no mesmo período. O índice de preço é a proxy da variável inflação. A
hipótese é que quanto maior for a inflação menos as famílias consomem
o bem. Mas, como a inflação não é percebida instantaneamente, vamos
supor uma defasagem de k=3, ou seja, três períodos, no caso, três
meses.

Tabela 2.1 – Consumo e índice de preço

Ano Mês C Índice de Preço

2009 Janeiro 408 132,3

Fevereiro 494 124,6

Março 556 119,4

Abril 659 114,9

Maio 741 106,3

Junho 761 113,2

Julho 795 100,7

Agosto 779 99,9

Setembro 897 100

Outubro 923 100

Novembro 893 84,5

Dezembro 548 91,8


continua...

54

book_econometria.indb 54 13/01/16 11:27


Econometria

2010 Janeiro 556 101,8

Fevereiro 708 94

Março 632 86,2

Abril 702 80

Maio 772 82

Junho 511 98,6


Fonte: Elaboração do autor (2012).

Resolução:

Passo 1:

Vamos escrever a função de regressão admitindo as defasagens


distribuídas do modelo propostos.

Em que Y é consumo e X índice de preço representando inflação.

Passo 2:

Vamos criar a tabela com as variáveis defasadas.

Tabela 2.2 – Defasando a variável IP = índide de preços

Mês/Ano C IP IP t-1 IP t-2 IP t-3

Janeiro 408 132,3

Fevereiro 494 124,6 132,3

Março 556 119,4 124,6 132,3

Abril 659 114,9 119,4 124,6 132,3

Maio 741 106,3 114,9 119,4 124,6

Junho 761 113,2 106,3 114,9 119,4

Julho 795 100,7 113,2 106,3 114,9

Agosto 779 99,9 100,7 113,2 106,3


continua...

55

book_econometria.indb 55 13/01/16 11:27


Capítulo 2

Setembro 897 100 99,9 100,7 113,2

Outubro 923 100 100 99,9 100,7

Novembro 893 84,5 100 100 99,9

Dezembro 548 91,8 84,5 100 100

Janeiro 556 101,8 91,8 84,5 100

Fevereiro 708 94 101,8 91,8 84,5

Março 632 86,2 94 101,8 91,8

Abril 702 80 86,2 94 101,8

Maio 772 82 80 86,2 94

Junho 511 98,6 82 80 86,2

98,6 82 80

98,6 82

98,6

Fonte: Elaboração do autor (2012).

Para criar a variável defasada, basta copiar a coluna de interesse, no


caso, é o nosso X, representado por IP (índice de preços), e: para uma
defasagem, colar na segunda célula abaixo do nome da variável (IPt-
1
); para duas defasagens, colar a terceira célula abaixo do nome da
variável, e assim por diante. Note que na variável IPt-1 o valor 132,3, que
representa o índice de preço do mês de janeiro, está relacionado na linha
de fevereiro, então, é relativo ao mês anterior.

Note que ao defasarmos as variáveis criamos dois problemas: o primeiro


são células inicias sem valores, o segundo, são células a mais em
algumas colunas comparado com as outras. O Excel não opera com
células em branco, nem com células com valores a mais no fim da
tabela. Temos que deletar as inicias e as finais. Dessa forma, modelos
de defasagens distribuídas sempre perdem informações, diminuem o
tamanho da amostra, isto pode acarretar em problema de regressão.

Após os ajustes de linha e tamanho nossa tabela ficou assim:

56

book_econometria.indb 56 13/01/16 11:27


Econometria

Tabela 2.3 – Variáveis defasadas

Mês/Ano C IP IP t-1 IP t-2 IP t-3

Abril 659 114,9 119,4 124,6 132,3

Maio 741 106,3 114,9 119,4 124,6

Junho 761 113,2 106,3 114,9 119,4

Julho 795 100,7 113,2 106,3 114,9

Agosto 779 99,9 100,7 113,2 106,3

Setembro 897 100 99,9 100,7 113,2

Outubro 923 100 100 99,9 100,7

Novembro 893 84,5 100 100 99,9

Dezembro 548 91,8 84,5 100 100

Janeiro 556 101,8 91,8 84,5 100

Fevereiro 708 94 101,8 91,8 84,5

Março 632 86,2 94 101,8 91,8

Abril 702 80 86,2 94 101,8

Maio 772 82 80 86,2 94

Junho 511 98,6 82 80 86,2

Fonte: Elaboração do autor (2012).

Passo 3:

Após o ajuste na tabela, conforme Tabela 2.3, podemos regredir o


modelo, como segue.

Vamos selecionar a variável Y e os X na ferramenta regressão do Excel:

57

book_econometria.indb 57 13/01/16 11:27


Capítulo 2

Figura 2.2 – Seleção das variáveis na ferramenta regressão do Excel

Fonte: Elaboração do autor (2012).

Resultado da regressão

Figura 2.3 – Seleção das variáveis na ferramenta regressão do Excel

Fonte: Elaboração do autor (2012).

58

book_econometria.indb 58 13/01/16 11:27


Econometria

Passo 4:

Agora vamos escrever o modelo e analisar os resultados finais.

Análise dos resultados:

O modelo, a priori, não serve para previsão, pois nenhum dos parâmetros passa
nos devidos testes.

Vamos começar avaliando os sinais esperados. Nossa hipótese inicial era de que
quanto maior a inflação menor o consumo. Dessa forma, todos os parâmetros
estimados de IP deveriam apresentar o sinal negativo, mas isso ocorre somente
para as variáveis IP e IPt-2. Nenhum parâmetro passa no teste, uma vez que
todos os p-valor são superiores a 5%. Lembrando que na falta da informação do
p-valor devemos fazer o teste a partir da tabela do teste t (ver anexo).

O R2 ajustado também é muito pequeno, isso significa que as variações de IP


explicam somente 4% da variação do consumo e o modelo apresenta 96% de
erro. O teste F também não é bom, não passa do nível de significância de 5% (ver
anexo 2)).

Como os resultados não foram os esperados, vamos modificar o exemplo agora,


defasando apenas dois período.

59

book_econometria.indb 59 13/01/16 11:27


Capítulo 2

Exemplo 3
A partir da Tabela 2.1 do exemplo 2, vamos supor uma defasagem de
k=2 ou seja, dois meses.

Passo 1:

Criar tabela defasada.

Tabela 2.4 – Variáveis defasadas

Mês/Ano C IP IP t-1 IP t-2

Abril 659 114,9 119,4 124,6

Maio 741 106,3 114,9 119,4

Junho 761 113,2 106,3 114,9

Julho 795 100,7 113,2 106,3

Agosto 779 99,9 100,7 113,2

Setembro 897 100 99,9 100,7

Outubro 923 100 100 99,9

Novembro 893 84,5 100 100

Dezembro 548 91,8 84,5 100

Janeiro 556 101,8 91,8 84,5

Fevereiro 708 94 101,8 91,8

Março 632 86,2 94 101,8

Abril 702 80 86,2 94

Maio 772 82 80 86,2

Junho 511 98,6 82 80

Fonte: Elaboração do autor (2012).

Passo 2:

Vamos regredir o modelo de regressão defasado no Excel.

Resumo dos resultados da regressão

60

book_econometria.indb 60 13/01/16 11:27


Econometria

Figura 2.4 – Estatística de regressão

Fonte: Elaboração do autor (2012).

Agora vamos escrever o modelo e analisar os resultados finais.

Análise dos resultados

Novamente, o modelo não serve para previsão e não passa no teste t e F, o R2


ajustado continua muito baixo.

Nosso objetivo é testar modelos, o fato do modelo proposto não ser utilizado
para previsão do consumo desse bem, não invalida a tentativa de provar com
essa amostra, para esse caso específico, a teoria. Os modelos empíricos são
caracterizados pela teoria econômica e as hipóteses estabelecidas.

61

book_econometria.indb 61 13/01/16 11:27


Capítulo 2

Seção 2
Variável Dummy
Na economia, a maioria dos modelos econômicos estão baseados em variáveis
medidas em grandezas físicas ou monetárias, o que chamamos de variáveis
quantitativas. As variáveis quantitativas discretas ou contínuas são grandezas
numéricas possíveis de trabalhar em modelagem econométrica sem grandes
problemas. Mas, além das variáveis discretas, a economia também trabalha
com variáveis qualitativas, tais como gênero, região etc. Na questão de gênero,
podemos perguntar como diferenciar os rendimentos em salários de homens
e mulheres ou em relação à região dos trabalhadores do sul se são melhores
remunerados que os do nordeste? As variáveis binárias ou Dummy auxiliam nos
modelos quando convertem variáveis como as citadas em qualitativas ou em
constructos numéricos.

2.1 Definição da variável Dummy


A variável dummy permite a inclusão de variáveis qualitativas no modelo de
regressão, representando uma variável explicativa. Segundo Gujarati (2011), tais
variáveis qualitativas, geralmente, indicam a presença ou a ausência de uma
qualidade ou atributo, tais como homem ou mulher, negro ou branco, católico
ou não católico, um método para quantificar tais atributos é construir variáveis
artificiais que assumam valores de 1 ou 0.

Então a variável dummy, também conhecida como variável binária; variável


artificial; variável indicador; variável categórica; variável dicotômica; ou variável
qualitativa – é aquela que indica a ocorrência ou não de um evento, ou a presença
ou a ausência de uma condição. Assume apenas dois valores: 1, que indica uma
situação, e 0, a outra.

Exemplo de construção da variável dummy:

Tempo de guerra = 1
EX
Tempo de paz = 0

Tais variáveis visam a captar:

•• efeitos temporais, como mudança de estações, mudanças de


políticas econômicas etc.;
•• efeitos de variáveis qualitativas, como sexo, cor, nacionalidade
estado civil etc.;
•• efeitos de variáveis quantitativas, em que apenas grandes
agrupamentos interessam à análise (população de até 14 anos
versus população com mais de 14 anos).

62

book_econometria.indb 62 13/01/16 11:27


Econometria

Segundo Hill et al. (2010), as variáveis binárias são variáveis explanatórias que
podem tomar um de dois valores. Essas variáveis simples, segundo os autores,
constituem instrumento poderoso para representar características qualitativas
de indivíduos, como sexo, raça ou local de residência. Além da inclusão simples
da variável dummy no modelo, podemos ter interações de dummies a partir da
multiplicação de duas ou mais variáveis binárias.

Carmo e Diaz (2000) confirmam o conceito e natureza da dummy, destacando que


o artifício das dummies permite incluir o efeito de variáveis qualitativas, categorias
ou mesmo variável mensuráveis, quando o importante for a distribuição em
classes. Para fatores qualitativos ou categorias, os autores destacam como
exemplo:

•• processo de produção;
•• grupo social;
•• setor de atividade;
•• região;
•• religião;
•• gênero;
•• estado civil.

Para variáveis contínuas expressas em classes, destacam:

•• faixa etária;
•• classe de renda;
•• nível de escolaridade.

Os autores destacam que a aplicação mais comum é a inclusão da variável


dummy como variável explicativa e podem ser empregadas em modelos simples,
em que a única variável explicativa é uma dummy, e em modelos um pouco mais
complexos, em que uma mesma categoria é desdobrada em variáveis dummies,
como, por exemplo, faixas etárias, classes de renda.

63

book_econometria.indb 63 13/01/16 11:27


Capítulo 2

2.2 Como incluir variáveis binárias no modelo


Podemos incluir uma variável dummy no nosso modelo de três maneiras: na
forma aditiva, incluindo como mais um X; na forma multiplicativa, captamos
mudanças no coeficiente angular; e a forma mista que combina as duas foram
anteriores.

A - Forma aditiva

Quando a mudança temporal ou a condição altera apenas o termo constante do


modelo, ou seja, o intercepto.

Exemplo:

Acrescentando a dummy (D):

Em que D:

1
D
0
Note-se que quando D = 0:

ou seja,

Mas quando D = 1:

ou seja,

Desse modo, o termo constante da equação passa de b0 para (b0 + b2),


caracterizando uma mudança no intercepto. Vamos ilustrar a partir de um
exemplo de Matos (2000):

64

book_econometria.indb 64 13/01/16 11:27


Econometria

Exemplo1
Q = volume de exportação de produtos manufaturados

P = preço internacional (período de 1959 – 1978)

D = mudança da política cambial que ocorreu em 1967.

1 a partir de 1967
D
0 antes de 1967

Vamos ilustrar a mudança de intercepto graficamente. Note que na figura abaixo a


seguir, para a nossa função linear o intercepto se desloca de b0 para (b0+b2).

Figura 2.5 – Forma aditiva

Fonte: Adaptado de Matos (2000).

65

book_econometria.indb 65 13/01/16 11:27


Capítulo 2

B - Forma multiplicativa

Capta a variação no coeficiente angular. Uma forma de levar em conta uma


variação no coeficiente angular é incluir no modelo uma variável explicativa
adicional igual ao produto de uma variável binária por uma variável contínua. Essa
nova variável explicativa é chamada de variável de interação ou variável binária de
inclinação.

A partir de um modelo simples, com um X explicativo, acrescentamos a dummy,


multiplicando pelo X:

Note-se que quando D = 0:

ou seja,

Note que quando a dummy assume zero não muda nada no modelo inicial e essa
é a ideia, ou seja, quando é zero não tem efeito sobre nossa variável dependente.

Mas quando D = 1, então:

, ou seja,

Como temos dois parâmetros para a mesma variável X, colocamos os parâmetros


em evidência.

A partir do exemplo 1:

Note que:

antes de 1967, ou seja quando D =0:

já depois de 1967, ou seja quando a D = 1

Então, a função ficaria assim:

Na ilustração gráfica, notamos que ambas as retas saem do mesmo intercepto,


diferente do caso anterior, porém, o ângulo se modifica.

66

book_econometria.indb 66 13/01/16 11:27


Econometria

Figura 2.6 – Forma multiplicativa

Fonte: Adaptado de Matos (2000).

C- Forma mista

A forma mista é uma combinação das formas aditiva e multiplicativa, capta


variações tanto no intercepto quanto no coeficiente angular.

Note-se que quando D = 0:

ou seja,

Mas quando D = 1:

ou seja,

67

book_econometria.indb 67 13/01/16 11:28


Capítulo 2

Figura 2.7 – Forma mista

Fonte: Adaptado de Matos (2000).

Acabamos de estudar como acrescentar a variável dummy que apresenta


características diferentes daquelas que representamos normalmente até aqui.

Vamos desenvolver um exemplo do setor elétrico, pois o consumo de energia


elétrica é muito importante para o crescimento de uma economia, tanto o
consumo das famílias como das indústrias. A implementação do horário de verão
pelo governo brasileiro a partir de 1985 visava a diminuir o consumo, já que a
oferta é limitada pelo o número de usinas do país e muitas vezes as intempéries
afetam as reservas de água das nossas usinas.

68

book_econometria.indb 68 13/01/16 11:28


Econometria

Exemplo 2
Os dados da tabela abaixo são referentes ao Brasil de 1981 a 1990,
adaptado de Matos (2000). Nesta tabela, temos a variável dependente
Q (quantidade demanda de energia elétrica), T (tarifa média) de energia
elétrica e Y (produto real) representando a renda.

Tabela 2.5 – Demanda de energia elétrica

Ano Q T Y

1981 69 143 84

1982 76 134 85

1983 81 117 82

1984 90 111 86

1985 94 109 93

1986 100 100 100

1987 103 137 104

1988 108 122 104

1989 113 85 107

1990 115 90 102

Fonte: Adaptado de Matos (2000).

Com base nestes dados, pede-se:

a. estimar a função de demanda por energia elétrica, usando


a forma linear;
b. incluir a variável dummy para captar o efeito do horário de
verão, na forma aditiva;
c. estimar a função de demanda por energia elétrica após a
inclusão da dummy;
d. analisar o modelo final.

69

book_econometria.indb 69 13/01/16 11:28


Capítulo 2

Resolução:

a) estimar a função de regressão linear:

Figura 2.8 – Regressão linear no Excel

Fonte: Elaboração autor (2012).

A partir das estatísticas de regressão, podemos escrever a função:

(0,33) (-2,92)* (6,81)

b) Como o horário de verão começou em 1985, até este ano colocamos


0 (zero), a partir de 1985, a variável dummy assume o valor 1 (um), ou
seja, ocorre o evento.

Tabela 2.6 – Demanda de energia elétrica adição da dummy (D)

Ano Q T Y D

1981 69 143 84 0

1982 76 134 85 0
continua...

70

book_econometria.indb 70 13/01/16 11:28


Econometria

1983 81 117 82 0

1984 90 111 86 0

1985 94 109 93 1

1986 100 100 100 1

1987 103 137 104 1

1988 108 122 104 1

1989 113 85 107 1

1990 115 90 102 1

Fonte: Adaptado de Matos (2000).

A partir da tabela acima vamos regredir a função:

Figura 2.9 – Regressão linear no Excel

Fonte: Elaboração autor (2012).

A partir das estatísticas de regressão podemos escrever a função:

(0,14) (-2,68)* (2,82)* (-0,07)

71

book_econometria.indb 71 13/01/16 11:28


Capítulo 2

b) A análise do modelo sempre requer uma validação do sinal esperado


dos parâmetros, a validação dos testes, t, R2 e F.

A partir da função de regressão podemos concluir que todos os sinais


estão teoricamente corretos, apesar de a amostra ser de apenas 10
elementos. Em relação à demanda de energia elétrica, espera-se que a T
(tarifa), ou seja, preço tenha uma relação inversa, quanto maior o preço
menor a demanda. Assim como a relação teórica entre renda e demanda
é uma relação positiva. A variável dummy representando o impacto do
racionamento de energia proporcionado pelo o horário de verão também
apresenta um sinal coerente, uma vez que quanto maior o racionamento
menor a quantidade demandada.

Quanto à confiabilidade, ressalta-se que o coeficiente de determinação é alto,


ou seja, as três variáveis juntas explicam 90% da variação da quantidade
demandada de energia elétrica, o que significa elevado poder de explicação.

A hipótese de que as variáveis T, Y e D, conjuntamente, afetam Q é aceita


ao nível de significância de 5%, conforme indica o teste F. Isso significa que,
pelo menos, uma dessas variáveis influencia significativamente a quantidade
demandada, com uma probabilidade de erro de apenas 5%.

Já o teste t nos indica que apenas os parâmetros b2 e b3 passam no teste, ou


seja, aceitam H1 e rejeitam H0 a um nível de significância de 5%. Se o intercepto
não passar no teste, neste caso, é relevante, já que a adição da variável dummy
afeta o intercepto. A variável dummy também não passa no teste que indica,
mesmo apresentando sinal teoricamente correto, pois ela não contribui para
explicação da demanda de energia elétrica para essa amostra.

72

book_econometria.indb 72 13/01/16 11:28


Econometria

Exemplo 3
Vamos modificar um pouco o modelo do exemplo anterior, agora
teremos apenas duas variáveis: Q (quantidade demanda de energia
elétrica) e T (tarifa média) de energia elétrica, como segue:

Tabela 2.7 – Demanda de energia elétrica e tarifa

Ano Q T

1981 69 143

1982 76 134

1983 81 117

1984 90 111

1985 94 109

1986 100 100

1987 103 137

1988 108 122

1989 113 85

1990 115 90

Fonte: Adaptado de Matos (2000).

Com base nesses dados, pede-se:

e. Incluir a variável dummy para captar o efeito do horário de


verão na forma multiplicativa;
f. Estimar a função de demanda por energia elétrica após a
inclusão da dummy;
g. Analisar o modelo final.

Resolução:

a) Para incluir a variável dummy multiplicativa, devemos incluir primeiro


a variável dummy e depois criar uma nova coluna TD (tarifa multiplicado
pela dummy). Na primeira célula abaixo do título da coluna, digite

73

book_econometria.indb 73 13/01/16 11:28


Capítulo 2

= (igual) para calcular, depois clique no primeiro valor de T, digite *


(asterisco) para multiplicar e clique no primeiro valor de D e tecle Enter
para calcular o primeiro valor, depois arrastar para os demais.

Figura 2.10 – Cálculo da variável dummy

Fonte: Elaboração autor (2012).

O resultado final:

Figura 2.11 – Demanda de energia elétrica, tarifa e variáveis dummies

Ano Q T D TD

1981 69 143 0 0

1982 76 134 0 0

1983 81 117 0 0

1984 90 111 0 0

1985 94 109 1 109

1986 100 100 1 100

1987 103 137 1 137

1988 108 122 1 122

1989 113 85 1 85

1990 115 90 1 90
Fonte: Elaboração autor (2012).

74

book_econometria.indb 74 13/01/16 11:28


Econometria

b) Para estimar a função após a inclusão da dummy na forma


multiplicativa, devemos excluir a coluna D. Para não destruir o seu
cálculo na coluna TD, copie toda a tabela para outra planilha do Excel,
e usando da ferramenta cole especial só valores, você pode excluir a
coluna D, sem problemas.

Figura 2.12 – Demanda de energia elétrica, tarifa e variáveis dummy

Ano Q T TD

1981 69 143 0

1982 76 134 0

1983 81 117 0

1984 90 111 0

1985 94 109 109

1986 100 100 100

1987 103 137 137

1988 108 122 122

1989 113 85 85

1990 115 90 90
Fonte: Elaboração do autor (2012).

75

book_econometria.indb 75 13/01/16 11:28


Capítulo 2

Resultados da regressão linear a partir da figura anterior:

Figura 2.13 – Regressão linear com variável dummy

Fonte: Elaboração autor (2012).

A partir das estatíssticas de regressão, podemos escrever a função:

(9,00)* (-3,49)* (4,49)*

c) Análise do modelo:

A partir da função de regressão, podemos concluir que todos os sinais estão


teoricamente corretos. Em relação à demanda de energia elétrica, espera-se que
a T (tarifa), ou seja, preço tenha uma relação inversa, quanto maior preço menor a
demanda, o que justifica o sinal negativo. Não temos nenhuma evidência teórica
da relação ou influência da dummy horário de verão e o preço da energia elétrica
(T), porém, como exercício, podemos criar a hipótese de que o horário de verão,
de alguma forma, diminuiria o preço da energia elétrica, já que os consumidores
pouparam mais.

Quanto à confiabilidade, ressalta-se que o coeficiente de determinação é bom,


ou seja, as duas variáveis juntas explicam 83% da variação da quantidade
demandada de energia elétrica, o que significa bom poder de explicação,
sobrando 17% de erro no modelo de estimação.

76

book_econometria.indb 76 13/01/16 11:28


Econometria

A hipótese de que as variáveis T e TD, conjuntamente, afetam Q é aceita


ao nível de significância de 5%, conforme indica o teste F. Isso significa
que, pelo menos, uma dessas variáveis influencia significativamente a
quantidade demandada, com uma probabilidade de erro de apenas 5%.

Os três parâmetros passaram no teste t, o que significa que ambos


aceitaram H1 ao um nível de significância de 5%.

Quando D=1

Temos alteração no coeficiente angular que aumenta de -0,40 para (-0,40


+0,18) = -0,22.

Seção 3
Previsões
Previsões ou projeções de valores futuros a partir da função de regressão é mais
uma ferramenta para auxílio da análise e tomada de decisão a partir de dados
passados. Além de projetar, ressaltaremos a importância das séries tempo e taxa
de crescimento.

As séries tempo são muito usadas na teoria econômica porque muitas das
variáveis, principalmente as macroeconômicas, são medidas ao longo do
tempo. Estudar o comportamento de tendências dessas variáveis auxilia o
economista na tomada de decisão.

Além da tendência, temos em alguns casos mudanças bem pontuais durante


o ano, como, por exemplo, a fruta de uma época, o que chamamos de
sazonalidade. Seu preço e oferta mudam dependendo do tempo ou do mês do
ano.

Na economia também estudamos os ciclos econômicos, esses formam uma série


temporal de longo tempo, ou seja, é uma tendência com prazo maior do que um
ano. Introduzir a tendência no nosso modelo de regressão é o objetivo desta
unidade. Além da forma tradicional linear para a tendência, vamos estudar a taxa
de crescimento que é uma função semilog, ou seja, usamos logaritmo natural e
linear na mesma função. A taxa de crescimento no tempo é uma medida muito
importante para análises conjunturais, por isso, vamos considerá-la. E, por fim,
vamos usar as funções regredidas para projetar valores futuros.

77

book_econometria.indb 77 13/01/16 11:28


Capítulo 2

3.1 Séries de tempo


Uma série de observações registradas em instantes distintos e sucessivos de
tempo constitui uma série temporal. É todo conjunto de valores passível de
ordenação cronológica, ou seja, é o controle de uma variável no tempo.

Seja Y a variável observada e t a variável tempo.

Uma série temporal é definida pelos valores: Y1 ,Y2 , ... , Yn , nos tempos t1, t2, ...,
tn.

Função:

Movimento característico das séries de tempo:

Tendência (T)

Variações sazonais (S)

Variações cíclicas (C)

Gráfico 2.1- Séries Temporais

Fonte: Elaboração do autor (2012).

A influência do tempo pode ser incorporada no modelo mediante a utilização de


uma das seguintes formas:

Tendência T: caracteriza uma série segundo um movimento regular em


alguma direção específica. A reta de tendência pode ser representada pela
reta de regressão, e nos permite avaliar se há tendência de crescimento ou
decrescimento nos dados estudados ao longo do tempo.

Variações sazonais (S): são variações repetidas que se completam em um ano.


Como, por exemplo, frutas de época, artigos verde amarelo em época de copa do
mundo.

78

book_econometria.indb 78 13/01/16 11:28


Econometria

Variações cíclicas (C): são variações repetidas em longo prazo, tais como ciclos
econômicos, índices ao longo do tempo.

3.2 Análise de tendência


Vamos estudar como inserir uma variável tendência no modelo linear e semilog. A
introdução implícita na equação de uma variável tempo ou tendência (T) medida
pelo número de períodos, contados do primeiro ao último período. A remoção da
tendência das variáveis, antes da estimação do parâmetro, por exemplo, retira
a sazonalidade de uma série. Uma sazonalidade se caracteriza por algo que só
ocorre uma vez ou outra, ou em períodos de tempos curtos. Para retirar tal efeito
usamos a média móvel.

A variável (T) num modelo indica a existência de uma tendência autônoma no


crescimento ou decrescimento da variável dependente. Nesse caso, o coeficiente
de (T) pode ser interpretado como uma medida dessa variação autônoma, isto
é, pode fazer a hipótese implícita de que o termo constante (b0) da equação
cresce ou decresce firmemente, embora os parâmetros das variáveis explicativas
permaneçam inalterados. Se, adicionalmente, existem informações a priori que
tais parâmetros também se alteram ao logo do tempo, poder-se-á acrescentar à
equação o termo multiplicativo (T.X) juntamente com a variável X.

Exemplo 1
A tabela

Abaixo mostra a variável tempo representada por meses do ano 2011


e 2012 e a taxa de juros, representada pela taxa SELIC, mensalizada. A
partir destes dados, analisar a tendência dos dados e prever a taxa de
juros para o mês de outubro de 2012.

Tabela 2.7 – Taxa de juro brasileiro

Mês Taxa Juros

jan/11 0,8859

fev/11 0,8212

mar/11 0,9455

abr/11 0,9235

continua...

79

book_econometria.indb 79 13/01/16 11:28


Capítulo 2

mai/11 0,9659

jun/11 0,9481

jul/11 0,9931

ago/11 0,9999

set/11 0,9358

out/11 0,9523

nov/11 0,8987

dez/11 0,8903

jan/12 0,8717

fev/12 0,7943

mar/12 0,8042

abr/12 0,7436

mai/12 0,7333

jun/12 0,6709

jul/12 0,668

ago/12 0,6514

set/12 0,5946
Fonte: Banco Central (2012).

Resolução:

Passo 1:

Vamos plotar o gráfico de dispersão. Para plotar o gráfico de dispersão,


sempre selecionamos primeiro o X (mês) e depois o Y (taxa de juros),
diferente da regressão que sempre começamos com o Y, isso porque no
Excel o par do gráfico de dispersão é XY.

No Excel:

a. Selecionar os dados na tabela.


b. Selecionar gráfico de dispersão:

80

book_econometria.indb 80 13/01/16 11:28


Econometria

Figura 2.15 – Plotar gráfico de dispersão

Fonte: Elaboração do autor (2012).

c) Selecionar o primeiro gráfico, ou seja, o que tem apenas pontos.

Resultado do gráfico:

Gráfico 2.2 – Gráfico de dispersão

Fonte: Elaboração do autor (2012).

Podemos perceber que os dados estão em um caminho bem desenhado


e pouco disperso.

Passo 2:

Regredir os dados e achar a função de regressão, antes de regredir


vamos transformar o nosso X em números de meses, porque não é
possível regredir com palavras na coluna X. Nossa tabela inicial fica
assim:

81

book_econometria.indb 81 13/01/16 11:28


Capítulo 2

Tabela 2.8 – Taxa de juro brasileiro

Taxa Juros Mês

0,8859 1

0,8212 2

0,9455 3

0,9235 4

0,9659 5

0,9481 6

0,9931 7

0,9999 8

0,9358 9

0,9523 10

0,8987 11

0,8903 12

0,8717 13

0,7943 14

0,8042 15

0,7436 16

0,7333 17

0,6709 18

0,668 19

0,6514 20

0,5946 21
Fonte: Elaboração do autor (2012).

Resultado da regressão no Excel:

82

book_econometria.indb 82 13/01/16 11:28


Econometria

Figura 2.16 – Regressão taxa de juros no Excel

Fonte: Elaboração do autor (2012).

Com o resultado da reta de regressão podemos perceber que a relação


entre tempo medido em mês e a taxa de juros Selic é negativa, ou seja,
com o passar do tempo ela está diminuindo.

Agora podemos acrescentar uma reta de tendência no nosso gráfico,


que vai corroborar com essa conclusão.

Para tal, volte no gráfico de dispersão no Excel e clique com o botão


esquerdo do seu mouse:

Gráfico 2.2 – Inserir a reta de tendência

Fonte: Elaboração do autor (2012).

83

book_econometria.indb 83 13/01/16 11:28


Capítulo 2

Clicar em Adicionar Linha de Tendência

Figura 2.17 – Adicionar a reta de tendência no Excel

Fonte: Elaboração do autor (2012).

Selecione Opções de Linha de Tendência, em seguida, tecle em Linear


e depois Fechar.

84

book_econometria.indb 84 13/01/16 11:28


Econometria

O que resulta no gráfico com linha tendência

Gráfico 2.3 – Gráfico reta de tendência

Fonte: Elaboração do autor (2012).

Podemos perceber que a reta é levemente inclinada para baixo, o que


confirma a relação negativa do b1 da nossa reta de regressão.

Passo 3:

É responder a segunda questão do exemplo, ou seja, qual a projeção?

O mês de outubro de 2012 na nossa amostra é o vigésimo segundo,


então temos:

Dessa forma, a previsão para a taxa de juros em outubro de 2012 seria


0,58%.

Gujarati (2011) introduz o estudo de tendência junto com outras formas


funcionais, particularmente, vamos estudar o modelo log-lin, que mede
a taxa de crescimento. O autor destaca que os economistas, homens de

85

book_econometria.indb 85 13/01/16 11:28


Capítulo 2

negócios e governos estão frequentemente interessados em saber a taxa


de crescimento de certas variáveis econômicas, tais como população,
PIB, oferta monetárias, emprego, produtividade, déficit comercial etc.

A partir dos dados do PIB para os Estados Unidos, de 1972-1991, o


autor desenvolve o modelo genérico.

Suponha que queiramos descobrir a taxa de crescimento do PIB nesse


período, sejam Yt = PIB no tempo t e Y0= valor inicial do PIB, isto é, no
ano de 1972 até 1991. Relembrando a fórmula de juros compostos de
matemática financeira, temos:

(1)

Em que r é a taxa de composta de crescimento de Y ao longo do tempo.


Calculando o logaritmo natural de (1), podemos escrever:

(2)

Sejam agora:

Podemos reescrever (2) como:

(3)

Acrescentando o termo erro temos:

(4)

86

book_econometria.indb 86 13/01/16 11:28


Econometria

Note que a variável dependente está logaritmizada e a explicativa está na


sua forma linear; por isso, o modelo é chamado de log-lin. Esse modelo
é parecido com qualquer outro modelo de regressão linear, já que os
parâmetros são lineares. A única diferença é que o regressando é o
logaritmo de Y e o regressor é tempo, que assumirá valores 1, 2, 3 etc.

No modelo (4), o coeficiente de inclinação mede a variação proporcional


(ou relativa) constante em Y para uma dada variação absoluta no valor
do regressor (neste caso, a variável t), ou seja,

(5)

Se multiplicarmos a variação relativa Y por 100, a formula (5) fornecerá a


variação percentual, ou a taxa de crescimento, em Y para uma variação
absoluta em X, o regressor.

87

book_econometria.indb 87 13/01/16 11:28


Capítulo 2

Exemplo 2
A tabela abaixo mostra a variável tempo representada por anos de 1972-
1991 e o PIB real para os Estados Unidos da América. Calcule a taxa de
crescimento para o PIB no período.

Tabela 2.9 – PIB americano em bilhões de dólares de 1987

Ano PIB

1972 3107,1

1973 3268,6

1974 3248,1

1975 3221,7

1976 3380,8

1977 3533,3

1978 3703,5

1979 3796,8

1980 3776,3

1981 3843,1

1982 3760,3

1983 3906,6

1984 4148,5

1985 4279,8

1986 4404,5

1987 4539,9

1988 4718,6

1989 4838,0

1990 4877,5

1991 4821,0
Fonte: Gujarati (2010).

88

book_econometria.indb 88 13/01/16 11:28


Econometria

Resolvendo:

Passo 1:

Transformar os anos em tendência.

Tabela 2.10 – Inclusão da tendência

PIB T

3107,1 1

3268,6 2

3248,1 3

3221,7 4

3380,8 5

3533,3 6

3703,5 7

3796,8 8

3776,3 9

3843,1 10

3760,3 11

3906,6 12

4148,5 13

4279,8 14

4404,5 15

4539,9 16

4718,6 17

4838,0 18

4877,5 19

4821,0 20

Fonte: Elaboração do autor (2012).

89

book_econometria.indb 89 13/01/16 11:28


Capítulo 2

Passo 2:

Calcular o logaritmo natura do PIB. Para isso, primeiro clique na célula


em branco abaixo do nome da nova variável, depois digite igual, e, para
calcular ,escreva LN. Clique no primeiro valor de PIB, no nosso caso,
está na célula A2, feche o parêntese e dê Enter.

Figura 2.18 – Cálculo do logaritmo natural de Y

Fonte: Elaboração do autor (2012).

A tabela completa fica assim:

Tabela 2.10 – Inclusão da tendência

PIB t lnPIB

3107,1 1 8,04

3268,6 2 8,09

3248,1 3 8,09

3221,7 4 8,08

3380,8 5 8,13

3533,3 6 8,17

3703,5 7 8,22

3796,8 8 8,24

3776,3 9 8,24

3843,1 10 8,25

3760,3 11 8,23

3906,6 12 8,27
continua...

90

book_econometria.indb 90 13/01/16 11:28


Econometria

4148,5 13 8,33

4279,8 14 8,36

4404,5 15 8,39

4539,9 16 8,42

4718,6 17 8,46

4838,0 18 8,48

4877,5 19 8,49

4821,0 20 8,48

Fonte: Elaboração do autor (2012).

Passo 3:

Regredir a função log-lin.

Figura 2.19 – Regressão da função log-lin

Fonte: Elaboração do autor (2012).

(700,54)* (25,86)*

Todos os parâmetros passam no teste t, o R2 também é muito bom. No


período 1972-1991, o PIB dos EUA aumentou a uma taxa de 2,47% ao
ano. Chamamos essa taxa de taxa de crescimento constante.

91

book_econometria.indb 91 13/01/16 11:28


Capítulo 2

3.3 Projeções
Em todos os casos que estudamos até aqui, após a regressão de uma função,
desde que passe nos testes que estabelecemos para um bom modelo de
previsão, ou seja, passar no teste de significância teste t apresentar o R2 superior
a 60%. E no caso da regressão múltipla apresentar um F significante, o modelo
serve para previsão de valores futuros

Dessa forma, a projeção ou previsão pode ser feita a partir da substituição do X


da função.

Agora veremos como calcular o erro que cometemos nessas projeções futuras e
o intervalo de confiança.

Segundo Salvatore (1983), uma projeção refere-se à estimação do valor da


variável dependente, YF , dado o valor atual ou projetado da variável independente,
XF, o F indica futuro. A variância do erro projetado é dada por:

Em que a variância do erro é dada por:

Em que:

= tamanho da amostra

= média de X

= X futuro

= o erro ao quadrado

= estimado a partir da função de regressão

= valor inicial de Y

= valor inicial de X

O intervalo de confiança de 95% para a projeção, YF, é:

t é a distribuição t com n-2 graus de liberdade. A tabela t está em anexo 1, ao


final do livro.

92

book_econometria.indb 92 13/01/16 11:28


Econometria

Exemplo 3

A tabela mostra as toneladas de milho por hectare, Y, resultantes do uso


de vários montantes de fertilizantes em KG por hectare, X, produzidos
em uma fazenda, em 10 anos, de 2001 a 2010. Vamos projetar para 2011
um montante de fertilizante usado de XF=35, qual a quantidade de milho
produzida?

Tabela 2.11 – Milho produzido e fertilizante utilizado

Ano Yi Xi

2001 40 6

2002 44 10

2003 46 12

2004 48 14

2005 52 16

2006 58 18

2007 60 22

2008 68 24

2009 74 26

2010 80 32
Fonte: Elaboração do autor (2012).

Resolvendo:

Passo 1:

Estimar a função de regressão:

93

book_econometria.indb 93 13/01/16 11:28


Capítulo 2

Figura 2.20 – Função de regressão

Fonte: Elaboração do autor (2012).

Função de regressão:

(13,70)* (16,60)*

Passo 2:

Calculando a variância do erro (resíduos):

Este valor é dado no ANOVA, já que a somatória dos erros é 47,30 (SQ)
e o grau de liberdade é 8 (10-2), temos o valor de 5,91 (MQ). Vamos usar
este valor para calcular a variância da projeção:

Passo 3:

Calculo da somatória de X menos a média ao quadrado.

Vamos voltar para a tabela com os dados inicial e calcular a média de X


e depois a expressão acima:

94

book_econometria.indb 94 13/01/16 11:28


Econometria

Tabela 2.12 – Média de X

Ano Yi Xi X- media (X - media)^2

2001 40 6 -12 144

2002 44 10 -8 64

2003 46 12 -6 36

2004 48 14 -4 16

2005 52 16 -2 4

2006 58 18 0 0

2007 60 22 4 16

2008 68 24 6 36

2009 74 26 8 64

2010 80 32 14 196

Media 18 576
Fonte: Elaboração do autor (2012).

Passo 4:

Calcular a variância da projeção

Lembrando que a hipótese é que XF = 35

95

book_econometria.indb 95 13/01/16 11:28


Capítulo 2

Vamos tirar a raiz quadrada para calcular o desvio padrão:

Antes de calcular o intervalo de confiança, vamos projetar o novo valor


da produção do milho, a partir da função de regressão que representa o
modelo:

Para calcular o intervalo de confiança de previsão com 95:

O t com 5% retiramos da tabela t - a qual segue no anexo 1 desse livro-


com 8 de grau de liberdade.

(85,22+7,10) e (85,22 -7,10) = 92,32 e 78,12

Então, o intervalo de confiança ou de previsão de 95% para YF em 2011


está entre 78,12 e 92,32. Como em 2010 a tabela apresenta um valor
para a variável Y de 80, esse é um resultado bastante plausível.

96

book_econometria.indb 96 13/01/16 11:28


Econometria

Atividades de autoavaliação
Ao final de cada capítulo, você realizará atividades de autoavaliação. O
gabarito está disponível no final do livro didático. Mas esforce-se para resolver
as atividades sem ajuda do gabarito, pois, assim, você estará promovendo
(estimulando) a sua aprendizagem.

1. A tabela abaixo mostra os dados para Estoques (Y) e Vendas(X) de um


determinado bem do setor industrial. Escreva o modelo autorregressivo,
considerando a variável dependente como explicativa com defasagem de um
período, ou seja, um modelo autorregressivo.

Tabela– Estoques e venda

Ano Y X

1991 52,9 30,3

1992 53,8 30,9

1993 54,9 30,9

1994 58,2 33,4

1995 60 35,1

1996 63,4 37,3

1997 68,2 41

1998 78 44,9

1999 84,7 46,5

2000 90,6 50,3

2001 98,2 53,5

2002 101,7 52,8

2003 102,7 55,9

2004 108,3 63

2005 124,7 73

2006 157,9 84,8

2007 158,2 86,6

2008 170,2 98,9

2009 180 110,8

2010 198 124,7


Fonte: Adaptado de Matos (2000).

97

book_econometria.indb 97 13/01/16 11:28


Capítulo 2

2. A partir dos dados e do modelo da questão 1 estime o modelo de defasagem


distribuída, escreva a função de regressão e analise o modelo de defasagem
distribuídas. O modelo serve para previsão?

3. Você concorda que a inclusão de variáveis defasadas no modelo de regressão


o torna mais dinâmico? Por quê?

4. Como ficaria a forma funcional do modelo de estoque e vendas se a defasagem fosse de


k=4 ?

5. A tabela abaixo mostra a quantidade ofertada de leite (em mil litros) por mês
por uma empresa, essa variável será apresentada pela letra Q, a vários preços
P, para um período de 14 meses. A partir desses dados estime a função de
regressão.

Tabela– Oferta de leite

Mês Q P

1 98 0,79

2 100 0,80

3 103 0,82

4 105 0,82

5 80 0,93

6 87 0,95

7 94 0,96

8 113 0,88

9 116 0,88

10 118 0,90

11 121 0,93

12 123 0,94

13 126 0,96

14 128 0,97
Fonte: Elaboração do autor (2012).

6. A partir do modelo desenvolvido na questão 5 vamos imaginar que empresa


enfrenta uma greve de suas unidades durante o quinto, sexto, e o sétimo mês de
produção. Insira uma variável dummy que represente uma mudança no intercepto.
Justifique.

98

book_econometria.indb 98 13/01/16 11:28


Econometria

7. A partir do modelo desenvolvido na questão 6, vamos imaginar que empresa


enfrenta uma greve de suas unidades durante o quinto, sexto, e o sétimo mês de
produção. Também vamos acrescentar a relação entre o período de greve e os
preços. Insira uma variável dummy que represente uma mudança no coeficiente
angular da função linear geral. Estime a função de regressão linear e analise os
resultados.

8. Compare os resultados da função linear sem a inclusão da dummy e com a


dummy desenvolvida na questão anterior.

9. A partir dos dados de juros para o Brasil, calcule a taxa de crescimento no


período.

Tabela 2.15 – Taxa de juro brasileiro

Taxa Juros Mês

0,8859 1

0,8212 2

0,9455 3

0,9235 4

0,9659 5

0,9481 6

0,9931 7

0,9999 8

0,9358 9

0,9523 10

0,8987 11

0,8903 12

0,8717 13

0,7943 14

0,8042 15

0,7436 16

0,7333 17

0,6709 18
continua...

99

book_econometria.indb 99 13/01/16 11:28


Capítulo 2

0,668 19

0,6514 20

0,5946 21
Fonte: Elaboração do autor (2012).

10. A partir dos dados de PIB dos USA, vamos projetar o valor para o ano 1992 e
calcular o intervalo de confiança.

Tabela - Inclusão da tendência

PIB T

3107,1 1

3268,6 2

3248,1 3

3221,7 4

3380,8 5

3533,3 6

3703,5 7

3796,8 8

3776,3 9

3843,1 10

3760,3 11

3906,6 12

4148,5 13

4279,8 14

4404,5 15

4539,9 16

4718,6 17

4838,0 18

4877,5 19

4821,0 20
Fonte: Elaboração do autor (2012).

100

book_econometria.indb 100 13/01/16 11:28


Capítulo 3

Problemas de regressão
Estudaremos um dos primeiros e mais importantes problemas possíveis de
ocorrer no modelo de regressão múltipla que é a correlação dos resíduos. Esse
é um problema que ocorre somente em séries temporais. Aprenderemos a testar
uma série para verificar se há esse problema e veremos um método possível de
correção.

Em vários casos, temos um bom modelo teórico e alguns parâmetros não se


comportam como deveriam para garantir a utilização do modelo para a previsão
e, nesses casos, pode ser devido a um problema de regressão.

Além da autocorreção dos resíduos que causa viés nos testes t, temos a
heteroscedasticidade e a multicolinearidade.

A autocorrelação dos resíduos é um típico problema de séries temporais, ou seja,


ocorre relacionada a anos, meses dias e as variáveis relativas a esses períodos.

Já a heteroscedasticidade é um problema de dados em croos section ou corte


no tempo. Nesses casos, temos um tempo e várias variáveis para esse mesmo
período. Por exemplo, os valores das ações em 20/03/2015, temos um dia e
uma lista de ações de várias empresas. Vamos ver a seguir o conceito e as
consequências de um problema heteroscedasticidade para o nosso modelo de
regressão.

A Multicolinearidade se resume a problemas na correlação entre duas variáveis


explicativas.

Vejamos com detalhes cada um desses problemas, bem como possíveis soluções
na área de economia para resolvê-los.

101

book_econometria.indb 101 13/01/16 11:28


Capítulo 3

Seção 1
Autocorrelação dos resíduos
Para a previsão utilizando o método dos mínimos quadrados ordinários,
destacamos alguns pressupostos ou condições, entre eles, em que o valor que o
termo erro assume em um período não se correlaciona com seu valor em algum
outro período, isto é :

E (ei ej)= 0 para i≠j com i,j=1,2,3,....,n.

Essa hipótese assegura que o valor médio de Y depende somente de X e não de


e. Lembrando que nosso objetivo é minimizar o erro, ou seja, ele é considerado,
mas não queremos que ele se torne mais importante do que os X’s que compõem
nosso modelo. O poder de explicação das variações de X deve ser maior ou
próximo a 100%, e o erro, tendendo a zero, sempre que possível, isso garante a
utilização da função estimada para prever o Y estimado.

Em alguns casos, os dados apresentam essa correlação nos resíduos e a


correlação (relação causal) prejudica os resultados do modelo.

Um exemplo é o modelo apresentar sustentação teórica, passar no teste t e


apresentar um R2 ajustado muito baixo, ou o inverso, não passar no teste t e
apresentar um R2 ajustado alto e relevante. Esse é um problema de regressão
denominado autocorrelação dos resíduos.

Além da autocorrelação, temos o problema de heteroscedasticidade e de


multicolinearidade. É desejável que a variância dos resíduos seja constante, isto
chamamos de homoscedasticidade, ou seja, .

A violação desse pressuposto é a heteroscedasticidade, que se refere ao fato de


a variância de ,não ser constate, isto é, .

Já a multicolinearidade refere-se à correlação entre duas variáveis explicativas


incluídas na equação de modelo. Isso implica que a multicolinearidade ocorre,
quando, por exemplo, duas variáveis X1 e X2 medem aproximadamente a mesma
coisa, ou seja, a correlação entre elas é quase perfeita.

102

book_econometria.indb 102 13/01/16 11:28


Econometria

1.1 O problema de autocorrelação dos resíduos

Conceitos e consequências
Autocorrelação significa dependência temporal dos valores sucessivos dos
resíduos, ou seja, os resíduos são correlacionados entre si.

Em termos formais e considerando-se inicialmente o modelo linear simples:

A autocorrelação dos resíduos implica que E (ei ej) ≠ 0 para i ≠ j. A ausência de


autocorrelação significa, portanto, E (ei ej) = 0 para i ≠ j.

Vamos ver uma demonstração gráfica para o problema:

Figura 3.1 – Correlação entre os resíduos et e et-1

Fonte: Elaborado pelo autor (2012).

Quando os resíduos são autocorrelacionados, as estimativas de MQO (mínimos


quadrados ordinários) dos parâmetros não são eficientes, isto é, não apresentam
variância mínima, além de seu erro-padrão viesado, o que conduz a testes e
intervalos de confiança incorretos.

Se a autocorrelação for positiva, os erros-padrões serão subestimados, e o valor


de t superestimado. Se a autocorrelação for, ao contrário, negativa, os erros-
padrões serão superestimados e, o valor de t, subestimado.

Portanto, a autocorrelação positiva é a mais danosa, porque existirá,


no caso do teste t, o risco de rejeitar-se a hipótese nula de ausência de
efeito, quando se deveria aceitá-la. A autocorrelação é positiva quando os
resíduos são diretamente relacionados entre si.

103

book_econometria.indb 103 13/01/16 11:28


Capítulo 3

(1)

vt = erro (ruído branco normalmente distribuído e com variância mínima)

Nessa primeira equação, formulamos um modelo para o erro. Como é regressão


também um erro que chamaremos de v. A ideia é estimar o rô ( ) e analisar o
sinal.

Então se e , a autocorrelação é negativa.

Tal autocorrelação é dita de primeira ordem, porque o resíduo et é relacionado


com et-1, ou seja, resíduo em t é função do resíduo no período imediatamente
anterior (t -1).

A presença de autocorrelação nos resíduos gera:

1. estimadores dos parâmetros (b) não viesados, porém, não


eficientes;
2. as variâncias estimadas dos parâmetros são subestimadas,
gerando problemas com o teste de hipótese;
3. a autocorrelação nos resíduos é dita de 1ª ordem, ou seja, AR(1);
4. estimação por meio do método de Mínimos Ordinários
Generalizados (MOG).

Estimadores eficientes são aqueles que apresentam variância mínima e são


estatisticamente mais significantes que qualquer outro estimador. Um estimador
é não viesado se a média de sua distribuição amostral é igual ao verdadeiro
parâmetro E(b^) = b e um melhor estimador não viesado ou eficiente significa um
estimador de menor variância.

Fontes de autocorrelação
São fontes de autocorrelação a omissão de alguma variável importante, a má
especificação da forma matemática e do termo aleatório e ajustes imperfeitos de
observações estatísticas. Vejamos em detalhes cada um desses casos.

Omissão de variável explicativa (erro de especificação)

As variáveis econômicas tendem a ser autocorrelacionadas. Assim, a omissão


de uma ou mais variáveis explicativas refletirá, obviamente, no termo residual et,
cujos valores se tornam, por isso, correlacionados entre si.

104

book_econometria.indb 104 13/01/16 11:28


Econometria

Má especificação da forma matemática (erro de especificação)

Os dados utilizados e a teoria podem sugerir, por exemplo, a forma quadrática em


vez da forma linear.

Má especificação do verdadeiro termo aleatório

Pode-se esperar, em muitos casos, que, para valores sucessivos, os verdadeiros


valores de et não sejam independentes. Mesmo fatores randômicos (guerras,
estiagem, greves etc.) poderão exercer efeitos que se propagam ao longo de
vários períodos de tempo.

Por exemplo, o efeito negativo de uma seca sobre o nível de produção de uma
lavoura pode perdurar por algum tempo, sob a forma de escassez e deterioração
de sementes.

Ajustes imperfeitos de séries estatísticas

Muitos dados publicados contêm interpolações ou suavização (smoothing), as


quais poderão tomar as disturbâncias aleatórias correlacionadas entre si ao longo
do tempo.

Teste para detectar a presença de autocorrelação


Teste de Durbin Watson

Esse é o teste mais comum para diagnosticar a autocorrelação serial pela primeira
ordem.

A estatística para teste de Durbin Watson (d) é definida pela seguinte expressão:

(2)

O desenvolvimento da equação (2) mostra que o somatório de et tende a ser igual


ao somatório de , quando n aumenta. Assim, para grandes amostras, ter-se-á:

, em que é a estimativa do parâmetro de na equação (1).

Portanto:

se = 0 então d = 2 (ausência de autocorrelação);

se = 1 então d = 0 (autocorrelação positiva);

se = -1 então d = 4 (autocorrelação negativa).

105

book_econometria.indb 105 13/01/16 11:28


Capítulo 3

As hipóteses para o teste podem ser estabelecidas como segue:

H0 = 0 (ausência de autocorrelação);

H1 ≠
0 (presença de autocorrelação).

O valor calculado de d é comparado com os limites inferiores di e superiores ds de


valores, tabelados por Durbin Watson, como mostrado no gráfico:

Figura 3.2 – Teste Durbin Watson

Fonte: Elaborado pelo autor (2012).

Os limites di e ds são usados para testar a autocorrelação positiva (d < 2),


enquanto os limites (4 – ds) e (4 – di) permitem investigar a autocorrelação
negativa (d > 2).

•• Região I (d < di), rejeita-se a hipótese nula de ausência de


autocorrelação (H0) e se aceita a presença de autorrelação de
primeira ordem;
•• Região II, o teste é não conclusivo (di < d < ds);
•• Região III, (d > ds), aceita-se a hipótese nula (H0) e se rejeita H1;
•• Região IV se (4 – ds) < d < (4 – di), é não conclusivo;
•• Região V se d > (4 – di), rejeita-se a hipótese nula (H0) e a hipótese
alternativa (H1).

106

book_econometria.indb 106 13/01/16 11:28


Econometria

Exemplo 1
Fez-se um estudo durante vários meses em um bairro de uma grande
cidade, calculando-se o valor médio para o aluguel. Estimou-se esses
valores como função da atividade econômica (renda) e da taxa de juros
de curto prazo.

Tabela 3.1 – Valores médios de aluguel

Mês/ano Renda Aluguel médio Taxa de juros

Jan./10 294 100 2,1

Fev./10 297 102 2,1

Mar./10 238 98 2,0

Abril/10 219 100 1,8

Maio/10 310 99 1,8

Jun./10 305 87 1,6

Jul./10 257 86 1,7

Ago./10 249 84 1,8

Set./10 253 91 1,8

Out./10 251 92 1,7

Nov./10 327 93 1,6

Dez./10 338 90 1,5

Jan./11 349 95 1,4

Fev./11 365 96 1,2

Mar./11 327 99 1,1

Abril/11 349 102 1,5

Maio/11 344 103 1,7

Jun./11 327 101 1,8

Jul./11 329 105 2,0

Ago./11 469 108 1,9

Fonte: Elaborado pelo autor (2012).

107

book_econometria.indb 107 13/01/16 11:28


Capítulo 3

Passo 1

Regredir normalmente, mas como precisaremos dos resíduos para fazer


o teste de Durbin e Watson, vamos assinalar o box resíduos, como na
figura a seguir.

Figura 3.3 – Regressão com resíduos

Fonte: Elaborado pelo autor (2012).

O resultado será:

Figura 3.4 – Resultados da regressão

Fonte: Elaborado pelo autor (2012).

108

book_econometria.indb 108 13/01/16 11:28


Econometria

Os erros (resíduos):

Figura 3.5 – Resultados dos Resíduos

Fonte: Elaborado pelo autor (2012).

A coluna “previsto” é o Y chapéu, que, no nosso caso, são os preços


dos aluguéis. Os resíduos ou erros são as diferenças entre cada Y
da amostra (valores da Tabela 3.1) menos Y chapéu. Utilizaremos os
resíduos para fazer o teste de autocorrelação.

Escrevendo a função de regressão do modelo, temos:

R2 ajustado = 0,36
(4,74)* (3,24)* (2,23)*

Como podemos perceber, o modelo apresenta contradições nos seus


resultados, os sinais dos parâmetros são os esperados, todos os
parâmetros passam no teste t, como se espera, porém, o R2 ajustado é
muito baixo, o que nos leva a descartar o modelo para previsão, já que
o erro é maior que o poder de explicação do modelo. O fato de ser uma
série temporal nos indica a possibilidade de problema de autocorrelação.

109

book_econometria.indb 109 13/01/16 11:28


Capítulo 3

Passo 2

Agora vamos calcular o teste de Durbin Watson.

Para conseguirmos o d calculado, temos que defasar o e (erro), ou seja,


criar a variável defasada . Vamos criar a variável no Excel e depois
diminuir os valores e elevar ao quadrado.

Para criar a coluna et-1, você vai copiar a coluna et e colar uma célula
abaixo na , ou seja, na célula dois. Note que a segunda observação é
referente a fevereiro de 2010, um t (meses) menos 1 (de janeiro de 2010),
o que comprova a defasagem.

Observe que, ao defasar uma variável, perdemos uma observação da


amostra que tinha vinte dados e agora ficará com 19. Temos então que
apagar o último valor de que ficou fora da tabela.

Segue demonstração na figura:

Figura 3.6 – Cálculo de d

Fonte: Elaborado pelo autor (2012).

110

book_econometria.indb 110 13/01/16 11:28


Econometria

O resultado d é obtido clicando em 387,81 que a soma de


dividido pelo SQ do ANOVA, que é o nosso erro ao quadrado (479,28).

Então temos:

Agora vamos fazer o gráfico do teste de Durbin Watson, para comparar


este valor de d calculado com o d tabelado:

A nossa amostra apresenta os seguintes dados:

n = 20

k = 2 (número de variáveis explicativas)

111

book_econometria.indb 111 13/01/16 11:28


Capítulo 3

Consultando a tabela teste Gujarati, temos:

Cruzando as duas informações anteriores, vamos consultar a segunda


coluna k=2 e descer até o n igual a 20, temos:

112

book_econometria.indb 112 13/01/16 11:28


Econometria

di = 1,100

ds =1,537

4 – ds = 4 – 1,537 = 2,463

4 – di = 4 – 1,100 = 2,900

Figura 3.7 – Teste de Durbin Watson

Fonte: Elaborado pelo autor (2012).

O d calculado é menor que 1,100 e cai na região I, ou seja, o modelo


apresenta autocorrelação positiva. Após a constatação de presença de
autocorrelação, vamos estudar um método para corrigir a autocorrelação
dos resíduos.

As causas e consequências da autocorrelação dos resíduos, como acabamos


de estudar, afetam nossos resultados e, principalmente, a decisão de usar ou
não usar a função de regressão para previsões futuras. O cálculo do d do teste
de Durbin Watson nos garante a verificação dos problemas. Na próxima seção,
vamos estudar o método de correção desse problema.

1.2 Método de correção


Para a correção do problema de autocorrelação, primeiro vamos mostrar como o
problema da autocorrelação pode ser tratado e depois apresentar métodos para
eliminá-lo.

Racionalização do problema

Uma vez diagnosticado o problema da autocorrelação serial, é possível eliminar


seus efeitos por meio da transformação das variáveis, essa transformação se
chama MOG (método dos Mínimos Ordinários Generalizados).

Vamos desenvolver o método!

113

book_econometria.indb 113 13/01/16 11:28


Capítulo 3

Veja o seguinte modelo linear simples:

(4)

Em que:

et é gerado por um processo autorregressivo de primeira ordem, do tipo:

(5)

Desse modo, substituindo-se 5 em 4, obtém-se a seguinte equação:

(6)

Com uma defasagem, a equação 4 será:

, ou seja,

(7)

Portanto, substituindo-se 7 em 6 e reordenando os termos, tem-se a seguinte


equação:

(8)

Fazendo-se:

A equação 8 ficará (9)

O raciocínio pode ser entendido para casos de mais de uma variável explicativa.

Portanto, conhecendo-se o valor de e feitas as transformações requeridas por


(8), obtém-se uma estimativa corrigida da equação original (4). O parâmetro é,
no entanto, desconhecido.

Existem vários métodos para estimá-lo, sendo alguns deles apresentados a


seguir:

114

book_econometria.indb 114 13/01/16 11:28


Econometria

Método de correção da autocorrelação


Método de dois estágios de Durbin:

•• transforma-se a equação 8
;

•• estima-se , que é o coeficiente de Yt-1 na equação anterior;


•• as transformações requeridas são realizadas por 8, obtendo-se a
expressão cuja estimativa será a equação corrigida:

Generalizando, tem-se:

Fazendo-se:

................

Dessa forma, a equação transformada será:

(10)

Vamos continuar resolvendo nosso exemplo.

Passo 3: calcular o

Modelo inicial:

Inclusão da variável defasada:

Note que nosso modelo tinha três variáveis, sendo uma dependente Y e duas
explicativas X1 e X2. Para estimar o , acrescentamos como variáveis explicativas
o X1 defasado (t-1) e o X2 defasado e também o Y defasado. Observe que o Y
agora se torna uma variável explicativa e o coeficiente estimado para esta variável
será o . Esse valor se faz necessário para transformar as variáveis originais
e eliminar o problema de autocorrelação.

115

book_econometria.indb 115 13/01/16 11:28


Capítulo 3

Para calcular esse coeficiente, vamos incluir na nossa planilha os dados iniciais e
mais cada variável defasada.

Figura 3.9 – Inclusão das variáveis defasadas

Fonte: Elaborado pelo autor (2012).

Agora vamos regredir com as seis variáveis:

Antes de regredir, cole a tabela em outra planilha e delete a primeira linha.


Nessa regressão, estamos interessados somente no rô, ou seja, o coeficiente
de Aluguéis (t-1), e para tanto não se faz necessário testar os parâmetros e nem
avaliar o R2.

116

book_econometria.indb 116 13/01/16 11:28


Econometria

Figura 3.10 – Resultado da regressão com as variáveis defasadas

Fonte: Elaborado pelo autor (2012).

Do resultado da regressão acima, temos que o = 0,75.

Com o rô estimado, podemos transformar o modelo como segue:

Fazendo-se:

Então, nossa função vai ficar:

Para estimar esta nova função derivada da anterior, temos que criar as três novas
variáveis dessa forma para o primeiro valor de W. Clique na célula em branco
abaixo da variável e digite igual (=), depois clique em Y (102) e em seguida digite o
sinal - (menos), colocando entre parênteses o valor de rô (0,75), pressione * (para
multiplicar) e clique no valor de Yt-1 que é 100. Dê um enter para calcular e depois
arraste para todos os valores. Repita o mesmo procedimento para as demais
variáveis e a tabela vai ficar desta forma:

117

book_econometria.indb 117 13/01/16 11:28


Capítulo 3

Figura 3.11 – Novas variáveis

Fonte: Elaborado pelo autor (2012).

Agora sim podemos regredir novamente ao modelo após a transformação das


variáveis originais, como segue:

Figura 3.12 – Resultado da regressão com as variáveis transformadas

Fonte: Elaborado pelo autor (2012).

118

book_econometria.indb 118 13/01/16 11:28


Econometria

Escrevendo a nova equação da função:

W^ = 18,79 + 0,03Z1 + 7,56Z2 R2 ajustado = 0,08


(5,77)* (1,49) (1,21)

Note que o modelo piorou significativamente, o R2 muito baixo e ambos os


parâmetros b1 e b2 não passam no teste t. O que atesta que o modelo não serve
para previsão mesmo sanando o problema de correlação, isso significa que o
problema do modelo pode ser de outra natureza.

Observe que o processo de testar e estimar os modelos nem sempre reportam


aos resultados que queríamos como comportamento teórico e relacional, porém,
não invalida o estudo do problema.

Seção 2
Heteroscedasticidade
É desejável que a variância dos resíduos ei seja constante, ou seja,
homoscedasticidade , a variância dos resíduos é igual a signa dois.
A violação desse pressuposto é a heteroscedasticidade que se refere ao fato de a
variância de ei, não ser constante, isto é,

Figura 3.13 - Gráficos típicos de heteroscedasticidade

Fonte: Elaborado pelo autor (2012).

A consequência da heteroscedasticidade é que o método dos mínimos quadrados


ordinários não gera estimativas de parâmetros eficientes ou de variância mínima,
o que implica erros padrões viesados e incorreção dos teste t e F. Tal problema é
mais frequente em séries não temporais, ou seja, cross section.

119

book_econometria.indb 119 13/01/16 11:28


Capítulo 3

Pressupostos sobre a natureza do Heteroscedasticidade


Seja o modelo linear geral:

No caso de heterocesdasticidade, a , a variância é diferente de


sigma ao quadrado. Isso implica afirmar que . O caso
mais frequente é que ei, o erro, é, de algum modo, relacionada a Xi.

Para obtermos bons resultados no modelo de regressão, esses termos


devem ser independentes, ou seja, não podem apresentar correlação.

Uma forma especificativa plausível para a associação entre ei e Xi é a seguinte:

(1)

Tal forma especificativa envolve os parâmetros e c. O c é particularmente


importante, porque mede a força da heteroscedasticidade. Quanto mais próximo
de zero for o valor de c, menos expressiva será a dispersão dos resíduos ei. (c = 0
não haverá heterocesdasticiade).

A partir de (1), conclui-se que o desvio padrão (DP) de ei será:

Organizando a equação temos:

Dessa forma, para obter variância constante (homoscedestacidade), basta dividir


a equação original por Xc/2 .

No caso do modelo linear simples Y = b0 + b1X +e, a equação transformada, após


a divisão, será:

Dessa forma:

O que assegura a homoscedasticidade.

120

book_econometria.indb 120 13/01/16 11:28


Econometria

Caso c = 2, a equação será:

Fazendo-se:

Y/X = W

1/X = S

e/X = u,

A equação, depois da transformação das variáveis será:

(2)

Quando c = -2, o fator de ponderação será X-1 = 1/X

Portanto:

(e)

(homoscedasticidade)

Fazendo-se:

YX = U

X2 = Z

eX =s, ter-se-á:

(3)

Aplicando-se mínimos quadrados às equações (2) e (3), obtém-se estimativas dos


parâmetros do modelo, trata-se do método de mínimos quadrados ponderados
(MQP). Estamos ponderando, ou seja, dividindo toda a equação pelo X, que pode
apresentar o problema de correlação com erro.

Vamos aprender a identificar o problema de heteroscedasticidade a partir de um


teste, e, caso o problema seja identificado, aprenderemos a corrigi-lo e estimar o
modelo com o MQP.

121

book_econometria.indb 121 13/01/16 11:28


Capítulo 3

2.2 Método de correção do problema


Para identificar o problema de heroscedasticidade em um conjunto de dados,
vamos aplicar o teste de Quandt e Goldfeld, que envolve fazer duas regressões
parciais dos dados e classificar os resultados a partir dos limites dados pelo teste.

Teste de Quandt-Goldfeld
O teste consiste nos seguintes passos:

1. Ordenam-se as observações de X que, hipoteticamente, está correlacionada


com os resíduos.

2. Seleciona-se arbitrariamente certo número de observações centrais (c), que


serão omitidas da análise.

•• Em geral, omitem-se 1/5 das observações.


•• As (n – c) observações restantes são divididas em duas subamostras
de tamanhos iguais, uma incluindo valores menores de X e outra, os
maiores.

3. Estima-se regressões separadas e obtém-se a soma de quadrados dos


resíduos para cada subamostra:

•• SQRb = soma de quadrados dos resíduos mais baixos de X


•• SQRe = soma de quadrados dos resíduos mais elevados de X

4. Com essas informações, define-se a seguinte estatística F:

(4)

F* com (n – c-2k)/2 graus de liberdade tanto para o numerador quanto para


denominador.

Em que:
n = número de observações;
c = número de observações omitidas;
K= número de variáveis explicativas.

122

book_econometria.indb 122 13/01/16 11:28


Econometria

Figura 3.14 -Gráfico teste de Grandt-Goldfeld

Fonte: Elaborado pelo autor (2012).

Se as variâncias das duas subamostras forem aproximadamente iguais, F tende


a 1 e a hipótese nula de ausência de heterocedasticidade (H0) será aceita. À
medida que a diferença entre as duas variâncias se amplia, o problema de
heteroscedasticidade vai ficando mais sério. Se F* observado > F crítico, a
hipótese nula de homocedasticidade será rejeitada.

123

book_econometria.indb 123 13/01/16 11:28


Capítulo 3

Exemplo 2
Com os dados da tabela a seguir, faça a regressão dos salários
em função dos anos de estudo, levantamento feito em 2009, em
Florianópolis. Verifique a existência de heterocedsticidade, em caso
positivo, faça as correções devidas e reestime o modelo.

Tabela 3.2 – Salários e anos de estudo

Salários Anos de estudo

1099 5

1243 8

4305 23

220 0

1757 9

1842 10

2181 11

3464 17

120 0

2821 15

4140 22

1439 8

1847 11

130 0

251 1

1801 9

3788 22

145 0

467 2

861 4
continua...

124

book_econometria.indb 124 13/01/16 11:28


Econometria

3692 21

2587 15

2900 15

507 2

1226 7

3259 17

2033 11

2029 11

1618 8

637 3

2216 12

3078 16

1160 6

2335 12

3223 16

1630 8

2367 13

Fonte: Elaborado pelo autor (2012).

Passo 1: Ordenar os dados

Para ordenar os dados, clique na coluna de dados de salário depois


clique no filtro do Excel (classificar e filtrar), conforme Figura 3.15,
selecione a primeira opção, classificar do menor para o maior. Na caixa
de Aviso de classificação, selecionar Expandir a seleção e clicar em
Classificação.

125

book_econometria.indb 125 13/01/16 11:28


Capítulo 3

Figura 3.15 - Ordenar os dados

Fonte: Elaborado pelo autor (2012).

Passo 2: dividir a amostra em dados mais baixos e mais elevados

Antes de dividir a amostra em duas subamostras iguais, temos que


retirar 1/5 do meio da amostra. Como nosso exemplo tem 37 dados, um
quinto de 37 é 7,4 vamos arredondar para 7. Assim, 37 – 7 = 30. Dessa
forma, vamos trabalhar com 15 dados mais baixos, pulamos 7 e depois
com as últimas 15 observações mais elevadas.

Figura 3.16 - Cálculo do erro ao quadrado dos valores mais baixos

Fonte: Elaborado pelo autor (2012).

126

book_econometria.indb 126 13/01/16 11:28


Econometria

Agora, vamos calcular o erro ao quadrado da amostra dos valores mais


alto da amostra, lembre-se de pular os valores centrais.

Figura 3.17 - Cálculo do erro ao quadrado dos valores mais elevados

Fonte: Elaborado pelo autor (2012).

Passo 3: Cálculo do F*

Graus de liberdade = (37 – 7 – (2*1))/2 = 28/2 = 14

Valor de F(tabelado)

F14/14=2,46 (como não temos 14 no numerador este é o valor do F14/15)

Como F calculado (3,17) é maior que F tabelado (2,46), a amostra


apresenta heteroscedasticidade.

Passo 4: Correção dos dados

Vamos transforma nossa equação inicial:

Em que: W é salários e E anos de estudo.

Vamos dividir toda a equação por E, nosso X, ou seja, a variável


explicativa.

127

book_econometria.indb 127 13/01/16 11:28


Capítulo 3

Desta forma a nova equação será

Para regredir a nova equação, temos que criar as novas variáveis,


voltando à tabela original com todos os dados da amostra. Para calcular
Z, clique na primeira célula da coluna, em seguida em =, e depois no
primeiro valor W barra (/) para dividir, e clique no primeiro valor de E. Em
seguida, tecle enter para calcular o primeiro valor e basta arrastar para
calcular os demais. Repetir o mesmo procedimento para o cálculo de S.

Figura 3.18 - Cálculo das variáveis ponderadas

Salários Anos de estudo Z(W/E) S(1/E)

120 0 120 1

130 0 120 1

145 0 145 1

220 0 220 1

251 1 251,00 1,00

467 2 233,50 0,50

507 2 253,50 0,50

637 3 212,33 0,33

861 4 215,25 0,25

1099 5 219,80 0,20

1160 6 193,33 0,17

1226 7 175,14 0,14

1243 8 155,38 0,13

1439 8 179,88 0,13

1618 8 202,25 0,13

1630 8 203,75 0,13


continua...

128

book_econometria.indb 128 13/01/16 11:28


Econometria

1757 9 195,22 0,11

1801 9 200,11 0,11

1842 10 184,20 0,10

1847 11 167,91 0,09

2029 11 184,45 0,09

2033 11 184,82 0,09

2181 11 198,27 0,09

2216 12 184,67 0,08

2335 12 194,58 0,08

2367 13 182,08 0,08

2587 15 172,47 0,07

2821 15 188,07 0,07

2900 15 193,33 0,07

3078 16 192,38 0,06

3223 16 201,44 0,06

3259 17 191,71 0,06

3464 17 203,76 0,06

3692 21 175,81 0,05

3788 22 172,18 0,05

4140 22 188,18 0,05

4305 23 187,17 0,04

Fonte: Elaborado pelo autor (2012).

Na Figura 3.18, temos as variáveis ponderadas calculadas. Note que


nesse caso temos uma peculiaridade: quando valores de X forem iguais
a zero, para esses casos, desconsidere o valor de erro e repita o valor

129

book_econometria.indb 129 13/01/16 11:28


Capítulo 3

original da variável.

Resultado da regressão antes do teste de heteroscedasticidade.

(2,91)* (54,71)*

Notamos que os dados iniciais são bons, mas, como os dados


apresentam o problema de heteroscedasticidade, eles podem ser
viesados.

(-0,56) (32,53)*

Note que o modelo é bem pior que o inicial, o R2 é muito próximo do


zero e o teste da variável explicativa não passa. Dessa forma, o modelo
estimado pelo método dos mínimos quadrados ponderados não serve
para previsão.

No caso de um modelo de regressão múltipla, temos que fazer hipótese


sobre um dos X e testá-lo, e caso não apresente o problema de
heteroscedasticidade, testamos o X2, e assim por diante.

Agora vamos estudar o problema multicolineariadade dos dados, esse


não é um problema muito relevante, mas é importante estar ciente do
seu conceito.

130

book_econometria.indb 130 13/01/16 11:28


Econometria

Seção 3
O problema de Multicolinearidade
Multicolinearidade refere-se à correlação entre duas variáveis explicativas
incluídas na equação de modelo. A multicolinearidade ocorre, quando, por
exemplo, duas variáveis X1 e X2 medem aproximadamente a mesma coisa, ou
seja, a correlação entre elas é quase perfeita. Quando tal correlação é elevada, a
eficiência dos parâmetros estimados é significativamente afetada, tornando-os
instáveis.

Os coeficientes estimados pelo MMQ podem ser estatisticamente não


significantes (e ainda ter sinal errado), ainda que R2 seja “alto”.

Em síntese, as consequências da multicolinearidade são:

1. Matriz de variância com valores muito elevados;


2. Possibilidade de conflito entre os resultados dos testes t, F e R2;
3. Grande sensibilidade dos parâmetros a pequenas mudanças na
amostra.

Identificação da existência de multicolinearidade


e tratamento
Para identificar multicolinearidade, podemos calcular o coeficiente de correlação
(r) entre cada par de variáveis explicativas. Se para algum (alguns) dos pares eles
forem superior a 0,8, deve-se considerar a existência do problema.

O tratamento da multicolinearidade

a. aumento do tamanho da amostra;


b. uso de informação a priori sobre o valor da estimativa dos
parâmetros, obtida de estudo prévio;
c. transformação da forma funcional;
d. exclusão das variáveis colineares;
e. uso de razão ou primeiras diferenças;
f. não fazer nada.

Às vezes é muito difícil conseguir aumentar o tamanho da amostra, ou seja,


conseguir mais dados passados. Dessa forma, optaremos por não fazer nada.

131

book_econometria.indb 131 13/01/16 11:28


Capítulo 3

Atividades de Autoavaliação
1. A tabela a seguir demonstra as despesas com máquinas e equipamentos de
utilidade pública (Y) PNB e Índice de preço de produto (IPP).

Ano 1993 1994 1995 1996 1997 1998 1999 2000 2001

Y 14,9 15,0 15,5 16,3 17,4 18,7 20,2 21,6 23,1

PNB 573,8 604,7 645,7 698,1 763,0 806,3 878,5 945,5 992,4

IPP 102,8 103,8 104,6 105,7 108,2 110,0 113,7 118,4 123,5

Ano 2002 2003 2004 2005 2006 2007 2008 2009 2010

Y 25,3 27,0 28,7 30,6 30,1 32,3 35,8 39,5 43,2

PNB 1073,4 1181,1 1316,6 1422,9 1538,8 1712,2 1909,5 2137,6 2378,5

IPP 127,4 130,9 139,9 155,5 168,4 175,2 184,7 197,1 218,4

Faça o teste de Durbin Watson para detectar a autocorrelação.

2. A partir do exercício 1, corrija o problema de autocorrelação pelo método de


Durbin de dois estágios.

3. A partir do modelo estimado na questão dois, após as correções, analise os


resultados finais do modelo.

4. Redefina o modelo resultante na questão 3, para que se possa usar o modelo


para a previsão.

5. Podemos garantir que o novo modelo proposto em 4 não apresenta problema


de autocorrelação? Justifique a sua resposta.

6. Classifique as alternativas abaixo: V (verdadeiro) e F (falso). .

a)  ( )  Multicolinearidade é um problema de dados apresentados exclusivamente


em cross section.
b)  ( )  As principais fontes de autocorrelação serial são: a omissão de alguma
variável importante; a má especificação da forma matemática e do termo
aleatório e os ajustes imperfeitos de séries estatísticas.
c)  ( )  Sempre que se localiza multicolinariedade em duas variáveis, deve-se
excluí-las da equação.
d)  ( )  O principal tratamento da multicolinearidade e o aumento do tamanho da
amostra.

132

book_econometria.indb 132 13/01/16 11:28


Econometria

7. A tabela abaixo demonstra os dados de consumo e renda de várias famílias


para o ano de 2015, na cidade de Imbituba. Observe que os dados já estão
ordenados.

Consumo Renda

55 80

65 85

70 90

74 100

75 105

79 110

80 115

84 120

90 125

95 130

98 140

108 145

110 150

113 160

115 165

120 180

125 185

130 190

135 200

137 205

140 210

140 220

144 225

145 230

152 240
continua...

133

book_econometria.indb 133 13/01/16 11:28


Capítulo 3

175 245

178 250

180 260

189 265

191 270

A partir dos dados acima, faça o teste de heterocedasticidade, pondere as


variáveis e reestime o modelo.

134

book_econometria.indb 134 13/01/16 11:28


Capítulo 4

Equações simultâneas
Em alguns casos na teoria econômica, uma variável pode assumir o papel de
variável dependente numa função e, ao mesmo tempo, ou simultaneamente, ser
uma variável independente em outra função.

A identidade macroeconômica de Keynes é um bom exemplo, pois a renda


(Y) depende, entre outras variáveis, do agregado do consumo. Por sua vez, o
consumo das famílias depende do nível de renda. Note que na função de renda,
o consumo é uma variável explicativa, ou seja, um X, e na função consumo é uma
variável dependente do nível de renda.

Para variáveis que apresentam essas características, não podemos estimar com
o método clássico de estimação de regressão. Para isso, vamos introduzir um
novo método de estimação que leva em consideração o sistema de equações
simultâneas.

Seção 1
Conceito e natureza
Até agora estudamos exclusivamente modelos de equação única, isto é,
modelos em que havia uma única variável dependente Y e uma ou mais variáveis
explicativas, os Xs. Em tais modelos, a ênfase foi na estimativa e/ou previsão do
valor médio de Y condicionado aos valores das variáveis Xs. A relação de causa e
efeito em tais modelos, portanto, flui dos Xs para o Y.

Segundo Gujarati (2011), em muitas situações, porém, não faz sentido tal relação
de causa e efeito de mão única, ou unidirecional. Isso ocorre se Y é determinado
pelos Xs, e alguns dos Xs são, por sua vez, determinados por Y. Ou seja, há uma
relação de mão dupla, ou simultânea, entre Y e (alguns dos) Xs. No modelo de
equações simultânea é possível reunir um conjunto de variáveis que possam ser
determinados simultaneamente pelo conjunto restante de variáveis.

135

book_econometria.indb 135 13/01/16 11:28


Capítulo 4

Assim, ao contrário dos modelos de equação única, nos modelos de equações


simultâneas, não podemos estimar os parâmetros de uma única equação sem
levar em conta informações fornecidas por outras equações no sistema.

Em tais modelos, há mais de uma equação, uma para cada das variáveis
mutuamente ou conjuntamente dependentes, ou variáveis endógenas.

No contexto dos modelos de equações simultâneas, as variáveis conjuntamente


dependentes são chamadas de variáveis endógenas, e as variáveis
verdadeiramente não estocásticas, ou que possam ser assim consideradas, são
chamadas de variáveis exógenas ou predeterminadas. Endógena determinada
variável dentro do modelo e exógena fora do modelo.

Exemplo 1
Modelo de demanda e oferta

O preço, P, de uma mercadoria e a quantidade vendida, Q, são


determinados pela intersecção das curvas de demanda e oferta dessa
mercadoria. Assim, admitindo, por questão de simplicidade, que as
curvas de demanda e oferta sejam lineares, e acrescentando os termos
de perturbação estocástico, ou seja, o erro e1 e e2, segundo Gujarati
(2011), podemos escrever as funções demanda e oferta empíricas como:

Função demanda

Função oferta

Condições de equilíbrio

Em que:

Qd = quantidade demandada;

Qo = quantidade ofertada;

P = Preço;

t = tempo.

Espera-se que o sinal de b1 seja negativo, uma vez que a função


demanda é negativamente inclinada, ou seja, quanto maior o preço
menor a Qtd. Já a alta de preço tem um efeito contrário na curva de
oferta, que é positivamente inclinada. Nesse caso, as perturbações na
função de demanda mudam o preço e quantidade da demanda que, por
consequência, afetam a quantidade de oferta, e assim por diante.

136

book_econometria.indb 136 13/01/16 11:28


Econometria

Exemplo 2
Modelo Keynesiano de determinação da renda.

Considere o modelo Keynesiano simples de determinação da renda:

Função consumo

Identidade de renda

Em que:

C = consumo;

Y = renda;

I = investimento (admitido como exógeno);

S= poupança;

t= tempo;

= termo de perturbação estocástica (erro);

= parâmetros;

= PMgC (propensão marginal a consumir)

A função consumo (C) depende de renda (Y), sendo que as famílias,


para consumirem, dependem de renda para tal. A identidade de renda
total é resultado da soma do consumo total mais investimentos totais,
considerando que investimento é igual à poupança. Dessa forma, as
variáveis C e Y são interdependentes, o consumo é determinado pelo
nível de renda, porém, também determina a renda total. Na primeira
equação, C é uma variável dependente, e, na segunda, é uma variável
independente ou explicativa.

Para os dois exemplos, não podemos estimar as funções pelo MQO (mínimos
quadrados ordinários), pois, se aplicarmos isso, os parâmetros estimados serão
inconsistentes, dessa forma, vamos aprender um método alternativo para esses
casos.

137

book_econometria.indb 137 13/01/16 11:28


Capítulo 4

Seção 2
Método dos mínimos quadrados indiretos (MQI)
Os modelos de equações simultâneas pressupõem um sistema de equações
representantes do problema estudado. Desse pressuposto temos o problema de
identificação do sistema de equações. Quanto à estimativa de uma equação é
exatamente identificada, usamos o MQI para estimativa das equações reduzidas,
já quando a estimativa de uma equação é sobre identificada, usaremos o MQ2E,
o método de dois estágios para estimar as equações reduzidas. Primeiramente,
vamos desenvolver o método MQI.

Segundo Matos (2000), o termo identificação em econometria refere-se


à possibilidade ou não de se obter os parâmetros estruturais de uma
equação pertencente a um sistema simultâneo, a partir das equações
reduzidas. Tal equação é identificada se seus parâmetros podem ser
obtidos a partir dos parâmetros estimados das equações reduzidas. Se a
equação não for identificada, as estimativas de seus parâmetros podem
referir-se a outra equação do sistema ou constituir-se uma mistura das
duas.

Hill et al. (2010) destaca que a condição necessária para identificação em um


sistema de M equações simultâneas, que determinam conjuntamente os valores
de M variáveis endógenas, é que, ao menos, M-1 variáveis devem estar ausentes
de uma equação para que seja possível estimar seus parâmetros.

Quando é possível a estimação dos parâmetros de uma equação, essa se diz


identificada, e seus parâmetros podem ser estimados consistentemente. Se
s M-1 variáveis são omitidas de uma equação, essa é não identificada e seus
parâmetros não podem ser estimados.

Para uma equação simultânea, o método para obter as estimativas dos


coeficientes a partir das estimativas de MQO dos coeficientes na forma
reduzida é conhecido como método dos mínimos quadrados indiretos
(MQI), e as estimativas assim obtidas são conhecidas como estimativas
por mínimos quadrados indiretos.Uma equação na forma reduzida é a
que tem uma variável endógena unicamente em termos das variáveis
predeterminadas e perturbações estocásticas.

138

book_econometria.indb 138 13/01/16 11:28


Econometria

Exemplo 3
Para ilustrar, considere o modelo Keynesiano de determinação de
renda.

Função consumo h (1)

Identidade de renda (2)

Neste modelo, C (consumo) e Y (renda) são as variáveis endógenas


e I (investimento) é tratado como uma variável exógena. Ambas as
equações anteriores são estruturais, sendo que (2) é uma identidade.

Vamos transformar as equações originais em reduzidas:

Passo 1:

Substituindo (1) em (2) temos:

Equação:

, como consumo é representado por , temos:

, juntando as variáveis iguais

colocando em evidência a renda

(3)

Em que:

A equação (3) é uma equação na forma reduzida; ela expressa a


variável endógena Y unicamente como uma função da variável exógena
(ou predeterminada) I e do termo de perturbação estocástico w. Os
parâmetros e são os coeficientes na forma reduzida.

139

book_econometria.indb 139 13/01/16 11:28


Capítulo 4

Passo 2:

Substituindo (2) em (1) temos:

(4)

Em que:

A equação (4) é uma equação na forma reduzida; ela expressa a variável


endógena C, unicamente como uma função da variável exógena
(ou predeterminada) I e do termo de perturbação estocástico w. Os
parâmetros e são os coeficientes na forma reduzida.

Note que agora temos duas equações como no início, porém, ambas
são determinadas ou explicadas pelo mesmo X, ou seja, I (investimento)
e pela mesma quantidade de X, no caso um.

O método dos MQI envolve os três passos a seguir:

Passo 1: primeiro, obtemos as equações na forma reduzida;

Passo 2: aplicamos o método dos MMQ às equações na forma reduzida


individualmente;

Passo 3: obtemos estimativas dos coeficientes estruturais por meio dos


coeficientes estimados na forma reduzida, obtidos no passo 2.

140

book_econometria.indb 140 13/01/16 11:28


Econometria

Exemplo 4
Na tabela abaixo temos os dados referentes ao mercado de um produto
agrícola. Em que Q representa quantidades em toneladas, P preço US$/
kg e Renda em número índice com base em 1977=100. Estime a oferta e
a demanda pelo MQI – método dos mínimos indiretos.

Tabela 4.1 – Mercado de um produto agrícola

Ano Q P Y

1977 236,2 20,06 100

1978 238,1 20,86 111

1979 245,3 20,68 110

1980 243,6 20,90 112

1981 250,1 19,60 114

1982 247,7 19,90 114

1983 249,6 20,22 118

1984 239,8 20,96 123

1985 240,9 19,30 110

1986 246,7 18,24 101

1987 228,9 18,62 85

1988 221,8 19,76 87

1989 226,8 20,58 96

1990 237,1 19,76 103

1991 253,9 19,02 117

1992 240,5 19,70 120

1993 248,4 17,30 110

1994 239,8 20,80 119

1995 252,5 21,16 126

1996 254,9 22,70 145

Fonte: Suganuma (2000).

141

book_econometria.indb 141 13/01/16 11:28


Capítulo 4

Sistema de equações que representam o modelo:

Função Demanda (1)

Função oferta (2)

Em que:

Qd = quantidade demanda

Qs = quantidade ofertada

P = preço

Y = renda Suponha que Y seja exógeno.

= erro

Resolvendo:

Primeiro, obter as equações reduzidas

Passo 1: antes de substituir 1 em 2, temos que transformar a equação


oferta de Q para P.

Oferta (2)

(2)

Passo 2: Substituindo (1) em (2) temos:

(tirar o m.m.c. do coeficiente de P)

142

book_econometria.indb 142 13/01/16 11:28


Econometria

(3)

Passo 3: Substituindo (2) em (1) temos:

(tirar o m.m.c. do coeficiente de


Q e do intercepto)

(4)

143

book_econometria.indb 143 13/01/16 11:28


Capítulo 4

Dessa forma, as equações na forma reduzida correspondentes às


equações estruturais anteriores são:

(3)

(4)

Segundo, estimar as equações reduzidas por MQO

Observe que cada equação na forma reduzida contém uma variável


endógena, que é a variável dependente e que é uma função
exclusivamente da variável exógena Y(renda) e das perturbações
estocásticas, ou seja, do erro.

Por isso, os parâmetros das equações na forma reduzida anteriores


podem ser estimados por MQO.

Essas estimativas são:

Terceiro, a partir dos parâmetros estimados por MMQ, calculamos


os coeficientes estruturais

Como nosso objetivo primordial é determinarmos os coeficientes


estruturais, vejamos se podemos estimá-los pelos coeficientes na forma
reduzida. Portanto, seus parâmetros podem ser unicamente estimados
pelos coeficientes na forma reduzida como segue:

144

book_econometria.indb 144 13/01/16 11:29


Econometria

Consequentemente, as estimativas desses parâmetros podem ser


obtidas das estimativas dos coeficientes na forma reduzida:

Note que os parâmetros da função demanda não podem ser estimados.

Resolvendo no Excel:

Passo 1:

Estimar a equação reduzida da Oferta:

Figura 4.1– Regressão função oferta

Fonte: Elaborado pelo autor (2012).

(7,70)* (2,91)*

Passo 2:

Estimar a equação reduzida da Demanda:

145

book_econometria.indb 145 13/01/16 11:29


Capítulo 4

Figura 4.2 – Regressão função demanda

Fonte: Elaborado pelo autor (2012).

(16,74)* (5,16)*

Passo 3:

A partir das duas equações reduzidas podemos, calcular os parametros


estruturais.

Voltando para a função estrutural de oferta inicial, temos:

Dessa forma, temos coeficientes consistentes para a função oferta pelo


método dos quadrados indiretos.

146

book_econometria.indb 146 13/01/16 11:29


Econometria

Seção 3
Método de dois estágios para estimação
de mínimos quadrados (MMQ2E)
Os dois estágios desse método são:

Primeiro: a estimação por mínimos quadrados da equação reduzida Y e o cálculo


de seu valor previsto (Y chapéu);

Segundo: a estimação por mínimos quadrados da equação estrutural em que a


variável endógena do lado direito Y é substituída por seu valor previsto .

Procedimento Geral de estimação de mínimos quadrados em dois estágios:

Podemos utilizar o método de estimação de mínimos quadrados em dois estágios


para estimar os parâmetros de qualquer equação identificada dentro de um
sistema de equações simultâneas. Em um sistema de M equações simultâneas,
sejam Y1, Y2, ....,Ym as variáveis endógenas e K variáveis exógenas X1, X2, ..., Xk,
suponha que a primeira equação estrutural dentro deste sistema seja:

(1)

Se essa equação é identificada, então, seus parâmetros podem ser estimados por
meio dos dois passos abaixo:

Passo 1: estimar por mínimos quadrados os parâmetros das equações em forma


reduzida:

Podemos obter os valores previstos:

Passo 2: substituindo as variáveis endógenas Y2 e Y3 no lado direito da equação


estrutural (equação 1) por seus valores previstos na equação 2:

(2)

Finalmente, estimamos por mínimos quadrados os parâmetros dessa equação.

147

book_econometria.indb 147 13/01/16 11:29


Capítulo 4

As propriedades do estimador de MMQ2E:

•• o estimador MMQ2E é um estimador tendencioso, mas é


consistente;
•• em grandes amostras, o estimador MMQ2E tem distribuição
aproximadamente normal.
•• as variâncias e covariâncias do estimador MMQ2E são
desconhecidas em pequenas amostras, mas para grandes amostras
dispomos de expressões que podem servir como aproximações.
Essas fórmulas estão embutidas no software econométrico, que
dão desvio padrão e valores t precisamente como um programa de
regressão de mínimos quadrados comum.

Exemplo 5
As trufas, um tipo de cogumelo subterrâneo, são usadas na gastronomia.
Na França, são localizados por pessoas que utilizam porcos para fareja-
las. Hill et al. (2010):

Tabela 4.2 – Mercado de trufas

Obs. P q Ps rd Pf

1 9,88 19,89 19,97 21,03 10,52

2 13,41 13,04 18,04 20,43 19,67

3 11,57 19,61 22,36 18,70 13,74

4 13,81 17,13 20,87 15,25 17,95

5 17,79 22,55 19,79 27,09 13,71

6 12,84 6,37 15,98 24,89 24,95

7 18,11 15,02 17,94 22,94 24,17

8 13,52 10,22 17,09 21,96 23,61

9 22,45 23,64 22,72 38,85 19,52

10 16,55 16,12 15,74 31,69 20,03

11 19,39 24,55 24,64 26,23 15,38


continua...

148

book_econometria.indb 148 13/01/16 11:29


Econometria

12 22,29 18,92 23,70 30,07 22,98

13 16,65 11,94 15,93 33,67 25,76

14 21,65 18,93 23,34 32,90 25,17

15 17,56 12,60 15,21 37,46 25,82

16 20,40 20,49 26,04 35,18 19,31

17 26,85 22,94 22,95 43,81 26,02

18 29,98 21,08 27,10 41,21 29,65

19 23,59 16,68 23,65 38,20 27,45

20 19,11 17,61 20,06 43,98 18,00

21 15,41 16,62 26,38 37,64 18,87

22 25,81 20,99 24,28 45,24 24,58

23 27,67 24,53 26,64 48,15 25,25

24 23,57 19,67 22,65 36,70 24,24

25 22,25 23,29 19,68 43,92 22,63

26 25,60 16,64 23,82 46,03 27,35

27 27,90 20,81 28,98 46,32 30,34

28 27,00 14,95 18,52 48,94 24,12

29 29,48 26,27 28,16 51,25 34,01

30 35,15 20,65 28,43 48,36 34,01

Fonte: Hill et al.(2010).

Considere um modelo de oferta e de demanda de trufas:

Demanda

Oferta

Nessa equação de demanda, q é a quantidade de trufas negociadas em


determinado mercado Francês no instante t;P é o preço de mercado das
trufas; Ps é o preço de mercado de um substituto das trufas reais, como
outro fungo de menor valor; e rd é a renda disponível per capita.

149

book_econometria.indb 149 13/01/16 11:29


Capítulo 4

A equação de oferta contém o preço de mercado e a quantidade


ofertada. Inclui também Pf, o preço de um fator de produção, que em
nosso caso é o preço do aluguel, por hora, dos porcos usados no
farejamento.

Nesse modelo as variáveis exógenas são Ps, rd, Pf e o intercepto.

A regra para identificar uma equação é que, em um sistema de M


equações, ao menos M-1 variáveis sejam omitidas de cada equação,
para que ela seja identificada. Na equação de demanda, a variável
pf não está incluída e assim temos a condição M-1, ou seja, uma
variável é omitida. Na equação de oferta, estão ausentes tanto ps
como rd, situação mais do que suficiente para satisfazer a condição de
identificação.

Concluímos, portanto, que cada equação nesse sistema é identificada,


podendo, assim ser estimada por mínimos quadrados de dois estágios.
Por que razão as variáveis são omitidas de suas respectivas equações?
Porque a teoria econômica diz que o preço de um fator deve afetar a
oferta, mas não a demanda; e o preço de bens substitutos e a renda
devem afetar a demanda, mas não a oferta.

As equações em forma reduzida

As equações em forma reduzida expressam cada variável endógena, p e q,


em termos das variáveis exógenas, ps, pf e rd e o intercepto, mais o termo
estocástico (erro).

A partir das equações iniciais:

Demanda (1)

Oferta (2)

Obtivemos as forma reduzidas a partir da substituição de 1 em 2 e, em seguida, 2


em 1 conforme modelo MQI.

Formas reduzidas:

Demanda

Oferta

150

book_econometria.indb 150 13/01/16 11:29


Econometria

Agora vamos regredir as equações reduzidas:

Demanda

Figura 4.3– Regressão função demanda

Fonte: Elaborado pelo autor (2012).

Função demanda:

Agora vamos regredir a função oferta:

Figura 4.4– Regressão função oferta

Fonte: Elaborado pelo autor (2012).

151

book_econometria.indb 151 13/01/16 11:29


Capítulo 4

Função oferta:

Para o segundo estágio, usaremos esta função para calcular a variável

Passo 1:

Crie a coluna na tabela original dos dados, como segue:

Tabela 4.3 – Inclusão da variável

Q Ps rd Pf P^

19,89 19,97 21,03 10,52

13,04 18,04 20,43 19,67

19,61 22,36 18,7 13,74

17,13 20,87 15,25 17,95

22,55 19,79 27,09 13,71

6,37 15,98 24,89 24,95

15,02 17,94 22,94 24,17

10,22 17,09 21,96 23,61

23,64 22,72 38,85 19,52

16,12 15,74 31,69 20,03

24,55 24,64 26,23 15,38

18,92 23,7 30,07 22,98

11,94 15,93 33,67 25,76

18,93 23,34 32,9 25,17

12,6 15,21 37,46 25,82

20,49 26,04 35,18 19,31

22,94 22,95 43,81 26,02

21,08 27,1 41,21 29,65

16,68 23,65 38,2 27,45

17,61 20,06 43,98 18


continua...

152

book_econometria.indb 152 13/01/16 11:29


Econometria

16,62 26,38 37,64 18,87

20,99 24,28 45,24 24,58

24,53 26,64 48,15 25,25

19,67 22,65 36,7 24,24

23,29 19,68 43,92 22,63

16,64 23,82 46,03 27,35

20,81 28,98 46,32 30,34

14,95 18,52 48,94 24,12

26,27 28,16 51,25 34,01

20,65 28,43 48,36 34,01

Fonte: Tabela 4.2, complementada pelo autor (2012).

Passo 2: calcular os valores de

Digite igual na primeira célula do Excel, abaixo do nome da variável (P^), e depois
digite -8,07 mais 0,47*(asterisco para multiplicar) e clique no primeiro valor de Ps;
em seguida, digite + seguido de 0,29* e clique no primeiro valor da variável rd;
digite + seguido de 0,37*e clique no primeiro valor de Pf; tecle Enter para finalizar
e arraste a fórmula até o fim da tabela.

No Excel:

Figura 4.5 – Calculo da variável P^

Fonte: Elaborado pelo autor (2012).

153

book_econometria.indb 153 13/01/16 11:29


Capítulo 4

Tabela 4.4 – Cálculo da variável P^

Q Ps Rd Pf P^

19,89 19,97 21,03 10,52 11,31

13,04 18,04 20,43 19,67 13,61

19,61 22,36 18,7 13,74 12,95

17,13 20,87 15,25 17,95 12,80

22,55 19,79 27,09 13,71 14,16

6,37 15,98 24,89 24,95 15,89

15,02 17,94 22,94 24,17 15,96

10,22 17,09 21,96 23,61 15,07

23,64 22,72 38,85 19,52 21,10

16,12 15,74 31,69 20,03 15,93

24,55 24,64 26,23 15,38 16,81

18,92 23,7 30,07 22,98 20,29

11,94 15,93 33,67 25,76 18,71

18,93 23,34 32,9 25,17 21,75

12,6 15,21 37,46 25,82 19,50

20,49 26,04 35,18 19,31 21,52

22,94 22,95 43,81 26,02 25,05

21,08 27,1 41,21 29,65 27,59

16,68 23,65 38,2 27,45 24,28

17,61 20,06 43,98 18 20,77

16,62 26,38 37,64 18,87 22,23

20,99 24,28 45,24 24,58 25,56

24,53 26,64 48,15 25,25 27,76

19,67 22,65 36,7 24,24 22,19

23,29 19,68 43,92 22,63 22,29

16,64 23,82 46,03 27,35 26,59


continua...

154

book_econometria.indb 154 13/01/16 11:29


Econometria

20,81 28,98 46,32 30,34 30,21

14,95 18,52 48,94 24,12 23,75

26,27 28,16 51,25 34,01 32,61

20,65 28,43 48,36 34,01 31,90


Fonte: Elaborado pelo autor (2012).

Agora, devemos voltar às equações estruturais e substituir P por :

Podemos, dessa forma, regredir as equações estruturais modificadas pelo MQO:

Função demanda:
Figura 4.6 – Regressão da função demanda

Fonte: Elaborado pelo autor (2012).

(-1,26) (5,71)* (3,27)* (-3,29)*

155

book_econometria.indb 155 13/01/16 11:29


Capítulo 4

Função oferta:

Figura 4.7 – Regressão da função oferta

Fonte: Elaborado pelo autor (2012).

(6,94)* (-5,03)* (6,15)*

Como podemos perceber, em ambos os casos os parâmetros estimados são


consistentes, ou seja, passam no teste t. Os sinais também são os esperados. Na
equação da demanda, quanto maior for o preço do cogumelo substituto, espera-
se que a demanda de trufas aumente. A renda também tem um efeito positivo
no aumento de demanda e quanto maior for o preço menor será a demanda. Na
curva de oferta, quanto maior o preço do fator de produção menos se oferta e
quanto maior o preço mais se oferta.

As equações simultâneas pressupõem um conjunto de equações interligadas para


responder a teoria econômica. Como podemos perceber, por se tratar de modelos
determinados por um conjunto de equações, não podemos regredir apenas
uma das equações. Para tanto, temos dois métodos: o MQI e o MMQ2E. Para
ambos os casos, devemos calcular as equações reduzidas do modelo a partir de
substituição. Quando utilizamos esses modelos, os parâmetros estimados são
consistentes.

156

book_econometria.indb 156 13/01/16 11:29


Econometria

Atividades de autoavaliação
1. A tabela abaixo mostra dados referentes à Y (produto interno bruto)
representando renda nesta economia, C (consumo pessoal) e I (investimento
doméstico privado bruto), em bilhões de dólares, para o período de 1970-1991.

Equações estruturais do modelo:

Função consumo

Identidade de renda

Ano C I Y

1970 1813,5 429,7 2873,9

1971 1873,7 475,7 2955,9

1972 1978,4 532,2 3107,1

1973 2066,7 591,7 3268,6

1974 2053,8 543,0 3248,1

1975 2097,5 437,6 3221,7

1976 2207,3 520,6 3380,8

1977 2296,6 600,4 3533,3

1978 2391,8 664,6 3703,5

1979 2448,4 669,7 3796,8

1980 2447,1 594,4 3776,3

1981 2476,9 631,1 3843,1

1982 2503,7 540,5 3760,3

1983 2619,4 599,5 3906,6

1984 2746,1 757,5 4148,5

1985 2865,8 745,9 4279,8

1986 2969,1 735,1 4404,5

1987 3052,2 749,3 4539,9

1988 3162,4 773,4 4718,6

1989 3223,3 784,0 4838,0

1990 3260,4 739,1 4877,5

1991 3240,8 661,1 4821,0


Fonte: Economic Report the President, 1993, tabela B-2, p. 350.

157

book_econometria.indb 157 13/01/16 11:29


Capítulo 4

Determine as funções reduzidas do modelo.

2. A partir do modelo da questão anterior, regrida as funções reduzidas

3. A partir do modelo inicial, estime a equação simultânea pelo método de


mínimos quadrados indiretos.

158

book_econometria.indb 158 13/01/16 11:29


Econometria

Anexos

Anexo 1
Tabela – Distribuição t de Student (teste bilateral).

Grau de
Probabilidade de um valor maior em
Liberdade valor absoluto que o valor tabelado
(gl)

0,01 0,05 0,10

1 63,657 12,706 6,314

2 9,925 4,303 2,920

3 5,841 3,182 2,353

4 4,604 2,776 2,132

5 4,032 2,571 2,015

6 3,707 2,447 1,943

7 3,499 2,365 1,895

8 3,355 2,306 1,860

9 3,250 2,262 1,833

10 3,169 2,228 1,812

11 3,106 2,201 1,796

12 3,055 2,179 1,782

13 3,012 2,160 1,771

14 2,977 2,145 1,761

15 2,947 2,131 1,753

16 2,921 2,120 1,746

17 2,898 2,110 1,740


continua...

159

book_econometria.indb 159 13/01/16 11:29


Grau de
Probabilidade de um valor maior em
Liberdade valor absoluto que o valor tabelado
(gl)

0,01 0,05 0,10

18 2,878 2,101 1,734

19 2,861 2,093 1,729

20 2,845 2,086 1,725

21 2,831 2,080 1,721

22 2,819 2,074 1,717

23 2,807 2,069 1,714

24 2,797 2,064 1,711

25 2,787 2,060 1,708

26 2,779 2,056 1,706

27 2,771 2,052 1,703

28 2,763 2,048 1,701

29 2,756 2,045 1,699

30 2,750 2,042 1,697

∞ 2,576 1,960 1,645

160

book_econometria.indb 160 13/01/16 11:29


Anexo 2

161

book_econometria.indb 161 13/01/16 11:29


162

book_econometria.indb 162 13/01/16 11:29


163

book_econometria.indb 163 13/01/16 11:29


164

book_econometria.indb 164 13/01/16 11:29


Gabarito das atividades
de autoaprendizagem
Capítulo 1
Questão 1:

a. Caminho de resposta:

Função:

b. Caminho de resposta:

(13,80) e (11,13)

165

book_econometria.indb 165 13/01/16 11:29


Universidade do Sul de Santa Catarina

c. Caminho de resposta:

Análise do teste t:

(13,80)* (11,13)*

* ambos os parâmetros b0 e b1 passam no teste t uma vez que o t (tabelado) com


gl = 3 é 3,182, com um nível de significância de 5%. Aceitam H1 e rejeitam Ho.

Sim, até o momento o sinal de b1 é compatível com a teoria, já quanto maior


a renda maior será o consumo e ambos os parâmetros passaram no teste t,
indicando um bom modelo para a previsão.

d. Caminho de resposta:

R2 = 0,98

A partir desse resultado, podemos inferir que 98% das variações de Y são
explicadas pelas variações de X, restando apenas 2% de erro, o que caracteriza
um ótimo modelo para a previsão.

Questão 2:

R2 = 0,04

(-0,43) (0,62)*

166

book_econometria.indb 166 13/01/16 11:29


Econometria

Questão 3:

Primeiro passo, plotar o gráfico de dispersão:

Segundo passo, adicionar a reta de tendência:

167

book_econometria.indb 167 13/01/16 11:29


Universidade do Sul de Santa Catarina

Questão 4:

Função de regressão:

Questão 5:

Função de regressão:

(0,33) (-2,92)* (6,81)*

168

book_econometria.indb 168 13/01/16 11:29


Econometria

* os parâmetros b1 e b2 passam no teste aceitando H1 e rejeitando H0, dado que


o valor-p de b1 é 0,02 < que 0,05 e de b2 é 0,00 também menor que 5%. O b0 não
passa no teste porque seu valor-p é 0,75>0,05, porém como ele é o intercepto da
equação, podemos relevar esta condição. A reta pode sair da origem sem maiores
problemas, ou seja, se o valor de b0 for zero não invalida nossa equação.

Questão 6:

O R2 ajustado é 0,91 ou 91%, o que significa que as variações de tarifa e renda


explicam 91% da variação da quantidade demanda de energia. O F deu 47,99.
Como seu F de significação (0,0000819) que equivale ao valor-p dos parâmetros
é bem menor que 5%, também podemos dizer que o R2 ajustado é diferente de
zero e, pelo menos, um dos parâmetros estimados é diferente de zero.

Questão 7:

A quantidade demanda de energia estimada para o ano de 1991 seria 113,33.

169

book_econometria.indb 169 13/01/16 11:29


Universidade do Sul de Santa Catarina

Capítulo 2
Questão 1:

A regressão que representa o modelo é a seguinte:

Questão 2:

Passo 1: Defasar a variável Y:

170

book_econometria.indb 170 13/01/16 11:29


Econometria

Passo 2: Regredir as variáveis:

Passo 3: Escrever a função de regressão:

R2 ajustado= 0,99 F= 682,39*


(0,83) (4,07)* (3,01)*

Passo 4: Analisar o modelo:

Ambos os parâmetros passam no teste, apenas o intercepto não passa no teste


t, mas como a função não será prejudicada se o intercepto for zero, ou seja, a
reta passar na origem, relevamos este resultado. Como a inclusão da variável
dependente com uma defasagem passa no teste t, significa que faz sentido o
pressuposto que os estoques hoje dependem do estoque de t-1, no caso do ano
anterior. O R2 deu muito bom, 0,99, o que significa que 99% das variações de Y
são explicadas por Xt e Yt-1, resultando em apenas 1% de erro no modelo. O F
também passa.

Passo 5: O modelo serve para previsão?

Sim, por conta dos bons resultados dos testes.

Questão 3:

Sim, porque a inclusão de variáveis defasadas captam a mudança da variável


no tempo. O tempo na economia tem impactos nos resultados de políticas
econômicas e nas variáveis envolvidas.

171

book_econometria.indb 171 13/01/16 11:29


Universidade do Sul de Santa Catarina

Questão 4:

Questão 5:

A regressão que representa o modelo é a seguinte;

R2 = 0,06
(0,97) (0,86)

Questão 6:

Como a dummy deve afetar o intercepto, a forma de inclusão é a aditiva.

Dummy = 0 (períodos de não greve)

Dummy = 1 (períodos de greve)

Na tabela:

Mês Q P D

1 98 0,79 0

2 100 0,80 0
continua...

172

book_econometria.indb 172 13/01/16 11:29


Econometria

3 103 0,82 0

4 105 0,82 0

5 80 0,93 1

6 87 0,95 1

7 94 0,96 1

8 113 0,88 0

9 116 0,88 0

10 118 0,90 0

11 121 0,93 0

12 123 0,94 0

13 126 0,96 0

14 128 0,97 0

Questão 7:

Como a dummy deve afetar o coeficiente angular, a forma de inclusão é a


multiplicativa.

Dummy = 0 (períodos de não greve)

Dummy = 1 (períodos de greve)

Na tabela:

Mês Q P D PD

1 98 0,79 0 0

2 100 0,80 0 0

3 103 0,82 0 0

4 105 0,82 0 0

5 80 0,93 1 0,93

6 87 0,95 1 0,95

7 94 0,96 1 0,96

8 113 0,88 0 0
continua...

173

book_econometria.indb 173 13/01/16 11:29


Universidade do Sul de Santa Catarina

9 116 0,88 0 0

10 118 0,90 0 0

11 121 0,93 0 0

12 123 0,94 0 0

13 126 0,96 0 0

14 128 0,97 0 0

Função:

R2 (ajustado) = 0,98 F=295,83


(-3,47)* (15,65)* (-23,59)*

Análise do modelo:

A partir da função de regressão, podemos concluir que todos os sinais estão


teoricamente corretos. Em relação à oferta de leite e preço, se espera uma
relação positiva, quanto maior preço maior a oferta. Já a dummy que representa
períodos de greve e, portanto, de redução ou total suspensão da produção, se
espera uma relação negativa, ou seja, quanto mais greve menor a produção.

Quanto à confiabilidade, ressalta-se que o coeficiente de determinação é muito


bom, ou seja, as duas variáveis juntas explicam 98% da variação da quantidade
de oferta de leite, o que significa um ótimo poder de explicação.

A hipótese de que as variáveis P e D, conjuntamente, afetam Q é aceita ao nível


de significância de 5%, conforme indica o teste F. Isso significa que, pelo menos,

174

book_econometria.indb 174 13/01/16 11:29


Econometria

uma dessas variáveis influencia significativamente a quantidade demandada, com


uma probabilidade de erro de apenas 5%.

Os três parâmetros passaram no teste t, o que significa que ambos aceitaram H1


ao um nível de significância de 5%.

Questão 8

Podemos perceber que em termos de sinais, ambas são satisfatórias. Já em


relação à significância, percebemos que a primeira equação não representa um
bom modelo, uma vez que nenhum parâmetro passa no teste t e o R2 é muito
baixo, apenas 6%. O que corrobora para importância da ocorrência de greve na
quantidade ofertada deste produto neste período estudado.

Questão 9

Passo1:

Vamos transformar a variável taxa de juros em LN de taxa de juros:

Taxa Juros Mês LNJuros

0,8859 1 -0,12115

0,8212 2 -0,19699

0,9455 3 -0,05604

0,9235 4 -0,07958

0,9659 5 -0,03469

0,9481 6 -0,0533

0,9931 7 -0,00692

0,9999 8 -0,0001

0,9358 9 -0,06635

0,9523 10 -0,04888

0,8987 11 -0,10681

0,8903 12 -0,1162

0,8717 13 -0,13731

0,7943 14 -0,23029

0,8042 15 -0,21791

0,7436 16 -0,29625

175

book_econometria.indb 175 13/01/16 11:29


Universidade do Sul de Santa Catarina

0,7333 17 -0,3102

0,6709 18 -0,39914

0,668 19 -0,40347

0,6514 20 -0,42863

0,5946 21 -0,51987

Passo 2:

Estimar a função de regressão forma log-lin:

Escrever a função:

(1,01) (-6,17)*

O modelo é bom, passa no teste t e apresenta um poder de explicação de 67%. A


taxa de crescimento, que neste caso é de queda de 2% , corrobora com a reta de
tendência do modelo linear.

176

book_econometria.indb 176 13/01/16 11:29


Econometria

Questão 10

Passo 1:

Estimar a função de regressão:

Fonte: Elaborado pelo autor (2012).

Função de regressão:

(57,97)* (23,13)*

Passo 2:

Calculando a variância do erro (resíduos):

Este valor é dado no ANOVA, já que a somatória dos erros é 213.298,36 (SQ) e o
grau de liberdade é 18 (20-2), temos o valor de 11.861,02 (MQ).

177

book_econometria.indb 177 13/01/16 11:29


Universidade do Sul de Santa Catarina

Passo 3:

Calculo da somatória de X menos a média ao quadrado.

PIB t (t-média)^2

3107,1 1 90,25

3268,6 2 72,25

3248,1 3 56,25

3221,7 4 42,25

3380,8 5 30,25

3533,3 6 20,25

3703,5 7 12,25

3796,8 8 6,25

3776,3 9 2,25

3843,1 10 0,25

3760,3 11 0,25

3906,6 12 2,25

4148,5 13 6,25

4279,8 14 12,25

4404,5 15 20,25

4539,9 16 30,25

4718,6 17 42,25

4838 18 56,25

4877,5 19 72,25

4821 20 90,25

Média 10,50 665

178

book_econometria.indb 178 13/01/16 11:29


Econometria

Passo 4:

Calcular a variância da projeção:

Lembrando que a hipótese é que tF = 21:

Desvio padrão:

Calculando o YF:

Intervalo de confiança de previsão com 95%:

O t com 5% retiramos da tabela t do anexo 1, com 18 de grau de liberdade e 5%


de nível de significância.

(4.984,33 – 252,29) e (4.984,33 + 252,29) = 4.732,04 e 5.236,62

O intervalo de confiança de 95% para YF está entre 4.732,04 e 5.236,62

179

book_econometria.indb 179 13/01/16 11:29


Universidade do Sul de Santa Catarina

Capítulo 3
Questão 1:

Passo 1: Fazer a regressão linear múltipla:

R2 ajustado = 0,99
(4,04)* (6,14)* (-2,39)*

Passo 2: Calcular o d:

Teste de Durbin Watson

180

book_econometria.indb 180 13/01/16 11:29


Econometria

Passo 3: Comparar o valor d calculado com d tabelado:

n = 18

k = 2 (número de variáveis explicativas)

Consultando a tabela do anexo, temos:

di = 1,046

ds =1,535

4 – ds = 4 – 1,537 = 2,465

4 – di = 4 – 1,100 = 2,954

181

book_econometria.indb 181 13/01/16 11:29


Universidade do Sul de Santa Catarina

O d calculado é menor que 1,046 e cai na região I, ou seja, o modelo apresenta


autocorrelação positiva.

Questão 2

Calcular o rô:

Para acharmos o rô, precisamos defasar as três variáveis do modelo, como


segue:

Delete a primeira linha antes de regredir:

182

book_econometria.indb 182 13/01/16 11:29


Econometria

Passo 2

Regressão para achar o rô:

ρ=0,62

Passo 3

Transforme as variáveis:

Wt = b0’+ b1 ( Z1t ) + b2 ( Z2t ) + vt

183

book_econometria.indb 183 13/01/16 11:29


Universidade do Sul de Santa Catarina

Passo 4

Regredir o modelo a partir das variáveis transformadas:

W^ = 4,13 + 0,02Z1 – 0,07Z2 R2 ajustado = 0,96


(3,10)* (4,83)* (-1,16)

Questão 3

W^ = 4,13 + 0,02Z1 – 0,07Z2 R2 ajustado = 0,96


(3,10)* (4,83)* (-1,16)

Podemos perceber que os sinais dos parâmetros b1 e b2 estão corretos, já


que quanto maior for a renda, maior será a quantidade vendida. O índice de
preço também se comporta como o esperado, quanto maior o preço, menor
a quantidade vendida. O R2 ajustado também é um ótimo indicador, já que a
variação das variáveis X explicam 96% da variação de Y. Porém, o problema de
autocorreção afeta a significância do b3, ou seja, o parâmetro IPP não passa no
teste t após as transformações das variáveis, o que indica que o modelo não
serve para a previsão.

184

book_econometria.indb 184 13/01/16 11:29


Econometria

Questão 4

A principal alteração possível de sanar o problema é retirar do modelo inicial a


variável IPP, como segue:

Y^= 6,38 + 0,016PNB R2 ajustado = 0,98


(9,32)* (30,23)*

O resultado é um ótimo modelo para previsão.

Questão 5

Não, para tanto devemos fazer a rodada de testes novamente calculando d,


comparando com os limites inferiores e superiores para o teste. Note que o
k do teste de Durbin agora é 1, isso porque reduzimos o número de variável
explicativa. Porém como os resultado não apresentam contradições entre o R2
ajustado e o testes t, não há indícios que o modelo apresente problemas de
autocorrelação dos resíduos.

Questão 6

a) F
b) V
c) V
d) V

185

book_econometria.indb 185 13/01/16 11:29


Universidade do Sul de Santa Catarina

Questão 7

Passo 1: Calcular os resíduos dos valores mais baixos:

Valores mais baixos:

Valores mais elevados:

186

book_econometria.indb 186 13/01/16 11:29


Econometria

Graus de liberdade = (30 – 6 – (2*1))/2 = 22/2 = 11

Valor de F(tabelado)

F11/11=2,82

Como F calculado (5,55) é maior que F tabelado (2,82), a amostra apresenta


heteroscedasticidade.

Reestimando o modelo:

Ponderando as variáveis

C/Y 1/Y

0,6875 0,0125

0,7647 0,0118

0,7778 0,0111

0,7400 0,0100

0,7143 0,0095

0,7182 0,0091

0,6957 0,0087

0,7000 0,0083

0,7200 0,0080

0,7308 0,0077

0,7000 0,0071

0,7448 0,0069

0,7333 0,0067

0,7063 0,0063

0,6970 0,0061

0,6667 0,0056

0,6757 0,0054

0,6842 0,0053

0,6750 0,0050

0,6683 0,0049
continua...

187

book_econometria.indb 187 13/01/16 11:29


Universidade do Sul de Santa Catarina

0,6667 0,0048

0,6364 0,0045

0,6400 0,0044

0,6304 0,0043

0,6333 0,0042

0,7143 0,0041

0,7120 0,0040

0,6923 0,0038

0,7132 0,0038

0,7074 0,0037

188

book_econometria.indb 188 13/01/16 11:29


Econometria

Capítulo 4
Questão 1

Função consumo (1)

Identidade de renda (2)

Passo 1: Substituindo (1) em (2) temos:

Yt = (b0 + b1Yt + mt ) + It ,

Yt - b1Yt = b0 + mt + It,

Yt (1 - b1) = b0 + mt + It

Yt = b0/1 - b1 + mt/1 - b1 + It/1 - b1

Yt = π0 + π1It + w1t (3)

Passo 2: Substituindo (2) em (1) temos:

Ct = b0 + b1(Ct + It) + mt

Ct - b1Ct = b0 + b1It + mt

Ct (1- b1) = b0 + b1It + mt

Ct = b0/1- b1 + b1It/ 1- b1+ mt/ 1- b1

Ct = π2 + π3It + w2t (4)

189

book_econometria.indb 189 13/01/16 11:29


Universidade do Sul de Santa Catarina

Questão 2

Passo1 : estimar as funções reduzidas

Função renda:

Yt = π0 + π1It + w1t

Função consumo:

Ct = π2 + π3It + w2t

190

book_econometria.indb 190 13/01/16 11:29


Econometria

Questão 3

Método de mínimos quadrados indiretos

Funções estruturais:

Função consumo (1)

Identidade de renda (2)

Funções reduzidas:

Yt = π0 + π1It + w1t (3)

Ct = π2 + π3It + w2t (4)

Funções reduzidas estimadas:

Calculando os parâmetros pelo método dos mínimos indiretos:

Substituindo os parâmetros calculados na função consumo:

191

book_econometria.indb 191 13/01/16 11:29


192

book_econometria.indb 192 13/01/16 11:29


Considerações Finais

A teoria econômica apresenta várias formas de avaliar as variáveis econômicas.


Teoricamente, no campo da microeconomia e da macroeconomia temos vários
modelos matemáticos possíveis de averiguação empírica. A Econometria é a
ciência que permite estudar esses modelos e, a partir de um conjunto de variáveis
independentes, prever o comportamento futuro de uma variável independente.

A previsão é uma poderosa forma de resolver problemas, assim sendo, saber


elaborar uma boa previsão e variável uma econômica permite uma tomada
de decisão eficiente. Na atualidade, uma boa previsão minimiza erro e, por
consequência, minimiza custos e agiliza a tomada de decisão.

A econometria permite usar as ferramentas estatísticas com teoria econômica e


séries históricas, ou seja, séries temporais, como estudamos o comportamento
das variáveis ao longo do tempo. Essa análise de comportamento no tempo
permite um prognóstico das variáveis no futuro.

Esperamos que, com o que foi estudado nesta disciplina, você possa ter suporte
para análises e tomadas de decisões. Sucesso!

Prof. Joseane Borges de Miranda

193

book_econometria.indb 193 13/01/16 11:29


book_econometria.indb 194 13/01/16 11:29
Referências

ANDERSON, David R. Estatística Aplicada à Administração e Economia. São


Paulo: Pioneira Thomson Learning, 2002.

BARBETTA, Pedro Alberto. Estatística aplicada às Ciências Sociais. 4.ed.


Florianópolis: Ed. Da UFSC, 2001.

CARMO, Heron E. do; DIAZ, Maria Dolores M. In: VASCONCELLOS, M. S. de e


ALVES, D. (org.) Manual de Econometria. SP: Atlas, 2000.

GUJARATI, Damodar N. Econometria básica. São Paulo: Makron Books, 2011.

HILL, R. Carter; GRIFFITHS, William E.; JUDGE, George G. Econometria. São


Paulo: Saraiva, 2010.

MADDALA, G. S. Introdução a econometria. Rio de Janeiro: Prentice-Hall do


Brasil, 1992.5.

MATOS, Orlando Carneiro de. Econometria básica: Teoria e aplicações. São


Paulo: Atlas, 200.

SARTORIS, Alexandre. Estatística e Introdução à econometria. São Paulo:


Saraiva, 2003.

195

book_econometria.indb 195 13/01/16 11:29


book_econometria.indb 196 13/01/16 11:29
Sobre a Professora Conteudista

Joseane Borges de Miranda


é natural de Imbituba. É bacharel Ciências Econômicas na UFSC em 1998, seu
TCC objetivou analisar o Impacto da política cambial sobre os preços agrícolas
em Santa Catarina. É pós-graduada em Economia Industrial pela Universidade
Federal de Santa Catarina (2000), sua dissertação de Mestrado foi focado
nos aspectos macroeconômicos da competitividade sistêmica no setor de
revestimento de Santa Catarina. Créditos de doutorado do programa de pós-
graduação da UFSC chamado EGC (Engenharia e Gestão do Conhecimento),
a área de conhecimento é Engenharia do Conhecimento. É professora há
mais de 12 anos da disciplina Econometria nos cursos de Economia. Na
Unisul é professora presencial da Engenharias de Produção, Civil e Ambiental.
A maioria das disciplinas ministrada são de Probabilidade e Estatística,
Macroeconomia . Na UV (Unisul Virtual) é professora on-line das disciplinas de
Gestão do Conhecimento, Finanças Internacionais, Probabilidade e Estatística
e Econometria. É co-autora do Livro de Matemática nas Ciências Sociais, é
autora dos Livros: Engenharia Econômica; Econometria I e Econometria II e
coordenadora do curso de bacharelado “Ciências Econômicas” da UV.

197

book_econometria.indb 197 13/01/16 11:29


econometria.pdf 1 13/01/16 10:00

w w w. u n i s u l . b r