Você está na página 1de 112

Introduo

ECONOMETRIA
Prof. Helio Otsuka



Verso 2013





Sumrio

. Captulo 1: Introduo .............................................................................................................................. 1

. Captulo 2: Conceitos iniciais .................................................................................................................... 3
2.1. Objetivo da econometria ..................................................................................................................... 3
2.2. Definio de modelo ............................................................................................................................ 3
2.3. Estrutura de um modelo economtrico ............................................................................................... 4

. Captulo 3: Anlise de regresso linear simples de duas variveis ............................................................ 6
3.1. Expresso do modelo ........................................................................................................................... 8
3.2. Pressupostos bsicos............................................................................................................................ 8
3.3. Estimao dos parmetros ................................................................................................................... 9
3.4. Equaes normais (equaes simultneas) ......................................................................................... 10

. Captulo 4: Regresso linear mltipla ....................................................................................................... 22
4.1. Introduo ............................................................................................................................................ 22
4.2. Pressupostos do modelo ...................................................................................................................... 23
4.2.1. Teorema de Gauss-Markov ....................................................................................................... 23
4.3. Estimao dos parmetros ................................................................................................................... 24
4.4. Estimao da equao de regresso mltipla ...................................................................................... 25
4.5. Previso de valores com base na equao de regresso ..................................................................... 25
4.6. Erro padro da estimativa .................................................................................................................... 26
4.7. Intervalos de predio (IP) ................................................................................................................... 26
4.8. Erro padro dos estimadores ............................................................................................................... 26
4.9. Intervalo de confiana dos estimadores .............................................................................................. 27
4.10. Coeficiente de determinao (poder explicativo da regresso) ........................................................ 27
4.11. Teste de hipteses ............................................................................................................................. 28

. Captulo 5: Correlao .............................................................................................................................. 45
5.1. Objetivo para economia ....................................................................................................................... 45
5.2. Conceito de correlao ........................................................................................................................ 45
5.3. Medida de correlao .......................................................................................................................... 46
5.4. O coeficiente de correlao r e sua interpretao ............................................................................. 46
5.5. Imagens de r no plano cartesiano em funo do seu valor ............................................................... 47
5.6. Diferena entre correlao e regresso ............................................................................................... 48

. Captulo 6: Violao dos pressupostos bsicos ......................................................................................... 54
6.1. Heteroscedasticidade e homoscedasticidade ...................................................................................... 54
6.2. Natureza da heteroscedasticidade ....................................................................................................... 55
6.3. Consequncias da heteroscedasticidade ............................................................................................. 57
6.4. Deteco da heteroscedasticidade ...................................................................................................... 57

. Captulo 7: Autocorrelao ou Correlao Serial ....................................................................................... 69
7.1. Natureza da autocorrelao ................................................................................................................. 69
7.2. Padres grficos de autocorrelao ..................................................................................................... 69
7.3. Causa da autocorrelao ...................................................................................................................... 70
7.4. Consequncias da autocorrelao ....................................................................................................... 70
7.5. Diagnstico (identificao) da autocorrelao .................................................................................... 71
7.6. Medidas corretivas visando a remoo da autocorrelao ................................................................. 76




. Captulo 8: Utilizao de variveis especiais ............................................................................................. 82
8.1. Variveis dummy (dummies, binrias, artificiais, dicotmicas, etc.) ................................................... 82
8.2. Incorporao da varivel ( ) d ao modelo de regresso linear ............................................................. 83
A) Incorporao da varivel ( ) d pela forma aditiva .......................................................................... 83
B) Incorporao da varivel ( ) d pela forma multiplicativa ............................................................... 87


. Captulo 9: Anlise das sries temporais ................................................................................................... 92
9.1. Introduo ............................................................................................................................................ 92
92. Conceito de sries temporais ................................................................................................................ 92
9.3. Anlise de uma srie temporal ............................................................................................................ 94

. Tabelas ..................................................................................................................................................... 104
Tabela normal ............................................................................................................................................. 104
Distribuio t de Student ............................................................................................................................ 105
Tabela da distribuio F (nvel de significncia 1%) .................................................................................... 106
Tabela da distribuio F (nvel de significncia 5%) .................................................................................... 107
Tabela de Durbin-Watson ........................................................................................................................... 108

. Bibliografia ............................................................................................................................................... 109


ECONOMETRIA
(Noes Bsicas)


Captulo 1: INTRODUO

Uma imensa gama de relaes tericas existentes entre variveis de natureza econmica podem
ser expressas e formuladas atravs de modelos matemticos. Assim, nota-se que cada vez mais
estudiosos em economia se valem de metodologias estatsticas para estimar parmetros
desconhecidos, testar hipteses, efetuar simulaes sobre as mais diversas relaes entre
variveis econmicas, visando efetuar previses de carter quantitativo de inmeros eventos.
exatamente nesse contexto que se torna imprescindvel a efetiva participao da econometria
como ferramenta necessria na verificao, por exemplo, de teorias e polticas econmicas,
previso de valores de variveis de natureza econmica, influenciando sobremaneira na tomada
de decises.

O objetivo dessa apostila procurar transmitir aos estudantes de economia, de forma clara e
resumida, os principais conceitos que entendemos serem relevantes para a sua formao.

Dado o nmero exguo de horas/aulas disponveis, procuramos abranger o mximo do nosso
contedo programtico, dando nfase parte prtica/operacional de cada captulo com aplicao
de exerccios j desenvolvidos com a consequente interpretao dos seus resultados, deixando a
parte terica de maior profundidade, como trabalho de consulta, anlise e interpretao por parte
do aluno junto a bibliografia recomendada. Contem ainda exerccios complementares que devero
ser desenvolvidos no decurso das aulas

Assim, entendemos que o contedo programtico apresentado na sequencia ser suficiente para
dar uma ideia da importncia do conhecimento de econometria como base na formao dos
futuros profissionais em economia.

Vale deixar aqui registrado, contudo, que a econometria, como tambm ocorre em outras
cincias, apresenta suas limitaes, principalmente de natureza estatstica e econmica.

Poderamos citar algumas de natureza estatstica, como por exemplo:

utilizao de amostras pequenas, no representativas;

falhas nas observaes das variveis;

dificuldade de dar tratamento adequado a alguns modelos no lineares;

o problema da multicolinearidade, etc.

Entre os de natureza econmica temos:

1


dificuldades na classificao de variveis em endgenas e exgenas o que tornaria tendencioso
o efeito das mesmas;

dificuldade de incorporar nos modelos os fatores de natureza qualitativa e subjetiva como
opinies; expectativas; intenes; etc.

problemas de especificao da teoria e dos erros, etc.

Os problemas citados j vm sendo analisados h algum tempo por econometristas, entretanto
alguns pontos no foram totalmente solucionados como o problema da multicolinearidade
(intercorrelao entre variveis explicativas) e mensurao de variveis subjetivas.

Para o aprendizado suave da matria pressupe-se que o alunado tenha algum conhecimento de
estatstica bsica e de inferncia estatstica.

Apresentamos abaixo, os assuntos abordados nesta apostila, acompanhados de exerccios ao fim
de cada capitulo, procurando, na medida do possvel, alinhar-se com o programa de econometria
institudo pela Faculdade.

Conceito de econometria e o seu objetivo;

Conceito de modelo (classificao, estrutura, pressupostos bsicos, etc.);

Anlise da regresso linear simples de duas variveis (estimao e interpretao dos
parmetros; o mtodo dos mnimos quadrados ordinrios; conceito de regresso; previso de
valores; erro padro da estimativa; erro mximo de estimao; intervalo de predio; erro
padro dos estimadores; qualidade do ajuste e sua interpretao; teste de hipteses aplicados
regresso pela distribuio t de Student e pela distribuio F de Fisher/Snedecor com a
elaborao do quadro ANOVA (Analysis of Variance);

Anlise da regresso linear mltipla, onde sero abordados todos os itens j comentados na
anlise de regresso simples;

Covarincia e correlao (determinao, interpretao e verificao da sua existncia);

Violao dos pressupostos bsicos (heteroscedasticidade e homoscedasticidade; natureza,
consequncia e deteco da heteroscedasticidade); autocorrelao serial (causas,
consequncias e diagnstico da autocorrelao);

Utilizao de variveis especiais como extenso dos modelos de regresso (variveis dummy,
binria, artificial ou dicotmica); utilizao da varivel tempo como varivel explicativa numa
srie temporal de informaes numricas;

Modelos no lineares;

Anlise de sries temporais.
2


Para finalizar, gostaramos de lembr-los de que a presente apostila no uma receita de bolo,
onde o estudante pensa que aprendendo o que est nela contida, j sabe tudo sobre econometria.
Muito pelo contrrio. O nosso objetivo, ao preparar a matria dessa forma, foi com a inteno de
facilitar e maximizar o processo de aprendizado, dando nfase aos itens de maior relevncia
dentro do contedo programtico adotado pela Faculdade, contendo aplicaes prticas de fcil
entendimento.

Certamente um dos mais poderosos instrumentos utilizados na anlise de problemas econmicos
so as aplicaes de tcnicas estatsticas economia, denominada de econometria.
A econometria em si, muito mais abrangente com uma diversidade de tpicos que no esto
aqui comentados.


Captulo 2: CONCEITOS INICIAIS

2.1. OBJETIVO DA ECONOMETRIA

A econometria trata da mensurao das relaes entre variveis de natureza econmica com base
em ferramental estatstico e tem como alguns de seus objetivos a verificao emprica das leis e
das teorias econmicas, a avaliao das polticas econmicas, a previso dos valores das variveis
de natureza econmica, etc.

Alguns autores como Artur S. Goldberger, em seu livro Econometric Theory, define econometria
como a cincia social no qual o ferramental estatstico, tais como inferncia estatstica e a
estatstica matemtica, so aplicadas anlise dos fenmenos econmicos.


2.2. DEFINIO DE MODELO

Entende-se como modelo em econometria a um conjunto de hipteses estabelecidas priori,
acerca do comportamento de um dado fenmeno, com base numa teoria j existente e podem ser
classificados em tericos e economtricos.

Um modelo terico quando expressam leis de natureza econmica sem conter necessariamente
tratamento estatstico; j os economtricos, contm necessariamente tratamento estatstico com
as devidas especificaes como, por exemplo: a definio das variveis, a forma funcional, o n de
equaes, etc. como veremos a seguir.

Exemplo de modelo terico:
Funo liquidez: M= L (i;x) , onde M= meios de pagamento; L=liquidez; i=taxa de juro; x =
renda

Exemplo de modelo economtrico:
Funo consumo: C= a+bx+e, onde C= consumo agregado; a e b = parmetros linear e angular;
x= renda; e= erro aleatrio
3


Os modelos podem ainda ser classificados quanto a sua forma funcional e quanto ao nmero de
equaes:

Quanto a forma funcional

- Lineares: quando expressa por uma funo linear

i
x y .
2 1
+ =

- No lineares: quando expressa por uma funo no linear

i
x
y
2 1
= , que uma funo exponencial simples

Quanto ao nmero de equaes:

- Uniequacionais: quando contm apenas uma equao

x
cx bx a y + + =

- Pluriequacionais: quando contm pelo menos duas equaes como, por exemplo, uma funo
linear (1) e a funo (2) onde x representa o resultado da diferena entre a funo (1) e o
resultado dos investimentos (w)

i
x y .
2 1
+ = (1)

w y x = (2)

Onde = y despesa em funo da renda, = x renda e = w resultado dos investimentos


2.3. ESTRUTURA DE UM MODELO ECONOMTRICO


Estruturalmente um modelo economtrico envolve quatro elementos bsicos que so: Variveis
(dependente e independente), Equaes, Parmetros ou Coeficientes (intercepto e o parmetro
responsvel pela declividade, alm do termo aleatrio ou perturbaes).

Por exemplo: na estrutura de um modelo linear encontramos a varivel dependente (ou endgena
ou explicada), a varivel independente x (ou exgena ou explicativa), os parmetros linear ou
intercepto
1
e o angular
2
, conforme esquema a seguir, alm do termo aleatrio e.
e x y
i
+ + = .
2 1


Onde:
= y varivel dependente =
1
parmetro intercepto
4


=
i
x varivel independente

=
2
parmetro angular
= e termo aleatrio

O que so regressores?

O conjunto de variveis exgenas ou explicativas mais o termo constante ou linear ou intercepto
so denominados de regressores. Assim, na equao acima, os regressores seriam:

1
e
i
x .
2


Cabe lembrar que o comportamento da economia resulta da interdependncia de diversos fatores
e ao explic-lo os economistas evitam a complexidade do mundo real atravs da construo de
modelos que apesar de retratarem de forma aproximada a realidade, destacando apenas os
elementos ou variveis consideradas relevantes, permitem alcanar a essncia do fenmeno em
questo. Apesar do avanado estgio em que se encontra a teoria econmica, ocorrem situaes
onde a formulao das hipteses do modelo e a identificao dos elementos relevantes um
tanto arbitrria, no havendo garantias de que elas sejam realistas, portanto, preciso verificar se
o modelo proposto capaz de explicar o fenmeno a que se prope.

Atravs do confronto do modelo com as observaes do mundo real que se pode concluir ou
no a validade do modelo. Um poderoso instrumento neste sentido so os modelos
economtricos analisados pela econometria, uma tcnica que agrega a estatstica, a matemtica e
a teoria econmica.

Conforme indicado na figura 1 a seguir, um modelo economtrico resulta de um processo que se
inicia com uma anlise econmica que envolve a consulta da teoria econmica e percepo da
realidade para auxiliar na identificao das variveis dependentes e independentes a serem
includas no modelo, bem como na especificao da forma funcional que relaciona estas variveis.
Uma caracterstica dos modelos economtricos a considerao de um termo estocstico, com
uma distribuio de probabilidade hipottica, para representar a incerteza inerente ao
comportamento da economia e tambm outras variveis, omitidas na formulao do modelo, mas
que explicam a realidade.

Uma vez especificado o modelo economtrico e estabelecidas s hipteses pertinentes, so
coletadas observaes das variveis dependentes e independentes, para em seguida, atravs da
aplicao da inferncia estatstica, estimar e testar a validade do modelo economtrico. A validade
de um modelo economtrico no ser apenas julgada por tcnicas de inferncia estatstica, mas
tambm pela coerncia com a teoria econmica. Caso o modelo especificado no seja o aceito
deve ser corrigido, seja retirando ou incluindo variveis independentes ou ainda modificando a
forma funcional que relaciona as variveis.

Quanto aplicao, os modelos economtricos podem ser utilizados na obteno de evidncias
empricas que modifiquem, refinem ou refutem as concluses contidas na teoria econmica ou
novas proposies tericas e tambm na avaliao de polticas econmicas, sendo uma
ferramenta muito til para fazer previses de alguma varivel econmica ou ainda estimar
5


parmetros como elasticidades, multiplicadores, coeficientes tcnicos e custos marginais,
portanto trata-se de uma valiosa ferramenta em um processo de tomada de deciso.




Figura 1 sugesto de roteiro para construo de modelos economtricos


Captulo 3: ANLISE DE REGRESSO LINEAR SIMPLES DE DUAS VARIVEIS

O gerente de vendas de uma empresa varejista do ramo de calados est interessado em obter
uma equao que sintetize a relao existente entre o investimento em propaganda e o volume
de vendas da empresa, com a finalidade de realizar projees do volume de vendas.


6


Tabela 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z.

Investimento em Propaganda milhares de
Reais (x)
Venda em milhares de Reais
(y)
30 40
20 34
35 52
40 49
38 47
18 21
10 20
15 27
35 41
24 48


0
10
20
30
40
50
60
0 10 20 30 40 50
Investi mento em propraganda mi l hares de Reai s
V
e
n
d
a

e
m

m
i
l
h
a
r
e
s

d
e

r
e
a
i
s


Figura 3.1 Dados de investimento em propaganda e vendas em milhares de reais da empreza Z.

A figura 3.1 apresenta um grfico com os valores de uma amostra levantada pelo departamento
de vendas da empresa Z. O grfico revela uma tendncia de crescimento entre o volume de
vendas e o investimento em propaganda, ou seja, um incremento no investimento em propaganda
resulta em um aumento no volume de vendas.
7


0
10
20
30
40
50
60
0 10 20 30 40 50
Investi mento em propraganda mi l hares de Reai s
V
e
n
d
a

e
m

m
i
l
h
a
r
e
s

d
e

r
e
a
i
s


Figura 3.2 Reta ajustada entre Volume de vendas e investimento com propaganda em milhares de
reais.

O exemplo anterior constitui uma aplicao de regresso linear simples, onde a relao existente
entre a varivel dependente ou endgena (volume de vendas) e a varivel independente ou
exgena (investimento em propaganda) modelada atravs de uma reta ajustada aos dados
amostrais, conforme mostra a Figura 3.2


3.1. EXPRESSO DO MODELO:

e x y
i
+ + = .
2 1
(3)

O modelo chamado de regresso linear simples porque h apenas uma varivel econmica ( ) x ,
no lado direito da equao. Quando houver mais de uma varivel explicativa ( ) x chamada de
regresso mltipla. chamado de linear porque a expectativa condicional de y uma funo
linear de x, ou seja:

( ) e x x y E + + = .
2 1



3.2. PRESSUPOSTOS BSICOS:

O termo regresso mostra o efeito da varivel explicativa x sobre a varivel explicada y, atravs
das estimativas dos parmetros
i
.

Num modelo de regresso linear devero ser considerados alguns pressupostos conforme abaixo:

a) O valor de ypara cada valor de x definido pela expresso acima (3), onde e o erro ou
termo aleatrio.
8


b) A esperana matemtica do erro aleatrio igual a zero, pois admite-se que ( )
i
x y E .
2 1
+ = ,
donde se conclui que: ( ) 0 = e E .

c) A varincia do erro aleatrio igual varincia de y, pois y e e diferem apenas pelo
intercepto, que um fator constante que no altera a varincia, ( ) ( ) y V e V = . Portanto, a
varincia do erro aleatrio finita e constante.

d) A covarincia entre qualquer par de erros aleatrios
1
e e
2
e igual covarincia do par
1
y e
2
y que igual zero, ou seja: ( ) ( ) 0 ; cov ; cov
2 1 2 1
= = y y e e . Assim, temos que os termos
aleatrios so independentes.

e) O Erro aleatrio (e) segue distribuio normal com mdia igual a zero e varincia constante;

OBS:
Significado do termo erro aleatrio ou perturbao estocstica ( ) e : resumidamente podemos
conceituar como sendo o substituto ou representante de todas as variveis omitidas ou
desconsideradas que podem afetar a varivel dependente y, mas que no esto no modelo de
regresso ou que no puderam ser includos no citados modelo.


3.3. ESTIMAO DOS PARMETROS

O problema de regresso consiste em, dado o modelo terico (como o linear, por exemplo),
estimar os parmetros desconhecidos
1
e
2
que so respectivamente os parmetros intercepto
e o angular, com base nas informaes amostrais de um dado fenmeno como, por exemplo,
despesas com alimentao e renda (no caso de uma regresso linear simples).

Apesar de existirem vrios mtodos para sua obteno (polinmios ortogonais, mxima
verossimilhana, mnimos quadrados ordinrios, etc.), o mais recomendado, por ser no
tendencioso, consistente, eficiente, de fcil obteno e de maior confiabilidade, o mtodo dos
mnimos quadrados ordinrios, que sugere como princpio que devemos obter uma reta tal que a
soma dos quadrados das distancias verticais de cada ponto reta seja o menor possvel ou em
outras palavras, que a soma dos quadrados das diferenas entre cada valor conhecido e ajustado
pela funo ( ) y seja o menor possvel, isto :

( )

=

n
i
y y
1
2
= mnimo (4)

O valor do intercepto ( )
1
e o valor do parmetro angular ( )
2
dessa reta que melhor se ajusta
aos dados conhecidos ( ) y , pelo mtodo dos mnimos quadrados ordinrios (m.q.o.) so
1
b e
2
b
que so as estimativas de
1
e
2
do modelo linear simples:
i
x b b y .
2 1
+ = .

9


3.4. EQUAES NORMAIS (Equaes simultneas)

Para obtermos os valores de
1
b e
2
b , utilizamos a forma recursiva, denominada de equaes
normais que so obtidas derivando-se parcialmente a igualdade (4) acima e igualando-a a zero,
obtendo-se:

- Forma geral

+ =
+ =


2
2
2
. .
. .
x b x b xy
x b n b y
i
i
(5)

- Forma reduzida

( ) ( )( )
( ) ( )
2
2
2
.
. .

=
x x n
y x xy n
b (6)

x b y b .
2 1
= (7)

As frmulas (4), (5) e (6) e (7) so denominadas de estimadores de mnimos quadrados e so
utilizadas para estimar os parmetros
1
b e
2
b da funo.

Na sequncia daremos um exemplo com vrias perguntas. O desenvolvimento, a interpretao e
a natureza das mesmas esto explicitados no decurso das resolues das questes.

Exemplo 1:
A tabela abaixo mostra a evoluo da poupana pessoal ( ) y e renda pessoal ( ) x em unidades
monetrias (U.M.) por um perodo de 12 anos (Colunas (1), (2) e (3)). Pressupe-se que a trajetria
das variveis assume um comportamento linear.

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
Anos
Poupana
( ) y
Renda
( ) x
y x.
2
x
y
( )
2
y y ( )
2
x x ( )
2
y y ( )
2
y y
1 6 8 48 64 6,15 0,023 49 16 14,82
2 7 8 56 64 6,15 0,723 49 9 14,82
3 6 9 54 81 6,70 0,490 36 16 10,89
4 8 11 88 121 7,80 0,040 16 4 4,84
5 9 12 108 144 8,35 0,422 9 1 2,72
6 10 13 130 169 8,90 1,210 4 0 1,21
7 9 14 126 196 9,45 0,202 1 1 0,30
8 9 16 144 256 10,55 2,402 1 1 0,30
9 11 18 198 324 11,65 0,422 9 1 2,72
10 12 20 240 400 12,75 0,002 25 4 7,56
11 15 11 165 121 13,85 1,322 49 25 14,82
12 18 29 522 841 17,70 0,090 196 64 59,29
120 180 2044 3144 - 7,911 444 142 134,29
10


Nota: as colunas (1) a (3) so dados informados e as colunas (4) a (10) so colunas auxiliares para
desenvolvimento das questes.

Com base nas informaes pede-se:

1) Estimar pelo mtodo dos mnimos quadrados ordinrios a equao da poupana em funo
da renda;
2) Calcular e interpretar o resultado dos estimadores obtidos;

3) Estimar a poupana provvel, se a renda pessoal num determinado ano for de 35 U.M.

4) Avaliar o erro padro de estimativa

5) Obter o intervalo de predio para a poupana estimada em (3)

6) Determinar o erro padro dos estimadores;

7) Obter o intervalo de confiana dos estimadores com 05 , 0 = e interpret-los;

8) Verificar a qualidade do ajuste e interpret-lo;

9) Determinar o intervalo de predio em funo do erro mximo do valor estimado e o
intervalo de predio dela decorrente.

10) Testar a hiptese da existncia de regresso entre o par x e y (por Student e por Fische


Desenvolvimento:

1) Equao de regresso do modelo ( ) x y .
2 1
+ =

( ) ( )( )
( ) ( )
2
2
2
.
. .

=
x x n
y x xy n
b
( )
2 2
180 3144 12
120 180 2044 12



= b 55 , 0

2
= b

15 55 , 0 10 .

2 1
= = x b y b 75 , 1

1
= b

- Equao de regresso da poupana:

x y 55 , 0 75 , 1 + =

2) Interpretao de
1

b e
2

b
11


No contexto econmico, o valor 75 , 1

1
= b , significa que mesmo que a renda x seja zero, a
poupana pessoal y teria um crescimento de 1,75 U.M.

Quanto ao estimador
2

b , significa aumento de 0,55 na poupana pessoal ( ) y , quando a renda


pessoal ( ) x (parmetro angular) aumentar de uma unidade monetria.

3) Valor estimado da poupana quando a renda for de 35 U.M.
Com a ajuda da equao obtida na questo (1), ou seja, x y 55 , 0 75 , 1 + = , podemos estimar o
provvel valor da poupana pessoal ( ) y , bastando para tanto substituir a varivel explicativa ( ) x
por 35 U.M. que a renda conhecida, ou seja:

x y 55 , 0 75 , 1 + =
35 55 , 0 75 , 1 + =
est
y 21 =
est
y U.M.

4) Erro padro de estimativa
O erro padro da estimativa tem como uma de suas finalidades estabelecer o intervalo de
predio (margem de desvio) para mais ou para menos do valor estimado de ( ) y em funo de
( ) x . Portanto, nada mais do que a disperso em termos absolutos dos valores residuais. Como
se sabe, os valores residuais so aqueles valores resultantes da diferena entre os dados
conhecidos e os ajustados por uma funo qualquer.

O erro padro da estimativa, geralmente representado por
x y
S
:

calculado pela expresso:



( )
k n
y y
S
x y

=

2
:

(8)

Sendo:
= y dados conhecidos (coluna 2 da tabela)
= y dados ajustados pela equao (coluna 6)
= n tamanho da amostra ( 12 = n )
= k nmero de parmetros (intercepto + angular)


( )
2 12
911 , 7

2
:

=

k n
y y
S
x y
89 , 0

:
=
x y
S
5) Intervalo de Predio (IP) para o valor estimado da poupana de 21 U.M.
O Intervalo de Predio (IP) nada mais do que a margem de erro do valor estimado, o que sugere
diminuir e posteriormente somar ao valor estimado o erro padro da estimativa, calculado na
questo anterior, ou seja, quanto menor o seu valor, menor a margem de erro.

IP = valor estimado (VE) erro padro da estimativa
12


IP = VE
x y
S
:


IP = (VE -
x y
S
:

; VE +
x y
S
:

) (9)
IP = 21 + 0,89
IP = (21 - 0,89 ; 21 + 0,89)
IP = (20,11 ; 21,89)

6) Erro padro dos estimadores
1

b e
2

b
No estudo da regresso, a determinao do erro padro dos estimadores ( )
1

b
S tem como uma de
suas finalidades bsicas auxiliar na obteno do intervalo de confiana dos estimadores, pois de
fundamental importncia que os estimadores sejam no tendenciosos.

No caso da regresso linear simples, vimos que os estimadores so
1

b e
2

b , assim, temos:

Clculo do erro padro do estimador
1

b:

( )

=
2
2
:
.
.

1
x x n
x
S S
x y b
(10)

Clculo do erro padro do estimador
2

b :

( )


=
2
:

2
x x
S
S
x y
b
(11)
No exemplo em questo temos:

6.1) Erro padro do estimador
1
b ( )
1

b
S

( )

=
2
2
:
.
.

1
x x n
x
S S
x y b
(12)
444 12
3144
. 89 , 0

=
b
S 68 , 0

1
=
b
S

6.2) Erro padro do estimador
2
b ( )
2

b
S
( )


=
2
:

2
x x
S
S
x y
b
(13)
444
89 , 0

1
=
b
S 042 , 0

2
=
b
S
13


7) Intervalo de confiana dos estimadores
A construo de um intervalo de confiana (IC) para um estimador tem como finalidade,
principalmente em econometria, medir o nvel de preciso do citado estimador, ou seja, se h
sintomas de tendenciosidade.

Para a construo do IC, o pesquisador dever levar em considerao algumas informaes
relevantes como, por exemplo:

Valor do erro padro dos estimadores ( )
1

b
S , conforme mencionado no item anterior;
O nvel de confiana desejado na pesquisa, com base na distribuio t de Student;
O nmero de graus de liberdade ( ) k n l g = . . .
= n tamanho da amostra e = k nmero de parmetros

Assim, observadas as condies acima, o intervalo de confiana de um dado estimador poder ser
construdo com base no modelo genrico a seguir:

( ) ( )
i i
b i i b i
S k n t b S k n t b

. + < <

(14)

7.1) Intervalo para
1

b

( ) ( ) 68 , 0 . 2 12 75 , 1 68 , 0 . 2 12 75 , 1
05 , 0 1 05 , 0
+ < < t t
27 , 3 23 , 0
1
< <

O intervalo acima definido significa que existe a probabilidade 0,95 ou 95% de chance de que o
valor de
1
esteja entre 0,23 e 3,27.

7.2) Intervalo para
2

b

042 , 0 2281 , 2 55 , 0 042 , 0 2281 , 2 55 , 0
2
+ < <
644 , 0 4564 , 0
2
< <

O intervalo acima significa que existe a chance de 95% de que
2
esteja entre 0,4564 e 0,644.

8) Avaliao da qualidade do ajuste
A qualidade do ajuste ou poder explicativo da regresso pode ser avaliado pelo coeficiente de
determinao ( )
2
R e tem como finalidade verificar em quantos por centos a varivel dependente
( ) y explicada pela varivel independente ( ) x . Quanto mais o valor de
2
R se aproximar de
100%, melhor a qualidade do ajuste.

14


Expresso para clculo:

( )
( )
2
2
2

=
y y
y y
R (15)

Substituindo com os resultados encontrados nas colunas (9) e (10) do exemplo,

142
29 , 134
2
= R 946 , 0
2
= R ou % 6 , 94

O resultado indica que 94,6% da varivel y explicada pela varivel X, que sugere uma boa
qualidade do ajuste, pois quanto mais se aproximar de 100% ou de 1, melhor a qualidade do
ajuste.

9) Erro mximo do valor estimado
Para obtermos o intervalo de predio com base no erro mximo do valor estimado, devemos
inicialmente determinar o valor do erro ( ) E pela expresso:

( )
( )

+ + =
2
2
2
.
. 1
1

.
x x n
x x n
n
S t E
y
(16)

Onde:
=

t distribuio t de Student com ( ) . .l g k n , com 05 , 0 = ou 95% ou outro nvel qualquer


=
y
S

erro padro da estimativa


= n tamanho da amostra e = k n de parmetros da funo sob anlise
. As estatsticas acima so conhecidas:
( ) ( ) 228 , 2 10
05 , 0
= = t k n t

(tabelado)
89 , 0

=
y
S
12 = n
= x varivel explicativa utilizada na poca
i
t para estimativa de y. No exemplo em questo
35 = x U.M.
15 = x


= 3144
2
x


. Da temos:

( )
2
2
180 3144 12
15 35 . 12
12
1
1 . 89 , 0 228 , 2


+ + = E
15


1
b
2
b
5328
4800
083 , 0 1 . 982 , 1 + + = E
984 , 1 . 982 , 1 = E 79 , 2 = E

Obtido E, o intervalo de predio ser conhecido, somando-se e subtraindo-se ao valor estimado
o valor de E, ou seja:

E VE IP = (17)
( ) 79 , 2 21 ; 79 , 2 21 + = IP
( ) 79 , 23 ; 21 , 18 = IP

Observe que a diferena em relao ao intervalo de predio encontrado na questo 5 anterior
que no 2 procedimento foi introduzido o fator probabilstico (distribuio t de Student).

10) Teste de hiptese da existncia de regresso por t de Student e Fisher

Um recurso estatstico para se verificar a existncia de regresso entre variveis de uma dada
funo a aplicao do teste de hipteses.

Existem inmeras formas para efetuar o teste. Sero abordados, neste caso, o de Student e o de
Fisher/Snedecor, por serem os mais usuais.

10.1) Teste t de Student
Por este teste calculamos inicialmente o valor de
c
t pela funo:

i
b
i i
c
S
b
t


= (18)
Onde:
=
c
t t calculado
=
i
b parmetros intercepto e angular
=
i
hiptese a ser testada
=
i
b
S

erro padro dos estimadores



No exemplo so conhecidos:

- A equao de regresso: x y 55 , 0 75 , 1 + =


- Erro padro do estimador
2
b 042 , 0

2
=
b
S
16


Assim:
042 , 0
0 55 , 0
=
c
t 09 , 13 =
c
t

Na sequncia, formulamos as hipteses:

0
2 0
= = H (ausncia de regresso)
0
2 1
= H (presena de regresso)

Verificamos na tabela da distribuio t o valor de ( ) ( ) 228 , 2 2 12
05 , 0
= = t k n t

.

Comparamos
c
t com ( ) k n t

.

Se
c
t (calculado) for maior que ( ) k n t

(tabelado), ou seja, diferente de zero, significa presena


de regresso entre as variveis x e y.

No teste em questo, as decises a serem apresentadas so:

a) Deciso estatstica = rejeita-se a hiptese
0
H ;
b) Deciso econmica = a populao da qual foi extrada a amostra de 12 observaes sobre
poupana ( ) y e renda( ) x ) sugere a existncia de regresso entre elas com 95% de
probabilidade de que a deciso tomada esteja correta.

10.2) Teste F de Fisher
Uma outra forma de verificar a existncia de regresso atravs do teste F com auxlio do quadro
de anlise da varincia (ANOVA), cujo desenho para determinar o F calculado ( )
c
F o que se
segue:

Fonte da
variao
Soma dos
quadrados
Graus de
Liberdade ( ) . .l g
Mdia
Quadrtica
c
F
Devido a
regresso
( )


2
y y
1 = k
( )
1

y y
(a)
b
a
F
c
=
Devido a
resduos
( )


2
y y
1 k n
( )
1

k n
y y
(b)

No exemplo em questo j foram calculadas as estatsticas necessrias ao clculo de
c
F (na tabela
do exemplo 1). Encontrado o valor de
c
F , este comparado ao ( ) 1 k n F

(tabelado), na
distribuio de Fisher/Snedecor.

Se o valor de
c
F for maior que ( ) 1 k n F

, rejeitamos a hiptese nula


0
H , o que sugere
presena de regresso entre as variveis x e y, que so respectivamente a renda e a poupana.

Conforme visto no teste anterior por Student, as hipteses devero ser formuladas como se segue:
17


:
0
H ausncia de regresso
:
1
H presena de regresso

Finalmente, enunciamos as decises estatstica e econmica.

Dessa forma, aplicando-se o teste F ao exemplo 1 temos:

Elaborao do quadro ANOVA com base nas estatsticas conhecidas:

Fonte da
variao
dos quadrados ( ) . .l g
Mdia
Quadrtica
c
F
Regresso 134,29 1 134,29
75 , 169
79 , 0
29 , 134
=
Resduos 7,911 12-1-1 = 10 0,79

75 , 169 =
c
F ( ) ( ) 96 , 4 10 1
05 , 0
= = F k n F



- Formulao das hipteses:
:
0
H ausncia de regresso
:
1
H presena de regresso

Nota-se que ( ) 10
05 , 0
F F
c
> o que sugere rejeitar a hiptese
0
H , o que nos leva as seguintes
decises:

a) Deciso estatstica = rejeitar
0
H

b) Deciso econmica = a populao da qual foram extradas as 12 amostras sugere a existncia
de regresso entre o par de valores x e y, com 95% de probabilidade de que a deciso esteja
correta.


18


Exemplo 2:

Com base nos dados de despesas com alimentao (yi ) e renda mensal (xi ), levantados durante 10
periodos consecutivos (ti ), desenvolver as questes 1 a 11. Os valores esto em unidades
monetrias (U.M.)

i
t
i
y
i
x
1 5 10
2 6 15
3 8 17
4 12 20
5 13 25
6 10 20
7 12 22
8 18 30
9 13 25
10 18 26
115 210

1) Estimar a equao da reta que exprime a relao entre y e x;

2) Interpretar os resultados obtidos dos estimadores no contexto do modelo econmico em
questo;

3) Estimar, com base na equao obtida em (1), a despesa com alimentao ( ) y , sabendo-se
que a renda mensal ( ) x de 30 U.M.;

4) Determinar o erro padro da estimativa;

5) Determinar o intervalo de predio com base nos resultados encontrados em (3) e (4);

6) Determinar o intervalo de predio com base no erro mximo do valor estimado;

7) Determinar o erro padro dos estimadores
1
b e
2
b ;

8) Determinar o intervalo de confiana dos estimadores
1
b e
2
b ;

9) Avaliar a qualidade do ajuste (poder explicativo da regresso), interpretando-o;

10) Testar a hiptese da existncia de regresso entre as variveis x e y pela distribuio t;

11) Idem acima pela distribuio F . Elaborar o quadro ANOVA.


19


Exemplo 3:

O par de valores
i
y e
i
x referem-se a ndice de quantidade demandada e tarifa real mdia,
respectivamente, de energia eltrica. Os valores da tarifa foram deflacionados por um indicador
adequado, tendo como base o ano t6.

Anos

i
y
i
x
t1 74 145
t2 76 134
t3 81 117
t4 90 111
t5 94 109
t6 100 100
t7 103 137
t8 108 122
t9 113 85
t10 115 90

1) Estimar a equao da demanda;

2) Tendo por base a equao obtida em (1), estimar a demanda esperada em t11 se a tarifa real
em t1 for de 98;

3) Determinar o intervalo de predio do valor estimado da demanda em t11;

4) Determinar o intervalo de predio com base no erro mximo do valor estimado;

5) Determinar o intervalo de confiana dos estimadores
1
b e
2
b ;

6) Avaliar a qualidade do ajuste;

7) Testar a hiptese da existncia de regresso entre as duas variveis (por Student e por
Fisher);

20


Exemplo 4:

Considere os dados amostrais de um estudo da relao entre o nmero de anos que os candidatos
a empregos em um determinado banco comercial estudaram ingls na faculdade e as notas
obtidas em um teste de proficincia nessa lngua.
Nmero de anos (x) Nota do teste (y)
3 5,2
4 7,7
4 7,4
2 5,3
5 9,1
3 6,4
4 7,3
5 8,6
3 7,4
2 4,3


Exemplo 5:
Uma empresa, com a finalidade de determinar a relao entre gastos anuais com propaganda
(X), em R$1.000,00 e lucro anual (Y), em R$1.000,00, optou por utilizar o modelo linear
simples
i i
X Y + + = , em que Yi o valor do lucro bruto auferidono ano i, Xi o valor
gasto com propaganda no ano i e , o erro aleatrio com as respectivas hipteses
consideradas para a regesso linear simples ( e so parmetros desconhecidos).
Considerou, para o estudo, as seguintes informaes referentes s observaes nos ltimos
10 anos da empresa

=
=
10
1
100
i
i
Y ;

=
=
10
1
60
i
i
X ;

=
=
10
1
650
i
i i
Y X ;

=
=
10
1
2
400
i
i
X ;

=
=
10
1
2
1080
i
i
Y ;

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que,caso
haja um gasto anual com propaganda de 80 mil reais, a previso do lucro bruto anual, em mil
reais ser de:
a) 84 b) 102,5 c) 121 d) 128,4 e) 158


Exemplo 6:
Utilizou-se um modelo de regresso linear para avaliar a relao entre o preo do litro da
gasolina e o do pretrleo Brent, ambos em reais, compreendendo o perodo de janeiro de 2002
a dezembro de 2006. Os resultados obtidos foram:
( ) ( )

= =
= =
60
1
60
1
2
2
052 , 0

58
1
; 18
i i
i i i
Y Y Y Y e 4 78 , 2 = E F
sig

21



Considere o quadro a seguir:
ANOVA
Soma dos
quadrados
Graus de
liberdade
Mdia dos
quadrados
F Fsig
Modelo
(regresso)

Residual X Y
Total

Os valores de X , Y e Z , no quadro acima, respectivamente so:
a) 3,016 ; 0,052 e 2,78E-4;
b)3,016; 0,052 e 288,154;
c) 14,98; 3,016 e 288,154;
d) 18 ; 0,052 e 2,78E-4;
e) 18 ; 0,052 e 288,154


Captulo 4: REGRESSO LINEAR MLTIPLA

4.1. INTRODUO

J vimos que na regresso linear simples consideramos apenas uma varivel econmica,
explicativa ou exgena, na parte direita da equao ( ) e x y + + = .
2 1
.

Na regresso mltipla so consideradas duas ou mais variveis explicativas ( )
i
x , como por
exemplo: salrio ( )
1
x , renda de aluguel ( )
2
x , renda de investimento ( )
3
x , etc. que influenciam a
varivel dependente
i
y .

Trata-se, portanto, de uma extenso do modelo de regresso linear simples.

Genericamente, em n observaes de variveis amostrais ( )
n
x x x y ,..., , ,
2 1
, o modelo assumir a
forma:

e x x x y
n n
+ + + + + =
1 2 3 1 2 1 1
. ... . . (19)

Ou, sob a forma de estimadores:

e x b x b x b b y
n n
+ + + + + =
1 2 3 1 2 1 1
. ... . . (20)

Se chamarmos a varivel endgena y de nvel de investimento, ele depender de fatores a ela
agregados como, por exemplo: taxa de juros, varivel de renda, etc. que so respectivamente as
variveis explicativas
i
x .
22


Os estimadores da equao (20) so os
i
b ( )
n
b b b b ,..., , ,
3 2 1
e as estimativas desses estimadores so
os
i
( )
n
,..., , ,
3 2 1
da equao (19).

O erro aleatrio ou resduo ( ) e

apontado nas duas equaes o resultado da diferena que
porventura venha a ocorrer entre os valores conhecidos
i
y e os valores esperados ou ajustados
pelo modelo
i
y .
i i
y y e = (resduo)
=
i
y volume real de venda
=
i
y volume esperado de venda

Alguns outros fatores que poderiam influenciar no valor de ( ) e , no caso da varivel venda, so os
comportamentos dos concorrentes, fatores meteorolgicos, etc. denominadas eventos de
natureza qualitativa, que veremos no captulo 8.


4.2. PRESSUPOSTOS DO MODELO

Alguns pressupostos devero ser considerados nos modelos de regresso mltipla, assim como
foram no modelo de regresso simples, tais como:

a) O valor de y para cada valor de x definido por
1 2 3 1 2 1
. ... . .

+ + + + =
n n i
x x x y
b) A esperana do erro aleatrio ( ) e E igual a zero
c) A varincia do erro aleatrio ( ) e V igual a
2
, o que significa que varincia do erro aleatrio
constante
d) O erro aleatrio e tem distribuio normal cuja mdia zero, ( ) a igual varincia e , 0 = e E
2


finito e constante.

e) A covarincia entre qualquer par de erros aleatrios
1
e e
2
e igual covarincia do par
1
y e
2
y que igual zero, ou seja: ( ) ( ) 0 ; cov ; cov
2 1 2 1
= = y y e e , significando que os termos
aleatrios so independentes.
f) O valor esperado ou a esperana matemtica da varivel dependente y, ( ) y E , depende dos
valores das variveis explicativas
i
x e dos parmetros desconhecidos
i
, ou seja:
( )
1 2 3 1 2 1
. ... . .

+ + + + =
n n
x x x y E



4.2.1. Teorema de Gauss-Markov

Este teorema nos diz que se os estimadores de mnimos quadrados atenderem as hipteses acima
relacionadas (letras a a f) sero os melhores estimadores lineares no-tendenciosos dos
parmetros, ou seja, eles so BLUE (best linear unbiesed estimators) em um modelo de regresso
mltipla.



23


4.3. ESTIMAO DOS PARMETROS

Para a estimao dos parmetros intercepto e angulares, podemos recorrer a dois caminhos.

a) Pela aplicao do princpio dos mnimos quadrados ordinrios (conhecido como equaes
normais), comentado no captulo anterior;

b) Pela forma matricial
Geralmente recomendado para modelos com mais de trs parmetros a serem estimados.
Conceitualmente, o modelo de n variveis uma extenso dos modelos de duas e trs
variveis, objeto de abordagem do presente curso. Assim, salvo a notao matricial, poucos
conceitos sero acrescentados, razo pela qual abordaremos apenas o primeiro
procedimento, ou seja, pelo critrio dos mnimos quadrados.

A vantagem da aplicao da lgebra matricial sobre a escalar que ela se aplica a uma, duas,
trs ou qualquer nmero de varveis, mas exigir do estudante total intimidade com a lgebra
matricial.


Estimao dos parmetros pela aplicao dos Mnimos Quadrados Ordinrios (M.Q.O.)

Procedimentos operacionais:

a) Determinar inicialmente os desvios em relao mdia aritmtica de cada uma das
variveis amostrais informadas (tanto dependentes quanto as independentes), ou seja:

Para valores de Y Y y Y
i i i
=
Para valores de X X x X
i i i
=
Este procedimento tem como finalidade facilitar os clculos, pois operamos com valores
reduzidos de
i
y e
i
x .

b) Aplicar os valores reduzidos de
i
y e
i
x nos modelos abaixo:

1) Clculo do estimador
2
b

( )( ) ( )( )
( )( ) ( )
2
2 1
2
2
2
1
2 2 1
2
2 1
2
. .
. . . . .

=
x x x x
y x x x x y x
b (21)

2) Clculo do estimador
3
b

( )( ) ( )( )
( )( ) ( )
2
2 1
2
2
2
1
1 2 1
2
1 2
3
. .
. . . . .

=
x x x x
y x x x x y x
b (22)

24


3) Clculo do estimador
1
b (intercepto)

Para este clculo utilizamos os valores j conhecidos de
2
b e
3
b alm da mdia aritmtica dos
valores reais de
i
Y e
i
X .

2 3 1 2 1
. . X b X b Y b = (23)

Representao:

n i
X X X Y ;...; ; ;
2 1
(so os dados numricos conhecidos)

2 1
; ; X X Y
i
(so as mdias dos mesmos dados)

As variveis
i
y e
i
x em letras minsculas so os afastamentos ou desvios em relao mdia
de
i
Y e
i
X , ou seja:

i i i
Y Y y = ;
1 1 1
X X x = ;
2 2 2
X X x = ; etc.


4.4. ESTIMAO DA EQUAO DE REGRESSO MLTIPLA

Encontrados os estimadores
1
b,
2
b e
3
b pelas equaes (21), (22) e (23) para obter a equao de
regresso da varivel dependente ( )
i
y em funo das variveis explicativas ( )
1
x e ( )
2
x , pelo
mtodo dos mnimos quadrados ordinrios, basta substituir no modelo de regresso mltipla
representado em (20) os parmetros obtidos, ou seja:

2 3 1 2 1
. . x b x b b y + + =

Onde:

1
b obtido em (19)
2
b obtido em (17)
3
b obtido em (18)


4.5. PREVISO DE VALORES COM BASE NA EQUAO DE REGRESSO

Definida a equao de regresso acima, poderemos efetuar previses ou estimao de valores
com a ajuda da citada equao.

25


Se forem conhecidos os valores de
1
x e de
2
x , poderemos estimar y. Como
1
b (intercepto)
constante, basta multiplicar
1
x e
2
x por
2
b e de
3
b , respectivamente, e adicionar o valor constante
de
1
b para termos o y estimado.


4.6. ERRO PADRO DA ESTIMATIVA

Conforme j visto na regresso simples, o erro padro da estimativa na regresso mltipla tem a
mesma finalidade, ou seja, avaliar a margem de erro (desvio padro) do valor estimado, podendo
ser calculado pela expresso:

( )
k n
y y
S
i
x y

=

2
:

(24)

Onde:
= y dados numricos conhecidos
= y dados ajustados pelo modelo
= n tamanho da amostra
= k nmero de parmetros (intercepto + angulares)


4.7. INTERVALOS DE PREDIO ( ) IP

Conhecido o valor estimado ( ) VE , para determinarmos a margem de variao do citado valor
basta subtrair e adicionar ao mesmo o erro padro da estimativa ( )
i
x y
S
:

que nada mais do que o


desvio padro dos resduos, conforme explicitado em (24).

Assim:

( )
i
x y
S VE IP
:

= (25)

( )
i i
x y x y
S VE S VE IP
: :

+ =


4.8. ERRO PADRO DOS ESTIMADORES

Os estimadores
2
b e
3
b tambm devem ser analisados quanto a sua variabilidade, pois quanto
menor o erro, melhor ser a qualidade do ajuste. A qualidade do ajuste, como veremos em 4.10,
tambm denominada Coeficiente de Determinao.

A obteno do erro padro do estimador
2
b feita pela expresso:

26


( ) | |

=
2
2
2
2 1 2
1
:
.

2
x
x x
x
S
S
x y
b
(26)

Quanto ao estimador
3
b , a expresso para clculo :

( ) | |

=
2
1
2
2 1 2
2
:
.

3
x
x x
x
S
S
x y
b
(27)


4.9. INTERVALO DE CONFIANA DOS ESTIMADORES

Assim como calculamos o intervalo de predio do valor estimado, podemos tambm determinar
o intervalo de confiana dos estimadores com base no erro padro e em funo do nvel de
significncia desejado na distribuio

t de Student e tem como finalidade avaliar o nvel de


preciso dos estimadores de fundamental importncia para anlise de regresso.

A expresso para determinar o intervalo de confiana de um dado estimador :

( ) ( ) { }
i i
b i i b i
S k n t b S k n t b P

. 1 + =

(28)

Onde:
=
i
b estimadores ( ) ;... ;
3 2
b b
( ) = k n t

valor tabelado na distribuio t


= nvel de significncia ( ) ;... 05 , 0 ; 01 , 0
= n tamanho da amostra
= k nmero de parmetros, inclusive intercepto
=
i
b
S

erro padro do estimador


i
b


4.10. COEFICIENTE DE DETERMINAO (poder explicativo da regresso)

Na anlise de regresso importante para o pesquisador verificar a qualidade do ajuste, ou seja,
uma medida que indique a proporo da variao de y que a equao de regresso consegue
explicar. Essa medida por ser avaliada pelo coeficiente de determinao, tambm conhecido
como poder explicativo da regresso, cuja expresso :
( )
( )

=
2
2
2

y y
y y
R (29)

27


O valor de
2
R , por ser uma proporo, estar compreendido entre 0 e 1 e quanto mais se
aproximar de 1, mais forte a associao entre variveis envolvidas na equao de regresso.
Costuma tambm ser apresentado em termos percentuais e, nesse caso, o campo de definio de
2
R ser de 0 a 100%, conforme j comentado no captulo anterior.


4.11. TESTE DE HIPTESES

O teste de hipteses pode ser aplicado anlise de regresso com o objetivo de verificar a
existncia de regresso entre variveis x e y no caso de uma regresso simples, conforme j
visto no captulo anterior. No caso de uma regresso mltipla, o teste pode ser utilizado para
verificar a influncia das variveis explicativas
1
x e
2
x sobre a explicada y.

Os testes que podero ser utilizados so de Student ( ) t e o de Fisher/Snedecor ( ) F .

Os procedimentos operacionais para a realizao dos testes seguem os mesmos critrios aos j
explicitados para a regresso simples, o que torna desnecessria a sua repetio. Os detalhes, se
houverem, so mnimos e de fcil entendimento.

Exemplo 6:

Os dados abaixo se referem ao ndice de quantidade demandada de energia eltrica ( ) Y , da tarifa
real mdia ( )
1
X e do produto real ( )
2
X .

Y
1
X
2
X
y
1
x
2
x
1
.x y
2
.x y
2 1
.x x
2
1
x
2
2
x y
( )
2
y y ( )
2
y y ( )
2
y y
69 143 84 -26 28 -11 -728 286 -308 784 121 74,46 29,81 676 421,89
76 134 85 -19 19 -10 -361 190 -190 361 100 77,89 3,57 361 292,75
81 117 82 -4 2 -13 -28 182 -26 4 169 78,28
... ... ...
90 111 86 -5 -4 -9 20 45 36
... ...
97,22
94 109 93 -1 -6 -2 6 2 12 97,71
100 100 100 5 -15 5 -75 25 -75 104,89
103 137 104 8 22 9 176 72 198 100,89
108 122 104 13 7 9 91 117 63 104,54
113 85 107 18 -30 12 -540 216 -360 117,28 18,32 324 496,40
115 92 105 21 -23 10 -483 210 -230 529 100 113,08 8,53 441 326,89
950 1150 950 0 0 0 -1922 1345 -880 3388 906 - 173,86 2282 1924,13

Desenvolver as questes:

1) Estimar a equao da demanda por energia eltrica pelo MQO;

2) Com base na equao da demanda obtida, estimar a demanda provvel quando a tarifa real
mdia ( )
1
x for de 87 e o produto real ( )
2
x for de 105;

3) Obter o intervalo de predio do valor estimado da demanda;

4) Calcular e interpretar o valor do coeficiente de determinao (poder explicativo da regresso);
28



5) Testar o efeito conjunto das variveis explicativas ao nvel de 5% pelo teste F, com o auxlio do
quadro ANOVA;

6) Testar, com base em Student, o efeito de cada varivel explicativa (
1
x e
2
x ) sobre os
parmetro a elas associadas (
1
b e
2
b ) a nvel de 5%.


Desenvolvimento:

1) Equao da demanda (forma linear)

Inicialmente calculamos os estimadores:

1.1) Estimador
2


( )( ) ( )( )
( )( ) ( )
2
2 1
2
2
2
1
2 2 1
2
2 1
2 2
. .
. . . . .

= =
x x x x
y x x x x y x
b

( ) ( )
( ) ( ) 128 . 295 . 2
732 . 557
880 906 3388
1345 880 906 1922
2 2

=


= b

243 , 0
2
= b

1.2) Estimador
3


( )( ) ( )( )
( )( ) ( )
2
2 1
2
2
2
1
1 2 1
2
1 2
3 3
. .
. . . . .

= =
x x x x
y x x x x y x
b

( ) ( )
( ) ( ) 128 . 295 . 2
500 . 865 . 2
880 906 3388
1922 880 3388 1345
2 3
=


= b

249 , 1
3
= b

1.3) Estimador
1


2 3 1 2 1 1
. . x b x b y b = =

( ) 95 249 , 1 115 243 , 0 95
1
= b

29 , 4
1
= b
29


A equao da demanda ser ento:

2 1
. 249 , 1 . 243 , 0 29 , 4 x x y + =

2) Previso da demanda quando:
87
1
= x (tarifa real mdia)
105
2
= x (produto real)

Substituindo na equao anterior, encontramos:

( )
105 249 , 1 87 243 , 0 29 , 4 + =
est
y

( )
3 , 114 =
est
y

3) Intervalo de predio

3.1) Pelo critrio normal
necessrio calcular inicialmente o erro padro da estimao

( )
2 10
86 , 170

=

k n
y y
S
y


66 , 4

=
y
S

O intervalo de predio ser ento

y
S VE


66 , 4 3 , 114
96 , 118 64 , 109 < < IP

4) Coeficiente de determinao

O coeficiente de determinao (Poder explicativo da regresso), tem por objetivo medir a
qualidade do ajuste, podendo ser avaliado pela relao:

( )
( )
84 , 0
2282
13 , 1924

2
2
2
= =

y y
y y
R

O resultado 84 , 0
2
= R ou % 84 sugere uma boa qualidade de ajuste.

30


5) Estatstica F (ou teste F)

Pode ser obtido pelo quadro da anlise da varincia (ANOVA Analisys of Variance)

A aplicao da estatstica F ao problema verificar se as variveis explicativas
1
x e
2
x (tarifa real e
produto real), respectivamente, exercem conjuntamente efeito significativo sobre a varivel
dependente y (demanda de energia eltrica).

Quadro ANOVA
Fonte de
Variao
Soma dos
quadrados
Graus de
liberdade
Mdia
quadrtica
E
Regresso ( )


2
y y
k
( )
k
y y
S
R


=
2
2


2
2
E
R
S
S
E =
Resduos ( )


2
y y
1 k n
( )
1

2
2


=

k n
y y
S
E

=
2
R
S varincia explicada ou varincia da regresso
=
2
E
S varincia residual
= k nmero de variveis explicativas

Retirando as estatsticas da tabela auxiliar e substituindo, encontramos:

Fonte de
Variao
dos quadrados g.l.
Mdia
quadrtica
E
Regresso
13 , 1924
2
07 , 962
2
=
R
S
73 , 38
84 , 24
07 , 962
= = E
Resduos
86 , 173
1 2 10 84 , 24
2
=
E
S

Logo,

73 , 38 =
c
F (valor calculado de F)

No caso de regresso mltipla, ou seja, duas ou mais variveis explicativas, a formulao das
hipteses pode ser feita conforme abaixo:

0 :
3 2 0
= = b b H (ausncia de efeito)
0 :
3 2 1
b b H (presena de efeito)

Se ( ) 1 > k n F F
c
, rejeitamos
0
H
( ) 1 < k n F F
c
, aceitamos
0
H

No exemplo em questo, ( ) 1 2 10
05 , 0
> F F
c


31


( ) 74 , 4 7
05 , 0
= F (na distribuio F, deve-se observar que o g.l. igual a 2 no numerador e 7 no
denominador.

Como 74 , 4 73 , 38
05 , 0
= > = F F
c
, devemos rejeitar a hiptese
0
H , o que sugere que pelo menos
uma das variveis explicativas
1
x ou
2
x exerce influncia significativa sobre a varivel dependente
y, com probabilidade de erro 5%.

6) Estatstica t com relao aos parmetros
2
e
3


Sabe-se que:
i
b
i i
c
S
b
t


=

6.1) Estatstica t para 0
2
=
O teste de significncia para o efeito da varivel explicativa
1
x (tarifa real) pode ser:
0 :
2 0
= H (ausncia de efeito)
0 :
2 1
< H (presena de efeito negativo)

Sabemos que: 243 , 0
2
= b ; 093 , 0

2
=
b
S
66 , 4

=
y
S ; ( ) 3646 , 2
05 , 0
= k n t

( )
( )
093 , 0
906
880
3388
66 , 4
.

2
2
2
2
2 1 2
1
2
=

x
x x
x
S
S
y
b


62 , 2
093 , 0
0 243 , 0
=

=
c
t
62 , 2 =
c
t

Como

t t
c
> ( ) 3646 , 2 62 , 2 > , rejeitamos
0
H , o que sugere a presena de efeito negativo da
varivel x sobre y.

6.2) Estatstica t para
3

O teste t para o efeito da varivel explicativa
2
x (produto real) pode ser:

0 :
3 0
= H (ausncia de efeito)
0 :
3 1
> H (presena de efeito positivo)

Sabemos que: 249 , 1
3
= b ; 179 , 0

3
=
b
S
32


66 , 4

=
y
S ; ( ) 3646 , 2 7
05 , 0
= t

( )
( )
179 , 0
3388
880
906
66 , 4
.

2
2
1
2
2 1 2
2
3
=

x
x x
x
S
S
y
b

977 , 6
179 , 0
0 249 , 1
=

=
c
t
Verifica-se que

t t
c
> ( ) 3646 , 2 977 , 6 > , o que sugere rejeitar a hiptese
0
H , significando a
presena de efeito positivo da varivel explicativa
2
x (produto real) sobre a demanda y.

Pelo teste t, nota-se que os parmetros
2
e
3
exercem influncia sobre y, primeira
negativamente e a segunda positivamente.


Exemplo 7:

Considere o quadro abaixo com informaes sobre investimentos ( ) Y , lucro esperado ( )
1
X e o
estoque de capital desejado ( )
2
X durante 15 anos (valores em R$ milhes).

i
t
i
Y
1
X

2
X
i
y
1
x
2
x y x.
1

2 1
.x x y x .
2

2
1
x
2
2
x y
( )
2
y y ( )
2
y y ( )
2
y y
1 2 60 3 -3 -9 -3 27 27 9 81 9 2,48 0,23 6,35 9
2 2 62 3 -3 -7 -3 21 21 9 49 9 2,47 0,22 6,40 9
3 4 65 4 -1 -4 -2 4 8 2 16 4 3,32 0,46 2,82 1
4 6 68 5 1 -1 -1 -1 1 -1 1 1 4,16 3,39
...
1
5 4 65 5 -1 -4 -1 4 4 1 16 1 4,17 0,03 1
6 3 62 4 -2 -7 -2 14 14 4 49 4 3,32 0,10 4
7 5 66 6 0 -3 0 0 0 0 9 0 5,01 0,01 0
8 6 70 7 1 1 1 1 1 1 1 1 5,85 0,02 1
9 5 68 6 0 -1 0 0 0 0 1 0 5,86 0,74 0
10 3 65 4 -2 -4 -2 8 8 4 16 4 3,32 0,10 4
11 4 69 5 -1 0 -1 0 0 1 0 1 4,15 0,02 1
12 5 72 6 0 3 0 0 0 0 9 0 4,99 0,00 0
13 6 78 8 1 9 2 9 18 2 81 4 6,68 0,46 1
14 8 80 10 3 11 4 33 44 12 121 16 8,37 0,14 11,36 9
15 12 85 14 7 16 8 112 128 56 256 64 11,76 0,06 45,70 49
75 1035 90 0 0 0 232 274 100 706 118 - 5,98 84,67 90

Pedidos:

1) Obter a funo de regresso do investimento;

2) Interpretar os resultados dos parmetros, pelo MQO;

3) Estimar o investimento esperado quando o lucro esperado for 90 e o estoque de capital for
12;
33



4) Obter o intervalo de predio ou previso do valor estimado em (3), com base no erro padro
da estimativa;

5) Obter o intervalo de confiana dos estimadores
2
e
3
;

6) Obter e interpretar o resultado da qualidade do ajuste (poder explicativo da regresso);

7) Verificar pelo teste F se as variveis
1
X e
2
X exercem conjuntamente efeito significativo
sobre Y (dependente);

8) Verificar pelo teste t se as variveis
1
X e
2
X exercem separadamente efeito sobre Y .

Desenvolvimento:

1) Funo Investimento

O modelo : e x x y + + + =
2 3 1 2 1
. . , cujos estimadores so
1
b,
2
b e
3
b .

As estatsticas calculadas com base no quadro auxiliar so:

5 = Y 69
1
= X 6
2
= X
232 .
1
=

y x 706
2
1
=

x
100 .
2
=

y x 118
2
2
=

x
2747 .
2 1
=

x x ( ) 75076 .
2
2 1
=

x x

Y Y y
i
=
1 1
X X x
i
=
2 , 2 2
X X x
i
=

( )( ) ( )( )
( )( ) ( )
2
2 1
2
2
2
1
2 2 1
2
2 1
2
. .
. . . . .

=
x x x x
y x x x x y x
b

( ) ( )
( )
003 , 0
8232
24
75076 118 706
100 274 118 232
2
=

=


= b

003 , 0
2
= b


( )( ) ( )( )
( )( ) ( )
2
2 1
2
2
2
1
1 2 1
2
1 2
3
. .
. . . . .

=
x x x x
y x x x x y x
b

34


( ) ( )
( )
85 , 0
8232
7032
75076 118 706
232 274 706 100
3
= =


= b ; 85 , 0
3
= b


2 3 1 2 1
. . x b x b y b =

( ) 6 85 , 0 69 003 , 0 5
1
= b

( ) 10 , 5 21 , 0 5
1
= b

11 , 0
1
= b

2 1
. 85 , 0 . 003 , 0 11 , 0 x x y + =

2) Interpretao dos parmetros

2.1) O valor 0,11 do intercepto significa que se o lucro esperado ( )
1
X e o estoque de capital
desejado ( )
2
X forem zero, o investimento seria de R$0,11.

2.2) A varivel explicativa
1
X (lucro esperado) sendo negativa, um aumento de R$1,00 no lucro
esperado acarreta um decrscimo de R$0,003 no investimento.

2.3) A varivel explicativa
2
X (estoque de capital desejado) sendo positiva, significa que um
aumento de R$1,00 nessa varivel acarreta um aumento de R$0,85 no investimento.

3) Investimento esperado

( ) 2 1
. 85 , 0 . 003 , 0 11 , 0 x x y
esperado
+ =

( )
20 , 10 27 , 0 11 , 0 + =
esperado
y

( )
04 , 10 $ R y
esperado
=

4 ) Intervalo de predio do valor estimado

( )
k n
y y
S
y

=

2


y
S VE IP

=

( ) 98 , 5
2
=

y y ; 15 = n ; 3 = k

71 , 0
3 15
98 , 5

=
y
S
35


71 , 0

=
y
S

y y
S VE IP S VE IP

+ < < =

71 , 0 04 , 10 71 , 0 04 , 10 + < < IP

75 , 10 33 , 9 < < IP

5) Intervalo de confiana dos estimadores

5.1) Intervalo de
2 2
b =
Calculamos inicialmente o erro padro de
2

( )


=
2
2
2
2 1 2
1
.

2
x
x x
x
S
S
y

= 706
2
1
x ;

=118
2
2
x

( )
085 , 0
118
274
706
71 , 0

2
2
=

S

085 , 0

2
=

S

O intervalo de confiana de
2

S baseia-se na igualdade probabilstica.



( ) ( ) ( )
i i
S k n t b S k n t b P P
i i i

. 1 + =

( ) ( ) 085 , 0 . 3 15 003 , 0 085 , 0 . 3 15 003 , 0 1
05 , 0 2 05 , 0
+ = t t P

085 , 0 1788 , 2 003 , 0 085 , 0 1788 , 2 003 , 0 1
2
+ = P

1822 , 0 1882 , 0 95 , 0
2
=

O resultado significa que existe uma probabilidade de 0,95 de que o estimador
2
esteja entre
1882 , 0 e 1822 , 0 .

5.2) Intervalo de
3
.
Clculo inicial de erro padro de
3


36


( )

=
2
1
2
2 1 2
2
.

3
x
x x
x
S
S
y
b


Estatsticas:

=118
2
2
x ( ) 076 . 75 274 .
2
2
2 1
= =

x x

71 , 0

=
y
S 706
2
1
=

x
66 , 11
71 , 0
706
076 . 75
118
71 , 0

3
=

=
b
S

21 , 0

3
=
b
S

Calculado o erro padro de
3

b
S , o intervalo de confiana baseia-se na igualdade probabilstica

( ) ( ) ( )
3 3

. 1
3 3 3
S k n t b S k n t b P P + =

Sabemos que:

85 , 0
3
= , 21 , 0
3
=

S e ( ) 1788 , 2 12
05 , 0
= t , ento teremos:

1788 , 2 21 , 0 85 , 0 1788 , 2 21 , 0 85 , 0 95 , 0
3
+ =

31 , 1 39 , 0 95 , 0
3
=

O intervalo encontrado de
3
sugere que existe uma probabilidade de 0,95 de que
3
esteja
entre 39 , 0 e 31 , 1 .

6) Qualidade do ajuste

O poder explicativo da regresso ou coeficiente de determinao tem por objetivo avaliar a
qualidade do ajuste e medido pela expresso
2
R .

( )
( )

=
2
2
2

y y
y y
R

Onde: 1 0
2
R ou % 100 0
2
R

Da tabela extramos as estatsticas:
37



( ) 67 , 84
2
=

y y ; ( ) 90
2

= y y

90
67 , 84
2
= R 94 , 0
2
= R ou % 94

O resultado obtido sugere uma boa qualidade de ajuste na funo de regresso.


7) Verificao pelo teste F se as variveis explicativas
1
X e
2
X exercem influncia conjunta sobre
a varivel dependente Y .

Do quadro auxiliar de clculos retiramos as estatsticas:

( ) 67 , 84
2
=

y y ; 15 = n (amostra)
( ) 98 , 5
2
=

y y ; 2 = k (variveis explicativas)

Utilizando ANOVA para obter
c
F :

Fonte de
Variao
dos quadrados g.l.
Mdia
quadrtica
c
F
Regresso
67 , 84
2
34 , 42
48 , 170
25 , 0
34 , 42
= =
c
F
Resduos
98 , 5
1 2 15
25 , 0

Hipteses:

0 :
3 2 0
= = b b H (ausncia de efeito)
0 :
3 2 1
b b H (presena de efeito)

Concluso:

48 , 170 =
c
F ; ( ) 89 , 3 13
05 , 0
= F

F F
c
>

Como

F F
c
> rejeitamos a hiptese
0
H , o que sugere que pelo menos uma das variveis
explicativas exerce efeito sobre a varivel Y . Com a probabilidade de 95% de que a assertiva
esteja correta.

8) Avaliao da influncia pelo teste t (Student)

- Formulao das hipteses:

38


0 :
2 0
= b H (ausncia de influncia)
0 :
2 1
b H (presena de influncia)

i
b
i i
c
S
b
t


= (Geral)
- Teste para o estimador
2
b (estimativa de
2
)

035 , 0
085 , 0
0 003 , 0

2
2 2
=

=
b
c
S
b
t



035 , 0 =
c
t

Tabela (t) = ( ) 1788 , 2 12
05 , 0
= t

Verifica-se que

t t
c
< , o que sugere aceitar
0
H , ou seja, ausncia de influncia.

- Teste para o estimador
3
b (estimativa de
3
)

04 , 4
21 , 0
0 85 , 0
=

=
c
t

04 , 4 =
c
t

( ) 1788 , 2 12
05 , 0
= t

Verifica-se que

t t
c
> , o que sugere rejeitar a hiptese
0
H , ou seja, a varivel estoque de capital
( )
2
X exerce influncia positiva sobre os investimentos.

Nota-se pelo teste t que apenas
3
exerce influncia sobre a varivel y.

39


Exemplo 8:

A tabela abaixo representa as observaes semanais sobre receitas ( )
i
Y , em R$1000,00, sobre
preo de venda ( )
1
X , em R$1,00, e gastos com propaganda ( )
2
X , em R$1000,00, durante 12
semanas para uma cadeia de lanchonetes.

i
t
i
Y
1
X

2
X
1 120 2,0 10
2 122 2,0 8
3 90 1,5 23
4 123 2,0 11
5 122 2,0 10
6 108 2,5 6
7 150 2,5 18
8 90 1,8 19
9 140 2,5 21
10 125 1,2 18
11 110 1,8 16
12 116 2,2 20
1416 24 180

- Desenvolver:

1) Obter a equao de regresso mltipla estimada da receita ( )
i
y ;

2) Obter a previso da receita quando 30 , 2
1
= x e 22
2
= x , em
13
t ;

3) Obter o intervalo de predio da receita prevista no item anterior;

4) Determinar o erro padro de estimativa;

5) Calcular o erro padro dos estimadores
2
e
3
;

6) Obter o intervalo de confiana dos estimadores
2
e
3
;

7) Avaliar a qualidade do ajuste;

8) Verificar pelo teste F se as variveis explicativas
1
x e
2
x exercem influncia conjunta sobre a
varivel receita ( )
i
Y .


Exemplo 9:

Dez pessoas sadias entre 20 e 40 anos, do sexo masculino, foram submetidas a um teste de
avaliao fsica, quanto ao peso total ( )
i
Y , peso magro ( )
1
X e as calorias dirias ingeridas ( )
2
X ,
como se segue:
40


i
Y
1
X
2
X
77 52 2.000
62 42 1.600
65 45 1.800
76 51 2.000
74 45 1.800
61 41 1.600
64 42 1.700
61 41 1.500
67 47 1.600
63 44 1.400

- Considerando que a srie de valores apresenta comportamento linear, obter:

a) A equao de regresso mltipla;

b) O peso total estimado, quando 50
1
= X e 450 . 1
2
= X ;

c) O erro padro da estimativa;

d) O erro padro dos estimadores
2
e
3
;

e) Analisar pelo teste F se as variveis explicativas
1
x e
2
x exercem, conjuntamente, influncia
sobre o peso total y;


Exemplo 10:

Considere as assertivas abaixo:

A) A funo consumo: C= a+bx+e, onde C= consumo agregado; x= renda e e= erro aleatrio, um
exemplo clssico de modelo terico;

B) O conjunto de variveis exfenas mais o termo constante denominado de regressor;

C) Com relao a regresso linear mltipla, a varivel dependente y deve variar linearmente com
o conjunto de variveis xi e no com cada uma destas;

D) Se comparamos a regresso linear mltipla com a regresso linear simples, os resduos
daquele so sempre menores;

E) Numa anlise de regresso, o termo erro aleatrio ou perturbao estocstica (e), nada mais
do que o representante de todas as variveis omitidas que podem eventualmente afetar a
varivel endgena, mas que no puderam ser includas no modelo.
41


Esto corretas as afirmativas:

a) A e B b) C e D c)A e E d) B eE e) A,B e E


Exemplo 11:

Com relao regresso linear mltipla, assinale a afirmativa correta:

A) A representao geomtrica sempre de um plano: e x x x y
n n
+ + + + + =
1 2 3 1 2 1
.....

B) Quando comparados com a regresso linear simples, os resduos so sempre menores;

C) A varivel y dependente deve variar linearmente com o conjunto de variveis xi e no com
cada uma delas;

D) Funes como
k
x
k
x x
b b b a y .....
2 1
2 1
= so sempre linearizveis ;

E) Na aplicao de logaritmos sempre permite a lenearizao, culminando na representao
geomtrica por hiperplano.


Exemplo 12:

Considerando o modelo de regresso linear simples, tendo x como varivel aleatria e
independente e y como varivel dependente, correto afirmar que:

a) A varivel x no isenta de erro;

b) A funo de regresso fornece a mdia de x para cada y considerado;

c) A varivel no isenta de erro;

d) A variao residual de y distribuda normalmente com desvio padro constante e mdia
diferente de zero;

e) A variao residual de y constante com x.


42


Exemplo 13:

Dentre as afirmativas abaixo, assinale a(s) correta(s)

a) Quando o pesquisador encontra dificuldades para incorporar a um dado modelo e fatos de
natureza no quantitativa, podemos dizer que est diante de umalimitao de natureza
estatstica;

b) A funo consumo do tipo e x+ + .
2 1
, onde y= consumo agregado; x= renda e e = erro
aleatrio , pode ser considerado um modelo economtrico, dada a necessidade de aplicar
tratamento estatstico na sua anlise;

c) O conjunto de variveis exgenas mais o termo entercepto so denominados de regressores;

d) Num modelo de regresso linear devero ser levados em considerao alguns pressupostos
bsicos, como por exemplo: A covarincia entre qualquer par de erros aleatrios e1 e e2
sempre diferente da covarincia do par y e y2 que igual a unidade


Exemplo 14:

Uma srie temporal de 15 termos foi ajustada a uma funo do tipo + + = x y .
2 1
, tendo sido
encontradas as seguintes estatsticas de avaliao:

a) x y 8 , 1 5 , 4 + =

b) 696 , 0

2
=
b
S

c) ( )

= 4 , 113
2
y y

d) ( )

= 300
2
y y

e) ( )

= 6 , 186
2
y y


14.1. Determinando o intervalo de confiana com o estimador
2
, com 05 , 0 = , encontramos ...

a) 0,316 283 , 3
2


b) 0,307 292 , 3
2


c) 0,302 983 , 5
2


43


d) 2,996 003 , 6
2


e) 0,296 303 , 3
2



14.2. Determinando o valor do poder explicativo da regresso (R
2
) obtemos:

a) 0,608 b)0,622 c)0,378 d)0,806 e)2,645


14.3. Testando a hiptese quanto a ausencia ou a presena de regresso da funo x y 8 , 1 5 , 4 + =
pelo teste F, com base em ANOVA, obtemos para F0(calculado) o valor de .......; e assim podemos
concluir que .....

a) 7,9 ; sugere ausncia de regresso entre x e y;

b) 7,9 ; os dados so insuficientes para aplicao do teste;

c) 9,1 ; sugere ausncia de linearidade da funo;

d) 7,9 ; sugere presena de regresso entre x e y;

e) N.R.A


Exemplo 15:

Qual das afirmaes abaixo faz referencia correta ao modelo de regresso linear simples?
a) Toda regresso apresenta heterocedasticidade.
b) Se a varincia constante, os dados so homocedsticos.
c) O intercepto representa a inclinao da reta de regresso.
d) Os erros do modelo no so aleatrios, com a esperana igual a 1.
e) A constante sempre positiva.


Exemplo 16 :

Com relao Regresso Linear Mltipla, assinale a afirmativa correta:
a) A varivel Y dependente deve variar linearmente com o conjunto de variveis X1 e no com
cada uma destas.
b) A representao geomtrica sempre de um plano: y=a1+b2x1+b3x2+.......bnxn-1 +e1 .
c) Funes como
xk
k
x x
b b ab y .....
2
2
1
1
= so sempre linearizveis.
d) A aplicao de logaritmos sempre permite a linearizao, culminando na representao
geomtrica por hiperplano.
e) Quando comparados com a Regresso Linear Simples, os resduos so sempre menores.
44


Exemplo 17:

Suponha que o custo de produo de energia por kilowatt/hora(Y) seja uma funo linear do fator
de carga (X1), em % e do custo do carvo (XZ) em centavos de dlar por milho de Btu. Assumindo
normalidade dos dados, um modelo de regresso linear mltipla foi adotado para uma amostra de
tamanho 12.

O modelo estimado foi:
Y= 6,14 0,04X1 + 0,09X2
(0,91) (0,01) (0,01)

Sendo os erros padres indicados entre parnteses.
A tabela da anlise de varincia, incompleta, encontra-se a seguir

TABELA ANOVA
FV Graus de
liberdade
Soma dos
quadrados
Mdia dos
quadrados
F F de significao
Regresso 31,15 9,02E-05
Residuo 0,6
Total

Com base nesses dados, considere as afirmaes a seguir:
I. Para cada aumento de uma unidade na varivel X1 corresponder um decrscimo de 0,04 na
varivel Y, permanecendo inalterada a varivel X2.
II. A varincia residual do modelo considerado 0,6 (Kilowatt/hora)
2
.
III. O intervalo bilateral de 95% de confiana para o custo do carvo , aproximadamente, (0,07;
0,11)

Est correto o que se afirma em:

a) II apenas b) III apenas c) I e II apenas d) I e III apenas e ) I,II e III .


Captulo 5: CORRELAO

5.1. OBJETIVO PARA A ECONOMIA

de grande importncia para a Economia explorar e verificar os inter-relacionamentos existentes
entre as variveis econmicas. Essa avaliao, bem como seu grau de intensidade, pode ser
medida atravs do coeficiente de correlao que veremos a seguir.


5.2. CONCEITO DE CORRELAO

Correlacionar verificar com base em tcnicas especiais se existe inter-relacionamento entre
variveis (econmicas ou no).
45


Quando esta avaliao feita entre duas variveis como, por exemplo, consumo mdio e renda
mdia, denominada correlao simples.

Quando a avaliao feita entre trs ou mais variveis chamada de mltipla como, por exemplo,
temperatura, umidade, ndice pluviomtrico, patrimnio, faturamento, vendas, etc...Os princpios
bsicos que regem os problemas da correlao mltipla so semelhantes aos da correlao
simples.

Quando feita entre trs ou mais variveis permanecendo fixa (constante), as demais variveis do
conjunto observado chamada de parcial. Dessa forma, a correlao parcial estima a relao
funcional entre a varivel dependente e outras variveis independentes.
No nosso curso, sero detalhadas apenas a avaliao e interpretao da correlao simples.


5.3. MEDIDA DE CORRELAO

O instrumento de medida de correlao dado pelo coeficiente de correlao de Pearson,
representado por r , e as expresses para o clculo geralmente utilizadas so:
( )( )
( ) ( )
|
|
.
|

\
|

|
|
.
|

\
|

n
y
y
n
x
x
n
y x
xy
r
2
2
2
2
.
.
(30)
Outra forma de clculo:

( )( ) | |
y x
n
y y x x
r


=

.
(31)

Onde:
x e y = variveis sob anlise
x
e
y
= desvios padro das variveis x e y
n = tamanho amostral


5.4. O COEFICIENTE DE CORRELAO r E SUA INTERPRETAO

O valor de r pode apresentar-se de forma positiva ou negativa.

Quando r positivo significa que as duas variveis em estudo ( x e y), por exemplo, crescem ou
decrescem no mesmo sentido.

Quando r negativo significa que as duas variveis em anlise seguem sentidos inversos, ou seja,
quando os valores de x evoluem crescentemente, os de y tendem a evoluir decrescentemente e
vice-versa.
46


Genericamente, a interpretao do valor de r pode ser obtida com base na tabela seguinte:

r ( )
Correlao
0 Nula
0,00 0,30 Fraca
0,30 0,60 Mdia
0,60 0,90 Forte
0,90 0,99 Fortssima
1 Mxima

O domnio de r portanto:
1 1 + r

Depreende-se pela tabela de avaliao que quanto mais prximo for o valor de r de 1 ou -1, mais
acentuado o inter-relacionamento entre as variveis ( x e y). Ressalve-se que tais valores so
arbitrrios , razo pela qual devero ser usados apenas para se ter uma idia da magnitude da
correlao e no como medida decisria.


5.5. IMAGENS DE r NO PLANO CARTESIANO EM FUNO DO SEU VALOR




1 0 < < r
y
x
0 1 < < r
y
x
(correlao

(correlao negativa)
0 = r
(correlao nula) (circular)
y
x
y
x
47


(r =mxima positiva)












5.6. DIFERENA ENTRE CORRELAO E REGRESSO

Vale deixar registrado que existe uma diferena entre correlao e regresso. Como j vimos, a
correlao mede o grau de inter-relacionamento ou associao entre variveis, ao passo que a
regresso mostra o efeito da varivel explicativa
i
x sobre a varivel explicada
i
y . Se analisarmos
os dois procedimentos, podemos sugerir que a anlise de regresso apresenta algumas vantagens
em relao anlise de correlao, quais sejam:

- A regresso indica o sentido da relao de dependncia entre x e y;

- Os parmetros intercepto e angular podem ser estimados e utilizados para fins de previso.


Exemplo 18:

O par y e x se refere a demanda de energia eltrica ( ) y e tarifa ( ) x .

i
t ( ) kw y1000 x
y x.
2
y
2
x
( ) x x ( ) y y b a
2
a
2
b
1 30 4 120 900 16 -2 8 -16 4 64
2 28 4 112 784 16 -2 6 -12 4 36
3 24 3
... ... ...
-3 2 -6 9 4
4 23 5 -1 1 -1 1 1
5 22 5 -1 0 0 1 0
6 22 5 -1 0 0 1 0
7 20 6 0 -2 0 0 4
8 18 8 2 -4 -8 4 16
9 18 9 3 -4 -12 9 16
10 15 11 165 225 121 5 -7 -35 25 49
220 60 1230 5030 418 0 0 -90 58 190

(r =mxima negativa)

1 + = r
1 = r
48


Perguntas:

1) Calcular o coeficiente de correlao ( ) r pelos dois procedimentos, interpretando o resultado;

2) Traar o diagrama de disperso e verificar se o citado diagrama corresponde ao valor
encontrado de r ;

3) Testar a hiptese da existncia de correlao entre y e x por Student, com 05 , 0 = .

Desenvolvimento:

1) Clculo de r

1.1) Pela expresso (30)
( )( )
( ) ( )
|
|
.
|

\
|

|
|
.
|

\
|

n
y
y
n
x
x
n
y x
xy
r
2
2
2
2
.
.


|
.
|

\
|

|
.
|

\
|

=
10
48400
5030 .
10
3600
418
10
220 60
1230
r

86 , 0 = r

Pela expresso (31)


( )( ) | |
y x
n
y y x x
r


=

.


408 , 2 359 , 4 10
90


= r

86 , 0 = r


. Interpretao:

fcil verificar que os resultados obtidos pelos dois critrios so os mesmos, sugerindo uma forte
correlao inversa, o que significa que, medida que o consumo de energia eltrica decresce,
aumenta o valor da tarifa.

49


y
x
2) Diagrama de disperso

O diagrama de disperso nada mais do que a colocao de pontos coordenados de y e x no
plano cartesiano, o que nos permite visualizar a relao entre essas variveis. Alm disso, ajuda-
nos a identificar a presena de outliers que, se ocorrer, pode distorcer acentuadamente o
resultado da correlao.

Outliers so dados atpicios que diferem significativamente do conjunto sob anlise.

A imagem grfica abaixo sugere que as duas variveis nela consideradas (consumo de energia
eltrica x tarifa) so negativamente relacionadas, sem presena de outliers






3) Teste de hiptese da existncia de ( ) r

Nem sempre o valor de ( ) r garante a existncia de correlao devido a fatores diversos, tais como
nmero insuficiente de dados amostrais, variveis com informaes distorcidas, etc.

Uma forma para se verificar a existncia de correlao a aplicao do teste de hipteses, como a
distribuio t de Student, por exemplo.

Recomenda-se aplicar o teste para variveis com tamanho da amostra igual ou superior a 30
informaes, pois se deve atender a hiptese que as mesma apresentam tendncia de
normalidade.

Para testar a hiptese por Student, devemos inicialmente determinar o valor de t calculado ( )
c
t
pela expresso:
30

25


20


15


10


5



2 4 6 8 10 12
50


2
1
.
r
k n r
t
c

= (32)

Onde:
= r resultado do coeficiente de correlao
= n tamanho da amostra
K = nmero de variveis

O valor de
c
t deve ser comparado com o valor de ( ) k n t

tabelado.

Se ( ) k n t t
c
>


ou ( ) k n t t
c
<



Em contra partida se:

( ) ( ) k n t t k n t
c


, aceita a hiptese
0
H

A formulao das hipteses dever acompanhar o seguinte esquema:
0 :
0
= H , ausncia de correlao
0 :
1
H , presena de correlao

No exemplo em questo temos:

2
1
.
r
k n r
t
c

=

( )
2
86 , 0 1
2 10 . 86 , 0


=
c
t

Consultando a tabela para ( ) 31 , 2 2 10
05 , 0
= t , nota-se que 7 , 4 =
c
t maior que ( ) 31 , 2 8 =

t , o
que sugere rejeitar a hiptese
0
H e aceitar
1
H , que indica presena de correlao, conforme
hipteses abaixo formuladas.
0 :
0
= H , ausncia de correlao
0 :
1
H , presena de correlao

4) Formas alternativas para o clculo de r (coeficiente de correlao) e de R
2
(coeficiente de
determinao)

Conhecendo-se o valor de r, pode-se rapidamente estimar o valor de R
2
, bastanto para tanto
elevar ao quadrado o valor de r, ou seja: se r = 0,75, R
2
=0,56. Da mesma forma, como decorrncia,
se R
2
=0,56, r = 75 , 0 56 , 0 =




51


Exemplo 19:
Considere o par abaixo referente a taxa efetiva de inflao ( ) % y e a taxa de desemprego ( ) % x .

( )
i
t
i
y
i
x
t1 6 5
t2 11 6
t3 9 8
t4 6 8
t5 6 7
t6 8 6
t7 11 6
t8 13 7
t9 10 8
t10 10 9


1) Calcular o coeficiente de correlao pelos modelos conhecidos, interpretando o resultado;

2) Traar o diagrama de disperso no plano cartesiano. Verificar se h coerncia com o valor de
r encontrado;

3) Testar a hiptese da existncia de correlao entre inflao e taxa de desemprego. Utilize
Student com 05 , 0 = .


Exemplo 20:

Com base nos dados do ndice de quantidade demandada e tarifa real do exemplo 3, obter:

a) O coeficiente de correlao, interpretando o seu resultado;

b) Traar o diagrama de disperso;

c) Testar a hiptese da existncia de correlao, utilizando Student, com 05 , 0 = .


Exemplo 21:

Sobre a avaliao da correlao linear, analise as assertivas:

A) O coeficiente de correlao dever ser testado quanto diferena para nulidade, atravs do
teste t de Student;

B) A correlao parcial estima a relao funcional entre a varivel dependente e outras variveis
independentes;
52



C) Na correlao linear mltipla, R
2
indica a parcela de variao total de y explicada pelo
hiperplano de regresso.

D) A presena de outliers suaviza o efeito da correlao.

Est (o) correta (s) apenas a(s) afirmativa (s) :

1) A 2) B e C 3) A, B e C 4) A,C e D 5) A e B


Exemplo 22:

Utilizou-se um modelo de regresso linear para avaliar a relao entre o preo do litro da
gasolina e o do petrleo Brent, ambos em reais, compreendendo o perodo de janeiro de 2002
a dezembro de 2006.
Os resultados obtidos foram:

( ) ( )

= =
= =
60
1
60
1
2
2
052 , 0

58
1
; 18
i i
i i i
Y Y Y Y e 4 7 , 2
.
= E F
sig



Considere o quadro a seguir.

ANOVA
FV Soma dos quadrados Graus de liberdade Mdia dos quadrados F Fsig
Modelo (regresso) z
Residual x Y
Total

Os valores de X , Y e Z, no quadro acima, respectivamente, so:
a) 3,016; 0,052 e 2,78E-4;
b) 3,016; 0,052 e 288,154;
c) 14,98; 3,016 e 288,154;
d) 18; 0,052 e 2,78E-4
e) 18; 0,052 e 288,154.

53


Exemplo 23:

As estatsticas a seguir foram obtidas de observaes realizadas em 100 individuos com
relao a duas caractersticas X e Y.


= =
= =
100
1
100
1
248 ; 58
i i
i i
X Y ;

( ) ( )

= =
= =
100
1
100
1
2 2
144 ; 25
i i
i i
Y Y X X ;

( )( )

=
=
100
1
; 2 , 43
i
i i
Y Y X X

O coeficiente de correlao amostral entre X e Y igual a :
a) -0,36 b) -0,18 c) 0,44 d) 0,72 e) 0,80


Exemplo 24:

A partir de uma amostra aleatria (X1 , Y1), (X2, Y2) ........., (X20, Y20) foram obtidas as estatsticas:
mdias 5 , 12 = X e 19 = Y , varincias amostrais 30
2
=
x
S e 54
2
=
y
S e covarincia 36
2
=
xy
S
Qual a reta de regresso estimada de Y em X?
a) ; 667 , 0 19

i i
X Y + = b) ; 2 , 1 5 , 12

i i
X Y + =
c) ; 2 , 1 4

i i
X Y + = d) ; 2 , 1 19

i i
X Y + = e) ; 8 , 22 80

i i
X Y + =


Captulo 6: VIOLAO DOS PRESSUPOSTOS BSICOS

Neste captulo sero abordados alguns aspectos relacionados com a estimao de modelos
quando os resduos ( )
i
e no so constantes, ou seja, quando tais resduos associados com
observaes em um dado perodo de tempo se mantiverem, por transferncia, nos perodos
subsequentes.

Na ocorrncia desses casos, estamos diante de uma violao aos pressupostos bsicos j
comentados.

Assim, nos itens 6.1 a 6.5 deste captulo falaremos sobre heteroscedasticidade e no captulo 7
sobre autocorrelao que uma outra forma de violao.


54


6.1. HETEROSCEDASTICIDADE E HOMOSCEDASTICIDADE

J vimos que na anlise de regresso era necessrio levar em considerao algumas hipteses, tais
como:

- o valor de y para cada valor de x dado por: e x y + + =
1 2 1
. ;
- a esperana do erro aleatrio dever ser igual a zero ( ) 0 = e E ;
- a varincia do erro aleatrio dever ser igual a varincia de y (varivel explicada)
( ) ( ) y V e V = ;
- as variveis explicativas ( )
i
x so fixas e no estocsticas;
- a varincia do erro aleatrio dever ser constante ( ) e V = constante;
- alm de outros.

Quando os pressupostos citados ou hipteses bsicas no se verificam, estamos diante de uma
violao ou transgresso.

Na ocorrncia desses casos algumas indagaes vm mente do pesquisador, tais como: o que
provoca tais distores? Quais as consequncias para as estimaes dos parmetros? O que fazer
para minimizar tais problemas? Quais os procedimentos para diagnostic-los?

Para melhor entender a matria necessrio conhecer o significado de alguns termos, como
heteroscedasticidade e homoscedasticidade.


6.2. NATUREZA DA HETEROSCEDASTICIDADE

Conforme comentado acima, uma importante hiptese no modelo de regresso que a varincia
de cada erro aleatrio ( ) e V seja um nmero constante igual a
2
.

Essa a hiptese do princpio da homoscedasticidade.

Quando isso no se verifica, ou seja, quando a varincia do erro aleatrio ( ) e V algum nmero
no constante, para todas as informaes numricas dizemos que o modelo de regresso
heteroscedstico e, nesse caso, estaremos diante de uma srie numrica que apresenta
problemas heteroscedsticos.

Para melhor esclarecer a diferena entre homoscedasticidade e heteroscedasticidade suponha
que no modelo e x y + + =
1 2 1
. , y represente poupana e x a renda.

Na prtica, medida que a renda aumenta a poupana tambm tende a aumentar, em mdia.

Quando a varincia, em relao mdia da poupana, permanece a mesma em todos os nveis de
renda, ou seja, mesmo que a renda aumente, a varincia da poupana permanece constante,
dizemos que este comportamento homoscedstico.
55


Diagramaticamente, um comportamento homoscedstico de pontuaes aleatrias pode ser
observado no diagrama 1. Por esse diagrama, mesmo quando o nvel ( )
i
n de renda aumenta, a
varincia condicional da poupana permanece a mesma.


Diagrama 1 (homoscedstico)


















ni = nvel de renda



Nota-se que a varincia da poupana permanece constante, mesmo com o aumento da renda.

Quando a varincia condicional de y (poupana) aumenta, quando a renda ( )
i
n aumenta, ou seja,
quando as varincias no so mais as mesmas, quando os nveis de renda aumentam, como se
pode verificar no diagrama 2, dizemos que existe heteroscedasticidade.

n3
n2
n1
i
x y .
2 1
+ =
Renda ( ) x
Poupana ( ) y
Funo densidade
de probabilidade
56


Diagrama 2 (heteroscedstico)

















ni = nvel de renda



OBS: Nota-se que a varincia da poupana vai se modificando medida que o nvel de renda
aumenta.

Alguns autores definem heteroscedasticidade como sendo a existncia de no-imutabilidade nos
resultados da varincia dos erros, ou tambm, quando os desvios-padro dos resduos no so
constantes. Como o desvio padro a raiz quadrada da variancia, procede a definio.


6.3. CONSEQUNCIAS DA HETEROSCEDASTICIDADE

Uma das consequncias de maior relevncia que os estimadores ( )
i
b obtidos (principalmente
pelo M.Q.O.) no so eficientes ou no apresentam varincia mnima, o que significa violar um dos
princpios do mtodo dos mnimos quadrados, tendo como consequncias:

- erros padro viesados;
- incorreo nos testes t e F;
- intervalos de confiana no confivel;
- etc.


6.4. DETECO DA HETEROSCEDASTICIDADE

Para verificao da existncia de heteroscedasticidade existem dois mtodos (formais e informais)

n3
n2
n1
i
x y .
2 1
+ =
Renda ( ) x
Poupana ( ) y
Funo densidade
de probabilidade
57


Deteco pelo mtodo informal ou por observao visual:

Os mtodos informais podem ser utilizados quando se desconhece a natureza da
heteroscedasticidade e, nesse caso, efetuamos a anlise de regresso partindo-se da hiptese de
que no h nenhuma violao aos pressupostos.

Procedimentos operacionais:

1) Obter a equao de regresso;
2) Determinar os resduos ( )
i
e ;
3) Representar graficamente os valores residuais no plano cartesiano;
4) Comparar o diagrama assim obtido com os diagramas padronizados de resduos
reconhecidamente heteroscedsticos, cujos formatos so os diagramas d1, d2, d3 e d4
adiante;
5) Se o diagrama obtido assemelhar-se ao da figura (d1, d2 e d3) provvel que a srie seja
heteroscedstica; caso se assemelhe ao da figura d4 provvel que a srie seja
homoscedstica.

Diagramas padro de resduos heteroscedsticos























d1, d2 e d3 so resduos heteroscedsticos.
d4 um resduo homoscedstico.

i
e
i
x

d1
i
e
i
x

d2
i
e
i
x
d3
i
e
i
x
d4
58


x

i
e
Exemplo 25:

O par
i i
y x; apresenta a seguinte equao de regresso: x y 77 , 0 22 , 0 + = .
Verificar, com base em anlise visual dos resduos ( )
i
e , se a srie apresenta tendncia
heteroscedstica.

x
y
i
e
6 4 -0,4
9 6 -0,7
11 10 1,5
15 14 2,5
16 9 -3,3
22 13 -3,9
23 21 3,3
102 77

Desenvolvimento:




Pelo mtodo informal, calculamos os resduos ( )
i
e com base na equao de regresso j
informada, x y 77 , 0 22 , 0 + = , resultando na coluna
i
e do quadro. Na sequncia plotamos esses
valores no plano cartesiano, cuja imagem a que se segue.


4,0


3,5


3,0


2,5


2,0


1,5


1,0


0,5



-0,5
5 10 15 20 25

-1,0


-1,5


-2,0


-2,5


-3,0


-3,5


-4,0


59


Concluso:
Fazendo a comparao grfica nota-se que o diagrama residual
i
e do par de valores ( x e y)
assemelha-se ao da figura d1 que um padro de resduo heteroscedstico. Dessa forma, com
base em anlise visual dos resduos, conclui-se que a srie em questo heteroscedstica.

Exemplo 26:

O par
i i
y x; de tendncia linear tem equao de regresso
i
x y 94 , 77 1342 , 0 + = . Verificar, com
base em anlise visual dos resduos se a mesma heteroscedstica.

i
x
i
y
0,060 4
0,086 6
0,107 10
0,146 14
0,156 9
0,215 13
0,230 21
1,00 77


Deteco da heteroscedasticidade pelo mtodo formal

Existem inmero testes para verificar a presena de heteroscedasticidade pelo mtodo formal,
tais como os mtodos de:

- Goldfeld e Quandt;
- Pesaran e Pesaran;
- Gledjiser;
- Etc.

Apesar desses mtodos apresentarem fundamentos tericos assemelhados, o mais recomendado
o teste de Goldfeld e Quandt. Neste mtodo, conhecido um dado par de valores de
i
y e
i
x , os
procedimentos operacionais para sua verificao sos os seguintes:

Teste de Goldfeld e Quandt

1) Ordenar os valores da varivel explicativa
i
x , de forma crescente, ou seja, segundo a sua
magnitude;

2) Os valores de y devero acompanhar o deslocamento de x;

3) Eliminar alguns dados centrais da srie aps a ordenao. Geralmente da ordem de, no
mximo, do tamanho amostral ( c = dados eliminados);
60



4) As observaes restantes, ou seja, aquelas correspondentes a ( ) c n observaes devero
ser divididas em dois subgrupos de igual tamanho. Por exemplo, se 30 = n e tendo sido
desconsiderado 10 = c ( de 30), restando 20 = n , formando dois subgrupos de 10
informaes cada;

5) Obter a funo de regresso dos dois subgrupos;

6) Obter a soma dos quadrados dos resduos dos dois subgrupos, respectivamente SQR1 e SQR2,
ou seja:
( )

=
2
1 1 1
y y SQR (33)
( )

=
2
2 2 2
y y SQR (34)

7) Obter F calculado ( )
c
F , que a relao entre SQR2 e SQR1, dividido pelo nmero de graus de
liberdade.
( )
( )
( )
( ) k c n
y y
k c n
y y
F
c
2 . 5 , 0

2 . 5 , 0

2
1 1
2
2 2

(35)

O nmero de graus de liberdade (g.l.) dado pela expresso:

( )
( ) k c n
k c n
l g 2 . 5 , 0
2
2
. . =

= (36)
Onde:
= n tamanho da amostra inicial
= c nmero de itens amostrais desprezados
= k nmero de parmetros (intercepto + angulares)

8) Comparar o valor de
c
F com o valor tabelado de F de Fisher, com o g.l. obtido em (36), ou
seja: ( ) 5 , 0 . 2k c n F



9) Se

F F
c
> rejeitamos a hiptese de que a srie de resduos homoscedstica, o que significa
sugerir que, provavelmente, a srie heteroscedstica. Em caso contrrio, se

F F
c
< a srie
homoscedstica.

OBSERVAO:

A finalidade de se desprezar alguns dados centrais da srie acentuar a diferena entre o
subgrupo de varincia maior. A omisso de dados dever ser feita em funo do tamanho da
amostra. Via de regra costuma-se desprezar:
- para 8 30 = n dados
- para 16 60 = n dados, etc.
61


Exemplo 27:

Verificar, com base no teste de Goldfeld e Quandt, se o par de valores abaixo apresenta sintomas
de heteroscedasticidade.

Dados originais
1
y
1
x
33 44
37 49
41 54
46 62
51 68
57 71
65 78
72 82
81 86
91 92
100 100
103 97
114 98
122 95
136 101
141 109
150 117
155 121
163 121
170 125
172 119


Desenvolvimento:

1) Dados ordenados
2
y
2
x
2
y
2
x
2
y
2
x
33 44 122 95 170 125
37 49 103 97
41 54 114 98
46 62 100 100
51 68 136 101
57 71 141 109
65 78 150 117
72 82 172 119
81 86 155 121
91 92 163 121
62


OBS:
Os dados foram ordenados em funo da magnitude de
i
x


2) Obteno da funo de regresso e do nmero de graus de liberdade da srie 1 (S1)

1
y
1
x
1
y

( ) ( )
2
1
2
1 1
e y y =
33 44 31,90 1,20
37 49 36,83 0,03
41 54 41,76 0,58
46 62 49,65 13,32
51 68 55,57 20,88
57 71 58,52 2,31
65 78 65,43 0,18
72 82 69,37 6,91
402 508 - 45,42 (SQR1)

- Estatsticas obtidas para a srie 1:

a) Funo de regresso:
1
. 986 , 0 48 , 11 x y + =

b) Nmero de graus de liberdade:
( )
( )
6
2
2 2 5 21
2
2
. .
1
=

=

=
k c n
S l g

c) Soma dos quadrados dos resduos:
42 , 45
1
= SQR


3) Obteno da funo de regresso e do nmero de graus de liberdade da srie 2.

2
y
2
x
2 2
.x y

2
2
x
2
y

( ) ( )
2
2
2
2 2
e y y =
100 100 10.000 10.000 148,74 2.375,59
136 101
...
10.201 149,47 181,44
141 109
...
155,31 204,78
150 117 161,15 124,32
172 119 162,61 88,17
155 121 164,07 82,26
163 121 164,07 1,15
170 125 21.250 15.625 166,99 9,06
1.187 796 136.851 104.839 - 3.066,77 (SQR2)

63


( ) ( )( )
( ) ( )
( )
73 , 0
796 839 . 104 8
187 . 1 796 851 . 136 8
.
. . .
2 2
2
2 2 2 2
2
=


=

=


x x n
y x y x n
b

74 , 75 5 , 99 73 , 0 38 , 148 .
2 2 2 1
= = = x b y b

Estatsticas obtidas para a srie 2:

a) Funo de regresso:
2 2
. 73 , 0 74 , 75 x y + =

b) Graus de liberdade da S2
( ) ( ) 6 4 5 21 . 5 , 0 . .
2
= = S l g

c) SQR2 = 3.066,77 (Soma do quadrado dos resduos)


4) Clculo do
c
F
( )
( )
52 , 67
6
42 , 45
6
72 , 066 . 3
. .
. .
1
1
2
2
= = =
S l g
SQR
S l g
SQR
F
c


52 , 67 =
c
F


5)
c
F

(tabelado). Consultando a tabela obtemos:

( )
2
2k c n
F

( ) 28 , 4 6
05 , 0
= F


6) Concluso:
( ) 28 , 4 6 52 , 67
05 , 0
= > = F F
c


Constata-se que

F F
c
> o que sugere que a srie sob estudo heteroscedstica.


Exemplo 28:

Verificar se o par de valores abaixo, referentes s despesas com alimentao y e renda mensal x,
apresenta violao aos pressupostos bsicos pelo mtodo de Goldfeld e Quandt. Faa 05 , 0 = .


64


Dados informados


Desenvolvimento:

1) Dados ordenados

1
y
1
x
58 343
82 425
120 467
100 480
126 483
122 496
100 519
105 540
128 543
98 555
107 560
181 591
93 605
122 607
129 611
118 659
82 664
139 700
182 704
98 720
124 722
126 722

22 = n
1
y
1
x
1
y

1
x

58 343 122 607
82 425 129 611
120 467 93 605
126 483 118 659
100 480 82 664
122 496 182 704
100 519 139 700
128 543 98 720
105 540 124 722
107 560 126 722
98 555
181 591
Dados eliminados
c =6
22 = n
65


2) Determinao da equao de regresso da amostra 1

i
y
i
x

x y.

2
x

y

( ) ( )
2
1
2
e y y =
58 343 19.894 117.649 66,4 71,18
82 425
... ...
89,3 53,51
120 467 101,0 359,75
100 480 104,7 21,71
126 483 105,5 420,37
122 496 109,1 165,79
100 519 115,5 241,52
105 540 56.700 291.600 121,4 268,96
813 3.753 388.754 1.787.029 - 1.602,79 (SQR1)

( ) ( )( )
( ) ( )
279 , 0
223 . 211
843 . 58
009 . 085 . 14 029 . 787 . 1 8
753 . 3 813 754 . 388 8
.
. . .
2
2
2
= =


=

=


x x n
y x y x n
b


279 , 0

2
= b

26 , 29 13 , 469 279 , 0 63 , 101

1
= = b

i
x y . 279 , 0 26 , 29 + =

(Funo de regresso da srie 1)


3) Determinao da equao de regresso da amostra 2

2
y
2
x
2 2
.x y

2
x

y

( ) ( )
2
2
2
e y y =
129 611 78.819 373.321 116,8 147,79
118 659
... ...
121,8 14,34
82 664
...
1.624,25
139 700 168,74
182 704 3.088,91
98 720 904,20
124 722 18,28
126 722 90.972 521.284 128,3 5,18
998 5.502 687.517 3.795.082 - 5.067,49 (SQR2)

103 , 0
652 . 88
140 . 9
004 . 272 . 30 082 . 795 . 3 8
502 . 5 998 517 . 687 8

2
= =


= b

91 , 53 75 , 687 103 , 0 75 , 124 .

2 1
= = = x b y b

66


i
x y . 103 , 0 91 , 53
2
+ =

(Regresso da amostra 2)


4) Determinao dos graus de liberdade das amostras 1 e 2

( ) k c n l g 2 . 5 , 0 .
1
=

( ) 6 2 2 6 22 . 5 , 0 .
1
= = l g

5) Determinao do F calculado:

16 , 3
6
79 , 602 . 1
6
49 , 067 . 5
.
.
1
2
= = =
l g
SQR
l g
SQR
F
c


16 , 3 =
c
F

6) Comparao com o

F (tabelado)

28 , 4 ) 6 (
05 , 0
= F


. Concluso:

Nota-se que

F F
c
< , o que sugere aceitar a hiptese
0
H , ou seja, a srie de resduos
homoscedstica.

Hipteses:
0
H : a srie de resduos homoscedstica
1
H : tal no ocorre


Exemplo 29:

O par de valores abaixo mostra o consumo (Y) e renda (X). Aplicar o teste de Goldfeld-Quandt
e verificar se h presena de violao aos pressupostos bsicos (heteroscedasticidade). Faa
05 , 0 = .
67



ti
i
Y
i
X
t1 6 8
t2 7 10
t3 7 9
t4 8 11
t5 8 12
t6 9 12
t7 10 13
t8 10 14
t9 9 13
t10 8 9
t11 8 11
t12 11 16
t13 11 15
t14 13 17
t15 11 15
t16 12 18
t17 14 23
t18 12 22
t19 15 24
t20 18 19


Exemplo 30:
Dentre os itens abaixo, identifique as premissas bsicas para o modelo de regresso.
I. Linearidade do fenmeno medido.
II. Variancia no constante dos termos de erro (heteroscedasticidade).
III. Normalidade dos erros.
IV. Erros correlacionados.
V. Presena de colinearidade.

a) I e III;
b) II e III;
c) I,III e IV;
d) I,III e V;
e) I,II, III e V.

Exemplo 31:
Heterocedasticidade refere-se situao onde a varincia dos erros :
a) constante e igual a 1;
b) constante;
c) varivel;
d) varivel entre 0 e 1;
e) infinita sempre.
68


Exemplo 32:
Aps a estimativa de um modelo de regresso linear, foi constata a presena de
heterocedasticidade. Isto significa que os (as):
a) resduos so auto-correlacionados;
b) resduos somados no do um resultado nulo;
c) desvios padres dos resduos no so constantes;
d) dados usados so transversais (cross-section);
e) variveis independentes so fortemente correlacionadas.


Exemplo 33:
Na estimativa de uma regresso linear, o problema da heterocedasticidade ocorre quando:
a) os dados so transversais;
b) h autorrelao dos resduos;
c) h correlao positiva entre as variveis independentes;
d) a varincia dos erros no constante;
e) as variveis independentes so negativas.


Captulo 7: AUTOCORRELAO OU CORRELAO SERIAL

7.1. NATUREZA DA AUTOCORRELAO

O termo autocorrelao numa srie histrica de informaes pode ser interpretado como sendo a
presena de correlao entre resduos ( )
i
e de uma dada srie temporal.

Por exemplo, se uma varivel
t
x sistematicamente correlacionada com a varivel da poca
imediatamente anterior
1 t
x , dizemos que
t
x uma varivel autocorrelacionada e, nesse caso,
pode-se concluir que o valor da correlao entre as variveis
t
x e
1 t
x diferente de zero.


7.2. PADRES GRFICOS DE AUTOCORRELAO












i
e
t
x
Fig. 1
Ausncia de
autocorrelao
i
e
t
x
Fig. 2
Presena de
autocorrelao
69



Autocorrelao Positiva













Autocorrelao Negativa












Geralmente uma autocorrelao costuma ser positiva, dado que a maioria das sries temporais
econmicas se move mais para cima do que para baixo por um perodo relativamente longo (como
o da fig. 3) e no de forma sistemtica de curta durao (como o da fig. 5).


7.3. CAUSAS DA AUTOCORRELAO

a) Omisso de variveis relevantes na especificao do modelo;

b) Escolha inadequada do modelo funcional, ou seja, as informaes a serem analisadas podem
sugerir, a ttulo de exemplo, a aplicao de um modelo exponencial ao invs de um modelo
quadrtico.


7.4. CONSEQUNCIAS DA AUTOCORRELAO

a) Os parmetros estimados ( ) . ; ;
2 1
etc podem no ser eficientes;

i
e
t
x
Fig. 3
i
e
t
x
Fig. 4
i
e
t
x
Fig. 5
i
e
t
x
Fig. 6
70


b) A estimativa do erro padro pode apresentar-se viezada, ou seja, um valor que no reflete a
realidade, conduzindo os resultados dos testes e intervalos de confiana incoerentes.


7.5. DIAGNSTICO (IDENTIFICAO) DA AUTOCORRELAO

Para verificar a existncia da autocorrelao, podemos recorrer ao teste de Durbin & Watson
mediante aplicao da equao abaixo:

( )

=
=

=
n
t
t
n
t
t t
c
e
e e
d
1
2
1
2
1

(37)
=
t
e valor do resduo na poca t;
=
1

t
e valor do resduo na poca imediatamente anterior

Devendo-se ressaltar que, quando a anlise feita com esta concepo, ou seja, considerando a
poca imediatamente anterior, a autocorrelao chamada de 1 ordem (maioria dos casos).
Quando a anlise da poca no a imediatamente anterior, diz-se que a autocorrelao de
ordem superior.

O valor de
c
d compreendido no intervalo 0 a 4, ou seja, ( ) 4 0
c
d .

- se 0 =
c
d indica ausncia de autocorrelao
- se 2 >
c
d indica a presena de autocorrelao negativa
- se 2 <
c
d indica a presena de autocorrelao positiva

Para fazer o diagnstico, o valor de
c
d (d calculado) comparado com o valor tabelado de Durbin
& Watson, levando sempre em considerao o nvel de significncia desejado e o nmero de
variveis explicativas.

A tabela de Durbin/Watson apresenta suas limitaes, pois no foi desenvolvida com base em
modelos funcionais, como o caso da distribuio normal, razo pela qual existe um intervalo de
valores em que o teste de Durbin/Watson ( ) d inconclusivo. Nestes casos outros meios podero
ser usados, como veremos mais frente.

Na tabela de Durbin/Watson, os limites
i
D (inferior) e
u
D (superior), que passaremos a chamar de
i
d e
S
d , respectivamente, so utilizados para testar a autocorrelao positiva ( ) 2 < d , enquanto
que os limites ( )
s
d 4 e ( )
i
d 4 para testar a autocorrelao negativa ( ) 2 > d .

Assim,
i
d e
s
d so valores crticos da estatstica de Durbin/Watson (tabelados).


71


Realizao do teste:

1) Quando a autocorrelao positiva( ) 2 <
c
d .

1.1) Se
i c
d d < sugere presena de autocorrelao positiva (Regio I do grfico).

1.2) Se
s c i
d d d < < o teste no conclusivo, ou seja, no podemos afirmar se a srie ou no
autocorrelacionada (Regio II do grfico).

1.3) Se
s c
d d > ausncia de autocorrelao (Regio III).


2) Quando a autocorrelao negativa ( ) 2 >
c
d .

2.1) Se ( )
s c
d d < 4 ausncia de autocorrelao (Regio III)

2.2) Se ( ) ( )
i c s
d d d < < 4 4 o teste inconclusivo (Regio IV)

2.3) Se ( )
i c
d d > 4 sugere presena de autocorrelao negativa (Regio V).








( ) 2 <
c
d sugere presena
de autocorrelao positiva


( ) 2 <
c
d sugere presena
de autocorrelao negativa



































0

i
d
s
d ( )
s
d 4 ( )
i
d 4
4

( ) 2 >
c
d Autocorrelao negativa
( ) 2 <
c
d Autocorrelao positiva
2
Pres.
AC (+)

Regio
I
No
Conc.

Regio
II
Ausncia
AC

Regio
III
No
Conc.

Regio
IV
Pres.
AC (-)

Regio
V
72


Exemplo 34:
Verificar a existncia de autocorrelao no par de valores referente a dados de consumo ( )
i
Y e
renda
i
X . O modelo funcional linear. Faa 05 , 0 = .
(1) (2) (3) (4) (5) (6) (7) (8)
i
t
i
Y
i
X
i
y
t
e
1

t t
e e ( )
2
1

t t
e e ( )
2

t
e
1 745 988 708,11 36,89 - - 1.360,87
2 652 812 648,97 3,03 -33,86 1.146,50 9,18
3 709 892 675,85 33,15 30,12 907,21 1.098,92
4 692 911 682,24 9,76 -23,38 547,09 95,26
5 668 904
... ... ... ... ...
6 671 920
7 698 934
8 661 956
9 685 959
10 675 966
11 673 989
12 693 997
13 748 1.011
14 740 997
15 715 999 711,80 3,20 -25,67 658,95 10,24
10.425 14.235 - - - 10.288,95 8.663,40

Procedimentos operacionais:

a) Equao de regresso do consumo em funo da renda.
i
x y . 336 , 0 14 , 376 + =

b) Valores ajustados com base na equao anterior.
Ver coluna (4)
i
y

c) Valores residuais ( )
t
e coluna (5)

d) Clculo das diferenas sucessivas residuais da poca t em relao poca imediatamente
anterior ( )
1
1


t t
e e t . Coluna (6)

e) Soma dos quadrados das diferenas residuais. Coluna (7)
( )

=

95 , 288 . 10
2
1 t t
e e

f) Soma dos quadrados dos resduos
2

i
e . Coluna (8).
40 , 663 . 8
15
1
2
=

= i
i
e

g) Clculo de d.
73


19 , 1 1876 , 1
40 , 663 . 8
95 , 288 . 10
= = =
c
d

h) Comparar o valor de 19 , 1 =
c
d com o valor tabelado de Durbin/Watson, com 05 , 0 = e com o
tamanho da amostra 15 = n para o exerccio em questo e ainda considerando uma varivel
explicativa, dado que a forma funcional linear simples. Da obtemos para 08 , 1 =
i
d e
36 , 1 =
s
d .

Como o valor calculado de d ( ) 19 , 1 =
c
d est entre os dois valores tabelados, ou seja,
36 , 1 19 , 1 08 , 1 < < , conclui-se que o resultado do teste inconclusivo, o que significa que no
podemos afirmar se h ou no autocorrelao.


Exemplo 35:

Uma amostra de 10 observaes de um dado fenmeno foi ajustado a um modelo economtrico
contendo 2 variveis explicativas. O valor obtido de 17 , 1 =
c
d . Verificar pelo teste DW se a srie
autocorrelacionada. Faa 05 , 0 = .

Soluo:

10 = n ; 17 , 1 =
c
d ; 2 = k ; 05 , 0 =

Verifica-se que 2 <
c
d , o que significa que a autocorrelao, se existir, ser positiva. Como
s c i
d d d < < ( ) 641 , 1 17 , 1 697 , 0 < < sugere inconcluso, no se podendo afirmar se
autocorrelacionada ou no.


Exemplo 36:

Com uma amostra de 80 observaes foi estimada uma equao com trs variveis explicativas.
Considerando que o valor obtido para 92 , 2 =
c
d , testar a presena de autocorrelao pelo teste
de DW com 05 , 0 = .

Soluo:

80 = n ; 92 , 2 =
c
d ; 3 = k ; 05 , 0 =
Considerando a tabela, obtemos: 56 , 1 =
i
d ; 715 , 1 =
s
d .

Como 2 >
c
d , a autocorrelao negativa.

285 , 2 715 , 1 4 4 = =
s
d
74


44 , 2 56 , 1 4 4 = =
i
d

Como 92 , 2 =
c
d maior do que 44 , 2 4 =
i
d ( )
i c
d d > 4 , pertence a regio de aceitao da
hiptese da existncia de autocorrelao (Regio V) no grfico ilustrativo, o que sugere a presena
de autocorrelao negativa.


Exemplo 37:

So conhecidas as estatsticas:
a) Tamanho da amostra 50 = n observaes;
b) Nmero de variveis explicativas: 4 = k variveis;
c) Nvel de significncia desejado 05 , 0 = .

Testar a presena de autocorrelao para os valores de
c
d a seguir:
1) 40 , 1 =
c
d
2) 50 , 2 =
c
d
3) 97 , 3 =
c
d
4) 115 , 2 =
c
d


Exemplo 38:

Verificar a existncia de autocorrelao no par de valores abaixo. O modelo funcional
linear.Faa 05 , 0 =

ti
i
Y

i
X
t1 20 12
t2 26 13
t3 30 15
t4 28 18
t5 32 24
t6 30 30
t7 35 40
t8 48 64
t9 41 88
t10 50 96
330 400


75


7.6. MEDIDAS CORRETIVAS VISANDO A REMOO DA AUTOCORRELAO

Detectada a presena de autocorrelao possvel remov-la. Entretanto, a operao de remoo
dever ser precedida de algum tipo de anlise com o objetivo de verificar a sua causa. Por
exemplo, poder ser ocasionada pela m especificao na formatao do modelo. Uma vez
detectada a causa, poder ser corrigida com a incluso de variveis adicionais ou com a
substituio do modelo funcional. Se a causa parte integrante do modelo estimado pelo
pesquisador, ela dever ser removida.

Para melhor entendimento do problema, mostraremos, inicialmente, o desenvolvimento da
equao de Durbin/Watson (DW) para a obteno do valor de
c
d .

Desenvolvimento da equao de Durbin/Watson para obteno do valor de
c
d .

J vimos que:
( )
( )

=
=

=
n
i
t
n
i
t t
c
e
e e
d
1
2
1
2
1



Desenvolvendo o numerador da equao, obtemos:

( )


+
=
2
2
1 1
2

. 2
t
t t t t
c
e
e e e e
d


+
=
2
2
1 1
2

. 2
t
t t t t
c
e
e e e e
d (38)

Se o tamanho da amostra da srie sob estudo for relativamente grande, a diferena entre
2

t
e e
2
1

t
e , segundo leis estatsticas, muito pequena, podendo consider-las como sendo iguais.

Aplicando esse princpio em (38), obtemos:



=
2
1
2

. 2
t
t t t
c
e
e e e
d

Dividindo os dois membros do numerador por
2

t
e , obtemos:

|
|
.
|

\
|
=


2
1
2
2

2
t
t t
t
t
c
e
e e
e
e
d

76


|
|
.
|

\
|
=


2
1


1 2
t
t t
c
e
e e
d (39)

Sabe-se que a relao

2
1


t
t t
e
e e
um estimador do coeficiente de correlao de erros, podendo
assim ser denominado de r . Assim, a equao (39) transformar-se- em:

( ) r d
c
= 1 2 (40)

Esta equao tambm poder ser usada para verificar a presena de autocorrelao. Por exemplo:

Se o valor de 0 = r ,
c
d ter um valor prximo de 2, o que sugere ausncia de autocorrelao.
Se ( ) 1 = r , ou no entorno desse valor,
c
d ter um valor prximo de zero, o que indica presena
de autocorrelao positiva.

Se ( ) 1 = r , ou prximo desse valor,
c
d ter um valor prximo de quatro, o que indica presena
de autocorrelao negativa, pois, conforme j foi visto, valores acima de 2 indicam autocorrelao
negativa e inferiores a 2 autocorrelao positiva.

Contudo, para verificao da existncia de autocorrelao, DW desenvolveu uma tabela contendo
os valores crticos dos limites inferiores e limites superiores em funo do nmero de observaes
( ) n , nmero de variveis explicativas ( ) k e do nvel de significncia desejado ( ) , j do nosso
conhecimento e utilizados em exemplos anteriores.

Para a remoo da autocorrelao, tomaremos como base a equao (40) para estimar o valor de
r que nada mais do que o estimador do coeficiente de correlao de erros, ou seja:

=
=

=
n
i
t
n
i
t t
e
e e
r
1
2
1
1




Efetuando-se os desenvolvimentos, obteremos o valor de ( ) r d
c
= 1 . 2 , colocando r em evidncia
obtemos r d
c
2 2 = , dividindo ambos os membros por 2 obtemos:

2
2
2
2
2
r d
c
=

r
d
c
=1
2

2
1
c
d
r = (41)

77


Assim, conhecido o valor de
c
d , pode-se estimar o valor de r atravs da igualdade (41) acima e,
uma vez estimado r , podemos efetuar a correlao dos valores conhecidos das variveis,
obtendo-se as variveis transformadas.

Por exemplo: Se y a varivel dependente e x a varivel explicativa e chamando
c
y e
c
x de
variveis transformadas em funo de r , temos:
1 ,
=
t t t c
y r y y (42)

1 ,
=
t t t c
x r x x (43)

Exemplo:

Suponhamos que: 188 , 1 =
c
d ; 745
1
=
t
y ; 652 = y

O valor de y corrigido em
2
t ser:

4060 , 0
2
188 , 1
1
2
1 = = =
c
d
r

745 4060 , 0
2 2 ,
= y y
c


47 , 302 652
2 ,
=
c
y

53 , 349
2 ,
=
c
y
Procedimento idntico dever ser observado para as variveis explicativas x.


Exemplo 39:

No exemplo 34 da pgina 73 verificamos que o par de valores y e x eram autocorrelacionados e
conclumos, pelo teste de Durbin/Watson, que no podemos afirmar se h ou no autocorrelao
pois, segundo o teste, caiu na regio de inconcluso.

78


Com base nos dados do mesmo exemplo 34, aplicar medidas corretivas junto s variveis
i
y e
i
x e
verificar se a nova srie permanece inconclusiva.
(1) (2) (3) (4) (5) (6) (7) (8) (9)
i
t
i
y
t c
y
,

t
x
t c
x
,
( ) ( ) 5 3
( )
2
5
t c
y
,


t c
e
,


1 745 - 988 - - - - -
2 652 349,53 812 410,87 143.611,39 168.814,16 347,04 2,48
3 709 444,29 892 562,33
... ...
409,82 34,47
4 692 404,15 911 548,85 404,23 -0,08
5 668 387,05 904 534,13 398,13 -11,08
6 671 399,79 920 552,97 405,06 -6,15
7 698 425,57 934 560,48 409,06 16,51
8 661 377,61 956 576,79 415,81 -38,20
9 685 416,63 959 570,86 413,36 3,97
10 675 396,89 966 576,65 415,76 -18,87
11 673 398,95 989 596,80 424,11 -25,16
12 693 419,76 997 595,47 423,56 -3,80
13 748 466,64 1.011 606,22 428,01 38,63
14 740 436,31 997 586,53 419,85 16,46
15 715 414,56 999 594,22 246.339,84 353.097,41 423,04 -8,48
10.425 5.737,73 - 7.873,17 3.239.285,87 4.457.939,38 - -

. Continuao da tabela:

(1) (10) (11) (12)
i
t
1 , , ,


=
t c t c t c
e e e
i

( )
2
10 ( )
2
9
1 - - -
2 - - 6,15
3 31,99 1.023,36 1.188,18
4 -34,55 1.193,70 0,006
5 -11,00 121,00 122,77
6 4,93 24,30 37,82
7 22,66
... ...
8 -54,71
9 41,47
10 -22,14
11 -6,29
12 21,36
13 42,43
14 -22,17
15 -24,94 622,00 71,91
- 11.488,60 5.936,10

Desenvolvimento:

1) Valor de d j obtido anteriormente

19 , 1 188 , 1 = d

79


.
.
.

.
.
.

2) Clculo do valor de r

2
1
d
r = 4060 , 0
2
1876 , 1
1 = = r


3) Transformao da varivel
t
y em
t c
y
,


1 ,
=
t t c
y r y y (coluna 3 da tabela)

53 , 349 745 4060 , 0 652
1
,
= =
t c
y

56 , 414 740 4060 , 0 715
15
,
= =
t c
y


4) Transformao da varivel
t
x em
t c
x
,


1 ,
=
t t t c
x r x x (coluna 5 da tabela)
87 , 410 988 4060 , 0 812
1
,
= =
t c
x

22 , 594 997 4060 , 0 999
15
,
= =
t c
x


5) Determinao da funo consumo, tendo por base os dados transformados (colunas 3 e 5)

( ) ( )( )
( ) ( )


=
2
,
2
,
, , , ,
2
.
. .
t c t c
t c t c t c t c
x x n
x y x y n


4145 , 0
2
=

2 , , 1
=
t c t c
x y

74 , 176
1
=


t c t c
x y
, ,
. 4145 , 0 74 , 176 + =


6) Ajustamento dos valores de
t c
y
,
com base na funo encontrada na questo anterior (coluna
8 da tabela)

04 , 347 87 , 410 4145 , 0 74 , 176
2
,
= + =
t c
y
80


.
.
.

.
.
.

OBS: reparar que a
1
,

t c
y desaparece, pois
1
t no existe mais.

04 , 423 22 , 594 4145 , 0 74 , 176
15
,
= + =
t c
y


7) Determinao dos resduos, efetuando-se a diferena entre os dados de
t
y (conhecido) e os
t c
y
,
(ajustados), ou seja

t c t c t c
y y e
, , ,
=

48 , 2 04 , 347 52 , 349
2 2 2 2
, , ,
= =
t c t c t c
y y e

48 , 8 04 , 423 56 , 414
15 15 15 15
, , ,
= =
t c t c t c
y y e


8) Determinao das diferenas sucessivas dos resduos, ou seja, entre os resduos da poca t
pelas da poca imediatamente anterior ( ) 1 t .

1 , , ,


=
t c t c t c
e e e (coluna 10)

Observar que os resduos da poca
1
t e
2
t no existiro mais, iniciando-se pela poca
3
t .

98 , 31 48 , 2 47 , 34
2 3 3
, , ,
= =
t c t c t c
e e e

94 , 24 46 , 16 48 , 8
14 15 15
, , ,
= =
t c t c t c
e e e


9) Determinao da soma dos quadrados das diferenas sucessivas residuais

( ) 60 , 488 . 11
1
2
1 , ,
=

=

n
i
t c t c
e e (coluna 11)


10) Determinao da soma dos quadrados dos resduos

= 10 , 936 . 5
2
,t c
e (coluna 12)


81


11) Determinao do novo valor de d

( )
94 , 1
10 , 936 . 5
60 , 488 . 11


2
,
2
1 , ,
= =


t c
t c t c
c
e
e e
d


12) Consulta ao valor tabelado de d com: 14 = n ; 05 , 0 = e 1 = k

Encontramos 045 , 1 =
i
d e 350 , 1 =
s
d que so os intervalos crticos.


13) Comparao com o valor de 94 , 1 =
c
d

Verifica-se que o valor calculado de d ( ) 94 , 1 =
c
d exterior aos intervalos crticos da tabela de
Durbin/Watson, cujos valores so, respectivamente, 045 , 1 =
i
d e 350 , 1 =
s
d .

Verifica-se tambm que o valor de d menor que 2 ( ) 2 < d , o que sugere, em princpio, que a
srie autocorrelacionada positivamente.

Contudo, como 94 , 1 =
c
d , ou seja, maior do que o 350 , 1 =
s
d , cai na Regio III da ilustrao grfica,
o que sugere ausncia de autocorrelao, significando que a autocorrelao foi removida.



Captulo 8: UTILIZAO DE VARIVEIS ESPECIAIS

8.1. VARIVEIS DUMMY (DUMMIES, BINRIAS, ARTIFICIAIS, DICOTMICAS, ETC.)

Nos captulos anteriores lidamos exclusivamente com variveis que podamos medir,
denominadas variveis quantitativas como, por exemplo: nvel de renda, variao salarial, taxa de
desemprego, etc.

Entretanto, algumas variveis consideradas relevantes para fins de pesquisas no so numricas,
elas so de natureza qualitativa, tais como: sexo, religio, nvel de instruo, etc.

Em certos estudos, fundamental o uso das variveis qualitativas denominadas dummy ( ) d na
anlise de regresso, pois permite expandir os objetivos da mesma, de forma a levar em
considerao variveis relevantes que no podem ser avaliadas em termos quantitativos. Com a
aplicao da varivel ( ) d possvel considerar os efeitos de natureza qualitativa que influenciam
os valores da varivel dependente ( ) y .

A varivel ( ) d , para fins operacionais, assume dois valores: 1 (um), indicando uma situao e 0
(zero), a outra situao como, por exemplo:
82



1 = ocorrncia de um evento e 0 = no ocorrncia

Por ser uma varivel qualitativa, tem como alguns de seus objetivos, na anlise de regresso,
absorver os efeitos temporais, tais como: mudana nas polticas econmicas, efeitos decorrentes
de sexo, religio, nacionalidade, etc. conforme acima comentado.


8.2. INCORPORAO DA VARIVEL ( ) d AO MODELO DE REGRESSO LINEAR

Pode ser incorporada de forma aditiva, multiplicativa ou mista (conjugao dos dois primeiros).

Abordaremos nesse mdulo as formas aditiva e multiplicativa.


A) INCORPORAO DA VARIVEL d PELA FORMA ADITIVA

Quando os efeitos citados anteriormente alteram apenas o termo constante (intercepto), a
varivel incorporada aditivamente.

Assim, incorporando ao modelo de regresso uma varivel qualitativa e chamando de 1 = d um
determinado perodo da srie e 0 = d o outro perodo, cuja condio normal, teremos na
equao geral de regresso a seguinte expresso:

e x x y + + + =
2 3 1 2 1
. .

Fazendo d x =
2
, temos: e d x y + + + = . .
3 1 2 1


Fazendo 0 = d , obtemos: e x y + + =
1 2 1
.


Fazendo 1 = d temos: e x y + + + =
3 1 2 1
.

Sabemos que
1
e
3
so constantes e nessa condio temos: ( ) e x y + + + =
1 2 3 1
.

Assim, chegamos a duas equaes de regresso.

A primeira com base na condio 0 = d , obtendo-se e x y + + =
1 2 1
.

e a segunda na condio
1 = d , obtendo-se ( ) e x y + + + =
1 2 3 1
. .

Verifica-se que quando 1 = d o valor do intercepto se modifica, passando a ser ( )
3 1
+ e quando
0 = d o intercepto no se altera.

83


Com a incorporao da varivel ( ) d ao modelo, criamos um deslocamento paralelo de ( ) d que
pode ser para cima (forma aditiva) ou para baixo (forma subtrativa), conforme o valor de
3

resulte de forma positiva ou negativa, respectivamente.

Um exemplo numrico poder explicitar melhor.


Exemplo 40:

Considere a srie de valores, em milhes de dlares, referente ao gasto de um dado pas com
esforo de guerra ( ) Y e a renda nacional ( ) X . Introduzir a varivel ( ) d no perodo de t8 a t13,
considerado perodo de convulso.

Mostrar o efeito causado pela interao da varivel ( ) d , pela forma aditiva, bem como a imagem
grfica das duas equaes de regresso.

i
t
Y
1
X D X =
2

y
1
x d
y x.
2
d d x.

d y.
2
x

1 2,6 2,4 0 -4,16 -4,44 -0,35 18,47 0,1225 1,554 1,456 19,714
2 3,0 2,8 0 -3,76 -4,04 -0,35 15,19 0,1225 1,41
3 3,6 3,1 0 -3,16 -3,74 -0,35 11,82 0,1225 1,31
4 3,7 3,4 0 -3,06 -3,44 -0,35 10,53 0,1225 1,20
5 3,8 3,9 0 -2,96 -2,94 -0,35 8,70 0,1225 1,03
6 4,1 4,0 0 -2,66 -2,84 -0,35 7,55 0,1225 0,99
7 4,4 4,2 0 -2,36 -2,64 -0,35 6,23 0,1225 0,92
8 7,1 5,1 1 0,34 -1,74 0,65 -0,59 0,4225 -1,13
9 8,0 6,3 1 1,24 -0,54 0,65 -0,67 0,4225 -0,35
10 8,9 8,1 1 2,14 1,26 0,65 2,70 0,4225 0,82
11 9,7 8,8 1 2,94 1,96 0,65 5,76 0,4225 1,27
12 10,2 9,6 1 3,44 2,76 0,65 9,49 0,4225 1,79
13 10,1 9,7 1 3,34 2,86 0,65 9,55 0,4225 1,86
14 7,9 9,6 0 1,14 2,76 -0,35 3,15 0,1225 -0,97
15 8,7 10,4 0 1,94 3,56 -0,35 6,91 0,1225 -1,25
16 9,1 12,0 0 2,34 5,16 -0,35 12,07 0,1225 -1,81
17 10,1 12,9 0 3,34 6,06 -0,35 20,24 0,1225 -2,12 -1,169 36,724
115 116,3 6 147,10 3,8825 6,52 13,425 193,76

OBS: Para a determinao dos parmetros
1
,
2
e
3
, recomendamos inicialmente efetuar a
transformao das variveis ,
1


e D em y,
1
x e d, calculando-se os afastamentos em torno
da mdia de cada varivel, ou seja:

Y Y y =
1 1 1
X X x =
D D d =

No exemplo: 76 , 6 = Y ; 84 , 6
1
= X ; 35 , 0 = D




84


Clculo dos parmetros:

( )( ) ( )( )
( )( ) ( )
2
1
2 2
1
2
1
2
. .
. . . . .

=
d x d x
d y d x d y x
b


( ) 763 , 709
585 , 483
52 , 6 885 , 3 76 , 193
425 , 13 52 , 6 885 , 3 10 , 147
2 2
=


= b

68 , 0
2
= b

( )( ) ( )( )
( )( ) ( )
2
2 2
2
3
. .
. . . . .

=
d x d x
y x d x x d y
b


( ) 763 , 709
14 , 1642
52 , 6 8825 , 3 76 , 193
425 , 13 52 , 6 76 , 193 425 , 13
2 3
=


= b


31 , 2
3
= b


D b x b y b . .
3 1 2 1
=


35 , 0 31 , 2 84 , 6 68 , 0 76 , 6
1
= b


3 , 1
1
= b


d x y . 31 , 2 . 68 , 0 3 , 1 + + =


- Fazendo 0 = d , encontramos:

x y . 68 , 0 3 , 1
1
+ = (1)

- Para 1 = d

31 , 2 . 68 , 0 3 , 1
2
+ + = x y

( ) x y . 68 , 0 31 , 2 3 , 1
2
+ + =

x y . 68 , 0 61 , 3
2
+ = (2)

- Concluso:

Para a poca normal de paz, a equao de regresso a (1), ou seja, x y . 68 , 0 3 , 1
1
+ = .
Para a poca de guerra a equao de regresso a (2), ou seja, x y . 68 , 0 61 , 3
1
+ = .

85


O efeito aditivo da interao a diferena entre os interceptos de
2
y e
1
y , ou seja,
31 , 2 30 , 1 61 , 3 (milhes).

- Imagem grfica:

12

10


8


6


4


2



2 4 6 8 10 12

Na regresso (1) para 3 , 1 0
1
= = y x
1 , 8 10
1
= = y x

Na regresso (2) para 61 , 3 0
2
= = y x
41 , 10 10
2
= = y x


Exemplo 41:

Considere o par de valores X

e Y

levantados durante 10 perodos. Introduzir a varivel dummy
no perodo de t1 a t5 pela forma aditiva e avaliar o efeito da interao, retratando inclusive a sua
imagem no plano cartesiano.

i
t
i
Y
i
X
1 6 2
2 13 1
3 15 5
4 12 4
5 9 3
6 14 13
7 16 18
8 18 20
9 15 25
10 22 29
140 120

Efeito da interao ( ) 31 , 2 30 , 1 61 , 3 =
x y . 68 , 0 3 , 1
1
+ =
x y . 68 , 0 61 , 3
2
+ =

86


B) INCORPORAO DA VARIVEL ( ) d PELA FORMA MULTIPLICATIVA

Geralmente, a incorporao da varivel ( ) d pela forma multiplicativa utilizada quando ocorre
alguma mudana na capacidade de gerar efeito de uma ou mais variveis explicativas do modelo.

Ex: Produo de um determinado bem agrcola em funo da rea plantada e da aplicao de
fertilizante ao solo.

Sabemos que a aplicao de fertilizante intensifica o efeito da rea plantada, o que sugere a
introduo da varivel ( ) d multiplicativa para captar o efeito interativo das duas variveis (rea
plantada e aplicao de fertilizante).

O modelo de regresso poder ser especificado da forma a seguir:

( ) d x x y . . .
1 3 1 2 1
+ + =


Onde:

dummy d = 1 = d = se for utilizado fertilizante e
0 = d = em caso contrrio

O termo ( ) d x.
1
indica a mudana provocada pela influncia de
1
x aps a aplicao de fertilizante.
Assim, se for aplicado fertilizante, temos 1 = d e teremos:

( ) 1 . . .
1 3 1 2 1
x x y + + = , o que implica em:

( )
3 2 1 1
. + + = x y

Em caso contrrio, ou seja, rea no fertilizada, temos 0 = d .

( ) 0 . . .
1 3 1 2 1
x x y + + = , o que implica em:

1 2 1
.x y + =

Pode-se observar que o coeficiente angular
2
se altera caso 1 = d , significando que o efeito
sobre a rea plantada se intensifica com o emprego do fertilizante.

Resumindo: ( ) d x.
1
uma varivel interativa e ( )
3 2
+ o efeito da interao.

O exemplo a seguir explicitar melhor.




87


Exemplo 42:

Os dados a seguir referem-se a produo agrcola ( ) Y , em milhes de toneladas, e a quantidade
de fertilizantes aplicados ( ) X , em toneladas, durante dez perodos consecutivos. Verificar o efeito
da aplicao de fertilizantes na produo agrcola com a introduo da varivel dummy pela forma
multiplicativa, sabendo-se que o perodo da aplicao de fertilizantes foi durante a poca t5 a t10.

Traar a equao no plano cartesiano, ilustrando a imagem grfica do efeito.

i
t
Y X D
y
x
' . D D X =
y x.
2
d d x.

d y.
2
x

1 9 8 0 -5 -1 0 5 32,49 5,7 28,5 1
2 8 7 0 -6 -2 0 12 32,49 11,4 34,2 4
3 11 8 0 -3 -1 0 3 32,49 5,7 17,1 1
4 13 10 0 -1 1 0 -1 32,49 -5,7 5,7 1
5 10 7 1 -4 -2 7 8 1,69 -2,6 -5,2 4
6 14 6 1 0 -3 6 0 0,09 -0,9 0 9
7 15 12 1 1 3 12 3 39,69 18,9 6,3 9
8 18 11 1 4 2 11 8 28,09 10,6 21,2 4
9 20 10 1 6 1 10 6 18,49 4,3 25,8 1
10 22 11 1 8 2 11 16 28,09 10,6 42,4 2
140 90 6 0 0 57 60 246,1 58 176 36
14 = y 9 = X 7 , 5
10
57
' = = D D X D . '= ' ' D D d =

( )( ) ( )( )
( )( ) ( )
2
2 2
1
2
1
2
. .
. . . . .

=
d x d x
d y d x d y x
b


( ) ( )
( ) ( )
83 , 0
6 , 5495
4558
58 1 , 246 36
176 58 1 , 246 60
2 2
= =


= b

( )( ) ( )( )
( )( ) ( )
2
2 2
2
3
. .
. . . . .

=
d x d x
y x d x x d y
b


52 , 0
6 , 5495
2856
3
= = b


7 , 5 . .
3 2 1
b x b y b =


7 , 5 52 , 0 9 83 , 0 14
1
= b


57 , 3
1
= b


d x x y . 52 , 0 83 , 0 57 , 3 + + = (geral)
varivel de interao
0 = d x y . 83 , 0 57 , 3 + =
88



1 = d ( ) x x y . 35 , 1 57 , 3 . 52 , 0 83 , 0 57 , 3 + = + + =
efeito da interao
- Imagem Grfica



25

20


15


10


5


5 10 15 20 25

x y . 83 , 0 57 , 3
1
+ =

Para 57 , 3 0
1
= = y x
87 , 11 10
1
= = y x


x y . 35 , 1 57 , 3
2
+ =

Para 57 , 3 0
2
= = y x
1 , 17 10
2
= = y x


Com fertilizante
Sem fertilizante
Efeito da interao
x y . 83 , 0 57 , 3
1
+ =

x y . 35 , 1 57 , 3
1
+ =
x y . 68 , 0 3 , 1
1
+ =
89


Exemplo 43:

Dado o par de valores
i
x e
i
y de tendncia linear, aplicar a varivel binria pela forma
multiplicativa. Introduzir a varivel d nos 6 primeiros perodos da srie.


i
t
Y
1
X D D X D = .
y
1
x d y x.
1

2
1
x
2
d

d x.
1
d y.

1 5 12 1 12 -7 -4 2 28 16 4 -8 -14
2 6 15 1 15 -6 -1 5 6 1 25 -5 -30
3 7 22 1 22 -5 6 12 -30 36 144 72 -60
4 12 20 1 20 0 4 10 0 16 100 40 0
5 14 15 1 15 2 -1 5 -2 1 25 -5 10
6 10 16 1 16 -2 0 6 0 0 36 0 -12
7 15 19 0 0 3 3 -10 9 9 100 -30 -30
8 18 20 0 0 6 4 -10 24 16 100 -40 -60
9 13 12 0 0 1 -4 -10 -4 16 100 40 -10
10 20 9 0 0 8 -7 -10 -56 49 100 70 -80
120 160 - 100 0 0 0 -25 160 734 134 -286

12 = Y 12 = Y y

16
1
= X 16
1 1
= X x

10 = D 10 = D d

Estatsticas:

25 .
1
=

y x 134 .
1
=

d x

160
2
1
=

x 286 . =

d y

734
2
=

d

( )( ) ( )( )
( )( ) ( )
2
1
2 2
1
1
2
1
2
. .
. . . . .

=
d x d x
d y d x d y x
b


( ) ( )
( )
2 , 0
484 . 99
974 . 19
134 734 160
286 134 734 25
2 2
= =


= b



( )( ) ( )( )
( )( ) ( )
2
1
2 2
1
2
1
3
. .
. . . . .

=
d x d x
y x d x x d y
b


90


43 , 0
484 . 99
410 . 42
484 . 99
350 . 3 760 . 45
3
=

=

= b


( ) 1 , 13 10 43 , 0 16 2 , 0 12

1
= = b

d x x y . 43 , 0 2 , 0 1 , 13
1 1
+ =

Para 0 = d

1 1
2 , 0 1 , 13 x y + = ( 1 )

Para 1 = d

1 1 2
43 , 0 2 , 0 1 , 13 x x y + =

( ) 43 , 0 2 , 0 . 1 , 13
1 2
+ = x y

1 2
23 , 0 1 , 13 x y = ( 2 )

- Imagem grfica:



20


15


10


5





5 10 15 20


Regresso (1)
1 1
2 , 0 1 , 13 x y + = 1 , 13 0
1
= = y x
1 , 17 1 , 13 0 , 4 20
1
= + = = y x


Regresso (2)
(efeito subtrativo)
(2)
(1)
= efeito da interao
91


1 2
23 , 0 1 , 13 x y = 1 , 13 0
2
= = y x
5 , 8 20
2
= = y x


Exemplo 44:

Os dados abaixo referem-se a consumo de energia eltrica ( ) Y , produo real ( )
i
X e varivel
dummy ( ) D , levantados no horrio de vero durante 10 anos (dados hipotticos). Verificar o
efeito da varivel ( ) D pela forma multiplicativa.


i
t
Y
i
X ( ) D

1990 7 8 0
1991 8 9 0
1992 8 8 0
1993 9 9 0
1994 9 9 0
1995 10 10 1
1996 10 12 1
1997 11 13 1
1998 12 15 1
1999 16 17 1
100 110 5


Captulo 9: ANLISE DAS SRIES TEMPORAIS

9.1. INTRODUO

O objetivo deste mdulo fazer uma abordagem superficial sobre anlise de uma srie temporal,
no tendo como objetivo o aprofundamento terico e operacional deste importante segmento da
estatstica, em funo da reduzida carga horria disponvel.


9.2. CONCEITO DE SRIES TEMPORAIS
Uma srie temporal um conjunto de observaes de um determinado fenmeno varivel com o
tempo. Por exemplo, constituem sries temporais, os ndices de preos mensais de um bem,
exportao brasileira de manufaturados no perodo de t1 a tn , etc.
Se representarmos os termos da srie em um plano cartesiano, representado pelo eixo de
ordenadas (y) pelo eixo das abscissas (x), acompanhando os dados da srie, obter-se- uma
configurao como o da figura abaixo:


Figura 1


y
x
92


Onde y uma varivel funo do tempo

= y f(x)

Numa srie temporal costumamos distinguir quatro componentes (tendncia, variaes sazonais;
variaes cclicas e variaes aleatrias ou irregulares), cuja anlise importante para o perfeito
conhecimento do fenmeno representado pelos mesmos. Os componentes citados podem ser
definidos conforme abaixo:

a) Tendncia

Tambm chamada de tendncia secular ou movimento a longo prazo, pode ser conceituada como
sendo a funo mdia de seu processo gerador, entendendo-se por processo gerador, ou processo
estocstico, uma famlia infinita de variveis Xi (i= 0; 1; 2; 3;......) tal que os diversos termos da
srie so considerados como observaes das variveis aleatrias x1; x2; ......xn, , o que significa
dizer que X1 uma observao de x1; X2 uma observao de x2; Xn de xn......etc. Em outras
palavras, a tendncia provvel do comportamento da srie num intervalo de tempo
razoavelmente longo em relao a unidade de tempo considerada. Nota-se na figura 1 a provvel
tendncia crescente da srie.


b) Variaes sazonais ou estacionais

So flutuaes que se verificam aproximadamente nas mesmas pocas de cada ano resultantes de
fenmenos cclicos exteriores ao conjunto principal de causas que atuam sobre os termos da srie.

So exemplos de variaes sazonais: a venda de artigos para crianas na poca natalina; ndice de
precipitao pluviomtrica acompanhada mensalmente numa determinada cidade num perodo
de cinco anos.


c) Variaes cclicas

Os movimentos cclicos so formados por ciclos. Basicamente um ciclo consiste de um perodo de
expanso das atividades econmicas, seguidas de recesso, contrao e recuperao que se
confunde com a fase de expanso do novo ciclo.
Na componente cclica, o mais importante o denominado ciclo de negcios que so tipos de
flutuaes encontradas nas atividades econmicas agregada de naes que organizam seu
trabalho principalmente em empresas comerciais.

Os ciclos econmicos so tipos de flutuaes que perduram por mais de um ano e tendem a se
repetir com certa regularidade.

O ciclo de negcios, por exemplo, costuma ter durao superior a um ano podendo alcanar at
10 a 12 anos. Em mdia, um ciclo costuma oscilar em torno de 4 anos.

93


d) Variaes irregulares

So flutuaes espordicas da srie ocasionadas por eventos inesperados.

So exemplos de variaes irregulares: enchentes; greves; terremotos; incndios, etc.. que afetam
a maioria das atividades produtivas dependendo da sua intensidade.

Este componente, face as suas caractersticas imprevisveis, de difcil anlise.

Sob o ponto de vista econmico, comum afirmar-se que a componente tendncia , comentado
em a) e a componente sazonal comentado em (b) so as de maior relevncia, ou seja, aquelas que
mais se sobressaem se comparadas com as outras componentes.


9.3. ANLISE DE UMA SRIE TEMPORAL

J vimos que os principais componentes de uma srie temporal podem ser: Tendncia (T);
Variaes estacionais (E); Variaes cclicas (C) e Variaes irregulares (I).

Analisar uma srie temporal consiste em investigar, utilizando-se de tcnicas especiais, as
componentes T; E; C e I, podendo ser feito duas formas: por soma Y= T + E + C + I , ou por
multiplicao Y= T x E x C x I.

Na prtica, o mtodo a ser considerado depende da significncia do sucesso alcanado com a
aplicao da hiptese.

Para melhor compreenso, daremos a sequencia normal dos procedimentos operacionais que
devero ser adotados para analisar uma srie temporal:

a. Preparar a srie quando se tratar de valores monetrios, deflacionando-a convenientemente
em relao a um ano ou perodo bsico adequado, com vistas a eliminar as distores
inflacionrias;

b. Traar o grfico conveniente (linhas ou curvas) , no plano cartesiano, dos valores
deflacionados para examinar a tendncia provvel da srie;

c. Analisar a tendncia da srie baseado no exame anterior, utilizando-se dos procedimentos
explicitados na sequncia

c.1. Processo grfico, geomtrico ou a mo livre:
Consiste em traar sobre o grfico da srie estudada, curva que melhor representa a sua
tendncia. A interpretao deste mtodo estritamente pessoal e no apresenta uma
justificativa terica onde possa apoiar-se, portanto este mtodo apresenta as suas falhas, razo
pela no ser exemplificada.

94


c.2. Processo das semi-mdias:
Consiste em dividir a srie em duas partes aproximadamente iguais, determinando a mdia
aritmtica de ambas. A seguir marcamos sobre o grfico as duas mdias obtidas. Ligando-a
convenientemente teremos a reta ajustada. (ver figura 2)

Exemplo 45:

Considere a srie de valores abaixo, j deflacionados. Avaliar a sua tendncia pelo mtodo das
semi-mdias
TABELA 1

ANOS VALOR VALOR MDIO
t1 30
t2 36 33,3( )
1
x
t3 40
t4 27
t5 46
t6 42 42,5( )
2
x
t7 40
t8 42

Procedimentos:
- Dividir a srie em dois subgrupos de tamanhos iguais;
- Tirar a Mdia do 1 grupo (t1 a t4) : 3 , 33
1
= x
- Tirar a Mdia do 2grupo (t5 a t8) : 5 , 42
2
= x
- Traar o grfico no plano cartesiano
- Unir os dois pontos
1
x e
2
x obtendo-se assim a reta de tendncia T.

(Figura 2)




50

T
45


40


35


30


t1 t2 t3 t4 t5 t6 t7 t8
$ R
( )
i
t
2
x
1
x
95


O ponto
i
x poder ser colocado entre o perodo t2 e t3 e o ponto
2
x entre t6 e t7.
T= linha de tendncia sugerida pelo mtodo das semi-mdias.


c.3) Processo das mdias mveis
Consiste em calcular as mdias sucessivas de igual nmero de termos denominado de perodo. A
srie assim constituda caracteriza-se pela regularizao ou suavizao dos valores originais da
srie eliminando em alguns casos a influencia das componentes cclica e estacional.

Uma das inconvenincias deste processo a perda dos valores extremos da srie de acordo com a
periodicidade adotada.


Exemplo 46:

Construo de uma mdia mvel de ordem ou periodicidade 2 e 3 do exemplo anterior.

TABELA 2


1 2 3 4
ANOS VALOR (R$)
y1
MDIA MVEL DE 2 ANOS
y2 (N=2)
MDIA MVEL DE 3 ANOS
y3 (N=3)
t1 30
t2 36 33,0 35,7
t3 40 38,0 38,3
t4 37 38,5 41,1
t5 46 41,6 41,9
t6 42 44,0 42,9
t7 41 41,5 41,4
t8 42 41,5

Figura 3

96


Nota-se pela figura 3 que, com a aplicao das mdias mveis, os dados originais sofrem processo
de suavizao. A linha 1 (contnua), refere-se a dados originais e a linha 2 (tracejada) o resultado
da aplicao da mdia mvel de periodicidade 2 (y2).

d. Determinao da equao de tendncia pelo processo analitico
Consiste em analisar a srie utilizando-se de conceitos matemticos, sendo por esta razo
apresentar um bom ndice de confiabilidade no estudo da tendncia.
Basicamente neste processo poder recorrer-se a trs mtodos para a caracterizao da funo
ajustante: mtodo dos mnimos quadrados; mtodo dos momentos e mtodo da mxima
verossimilhana.
Para o presente caso, ser adotado o mtodo dos mnimos quadrados por ser de fcil
compreenso e de largo emprego na prtica.

e. Ajuste da srie
Consiste em promover o ajustamento da srie observada, atravs de uma funo que melhor
represente aqueles dados.

f. Obteno do coeficiente de determinao (R
2
) ou poder explicativo da regresso
Tem por objetivo avaliar o nvel de representatividade da varivel explicativa x sobre a explicada y.

g. Estacionariedade da srie
Significa verificar se a funo valor mdio e a funo covarincia so constantes ao longo do
tempo, ou seja: se ( )
t
y E e ( )
t
y v so constantes para todo t, alm de ( ) ( )
j t t j t t
y y y y
+
= ; cov ; cov


Exemplo 47:

Considere a srie temporal de valores investidos em ativos fixos, em milhes de reais, no perodo
de 2000 a 2010
Tabela 3

(1) (2) (3) (4)
ANOS INVESTIMENTOS
(a preos correntes)
INFLAO INVESTIMENTOS
(deflacionados)
2000 28 96 29,2
2001 30 99 30,3
2002 32 100 32,0
2003 34 110 30,9
2004 49 128 38,3
2005 54 136 39,7
2006 56 150 37,3
2007 91 180 50,6
2008 99 185 53,5
2009 117 228 51,3
2010 140 286 50,0
97


Obter:

a) Equao de tendncia pelo mtodo analitico
b) O poder explicativo da regresso
c) Efetuar o teste de estacionariedade

Soluo:

Inicialmente devemos deflacionar os dados de investimentos, escolhendo-se um indicador
inflacionrio e um ano base adequado, escolha do pesquisador. Os dados inflacionrios
hipotticos so os que esto relacionados na coluna (3) da tabela 3.
Tomando-se como base o ano de 2002, obtemos na coluna (4) da tabela 3, os investimentos
deflacionados que serviro de base para o desenvolvimento das questes solicitadas.
Dando sequencia aos procedimentos, traamos no plano cartesiano o grfico evolutivo da srie
deflacionada para verificar se sugere uma tendncia linear (figura 4).

Figura 4

98


Nota-se pela figura 4, que a srie de investimentos deflacionados sugere aplicao do modelo
linear, o que nos permite dar sequencia para obteno da equao de tendncia, com a utlizao
de variveis explicativas especiais, como representada na coluna 3 da tabela 4.

Tabela 4

(1) (2) (3) (4) (5) (6) (7) (8) (9)
ANOS INVEST
(Y)
(x1) X
2
y.x y
( )
2
y y ( )
2
y y ( )
2
y y
2000 29,2 -5 25 -146 27,1 174,2 123,2 4,4
2001 30,3 -4 16 -121,2 29,7 112,4 100,0 0,4
2002 32,0 -3 9 -96 32,4 62,4 68,9 0,2
2003 30,9 -2 4 -61,8 35,0 28,1 88,4 16,8
2004 38,3 -1 1 -38,3 37,7 6,8 4,0 0,4
2005 39,7 0 = = 40,3 0 0,4 0,4
2006 37,3 1 1 37,3 42,9 6,3 9,0 31,3
2007 50,6 2 4 101,2 45,6 28,1 106,1 25
2008 53,5 3 9 160,5 48,2 7,9 174,2 28
2009 51,3 4 16 205,2 50,9 62,4 121,0 0,2
2010 50,0 5 25 250,0 53,5 174,2 94,1 12,3
TOTAL 443,1 = 110 290,0 = 662,8 889,3 119,4

Desenvolvimento:

a) Determinao dos parmetros intercepto () e angular )

(b com auxlio das equaes normais,


pelo mtodo dos minimos quadrados ordinrios:

( ) ( ) ( )
( ) ( )
2
2


=
x x b
y x xy n
b

x b y a =



( )
64 , 2
0 110 11
1 , 443 0 290 11

2
=


= b

3 , 40 0 64 , 2 3 , 40 = = a a

b) Equao de tendncia:

i
x y 64 , 2 3 , 40 + =

99


Para verificar o posicionamento da equao de tendencia no plano, basta substituir na funo
i
x y 64 , 2 3 , 40 + = atribuindo a x os valores -5 e 5 para os anos de 2000 e 2010 respectivamente,
obtendo-se assim, os extremos da funo. (ver a representao na figura 4)

( ) 1 , 27 5 64 , 2 3 , 40
1
= + = y

5 , 53 5 64 , 2 3 , 40
2
= + = y

Com base nessa equao, podemos efetuar previses. No exemplo em questo, trata-se de
estimar os investimentos em ativos fixos para pocas futuras, bastando para tanto, multiplicar o
parmetro angular da funo pelo valor sequencial da varivel especial xi, constante na coluna (3)
da tabela 4. Por exemplo, se quisermos estimar o investimento esperado para 2011, basta atribuir
a x o valor 6:

( )
i
x y + = 64 , 2 3 , 40 2011

( ) 6 64 , 2 3 , 40 2011 + = y

( ) 1 , 56 2011 = y

c) Determinao do poder explicativo da regresso (R
2
)

Essa medida, tambm denominada de coeficiente de determinao, tem como finalidade avaliar o
grau de dependncia da varivel endgena y em relao a varivel independente x. Quanto maior
o valor de R
2
melhor a qualidade do ajuste. Por exemplo, se R
2
=0,75 indica que 75% da varivel
y explicada pela varivel x, sugerindo portanto, uma boa qualidade do ajuste .

Expresso para clculo:

( )
( )

=
2
2
2

y y
y y
R

Onde: = y dados ajustados pela funo;
y= mdia aritmtica da varivel y;
Y = dados observados ou conhecidos de y.

75 , 0
3 , 889
8 , 662
2
= = R ou 75%

O valor de R
2
obtido sugere que a equao de tendncia explica algo em torno de 75% o
comportamento da srie.

100


d) Teste de estacionariedade

Ao analisar uma srie temporal devemos verificar ainda se a mesma no apresenta sintomas de
tendenciosidade. Diz-se que uma srie estacionria quando no apresenta esse sintoma, ou seja,
quando sua mdia e sua varincia so constantes ao longo do tempo, ento:
( )
i
y E = constante para todo i
) (
i
y V = constante para todo i
( ) y cov = ( ) y cov , significa que a covarincia s depende do afastamento (distncia) no tempo que
separa os dois valores e no do momento em que estamos no tempo.

Assim como existem sries estacionrias, vale lembrar que tambm existem sries no
estacionrias. Estes tipos de srie so denominadas de passeios aleatrios (random walks),
dado que os pontos na linha do tempo passeiam vagarosamente para cima e para baixo, sem um
padro definido.

Para avaliar a estacionariedade de uma srie existem vrios caminhos, tais como o teste de raiz
unitria. O teste da raiz unitria mais utilizado o de Dickey-Fuller, que no ser explicitado nessa
apostila.

Um outro teste comumente utilizado o teste de Mann, objeto do nosso estudo. Assim, na tabela
5, a seguir, ser aplicado esse teste. Observar, com cuidado, o significado de cada coluna.

Tabela 5

(1) (2) (3) (4) (5) (6)
ANOS ti r1 r2 Pi i
2000 1 2,1 -5,6 7 4
2001 2 0,6 -4,1 4 6
2002 3 -0,4 -3,5 11 0
2003 4 -4,1 -0,6 6 3
2004 5 0,6 -0,4 3 4
2005 6 -0,6 0,4 10 0
2006 7 -5,6 0,6 2 3
2007 8 5,0 0,6 5 2
2008 9 5,3 2,1 1 2
2009 10 0,4 5,0 8 1
2010 11 -3,5 5,3 9 0


- - - - 25

Significado das colunas:

(2) ordenao unitria dos anos (ti)
101


(3) Residuos (ri) calculados com base na funo de regresso j obtida.
r1= yi -
i
y (diferena entre os dados conhecidos e os dados ajustados pela funo
i
x y 64 , 2 3 , 40 + =
(4) ordenao dos resduos de forma crescente (r2)
(5) enumerao dos resduos j ordenados na posio em que se encontrava primitivamente (Pi).
Exemplo: o valor -5,6 estava posicionado em 2000, ou seja, na posio 7 ; -4,1 na posio 4 e
assim sucessivamente.
(6) refere-se ao nmero de elementos da srie com valores superiores a cada Pi. Por exemplo:
valores superiores a P1=7 encontramos : (11,10,8 e 9), ou seja, 4 elementos. Etc.... (Pi)

Na sequencia , calculamos o valor de S pela expresso:
( )


=
2
1
2
n n
S
i


( )
2
1 11 11
25 2

= S

5 55 50 = = S

Para amostras superiores a 10 (n>10), partimos da hiptese de que a distribuio dos resduos
( ) S assintticamente normal com mdia zero: ( ) 0 = S E e desvio padro
( )
( ) ( )
18
5 2 1 +
=
n n n
s ou varincia ( )
( ) ( )
18
5 2 1
2
+
=
n n n
s
Nesses casos recomenda-se ainda aplicar a correo de continuidade, adicionando-se uma
unidade ao resultado de S, quando esta for negativa e subtraindo-se 1 quando for positiva. No
exemplo : S = - 5 + 1= - 4 .

A seguir calculamos o desvio padro pela expresso acima citada

( )
( ) ( )
18
5 2 ) 1 +
=
n n n
S

( ) ( )
84 , 12
18
5 11 2 1 11 11
) ( =
+
= S

Conhecido o valor de (S), o prximo passo determinar o valor de t calculado (tc)pela
expresso:

39 , 0
84 , 12
5
) (
=

= =
S
S
t
c



Este valor comparado com o valor tabelado de t com nivel de confiana desejado. No presente
estudo foi adotado 95% (1,96). Vale lembrar que a estatistica t pode ser aproximada a distribuio
102


normal quando o tamanho da amostra n for relativamente grande. Assim, se o valor de tc estiver
compreendido no intervalo 1,96, aceitamos a hiptese H0 de que a srie estacionria.

-1,96 tc 1,96 (srie estacionria)

No exemplo em estudo, nota-se que tc = - 0,39, portanto menor do que 1,96 estando
compreendido no intervalo citado, o que sugere que a srie estacionria.
A formulao das hipteses no teste de Mann :
H0: a srie de resduos estacionria
H1: a srie de resduos apresenta tendncia

Pelo resultado acima obtido, conclumos pela aceitao da hiptese nula ,.H0

Para amostras inferiores ou iguais a 10 (4 n 10), pode-se recorrer a tabela de Kendall.

Devido a exiguidade da carga horria, exerccios contendo aplicaes dessa tabela no sero aqui
abordados.

Conforme comentado inicialmente, este tpico mostra de forma apenas superficial o problema
envolvendo sries temporais. A matria sobre este assunto muito mais abrangente, razo pela
qual, deixaremos de abordar uma srie de tpicos inerentes a anlise das sries temporais, tais
como: Modelos Autorregressivos (AR), Modelos de Mdia Mvel (MA); Modelo Autorregressivo e
Mdia Mvel (ARMA), que a combinao de Mdia Mvel e Autorregressivo, Processo de
Periodicidades Ocultas, etc.
103



104



105



106



107



108


BIBLIOGRAFIA:

DAMODAR N. GUJARATI Econometria Bsica, Makron Books Ltda., So Paulo
HILL, R. CARTER Econometria, Saraiva, So Paulo, 1999
KELEIJIAN, HARRY H. Introduo Econometria: princpios e aplicaes, Campus, Rio de
Janeiro
SCHRDER, BRUNO Econometria para Concursos, Rio de Janeiro Elsevier, 2012.
109