Escolar Documentos
Profissional Documentos
Cultura Documentos
1
1. Introduo ao Modelo de Regresso .............................................................................. 1
2. Exemplos de Modelos Lineares ..................................................................................... 2
3. Derivao dos Mnimos Quadrados no Modelo de Regresso ...................................... 6
4. A Natureza Probabilstica do Modelo de Regresso...................................................... 9
5. Propriedades Estatsticas dos Estimadores................................................................... 13
6. Critrios de Avaliao dos Estimadores....................................................................... 14
7. Obteno da Mdia e o Desvio Padro dos Melhores Estimadores Lineares No
Tendenciosos ou Best Linear Unbiased Estimators (BLUEs) .......................................... 16
8. Aplicao de Testes de Hipteses e Intervalos de Confiana aos EstimadoresErro!
Indicador no definido.
9. O Coeficiente de Ajustamento ou Determinao: Erro! Indicador no definido.
10. Interpretao da Variao em Y em termos da Anlise de VarinciaErro! Indicador
no definido.
11. O Modelo de Regresso Mltipla......................... Erro! Indicador no definido.
12. Consideraes Adicionais: a Correlao Parcial.................................................34
13. Teste de Chow: um Teste para a Estabilidade Estrutural dos Modelos ................36
14. O Modelo de Regresso Mltipla com Variveis Explanatrias Estocsticas......36
15. Violao dos Pressupostos Bsicos do Modelo de Regresso Clssico..............37
16. O Problema da Multicolinearidade .....................................................................38
17. O Problema de Heteroscedasticidade..................................................................40
18. O Problema da Correlao Serial ......................... Erro! Indicador no definido.
19. A Previso com o Modelo de Regresso.............. Erro! Indicador no definido.
Leituras recomendadas (Pindyck e Rubinfeld(1976)):
1.
2.
3.
Referncias Bibliogrficas:
1.
Amostra
Modelo
Tt = 0
Tt = 0 + 1t
Tt = 0 + 1t + 2t2
Tt
Tt
Tt = 0 + 1t + 2v,
Tt
Tt
Variveis dummies
Define-se cada varivel dummy por:
X S1,t =
1 se t o perodo sazonal 1
0 seno
X S2,t =
1 se t o perodo sazonal 2
0 seno
XS(L-1),t =
(B)
Seja o modelo:
y=e
a+bx
logey
y
= (a + bx)
1
logee
y = a + bx (transformao
linear).
Substituindo-se x = 1/t, obtm-se a curva S ou curva do aprendizado (Figura 4):
t
Figura 4- Grfico da curva do aprendizado
Modelo recproco
Y=
1
1
= a + bx y=a+bx
a + bx
Y
(transformao linear)
Modelo semilogartmico
Y = a + b log x
Y = a + bv
(transformao linear)
v
Da mesma forma:
Y = 0 + 1 x12 + 2 log x2 Y = 0 + 1 V1 + 2 V2
V1
V2
Y = e1,478 (5,786/t)
Resultados do ajuste do modelo ao
conjunto de observaes:
Parmetros (a) 20.7867
(b) -21.0389
R2 = 0.953, Fteste = 442.6
vendas(Y)
0.023
0.157
0.329
0.48
1.205
1.748
1.996
2.509
2.366
2.94
2.8714
2.9346
3.1346
3.24
3.148
3.522
3.54
3.31
3.547
3.374
3.3745
3.401
3.6971
3.493
1/t
1
0.5
Loge(vendas)
-3.77226
-1.851151
Qt = Lt Kt A(t) t
funcional de t
funo de
produo
2)
mudana
tcnica
ex.: A(t) = e
3.
, onde Y
= a + bXi , e N
Define-se o resduo ou desvio (i) como i = Yi Y
i
i
corresponde ao nmero de observaes amostrais.
N
2
(Yi a bX i ) = 0 ... Yi = a N + bXi
a
(I)
-2 Xii = 0
2
2
(Yi a bX i ) = 0 ... Xi Yi = a Xi + bXi (II)
b
que multiplicadas, respectivamente, por Xi e N, so reescritas:
normais
( N) Xi Yi = ( N) (a Xi + b Xi2)
N X i Yi X i Yi
inclinao
N X i 2 ( X i ) 2
coeficiente linear
intercepto
Yi
Xi
b
a=
N
N
constante
X
b=
b=
... () N 2
() N 2
b=
( X i Yi / N) ( X i /N) ( Yi /N)
2
Xi
( X i /N) 2
N
( X i Yi /N) X Y
2
Xi
- X2
N
( X i Yi /N)
( X i2 /N)
(X i X) X i
NX
=
= 0 ).
N
N
N
Assim, reescrevem-se as estimativas dos parmetros de mnimos quadrados da
b=
x i y i
x i2
a = Y bX
onde o significado dessas estimativas de a e b :
b
dY
dX
xi = 0
X
21.0
15.0
15.0
9.0
12.0
18.0
6.0
12.0
yi = 0
xiyi = 19.50
xi2 = 162.00
b=
x i y i
= 0,120
x i2
a = 1,375
= 1,375 + 0,12 X
Y
Calcula-se: X = 13.5 e Y = 3.0
Regresso transformada
Figura 7- Exemplo do ajustamento da linha de regresso e da linha de regresso
transformada
Exerccio (casa)
Prove que a linha de regresso estimada passa sobre o ponto de mdia ( X , Y ).
Sugesto: mostre que X e Y satisfazem equao Y = a + bX, sendo a e b
definidos como: b =
4.
N X i Yi X i Yi
2
N X i ( X i )
a=
Yi b X i
N
N
Para isso,
observados
i
Renda dos
Indivduos
Meio/
Fatores aleatrios
Gastos com
alimentao
Figura 8- Relao entre amostra de renda dos indivduos e seus gastos com
alimentao
Dessa forma, definem-se as variveis aleatrias Yi e Xi e, por hiptese, a
verdadeira relao linear entre elas, como Yi = + Xi + i (Figura 9).
Yi = + Xi + i
TRUE MODEL
(populao)
erro aleatrio
varivel
aleatria
Fixados
(distribuio de
probabilidade)
(ii)
(iii)
a)
O erro i tem
E (i) = 0
(zero) e E(i)2 = 2
(constante), para
todas as observaes.
b)
para i j.
No caso de (iii), supondo-se E (i) = `, sendo ` um valor constante qualquer,
pode-se escrever: Yi = + Xi + i + (` - `) = ( + `) + Xi + (i - `), definindo-se
assim um novo coeficiente *.
i*
constante
2)
Erros correlacionados
11
12
Assume-se que:
(iii) c) O termo do erro normalmente distribudo (erros de medida e omisso
de variveis pequenos e independentes entre si).
Yi combinao dos i`s, normalmente distribuda, sendo: Yi = + Xi +i.
= + X deve estar prxima ao
Assim, a linha de regresso estimada Y
verdadeiro modelo Y = + X, onde as estimativas de e , os estimadores e , so
variveis aleatrias ou seja, tem E ( ), VAR( ), E ( ) e VAR ( ) (Figura 13). Para que
se possa entender melhor este ponto supe-se que se tenha N valores fixados de Xi, em
uma determinada amostra (A1), de forma que se tenha Yi valores associados a esses N
valores de Xi. Com esses valores de X e Y, estima-se ( ) .
/ ( )
/ ( )
E ( )
VAR ( ) ,
E ( )
VAR ( ) .
populao Yi
A2
A1
X1
13
Yi
Xi
i`s so diferentes, sempre. Com esse procedimento, pode-se obter uma distribuio de
x i yi
estimativas de ( ) , sendo: =
com respectivos valor esperado e varincia, aos
x i2
Xi
estimador no-viesado da verdadeira mdia
N
(X i X)
da populao. Da mesma forma, observa-se que:
estimador no-viesado da
N 1
2
verdadeira varincia da populao, em cujo denominador tem-se N-1, pois X foi fixado
para estabelecer os desvios.
2)
Eficincia
14
Consistncia
Este critrio diz respeito a quando o tamanho da amostra N tender a ser grande
(Figura 15) verificar-se propriedades assintticas, definidas pelo limite em probabilidade
de ou p lim :
p lim lim Prob (( | - |) < ) = 1 , de forma que: p lim = .
N
> 0, pequeno
Prob
N muito grande
Pequeno N
15
(X i X) 2
como um estimador viesado mas consistente da
N
= ci yi .
i =1
Assim:
= ci yi = ci (x i + i ) = cix i + ci i
Obtm-se:
16
(I)
pode-se escrever
xi
de forma que
x i2
E ( ) = cix i + ci E( i )
0
* E ( ) = c i x i = c i x i = , logo estimador no tendencioso,
x
onde ci x i = i 2 x i =1
xi
(II)
De modo similar:
VAR ( ) = E ( - ) 2
Substituindo (I) em VAR ( ) , tem-se que VAR ( ) = E [ cix i + ci i ]2 .
-
Observa-se que - = cix i + ci i = ( c i x i 1) + c i i
De (II) tem-se que ci x i = 1 , logo
- = ci i , sendo ( - )2 = ( ci i )2
VAR ( ) = E ( - )2 = E [ ci i ]2
VAR ( ) = E [( c11 )2 + ( c 2 2 )2 + ...] + E [(2c1c212) + ...]
Ora, E (ij) = 0, i j, assim:
VAR ( ) = E ( c11 )2 + E ( c 2 2 )2 + ... =
= c12 E (1)2 + c22 E (2)2 + ... =
= c12 12 + c22 22 + ... = 2ci2, pois, na presena de
homocedasticidade, E (i)2 = cte = i2 = 2.
Ora, ci2 =
2
1
xi
=
, logo:
2 2
2
( x i )
xi
VAR ( ) = 2 / xi2 , xi = Xi - X
De forma similar pode-se obter que:
E ( ) =
17
X i2
VAR ( ) =
2
N (X i X)
2
X 2
COV ( , ) =
x i2
preciso remarcar que se = ci yi uma combinao linear de variveis yi e se
yi normalmente distribuda, uma varivel aleatria normalmente distribuda, o que
implica que os testes de hiptese so vlidos para . Alm disso, observa-se que, de
acordo com o Teorema do Limite Central, se o tamanho da amostra cresce, a distribuio
da mdia amostral de uma varivel independentemente distribuda tende para a
normalidade.
2 Xi
, cuja varincia reduz-se a 2/N se X = 0 na amostra.
~ N ,
2
N xi
X
COV ( , ) =
, onde se observa que, se X > 0, superestimar corresponde
x i2
a subestimar e vice-versa.
Observa-se que: 2 o verdadeiro valor da varincia do erro. Utiliza-se S2 como
estimador no-viesado 2 de 2 ou seja: S2 = 2 =
8.
i2
(Yi X i ) 2
.
=
N2
N2
18
Em geral estabelece-se a hiptese nula ou seja, de que o efeito no est presente. Para o
modelo ser explicativo, a hiptese nula deve ser rejeitada. Ao associar-se ao conjunto
amostral um modelo de regresso, objetivo analisar os dados de forma a testar o modelo
ajustado e avaliar a adequao de novos modelos. Desta forma, realizam-se os testes de
hipteses, tendo resultados que podem levar a uma seqncia de testes de modelos. Ou
seja:
(a) Informao inconsistente com o modelo:
Rejeio do modelo; novo modelo considerado.
(b) Informao consistente com o modelo:
Modelo aceito at que novas hipteses ou nova informao permitam novos
testes.
Os testes so aplicados a um nvel de significncia (n.s.). Por exemplo, o que
significa: nvel de significncia de 5%? Significa que, se a hiptese nula for rejeitada neste
nvel, fato que ela estava correta pelo menos 5% das vezes. O nvel de significncia pode
ser compreendido como o ndice de erro aceito ao estabelecer o modelo de regresso (ou
erro Tipo 1).
O teste estatstico para rejeitar a hiptese nula associada ao coeficiente da
regresso baseia-se usualmente na distribuio t de Students.
Essa distribuio
relevante pois nela utiliza-se a estimativa amostral da varincia do erro, ao invs de seu
valor verdadeiro (na populao).
Para compreender a formao dos intervalos de confiana e o procedimento do
teste, inicialmente obtm-se a estatstica t com N-2 graus de liberdade (considerando-se o
modelo com dois estimadores) como:
tN-2 =
=
, com a qual se obtm a padronizao do valor estimado
S
S/( x i2 )1/2
.
Constri-se em torno de estatstica tN-2 um intervalo de confiana tal que:
-tc < tN-2 < tc , que tem (1-n.s.)% de probabilidade de conter o verdadeiro valor do
parmetro, onde tc corresponde ao valor tabelado da estatstica t de Students para um
nvel de significncia (n.s.) ou probabilidade (1-n.s.), com N-2 graus de liberdade (N o
tamanho da amostra e 2 representa o nmero de estimadores).
19
graus
de
<
t
Prob t c <
= 0,95 significa que h 95% de probabilidade de
c
S/( x i2 )1/2
S
= tc S .
2 1/2
( x i )
S ( X i2 )1/2
(N x i2 )1/2
= hiptese nula
Hiptese alternativa
= 0,
0.
20
Ct = 1 + 2 Yt + t
Caso 2
Ct = 1 + 2 Yt + Dt + t , onde Dt representa a variao sazonal.
1
guerra
0
paz
E (Ct) = 1 + 2 E (Yt)
2 constante
teste: =0, verifica se a
mudana significativa entre
diferentes perodos.
ou
E (Ct) = (1 + ) + 2 E (Yt)
Caso 3
Ct = 1 + 2 Yt + (Dt Yt) + t
E (Ct) = 1 + 2 Yt
ou
E (Ct) = 1 + (2 + ) Yt
Caso 4
Ct = 1 + 2 Yt + Dt + (Dt Yt) + t
9.
21
Grandes resduos
ajuste ruim
Figura 16- Obteno dos desvios entre a varivel observada, a linha ajustada e o seu valor
mdio
Analisando o valor Y, pode-se obter a variao total de Y como o somatrio do
quadrado dos desvios das observaes em relao mdia amostral:
Variao (Y) = (Yi Y) 2 , onde:
) + (Y
Y) ,
Yi Y = (Yi Y
i
i
De forma que:
22
2
) 2 + (Y
Y) 2 + 2 (Y Y
)(Y
Y)
(Yi Y) = (Yi Y
i
i
i
i
i
variao
total de
Y
(TSS)
variao
variao
residual
explicada
de Y
de Y
(no explicada)
(RSS)
(ESS)
y i
y i = x i
2 x i i
0
ESS RSS
+
TSS TSS
ESS RSS
= , sem , 0 R2 1.
TSS TSS
Na Figura 17 so
representadas duas situaes-limite para o valor de R2: ajustamento perfeito (a), e caso em
que a relao linear no se ajusta aos dados amostrais (b).
23
2
2
2
y i = y i + i + 2 y i i
2 x i i
Resduo da
regresso
2 x i i
=0
(nas equaes normais da regresso)
2
yi =
2 x i2
+ i2 + ( 2 0 = 0 ), onde
2 x i2 = y i2 - i2 .
2
2
Lembrando que o coeficiente de ajustamento funo de yi e yi , ou seja, as
R =
2
RSS y i2 2 x i2
i
2
=>
R
=
=
=
1
2
2
TSS y i2
yi
yi
(total)
10.
As medidas relativas a TSS, RSS e ESS devem ser convertidas em varincias, por
sua diviso pelos graus de liberdade associados ao processo de sua obteno. Assim,
Varincia total em Y
TSS
N 1
mdia
Varincia explicada em Y
24
RSS
1
Xi
Varincia residual em Y
ESS
N2
, ou
X,
varincia explicada
, como uma boa
varincia no explicada
varincia explicada
RSS/1
=
,
varincia no explicada
ESS/N 2
S2
que segue a distribuio F com 1, N-2 graus de liberdade no numerador e no denominador,
respectivamente.
F1, N-2 =
2 x i2
RSS
=0,
F1, N-2 = 0 somente quando
2
1
S
2
i
onde S =
N-2
2
Como orientao,
25
n.s. %
1, N-2 graus de liberdade
11.
multicolinearidade).
iii) E (i) = 0
E (i)2 = 2
E (i . j) = 0, i j
i ~ N [0, 2]
Por simplicidade, considere-se o modelo a 2 variveis independentes:
= + X + X
Yi = 1 + 2 X2i + 3 X3i + i Y
i
1
2
2i
3 3i
E (Yi) = 1 + 2X2i + 3X3i
2 = S 2
E (Yi)2 = 2
1 = Y 2 X 2 3 X 3
( x 2i y i )( x 3i ) ( x 3i y i )( x 2i x 3i )
2 =
2
2
( x 2i ) ( x 3i ) ( x 2i x 3i ) 2
2
( x 3i y i )( x 2i ) ( x 2i y i )( x 2i x 3i )
3 =
2
2
( x 2i ) ( x 3i ) ( x 2i x 3i ) 2
2
2
j
E[(b 2 2 ) ] =
= ...
j = 1, ..., k
=
k=3
2 = b 2
2 x 3i2
x x
2
2i
2
3i
( x 2i x 3i ) 2
2 x 22i
x x
2
2i
2
3i
( x 2i x 3i ) 2
3 = b3
2 [ X 22i X 3i2 ( X 2i X 3i ) 2
, sendo b1 = 1 .
N [ x 22i x 3i2 ( x 2i x 3i ) 2 ]
2 x 2i x 3i
x 22i x 3i2 ( x 2i x 3i ) 2
27
i2
Nk
ii)
S2 =
iii)
~ tN-k, j = 1, ..., k
Seja:
Yi = 1 + 2 X2i + ... + i, com k variveis ou k parmetros
) + (Y
Y)
Yi - Y = (Yi Y
i
Total = Residual + Explicada
) 2 + (Y
Y) 2
(Yi - Y) 2 = (Yi Y
i
i
O coeficiente de ajustamento:
R2 =
Y) 2
i2
RSS (Y
i
1
=
=
TSS (Yi Y) 2
(Yi Y)
mede a qualidade do ajustamento
2)
Alm disso, o uso isolado do R2 tem valor limitado, pois pode ocorrer bom ajustamento
(leia-se aqui: bom R2) do modelo global porque variveis independentes esto fortemente
correlacionadas entre si, com baixos valores de t e altos desvios padro individuais.
28
k-1, N-k
R2 N k
1 R 2 k 1
R2 = 1 -
2
i
Nk
var( )
var(Y)
(Yi Y)
N 1
Note-se que:
Variao no explicada
2
S 2 (N k)
i
igual a 1 R =12
var(Y) (N - 1)
(Yi Y)
Variao total
Assim, pode-se derivar a relao entre R2 e R 2 :
R 2 = 1 (1 R2)
N 1
(N>k), para a qual:
Nk
1.
k = 1 R2 = R 2
2.
29
(c)
Var( )
S2
-, onde (1 - R 2 ) = 2 e S2 = (1 - R 2 ) S 2Y .
Var(Y)
SY
S 2Y
(d)
30
Etapas:
1)
= a + b X R 2
Y
1
1
1,1 1
.
.
.
= a + b X R 2
Y
2
2
1,2
2
.
.
.
= a + b X R 2
Y
n
n
1, n
n
1, t
Assim,
= a + b x
Y
1 t
2)
Modelos a 3 variveis:
Modelos a 4 variveis:
31
Exerccio 1 - Regresso
Estabelea, com suas palavras, um paralelo entre o mtodo MAXR e o processo
de comparao de modelos a partir de R2, R 2 e S2, considerando-se o modelo de vendas
do detergente Fresh (30 observaes semanais) (Bowerman e OConnel, 1987), onde:
Yt centenas de milhares de embalagens vendidas em cada perodo de observaes t;
xt1 preo (US$) do detergente Fresh no perodo t;
xt2 o preo mdio dos detergentes competidores (US$);
xt3 o gasto em propaganda no perodo t (em centenas de milhares de US$);
xt4 xt2 xt1 diferena de preos entre a mdia do mercado e o Fresh;
xt5
x t2
razo entre preos (alternativa a xt4).
x t1
v2
Yt = o + 1xt4 + 2xt3 + 3 x2t3 + 4 xt4xt3 + t tem as seguintes estatsticas associadas:
1.
ESS = 1,0644
2.
3.
R2 =
4.
S2 =
5.
k 1 N 1
R 2 = R 2
=
N 1 N k
5 1 30 1
= 0,9029
= 0,9083
30 1 30 5
O mesmo que R 2 =1 (1 R 2 )
Adicionando-se a varivel independente
32
N 1
Nk
2
xt4 x
N>k
v3
t3
2.
3.
R2 (cresce) =
12,4161
= 0,9225
13,4586
4.
S2 (cresce) =
ESS 1,0425
=
= 0,0434
N np 30 6
5.
R 2 = 0,8701
33
mod I Ct = 1 + 1 yt + 1t
mod II Ct = 2 + 2 yt + 2Ct-1 + 2t
Modelo
I
Coeficientes
1
Valores
14,51
Estatstico t
7,03
0,88
173,06
R2 = 0,9977
2
ESS = 966,50
5,52
SER = 3,72
3,06
0,31
4,85
y 2
0,65
8,78
R = 0,9989
ESS = 440,70
SER = 2,55
-14,51
-7,03
0,12
24,57
R = 0,8961
ESS = 966,5
SER = 3,72
Cresceu
pois no
h
multicolinearidade
Modelo
II
Modelo
III
2
Abaixou em relao ao
R2 mod. I
12.
disposio
ao con.s.umo
0,31 = 0,88
(1 0,65)
significante
34
Elas so medida de
Regresso Y em X3
= + X
Y
1
2
3
2.
Regresso X2 em X3
= + X
X
2
1
2
3
3.
Remover influncia de X3 em Y e X2
Assim, obtm-se:
Y* = Y Y
X2* = X2 - X
2
4.
rYX 3
rYX 2 .X 3 =
rYX 2 rYX 3 . rX 2 X 3
2
(1 rX2 2 X 3 )1/2 (1 rYX
)1/2
3
, onde:
rX 2 .X3
possvel tambm derivar a seguinte relao entre o coeficiente de ajustamento
R2, que mede a mltipla correlao no modelo, e a correlao parcial:
2
rYX
. =
2 X3
R 2 r 2 YX 3
ou 1-R2 = (1 r 2 YX3 ) (1 r 2 YX 2 .X 3 )
2
1 r YX 3
35
Calcular a estatstica F:
F=
ESS
, onde ESS soma do quadrado dos resduos e S2 a
Nk
36
2)
(varivel estocstica)
erros de medida
ausncia de normalidade: os estimadores de MQO permanecem noviesados e consistentes mas nada se pode dizer sobre a verossimilhana.
37
O Problema da Multicolinearidade
38
Explicao do Problema
Considere-se o modelo:
Yi = 1 + 2 X 2i + 3 X 3i + i ,
i = 1, ..., N
fazendo
x 2i = X 2i X 2
Var ( 2 ) =
2 x 3i2
2
=
, onde r23 o coeficiente de
x 22i x 3i2 ( x 2i x 3i ) 2 x 22i (1 r 2 23 )
x2x3
( x x )
2
2
2
3
1
2
39
O Problema de Heteroscedasticidade
Seja por
exemplo os gastos de indivduos de renda baixa e alta. esperado que exista uma
impossibilidade de variar no caso de renda baixa e uma grande variabilidade nos gastos de
indivduos de renda alta, com excedente em relao aos gastos obrigatrios mensais
(Figura 18).
baixa
Gastos de indivduos
de renda
alta
Figura 18- Variabilidade nos gastos de indivduos de acordo com a renda
Em conjuntos de dados de sries temporais, raro observar-se a
heteroscedasticidade, pois a relao com tempo. Entretanto, ela frequente em conjuntos
de dados de corte transversal, como o exemplo citado acima.
Na presena de heteroscedasticidade, assume-se;
i ~ N (0, 2i)
Var(i) = E(i2) = 2i
40
x i i
x i2
E( x i i )
= , logo i2 no importa na derivao do valor esperado.
E ( ) = +
2
xi
2
Entretanto, na derivao de Var ( ) =
, 2 no pode ser concludo. O uso da
x i2
expresso Var ( ) =
2
para obteno da varincia do estimador leva a estimativas
x i2
Caso 1:
Varincias so conhecidas
ou min
x i yi
,
=
*
(x i ) 2
y x i
i
xi =
xi
i
yi =
yi
,
i
41
Yi =
X ji
Yi
*
*
, X ji =
, i = i , j = 1, ..., k
i
i
i
Yi = 1 X 1i + 2 X 2i +...+ i , onde X 1i =
1
ou seja, a equao ajustada no tem
i
Var( i ) i2
intercepto, sendo que: Var(i*) = Var i =
= 2 = 1.
i2
i
i
Caso 2:
Yi = 890,0 + 0,237 Xi
(4,4)
R2 = 0,93
F = 252,7
(15,9)
Heteroscedasticidade
estimativa de MQO
Caso 3:
Yi =
Yi
X 21
X ji
X ji =
X 21
i =
i
X 21
Var( i )
i
=
=C
2
X 2i
X 2i
Yi
1
= 0,249 + 752,9
Xi
Xi
R2 = 0,76
Houve
F = 58,7
transformao
na
varivel
Passos do teste:
43
1 Ng
1. Estima-se Sg2 = (Yi Y) 2 para cada grupo de observaes, g = 1, 2, ..., G,
N g i =1
onde: Sg2 = g2
G
g =1
g =1
rejeito Ho
modificao de MQO
Teste 2:
Teste de Goldfeld-Quandt
44
de
regresso
com
dados
+
linha de regresso com dados associados
s grandes varincias
Assim:
1. Ordenao dos dados de acordo com a magnitude de uma das variveis independentes
(relacionada magnitude da varincia do erro).
2. Omite-se d informaes centrais (d 1/5 N), e ajusta-se 2 regresses aos
e
Nd
dados
2
(N d)
k graus de liberdade.
2
4. Pressupe-se
ESS 2
distribuio F[N-d-2k)/2 graus de liberdade no numerador e no denominador]
ESS1
Se
ESS 2
> Fcrtico
ESS1
rejeito Ho
45
(11,3)
ESS1 = 3,0 x 105
Yi = 1.540,0 + 0,20 Xi
(1,4)
R2 = 0,55
(3,1)
ESS2 = 20,2 x 105
Teste 3:
Teste de White
46
47
Exemplo
Considere-se o modelo de regresso estimado:
SD t = 1 + 2 DI t 6 + 3 ISt 1 + 4 I t 1 + 5 E t 1 + 6 Pt 1 (highly trended time-series).
N = 88
graus de liberdade = 82
S = 263,4
R2 = 0,93
R 2 = 0,92
F5,82 = 220,6
Coeficiente
Valor
Desvio
Padro
Mdia
Coeficientes parciais
(de correlao)
12.091,0
2.321,0
5,2
1,0
0,109
0,06
1,8
15.507,9
0,19373
-1.690,3
483,6
-3,5
1,96
-0,36010
-76,2
65,6
-1,2
5,28
-0,12719
5.585,6
974,4
5,7
2,96
0,53486
-175,6
34,4
-5,1
105,1
-049147
Exerccio: Questo 1 escolher uma srie sazonal e estimar seus parmetros, R2,
testes, ...
48
18.
conjunto amostral: (a) < e (b) > . Na mdia, entretanto, h ausncia de vis (ou
seja, os estimadores esto corretos). Entretanto, a medida do sucesso da estimao estar
super avaliada se a varincia estimada for utilizada em testes.
Desta forma, devem ser introduzidas medidas de correo e de teste sobre a
presena da correlao serial dos erros ou autocorrelao.
a)
2v
,
1 2
50
2v
)
1 2
2.
sendo 2 = Var( t )
(I)
Var( t 1 )
Cov ( t , t 1 )
,
2
2v
1 2
0<1.
Observa-se que o intercepto do modelo original (1) deve ser calculado a partir do
intercepto obtido para a equao transformada Yt* .
Quando:
k
1 passo:
2 passo:
3 passo:
4 passo:
5 passo:
Definir e obter:
t = Yt 1 2 X 2t ... k X kt
6 passo:
7 passo:
por exemplo:
- anterior 0,01 ou 0,005
Problema: valor obtido pela minimizao da soma dos quadrados dos resduos
pode ser mnimo local (x mnimo global).
- O Procedimento de Hildreth-Lu
52
de valores entre 0 e 1.
Por exemplo
=
2 passo:
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
4 passo:
Substitui-se na equao:
Nova Varivel
Independente
Nova Varivel
Dependente
Nova Varivel
Independente
Hiptese nula = 0
Hiptese Alternativa 0 (ou > 0 ou < 0)
O teste mais popular para a correlao serial o teste de Durbin-Watson.
Existem testes alternativos, como o teste de Durbin, que se aplicam a situaes
especficas observados na amostra e modeladas (ver Durbin, J. (1970), Testing for Serial
Correlation in Least-Squares Regression When Some of the Regressors are Lagged
Variables, Econometrica, vol. 38, pp.410-421; Siegel, S. (1956), Nonparametric
Statistics for the Behavioral Sciences, Mc Graw-Hill e Theil. H. (1965), The Analysis of
Disturbances in Regression Analysis, Journal of the American Statistical Association,
Vol. 60, pp. 1067-1079).
(b1) Teste de Durbin-Watson
No teste de Durbin-Watson, calculada a estatstica DW, cujo valor permite
concluir sobre a presena ou no de significativa correlao serial. So procedimentos do
teste:
Sejam t , t 1 resduos da aplicao de MQO
T
Calcula-se: DW =
( t t 1 )
t =2
2
t
t =1
54
(
t =2
t 1 ) 2
2t
inicial.
t =1
Exemplo:
COAL = 12,262 + 92,34 FIS + 118,57 FEU- 48,90 PCOAL + 118,91 PGAS
(Demanda) (3,51)
(6,46)
(7,14)
(-3,82)
(3,18)
55
COAL* = 16,245 + 75,29 FIS* + 100,26 FEU*- 38,98 PCOAL* + 105,99 PFAS*
(3,3)
(4,4)
(3,7)
(-2,0)
(2,0)
56
T1
T2
T3 (atual)
Tempo T
Perodo da
estimao
expost
ex ante
Perodos de previso
Figura 21- Distino entre previso ex post e ex ante
Pode-se definir como sendo a melhor previso aquela com varincia mnima em
seu erro de previso. Pode-se afirmar que as estimativas de MQO levam s melhores
previses no tendenciosas com modelos lineares (BLUEs). O erro do procedimento de
previso est associado aos seguintes pontos:
1. Natureza aleatria do termo aditivo do erro.
2. O processo de estimao envolve erro ao estimar parmetros que tendem aos
verdadeiros parmetros, mas diferindo deles.
3. Previso condicional introduz erros ao calcular valores esperados para as
variveis independentes ou explanatrias.
4. Erro de especificao do modelo ( do modelo real).
O erro de previso , aqui, avaliado em trs situaes: (A) previso incondicional,
(B) previso incondicional com erros serialmente correlacionados e (C) previso
condicional, que traz inerente maior dificuldade.
57
E ( e T +1 ) = E ( Y
T +1 - YT +1 ) = 0 = E (-T+1) , ou seja: a previso de YT+1 um
valor no-enviesado (isto : correto na mdia).
2.
Y
Y
T +1
T +1
, onde ~ N (0, 1).
Y
Y
T +1
T +1
0,05, onde 0,05 o valor de crtico que se obtm segundo
58
Yt = + X
Y Y
+
Y
T +1
0,05
T +1
T +1
0,05
* intervalo de previso
59
Yt = + Xt + t
Com a aplicao dos Mnimos Quadrados Ordinrios obtm-se , , 2 .
2.
Y
T +1 = E ( YT +1 ) = + XT+1
- Y = ( - ) + ( - ) XT+1 - T+1
O erro de previso e T +1 = Y
T +1
T +1
As origens de erro em e T +1 so:
1)
2)
previso :
E ( e T +1 ) = E ( - ) + E [( - )XT+1] + E (-T+1) = E ( - ) + XT+1 E ( - ) =
0, pois XT+1 considerado conhecido e E(T+1) = 0.
A varincia de e T +1 (p2) pode ser obtida:
p2 = E [( e T +1 )2] = E [( - )2] + E [( - )2] . X2T+1 +
+ E [(T+1)2] + E [( - ) ( - )] 2XT+1
Observe-se que , dependem de 1, ... , t mas so independentes de T+1.
Assim,
p2 = Var( ) + 2Xt+1 COV ( , ) + X2T+1 Var( ) + 2 ,
sendo:
60
2 Xt
Var( ) =
T (X t X) 2
- X 2
(X t X) 2
Cov( , ) =
2
,
(X t X) 2
Var( ) =
X mdia amostral .
1 X 2 2XX T +1 + X 2 T +1
p = 1 + +
(X t X) 2
T
(a)
ou
1 (X T +1 - X) 2
p2 = 2 1 + +
2
T (X t X)
(b)
Varincia na amostra de dados de X
(c)
Tamanho da amostra (estimao)
Ou seja, o erro de previso sensvel a (a), (b) e (c). Dessa forma, (XT+1 - X )
permite ter uma medida da variao que pode-se assumir para o perodo de previso. Em
pacotes estatsticos, so gerados valores para a varivel hzz , definida para o modelo a 2
variveis por
hzz =
1
+
T
(Xz X) 2
2
t
T X
previso.
Para construir o intervalo de confiana em torno dos valores previstos, obtm-se o
valor do erro normalizado tal que, se for conhecido, =
Y
Y
t +1
t +1
~ N (0,1), e se 2
p
1
)2
(Yt Y
t
T2
1 (X t +1 X) 2
Assim, conhecida Sp = S 1 + +
e o valor do erro normalizado :
2
T (X t X)
2
Y
Y
T +1
T +1
, que segue a distribuio da estatstica t, com (T-2) graus de liberdade:
Sp
61
t S Y Y
+t S
Y
T +1
0.05 p
T +1
T +1
0.05 p
= 1,375 + 0,120 Xi
Y
i
S2 = 0,111
(Xi - X )2 = 162
X = 13,5
XN+1
N+1
Y
Sf2
N+1 1,96 Sf
Y
N+1 + 1,96 Sf
Y
6,5
2,155
0,158
1,375
2,935
10,0
2,575
0,133
1,860
3,415
X 13,5
2,995
0,125
2,303
3,687
17,0
3,315
0,133
2,600
4,030
20,5
3,835
0,158
3,055
4,615
24,00
4,155
0,259
3,677
5,673
menor Sp2
(1)
onde:
Yt* = Yt - Yt-1
Xt* = Xt - Xt-1
63
Nessa forma, a previso para o perodo T+1 pode ser obtida pela equao (2):
* = (1 - ) + X *
Y
T +1
T +1
(2)
onde:
*T+1 = Y
T+1 - YT
Y
(3)
X *T +1 = XT+1 - XT
(4)
T+1 = T + vT+1
= 2 E (T2) + E ( T2 +1 ) 2 E (T T+1) =
= 2 E (T2) + E (2T+1) 2 2 E (T2) =
= 2 2 + 2 2 2 2 = 2 - 2 2 = (1 - 2) 2,
onde (1 - 2) o fator de reduo no erro de previso (em relao situao com ausncia
de autocorrelao). Observe-se que (1 - 2) 2 = 2v .
Na prtica, h violao do pressuposto, pois , e no so conhecidos, embora
possam ser estimados (veja: Goldberger, A.S. (1962), Best Linear Unbiased Prediction in
the Linear Regression Model, Journal of the American Statistical Association, vol. 57, pp.
369-375).
64
ou
seja,
na
forma
das
diferenas
(X
X
)
t
com que se obtenha S2 = Sv2 , pois Sp2 obtida a partir do modelo de diferenas
generalizadas (baseado em Pindyck e Rubinfeld (1976), Economic Models and Economic
Forecasts, pp. 172).
(C)
A Previso Condicional
Os intervalos de
t+1 Xt+1) ( - )] = E [( X
t+1 Xt+1) ( - )] = 0
E [( X
onde , so as estimativas de MQO.
Nesse caso, pode-se concluir que:
= + X
, sendo a varincia do erro de previso:
Y
T +1
T +1
1 (X X) 2 + u 2
2
2
p2 = 2 1 + + T +1
+ u
2
(X t X)
Y
T +1 no normalmente distribudo, envolvendo a soma de produtos de variveis
normalmente distribudas.
65
Assim, uma estimativa robusta para o intervalo de previso pode ser obtida por:
1.
independente X
T +1 conhecida dois desvios padro acima ( X T +1 ) e dois
Y
T +1
T +1 + 2 u )
** = + (X
2 ) , sendo
Y
T +1
T +1
u
1 (X * T +1 X) 2
, com clculo similar para X ** T +1 .
p2 2 1 + +
2
T (X t X)
2.
66