Escolar Documentos
Profissional Documentos
Cultura Documentos
em notação vetorial
y Xβ u
onde
Vetor da variável Matriz das variáveis Vetor de coeficientes Vetor de erros
dependente explicativas de regressão (Vetor aleatório)
y1 1 X 2,1 X k ,1 1 u1
y 1 X
X k ,2 u
y 2 X 2, 2
β 2 u 2
yn 1 X 2,n X k ,n k u n
Hipóteses do modelo de regressão linear múltipla
H1: E(u)=0 E u1 0
E u 0
E u 2
E u
n 0
Var ui E u E ui E ui2 2
2
i
2
= 0 (hipótese H1)
Pela hipótese H2
Var ui E ui2 2
Pela hipótese H3 Covu , u E u u 0
i j i j
Variâncias na diagonal principal
Covariâncias fora da diagonal principal
de ordem n
u u u u
n 1 n 2 un2 0 0 2
Hipóteses do modelo de regressão linear múltipla
H6: Cada erro ui ~N(0,2) para i=1,...,n, logo o vetor de erros u tem distribuição
normal multivariada (n-variada) com vetor média nulo e matriz de covariâncias
u
u1 0 2 0 0
u
0 0 2
0
u 2 ~ N n ,
2
un 0 0 0
Estimador de mínimos quadrados ordinários (MQO)
Estimador MQO
Vetor aleatório
ˆ1
ˆ
ˆβ 2 X T X 1 X T y
ˆk
Matriz de
covariâncias do
vetor aleatório Var ˆ1 Cov ˆ1 , ˆ2 Cov ˆ1 , ˆk
Σ βˆ E βˆ β βˆ β
T
Cov
ˆ , ˆ
2 1 Var ˆ2
Cov ˆ2 , ˆk X X
2 T 1
Cov ˆk , ˆ1
Cov ˆk , ˆ2 Var ˆk
Estimador de mínimos quadrados ordinários (MQO)
ˆ 1
ˆ
β̂
2
~ N k β, Σ β̂
ˆ
k
Teorema de Gauss-Markov
Sob as hipóteses H0 até H5 (inclusive a hipótese H2 de
homocedasticidade do erro) o estimador MQO é o melhor
estimador linear não tendencioso, ou seja, o estimador MQO é
BLUE (Best Linear Unbiased Estimator)
E βˆ β Não tendencioso
FRP:
Heterocedasticidade
A heterocedasticidade indica que a variância de Y|X não é
constante, Var(Yi|Xi)= Var(ui)=i2 (observe o subscrito i), ou seja, a
hipótese H2: Var(ui) constante é violada.
Homocedasticidade Heterocedasticidade
Var(ui)=2para i=1,...,n Var(ui)=i2 = 2i para i=1,...,n
erros com variância erros com variâncias
constante igual a 2 diferentes (note que a
variância está indexada por i )
ˆ
19,9 1 22,3
ˆβ 1 X T X 1 X T y
31,2 1 32,3
31,8 1 36,6
12,1 1 12,1
ˆ
2
40,7 1 42,3
6,1 1 6,2
38,6 1 44,7
25,5 1 26,1
0,8471
10,3 1 10,3
y= X= 1 40,2
β̂
38,8
8 1 8,1
33,1 1 34,5
0,8993
33,5 1 38
13,1 1 14,1
14,8 1 16,4
uˆ
-0,32286 2
-2,44687
uˆ Tuˆ S QResíduos
i
ˆ
1,18057 2 i 1
û
0,18990
1,80010 nk nk nk
1,00199 1,30476 2 0,87652 2
-0,13158 2
1,22625
-1,52139 ˆ 2
-0,42753 20 2
-0,79598
-0,92078 ˆ 2 1,72632
1,38328
-1,29794
0,68524
0,87652
Exemplo ilustrativo (MADDALA, 2003)
2,5
Gráfico dos resíduos
2
1,5
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
-0,5
-1
-1,5
-2
-2,5
-3
Renda
Dispersão dos resíduos cresce com a renda familiar (X), indicando que a
variância do erro não é constante, ou seja, a hipótese de homocedasticidade
do erro não é verificada.
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
-0,5
-1
-1,5
-2
-2,5
-3
Renda
Exemplo ilustrativo (MADDALA, 2003)
Erro–padrão dos estimadores MQO
1 22,3
1 32,3 Resultados obtidos sob a hipótese de homocedasticidade H2.
1 36,6
1 12,1 Como veremos mais adiante, estas estimativas são
1 42,3 tendenciosas, pois neste caso o erro é heterocedástico.
1 6,2
1 44,7
1 26,1
X=
1
1
10,3
40,2 ˆΣ ˆ ˆ 2 XT X 1
1 8,1 β
1 34,5
1 38
ˆΣ 0,49471 0,01617
1 14,1
1 16,4
1 24,1
1 30,1
β̂ 0,01617 0,00064
1 28,3
1 18,2
1 20,1
Erro-padrão de ˆ 1
s 2ˆ 0,49471 0,70336
1
Erro-padrão de ˆ 2
s 2ˆ 0,00064 0,02531
2
Natureza da heterocedasticidade
A heterocedasticidade ocorre com freqüência quando trabalhamos com dados
em corte transversal ou cross-section (HILL et al, 2003).
Porém, se dispomos apenas dos valores médios por empresa (os dados individuais não
são disponíveis) temos o seguinte modelo de regressão linear múltipla estimado a partir
dos valores médios das variáveis por empresa:
Estimador MQO
ˆβ XT X 1 XT y
Na presença da heterocedasticidade o estimador MQO não é
mais BLUE.
ˆ 1
Além disso, o estimador Σβˆ ˆ X X da matriz de covariância
2 T
erro heterocedástico:
y Xβ u X é não aleatório H4
1
1
1
E βˆ E XT X XT y E XT X XT Xβ u E β XT X XTu
E βˆ β X X XT E u β
T 1
=0 H1
E βˆ β
Note que para provar a não tendenciosidade não foi necessário
assumir a hipótese H2 sobre a variância do erro, logo a
heterocedasticidade não afeta esta propriedade do estimador
MQO.
Conseqüências da heterocedasticidade para o estimador MQO
1
1
βˆ XT X XT y XT X XT Xβ u
1
1
βˆ β XT X XTu βˆ β XT X XTu Desvio do estimador em
relação a sua média
Valor esperado dos
quadrados dos
desvios em notação
matricial
ˆ 1
Substituindo o resultado β β X X XTu na matriz tem-se:
T
Σβˆ E X X T
1 T
X uu X X X T T 1
X é não aleatório H4
Euu XX X
1 1
Σβˆ X X T
X T T T
Σβˆ X X T
1 T
X E uu X X X
T T
1
Σβˆ X X
2 T 1
T
X IX X X T 1
Σβˆ X X
2
T
1
X ΩX X X
T
T
1
Σ X X X XX X
2 T 1 T T 1
As variâncias na diagonal da matriz não são
βˆ
mínimas, por isso o estimador MQO não é
Σ X X
2 T 1 eficiente na presença da heterocedasticidade
βˆ
ˆ X X ˆ X X X ΩXX X
2 T 1 2 T 1 T T 1
̂ 2 XT X
1
O uso do estimador implica em perda de validade da inferência quando o erro é heterocedástico
Conseqüências da heterocedasticidade para o estimador MQO
O MQO ajusta a equação de regressão de maneira a minimizar a soma dos
quadrados dos resíduos, ou seja, define os ’s como sendo a solução ótima do
seguinte problema de otimização:
Y 1 2 X 2,i 3 X 3,i k X k ,i
n
2
Min i
1 , 2 , 3 ,, k
i 1
Na presença da heterocedasticidade, os quadrados dos resíduos na região
com erros mais voláteis (maior variância) são maiores que os quadrados dos
resíduos na região com erros menos voláteis (menor variância).
2,5
1,5
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
-0,5
-1
-1,5
-2
-2,5
-3
Menor Renda Maior
volatilidade volatilidade
Conseqüências da heterocedasticidade para o estimador MQO
Para minimizar a soma dos quadrados dos resíduos, o MQO faz um bom
ajustamento da equação de regressão às observações na região de maior
variabilidade do erro, pois é nesta região que se encontram os maiores
resíduos.
Y C uˆ A2 uˆ B2 uˆC2
ûC Note que o resíduo da observação C
domina a soma dos quadrados dos
resíduos e por esta razão o MQO vai
orientar a definição dos ’s no sentido de
A Yˆ ˆ1 ˆ2 X minimizar uˆC2 . Este é o efeito da ponderação
implícita.
û A û B
Esta estratégia não é correta, pois atribui
B maior importância ás observações distantes
da média, representada pela reta de
X regressão, e menor importância às
observações junto a média.
Estimador de mínimos quadrados generalizados
Admitindo que as variâncias dos erros Var(ui)=i2 , i=1,...,n sejam conhecidas, a
ponderação implícita no MQO, provocada pela heterocedasticidade, é
compensada pela consideração de um sistema de pesos, em que o quadrado
de cada resíduo é ponderado pelo inverso da respectiva variância do erro:
Y
1 2 X 2,i 3 X 3,i k X k ,i
n
1 2
Min 2 i
1 , 2 , 3 ,, k
i 1 i
Denotando
Y X
n
2 X 3 X k X
* * * * * 2
Min i 1 1,i 2,i 3,i k ,i
1 , 2 , 3 ,, k
i 1
Estimador de mínimos quadrados generalizados
Isto significa que para aplicar o MQP basta dividir a equação de regressão por
i , o desvio-padrão de ui, e aplicar o estimador MQO para obter as estimativas
dos coeficientes ’s.
Note que dividindo a equação de regressão por i
Yi 1 2 X 2,i 3 X 3,i k X k ,i ui i 1,, n
1 Erro da equação
i Yi
1
1
2
X 2,i
3
X 3,i
k
X k ,i
1
transformada
ui i 1,, n
i i i i i i
1 1
Var ui 2 Var ui 2 i 1 ,i 1,, n
1 2
i i i
Y
1 2 X 2,i 3 X 3,i k X k ,i
n
1 2
Min i
1 , 2 , 3 ,, k
i 1 i
ω1 0 0
1 0 0
ω1
0 ω2 0 0 1 0
Ω Ω
1 ω2
0 0 ωn 0 0 1
ωn
1 0 0 1
ω1 ω1
0 0
0 1 0 0 1 0
Ω 1
1
ω2 Ω
2
ω2
1
1 0
ωn
0 0 0
ωn
1 1
Ω Ω Ω
1 2 2
Estimador de mínimos quadrados generalizados
βˆ MQG X T Ω 1 X 1
X T Ω 1 y
1
T
1
1
1
1
βˆ MQG X Ω Ω X X T Ω 2 Ω 2 y
2 2
1
Fazendo X* Ω X 2
Yi*
Yi
; X 1*,i
1
; X 2*,i
X 2,i
;
Variáveis i i i
1
transformadas
y* Ω y 2
X 3*,i
X 3,i
; ; X k*,i
X k ,i
i i
βˆ MQG X X *T *
1
X* T y * Semelhante ao MQO βˆ X T X 1
XTy
β X Ω X X Ω u
1
βˆ MQG T 1 T 1
ˆ
1
E β MQG β E X Ω X X T Ω 1u
T 1
E βˆ β X Ω X X Ω
X é não aleatório H4
Eu
T 1 1 T 1
MQG
E βˆ β
MQG
MQG é não tendencioso =0 H1
ˆβ
MQG β X Ω
T 1
X
1
X T 1
Ω u Desvio do estimador em
relação a sua média
Estimador de mínimos quadrados generalizados
Propriedades do estimador MQG
Σβˆ
MQG
E β MQG β β MQG β
ˆ ˆ T
ˆβ T 1
MQG β X Ω X
1 T 1
X Ω u
Σβˆ
MQG
E X Ω X T 1
1
X Ω uu Ω X X Ω X
T 1 T 1
T 1
1
Σβˆ
MQG
X Ω X T 1
1 1
X Ω E uu Ω X X Ω X
T
T 1
T 1
1
Σβˆ
MQG
σ X Ω X 2
T 1
1
X Ω ΩΩ X X Ω X
T 1 1
T 1
1
Σ βˆ
MQG
σ X Ω X 2
T 1
1
X Ω XX Ω X
T 1
T 1
1
Σ βˆ
MQG
σ2 X T
Ω 1 X
1
Matriz de covariância dos estimadores MQG
MQO , MQG , homocedasticidade , heterocedasticidade
Estimador MQG ˆβ
MQG X T 1
Ω X
1
X T
Ω 1
y
Matriz de covariância
do estimador MQG
Σβˆ
MQG
σ X Ω X
2
T 1
1
homocedasticidade heterocedasticidade
1 0 0 1 0 0
20 1 0 0 2 0
Σu 2
I Σu 2 2
Ω
0 1 0 0 n
0
ΩI ΩI
MQO é um caso O estimador MQG é eficiente e
particular do MQG o MQO é ineficiente.
1
βˆ MQO XT X XT y Matriz de covariâncias
do MQO com erros Σβˆ σ X X
2
T
1
X ΩX X X
T T
1
heterocedásticos MQO
1
Σβˆ σ 2 XT X As variâncias em Σβˆ são maiores que as variâncias em Σ βˆ
MQO
MQO MQG
Estimador de mínimos quadrados generalizados exeqüível
Na realidade as n variâncias dos erros (ou os n elementos da matriz ) não
são conhecidas e, portanto, devem ser estimadas.
βˆ1
ˆ
βˆ MQGE
β2
T ˆ 1 1
X Ω X XTΩ ˆ 1y ˆˆ
Σ β MQGE
ˆ 1
σˆ X Ω X
2 T
1
βˆk
7
y = 0,2372x + 0,8900
despesa anual (US$ 1000)
6 R2 = 0,9335
0
5,0 7,0 9,0 11,0 13,0 15,0 17,0 19,0
rendimento anual (US$ 1000)
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Mesmo com a suspeita de heterocedasticidade vale utilizar o
MQO para estimar a equação de regressão que explica as
despesas (Y) em função do rendimento familiar (X):
Yi 1 2 X i ui
1 5,0 1,8
1 5,0 2,0
1 5,0 2,0
1 5,0 2,0
1 5,0 2,1
1 10,0 3,0
1 10,0 3,2 MQO
ˆ1 0,89
1 10,0
3,5
ˆβ XT X 1 XT y
1 10,0 3,5
X= 1 10,0
Y= 3,6
1
1
15,0
15,0
4,2
4,2
ˆ2 0,2372
1 15,0 4,5
1 15,0 4,8
1 15,0 5,0
1 20,0 4,8
1 20,0 5,0
Mais resultados da estimação
1 20,0 5,7 Coefficients Standard Error t Stat P-value
1 20,0 6,0 Intercept 0,8900 0,2043 4,3561 0,0004
1 20,0 6,2 X Variable 1 0,2372 0,0149 15,8972 0,0000
R2 = 0,9335 F= 252,7223
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Análise dos resíduos MQO
O gráfico do resíduos contra a
uˆi yi ˆ1 ˆ2 X i variável explicativa sugere que o erro
é heterocedástico e sua variância
cresce com o rendimento anual
-0,276
-0,076
-0,076 0,8
-0,076
0,024 0,6
-0,262
-0,062 0,4
0,238
0,238 0,2
û
resíduos
0,338
0
-0,248
-0,248 5 7 9 11 13 15 17 19
-0,2
0,052
0,352 -0,4
0,552
-0,834 -0,6
-0,634
0,066
-0,8
0,366
-1
0,566
rendimento anual (US$ 1000)
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Análise dos resíduos MQO
Outra forma de identificar a presença de heterocedasticidade é
por meio do gráfico dos resíduos MQO contra os valores
ajustados Yˆi ˆ1 ˆ2 X i (FOX, 1991)
0,8
O gráfico sugere
0,6 heterocedasticidade do erro
0,4
0,2
Resíduos
0
2 2,5 3 3,5 4 4,5 5 5,5 6
-0,2
-0,4
-0,6
-0,8
-1
Valores ajustados
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Estimação por MQGE
1) Padrão de heterocedasticidade: com base no gráfico anterior
observa-se que a dispersão dos resíduos cresce com o
rendimento, então uma forma plausível para a
heterocedasticidade é a seguinte:
Var ui X
2
i
2
DPui X i
2) Transformação das variáveis: neste caso basta dividir a
equação de regressão por X, obtendo-se a seguinte equação
transformada:
Na equação
Yi 1 ui transformada 2 é o
1 2 intercepto e 1 a
Xi Xi Xi inclinação
Yi *
0,350
Xi*
0,1000 1
0,360 0,1000 1
1
βˆ X *T X * X *T y *
ˆ2 0,2360
0,280 0,0667 1
0,280 0,0667 1
0,300 0,0667 1
0,320 0,0667 1
0,333 0,0667 1
0,240 0,0500 1 Mais resultados da estimação
0,250 0,0500 1
0,285 0,0500 1
Coefficients Standard Error t Stat P-value
0,300 0,0500 1 Intercept 0,2495 0,0117 21,2812 0,0000
0,310 0,0500 1 1/X 0,7529 0,0983 7,6629 0,0000
0,03
0,02
0,01
Resíduos
0
0,25 0,27 0,29 0,31 0,33 0,35 0,37 0,39 0,41
-0,01
-0,02
-0,03
O gráfico dos resíduos da
-0,04 estimação por MQGE sugere
homocedasticidade do erro
-0,05 da equação transformada
-0,06
Valores ajustados
Exemplo ilustrativo (PINDYCK & RUBINFELD, 2004)
Comparação dos resultados
MQO Yˆi 0,89 0,2372 X i
0,2043 0,0149
MQG Yˆi 0,7529 0,2495 X i
0,0983 0,0117
Erro padrão entre parênteses
Porém o erro padrão MQO está calculado de forma errada dada, não é robusto em
relação à heterocedasticidade.
Note que o erro é heterocedástico para qualquer 0. Se =1 a variância é proporcional
a X, se =2 a variância é proporcional ao quadrado de X, e assim por diante.
Para cada valor de eles simularam 20.000 amostras, cada uma com 100 observações
e calcularam os estimadores MQO, MQG e o estimador de White.
Comparação dos estimadores MQO, MQG e White na
presença de heterocedasticidade (GUJARATI, 2000)
Erro-padrão da estimativa de 1 Erro-padrão da estimativa de 2
Erro- Erro-
(MQO) (MQO)
padrão da padrão da
Especificação Especificação estimativa Especificação Especificação estimativa
incorreta da correta da de 1 incorreta da correta da de 2
matriz de matriz de (MQG) matriz de matriz de (MQG)
covariâncias covariâncias covariâncias covariâncias
0,5 0,164 0,134 0,110 0,285 0,277 0,243
1,0 0,142 0,101 0,048 0,246 0,247 0,171
2,0 0,116 0,074 0,0073 0,200 0,220 0,109
3,0 0,100 0,064 0,0013 0,173 0,206 0,056
4,0 0,089 0,059 0,0003 0,154 0,195 0,017
MQO
1 1
Especificação robusta em relação à Σβˆ σ 2 XT X XTΩX XT X
heterocedasticidade (MQO) MQO
Teste de Goldfeld-Quandt
Teste Park
H0: homocedasticidade
Teste de Glejser H1: heterocedasticidade
Teste Breusch-Pagan
Teste de White
Teste de Goldfeld-Quandt
Assume que a variância do erro é uma função monótona de alguma variável
explicativa X (em geral uma variável de tamanho), mas não assume
especificação para esta função f.
Var u f X R.E.Quandt
http://www.quandt.com/req.html
O teste baseia-se em uma idéia muito simples:
Primeiro divide-se a amostra em duas subamostras,
Em cada subamostra estima-se o modelo sob análise y=X+u e obtém-se a série de resíduos de
cada um.
A partir das séries de resíduos obtém-se as estimativas para a variância do erro em cada
subamostra.
Por fim, aplica-se o teste F para testar a hipótese de igualdade das variâncias.
2,5 Subamostra II
2
1,5
ˆ 2II H 0 : 2I 2II homocedasticidade
H1 : 2I 2II heteroceda sticidade
1 Subamostra I
0,5
Resíduos
0
0 5 10 15 20 25 30 35 40 45 50
ˆ 2II
-0,5
-1
-1,5
Sob H0 ~F
-2
-2,5
ˆ 2I ˆ I
2
-3
Renda
S.M. Goldfeld & R.E.Quandt "Some Tests for Homoscedasticity," Journal of the American Statistical Association, 60 (1965), 539-547.
Teste de Goldfeld-Quandt
1) Ordene as observações por ordem crescente da variável X, se f(X) for uma função crescente,
ou por ordem decrescente da variável X, se f(X) for decrescente.
4) Calcule as somas dos quadrados dos resíduos para obter as estimativas das variâncias do
erro em cada sub-amostra:
nI nII
u1, i u2, i
2 2
K = nº de parâmetros no modelo de
ˆ I2 i 1
ˆ II2 i 1 regressão linear
nI k nII k
5) Faça o teste F para igualdade de variâncias: Sob H0
ln ln C ln X i
i
2
Como Var(ui) não é conhecida, substitui-se a variância pelo quadrado do resíduo MQO
do modelo y=X+u sob análise. Também admite-se uma relação estocástica:
Ruído branco
ln uˆ ln C ln X i vi
2
i
O modelo acima é uma equação de regressão linear simples que pode ser estimada por
MQO. Ao final, por meio de um teste t avalia-se a significância de C:
H 0 : C 0homocedasticidade Cˆ
Sob H0: ~ t n 2
H1 : C 0heteroceda sticidade SC2ˆ
Teste de Breusch-Pagan
Assume que a variância do erro é uma função da combinação linear de p variáveis
Z1,...,Zp que podem ser ou não as variáveis explicativas do modelo de regressão linear
4) Teste a hipótese nula H0: 2 = 3= ... = p= 0 (homocedasticidade) contra a hipótese
alternativa H1: 2 0 ou 3 0 ... ou p 0 (heterocedasticidade).
4) Teste a hipótese nula H0: 2 = 3= ... = k= 2 =...= k = 23 =...= k-1,k = 0
(homocedasticidade) contra a hipótese alternativa H 1: pelo menos um dos coeficientes é
diferente de zero (heterocedasticidade).
Sob a hipótese nula, a estatística teste nR2 tem distribuição 2 com graus de liberdade
igual ao número de variáveis explicativas no modelo de regressão auxiliar,
Onde:
Para este modelo a expectativa é que o termo aleatório seja heterocedástico, pois
trata-se de uma cross-section formada por unidades (estados) de tamanhos
diferentes.
22.749,37 1 4.408,08 18.367 96.885.928
ˆβ XT X 1 XT y
5.911,02 1 1.036,21 7.349 39.530.272
8.840,06 1 1.619,08 11.905 54.108.220
6.867,01 1 1.200,86 10.722 49.020.980
3.456,99 1 544,46 5.286 23.068.100
8.935,04 1 1.754,06 11.244 58.041.528
7.799,04 1 1.324,91 9.013 44.902.768
ˆ1 46,80526
3.756,99 1 525,02 4.526 19.366.750
3.527,99 1 631,95 3.877 16.837.810
2.108,00 1 325,89 2.884 12.447.340
3.156,00 1 716,80 4.747 20.445.330
475,00 1 127,43 634 2.617.152
ˆ2 3,23823
521,00 1 132,60 680 2.560.880
1.052,00 1 204,75 1.528 6.801.128
1.550,99 1 299,38 2.268 10.285.380
571,00 1 97,07 571 2.981.762
3.391,98 1 546,48 4.048 20.308.820
ˆ3 0,59662
3.037,02 1 624,22 4.765 20.946.940
1.250,00 1 452,34 1.795 6.505.080
y= 2.938,01
1.512,00
X= 1
1
736,16
411,26
5.221
2.688
20.194.830
9.408.000
ˆ4 0,00019
3.197,00 1 842,47 4.733 18.723.750
4.771,00 1 837,56 7.347 32.694.150
2.063,01 1 598,39 3.306 12.014.000
2.446,01 1 712,60 4.072 15.098.980
2.104,01 1 679,55 3.521 12.239.000
1.427,01 1 575,28 2.256 7.192.128
1.014,00 1 399,59 2.008 6.716.760
1
2.690,99 1 732,65 3.738 13.325.970
Σ βˆ ˆ X X 2 T
1.767,01 1 500,27 2.633 10.102.820
7.246,00 1 1.636,16 11.604 47.402.340 Raiz quadrada dos
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805 elementos da matriz
368,01 1 127,67 346 1.477.074
1.919,99 1 432,61 2.364 10.874.400
823,00 1 298,05 1.076 3.778.912 Coeficientes Erro padrão Stat t valor-P
1.522,99 1 294,45 1.963 8.387.899 Interseção -46,80526 84,21 -0,56 0,58
821,00 1 220,89 1.127 4.216.107
543,02 1 95,94 533 2.776.397 AID 3,23823 0,24 13,64 0,00
3.070,01 1 628,91 3.418 15.726.220 POP -0,59662 0,10 -5,71 0,00
1.766,00 1 439,18 2.185 9.480.715
20.051,97 1 4.082,20 20.411 103.830.800 INC 0,00019 0,00 8,12 0,00
698,00 1 185,25 325 1.697.150
940,03 1 164,83 816 4.204.848
Exemplo
Equação estimada por MQO (erros padrão entre parêntesis)
População
0
0 5000 10000 15000 20000 25000
-500
-1000
-1500
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00
821,00
1.052,00
1
1
1
298,05
220,89
204,75
1.076
1.127
1.528
3.778.912
4.216.107
6.801.128
1) Ordene a amostra
1.250,00
1.522,99
1
1
452,34
294,45
1.795
1.963
6.505.080
8.387.899 na ordem crescente
1.014,00 1 399,59 2.008 6.716.760
1.766,00
1.427,01
1
1
439,18
575,28
2.185
2.256
9.480.715
7.192.128
da população dos
1.550,99 1 299,38 2.268 10.285.380
1.919,99
1.767,01
1
1
432,61
500,27
2.364
2.633
10.874.400
10.102.820
estados
1.512,00 1 411,26 2.688 9.408.000 8 observações
2.108,00 1 325,89 2.884 12.447.340
2.545,99 1 446,60 3.080 16.675.120 centrais (c=8)
2.063,01
3.070,01
1
1
598,39
628,91
3.306
3.418
12.014.000
15.726.220
2) Retire algumas
2.104,01 1 679,55 3.521 12.239.000
2.690,99
3.527,99
1
1
732,65
631,95
3.738
3.877
13.325.970
16.837.810
observações
3.391,98
2.446,01
3.756,99
1
1
1
546,48
712,60
525,02
4.048
4.072
4.526
20.308.820
15.098.980
19.366.750
centrais e forme
3.197,00
3.156,00
1
1
842,47
716,80
4.733
4.747
18.723.750
20.445.330 duas subamostras
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980
8.935,04 1 1.754,06 11.244 58.041.528
7.246,00 1 1.636,16 11.604 47.402.340
8.840,06 1 1.619,08 11.905 54.108.220
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00 1 298,05 1.076 3.778.912
821,00 1 220,89 1.127 4.216.107
1.052,00 1 204,75 1.528 6.801.128
1.250,00 1 452,34 1.795 6.505.080
1.522,99 1 294,45 1.963 8.387.899
1.014,00 1 399,59 2.008 6.716.760
1.766,00 1 439,18 2.185 9.480.715
1.427,01
1.550,99
1.919,99
1
1
1
575,28
299,38
432,61
2.256
2.268
2.364
7.192.128
10.285.380
10.874.400
3) Estime o modelo de regressão
1.767,01
1.512,00
1
1
500,27
411,26
2.633
2.688
10.102.820
9.408.000 EXPi 1 2 AIDi 3 POPi 4 INCi ui
2.108,00 1 325,89 2.884 12.447.340
2.545,99
2.063,01
1
1
446,60
598,39
3.080
3.306
16.675.120
12.014.000
em cada subamostra e obtenha a
3.070,01
2.104,01
2.690,99
1
1
1
628,91
679,55
732,65
3.418
3.521
3.738
15.726.220
12.239.000
13.325.970
respectiva SQResíduos
3.527,99 1 631,95 3.877 16.837.810
3.391,98 1 546,48 4.048 20.308.820
2.446,01 1 712,60 4.072 15.098.980
3.756,99 1 525,02 4.526 19.366.750
3.197,00 1 842,47 4.733 18.723.750
3.156,00 1 716,80 4.747 20.445.330
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980
8.935,04 1 1.754,06 11.244 58.041.528
7.246,00 1 1.636,16 11.604 47.402.340
8.840,06 1 1.619,08 11.905 54.108.220
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
EXP intercepto AID POP INC
698,00 1 185,25 325 1.697.150
368,01
411,00
1
1
127,67
108,10
346
460
1.477.074
1.703.380
Exemplo teste de Goldfeld-Quandt
543,02 1 95,94 533 2.776.397
571,00 1 97,07 571 2.981.762
475,00 1 127,43 634 2.617.152
521,00 1 132,60 680 2.560.880
587,00 1 180,43 716 2.923.428
512,00 1 135,90 755 2.801.805
526,00 1 95,20 774 3.311.946
940,03 1 164,83 816 4.204.848 Subamostra I
699,00 1 178,30 969 4.373.097
704,00 1 190,84 1.026 3.759.264 nI = 21
823,00 1 298,05 1.076 3.778.912
821,00 1 220,89 1.127 4.216.107
1.052,00 1 204,75 1.528 6.801.128 ANOVA
1.250,00 1 452,34 1.795 6.505.080 df SS MS F Significance F
1.522,99 1 294,45 1.963 8.387.899
Regression 3 2.957.338,81 985.779,60 189,77 2,88174E-13
1.014,00 1 399,59 2.008 6.716.760
1.766,00 1 439,18 2.185 9.480.715 Residual 17 88.308,84 5.194,64
1.427,01 1 575,28 2.256 7.192.128 Total 20 3.045.647,65
1.550,99 1 299,38 2.268 10.285.380
1.919,99 1 432,61 2.364 10.874.400
1.767,01 1 500,27 2.633 10.102.820
1.512,00
2.108,00
1
1
411,26
325,89
2.688
2.884
9.408.000
12.447.340 SQResíduos
2.545,99 1 446,60 3.080 16.675.120
2.063,01 1 598,39 3.306 12.014.000
3.070,01 1 628,91 3.418 15.726.220
2.104,01 1 679,55 3.521 12.239.000
2.690,99 1 732,65 3.738 13.325.970
3.527,99 1 631,95 3.877 16.837.810
3.391,98 1 546,48 4.048 20.308.820
2.446,01 1 712,60 4.072 15.098.980
3.756,99 1 525,02 4.526 19.366.750
3.197,00 1 842,47 4.733 18.723.750
3.156,00 1 716,80 4.747 20.445.330
3.037,02 1 624,22 4.765 20.946.940
2.938,01 1 736,16 5.221 20.194.830 Subamostra II SQResíduos
3.456,99 1 544,46 5.286 23.068.100
5.165,98
4.771,00
1
1
1.101,24
837,56
5.796
7.347
27.965.700
32.694.150
nII = 21
5.911,02 1 1.036,21 7.349 39.530.272
ANOVA
7.799,04 1 1.324,91 9.013 44.902.768
6.867,01 1 1.200,86 10.722 49.020.980 df SS MS F Significance F
8.935,04 1 1.754,06 11.244 58.041.528 Regression 3 592.513.592,29 197.504.530,76 615,64 1,56325E-17
7.246,00 1 1.636,16 11.604 47.402.340 Residual 17 5.453.827,09 320.813,36
8.840,06 1 1.619,08 11.905 54.108.220 Total 20 597.967.419,39
22.749,37 1 4.408,08 18.367 96.885.928
20.051,97 1 4.082,20 20.411 103.830.800
Exemplo teste de Goldfeld-Quandt
ln uˆ 1 2 ln POPi
2
i 14
Ln û2
̂ 2 significativamente 6
diferente de zero e o 4
LnPOP
erro é heterocedástico 4 5 6 7 8 9 10 11
Exemplo teste de Park
50