Escolar Documentos
Profissional Documentos
Cultura Documentos
Notas de Aula
O Sr. Econopoulos não sabia, mas ficou bastante curioso para aprender na
tentativa de solucionar o seu problema.
Mas, o Sr. Econopoulos não concordou... Ele já havia percebido que a Econometria
seria capaz de lhe dar uma resposta mais precisa, isto é, menos dependente de
juízos de valor.
No caso, os modelos mais simples tratam da relação entre duas variáveis, uma
chamada de dependente (a que se quer explicar) e outra chamada de variável
independente ou explicativa.
O Sr. Econopoulos não teve dúvidas quanto à variável dependente neste caso. Esta
seria exatamente o preço de revenda da camioneta, em reais, que doravante será
representado por pr.
Mas, qual seria a variável explicativa neste caso? Utilizando a sua experiência, o Sr.
Econopoulos verificou que o ano de fabricação da camioneta (af) seria
fundamental para determinar o seu valor de revenda.
E, que tipo de relação existiria entre estas duas variáveis? No caso, o Sr.
Econopoulos espera que a relação entre elas seja positiva, ou seja, ele espera que
quanto mais nova a camioneta (i.e., quanto maior for o seu ano de fabricação),
maior tenderá a ser o seu preço de revenda.
Mas, como representar esta idéia matematicamente? Com base em seus estudos, o
Sr. Econopoulos representou a sua relação teórica entre as variáveis da seguinte
forma:
⎛ + ⎞
pr = ψ⎜ af ⎟
⎝ ⎠
No caso, o preço da camioneta seria uma função (representada pela letra grega
psi) do ano de fabricação da camioneta. O sinal positivo acima da variável
explicativa significa que a relação entre ela e a dependente é positiva ou
diretamente proporcional.
Mas, na prática, que forma deveria assumir esta função genérica especificada
acima? O Sr. Econopoulos havia lido que os modelos matemáticos mais básicos são
os modelos lineares. Portanto, o seu modelo poderia ser escrito da seguinte forma:
pr = ψ(af ) = β1 + β 2 .af
β2, por sua vez, representa o coeficiente de declividade desta função, isto é, ele
mede a variação de pr dada uma variação em af.
Formalmente:
∆pr dpr
β2 = ≈
∆af daf
Graficamente:
Como, neste caso, a relação esperada entre pr e af é positiva, então, supõe-se que
β2 > 0.
Em termos práticos, tem-se que cada ano adicional de uso reduz o preço de
revenda da camioneta em β2 reais.
Exemplo:
Logo:
Se X = 0, então Y = 5 = β1
Se X = 1, então Y = 5 + 2.1 = 7
∆Y = 7 – 5 = 2 e ∆X = 1 – 0 =1
Desta forma, para levar em consideração esses dois aspectos, faz-se necessário
desenvolver um modelo econométrico a partir do modelo econômico proposto. E,
o que diferencia o modelo econométrico do modelo matemático?
O modelo econométrico
No caso em questão, quais seriam, portanto, as outras variáveis que podem afetar o
valor de uma camioneta usada mas que não foram incluídas no modelo? Vários
exemplos poderiam ser mencionados, tais como a inclusão ou não de acessórios
opcionais, o cuidado do dono anterior, o tipo de pintura, etc.
Nessa nova formulação do modelo, que será a forma utilizada daqui em diante,
tem-se que:
β2, por sua vez, representa o coeficiente de declividade da função, isto é, ele
mede a variação de E(pr|af) dada uma variação em af.
Considera-se, portanto, que cada ano adicional de uso reduz o preço de revenda
da camioneta em β2 reais, em média.
Mas, que tipo de dados coletar? Os tipos de dados mais básicos que existem são
aqueles que são coletados para as variáveis ao longo do tempo (séries temporais)
ou aqueles que são coletados em um determinado ponto do tempo (séries
transversais).
Séries temporais são aquelas coletadas, como o nome sugere, ao longo do tempo.
A freqüência depende da situação, podendo ser anuais, semestrais, trimestrais,
mensais, semanais, diárias etc.
Então, como reconhecer esses tipos de séries? Nos modelos com séries temporais,
as variáveis têm observações referentes a um país, empresa, família etc. durante
vários períodos de tempo. Já nos modelos com séries transversais, em um
determinado período, são coletadas informações de vários países, regiões, estados,
municípios, empresas, pessoas, famílias etc.
Exemplos:
- PIB anual do Brasil de 1970 a 2000 ⇒ Séries temporais (observações do PIB anual do
Brasil em um certo período, ano a ano).
- PIBs dos países da Comunidade Européia em 2000 ⇒ Séries transversais
(observações dos PIBs de vários países em um determinado ano).
Então, o Sr. Econopoulos coletou uma amostra que consistia nas camionetas usadas
vendidas por sua firma durante o ano de 20031. Esta amostra consiste de 30
observações, de dados transversais, cujos valores das variáveis em questão são
apresentados a seguir:
1 Para que os valores de pr sejam comparáveis, eles são dados em termos reais, i.e., já descontada a
inflação mensal.
Graficamente,
60000
50000
40000
pr
30000
20000
10000
1994 1996 1998 2000 2002 2004
af
Ademais, ele também confirmou a hipótese que, na média, carros mais novos são
mais caros que os mais antigos.
De acordo com os dados disponíveis, crie uma caixa retangular onde os valores da
variável explicativa (genericamente representada por X) devem ser colocados na linha
e os da dependente (genericamente representada por Y) na coluna. Para cada
observação, forme pontos definidos por suas respectivas coordenadas de X e Y.
No caso, essa hipótese atesta que a relação entre as variáveis explicativas X2, ....
XK, e a variável dependente Y é linear “nos parâmetros”, ou seja, o modelo poderá
ser escrito da seguinte forma:
Yi = β1 + β 2 .X 2i + K + βK .XKi + ε i , i = 1,K ,n
(i) Yi = β1 + β 2 .X i + β 3 .Z i + ε i
(ii) Yi = β1 + β 2 .X i + β 3 .X i2 + ε i
(iii) Yi = β1 + β 2 .X i + β 3 .X iθ + ε i
(iv) log(Yi ) = β1 + β 2 . log(X i ) + ε i
(v) Yi = A.X iθ .ε i
(vi) Yi = A.X iθ + ε i
Então, quais são lineares “nos parâmetros”? De acordo com o conceito, seriam os
modelos (i), (ii) e (iv). Por quê?
Obs.: Não confundir a terminologia. Linear “nos parâmetros” não quer dizer
necessariamente que a relação entre a variável dependente e cada uma das
explicativas é linear “nas variáveis”, i.e., que pode ser expressa por uma reta ou
equivalente. Veja o caso dos exemplos (ii) e (iv) acima.
Na forma matricial:
⎡ Y1 ⎤ ⎡1 X 21 X 31 L XK1 ⎤ ⎡ β1 ⎤ ⎡ ε1 ⎤
⎢Y ⎥ ⎢1 X ⎥
X 32 L XK 2 ⎥ ⎢⎢β 2 ⎥⎥ ⎢⎢ε 2 ⎥⎥
⎢ 2⎥ = ⎢ 22
. +
⎢ M ⎥ ⎢M M M M ⎥⎢M ⎥ ⎢M⎥
⎢ ⎥ ⎢ ⎥⎢ ⎥ ⎢ ⎥
⎣Yn ⎦ ⎣1 X 2n X 3n K x Kn ⎦ ⎣βK ⎦ ⎣ε n ⎦
(n × 1) (n × K ) (K × 1) (n × 1)
Ou simplesmente:
Y = X.β + ε
ε = Y − X.β
n
Min ∑ε 2
i ou Min (ε'.ε )
βi 's β
i =1
Portanto, o vetor b seria aquele que minimizaria a soma dos resíduos ao quadrado.
Assim, encontraria-se a curva que melhor descreveria o comportamento médio da
relação entre as variáveis explicativas e a dependente.
b = (X' X ) X' Y
−1
i i
b2 = i=1
e b1 = Y − b 2 .X .
∑ (X − X)
n
2
i
i=1
Observação:
No caso do modelo linear (cuja curva estimada é uma reta), a reta estimada passa
exatamente no ponto em que X i = X e Ŷi = Y . Por quê?
Ŷ = b1 + b 2 .X i e b1 = Y − b 2 .X ⇒ Y = b1 + b 2 .X
Um exemplo
O Sr. Econopoulos agora será capaz de obter estimativas para os parâmetros
desconhecidos de seu modelo, utilizando os estimadores de mínimos quadrados.
Observações:
[a] Perceba que na equação estimada utiliza-se p̂r já que através dessa equação
serão obtidas estimativas de pr e não necessariamente os seus reais valores.
[b] Não faz sentido somar o termo aleatório na equação estimada. Por quê?
PR vs. AF
60000
50000
40000
E(PR)
R
P 30000
20000
E(AF)
10000
1994 1996 1998 2000 2002 2004
AF
Então, o preço esperado de revenda para uma camioneta fabricada no ano 2000
seria de $38.570, aproximadamente. Com isto, o Sr. Econopoulos poderia tentar
maximizar os seus lucros, já que ele teria uma boa idéia de qual seria o preço de
revenda de uma determinada camioneta.
ANEXO II.1
DERIVAÇÃO DOS ESTIMADORES DE M.Q.O.
Yi = β1 + β 2 .X i + ε i
Então:
ε i = Yi − (β1 + β 2 .X i )
∂S
= −2.∑ (Yi − β1 − β 2 .X i ) = 0 (1)
∂β1 i
∂S
= −2.∑ (Yi − β1 − β 2 .X i ).X i = 0 (2)
∂β 2 i
∑Y i − n.β1 − β 2 .∑ X i = 0 1∗ ( )
i i
∑ Y .X i i − β1 .∑ X i − β 2 .∑ X i2 = 0 2 ∗ ( )
i i i
Então:
n.β1 + β 2 .∑ X i = ∑ Yi
i i
β1 .∑ X i + β 2 .∑ X i2 = ∑ Yi .X i
i i i
⎡ n
⎢
∑X
i
i ⎤ ⎡ ∑ Yi ⎤
⎥.⎡ β1 ⎤ = ⎢ i ⎥
2 ⎢ ⎥ ⎢ Y .X ⎥
⎢∑ X i
⎢⎣ i
∑X
i
i
⎥ β ∑
⎥⎦ ⎣ 2 ⎦ ⎢⎣ i
i i
⎥⎦
Então, utilizando-se a Regra de Cramer temos que:
n ∑Y i
i
∑X i ∑ Y .X i i
∗
b2 = β =
i i
∑X
2
n i
i
∑X i
i ∑X i
2
i
n ∑X i
desde que i
≠0
∑X i
i ∑X i
2
i
Logo:
n.∑ Yi .X i − ∑ Yi .∑ X i
b2 = i i i
2
⎛ ⎞
n.∑ X − ⎜ ∑ X i ⎟ 2
i
i ⎝ i ⎠
Mas, esta expressão pode também ser escrita de uma forma alternativa:
∑ Y .∑ X i i
∑ Yi .X i − i
n
i
b2 = i
2
⎛ ⎞
⎜∑ Xi ⎟
∑i X i2 − ⎝ i n ⎠
∑ Y .∑ X i i ∑ Y .∑ X i i ∑ Y .∑ Xi i
∑ Yi .X i − i
n
i
− i
n
i
+ i
n
i
b2 = i
2 2
⎛ ⎞ ⎛ ⎞
⎜∑ Xi ⎟ ⎜∑ Xi ⎟
∑i X i2 − 2. ⎝ i n ⎠ + ⎝ i n ⎠
∑ Y .∑ X i i ∑ Y .∑ X i i ∑X ∑Y i i
∑ Y .X i i − i
n
i
− i
n
i
+ n. i
n
. i
n
b2 = i
2
⎛ ⎞
⎜∑ Xi ⎟ ∑i X i ∑i X i
⎝ ⎠
∑i X i − 2. n + n. n . n
2 i
∑ Y .X i i − X.∑ Yi − Y.∑ X i + n.X.Y
b2 = i i i
∑X − 2.X.∑ X i + n.X
2 2
i
i i
∑ (Y .X i i − Yi .X − X i Y + X.Y )
b2 =
∑ (X )
i
2
2
i − 2.X.X i + X
i
∑ (Y )(
− Y . Xi − X )
∑ (Y − Y )(. X − X )
i
i
i i
n −1 Côv(X, Y )
= i
= =
( ) ∑( )
b2
Vâr(X )
∑
2 2
X − X i Xi − X
i i
n −1
∑Y
i
i − n.b 1 − b 2 .∑ X i = 0
i
n.b 1 = ∑ Yi − b 2 .∑ X i
i i
∑Y i ∑X i
b1 = i
− b2. i
n n
b 1 = Y − b 2 .X
Desta forma, diz-se que (b 1 , b 2 ) = Arg Min S já que eles formam a solução para o
problema proposto.
Uma forma mais geral de derivar os estimadores de M.Q.O., que poderá ser utilizada
para qualquer modelo linear de regressão simples ou múltipla é apresentada a
seguir:
Y = X.β + ε ⇒ ε = Y − X.β
Min S = ε '.ε = (Y − X.β )'.(Y − X.β ) = Y '.Y − Y '.X.β − β'.X '.Y + β'.X '.X.β
β
Condição de primeira ordem do problema:
∂S
= − X '.Y + X '.X.β = 0
∂β'
Então:
X '.X.β = X '.Y ⇒ (X'.X )−1 .(X'.X ).β = (X'.X )−1 .X'.Y ⇒ b = β ∗ = (X '.X ) .X '.Y
−1
Aqui diz-se que b = Arg Min S pois é o vetor solução para o problema.
ANEXO II.2
UM EXEMPLO UTILIZANDO MATRIZES
Y X2 X3 Y X2 X3
800 2 0,8 2070 11 0,8
1160 4 0,7 1890 10 0,7
1580 6 0,5 1830 9 0,6
2010 8 0,4 1740 8 0,1
1890 7 0,2 1380 6 0,5
2600 12 0,2 1060 4 0,4
Yi = β1 + β 2 .X 2i + β 3 .X 3i + ε i , i = 1,...,12.
Em notação matricial:
⎡ Y1 ⎤ ⎡1 X 21 X 31 ⎤ ⎡ ε1 ⎤ ⎡ 800 ⎤ ⎡1 2 0,8 ⎤ ⎡ ε1 ⎤
⎢ Y ⎥ ⎢1 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ε ⎥
⎢ 2⎥ ⎢ X 22 X 32 ⎥ ⎢ ε2 ⎥ ⎢1160 ⎥ ⎢1 4 0,7 ⎥ ⎢ 2⎥
⎢ Y3 ⎥ ⎢1 X 23 X 33 ⎥ ⎢ ε3 ⎥ ⎢ 1580 ⎥ ⎢1 6 0,5 ⎥ ⎢ ε3 ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ Y4 ⎥ ⎢1 X 24 X 34 ⎥ ⎢ ε4 ⎥ ⎢2010 ⎥ ⎢1 8 0,4⎥ ⎢ ε4 ⎥
⎢ Y5 ⎥ ⎢1 X 25 X 35 ⎥ ⎢ ε5 ⎥ ⎢1890 ⎥ ⎢1 7 0,2⎥ ⎢ ε5 ⎥
⎢ ⎥ ⎢ ⎥ ⎡ β1 ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎡ β1 ⎤ ⎢ ⎥
⎢ Y6 ⎥ ⎢1 X 26 X 36 ⎥ ⎢ ⎥ ⎢ ε 6 ⎥ ⎢2600 ⎥ = ⎢1 12 0,2⎥ ⎢β ⎥ + ⎢ ε 6 ⎥
⎢ Y ⎥ = ⎢1 X 27
. β +
X 37 ⎥ ⎢ ⎥ ⎢ ε 7 ⎥
2 ⇒ ⎢2070 ⎥ ⎢1 11 0,8 ⎥.⎢ 2 ⎥ ⎢ ε ⎥
⎢ 7⎥ ⎢ ⎥ ⎢⎣β 3 ⎥⎦ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢⎣β 3 ⎥⎦ ⎢ 7 ⎥
⎢ Y8 ⎥ ⎢1 X 28 X 38 ⎥ ⎢ ε8 ⎥ ⎢1890 ⎥ ⎢1 10 0,7 ⎥ ⎢ ε8 ⎥
⎢ Y ⎥ ⎢1 X 29 X 39 ⎥ ⎢ε ⎥ ⎢1830 ⎥ ⎢1 9 0,6⎥ ⎢ε ⎥
⎢ 9⎥ ⎢ ⎥ ⎢ 9⎥ ⎢ ⎥ ⎢ ⎥ ⎢ 9⎥
⎢ Y10 ⎥ ⎢1 X 210 X 310 ⎥ ⎢ε 10 ⎥ ⎢1740 ⎥ ⎢1 8 0,1⎥ ⎢ε 10 ⎥
⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥
⎢ Y11 ⎥ ⎢1 X 211 X 311 ⎥ ⎢ ε 11 ⎥ ⎢1380 ⎥ ⎢1 6 0,5 ⎥ ⎢ ε 11 ⎥
⎢⎣ Y12 ⎥⎦ ⎢⎣1 X 212 X 312 ⎥⎦ ⎢⎣ε 12 ⎥⎦ ⎢⎣1060 ⎥⎦ ⎢⎣1 4 0,4⎥⎦ ⎢⎣ε 12 ⎥⎦
⎡1 2 0,8 ⎤
⎢1 4 0,7 ⎥
⎢ ⎥
⎢1 6 0,5 ⎥
⎢ ⎥
⎢1 8 0,4⎥
⎢1 7 0,2⎥
⎡1 1 1 1 1 1 1 1 1 1 1 1 ⎤⎢ ⎥
⎢
X' X = ⎢ 2 4 6 8 7 12 11 10 9 8 6 ⎥
4 ⎥.⎢⎢ 1 12 0,2⎥
1 11 0,8 ⎥
⎢⎣0,8 0,7 0,5 0,4 0,2 0,2 0,8 0,7 0,6 0,1 0,5 0,4⎥⎦ ⎢ ⎥
⎢1 10 0,7 ⎥
⎢1 9 0,6⎥
⎢ ⎥
⎢1 8 0,1⎥
⎢ ⎥
⎢1 6 0,5 ⎥
⎢⎣1 4 0,4⎥⎦
⎡ 20010 ⎤
X' Y = ⎢⎢160810 ⎥⎥
⎢⎣ 9309 ⎥⎦
Yi = β1 + β 2 .X 2i + K + βK .XKi + ε i , i = 1,K,n
Vale relembrar que a variável dependente (Y) varia em função das variáveis
independentes (X’s).
Como os verdadeiros valores dos β’s não são conhecidos, então, utiliza-se o método
dos mínimos quadrados ordinários para se obter suas estimativas para um
determinado conjunto de dados.Assim, será possível decompor o valor de Yi em
Yi = Ŷi + e i
( )
Yi − Y = Ŷi − Y + e i ,
∑ (Y − Y ) = ∑ (Ŷ − Y ) + ∑ (e )
2 2 2
i i i
⇓ ⇓ ⇓
SQT SQR SQE
Onde:
SQT = Soma de Quadrados Total
SQR = Soma de Quadrados da Regressão
SQE = Soma de Quadrados dos Erros
Portanto, SQT seria uma medida de variação total em Y em relação à sua média
amostral, enquanto que SQR seria a parcela desta variação total que seria
explicada pelo modelo de regressão.
Logo, SQE seria a parcela de variação total de Y em relação à sua média que não
é explicada pelo modelo.
Caso o modelo não consiga explicar de forma alguma a variação total de Y, então
será o caso que R2 = 0.
Ademais, é mais fácil obter um R2 alto quando se lida com séries temporais. No
caso, séries transversais, em geral, apresentam uma maior heterogeneidade.
Um exemplo:
SQR 6782,92
R2 = = = 0,5413
SQT 12531,82
ou
SQE 5748,896
R 2 = 1− = 1− = 1− 0,4587 = 0,5413 .
SQT 12531,82
A forma mais utilizada é a forma linear (nas variáveis), que é a que se tem utilizado
até o presente momento.
[1] Yi = β1 + β 2 .X i + ε i (LINEAR)
Outras formas funcionais podem ser utilizadas de acordo com o contexto e/ou com
a teoria que fundamenta o modelo econométrico.
Yi = A.Xβi 2 .ui
β1 = log(A ) e εi = log(ui )
Yi = A.eβ2 . Xi .ui
β1 = log(A) e ε i = log(ui )
[5] Yi = β1 + β 2 .
1
Xi
+ εi (RECÍPROCO)
O modelo RECÍPROCO é apropriado para descrever valores que se comportam
como uma função Hipérbole.
Perceba que se o grau for 1, o modelo polinomial será exatamente igual ao modelo
linear.
ANEXO III.1
DERIVAÇÃO DO R2
Yi = β1 + β 2 .X i + ε i
Então, algumas operações podem ser feitas na expressão acima, quais sejam:
Yi − Y = Ŷi − Y + e i
∑ (Y − Y ) = ∑ (Ŷ − Y + e )
2 2
i i i
i i
∑ (Y − Y )
i
2
= ∑ Ŷi − Y ( ) + ∑ (Ŷ − Y ).e + ∑ (e )
2
i i i
2
i i i i
∑ (Ŷ − Y ).e = ∑ Ŷ .e
i
i i
i
i i − Y.∑ e i
i
Mas, ∑e i
i = 0 , pois:
∑ e = ∑ (Y − Ŷ ) = ∑ Y − ∑ Ŷ = ∑ Y − ∑ (b
i
i
i
i i
i
i
i
i
i
i
i
1 + b 2 .X i )
∑ e = ∑ Y − n.b
i i 1 − b 2 .∑ X i = ∑ Yi − n. Y − b 2 .X − b 2 .∑ X i ( )
i i i i i
∑ e = ∑ Y − n.Y + n.b
i
i
i
i 2 .X − b 2 .∑ X i
i
∑ e = ∑ Y − ∑ Y + b .∑ X
i
i
i
i
i
i 2
i
i − b 2 .∑ X i = 0
i
Logo:
∑ (Ŷ − Y ).e = ∑ Ŷ .e = ∑ (b
i
i i
i
i i
i
1 + b 2 .X i ).e i
∑ (Ŷ − Y ).e
i
i i = b1.∑ e i + b 2 .∑ X i .e i = b 2 .∑ X i .e i
i i i
∑ X .e = ∑ X .Y − b .∑ X
i
i i
i
i i 1
i
i − b 2 .∑ X i2
i
∑ X .e = ∑ X .Y − (Y − b .X ).∑ X
i
i i
i
i i 2
i
i − b 2 .∑ X i2
i
∑ X .e = ∑ X .Y − Y.∑ X
i
i i
i
i i
i
i + b 2 .X.∑ X i − b 2 .∑ X i2
i i
1 ⎡ 1 ⎛ ⎞
2
⎤
∑i i i ∑i i i n ∑i i ∑i i 2 ⎢∑i i n ⎜⎝ ∑i i ⎟⎠ ⎥
X .e = X .Y − . Y . X − b . X 2
− . X
⎢⎣ ⎥⎦
Mas,
∑ (X )( ) 1
i − X . Yi − Y n.∑ X i .Yi − ∑ X i .∑ Yi ∑i i i n .∑i X i .∑i Yi
X .Y −
b2 = i
= i i i
=
∑ (X )
2 2 2
−X ⎛ ⎞ 1⎛ ⎞
i
i
n.∑ X − ⎜ ∑ X i ⎟ 2
i ∑i X − 2
i.⎜ ∑ i ⎟⎠
X
i ⎝ i ⎠ n⎝ i
Então:
1 ⎡ 1 ⎤
∑ X .e = ∑ X .Y − n .∑ Y .∑ X
i
i i
i
i i
i
i
i
i − ⎢∑ X i .Yi − .∑ Yi .∑ X i ⎥ = 0
⎣ i n i i ⎦
Portanto:
∑ (Y − Y ) = ∑ (Ŷ − Y ) + ∑ (e )
2 2 2
i i i
i i i
⇓ ⇓ ⇓
SQT SQR SQE
onde:
SQT = Soma de Quadrados Total
SQR = Soma de Quadrados da Regressão
SQE = Soma de Quadrados do Erro
Assim:
SQR SQE
+ =1
SQT SQT
Então, defina:
SQR SQE
R2 = = 1−
SQT SQT
Ou alternativamente:
∑ (Ŷ − Y )
2
∑e
2
i i
R2 = i
= 1− i
∑ (Y − Y ) ∑ (Y − Y )
2 2 (C.Q.D.)
i i
i i
PARTE IV
Hipóteses do modelo de regressão linear e as propriedades dos
estimadores de mínimos quadrados
O modelo geral de regressão pode ser completamente especificado com base nas
oito hipóteses a seguir:
[2] As variáveis explicativas devem ser consideradas determinísticas (i.e., não são
aleatórias) e linearmente independentes entre si, i.e., uma variável X não pode ser
uma função linear de outra.
Yi = β1 + β 2 .X i + β 3 .Mi + β 3 .SBCi + ε i
SBCi = X i − Mi
Essa hipótese diz que, dados os valores de X, o valor esperado do termo aleatório
deve ser zero para todas as observações. Em outras palavras, o modelo não
comete erros sistemáticos, i.e., comete erros para mais ou para menos, mas que
tendem a se cancelar.
Essa hipótese é equivalente a dizer que
[4] A distribuição de probabilidade de cada termo aleatório εi (i = 1,2, ...,n) é tal que
todas as distribuições apresentam a mesma variância (Homocedasticidade).
Graficamente:
[5] A distribuição de probabilidade de cada termo aleatório εi (i = 1,2, ...,n) é tal que
todos eles não se correlacionam (hipótese da não-autocorrelação dos resíduos).
[7] O modelo econométrico está bem especificado, i.e., ele deve ser compatível
com a teoria que deseja testar e não conter erros de especificação.
[8] Os valores aleatórios εi (i = 1,2, ...,n) tem distribuição normal com média 0 e
variância σ2, ou seja:
Ele pensou a respeito e percebeu que já que a fórmula utilizada é a mesma, então,
obviamente, amostras diferentes gerariam estimativas diferentes para os parâmetros
desconhecidos.
Assim, ele percebeu que o valor assumido pelos estimadores não poderiam ser
previstos a priori. Logo, os estimadores de M.Q. seriam, na verdade, variáveis
aleatórias.
E (bk ) = βk , ∀k
n
ou, em forma matricial
E (b ) = β
n
Ou seja, o Sr. Econopoulos descobriu que o valor esperado dos estimadores de M.Q.
é igual ao verdadeiro valor, desde que as hipóteses básicas do modelo de
regressão sejam mantidas.
Perceba que esta propriedade não garante que, ao estimar um modelo por este
método, os resultados serão os verdadeiros valores dos parâmetros.
Já que o Sr. Econopoulos não pode ter certeza absoluta se os valores dos
parâmetros estimados são iguais aos verdadeiros valores, ele pelo menos gostaria
de ter um certo grau de confiança de que os valores estimados pelo modelo são
representativos da realidade.
Para que isto seja possível, primeiramente é necessário calcular a variância dos
estimadores de M.Q. No caso, pode-se mostrar que
Var (b ) = σ 2 .( X ' X )
−1
⎛ n ⎞
s2 =
e'.e
= ⎜ ∑ êi2 ⎟ (n − K )
n − K ⎝ i =1 ⎠
onde,
e = Y − Ŷ = Y − X .b
ou
ei = Yi − Ŷi = Yi − b1 − b2 .X 2i − ... − bK .X Ki
Vâr (b ) = s 2 .( X ' X )
−1
Um Exemplo Numérico
Utilizando a sua amostra, o Sr. Econopoulos foi capaz de fazer os cálculos vistos
anteriormente. No caso:
e'.e 9 ,25.10 8
s2 = = ≈ 33.035.714
n−K 30 − 2
Modelo básico: Yi = β1 + β2 .X i + εi
∑e 2
i
Estimador da variância dos erros: s 2 = i =1
n−2
⎡ n
⎤
⎢ ∑ X i2 ⎥
vâr (b1 ) = s 2 .⎢ n i =1 ⎥ e ep(b1 ) = vâr (b1 )
⎢⎣ ∑
(
⎢ n. X − X
i )2⎥
⎥⎦
i =1
s2
vâr (b2 ) = e ep(b2 ) = vâr (b2 )
∑ (X − X)
n
2
i
i =1
O Teorema de Gauss-Markov
O Sr. Econopoulos ficou intrigado, pois, havia descoberto fórmulas para as médias e
variâncias dos estimadores de M.Q., mas não sabia ainda se os resultados obtidos
eram confiáveis.
Neste sentido, a primeira coisa a verificar seria se existem outros estimadores que
produzem resultados melhores que os de M.Q.
O Sr. Econopoulos continua em sua busca por uma maior confiabilidade nos
resultados obtidos através da estimação do modelo.
Mais especificamente, além da estimativa pontual dos parâmetros, faz sentido levar
também em consideração a sua variabilidade amostral. E, assim, deseja-se excluir a
hipótese de que cada um dos parâmetros possa ser igual a zero.
Testes de Hipóteses
Perceba que a hipótese nula é aquela que se quer colocar à prova. De acordo
com o teste estatístico será possível rejeitá-la ou, então, não haverá como afirmar
com um alto grau de certeza que o parâmetro em questão é, de fato, diferente de
zero.
No caso em análise, o teste que será utilizado será o teste t, cuja estatística é dada
por:
b k − βk
t=
ep(bk )
Se H0 for verdadeira, então, pode-se mostrar que
bk
t= ~ t (n−K )
ep(bk )
P(− t c ≤ t ≤ t c ) = 1 − α = 95%
A partir dessas idéias, então, é possível definir um regra clara para a rejeição ou não
rejeição de H0.
Assim, como regra geral, tem-se que se t < - tc ou se t > tc então rejeita-se a hipótese
nula e, portanto, diz-se que o parâmetro é estatisticamente significante ou
significativamente diferente de zero ao nível de significância α.
Mas, se - tc ≤ t ≤ tc então não se poderá rejeitar a hipótese nula e, portanto, diz-se
que o parâmetro em questão não é estatisticamente significante ao nível de
significância α.
No caso do teste de significância, quando não se rejeita a hipótese nula, isto não
quer dizer que o verdadeiro valor do parâmetro é igual a zero.
O ponto fundamental é que não será possível afirmar com um alto nível de
confiança que o parâmetro é diferente de zero.
Portanto, do ponto de vista estatístico, se pode ser igual a zero, então, deve ser
tratado como se fosse zero.
Seja α=0,05. O valor crítico tc é 2,048 para uma distribuição t com (T−2) = 28 graus de
liberdade.
b2 3113,02
t= = = 5,747710 > t c = 2,048
ep(b 2 ) 541,61
Conclusão: Já que t = 5,74 > tc = 2,048, nós rejeitamos H0: β2=0 e não rejeitamos a
alternativa, H1: β2≠0. Assim, existe uma relação estatisticamente significante entre a
o preço de revenda e o ano de fabricação da camioneta.
Perceba esta análise deve também ser feita para β1 e para os demais parâmetros
do modelo quando for o caso. Mais especificamente, neste exemplo, p-valor para
β1 foi igual a zero, mostrando que a constante é neste caso estatisticamente
diferente de zero.
Assim, conclui-se β3 não é estatisticamente significante, i.e., pode ser igual a zero, e,
portanto, esta variável adicionada não possui qualquer impacto sobre o modelo.
Uma opção seria incluir variáveis explicativas no modelo, pois, à medida em que
elas são acrescentadas, o R2 do modelo necessariamente não se reduzirá (é
provável que aumente).
O modelo padrão vem com motor de 2000 cilindradas, mas o cliente poderá optar
por motores de 3000 ou 4000 cilindradas.
No caso, ele espera que o sinal do coeficiente que multiplica esta variável seja
positivo, pois, quanto mais cilindradas maior deverá ser o preço de revenda da
camioneta, em média.
⇒ O coeficiente estimado indica, neste caso, que cada cilindrada a mais no motor,
aumentará o preço de revenda em R$ 7,02 aproximadamente.
O R2 ajustado
Uma dificuldade com o R2 é que ele pode ser aumentado pela inclusão de novas
variáveis, mesmo se as variáveis acrescentadas não apresentarem qualquer
justificativa econômica.
SQE (n − K )
R 2 = 1−
SQT (n − 1)
O R2 ajustado não tem o mesmo significado que o R2. Ele apenas mostra se a
inclusão de variáveis adicionais é justificável.
H0: β2 = 0 e β3 = 0
H1: β2 ≠ 0 e/ou β3 ≠ 0
pri = β1 + εi
F=
(SQER − SQE ) J
SQE (n − K )
É preciso comparar o valor de F com um valor crítico que deixa uma probabilidade
α na cauda superior da distribuição F com J e (n - K) graus de liberdade.
Existe uma fórmula mais simples para o teste de significância do modelo com a qual
não é necessário comparar dois modelos diferentes. Basta pensar no modelo sem
restrição (que é o modelo proposto).
Esta fórmula parte da idéia que SQER = SQT (Soma de Quadrados Total do modelo
sem restrições). Então:
F=
(SQT − SQE ) (K − 1) = SQR (K − 1)
SQE (n − K ) SQE (n − K )
F=
(SQR SQT ) (K − 1) = R2 (K − 1)
(SQE SQT ) (n − K ) (1 − R 2 ) (n − K )
Exemplo
No caso do modelo do Sr. Econopoulos, tem-se que n = 30; K = 3; e R2 = 0,804755.
Então:
0,804755 (3 − 1)
F= ≅ 55,64
(1 − 0,804755 ) (30 − 3)
Então, pode-se perceber que F = 55,64 > 3,36 = Fc.
P-valor = 0,0500
P-valor = 0,0000