Revisão—álgebra matricial
23
𝒂)
−𝟏
𝑿 ( 𝑿′ 𝑿 ) 𝑿′ = 𝑷
𝑛×(𝑘+1) ⏟(𝑘+1)×𝑛 𝑛×(𝑘+1) (𝑘+1)×𝑛 𝑛×𝑛
(𝑘+1)×(𝑘+1)
−𝟏
′
𝑰𝒏 − 𝑷 = 𝑰𝒏 − 𝑿 ( 𝑿 𝑿 ) 𝑿′ = 𝑴
𝑛×𝑛 𝑛×(𝑘+1) ⏟(𝑘+1)×𝑛 𝑛×(𝑘+1) (𝑘+1)×𝑛 𝑛×𝑛
⏟ (𝑘+1)×(𝑘+1)
𝑛×𝑛
𝒃)
′
𝑷′ = [𝑿(𝑿′ 𝑿)−𝟏 𝑿′ ]′ = 𝑿′ [(𝑿′ 𝑿)−𝟏 ]′ 𝑿′ = 𝑿[(𝑿′ 𝑿)′ ]−𝟏 𝑿′ = 𝑿(𝑿′ 𝑿)−𝟏 𝑿′ = 𝑷.
𝑴′ = 𝑰′𝒏 − 𝑷′ = 𝑰𝒏 − 𝑷 = 𝑴.
𝒄)
𝑷𝟐 = 𝑿[(𝑿′ 𝑿)′ ]−𝟏 𝑿′ 𝑿[(𝑿′ 𝑿)′ ]−𝟏 𝑿′ = 𝑿(𝑿′ 𝑿)−𝟏 𝑿′ = 𝑷.
𝑴𝟐 = (𝑰𝒏 − 𝑷)(𝑰𝒏 − 𝑷) = 𝑰𝒏 − 𝟐𝑷 + 𝑷𝟐 = 𝑰𝒏 − 𝟐𝑷 + 𝑷 = 𝑰𝒏 − 𝑷 = 𝑴.
𝒅)
𝑷𝑿 = 𝑿(𝑿′ 𝑿)−𝟏 𝑿′ 𝑿 = 𝑿.
𝒆)
𝑿′ 𝑴 𝒚 = 𝑿′ (𝑰𝒏 − 𝑷)𝒚 = (𝑿′ − 𝑿′ 𝑷)𝒚 = (𝑿′ − 𝑿′ 𝑷′ )𝒚 =
(𝑘+1)×𝑛 𝑛×𝑛 𝑛×1
⏟
(𝑘+1)×𝑛
24
Noção básica: valor esperado de uma matriz (v., por ex.: Introdução à Econometria, 2e,
Anexo B.5.2 Momentos de vectores e matrizes; Introductory Econometrics, 6e, Appendix D7a
Expected Value, D7b Variance-Covariance Matrix.).
Dada uma matriz de variáveis aleatórias, 𝑨 = [𝑎𝑖𝑗 ], o valor esperado, E(𝑨), é a matriz cujos
elementos são os valores esperados dos correspondentes elementos de 𝑨. Formalmente,
𝑎11 ⋯ 𝑎1𝑘 E(𝑎11 ) ⋯ E(𝑎1𝑘 )
𝑨=[ ⋮ ⋮ ] ⇒ E(𝑨) = [ ⋮ ⋮ ].
𝑎𝑛1 ⋯ 𝑎𝑛𝑘 E(𝑎𝑛1 ) ⋯ E(𝑎𝑛𝑘 )
Se a matriz é não aleatória (matriz de constantes), uma vez que o valor esperado de uma
constante é a própria constante, tem-se obviamente também E(𝑨) = 𝑨.
Considere-se então o vector
𝑦1
𝒚 = [ ⋮ ],
𝑛×𝑛 𝑦𝑛
com média (vector de médias)
E(𝑦1 ) 𝜇1
E(𝒚) = [ ⋮ ] = [ ⋮ ] = 𝝁 .
E(𝑦𝑛 ) 𝜇𝑛 𝑛×𝑛
27
𝒂)
𝜹 = 𝑮𝜷; ̂ = 𝑮𝜷
𝜹 ̂
Sob as hipóteses GM, o estimador OLS de 𝜷, do modelo 𝒚 = 𝑿𝜷 + 𝒖, é cêntrico; logo
̂|𝑿) = 𝐸(𝑮𝜷
𝐸(𝜹 ̂ |𝑿) = 𝑮𝐸(𝜷
̂ |𝑿) = 𝑮𝜷 = 𝜹.
𝒃)
̂ |𝑿) = 𝜎 2 (𝑿′ 𝑿)−𝟏; logo
Sob as hipóteses GM, V(𝜷
̂|𝑿) = V(𝑮𝜷
V(𝜹 ̂ |𝑿) = 𝑮V(𝜷
̂ |𝑿)𝑮′ = 𝜎 2 𝑮(𝑿′ 𝑿)−𝟏 𝑮′
28
A alternativa correcta é C—o coeficiente de 𝑥1 estima a taxa de variação de 𝑦 por acréscimo
unitário de 𝑥1 , cp: se 𝑥1 aumenta uma unidade e 𝑥2 permanece inalterado, estima-se que 𝑦 sofre
um acréscimo relativo de 100%.
(O coeficiente de 𝑥2 estima a elasticidade de 𝑦 por acréscimo unitário de 𝑥2 , cp: se 𝑥2 aumenta
1%, e 𝑥1 permanece inalterado, estima-se que 𝑦 decresce 0,02%.)
(V. c21, págs. 8-10).
29
Da definição das variáveis resulta, para todos os indivíduos, 𝑒𝑠𝑡𝑖 + 𝑠𝑖 + 𝑡𝑟𝑖 + 𝑙𝑖 = 168, ∀𝑖.
𝒂)
Não faz sentido considerar uma variação em qualquer das variáveis explicativas, mantendo
inalteradas as restantes. Quando 𝑒𝑠𝑡 (ou qualquer variável explicativa) varia, as outras (no
mínimo, uma delas) também variam, porque a sua soma é constante. Por exemplo, se o tempo
de estudo (𝑒𝑠𝑡) aumenta 5 horas por semana, o número de horas dedicado semanalmente a
outras actividades—por ex., sono (𝑠)—reduz-se 5 horas.
𝒃)
Pressuposto violado pelo modelo: (3) Ausência de multicolinearidade—as variáveis
explicativas são linearmente independentes. Em termos da matriz das variáveis explicativas, 𝑿,
as suas colunas são linearmente independentes ou seja, sua característica é igual ao número de
colunas (𝑘 + 1).
Neste caso, a matriz 𝑿 é do tipo
1 𝑒1 𝑠1 𝑡1 𝑙1
𝑒2 𝑠2 𝑡2 𝑙2
𝑿 = [1 ⋮ ⋮ ⋮ ]
(𝑛×5) ⋮ ⋮
1 𝑒𝑛 𝑠𝑛 𝑡𝑛 𝑙𝑛
—as suas colunas são linearmente dependentes [ex.: 168𝑐1 − (𝑐2 + 𝑐3 + 𝑐4 + 𝑐5 ) = 0]. Em
consequência, a matriz 𝑿′𝑿 não admite inversa e não se poderia obter o estimador OLS,
(𝑿′ 𝑿)−𝟏 𝑿′ 𝒚. O modelo está mal formulado.
𝒄)
Deve-se excluir uma das variáveis explicativas do modelo. A nova matriz 𝑿 (𝑛 × 4) passa a ter
todas as colunas linearmente independentes.
31
𝒂)
𝛽5 ≤ 0: quanto mais elevado 𝑟𝑎𝑛𝑘, pior a posição da universidade no ranking. Espera-se que
valores mais elevados de 𝑟𝑎𝑛𝑘 correspondam a níveis inferiores dos empregos dos recém-
licenciados, com valores medianos de 𝑠𝑎𝑙 mais baixos.
𝒃)
𝛽1 ≥ 0, 𝛽2 ≥ 0, 𝛽3 ≥ 0, 𝛽4 ≥ 0: efeitos de causalidade positivos.
𝒄)
Para uma média de curso 1 (ponto) superior, cp, estima-se um salário mediano24,8% superior
(variação relativa—𝛽2 é a taxa de variação de 𝑠𝑎𝑙 em ordem a 𝑚𝑓𝑐).
𝒅)
Para um número de livros existentes na biblioteca de uma universidade 1% superior, cp, estima-
se que o salário mediano de um recém-licenciado da universidade é 0,095% superior (𝛽3 é a
elasticidade de 𝑠𝑎𝑙 em relação a 𝑏𝑖𝑏).
𝒆)
Ceteris paribus, parece preferível frequentar universidades mais bem situadas no ranking (𝑟𝑎𝑛𝑘
inferior): estima-se em −0,33% a taxa de variação de 𝑠𝑎𝑙, para acréscimo unitário de 𝑟𝑎𝑛𝑘. Para
uma diferença de 20 posições no 𝑟𝑎𝑛𝑘𝑖𝑛𝑔 (∆𝑟𝑎𝑛𝑘 = 20), estima-se a variação relativa de 𝑠𝑎𝑙,
20 × (−0,33%. ) = −6,6%.
33
𝒂)
Deduz-se o valor esperado do estimador OLS com base num pressuposto relativo ao valor
esperado do erro do modelo—em concreto, a hipótese (4) E(𝑢|𝒙) = 0 (v. c221, págs. 19, 20).
̂ )—logo, para concluir se 𝜷
Para obter E(𝜷 ̂ é ou não cêntrico—não é necessário mencionar nada
a respeito da variância do erro (a qual é objecto da 5ª hipótese). O que significa que a ocorrência
de heteroscedasticidade (ou o seu contrário) não tem qualquer consequência sobre a
centricidade ou enviesamento do estimador.
𝒃)
Se se omite uma variável “importante” (entenda-se: “relevante”) do modelo—isto é, se o modelo
adoptado é sub-especificado—a consequência usual é a de que o erro é correlacionado com as
variáveis explicativas (ou seja, no modelo adoptado, as variáveis explicativas são endógenas).
Formalmente, sendo 𝑢 o erro deste modelo,
COV(𝑢, 𝒙) ≠ 0 ⇒ E(𝑢|𝒙) = ℎ(𝒙)
—a média condicional do erro é função das variáveis explicativas. Em consequência,
̂ |𝑿) = E[𝜷 + (𝑿′ 𝑿)−1 𝑿′ 𝒖|𝑿] = 𝜷 + (𝑿′ 𝑿)−1 𝑿′ E(𝒖|𝑿)
E(𝜷 ⏟ ≠ 𝜷,
≠𝟎
38
𝒂)
̂ = −19,315 + 0,128𝑠𝑞𝑟𝑓𝑡 + 15,198𝑏𝑑𝑟𝑚𝑠, 𝑛 = 88, 𝑅 2 = 0,632.
𝑝𝑟𝑖𝑐𝑒
GRETL
[Abrir a base de dados HPRICE1.gdt: no painel inicial,
Ficheiro → Abrir Dados → Ficheiro de Exemplos → separador Wooldridge → seleccionar
ficheiro Hprice1 House prices and characteristics.
Estimação do modelo: no painel inicial, após abrir a base de dados,
Modelo → Mínimos Quadrados (“Ordinary Least Squares”) → escolha da Variável dependente e
dos Regressores → OK]
Output da estimação OLS:
Modelo 1: Mínimos Quadrados (OLS), usando as observações 1-88
Variável dependente: price
𝒄)
̂ = 0,128 ∆𝑠𝑞𝑟𝑓𝑡
∆𝑝𝑟𝑖𝑐𝑒 ⏟ + 15,198 ∆𝑏𝑑𝑟𝑚𝑠
⏟ =
=140 =1
𝒆)
𝑝𝑟𝑖𝑐𝑒
̂ = −19,315 + 0,128436 × 2438 + 15,1982 × 4 = 354605USD.
GRETL
[No painel de output da estimação OLS do modelo—v. al. 𝒂),
Análise → Mostrar atual, ajustado, resíduos → seleccionar a primeira linha.]
𝒇)
O valor estimado do preço da primeira casa é 354605—alínea 𝒆). O valor efectivo de venda
(300000) sugere que o comprador pagou um preço inferior ao que se esperaria, de acordo com
o modelo adoptado. Mas, decerto, há muitas outras características de uma casa (algumas das
quais nem são mensuráveis), que afectam o preço mas que não são controladas neste modelo.