Regresion Modelo

CAPTULO 3
El modelo clasico de regresion

En el captulo anterior hemos aplicado el algebra matricial y la estadstica descriptiva al modelo lineal general y = X + u para encontrar el estimador de mni = (X X)1 X y. La teora de matrices ha jugado un papel
mos cuadrados ordinarios
relevante en el desarrollo del tema: nos ha permitido ordenar el conjunto de datos en
la matriz de disen
o X y en el vector de observaciones y, resolver el sistema de ecuaciones normales X X = X y y establecer las propiedades numericas de este metodo
de estimacion, X (y X) = X u
= 0k . Tambien hay que apreciar el papel jugado
por la estadstica descriptiva: nos revela que el estimador de mnimos cuadrados usa
la informacion de los datos resumida en los momentos muestrales de primer y segundo
n
orden nh=1 Xih , nh=1 Xih Xjh y

h=1 Xih Yh , y nos sugiere medir la bondad del ajuste
mediente el cudadrado de la correlacion simple entre Yi e Yi.
En este captulo vamos a hacer uso de la teora
propiedades estadsticas del estimador de mnimos
un conjunto de supuestos basicos bajo los cuales el
ordinarios es el mejor estimador que puede utilizarse
estadsticas deseables.
3.1.
de probabilidad para estudiar las

cuadrados. Vamos a especicar
estimador de mnimos cuadrados
porque cumple unas propiedades
Supuestos basicos
Sea y = (Y1 Y2 . . . Y n ) un vector de n-variables aleatorias y sea X una matriz n k

de variables explicativas. Suponemos que la esperanza matematica de y condicionada a
X, E(y|X), es una funcion lineal de un vector de para
metros = (1 2 . . . k ) , esto
es,
E(y|X) = X
y que el vector de variables aleatorias y puede representarse como
(3.1)
y = X + u
en donde u = (u1 u2 . . . un) es un vector de n perturbaciones estocasticas.

Es conveniente interpretar la ecuacion (3.1) como un experimento estadstico
que puede repetirse en identicas condiciones. Cada vez que se repite el experimento
se obtiene un resultado aleatorio. El resultado del experimento representado por
la ecuacion (3.1) es un vector de observaciones. De aqu, los datos {y1 , y2 , . . . , yn }
que se emplean en la estimacion de un modelo de regresion se interpretan como una
realizacio
n particular de las innitas posibles realizaciones de una variable aleatoria ndimensional {Y1 , Y2 , . . . , Y n }. Tambien se dice que los datos los datos {y1 , y2 , . . . , yn }
son una muestra de la poblacion {Y1 , Y2 , . . . , Yn }. Para resaltar esta distincio
n entre
muestra y poblacion cualquier modelo estadstico y, en particular, el modelo de regresion
se denomina tambien proceso generador de datos.
37
38
3.1. Supuestos basicos
Observacio
n 13. En Econometra, es habitual utilizar la misma notacio
n para las
variables aleatorias {Y1 , Y2 , . . . , Yn } y para los valores observados {Y1 , Y2 , . . . , Yn }. La
notacion, por tanto, es ambigua, pero la ambiguedad se resolvera en el contexto en que
se utiliza.
El modelo lineal general (3.1) cumple los supuestos basicos si:
1. X es una matriz no estocastica de rango k < n, tal que
X X
lm
= Q
n
n
siendo Q una matriz nita no singular (denida positiva) de orden k k,
2. u tiene una distribucion normal multivariante con vector de medias nulo y
matriz de varianzas y covarianzas escalar, u N (0, u2 In)
El signicado de los supuestos referidos a la matriz de variables explicativas X es el
siguiente:
1. Regresores no estocasticos. La matriz X es no estocastica cuando permanece
ja en las diferentes repeticiones del experimento.
2. Ausencia de multicolinealidad. El rango de X, (X) = k, es el nu
mero de columnas (o las) linealmente independientes. Este supuesto implica que (X X) = k
y que el sistema de ecuaciones normales tiene solucion u
nica. Si el supuesto se
incumple, (X) < k, entonces las columnas de la matriz X son linealmente
dependientes, (X X) < k y el sistema de ecuaciones normales tiene soluciones
multiples. El termino multicolinealidad hace referencia a la existencia de una o
mas relaciones lineales exactas o perfectas entre las variables explicativas.
3. El supuesto k < n indica que el nu
mero de observaciones es mayor que el
nu
mero de parametros a estimar. Si k > n, entonces (X) n, (X X) n, y
el sistema de ecuaciones normales tendra soluciones multiples.
4. Momentos muestrales nitos. El elemento generico de X X dividido por n es
n
\
Xih Xj h
n
h=1
que converge a una constante nita cuando n .

En cuanto a los supuestos referidos al vector de perturbaciones u,
1. Las perturbaciones estoca
sticas ui (i = 1, . . . , n) tienen media cero, E(ui ) = 0.
2. Homocedasticidad. Las perturbaciones estoca
sticas u i (i = 1, . . . , n) tienen la
misma varianza, V (ui ) = E[ui E(ui )]2 = E(u2 ) = 2 . La notacio
n V (ui ) = 2
i
indica que la varianza no cambia con el ndice i. El incumplimiento de este

supuesto se denomina heterocedasticidad, V (ui ) = 2i.
3. Ausencia de autocorrelacion o de correlacion serial. Las perturbaciones estocasticas son mu
tuamente ortogonales: ui y uj tienen covarianza nula, Cov(ui, uj ) =
E{[ui E(ui )][uj E(uj )]} = E(uiuj ) = 0 i = j. El incumplimiento de este
supuesto se denomina autocorrelacion, la covarianza E(uiuj ) =
/ 0 para algu
n
i = j (Nota: la correlacio
n simple entre ui y uj es E(ui , uj )/ E(u2 )E(u2 )).
i
4. Normalidad. Las perturbaciones estoca

sticas u i (i = 1, . . . , n) tienen una distribucion normal, u i N (0, 2 ).
u
Prof. Dr. Jose Luis Gallego Go

mez
Departamento de Econom a. Universidad de Cantabria
Apuntes de Econometra. LADE y LE. Curso 2008-2009.

Material publicado bajo licencia Creative Commons
39
3. El modelo clasico de regresion
Otra forma de resumir estas cuatro hipotesis es la siguiente: los errores se distribuyen
identica e independientemente como una normal con media cero y varianza constante
2
2
,
u
iidN
(0,
i
u
u ).
0.4
f (ui) =
0.35
1
2
eui /2
0.3
f (ui )
0.25
0.2
0.15
0.1
0.05
0
-4
-2
0
ui
Figura 1: Funcion de densidad de probabilidad de la distribucion normal estandar

El supuesto de que cada error ui tiene media cero, E(ui), puede expresarse en forma
matricial como
E(u1 )
0
E(u2 )
0
E(u) =
.
=
..
.
E(un )
0
Los supuestos de homocedasticidad y ausencia de autocorrelacion implican que la
matriz de varianzas y covarianzas del vector de perturbaciones u es escalar
V (u) =E[(u E(u))(u
u2 (
u1 u
E(u ))] = E
...
u
1
.
un
E(u21)
E(u1 u 2 ) . . .
E(u 2 u1 )
E(u1 un )
E(u2 ) . . .
E(u2 un )
.
.
.
..
2
0
.
...
2 . . .
0
.
.
.
..
= 2
u In
E(un u 1 ) E(u n u2 ) . . .
E(u2n )
.
0
...
.
u2
n 21. Bajo los supuestos ba

Proposicio
sicos, el vector de n-variables aleatorias
y = (Y1 Y2 . . . Yn ) en el modelo (3.1) tiene una distribucio

n normal multivariante
2
con vector de medias X y matriz de varianzas-covarianzas u I n ,
y N (X, u2 In )
n. En general, una combinacio
Demostracio
n lineal de variables aleatorias indeProf. Dr. Jose Luis Gallego Go
mez

pendientes con distribucion normal tiene tambien una distribucio

n normal. Como y es
una transformacion lineal del vector u, y = X + u, que tiene una distribucio
n normal multivariante, y tiene tambien una distribucio
n normal multivariante. El vector de
medias de y es
E(y) = E(X + u) = E(X) + E(u) = X

mez

3.3. Propiedades estadsticas de
40
y su matriz de varianzas y covarianzas
V (y) = E (y E(y))(y E(y))
= E (y X)(y X)
= E[uu ] = u2 I n
Observacion 14. La distribucion de probabilidad de la variable aleatoria y depende

de los parametros desconocidos y u2 . El metodo de estimacion de mnimos cuadrados
proporciona un estimador de ; queda pendiente la estimacion del parametro 2u.
n 20. La ecuacio
Definicio
n (3.1) se denomina funcio
n de regresion poblacional;
y la ecuacio
n estimada, funcio
n de regresion muestral.
n 21. El modelo lineal general (3.1), junto con los supuestos sobre X y
Definicio
u, excepto el de normalidad, se denomina modelo clasico de regresion.
3.2.
Estimador
de 2
u
Las perturaciones estocasticas {u1 , u2 , . . . , un } tienen varianza comu

n 2u. Si seleccionaramos una muestra {u1 , u2 , . . . , un }, entonces podramos estimar el parametro
poblacional u2 a partir de la varianza muestral
n
2
(ui u
)
1
2
2
s = i=1
=
u u nu
u
n
n
n
donde u
= i=1 ui /n es la media muestral. Ahora bien, como las perturbaciones ui no
son observables, el estimador s2u no es calculable.
Para evitar este problema, podemos contemplar los residuos u
i como estimaciones
2
de los errores ui y estimar el parametro u como la varianza muestral de los residuos.
Suponiendo que el modelo de regresion tiene termino
n constante,
2
2
i
i u
)
i=1 u
u
u
2
i=1 (u
=
=
=
u
n
n
n
que se denomina estimador de maxima verosimilitud de la varianza de las perturbaciones.
Alternativamente, y reconociendo que los grados de libertad de la suma de cuadrados
de libertad son n k, podemos proponer el estimador
n
i 2
u
u
i=1 u
2
=
=
u
nk
nk
que se denomina estimador de mnimos cuadrados de la varianza de las perturbaciones.
n 22. La raz cuadrada de
Definicio
2u,
u , se conoce como error estandar de la
regresion.
Ejemplo 1. En el2 modelo de las calicaciones,
n = 10, k = 4 y la suma de cuadrados de los residuos
u u = 6,7027. De aqu,
= 6,7027/10 = 0,67027 y
2 = 6,7027/6 = 1,11712.
u
3.3.
Propiedades estadsticas de
= (X X)1 X y del vector de para

El estimador
metros es un estadstico, es de : :Rn :Rk .
cir, una funcion de la variable aleatoria n-dimensional {Y1 , Y 2 , . . . , Yn },
=
(Y1 , Y2 , . . . , Yn ). Una estiPara hacer explcita esta dependencia escribimos
macion es un valor especco del estimador calculado para una de las innitas posibles
mez

41
realizaciones de la variable aleatoria {Y1 , Y2 , . . . , Yn }. Si {y1 , y2 , . . . , yn} es una realizacion particular de la variable aleatoria {Y1 , Y2 , . . . , Yn }, entonces la estimacio
n
= (y1 , y2 , . . . , yn ) es uno de los muchos posibles valores que puede tomar la variable
= (Y 1 , Y2 , . . . , Yn).
aleatoria
La distribucion de probabilidad conjunta del estimador (Y1 , Y2 , . . . , Yn ) describe
el comportamiento de las estimaciones que se obtendran en el conjunto de posibles
muestras de la poblacio
n {Y1 , Y 2 , . . . , Yn }. Esta distribucio
n se denomina distribucio
n
muestral y puede derivarse de la distribucio
n de probabilidad de {Y1 , Y 2 , . . . , Yn },
2
y N (X, I),
n de probabilidad de
u que a su vez se ha derivado de la distribucio
2
{u 1 , u2 , . . . , un }, u N (0, uI).
del
Teorema 2. Bajo los supuestos ba
sicos, el estimador de mnimos cuadrados
vector de para
metros en el modelo (3.1) tiene una distribucio
n normal multivariante
2
X)1 , que se escribe
con vector de medias y matriz de varianzas y covarianzas (X
u
sucintamente como
N , 2 (X X 1
)
u
n.
Demostracio
j (j = 1, . . . , k) del vector
= (X X) X y es
1. Normalidad. Cada elemento
una combinacion lineal de variables aleatorias independientes Y1 , . . . , Yn con
distribucion normal,
n
\
j =
ci Yi
i=1
en donde las ponderaciones c1 , . . . , cn son los elementos de la la j de la matriz

1
(X X) X .
2. Vector de medias
) = E X X
E(
X y = X X
X E [y] = X X
X [X] =
3. Matriz de varianzas y covarianzas

(
\(
\
) = E
E(
)
E(
)
V (
E(
) = (X X)
Como
) =E
V (
X X
X [y E(y)], tenemos
X [y E(y)] [y E(y)] X X X
= X X
X E [y E(y)] [y E(y)] X X X
= X X
X u2 I X X X
= 2u X X
n 23. Un estimador i del para

Definicio
metro i es insesgado si su esperanza
matema
tica coincide con el verdadero para
metro i, E(i ) = i. En el caso multidimen es insesgado si E(
) = .
sional, un vector de estimadores
El Teorema 2 arma que el estimador de mnimos cuadrados es insesgado: si tomamos
diferentes muestras de tamano n y para cada una calculamos el estimador , entonces
la media muestral de estas estimaciones es igual a .
mez

42
n 24. Un estimador insesgado i es ma

Definicio
s eciente que otro estimador i
tambien insesgado, si la varianza muestral de i es menor que la de i , V (i ) < V (i ).
es ma
s eciente
En el caso multidimensional, un vector de estimadores insesgados
que otro , si la diferencia entre las matrices de varianzas y covarianzas V () V ()

es una matriz denida negativa.
Observacio
n 15. Sea = w cualquier combinacio
n lineal de los para
metros de .
Entoces
= w es ma
s eciente que
= w si V () < V (), esto es, si
)w w V (
)w = w V (
) V (
) w
w V (
es una forma cuadratica denida negativa.
La inversa de la varianza de un estimador es una medida de su precision o acuracidad. Cuanto menor sea la varianza del estimador, tanto mas preciso o acurado sera el
estimador, lo que signica que las estimaciones obtenidas en las distintas realizaciones
del experimento aleatorio estaran proximas al parametro que se desea estimar.
Teorema 3 (Teorema de Gauss-Markov). Bajo los supuestos basicos del modelo
es el mas eciente en la clase de esticlasico, el estimador de mnimos cuadrados
madores lineales e insesgados de .
n. La clase general de estimadores lineales esta denida por
Demostracio
= Cy
en donde C es una matriz de orden k n de nu

meros jos. Se observa que el estimador
es un miembro particular de esta clase cuando C = (X X)1 X .

Dentro de la clase general de estimadores lineales, los estimadores insesgados
) = E(Cy) = CX =
E(
son aquelos que cumplen CX = Ik .
La matriz de varianzas y covarianzas de es
(
\(
\
) = E
E(
)
E(
)
V (
= CE (y E(y)) (y E(y)) C = 2 CC
u
Ahora escribimos
C = D + X X
en donde se cumple que DX = 0 porque CX = Ik . De modo que

CC = D + X X
D + X X X
Sustituyendo CC en V (), tenemos

V () = 2 DD + 2
u
X X
= DD + X X
Esta ecuacion puede escribirse como
V () V () = 2 DD
u
donde vemos que la diferencia de las dos matrices de varianzas y covarianzas es una
matriz semidenida positiva.

mez

43
Observacion 16. El Teorema de Gauss-Markow no hace uso del supuesto de normalidad de las perturbaciones.
n 25. Un estimador i es consistente o converge en probabilidad al para
Definicio
metro
verdadero i si, para todo > 0,
lm P (| i i | ) = 0
(n)
n
(n)
i
en donde
es el estimador calculado con n observaciones. En el caso multidimen del vector de para
sional, el vector de estimadores
metros es consistente si, para todo
> 0,
(n)
lm P (1 1 ) = 0
n
(n)
en donde es el vector de estimadores basado en una muestra de n observaciones y

(n)
1 1 es la norma eucldea del correspondiente vector.
En la denici
on anterior, i es el lmite en probabilidad de la secuencia de variables
(n)
aleatorias { } y se escribe como
i
n=k
plimi = i
p
i
n 26. Un estimador i converge en media cuadra

Definicio
tica al para
metro verdadero i si
lm E((n) i )2 = 0
n
o, equivalentemente, si
(n)
lm sesgo(i ) lm E( ) i = 0
n
(n)
(n)
lm var( ) l m E( i )2 = 0
n
converge en media cuadra

En el caso multidimensional, un vector de estimadores
tica
al vector de para
metros verdaderos si
\
(n) ) (
(n) ) = lm k E((n) )2 = 0
lm E (
n
i=1
n 22. Convergencia en media cuadra

Proposicio
tica implica convergencia en probabilidad.
n 23. Bajo los supuestos ba
Proposicio
sicos del modelo lineal general cla
sico, el
estimador de mnimos cuadrados del vector de parama

metros en el modelo (3.1) es
consistente.
converge en media cuadratica a (y, por la proposicio

n.
Demostracio
n 22, es
consistente) porque es insesgado y su matriz de varianzas y covarianzas tiende a una
matriz nula cuando n ,
1
2
2
1
lm X X
= 0Q1 = O
lm V () = lm u X X
= lm
n
n n
n n
n
n
n
La propiedad de consistencia signica que los estimadores de mnimos cuadrados

tienden o convergen a los parametros verdaderos al ir aumentando indenidamente el
tamano de la muestra.
mez

44

u2 y
2u
Observacion 17. El estimador de mnimos cuadrados se denomina ELIO para indicar que es un estimador lineal, insesgado y optimo. El adjetivo optimo indica que el
estimador es el mas eciente o el de mnima varianza en la clase de estimadores lineales
e insesgados.
cumple las propiedades estadstiEn resumen, el estimador de mnimos cuadrados
cas de linealidad, insesgadez, eciencia y consistencia. Estas propiedades se consideran
deseables y justican el empleo del metodo de mnimos cuadrados como metodo de estimacion en el marco del modelo lineal general clasico y nuestra preferencia por este
metodo frente a otros metodos de estimacion alternativos.
3.4.
Propiedades estadsticas de
2u y
2u
n 24. La suma de cuadrados de los residuos u

Proposicio
u
es funcio
n cuadra
tica
de las perturbaciones aleatorias, u

u
= u Mu.
n. Sabemos que u
Demostracio
= My y MX = 0. Por tanto,
u
= My = M [X + u] = Mu
De aqu,
u
u
= (Mu) Mu = u M Mu = u Mu
Vemos que la suma de cuadrados de los residuos es un estadstico, es decir, una funcion de las variables aleatorias {u1 , u2 , . . . , un }. Su distribucion de probabilidad puede,
por tanto, derivarse de la distribucion de probabilidad conjunta de las perturbaciones
estocasticas {u1 , u2 , . . . , un }.
Teorema 4. La ratio u
u
/ 2utiene una distribucion Chi-cuadrado con n k grados
de libertad, que se expresa sucintamente como

u u
2
nk
u2
n. Usaremos los siguientes resultados sobre distribuciones de formas

Demostracio
cuadraticas.
1. Sea z = (z1 z2 . . . zn ) un vector n 1 de variables aleatorias identica e
independientemente distribuidas (iid) con distribucio
n normal esta
ndar, z
N (0, I n ). Entonces,
\
n
z z =
z 2 2
i=1
Demostracion. Si zi N (0, 1), entonces z 2i N (0, 1)2 21. Adema

s, si
z1 , . . . , zn son variables aleatorias iid y si cada zi tiene una distribucio
n normal estandar, entonces la suma de los cuadradados z 2 + + z 2 tiene una
1
distribucion 2 con n grados de libertad.

2. Sea u = (u1 u2 . . . un) un vector n 1 de variables aleatorias identica e
independientemente distribuidas como una normal con media 0 y varianza 2u,
mez

45
u N (0, 2uIn ). Entonces,

n
\
1
ui
u
u
=
u2
u
i=1
n2
Demostracion. Sea z u/u . Entonces, E(z) = E(u/u ) = 0, E(zz ) =

E(uu / 2 ) = In , y z N (0, In ). Por el resultado 1, z z u u/ 2 2 .
u
3. Sea u N (0, 2uIn) y sea M una matriz simetrica e idempotente de rango

n k. Entonces
1
2
u
Mu
nk
2
u
Demostracion. Sean P y las matrices de autovectores y autovalores de M,

MP = P. Por ser M simetrica, P1 = P y M = PP . Por ser M
idempotente, M = P2 P , los autovalores tienen que ser iguales a 1 o
0. Como
trM = tr = n k se deduce que de los n autovalores, n k son iguales a uno
1
y k son iguales a cero. Dene u = Pu. Entonces, u N (0, I ) porque
n
u
P P = In . Luego
n k
1
u u
1
\
= u Mu =
u P Pu = u u =
ui nk
2
2
2
2
2
u
u
u
i=1
n 25.
2 = u
u
/(n k) es un estimador insesgado de 2 con varianza
Proposicio
2u4 /(n k).
n. La esperanza matematica de una variable aleatoria z con disDemostracio

tribucion Chi-cuadrado con m grados de libertad es igual a los grados de libertad m,
E(z) = m. Por tanto,
u
u
E 2 = (n k)
u
De aqu, E(u
u
) = (n k) 2u y
u
u
E(
u ) = E
nk
2
= 2u
La varianza de z 2m es igual a dos veces los grados de libertad, var(z) = 2m. Por
tanto,
u u
= 2(n k)
var
u2
De aqu, var(u
u
) = 2(n k) 4u y
var(
u2 ) =
var(u
u
)
(n k)2
2u
nk

mez

46
3.5. Resumen
Observacion 18. La esperanza matematica de la suma de cuadrados de los residuos

puede obtenerse sin conocer su distribucion de probabilidad
E(u
u
) =E(u Mu)
Proposicion 24
=E(tru Mu)
Propiedad: tr(escalar) = escalar
=E(trMuu )
Propiedad: tr(ABC) = tr(CBA)

\
n\
n
Propiedad: E( z ) =
E(z )
=trE(Muu )
=tr ME(uu )
=tr M( 2 I ) = tr 2 M
u n
u n
Propiedad: factor comu

n
= u2 (n k)
8.
2 = u
u
/n es
u
(k/n) 2u.
i=1
Supuesto: X es una matriz ja

Supuesto: E(uu ) = 2 I
= 2utrM
Corolario
i=1
Propiedad: trM = (n k)
un estimador sesgado de 2 , siendo el sesgo B(
2) =
u
n. De la relacio
Demostracio
n entre
2 y
2
u
2 =
se tiene que E(
2 ) = 2 (k/n) 2 .
u
n 26.
Proposicio
u2
n k
u
2
=u
u
/n es un estimador consistente de 2 .
u
n. El estimador
Demostracio
2 converge
en media cuadratica al verdadero parametro
u
1. lmn B(
2 ) = l mn (k/n) 2 = 0
u
2. lmn var(
u2 ) = lmn
2(n k) 4
u = 0
n2
resulta de un proceso de minimizacion,

Observacion 19. Mientras que el estimador
2
el estimador
use construye para que sea insesgado.
3.5.
Resumen
1. Un estimador es insesgado si su valor esperado coincide con el parametro que

se desea estimar.
2. Un estimador es consistente si la estimacion del parametro en muestras grandes
es el parametro que se desea estimar.
3. Un estimador es eciente dentro de una clase de estimadores si su varianza es
menor que la de los otros estimadores.
4. Bajo los supuestos basicos, el estimador de mnimos cuadrados es ELIO (en
ingles, BLUE: Best Linear Unbiased Estimator).
5. Bajo el supuesto de normalidad de las perturbaciones, el estimador de mnimos
cuadrados tiene una distribucion normal multivariante.
6. El error estandar de la regresion es la raz cuadrada de la varianza muestral de
los residuos.
mez

47
7. La precision de los estimadores es inversamente proporcional al error estandar

de la regresion.
Palabras clave
Modelo clasico de regresion
Distribucion normal multivariante
Vector de medias
Matriz de varianzas y covarianzas
Regresores no estocasticos
Multicolinealidad
Homocedasticidad
Correlacion serial
3.6.
Ejercicios
1. Use el proceso generador de datos

Yt = 1,0 + 0,5t + ut ut N (0, 1)
para generar 10 muestras de 25 observaciones (Y1 , . . . , Y25 ). Utilice cada muestra para estimar la regresion lineal simple de Yt sobre la tendencia lineal t.
Compare las estimaciones de 1 y 2 obtenidas en cada muestra con los valores
verdaderos. Calcule la media y desviacion tpica de las 10 estimaciones de 1
y 2 , que puede decir sobre la propiedad de insesgadez?. Genere despues una
muestra de 200 observaciones, y estime la regresion simple: que puede decir
sobre la propiedad de consistencia?.
2. Discuta las siguientes proposiciones:
a) El supuesto (X) = k implica que las variables explicativas son ortogonales.
b) Si para estimar la ecuacio
n de regresion simple, yi = 1 + 2 Xi + u i, so
lo
se disponde de un dato, i = 1, entonces el estimador de mnimos cuadros
de los parametros esta indeterminado.
c) Los momentos respecto al origen de la perturbacion aleatoria ui coinciden
con sus momentos centrados.
d) ) El estimador de la varianza
1 residual es un estimador lineal.
3. Demuestre que = + (X X) X u. Derive la distribucion de probabilidad

a partir de la distribucio
del estimador
n de probabilidad de u.
4. Demuestre que la submatriz de covarianzas de (i , j ) es semidenida positiva.
Utilice este resultado para demostrar que
cov(i , j )2 var(i )var(j )
Que puede decir sobre la correlacio
n entre i y j ?
5. Demuestre que V ar(yi) puede escribirse como
V ar(y
i) =
k j1
\
\
2
j ,
h )
x jiV ar(j ) + 2
xji xki cov(
j=1
j=2 h=1
k
\
6. Demuestre que
) (
) = (E
) (E
) + E (
E
) (
E
)
E (
=
k
\
sesgo (i ) +
i=1
mez
k
\
var(i )
i=1
48
3.6. Ejercicios
7. Derive las propiedades estadsticas de los residuos mnimo-cuadraticos, E(u

) y
V (u
).
8. Demuestre que V (u
t ) = (1 ht ) 2 , en donde ht = x (X X)1 xt .
u

mez


Regresion Modelo

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Regresion Modelo

Enviado por

Direitos autorais:

Formatos disponíveis

CAPTULO 3

El modelo clasico de regresion

orden nh=1 Xih , nh=1 Xih Xjh y

de probabilidad para estudiar las

Sea y = (Y1 Y2 . . . Y n ) un vector de n-variables aleatorias y sea X una matriz n k

en donde u = (u1 u2 . . . un) es un vector de n perturbaciones estocasticas.

3.1. Supuestos basicos

que converge a una constante nita cuando n .

indica que la varianza no cambia con el ndice i. El incumplimiento de este

4. Normalidad. Las perturbaciones estoca

Prof. Dr. Jose Luis Gallego Go

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3. El modelo clasico de regresion

Figura 1: Funcion de densidad de probabilidad de la distribucion normal estandar

n 21. Bajo los supuestos ba

y = (Y1 Y2 . . . Yn ) en el modelo (3.1) tiene una distribucio

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

pendientes con distribucion normal tiene tambien una distribucio

Prof. Dr. Jose Luis Gallego Go

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3.3. Propiedades estadsticas de

Observacion 14. La distribucion de probabilidad de la variable aleatoria y depende

Las perturaciones estocasticas {u1 , u2 , . . . , un } tienen varianza comu

= (X X)1 X y del vector de para

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3. El modelo clasico de regresion

en donde las ponderaciones c1 , . . . , cn son los elementos de la la j de la matriz

3. Matriz de varianzas y covarianzas

n 23. Un estimador i del para

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3.3. Propiedades estadsticas de

n 24. Un estimador insesgado i es ma

que otro , si la diferencia entre las matrices de varianzas y covarianzas V () V ()

en donde C es una matriz de orden k n de nu

es un miembro particular de esta clase cuando C = (X X)1 X .

en donde se cumple que DX = 0 porque CX = Ik . De modo que

Sustituyendo CC en V (), tenemos

Esta ecuacion puede escribirse como

Prof. Dr. Jose Luis Gallego Go

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3. El modelo clasico de regresion

en donde es el vector de estimadores basado en una muestra de n observaciones y

n 26. Un estimador i converge en media cuadra

converge en media cuadra

n 22. Convergencia en media cuadra

estimador de mnimos cuadrados del vector de parama

converge en media cuadratica a (y, por la proposicio

La propiedad de consistencia signica que los estimadores de mnimos cuadrados

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3.4. Propiedades estadsticas de

n 24. La suma de cuadrados de los residuos u

de las perturbaciones aleatorias, u

de libertad, que se expresa sucintamente como

n. Usaremos los siguientes resultados sobre distribuciones de formas

Demostracion. Si zi N (0, 1), entonces z 2i N (0, 1)2 21. Adema

distribucion 2 con n grados de libertad.

Apuntes de Econometra. LADE y LE. Curso 2008-2009.

3. El modelo clasico de regresion

u N (0, 2uIn ). Entonces,

Demostracion. Sea z u/u . Entonces, E(z) = E(u/u ) = 0, E(zz ) =

3. Sea u N (0, 2uIn) y sea M una matriz simetrica e idempotente de rango

Demostracion. Sean P y las matrices de autovectores y autovalores de M,

n. La esperanza matematica de una variable aleatoria z con disDemostracio

Prof. Dr. Jose Luis Gallego Go