Escolar Documentos
Profissional Documentos
Cultura Documentos
Supuestos basicos
y = X + u
38
Observacio
n 13. En Econometra, es habitual utilizar la misma notacio
n para las
variables aleatorias {Y1 , Y2 , . . . , Yn } y para los valores observados {Y1 , Y2 , . . . , Yn }. La
notacion, por tanto, es ambigua, pero la ambiguedad se resolvera en el contexto en que
se utiliza.
El modelo lineal general (3.1) cumple los supuestos basicos si:
1. X es una matriz no estocastica de rango k < n, tal que
X X
lm
= Q
n
n
siendo Q una matriz nita no singular (denida positiva) de orden k k,
2. u tiene una distribucion normal multivariante con vector de medias nulo y
matriz de varianzas y covarianzas escalar, u N (0, u2 In)
El signicado de los supuestos referidos a la matriz de variables explicativas X es el
siguiente:
1. Regresores no estocasticos. La matriz X es no estocastica cuando permanece
ja en las diferentes repeticiones del experimento.
2. Ausencia de multicolinealidad. El rango de X, (X) = k, es el nu
mero de columnas (o las) linealmente independientes. Este supuesto implica que (X X) = k
y que el sistema de ecuaciones normales tiene solucion u
nica. Si el supuesto se
incumple, (X) < k, entonces las columnas de la matriz X son linealmente
dependientes, (X X) < k y el sistema de ecuaciones normales tiene soluciones
multiples. El termino multicolinealidad hace referencia a la existencia de una o
mas relaciones lineales exactas o perfectas entre las variables explicativas.
3. El supuesto k < n indica que el nu
mero de observaciones es mayor que el
nu
mero de parametros a estimar. Si k > n, entonces (X) n, (X X) n, y
el sistema de ecuaciones normales tendra soluciones multiples.
4. Momentos muestrales nitos. El elemento generico de X X dividido por n es
n
\
Xih Xj h
n
h=1
39
Otra forma de resumir estas cuatro hipotesis es la siguiente: los errores se distribuyen
identica e independientemente como una normal con media cero y varianza constante
2
2
,
u
iidN
(0,
i
u
u ).
0.4
f (ui) =
0.35
1
2
eui /2
0.3
f (ui )
0.25
0.2
0.15
0.1
0.05
0
-4
-2
0
ui
u2 (
u1 u
E(u ))] = E
...
u
1
.
un
E(u21)
E(u1 u 2 ) . . .
E(u 2 u1 )
E(u1 un )
E(u2 ) . . .
E(u2 un )
.
.
.
..
2
0
.
...
2 . . .
0
.
.
.
..
= 2
u In
E(un u 1 ) E(u n u2 ) . . .
E(u2n )
.
0
...
.
u2
40
y su matriz de varianzas y covarianzas
V (y) = E (y E(y))(y E(y))
= E (y X)(y X)
= E[uu ] = u2 I n
Estimador
de 2
u
u
n
n
n
donde u
= i=1 ui /n es la media muestral. Ahora bien, como las perturbaciones ui no
son observables, el estimador s2u no es calculable.
Para evitar este problema, podemos contemplar los residuos u
i como estimaciones
2
de los errores ui y estimar el parametro u como la varianza muestral de los residuos.
Suponiendo que el modelo de regresion tiene termino
n constante,
2
2
i
i u
)
i=1 u
u
u
2
i=1 (u
=
=
=
u
n
n
n
que se denomina estimador de maxima verosimilitud de la varianza de las perturbaciones.
Alternativamente, y reconociendo que los grados de libertad de la suma de cuadrados
de libertad son n k, podemos proponer el estimador
n
i 2
u
u
i=1 u
2
=
=
u
nk
nk
que se denomina estimador de mnimos cuadrados de la varianza de las perturbaciones.
n 22. La raz cuadrada de
Definicio
2u,
u , se conoce como error estandar de la
regresion.
Ejemplo 1. En el2 modelo de las calicaciones,
n = 10, k = 4 y la suma de cuadrados de los residuos
u u = 6,7027. De aqu,
= 6,7027/10 = 0,67027 y
2 = 6,7027/6 = 1,11712.
u
3.3.
Propiedades estadsticas de
41
realizaciones de la variable aleatoria {Y1 , Y2 , . . . , Yn }. Si {y1 , y2 , . . . , yn} es una realizacion particular de la variable aleatoria {Y1 , Y2 , . . . , Yn }, entonces la estimacio
n
= (y1 , y2 , . . . , yn ) es uno de los muchos posibles valores que puede tomar la variable
= (Y 1 , Y2 , . . . , Yn).
aleatoria
La distribucion de probabilidad conjunta del estimador (Y1 , Y2 , . . . , Yn ) describe
el comportamiento de las estimaciones que se obtendran en el conjunto de posibles
muestras de la poblacio
n {Y1 , Y 2 , . . . , Yn }. Esta distribucio
n se denomina distribucio
n
muestral y puede derivarse de la distribucio
n de probabilidad de {Y1 , Y 2 , . . . , Yn },
2
y N (X, I),
n de probabilidad de
u que a su vez se ha derivado de la distribucio
2
{u 1 , u2 , . . . , un }, u N (0, uI).
del
Teorema 2. Bajo los supuestos ba
sicos, el estimador de mnimos cuadrados
vector de para
metros en el modelo (3.1) tiene una distribucio
n normal multivariante
2
X)1 , que se escribe
con vector de medias y matriz de varianzas y covarianzas (X
u
sucintamente como
N , 2 (X X 1
)
u
n.
Demostracio
j (j = 1, . . . , k) del vector
= (X X) X y es
1. Normalidad. Cada elemento
una combinacion lineal de variables aleatorias independientes Y1 , . . . , Yn con
distribucion normal,
n
\
j =
ci Yi
i=1
X y = X X
X E [y] = X X
X [X] =
X X
X [y E(y)], tenemos
X [y E(y)] [y E(y)] X X X
= X X
X E [y E(y)] [y E(y)] X X X
= X X
X u2 I X X X
= 2u X X
42
Entoces
= w es ma
s eciente que
= w si V () < V (), esto es, si
)w w V (
)w = w V (
) V (
) w
w V (
es una forma cuadratica denida negativa.
La inversa de la varianza de un estimador es una medida de su precision o acuracidad. Cuanto menor sea la varianza del estimador, tanto mas preciso o acurado sera el
estimador, lo que signica que las estimaciones obtenidas en las distintas realizaciones
del experimento aleatorio estaran proximas al parametro que se desea estimar.
Teorema 3 (Teorema de Gauss-Markov). Bajo los supuestos basicos del modelo
es el mas eciente en la clase de esticlasico, el estimador de mnimos cuadrados
madores lineales e insesgados de .
n. La clase general de estimadores lineales esta denida por
Demostracio
= Cy
) = E
E(
)
E(
)
V (
= CE (y E(y)) (y E(y)) C = 2 CC
u
Ahora escribimos
C = D + X X
D + X X X
X X
= DD + X X
V () V () = 2 DD
u
donde vemos que la diferencia de las dos matrices de varianzas y covarianzas es una
matriz semidenida positiva.
43
Observacion 16. El Teorema de Gauss-Markow no hace uso del supuesto de normalidad de las perturbaciones.
n 25. Un estimador i es consistente o converge en probabilidad al para
Definicio
metro
verdadero i si, para todo > 0,
lm P (| i i | ) = 0
(n)
n
(n)
i
en donde
es el estimador calculado con n observaciones. En el caso multidimen del vector de para
sional, el vector de estimadores
metros es consistente si, para todo
> 0,
(n)
lm P (1 1 ) = 0
n
(n)
n=k
plimi = i
p
i
o, equivalentemente, si
(n)
lm sesgo(i ) lm E( ) i = 0
n
(n)
(n)
lm var( ) l m E( i )2 = 0
n
i=1
2
1
lm X X
= 0Q1 = O
lm V () = lm u X X
= lm
n
n n
n n
n
n
n
44
Observacion 17. El estimador de mnimos cuadrados se denomina ELIO para indicar que es un estimador lineal, insesgado y optimo. El adjetivo optimo indica que el
estimador es el mas eciente o el de mnima varianza en la clase de estimadores lineales
e insesgados.
cumple las propiedades estadstiEn resumen, el estimador de mnimos cuadrados
cas de linealidad, insesgadez, eciencia y consistencia. Estas propiedades se consideran
deseables y justican el empleo del metodo de mnimos cuadrados como metodo de estimacion en el marco del modelo lineal general clasico y nuestra preferencia por este
metodo frente a otros metodos de estimacion alternativos.
3.4.
Propiedades estadsticas de
2u y
2u
u
u
= (Mu) Mu = u M Mu = u Mu
Vemos que la suma de cuadrados de los residuos es un estadstico, es decir, una funcion de las variables aleatorias {u1 , u2 , . . . , un }. Su distribucion de probabilidad puede,
por tanto, derivarse de la distribucion de probabilidad conjunta de las perturbaciones
estocasticas {u1 , u2 , . . . , un }.
Teorema 4. La ratio u
u
/ 2utiene una distribucion Chi-cuadrado con n k grados
45
u
i=1
n2
nk
2
u
\
= u Mu =
u P Pu = u u =
ui nk
2
2
2
2
2
u
u
u
i=1
n 25.
2 = u
u
/(n k) es un estimador insesgado de 2 con varianza
Proposicio
2u4 /(n k).
E 2 = (n k)
u
De aqu, E(u
u
) = (n k) 2u y
u
u
E(
u ) = E
nk
2
= 2u
La varianza de z 2m es igual a dos veces los grados de libertad, var(z) = 2m. Por
tanto,
u u
= 2(n k)
var
u2
De aqu, var(u
u
) = 2(n k) 4u y
var(
u2 ) =
var(u
u
)
(n k)2
2u
nk
46
3.5. Resumen
Proposicion 24
=E(tru Mu)
=E(trMuu )
=trE(Muu )
=tr ME(uu )
=tr M( 2 I ) = tr 2 M
u n
u n
= u2 (n k)
8.
2 = u
u
/n es
u
(k/n) 2u.
i=1
= 2utrM
Corolario
i=1
Propiedad: trM = (n k)
un estimador sesgado de 2 , siendo el sesgo B(
2) =
u
n. De la relacio
Demostracio
n entre
2 y
2
u
2 =
se tiene que E(
2 ) = 2 (k/n) 2 .
u
n 26.
Proposicio
u2
n k
u
2
=u
u
/n es un estimador consistente de 2 .
u
n. El estimador
Demostracio
2 converge
en media cuadratica al verdadero parametro
u
1. lmn B(
2 ) = l mn (k/n) 2 = 0
u
2. lmn var(
u2 ) = lmn
2(n k) 4
u = 0
n2
Resumen
47
Regresores no estocasticos
Multicolinealidad
Homocedasticidad
Correlacion serial
3.6.
Ejercicios
k j1
\
\
2
j ,
h )
x jiV ar(j ) + 2
xji xki cov(
j=1
j=2 h=1
k
\
6. Demuestre que
) (
) = (E
) (E
) + E (
E
) (
E
)
E (
=
k
\
sesgo (i ) +
i=1
Prof. Dr. Jose Luis Gallego Go
mez
Departamento de Econom a. Universidad de Cantabria
k
\
var(i )
i=1
Apuntes de Econometra. LADE y LE. Curso 2008-2009.
Material publicado bajo licencia Creative Commons
48
3.6. Ejercicios