Você está na página 1de 33

PUBLICACIONES DE 4 CURSO

Licenciatura: ECONOMICAS
Asignatura: MODELOS REGIONALES

TEMA 4:

DATOS PANEL: MODELOS ESTTICOS

Autores: Jess Mur; Ana Angulo

Departamento: ANLISIS ECONMICO

Curso Acadmico: 2008/2009

Facultad de Ciencias Econmicas y Empresariales Universidad de Zaragoza

Indice

1- Introduccin. 2- Fuentes de heterogeneidad en conjuntos de datos panel. 3- Estimacin en modelos de datos panel estticos. 4- Contrastes de especificacin en modelos de datos panel estticos. 5- Efectos espaciales en modelos de datos panel.

1. INTRODUCCIN

Se dice que estamos en presencia de un conjunto de datos de panel cuando se dispone, simultneamente, de informacin de corte transversal y de serie temporal. Esto es cuando se dispone de observaciones sobre determinadas caractersticas de un conjunto de agentes (individuos, pases, empresas, etc.) a lo largo de un perodo continuado de tiempo. La recogida de informacin se lleva a cabo, por tanto, en dos dimensiones y, de este modo, se generan mltiples observaciones puntuales para cada unidad econmica.

Generalmente, los paneles de datos se distinguen unos de otros segn su amplitud transversal y temporal. As, los paneles con un nmero muy amplio de observaciones transversales y un nmero de perodos reducido se denominan Paneles Micro. En el caso contrario, nmero de periodos elevado e informacin transversal reducida se conoce con el nombre de Paneles Macro. Por ltimo, en el caso realmente extraordinario de contar con un panel con amplia dimensin tanto temporal como transversal hablaramos de un Campo aleatorio (Random Field).

As mismo, resulta habitual hablar de paneles de datos equilibrados o paneles completos cuando el nmero de observaciones transversales es el mismo para cada perodo temporal.

Comenzaremos presentando una breve descripcin de las principales ventajas, as como de las limitaciones, del uso de muestras de datos de panel en la investigacin econmica en relacin con las bases de datos que slo contemplan una dimensin temporal (series temporales) o individual (corte transversal). Para ello nos basaremos en los trabajos de Hsiao (2000), Klevmarken (1989), Solon (1989) y Baltagi (2001). Entre las principales ventajas hay que destacar las siguientes:

1) Los datos de panel proporcionan menos problemas de multicolinealidad (presente en numerosas ocasiones al utilizar datos de series temporales), ms grados de

4 libertad y, por tanto, mayor eficiencia. En efecto, la utilizacin de datos de panel, como ya hemos comentado, permite utilizar un conjunto de datos ms informativos, en el sentido de que es capaz de recoger con mayor precisin la variabilidad en los datos, tanto la existente entre individuos como la que existe a lo largo del tiempo.

2) Asimismo, la utilizacin de datos de panel permite identificar y medir algunos efectos que no pueden considerarse al utilizar nicamente datos de corte transversal o datos de series temporales. Ben-Porath (1973) sugiere un ejemplo. Supongamos que tenemos datos de corte transversal correspondientes a un determinado nmero de mujeres en el que una variable es la participacin media anual en el mercado de trabajo. Supongamos que una determinada mujer ha participado una media del 50%. Esta cifra ha podido ser generada por dos situaciones diferentes. O bien ha trabajado el 50% de los aos considerados, o bien trabaja a tiempo parcial durante todos los aos. Las implicaciones de ambas situaciones son distintas y slo la utilizacin de datos de panel permitira discriminar ambas situaciones.

3) A diferencia de los datos de corte transversal, una ventaja adicional de los datos de panel radica en la posible modelizacin de efectos dinmicos. Por ejemplo, en los datos de corte transversal podemos determinar qu porcentaje de la poblacin consume un determinado producto en un determinado momento. La utilizacin de datos de panel permite analizar qu porcentaje de personas que consuman un producto siguen hacindolo y quienes han dejado de consumirlo. Un ejemplo de esto que acabamos de mencionar referido al desempleo puede encontrarse en Ashenfelter (1978) y Ashenfelter y Solon (1982).

4) Otra de las ventajas atribuidas a los datos de panel con respecto a los datos de corte transversal es la gran capacidad que ofrecen al investigador de construir y contrastar complicados modelos de comportamiento. De hecho, el anlisis y la modelizacin de la eficiencia tcnica resulta ms interesante realizarla utilizando datos de panel (Baltagi y Griffin, 1988b; Cornwell y otros, 1990; y Kumbhakar, 1990, 1991, 1992, 1993). Adems, es necesario introducir menos restricciones a la hora de estimar modelos de retardos distribuidos usando datos de panel, en relacin con los que son necesarios cuando se utilizan datos de series temporales (Hsiao, 1986).

5) Por otra parte, los datos de panel permiten resolver o reducir la magnitud de un problema economtrico muy importante que, a menudo aparece en los estudios empricos. Nos referimos a la presencia de variables omitidas (inobservadas u observadas con error) que estn correlacionadas con las variables explicativas del modelo. Por ejemplo, consideremos el siguiente modelo de regresin:
' ' yit = + xit + zit + it

i = 1,..., N ;

t = 1,..., T

(1)

donde dada la naturaleza de los datos, utilizaremos dos tipos de subndices: i para los individuos1 ( i = 1,..., N ) y t para el perodo temporal ( t = 1,..., T ) y donde xit y zit son vectores de variables exgenas, donde el trmino de error it se distribuye de forma idntica e independiente sobre i y t con media cero y varianza 2 . En estas circunstancias, es bien conocido que la estimacin MCO proporciona estimadores consistentes de los parmetros del modelo , y . Sin embargo, si suponemos que las variables incluidas en zit son inobservables, y que adems la covarianza entre xit y zit no es cero, (es decir, estn correlacionadas con xit ), entonces los estimadores MCO obtenidos al hacer la regresin de y it sobre xit sern sesgados2.

En estas circunstancia, se puede comprobar como la disponibilidad de datos de panel permite solucionar el problema. Al disponer de observaciones repetidas para un grupo de individuos podemos eliminar el efecto de las variables incluidas en z . Si por ejemplo, zit = zi para todo t (los valores de z permanecen constantes a lo largo del tiempo para un individuo, pero varan entre individuos), podemos tomar las primeras diferencias de las observaciones individuales en el tiempo y obtener:

Utilizaremos el trmino individuos para referirnos a las unidades de corte transversal. Como se ha comentado con anterioridad, tambin puede tratarse de empresas, hogares, pases, etc. Siempre que se omiten variables relevantes se incurre en un problema de sesgadez de los parmetros incluidos salvo que las variables incluidas y las omitidas sean ortogonales.
2

6
yit yi ,t 1 = xit xi ,t 1 + ( it i ,t 1 )
'

i = 1,..., N ;

t = 1,..., T

(2)

De forma anloga, si zit = z t para todo i (los valores de z permanecen constantes entre individuos en un determinado momento del tiempo, pero presentan variacin temporal), podemos tomar desviaciones con respecto a la media entre individuos en un periodo de tiempo y obtener:
yit yt = xit xt + it t '

i = 1,..., N ;

t = 1,..., T

(3)

donde y t =

yit
i =1

, xt =

xit
i =1

y t =

i =1

it

De esta forma, podemos obtener estimadores insesgados y consistentes para , en base a las regresiones (2) y (3). Sin embargo, si nicamente se hubiera dispuesto de datos de corte transversal (T=1) para el primer caso ( zit = zi ), o datos de series temporales (N=1) para el segundo ( zit = z t ), tales transformaciones no se podran haber llevado a cabo. En consecuencia, no se podran obtener estimadores consistentes de a no ser que se contara con instrumentos que estuvieran correlacionados con z, pero incorrelados con x y .

Existen numerosas aplicaciones que permiten ilustrar este punto. Utilicemos, por ejemplo, el trabajo de Baltagi y Levin (1992) en el que se estima la demanda de tabaco en Estados Unidos de 46 estados durante 25 aos. Concretamente, se modeliza el consumo como una funcin de la renta, los precios y el consumo retardado. Estas variables varan entre estados y en el tiempo. Sin embargo, hay muchas otras variables que pueden ser invariantes en el tiempo o entre estados y pueden afectar al consumo. Ejemplos de las primeras (invariantes en el tiempo) seran la religin o la educacin. Entre las segundas podra citarse la publicidad sobre radio o televisin que, normalmente, relaciona negativamente el consumo de tabaco con la salud. La

7 informacin referente a dichas variables es difcil de obtener y, en consecuencia, su omisin conlleva problemas de sesgos en las estimaciones, a no ser que se explote la naturaleza de los datos panel para eliminar sus efectos.

6) Finalmente, los datos de panel se recogen a nivel de micro-unidades como individuos, empresas u hogares (familias), eliminndose los sesgos causados principalmente por la agregacin de individuos, empresas o productos (Blundell, 1988, Klevmarken, 1989 y; Blundell y Meghir, 1990).

Entre las limitaciones de los datos de panel hay que destacar las siguientes:

i) Problemas asociados al diseo y recogida de la informacin. Kasprzyk y otros (1989) ofrecen una extensa discusin sobre esta problemtica. En cualquier caso, entre estos problemas podemos citar la posible no representatividad de la muestra elegida, las posibles no respuestas por falta de cooperacin de los entrevistados, el que el entrevistado no recuerde con exactitud su comportamiento, etc. (Bailar, 1989).

ii) Distorsiones debidas a errores de medida. Kalton y otros (1989) indican que los errores de medida surgen a causa de respuestas falsas que, por su parte, son fruto de respuestas ambiguas, errores de memoria, mentiras deliberadas de los encuestados (sesgo de prestigio) o bien debidos a los sesgos que puede introducir el propio encuestador.

iii) Una tercera limitacin hace referencia a los posibles problemas de seleccin. En ocasiones, es el propio investigador el que establece una especie de autoseleccin, por ejemplo cuando slo estamos interesados en aquellos que consumen por encima de un determinado nivel, con lo que artificialmente estamos truncando la muestra con los consiguientes problemas que eso puede traer consigo (Hausman y Wise, 1979). Otro problema asociado con la seleccin hace referencia a la posible no respuesta debido a que el encuestado rechaza participar o no est en casa, etc, aunque esto slo ocurre en la etapa inicial de la recogida de datos. Finalmente, destacamos el problema de lo que se

8 denomina atricin que, en cierto modo, tambin se puede catalogar como no respuesta pero una vez que el panel est en funcionamiento. De las personas que originalmente participan algunos pueden renunciar voluntariamente o bien se desplazan del lugar, o bien mueren. En estas ocasiones, suelen sustituirse por personas de similares caractersticas. Bjrklund (1989) y Ridder (1990, 1992) proporcionan una descripcin detallada de las consecuencias de la atricin.

iv) Finalmente, la ltima limitacin hace referencia a que en la mayora de los casos la dimensin temporal del panel es generalmente reducida. Ello hace que la mayor parte de los argumentos asintticos utilizados en los procedimientos de estimacin e inferencia recaigan casi exclusivamente en el nmero de individuos encuestados. En la mayor parte de los casos, la reducida dimensin temporal de los paneles tienen mucho que ver con el coste de obtencin de los datos. Adems, incrementar la dimensin temporal puede aumentar tambin los problemas de atricin que acabamos de mencionar.

Un concepto importante en el contexto de datos de panel es lo que se denomina

heterogeneidad y, asociada a ella, sesgo de heterogeneidad. Como en todo tipo de


modelizaciones, un modelo de datos de panel pretende explicar una variable a travs de las variables ms importantes, excluyendo ciertas variables cuyo impacto es menos significativo o peculiar de ciertos individuos. En estas circunstancias, la suposicin tpica de que una variable econmica y es generada por una funcin de distribucin probabilstica P(y|), donde es un vector real idntico para todos los individuos y perodos puede no ser realista. Es decir, el ignorar efectos especficos de individuos y tiempo que existen entre las unidades de tiempo o del corte transversal, y que no se capturan con las variables incluidas en el modelo, puede conducirnos a la presencia de heterogeneidad de los parmetros del modelo especificado. Es decir, la estimacin del modelo general, sobre la base del total de las NT observaciones:
' yit = + xit + it

i = 1,..., N ;

t = 1,..., T

(4)

puede conducir a importantes sesgos de heterogeneidad si, por el contrario, es conveniente diferenciar los parmetros en el tiempo o entre individuos.

En general, se pueden distinguir las siguientes formulaciones:

1) Los coeficientes de las pendientes son constantes, pero el trmino independiente vara entre individuos:
' y it = i + xit + it

i = 1,..., N ;

t = 1,..., T

(5)

Esta formulacin dar lugar a los modelos de componentes de error en una direccin.

2) Los coeficientes de las pendientes son constantes, pero el trmino independiente vara entre individuos y tiempo:
' yit = it + xit + it

i = 1,..., N ;

t = 1,..., T

(6)

Esta formulacin dar lugar a los modelos de componentes de error en dos direcciones.

3) Todos los coeficientes varan entre individuos:


' yit = i + xit i + it

i = 1,..., N ;

t = 1,..., T

(7)

4) Todos los coeficientes varan entre individuos y tiempo:


' yit = it + xit it + it

i = 1,..., N ;

t = 1,..., T

(8)

En todos los casos, se asume que el trmino de perturbacin it cumple las hiptesis bsicas; es decir, se supone distribuido de forma idntica e independiente sobre individuos y sobre el tiempo, con media 0 y varianza 2 .

Ilustremos con los siguientes grficos los posibles sesgos al estimar el modelo (4) (con parmetros homogneos), cuando lo correcto habra sido especificar, por

10 ejemplo, el modelo (5) (pendientes constantes y diferentes trminos independientes), suponiendo que consideramos una nica variable explicativa:

Donde cada elipse representa la nube de puntos para un individuo en el tiempo y, la lnea recta que la atraviesa representan la regresin individual. Por otro lado, la lnea ms gruesa representa la lnea de regresin correspondiente al modelo (4).

Sin embargo entre los modelos 5-8, son los dos primeros los que generalmente son utilizados en el marco de datos de panel. Es decir, lo habitual es incorporar heterogeneidad a travs del trmino independiente. En consecuencia, el efecto de un cambio en las variables explicativas es el mismo para todos los individuos y perodos,

11 pero el nivel medio puede variar entre individuos (en 5) o entre individuos y tiempo (en 6).

Como ya se ha indicado, el supuesto bsico de estos modelos radica en el hecho de que el efecto de todas las variables omitidas se recoge a travs de tres tipos de variables: 1. Variables idnticas a lo largo del tiempo para cada individuo, pero que varan entre individuos. Por ejemplo, los atributos de la direccin de una empresa, la habilidad, el sexo as como muchas otras variables sociodemogrficas.

2. Variables idnticas para todos los individuos en un perodo de tiempo, pero que varan en el tiempo. Dentro de ellas, se podran considerar variables tales como los precios, el tipo de inters o el ambiente de pesimismo u optimismo de una economa en un momento del tiempo.

3. Variables que varan tanto entre individuos como en el tiempo. Algunos ejemplos podran ser los beneficios de una empresa, las ventas o el stock de capital.

Las cuales se pueden ver reflejadas a travs del trmino independiente variable del modelo especificado.

Concluiremos esta seccin mostrando la especificacin propuesta por Hoch (1962) para estimar una funcin de produccin con datos de panel. Se parte de la tpica funcin de produccin de tipo Cobb-Douglas: yit = + 1 x1it + ... + k xkit + vit , donde y es el logaritmo del output y x1, ...,xk son los logaritmos de los inputs. A continuacin, se trata de solventar la crtica habitual relativa al hecho de haber ignorado variables que reflejan diferencias en las estrategias de direccin de las empresas, diferencias en tecnologa, etc., as como otro tipo de variables que afectan a la productividad de todas

12 las empresas pero que fluctan en el tiempo. En consecuencia, se deberan introducir dichas variables que podemos denotar, respectivamente, como Mi y Pt en el modelo (9), obteniendo:

yit = + 1 x1it + ... + k xkit + M i + Pt + it

(9)

Sin embargo, dado que las variables definidas como Mi y Pt son habitualmente no observadas, su efecto se traduce en un trmino independiente que vara entre empresas y/o tiempo tal y como se defini en las ecuaciones (5) y (6). De esta forma, se demuestra en el trabajo mencionado que teniendo en cuenta la heterogeneidad entre empresas y periodos se mejora la especificacin del modelo, dado que se reduce o se evita el sesgo por omisin de variables relevantes.

Por ltimo, cabe mencionar que los efectos especficos de los individuos y/o del tiempo recogidos en i o it en las ecuaciones (5) y (6), pueden tratarse como fijos o como aleatorios, dando lugar a dos tipos diferentes de modelos:

Si se les trata como parmetros desconocidos fijos, se obtiene el modelo de


efectos fijos.

Si por el contrario, asumimos que, aunque tales trminos independientes


difieren entre individuos y/o tiempo, puede considerarse que proceden de una
2 distribucin de media y varianza , se obtiene el modelo de efectos

aleatorios, donde los efectos individuales i o it son tratados como


aleatorios.

El enfoque de efectos fijos est condicionado a los valores de i o it ; es decir, la distribucin de la variable endgena se condiciona al valor de dichos parmetros, los cuales pueden estimarse. Por el contrario, el enfoque de efectos aleatorios no est condicionado a los valores individuales i o it sino que los integra. En trminos formales:

13
' Efectos fijos: E yit xit i = xit + i ' Efectos aleatorios: E yit xit = xit

' E yit xit it = xit + it (10)

Por este motivo los modelos de efectos fijos se obtienen en base al enfoque condicional del modelo, mientras que los modelos de efectos aleatorios en base al enfoque incondicional. Adems, como ya se ha mencionado para ambos modelos (de efectos fijos y aleatorios) se habla de modelos de componentes del error en una direccin (one-way) cuando se incorpora el trmino i (ecuacin 5, solo variacin entre individuos), mientras que se habla de modelos de componentes del error en dos direcciones (two-way) cuando se incorpora el trmino it (ecuacin 6, variacin entre individuos y tiempo). A continuacin, procederemos a su definicin.

2. ENFOQUE CONDICIONAL: EL ESTIMADOR INTRAGRUPO

El modelo de efectos fijos es simplemente un modelo de regresin lineal cuyos trminos independientes varan entre individuos y/o tiempo. Consideraremos en primer lugar, el modelo (5) que incorpora, nicamente, la variacin entre individuos, y que recibe el nombre de modelo de componente del error en una direccin, dedicando un segundo epgrafe ms breve al modelo (6) o modelo de componente del error en dos

direcciones.

2.2 MODELO DE COMPONENTE DEL ERROR EN UNA DIRECCIN

Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresin lineal cuyos trminos independientes varan entre individuos:

' y it = i + xit + it

it ~ IID(0, 2 )

(11)

14

donde xit es un vector de variables explicativas de dimensin K (es decir, recoge la observacin it de las K variables explicativas consideradas), que se asumen independientes de it ; y donde i recoge el efecto de aquellas variables propias del individuo i que permanecen constantes en el tiempo y, que muy probablemente se encuentran correlacionadas con las variables incluidas en xit .

En notacin matricial:

1 x1 y1 T 0 0 2 x2 y2 0 0 T . . . = . 1 + 2 + ... + N + . + . . . . . . . y 0 T 0 N xN N

(12)

siendo:

yi

(T x 1)

yi1 . = . . ; y iT

T ' = (1, 1,..., 1)


(1xT )

xi

(T x K )

xi'1 x1i1 ' xi 2 x1i 2 . . = = . . . . x' x iT 1iT

x2i1 x2i 2

x2iT

x Ki1 ... x Ki 2 ; ... x KiT ...

(Kx1)

1 2 . = . . K

15

i ' = ( i1 , i 2, ..., iT , )
(1xT )

con E i = 0 ,

[ ]

E i i = 2 I T
'

[ ]

E i j = 0 si i j
'

[ ]

siendo I T la matriz identidad de orden T (T x T).

Es decir, cada ecuacin i-sima, es de la forma:

yi = T i + xi + i

i=1,...,N

Esto puede escribirse en el marco del modelo de regresin tradicional mediante la inclusin de una variable ficticia para cada unidad i en el modelo:
' y it = j d ij + xit + it j =1 N

(13)

donde d ij = 1 si i = j y 0, en otro caso. Es decir, se incluyen N variables ficticias en el modelo, tantas como individuos. Los parmetros 1 ,..., N y pueden estimarse por mnimos cuadrados ordinarios, a partir de (13). A los estimadores as obtenidos se les denomina estimador de variable ficticia de mnimos cuadrados.

Sin embargo, dado que normalmente N (la dimensin transversal) es elevada, la regresin resultante (13) est constituida por un nmero muy elevado de regresores, lo cual resulta poco atractivo. No obstante, afortunadamente los estimadores contenidos en

pueden obtenerse de forma ms sencilla, efectuando una regresin sobre las variables
obtenidas como desviaciones respecto a las medias individuales. Bsicamente, esto equivale a una transformacin de los datos que implica la eliminacin de los efectos individuales i . Para analizar este punto, a partir de las medias temporales de cada variable se define el modelo:

yi = i + xi + i
'

(14)

16

donde y i =

yit
t =1

, xi =

xit
t =1

y i =

t =1

it

Restando miembro a miembro las expresiones (5) y (14), se obtiene:

yit y i = (xit x i ) + ( it i )
'

(15)

A este modelo se le denomina trasformacin intragrupos. A los estimadores MCO para , obtenidos a partir de este modelo transformado en desviaciones con respecto a las medias individuales se les denomina estimadores intragrupos o

estimadores de efectos fijos (Fixed effect estimators, FE) y, como ya hemos comentado
son idnticos a los obtenidos a partir del estimador de variables ficticias mnimo cuadrtico. Estos estimadores, por tanto, se calculan a partir de la siguiente expresin:

FE

N T ' = (xit x i )(xit x i ) i =1 t =1

(x
N T i =1 t =1

it

x i )( yit y i )

(16)

El procedimiento anterior es equivalente a premultiplicar la ecuacin i-sima:

yi = T i + xi + i
por una matriz Q de orden (T x T), simtrica e idempotente: Q = I T
Q yi = QT i + Q xi + Q i = Q xi + Q i 1 ' T T : T

(17)

(18)

matriz, que aplicada a cualquier vector, lo transforma en desviaciones con respecto a su media (y, aplicado a una matriz, transforma sus columnas en desviaciones con respecto a su media). De esta forma, se elimina el trmino i constante en el tiempo, eliminndose, de esta forma el problema relativo a su probable correlacin con las variables incluidas en xit . Por ejemplo:

17 yi1 yi . Q yi = . y de forma anloga para Q xi y Q i . . yiT yi

Haciendo uso de la nomenclatura anterior, el estimador de efectos fijos que se obtiene al aplicar MCO al modelo transformado es igual a:
1

FE

N ' = xi Q xi i =1

x
i =1

' i

Q yi

(18)

Expresin equivalente a la recogida en (16)3.

En consecuencia, a partir de lo indicado, puede comprobarse como el modelo de efectos fijos se concentra en las diferencias existentes dentro de los individuos. Es decir, se explica hasta qu punto yit se diferencia de la media temporal de esa variable, yi y, por tanto, no explica porque yi es diferente de y j .

Si se asume que todas las variables contenidas en xit son independientes de todos los trminos it , los estimadores de efectos fijos son estimadores insesgados de

. Si adems se impone normalidad para los trminos de perturbacin it , los


estimadores de efectos fijos, EF , tambin siguen una distribucin normal, por lo que puede utilizarse los procedimientos de inferencia habituales. Para consistencia se requiere: E{(xit x i ) it } = 0 (19)
^

Este tipo de estimador es tambin equivalente al que se obtiene al transformar el modelo en primeras diferencias y despus aplicar MCG para corregir el esquema de correlacin tipo MA generado en dicha transformacin.

18 La condicin suficiente para que lo anterior sea cierto es que xit sea estrictamente exgena, lo cual equivale a que: E{xit is } = 0 para

s, t

(20)

es decir, que las variables explicativas no dependan ni de valores presentes, ni pasados ni futuros del trmino de error.

Esta condicin puede resultar muy restrictiva en algunas aplicaciones. Por ejemplo, excluye la inclusin, como explicativa, de la variable endgena retardada as como la inclusin de cualquier variable que dependa de la historia de la propia variable endgena. Un ejemplo de esto ltimo sera el caso de si para explicar la oferta laboral de un individuo se desea incluir en el modelo los aos de experiencia, los cuales dependen de la propia historia laboral del individuo.

Adems, en estas mismas circunstancias (variables explicativas estrictamente exgenas), los N trminos independientes se estiman de forma insesgada como:

i = y i x i ' FE

i = 1,..., N

(21)

si bien, tales estimadores slo son consistentes cuando T .

La matriz de varianzas y covarianzas para los estimadores de efectos fijos FE , suponiendo que it se define de forma idntica e independiente entre individuos y tiempo, con varianza 2 (es decir, hay homocedasticidad y no autocorrelacin), viene dada por:

N T ' ^ V FE = 2 (xit x i )(xit x i ) = 2 i =1 t =1

N ' xi Q xi i =1

(22)

19

Una estimacin consistente de 2 se obtiene a partir de la suma de los cuadrados de los residuos intragrupos dividido entre N (T 1) K , es decir:

1 = N (T 1) K 1 = N (T 1) K

^ 2

^ ^ ' y x i it it FE = i =1 t =1 N T ^ ' ( yit y i ) (xit x i ) FE i =1 t =1 N T 2

(23)

Por ltimo, se debe hacer notar que una formulacin alternativa a (11) consiste en introducir un trmino independiente medio :
' yit = + i + xit + it

(24)

donde ahora y i son constantes fijas, las cuales no son separadamente identificables a no ser que se introduzcan restricciones adicionales. Lo habitual es introducir la restriccin

i =1

= 0 . Entonces el efecto individual i representa la desviacin del

individuo i de la media comn . El estimador del parmetro es idntico al ya conocido. Los estimadores de y i son, respectivamente:

= y x ' FE ;

i = y i x i ' FE

(25)

donde y =

yit
i =1 t =1

NT

x =

x
i =1 t =1

it

NT

2.2 MODELO DE COMPONENTE DEL ERROR EN DOS DIRECCIONES

20

Como ya se ha indicado, este modelo de efectos fijos es un modelo de regresin lineal cuyos trminos independientes varan entre individuos y tiempo:

' ' yit = it + xit + it = i + t + xit + it

(26)

En este caso, para obtener los estimadores de efectos fijos, se debe llevar a cabo una transformacin diferente de tal forma que desaparezcan tanto los efectos individuales i como los temporales t . En este caso, los estimadores resultantes son los que resultan de aplicar MCO a la siguiente ecuacin de variables transformadas:

(y

it

y i y t + y = (xit x i x t + x ) + ( it i t +
'

(27)

donde, como ya se ha definido con anterioridad:

yi =

y
t =1

it

T
N T

es la media temporal;

y =

y
i =1 t =1

it

NT

es la media total;

yt =

y
i =1

it

es la media por individuos.

Y ahora los estimadores de los efectos i y t vienen dados por:

i = ( y i y ) (x i x
^

)' EF
^

(28)

t = ( y t y ) (x t x
^

)' EF
^

21 No obstante, para especificar este tipo de modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles (N elevado, pero T pequeo) este modelo es escasamente utilizado. En estos casos, lo que se suele hacer es incorporar al modelo las correspondientes dummies temporales.

3. ENFOQUE INCONDICIONAL: EL ESTIMADOR GLS

Al igual que en el caso del modelo de efectos fijos consideraremos en primer lugar, el modelo que incorpora, nicamente, la variacin entre individuos (modelo de

componente del error en una direccin), dedicando un segundo epgrafe ms breve al modelo de componente del error en dos direcciones.

3.1 MODELO DE COMPONENTE DEL ERROR EN UNA DIRECCIN

Tal y como se ha comentado con anterioridad, en el modelo de efectos aleatorios los efectos individuales i son tratados como aleatorios y, adems se distribuyen de forma idntica e independiente entre individuos, es decir:
' yit = + xit + i + it , 2 ) it ~ IID(0, 2 ) ; i ~ IID(0,

(29)

donde denota al trmino independiente; i + it es tratado como un trmino de error compuesto de dos componentes: un componente especfico individual (invariante en el tiempo) y otro componente que vara entre individuos y en el tiempo y, que se supone incorrelado temporalmente. Adems, se asume que i y it son independientes entre s e independientes de x js , para todo j y s .

en trminos matriciales: yi = T + xi + T i + i = xi+ + vi siendo xi+ = (T , xi ); ' = , ' ; vi' = (vi1 ,...viT ); y vit = i + it

(29)

22

En consecuencia, teniendo en cuenta los anteriores supuestos, los estimadores MCO de los parmetros y ( ) en la ecuacin (29): N +' + = xi xi = i 1
^

x
i =1

+' i

yi

(30)

son insesgados y consistentes.

Sin embargo, la estructura de componentes del error implica que el trmino de


2 error i + it , presenta una forma particular de autocorrelacin (a menos que = 0 ).

En efecto, la matriz de varianzas y covarianzas del trmino de error para el individuo i,


vi = T i + i , es igual a:
2 + 2 2 . 2 ' = T T E vi vi' = = 2 I T + . . 2 2 ... 2 2 +

( )

2 2 ... +

2 2

(31)

NOTA Una forma muy cmoda de expresar la matriz anterior es la siguiente:


2 ' 2 = 2 I T + = 2 I T + T T T ' T T

+ 2

' T T

' T T

' ' T T 2 2 T T = IT T + T + T 2

' ' T T T T I ya que dadas las propiedades de y se cumple que la potencia r de T T T

dicha matriz es igual a:

23 En consecuencia, las desviaciones tpicas estimadas por los procedimientos habituales aplicado para MCO son incorrectas y, se debe de recurrir a estimadores mnimo cuadrticos generalizados (Generalized Least Square, GLS) para obtener estimadores ms eficientes.

Como en casos anlogos, se utiliza la inversa de la matriz para derivar el estimador GLS de los parmetros de la ecuacin (29):

GLS

N + ' 1 + = x i xi = 1 i

x
i =1

+' i

1 yi

(32)

siendo:
1 =
' ' T T T T 1 1 + = I T 2 2 T 2 T + T ' T T T =

2 1 = 2 IT 1 2 + T 2 =

1 1 ' 1 ' 1 I T T + T T = 2 2 T T T

1 ' Q + T T T

con =

2 2 + T

Por ltimo, teniendo en cuenta que Q transforma los datos en desviaciones con respecto a las medias individuales y que 1 ' TT toma medias individuales, el estimador T

GLS para los parmetros del modelo pueden escribirse como (ver Hsiao, 2003):

GLS

N N ' = xi' Q xi + T (x i x )(x i x ) i =1 i =1 N N ' . xi' Q yi + T (x i x )( y i y ) i =1 i =1

(33)

24

GLS = y GLS x

^ '

A partir de la expresin anterior, se puede comprobar fcilmente como si = 0 se obtiene el estimador de efectos fijos. Adems, dado que 0 si T , los estimadores de efectos fijos y aleatorios son equivalentes para valores elevados de T . Por otra parte, si = 1 , el estimador GLS es simplemente el estimador MCO (y es diagonal).

Por ltimo, destacar que a partir de la especificacin anterior, puede derivarse la siguiente expresin:

GLS = B + (I K ) FE
^ ^ ^

(34)

donde

B = (x i x )(x i x )
^ N '

i =1

(x
N i =1

x )( y i y ) es el estimador entre grupos

(between estimator) de . En otras palabras, este ltimo estimador es el estimador MCO en un modelo de medias individuales: yi = + xi + i + i
'

i = 1,2,..., N

(35)

y donde es una matriz de ponderaciones, la cual es proporcional a la inversa de la matriz de covarianzas de B (ver Hsiao, 2003).
^

En otros trminos, puede observarse como el estimador GLS se obtiene como una media ponderada entre los estimadores entre y dentro de los grupos (between y within group estimadores).

El estimador between ignora cualquier informacin existente dentro de los individuos. Por tanto, el estimador GLS, bajos las suposiciones existentes, es la

25 combinacin ptima entre los dos estimadores y, por tanto, es ms eficiente que cualquiera de ellos4. Concretamente, si las variables explicativas incluidas en (29) son independientes de todos los trminos it y i , el estimador GLS es insesgado. Es un estimador consistente si adems de (19), tambin se cumple que: E{x i it } = 0 y E{x i i } = 0 (36)

(Observar que las condiciones anteriores son tambin el requisito para que sea consistente el estimador between).

Una forma sencilla de calcular el estimador GLS consiste en estimar por MCO el siguiente modelo transformado5:
y 1 1 2 y = 1 1 12 + x 1 1 2 x + u i i it it it
'

(37)

donde uit es un trmino de perturbacin aleatorio que carece de autocorrelacin. De nuevo, observar que si = 0 , se obtiene el estimador entre grupos o estimador within y si = 1 , el estimador MCO.

2 y Finalmente, indicar que como es habitual los componentes de la varianza

2 son desconocidos en la prctica. En consecuencia, tras estimar dichos trminos en


una primera etapa, se derivan, en una segunda etapa, los estimadores GLS factibles. El estimador de 2 se obtiene fcilmente a partir de los residuos de la regresin dentro de grupos (within), tal y como se muestra en la expresin (23). Por ltimo, un estimador

El estimador MCO (obtenido con pero no la eficiente.

= 1 ) es tambin una combinacin lineal de los dos estimadores,


1

Lgicamente, a este modelo se llega obteniendo la matriz R, tal que


1 2

R ' R , la cual es igual a

1 1 ' = IT 1 2 TT , y premultiplicando el modelo original (29) por dicha matriz. T

26
2 consistente de se obtiene teniendo en cuenta que la varianza del error de la regresin
2 entre grupos (between) es igual a +

1 2 , la cual puede estimarse consistentemente T

como:

B =
^

^ 2

N ^ ^ 1 ' yi B xi B N (K + 1) i =1

(38)

donde B es el estimador between para . En consecuencia: 1 ^2 = B T


^ 2 ^ 2

(39)

Al estimador GLS Factible (mnimo cuadrtico generalizado factible) se le conoce como estimadores de efectos aleatorios (random effects estimator) para y y, se denota como RE .
^

Bajo ciertas condiciones de regularidad dbil, el estimador de efectos aleatorios es asintticamente normal y, su matriz de varianzas y covarianzas viene dada por la siguiente expresin:
N N ' ^ 2 ' V RE = xi Q xi + T (x i x )(x i x ) i =1 i =1 1

(40)

que muestra como el estimador de efectos aleatorios es ms eficiente que el de efectos fijos si se cumple que > 0 . La ganancia en eficiencia es debida a la utilizacin de la variacin entre grupos (x i x ) .

En resumen, hasta el momento presente, hemos presentado una serie de estimadores del vector de parmetros . Los bsicos son dos: el estimador entre grupos (o between) y el estimador de efectos fijos (o within). Los otros dos estimadores son el estimador MCO y el de efectos aleatorios. Ambos explotan las dos dimensiones

27 de los datos (between y within), pero mientras que el primero lo hace de forma ineficiente, el segundo lo realiza de forma eficiente.

3.2 MODELO DE COMPONENTE DEL ERROR EN DOS DIRECCIONES

De forma anloga a lo comentado para el caso del modelo de efectos fijos, en este caso se trata de incorporar los efectos temporales t , pero tambin con la caracterstica de ser considerados de naturaleza aleatoria, distribuidos de forma idntica e independiente:
' ' yit = + xit + it + it = + xit + i + t + it

(41)
2 ); t ~ IID(0, 2 ); it ~ IID(0, 2 ) i ~ IID(0,

Adems, igualmente se asume que i , t y it son independientes entre s e independientes de x js , para todo j y s .

A partir de aqu puede seguirse un proceso anlogo al anterior, aunque ms complejo. (Vease Baltagi, 2001, por ejemplo). En cualquier caso, la estrategia ms sencilla es aplicar MCO al modelo original transformado mediante la premultiplicacin de las distintas variables por la correspondiente matriz R. Dicha transformacin es la siguiente (lo ilustro para la variable dependiente, sera anlogo para el resto):

* yit = yit 1 y i 2 y t + 3 y

2 N + 2

(42)

siendo

1 = 1

; 2 T + 2

2 = 1

3 = 1 + 2 +

2 + 2 T + N 2

28

Sin embargo, como ya se coment con anterioridad, para especificar este tipo de modelo se requiere que tanto T como N sea elevado. En consecuencia, dado que en la mayor parte se trabaja con micropaneles (N elevado, pero T pequeo) este modelo es escasamente utilizado. Como se coment con anterioridad, lo que se suele hacer es incorporar al modelo las correspondientes dummies temporales.

4. ANLISIS DE ESPECIFICACIN

Tanto el modelo de efectos fijos como el de efectos aleatorios asumen que it es incorrelado entre individuos y en el tiempo (no autocorrelacin). Sin embargo, como en el caso de los modelos de regresin conocidos, si tal supuesto no se cumple, aunque los estimadores estndares siguen siendo consistentes, se invalida la inferencia realizada a partir de los tradicionales contrastes. Adems, los estimadores dejan de ser eficientes. Adems, de forma extensiva, la presencia de heteroscedasticidad en it (o, para los modelos de efectos aleatorios en i ) tiene efectos anlogos. Como consecuencia de las implicaciones sealadas es importante asegurarse de que nuestro modelo no presenta ninguno de los dos problemas indicados, es decir, ni problema de autocorrelacin ni de heteroscedasticidad.

4.1 MODELO DE EFECTOS FIJOS

En el caso del modelo de efectos fijos, los contrastes son sencillos, dado que es bsicamente un modelo estimado por MCO. Un contraste bastante simple de autocorrelacin en el modelo de efectos fijos est basado en el contraste de DurbinWatson (DW). En consecuencia, se contrasta la hiptesis nula de no autocorrelacin

29 frente a hiptesis alternativa que el trmino de perturbacin para cada individuo sigue un esquema AR(1), es decir:

it = i ,t 1 + it

(43)

donde it se encuentra idntica e independientemente distribuido entre individuos y tiempo.

En consecuencia, se contrasta autocorrelacin en el tiempo con la restriccin de que todos los individuos tienen el mismo coeficiente de autocorrelacin . Lgicamente, la hiptesis nula se plantea como H 0 : = 0 , frente a la alternativa de una cola < 0 o > 0 .

La generalizacin del estadstico de Durbin-Watson al caso que nos ocupa fue propuesta por Bhargava, Franzini y Narendranathan (1982) y, sigue la siguiente expresin:
^ ^ it i ,t 1 dw p = i =1 t =2 N T ^ N T 2


i =1 t =1

(44)

it

donde it son los residuos de la regresin within.

En este caso, los anteriores autores tambin derivaron los puntos crticos que, lgicamente, ahora dependen de los valores de N , T y K . Adems, al contrario que en el caso de series temporales, las zonas de indeterminacin para el estadstico de DW para datos de panel son muy pequeas, particularmente cuando el nmero de individuos en el panel es elevado.

30 De forma anloga, para contrastar heteroscedasticidad en el trmino de perturbacin it , se puede utilizar tambin la serie de residuos de efectos fijos it para calcular el contraste de tipo de multiplicadores de Lagrange desarrollado por BreuschPagan. Lgicamente, se contrasta la hiptesis nula de homocedasticidad frente a la alternativa de que
' V { it } = 2 h zit ^

( )

(45)

donde h es una funcin continuamente diferenciable, desconocida y, que al evaluarla en 0 se obtiene la unidad, h(0 ) = 1 . Este ltimo requisito permite que la hiptesis nula se plantee como H 0 : = 0 .

El estadstico de prueba se construye a partir de los resultados de la estimacin de una regresin auxiliar que regresa el cuadrado de los residuos de la estimacin de efectos fijos (o residuos within), it , sobre una constante y sobre las J variables zit
2 ^

que consideramos que pueden estar generando el problema de heteroscedasticidad. Bajo la hiptesis nula, el estadstico de Breusch-Pagan se calcula como N (T 1) veces el R 2 de la anterior regresin auxiliar y, se distribuye asintticamente como una distribucin

2 con J grados de libertad.

No obstante, para este tipo de modelos (modelos de efectos fijos), una estrategia muy utilizada consiste en utilizar la propuesta de Arellano (1987) consistente en utilizar la correccin de White que permite obtener una estimacin de la matriz de varianzas y covarianzas asinttica de los estimadores within-groups robusta tanto ante problemas de heteroscedasticidad y correlacin serial de cualquier tipo, para valores fijos de T y N grande (caso ms habitual) que viene dada por la siguiente expresin:

^ N ' V EF = xi Q xi i =1
^

N ' x Q Q x i i i x i Q xi i =1 i =1
N ' i ^ ^ '

(43)

31

donde i = Q yi Q xi FE son los residuos del modelo within estimado.

No obstante, si uno desea realizar supuestos acerca de ciertas formas de heterocedasticidad o autocorrelacin, es posible derivar estimadores ms eficientes explotando la estructura de covarianzas del error a travs del estimador MCGF, exactamente igual que en los modelos conocidos.

4.2 MODELO DE EFECTOS ALEATORIOS

La mayora de los contrastes que permiten contrastar los supuestos de homocedasticidad y no autocorrelacin en el marco de modelos de efectos aleatorios son complicados de realizar. No obstante, como el estimador de efectos fijos es consistente incluso cuando realizamos el supuesto de que i se encuentra idntica e independientemente distribuido y es independiente de las variables explicativas, los contrastes para el modelo de efectos fijos pueden ser tambin utilizados en el caso de los modelos de efectos aleatorios.

No obstante, la solucin en estos casos viene por la estimacin por MCGF tras haber adoptado una forma especfica para la matriz de varianzas y covarianzas. Veamos los casos ms generales.

Con respecto a la heterocedasticidad, en estos modelos puede aparecer porque la


2 2 varianza de i vara con i (en consecuencia hemos de hablar de en vez de )o i

porque la varianza de it vara con i (en consecuencia hemos de hablar de 2i en vez de

2 ) o ambos a la vez. En consecuencia la matriz de varianzas y covarianzas del trmino


de perturbacin es ahora:

32

2 E vi vi' = 2i I T + ' = i i T T

( )
1

(44)

2 Y la matriz inversa, i , sigue la expresin (32), sin mas que sustituir y 2


2 y 2i , respectivamente. Igualmente, el estimador GLS de se obtiene al por i

sustituir 1 por i , en dicha ecuacin. Lgicamente, reemplazando

2 y 2 i

(valores desconocidos) por sus estimaciones, se obtiene el estimador GLS Factible, o en dos etapas.

La estimacin de 2i puede efectuarse a partir de la estimacin de la estimacin


^

within. La varianza total puede estimarse a travs de los residuos MCO vit :

vi

^ 2

^ ^ 1 T v v = it i obtenidos a partir de la estimacin (30). A partir de aqu, se T 1 t =1 ^ 2 ^ 2 ^ 2

2 como: i = vi i . puede obtener la estimacin para i

En el caso de autocorrelacin se procede de forma anloga. Tomaremos un esquema de autorrelacin tipo AR(1) como ejemplo. Es decir, supongamos que en el modelo de efectos aleatorios en una direccin expresado en (29):
' yit = + xit + i + it , 2 ) it ~ IID(0, 2 ) ; i ~ IID(0,

(45)

en trminos matriciales: yi = T + xi + T i + i = xi+ + vi (46)

el trmino de perturbacin AR(1):

it

deja de ser independiente y sigue el siguiente proceso

33

it = it 1 + uit

(47)

donde uit se distribuye de forma idntica e independiente con media cero y varianza

2u .

La estimacin de dicho modelo por MCG se basa en idnticos supuestos que los de cualquier otro tipo de especificacin que presenta un problema de autocorrelacin AR(1). Teniendo en cuenta que el modelo transformado mediante la expresin: yit yit 1 = (1 ) + xit xit 1 + (1 ) i + uit
'

(48)

presenta una perturbacin ruido blanco, se puede efectuar un procedimiento iterativo del tipo propuesto por Cochrane-Orcutt consistente, como se recordar, bsicamente en lo siguiente. La primera etapa comienza con la estimacin de utilizando la ecuacin (47) y los residuos de la regresin within. A continuacin, se estima por MCO la regresin (48) resultante tras utilizar el valor de estimado, obteniendo un vector inicial de estimadores. En una segunda etapa, se obtienen unos nuevos residuos within, a partir de tales estimadores, con los que se repite el proceso. As sucesivamente, hasta que se alcance la convergencia.