Você está na página 1de 14

Censored Data and Truncated Distributions

William Greene

Jhon Ortega Garcia

Censored Data and Truncated Distributions

22 de agosto de 2014

1/1

Contenido

Censored Data and Truncated Distributions

22 de agosto de 2014

1/1

Deniciones Previas
Teoremas
Densidad de una Variable Aleatoria Truncada Sea una funcion de densidad
f (x),y a R, entonces
f (x|x > a) =

f (x)
f (x > a)

(1)

Momentos de una Distribucin Normal Truncada Si f N [, 2 ] y a R,


entonces
E[x|x > a] = + ()
(2a)
(2b)

V ar[x|x > a] = 2 [1 ()]

donde = (a )/ , () es la funcin de densidad normal estandar y


() =

()
()
si x > a
() =
si x < a
1 ()
()
() = () [() ]
Censored Data and Truncated Distributions

22 de agosto de 2014

2/1

Especicacin I
Sea una variable aleatoria no observable (latente),
Yi = X0i + i , i N [0, 2 ] i = 1, ..., N

cuya funcion de log.verosimilitud es:


ln L =


N 
X
2
1
1
Yi X0i /
ln 2 ln
2
2
i=1

Analizando un subconjunto de la variable latente denido como:

Especicacin
Yi = Yi

si Yi 0

Yi es no observada

si Yi < 0

Censored Data and Truncated Distributions

22 de agosto de 2014

3/1

Especicacin II

Podemos notar que el supuesto de normalidad no se cumple i X0


De las deniciones previas (2a) y (2b) sabemos que(reemplazando):
E[x|x > a] = + ()


E [Yi |Xi ] = E [Yi |Xi , Yi 0] = X0i + E i |i X0i
= X0i +

(X0 /)
1 (X0 /)

si escribimos
E [Yi |Xi ] = X0i + i

donde:
i =

(X0i / )
X0i /

1(

V ar[x|x > a] = 2 [1 ()]

(X0i / )
(X0i / )

El estimador de minimos cuadrados es insesgado e inconsistente,


puesto que la regresin no consideraria la no linealidad de i
La truncacin tiene el efecto de reducir la variacion en la poblacin

truncada.

Censored Data and Truncated Distributions

22 de agosto de 2014

4/1

Funcion de Log verosimilitud

De la denicion de una variable aleatoria truncada (1),tenemos que la


funcin de log verosimilitud es:

Log verosimilitud
ln L =

N
X
i=1


ln

(1/)((Yi X0i )/)


(X0i /)

A partir de la transformacion de Olsen(1978), podemos hallar la condicion


de 1er orden de la funcin de log verosimilitud y tendremos la matriz de
covarianzas asintoticas en funcion de y mediante el mtodo Delta:
b 0 ] = G Asy. V ar[(b
b 0 ] G0 G =
Asy.V ar[(b0 , )
0 , )

00

12

1
2

Dado que el modelo de regresion truncado no es lineal la interpretacion no


es directa, sin emargo se puede halar que los efectos marginales son:
E[Yi |Xi ]
= i
Xi
Censored Data and Truncated Distributions

22 de agosto de 2014

5/1

Especicacin I
Suponiendo otra vez una relacin lineal entre las variables explicadas y
explicativas, se tiene la siguiente espexicacin:
Yi = X0i + i , i N [0, 2 ] i = 1, ..., N

la cual esta sometida al siguiente proceso de particin y transformacin:


Yi =

j
X

dj Tj (Yi )

j=1

donde Tj (Yi ) particiona el conjunto de valores que puede tomar Yi en j


rangos y congurar valores especicos para cada rango; por otro lado dj
acompaa a los valores ya transformados y toma el valor de uno en caso los
valores correspondan a j y cero en otros casos(es decir, es una variable
dummy).
Censored Data and Truncated Distributions

22 de agosto de 2014

6/1

Especicacin II
De manera similar al caso truncado, obtenemos:
 

E [Yi |Xi ] = X0i / X0i + i

(3)

Notemos que en el caso censurado (X0i /) es la probabilidad asociada a


la regin no censurada.
Como en el caso truncado, la no linealidad de la media condicional
determina que la regresin lineal de Yi sobre Xi es sesgado e
inconsistente.
Los efectos marginales son obtenidos usando los primeros resultados:
E[Yi |Xi ]
=
Xi

X0i

Censored Data and Truncated Distributions

22 de agosto de 2014

7/1

Estimacin e Inferencia I
La Log Verosimilitud es una mezcla entre parte discreat y continua.

Funcion de Log Verosimilitud


ln L =

N
X
i=1






Yi X0i
X0i
1

+ d2 (Yi )
ln d1 (Yi )

Dado que Amemiya(1978) mostr que esta log verosimilitud puede ser
manipulada por tecnicas estandar y ayudandonos de las transformaciones
de Olsen(1978) obtenemos:
 X
X 1
2


2

0
ln L =
ln 2 ln + Yi Xi
+
ln 1 X0i
2
Yi >0

Yi =0

donde: = 1/ y = /
Censored Data and Truncated Distributions

22 de agosto de 2014

8/1

Estimacin e Inferencia II

la matriz de covarianzas asintoticas en funcion de y mediante el


mtodo Delta:
b 0 ] = J Asy. V ar[(b
b 0] J 0 J =
Asy.V ar[(b0 , )
0 , )

00

12

1
2

La regularidad emprica demuestra que los estimadores maximo


verosimiles pueden ser aproximados por la divisin de los estimados
MCO por la proporcion de observaciones no limite en la
muestra.M V M CO /pnl
La inferencia puede ser realizada por los mtodos estandar(Razn de
Verosimilitud, Multiplicadores de Lagrange y Wald)
Para la realizacin de predicciones tiene ms sentido usar la media
condicionada (3)
Es muy usado como medida de ajuste pseudo R2 = 1 ln L/ ln L0 ,
donde L es la log verosimilitud de la especicacin con todos los
parametros y L0 es la log verosimilitud del modelo solo con constante,
sin embargo, es muy debatible su uso.
Censored Data and Truncated Distributions

22 de agosto de 2014

9/1

Anlisis de Especicacin I
Si interpretamos el censuramiento como una solucion de esquina,
podriamos preguntarnos si la probabilidad de que ocurra una eleccin de
esquina es la misma que una solucin no de esquina. Paraa estudiar esto se
puede escribir la logverosimilitud para el modelo de solucin de esquina:
ln L = ln

 X


ln X0i +
ln X0i

Yi =0

= ln

Yi >0

ln X0i + ln


Yi =0

X
Yi >0


ln X0i +

Yi =0

ln

X0i

ln

ln X0i

Yi =0

Censored Data and Truncated Distributions

22 de agosto de 2014

10 / 1

Anlisis de Especicacin II

El test que verique el caso en estudio sera un test que compare


estadisticamente si los coecientes estimados por un modelo probit son los
mismos que del modelo de regresion truncado para obervaciones no limites.
Fin y Schmid(1984)proponen un test de multiplicador de lagrange
basadoen los resultados del modelo Tobit.


LR = 2 ln Lprobit + ln Ltruncada ln Ltobit

el cual tendr una dsitribucin Chi-cuadrado con grados de libertad igual al


nmero de variables.

Censored Data and Truncated Distributions

22 de agosto de 2014

11 / 1

Heterocedasticidad
Se podria especicar una logverosimilitud:
ln L =

N
X
i=1






X0i
Yi X0i

1
ln d1 (Yi )
+ d2 (Yi )
i
i
i

suponiendo que la heterocedasticidad es pura, se puede especicar una


funcin para la varianza en funcin de las variables correlacionadas con
b2
0
como: i = exp X i bastar con probar la signicancia estadstica
de .
Notemos que la especicacin de la varianza tambien puede tener
error de especicacin como cualquier modelo a ser estimado.

Censored Data and Truncated Distributions

22 de agosto de 2014

12 / 1

Heterogeneidad No observada

la heterogeneidad no observada no obervada, siempre en cuando no este


correlacionada con X es benigno. Si la especicaion cambia de:
Yi = X0i + i , i N [0, 2 ] i = 1, ..., N

Yi = X0i + i + i , i N [0, 2 ], N [0, 2 ] i = 1, ..., N

entonces la heterogeneidad pasar a formar parte de la perturbacin con


varianza 2 + 2 .

Censored Data and Truncated Distributions

22 de agosto de 2014

13 / 1