Econ Greene

Censored Data and Truncated Distributions
William Greene
Jhon Ortega Garcia
22 de agosto de 2014
1/1
Contenido
1/1
Deniciones Previas
Teoremas
Densidad de una Variable Aleatoria Truncada Sea una funcion de densidad
f (x),y a R, entonces
f (x|x > a) =
f (x)
f (x > a)
(1)
Momentos de una Distribucin Normal Truncada Si f N [, 2 ] y a R,

entonces
E[x|x > a] = + ()
(2a)
(2b)
V ar[x|x > a] = 2 [1 ()]
donde = (a )/ , () es la funcin de densidad normal estandar y

() =
()
()
si x > a
() =
si x < a
1 ()
()
() = () [() ]
2/1
Especicacin I
Sea una variable aleatoria no observable (latente),
Yi = X0i + i , i N [0, 2 ] i = 1, ..., N
cuya funcion de log.verosimilitud es:

ln L =

N
X
2
1
1
Yi X0i /
ln 2 ln
2
2
i=1
Analizando un subconjunto de la variable latente denido como:
Especicacin
Yi = Yi
si Yi 0
Yi es no observada
si Yi < 0
3/1
Especicacin II
Podemos notar que el supuesto de normalidad no se cumple i X0

De las deniciones previas (2a) y (2b) sabemos que(reemplazando):
E[x|x > a] = + ()

E [Yi |Xi ] = E [Yi |Xi , Yi 0] = X0i + E i |i X0i
= X0i +
(X0 /)
1 (X0 /)
si escribimos
E [Yi |Xi ] = X0i + i
donde:
i =
(X0i / )
X0i /
1(
V ar[x|x > a] = 2 [1 ()]
(X0i / )
(X0i / )
El estimador de minimos cuadrados es insesgado e inconsistente,

puesto que la regresin no consideraria la no linealidad de i
La truncacin tiene el efecto de reducir la variacion en la poblacin
truncada.
4/1
Funcion de Log verosimilitud
De la denicion de una variable aleatoria truncada (1),tenemos que la

funcin de log verosimilitud es:
Log verosimilitud
ln L =
N
X
i=1

ln
(1/)((Yi X0i )/)

(X0i /)
A partir de la transformacion de Olsen(1978), podemos hallar la condicion

de 1er orden de la funcin de log verosimilitud y tendremos la matriz de
covarianzas asintoticas en funcion de y mediante el mtodo Delta:
b 0 ] = G Asy. V ar[(b
b 0 ] G0 G =
Asy.V ar[(b0 , )
0 , )
00
12
1
2
Dado que el modelo de regresion truncado no es lineal la interpretacion no

es directa, sin emargo se puede halar que los efectos marginales son:
E[Yi |Xi ]
= i
Xi
5/1
Especicacin I
Suponiendo otra vez una relacin lineal entre las variables explicadas y
explicativas, se tiene la siguiente espexicacin:
Yi = X0i + i , i N [0, 2 ] i = 1, ..., N
la cual esta sometida al siguiente proceso de particin y transformacin:

Yi =
j
X
dj Tj (Yi )
j=1
donde Tj (Yi ) particiona el conjunto de valores que puede tomar Yi en j

rangos y congurar valores especicos para cada rango; por otro lado dj
acompaa a los valores ya transformados y toma el valor de uno en caso los
valores correspondan a j y cero en otros casos(es decir, es una variable
dummy).
6/1
Especicacin II
De manera similar al caso truncado, obtenemos:

E [Yi |Xi ] = X0i / X0i + i
(3)
Notemos que en el caso censurado (X0i /) es la probabilidad asociada a

la regin no censurada.
Como en el caso truncado, la no linealidad de la media condicional
determina que la regresin lineal de Yi sobre Xi es sesgado e
inconsistente.
Los efectos marginales son obtenidos usando los primeros resultados:
E[Yi |Xi ]
=
Xi
X0i
7/1
Estimacin e Inferencia I
La Log Verosimilitud es una mezcla entre parte discreat y continua.
Funcion de Log Verosimilitud

ln L =
N
X
i=1

Yi X0i
X0i
1
+ d2 (Yi )
ln d1 (Yi )
Dado que Amemiya(1978) mostr que esta log verosimilitud puede ser
manipulada por tecnicas estandar y ayudandonos de las transformaciones
de Olsen(1978) obtenemos:
X
X 1
2

2
0
ln L =
ln 2 ln + Yi Xi
+
ln 1 X0i
2
Yi >0
Yi =0
donde: = 1/ y = /
8/1
Estimacin e Inferencia II
la matriz de covarianzas asintoticas en funcion de y mediante el

mtodo Delta:
b 0 ] = J Asy. V ar[(b
b 0] J 0 J =
Asy.V ar[(b0 , )
0 , )
00
12
1
2
La regularidad emprica demuestra que los estimadores maximo

verosimiles pueden ser aproximados por la divisin de los estimados
MCO por la proporcion de observaciones no limite en la
muestra.M V M CO /pnl
La inferencia puede ser realizada por los mtodos estandar(Razn de
Verosimilitud, Multiplicadores de Lagrange y Wald)
Para la realizacin de predicciones tiene ms sentido usar la media
condicionada (3)
Es muy usado como medida de ajuste pseudo R2 = 1 ln L/ ln L0 ,
donde L es la log verosimilitud de la especicacin con todos los
parametros y L0 es la log verosimilitud del modelo solo con constante,
sin embargo, es muy debatible su uso.
9/1
Anlisis de Especicacin I
Si interpretamos el censuramiento como una solucion de esquina,
podriamos preguntarnos si la probabilidad de que ocurra una eleccin de
esquina es la misma que una solucin no de esquina. Paraa estudiar esto se
puede escribir la logverosimilitud para el modelo de solucin de esquina:
ln L = ln
X

ln X0i +
ln X0i
Yi =0
= ln
Yi >0
ln X0i + ln
Yi =0
X
Yi >0

ln X0i +
Yi =0
ln
X0i
ln
ln X0i
Yi =0
10 / 1
Anlisis de Especicacin II
El test que verique el caso en estudio sera un test que compare

estadisticamente si los coecientes estimados por un modelo probit son los
mismos que del modelo de regresion truncado para obervaciones no limites.
Fin y Schmid(1984)proponen un test de multiplicador de lagrange
basadoen los resultados del modelo Tobit.

LR = 2 ln Lprobit + ln Ltruncada ln Ltobit
el cual tendr una dsitribucin Chi-cuadrado con grados de libertad igual al

nmero de variables.
11 / 1
Heterocedasticidad
Se podria especicar una logverosimilitud:
ln L =
N
X
i=1

X0i
Yi X0i
1
ln d1 (Yi )
+ d2 (Yi )
i
i
i
suponiendo que la heterocedasticidad es pura, se puede especicar una

funcin para la varianza en funcin de las variables correlacionadas con
b2
0
como: i = exp X i bastar con probar la signicancia estadstica
de .
Notemos que la especicacin de la varianza tambien puede tener
error de especicacin como cualquier modelo a ser estimado.
12 / 1
Heterogeneidad No observada
la heterogeneidad no observada no obervada, siempre en cuando no este

correlacionada con X es benigno. Si la especicaion cambia de:
Yi = X0i + i , i N [0, 2 ] i = 1, ..., N
Yi = X0i + i + i , i N [0, 2 ], N [0, 2 ] i = 1, ..., N
entonces la heterogeneidad pasar a formar parte de la perturbacin con

varianza 2 + 2 .
13 / 1

Econ Greene

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Econ Greene

Enviado por

Direitos autorais:

Formatos disponíveis

Censored Data and Truncated Distributions

Jhon Ortega Garcia

Censored Data and Truncated Distributions

Censored Data and Truncated Distributions

Momentos de una Distribucin Normal Truncada Si f N [, 2 ] y a R,

V ar[x|x > a] = 2 [1 ()]

donde = (a )/ , () es la funcin de densidad normal estandar y

cuya funcion de log.verosimilitud es:

Analizando un subconjunto de la variable latente denido como:

Censored Data and Truncated Distributions

Podemos notar que el supuesto de normalidad no se cumple i X0

V ar[x|x > a] = 2 [1 ()]

El estimador de minimos cuadrados es insesgado e inconsistente,

Censored Data and Truncated Distributions

Funcion de Log verosimilitud

De la denicion de una variable aleatoria truncada (1),tenemos que la

(1/)((Yi X0i )/)

A partir de la transformacion de Olsen(1978), podemos hallar la condicion

Dado que el modelo de regresion truncado no es lineal la interpretacion no

la cual esta sometida al siguiente proceso de particin y transformacin:

donde Tj (Yi ) particiona el conjunto de valores que puede tomar Yi en j

Notemos que en el caso censurado (X0i /) es la probabilidad asociada a

Censored Data and Truncated Distributions

Funcion de Log Verosimilitud

la matriz de covarianzas asintoticas en funcion de y mediante el

La regularidad emprica demuestra que los estimadores maximo

Censored Data and Truncated Distributions

El test que verique el caso en estudio sera un test que compare

el cual tendr una dsitribucin Chi-cuadrado con grados de libertad igual al

Censored Data and Truncated Distributions

suponiendo que la heterocedasticidad es pura, se puede especicar una

Censored Data and Truncated Distributions

la heterogeneidad no observada no obervada, siempre en cuando no este

Yi = X0i + i + i , i N [0, 2 ], N [0, 2 ] i = 1, ..., N

entonces la heterogeneidad pasar a formar parte de la perturbacin con

Censored Data and Truncated Distributions

Você também pode gostar

Analizando un subconjunto de la variable latente denido como:

Podemos notar que el supuesto de normalidad no se cumple i X0

De la denicion de una variable aleatoria truncada (1),tenemos que la

El test que verique el caso en estudio sera un test que compare

suponiendo que la heterocedasticidad es pura, se puede especicar una

Yi = X0i + i + i , i N [0, 2 ], N [0, 2 ] i = 1, ..., N