Você está na página 1de 13

PARCIAL NUMERO 1

En la base de datos contamos con las siguientes variables:

Mujer: indica si el individuo es de sexo masculino o femenino, con la intuicin de que las
mujeres tienden a ser ms responsables con sus deudas que los hombres esta variable
toma el valor de 0 si el individuo es mujer y 1 si el individuo es hombre y se espera que su
coeficiente tenga signo positivo de manera que si el individuo es hombre aumente su
probabilidad de default.
Empleado: refleja si el individuo se encuentra actualmente trabajando o est
desempleado, la intuicin indica que si el individuo se encuentra desempleado aumentar
su probabilidad de default y por tanto el coeficiente de esta variable es positivo si 0 indica
que el individuo est empleado y 1 que el individuo est desempleado.
Profesional: refleja si el individuo tiene estudios a nivel profesional, la intuicin indica que
una persona profesional tendr menos probabilidades de caer en default, por tanto se
espera que si la variable toma el valor de 0 cuando el individuo es profesional y 1 cuando
no lo es entonces el coeficiente que acompaa esta variable tenga signo positivo.
Edad y Edad2: indica la edad del individuo, la intuicin seala una relacin negativa hasta
cierto punto de la edad con el default, de manera que a mayor edad menos probabilidades
de default tiene el individuo, sin embargo, tambin se espera que a partir de cierto punto
esta relacin cambie y a mayor edad se tenga una relacin positiva con el default, por lo
cual se incluye la variable Edad2 que es la edad al cuadrado.
Mora: indica si el individuo est en mora con su obligacin o no, se espera que tenga una
relacin positiva con el default de manera que si el individuo actualmente est en mora
esto aumente su probabilidad de caer en default.
Saldo: Se refiere al capital que an adeuda el individuo en ese momento. Se espera que
tenga una relacin positiva con el default de manera que a menores saldos por pagar la
probabilidad de default disminuya.
Default: es la variable explicada en indica si el individuo se encuentra actualmente en
default o no, toma el valor de 0 si no est en default y 1 si est en default.

PRUEBAS DE SIGNIFICANCIA:

Mujer: para probar la significancia de esta variable se usa una prueba Chi 2 por ser ms
efectiva en variables de respuesta, la salida de STATA nos muestra:
La prueba nos muestra un p-valor menor a 0,05, por lo tanto con una significancia del 5%
podemos decir que esta variable es significativa para explicar el default. Observamos
tambin que esta prueba confirma la intuicin sobre esta variable pues muestra que la
mayora de los individuos que toman el valor de ceo en la variable mujer, es decir, la
mayora de las mujeres tambin toman valor de cero en la variable default, es decir, no se
encuentran en default.
Empleado: Al realizar la prueba de hiptesis sobre esta variable en STATA obtenemos la
siguiente salida:

Se observa que el p-valor es menor a 0,05 y por tanto a un nivel de significancia del 5%
esta variable es significativa en la explicacin del Default, adems se observa que la
intuicin sobre la variable se confirma pues la mayora de los individuos que estn
empleados (empleo=0) no estn en default (default=0).
Profesional: Al realizar la prueba de significancia sobre esta variable STATA arroja la
siguiente salida:
Se observa un p-valor menor a 0,05, por lo tanto la variable es significativa en la
explicacin del default con un 5% de significancia, adems se observa que la mayora de
los individuos profesionales (profesional=0) no estn en default.
Mora: Al realizar la prueba de significancia sobre esta variable obtenemos:

Puesto que el p-valor de esta prueba es mayor a 0,05 no se tiene evidencia estadstica para
rechazar la hiptesis nula y por tanto la variable no es significativa a un nivel de
significancia del 5%.
Edad: Al realizar la prueba t de significancia a esta variable por ser ms efectiva en
variables continuas STATA arroja el siguiente resultado:
Se observa que el p-valor de la hiptesis nula de que el coeficiente que acompaa la
variable edad sea igual a cero es menor a 0,05 por tanto hay evidencia estadstica para
rechazar la hiptesis nula, por lo cual la variable edad es significativa en la explicacin del
default a un nivel de significancia del 5%.
Edad2: Al realizar la prueba de significancia sobre esta variable se obtiene:

Se observa que el p-valor de la hiptesis nula de que el coeficiente que acompaa a la


variable edad2 sea igual a cero es menor a 0,05, por tanto hay evidencia estadstica para
rechazar la hiptesis nula y la variable edad2 resulta significativa en la explicacin del
default a una significancia del 5%.
Saldo: Al realizar la prueba de hiptesis sobre esta variable se obtiene:
Se observa que el p-valor de la hiptesis nula, de que el coeficiente que acompaa a la
variable saldo es igual a cero, es mayor a 0,05 y por lo tanto no hay evidencia estadstica
para rechazar la hiptesis nula por lo cual a una significancia del 5% la variable saldo no
resulta significativa en la explicacin del default.

MODELOS LOGIT Y PROBIT:


Al correr los modelos Logit y Probit con el default como variable explicada y edad, edad2, mujer,
empleado y profesional como variables explicativas se obtiene el siguiente resultado:

Tipo Resultado Observaciones


Regresin
Probit Se observa
que los
coeficientes
de las
regresiones
son bastante
diferentes, sin
embargo, las
relaciones de
las variables
explicativas
Logit con la variable
default se
mantienen,
adems en
ambos
modelos todas
las variables
resultan
significativas y
fue necesario
suprimir el
trmino de la
constante.

EFECTOS MARGINALES:

Al hallar los efectos marginales en cada modelo obtenemos:


Tipo Resultado Observaciones
Regresin
Probit En ambos modelos un aumento
en la edad significa una
disminucin de la probabilidad
de default y adems con cada
ao ms esa disminucin es
mayor. Ser hombre tiene un
efecto positivo en el default
aumentando las probabilidades
de incurrir en el mismo, ser
desempleado aumenta tambin
Logit las probabilidades del default
pero llama la atencin que las
aumenta en menor medida que
ser hombre en ambos modelos,
por ltimo no ser profesional
aumenta las probabilidades de
caer en default y en ambos
modelos dicho aumento es el
menor. Por ltimo se observa
que las magnitudes de los
efectos marginales no distan
mucho entre un modelo y el
otro.

MATRICES DE CONFUSIN:

Al hallar las matrices de confusin para ambos modelos obtenemos:


Tipo Resultado Observaciones
Regresin
Probit En ambos modelos se observa
un porcentaje de casos
correctamente clasificados muy
similar, adems en ambos
modelos la sensibilidad, es
decir, el porcentaje de casos
que estimados por el modelo
dan default y que en realidad si
fueron default, es de 78,35%.
Por otra parte la especificidad,
es decir, porcentaje de casos
que estimados por el modelo no
caen en default y que en
realidad no caen en default, es
del 88,80%. En ambos modelos
el porcentaje de falsos
negativos, es decir, el porcentaje
de casos que el modelo estim
que caeran en default pero en
Logit realidad no cayeron en default,
es del 11.20%. En ambos
modelos el porcentaje de falsos
negativos, es decir, el porcentaje
de casos que el modelo estim
que no caeran en default pero
si cayeron en default, es de
21.65%.

TEST KOLMOGOROV SMIRNOV:

Al realizar el test para ambos modelos se obtiene:

Tipo Resultado Observaciones


Regresin
Probit En ambos casos el estadstico de
Kolmogorov Smirnov se
encuentra alrededor de 0.68 de
probabilidad de default. Las
grficas reflejan esto tambin
adems de reflejar que ambos
son buenos modelos en la
medida en que la distancia
1

entre la curva de los malos


.8

clientes y la de la los buenos es


Probability <= PIP

bastante alta en un gran


.6

segmento de probabilidad de
default (entre 0.2 y 0.6).
.4 .2
0

0 .2 .4 .6 .8 1
Pr(Default)

0 1

Logit
1
.8
Probability <= PIL
.4 .2
0 .6

0 .2 .4 .6 .8 1
Pr(Default)

0 1

CURVA ROC:

Al realizar la curva ROC para ambos modelos obtenemos:

Tipo Resultado Observaciones


Regresin
Probit Se observa que para ambos
modelos el rea bajo la curva

1.00
ROC es de 0.87, lo que significa
que las estimaciones de ambos
modelos son mucho mejores

0.75
que el azar.
Sensitivity
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


1 - Specificity
Area under ROC curve = 0.8791

Logit
1.00
0.75
Sensitivity
0.50
0.25
0.00

0.00 0.25 0.50 0.75 1.00


1 - Specificity
Area under ROC curve = 0.8792

HISTOGRAMA:

Se halla el histograma para ambos modelos:

Tipo Resultado Observaciones


Regresin
Probit En ambos modelos se observa
una distribucin similar dividida

15
en dos secciones ambas
leptocrticas y asimtricas hacia
la izquierda. La concentracin
de individuos en las segunda
10
seccin de la grfica es menor
que en la primera, lo que indica
Density

que la mayora de individuos


tiene poca probabilidad de caer
5

en default.
0

0 .2 .4 .6 .8 1
Pr(Default)

Logit
15
10
Density
5
0

0 .2 .4 .6 .8 1
Pr(Default)

CLCULO DE LA PRDIDA ESPERADA INDIVIDUAL Y TOTAL:

En STATA se calcula la prdida esperada individual mediante el siguiente cdigo, a saber, gen
PE=PIL*saldo, posteriormente para hallar la perdida esperada total se suman todos los valores de
PE y se obtiene que sta es 19.592.027.688.

LINEAS DE COMANDO UTILIZADAS:

gen edad2=edad*edad
ttest edad, by (Default)

ttest edad2, by (Default)

ttest saldo, by (Default)

tabulate mora Default, chi2

tabulate mujer Default, chi2

tabulate empleado Default, chi2

tabulate profesional Default, chi2

***************************Modelos

probit Default edad edad2 mujer empleado profesional, nocons

logit Default edad edad2 mujer empleado profesional, nocons

******Efectos marginales

mfx

******Matriz de confusion

estat classification

*****estimacion de Probabilidad de incumplimiento para el ltimo modelo estimado

probit Default edad edad2 mujer empleado profesional, nocons

predict PIP

logit Default edad edad2 mujer empleado profesional, nocons

predict PIL

******test Kolmogorov - Smirnov

ksmirnov PIP, by(Default)

ksmirnov PIL, by(Default)

*****grafica KS

distplot line PIP, by(Default)

distplot line PIL, by(Default)

*******Curva ROC y AUCROC

probit Default edad edad2 mujer empleado profesional, nocons

lroc
logit Default edad edad2 mujer empleado profesional, nocons

lroc

*****Distribucin Default y No Default

histogram PIP

histogram PIL

*****calculo perdida esperada individual

gen PE = PIL*saldo

sum PE

total PE

Você também pode gostar