Você está na página 1de 35

Modelos

De
Elección
Discreta
MPL

LOGIT

PROBIT
Motivación

 Las variables estadística pueden tomar


cualquier valor tanto las explicativas
como las variables explicadas.
 En algunos casos las variables sólo
pueden capturar la presencia o ausencia
del evento, estas pueden surgir como
variables causales en este caso se habla
de las variables “ficticias” y en el caso de
ser causada estamos hablando de
variables “discretas”
Modelos De Elección Discreta.

 Participación en mercado de trabajo.


 Opinión sobre una ley propuesta.
 Compra o no Compra de un bien.
 Área de trabajo escogida por un individuo.
 Centro Comercial elegido.
 Sistema de transporte preferido.
Modelos ........

 Los problemas anteriores se pueden formular a


través de modelos que enlazan decisiones o
resultados con un conjunto de factores, con la
misma filosofia de los modelos de regresión.
 Prob(ocurre J)=Prob(Y=J)
=F[efectos relevantes:parametros].

 Los valores que asume la variable dependiente es


cero en ausencia de y 1 uno en presencia del
evento.
Variables Endógenas Binarias.

 Una variable dependiente dicotómica


mide la presencia o ausencia de
respuesta frente a uno o más estímulos
de una o más variables independientes
cuantitativas o cualitativas.
 El modelo de respuesta discreto consiste
en obtener una combinación lineal de las
variables independientes que permita
calcular la probabilidad de que haya
respuesta para los distintos niveles o
dosis de los estímulos.
Modelos De Elección Binaria Como
Modelos De Regresión.

 Consideremos un conjunto de factores que afectan


la búsqueda de trabajo.
 Prob(Y=1)=f(XB).
 Prob(Y=0)=[1-f(XB)]

 El valor esperado del evento condicionado a un


conjunto de factores sera:

 E(Yi|X)=Prob(Y=1)F(XB)+Prob(Y=0)[1-F(XB)].
Modelos.

 La característica común es que la variable


dependiente produce una respuesta SI o NO; es
decir dicotómica.
 Los enfoque Más usuales son los siguientes.
 MODELO DE PROBABILIDAD LINEAL.
 MODELO LOGIT.
 MODELO PROBIT.
MPL.
 Considere el siguiente
ejemplo Yi Ui Probabilidad

 X ; factores que afecta la 0 -XB 1-Pi


decisión
1 1-XB Pi
 Y=1 si toma la decisión A
TOTAL 1
 Y=0 si toma cualquier otra
alternativa
 E(Yi|x)=XB E(Yi|X)= =0*(1-Pi)+1*Pi=Pi

Var(ui)=(-XB)2(1-Pi)+(1-XB)2*Pi=(XB)(1-XB)

Var(ui)=Pi(1-Pi)
Estimación MPL.

 Estime el modelo por MCO


 Obtenga los Y estimados
 Luego obtenga las ponderadores
wi=Ye(1-Ye)
 Utilice los wi para estimar el modelo por MCP

E(Yi \ Xi)1  E(Yi \ Xi)  Pi1  Pi   wi

Yi 0 Xi ui
  1 
wi wi wi wi
Críticas al MPL.

No cumplimiento de la restricción
de probabilidad. 0  E(Yi \ Xi)  1
Yi
El Coeficiente de Determinación es un
valor cuestionable como medida de la
bondad de ajuste
El termino de error no se distribuye
normalmente su distribución es binomial

El término 𝑢𝑖 es heterocedástico
Críticas

 Los modelos de regresión comunes exigen que la


distribución de la variable dependiente sea normal.
 Si no es normal pero sí continua, se puede intentar
aplicar transformaciones que normalicen la función de
probabilidad.
 Pero esta estrategia no sirve para las variables
discretas.
 Es necesario ampliar la teoría de los modelos de
regresión con variables discretas dependientes
binomiales.
Proceso Binomial

 Se dice que un proceso es binomial cuando sólo se


tiene dos posibles resultados. “éxito” o “fracaso”,
siendo constante la probabilidad a lo largo de una serie
de repeticiones.
 A la variable número de éxitos en n repeticiones se le
denomina variable binomial.
 A la variable aleatoria resultado de un solo ensayo y
con sólo dos valores: 0 para el “fracaso” y 1 para el
“éxito”, se le denomina binomial puntual o distribución
de Bernouilli.
Alternativas.

 Dado las criticas (en especial a que se sale de


los valores restringidos de probabilidad) se han
propuestos otros modelo diferentes a la de
distribuciones binarias.

Pi FDA
1

F ( X  x0 )  P( X  x0 )

0
La FDA de una variable aleatoria X es la probabilidad de que esta tome un valor
menor o igual a xo, donde este es un valor numérico especifico de X
Modelo Alternativos.

 Se propone un modelo que transforme los


valores a una probabilidad y se asocie a una
distribución de probabilidad uniforme y continua
 Pi=F(B0+B1X1i+B2X2i+...+BkXki)
 Entre las alternativa se proponen dos
distribuciones asociadas
 La Normal ==>Probit o Normit
 La Logística.==> Logit
Probit.

 Haciendo zi=-XB
 Tenemos P(Y=1)=F(XB) y P(Y=0)=F(-zi)

zi t 2
1
Pi  F ( zi ) 
2 e

z
dt
Logit

1
Pi  F ( zi )   zi
1 e
 El modelo Logit puede ser estimado por MCO si realizamos
el siguiente procedimiento.

 zi 1 Pi
e  zi e 
zi

e 1  Pi
 Pi 
ln    zi   0  1 X 1   2 X 2  ...   k X k
 1  Pi 
Ajuste

 Para transformar los parámetros Logit a Probit


algunos autores sugieren multiplicar por 
 Amemiya recomienda Multiplicar el parámetro
Logit por (1/1.6)=0.625
 Para transformar los parámetros Logit estimados
equivalentes a los parámetros del MPL se sugiere
multiplicar por 0.25Blogit , pero menos la
constante.
 El en caso de la constante se multiplica el
parámetro Logit por 0.25 y se le suma 0.5
Ajuste

 Para transformar los parámetros


estimado del MPL a parámetros Probit se
deben multiplicar por 2.5*BMPL
equivalente al BProbit. Todos menos la
constante.
 En el caso de la constante el valor debe
ser calculado como; 2.5*BMPL -0.5 es
equivalente al BProbit. De la constante
Ajustes.

 MPL  0,25 Logit


 MPL  0,25 Logit  0,5; constante
 probit  0,625  Logit
 probit  2,5 MPL
 probit  2,5 MPL  0,5;constante
Bondad de la estimación

 2(ln LNR  ln LR )  X k 1 2

Prediccion es Correctas
R conteo 
2

Total de Observaciones
LNR
R 2
McFadden´s  1  log
LR
Pendientes.

 i
Pi 
  i Pi (1  Pi )
X i 
  i ( zi )

Donde zi es la función de densidad de la


distribución normal asociada al modelo
ODDS
ODDS =PROBABILIDAD DE ÉXITO/PROBABILIDAD DE FRACASO

Prof. Douglas C. Ramírez Vera


22
ODDS

 La función de densidad de probabilidad de una


variable binomial y de parámetros n y p es

La función de densidad para una variable Bernouilli es

La probabilidad de éxito es p y la de fracaso es q=(1-p); el


cociente entre p/q , indica cuanto es más o menos
probable el “éxito” sobre el “fracaso” esta razón de
probabilidades se conoce como ODDS
Odds=probabilidad de éxito/probabilidad de fracaso=p/q=p/(1-p)
ODDS

 La función de densidad de probabilidad de una variable


binomial y de parámetros n y p es
𝑛 𝑦
𝑓 𝑦 = 𝑦 𝑝 1 − 𝑝 1−𝑦

 La función de densidad para una variable Bernouilli es.


𝑓 𝑦 = 𝑝𝑦 1 − 𝑝 1−𝑦
 La probabilidad de éxito es p y la de fracaso es q=(1-p); el
cociente entre p/q , indica cuanto es más o menos probable
el “éxito” sobre el “fracaso” esta razón de probabilidades se
conoce como ODDS

Odds=probabilidad de éxito/probabilidad de fracaso=p/q=p/(1-p)


ODDS

 Si la probabilidad del éxito es 0.75 y la de


fracaso es 0.25el odds será de 0.75/0.25=3
 Siempre que el odds se mayor a uno (odds>1) la
probabilidad de éxito será mayor a la
probabilidad de fracaso.
 Es posible obtener la probabilidad de éxito a
partir de los odds ya que se cumple la siguiente
relación.
Odds=p/q=p/(1-p)p=odds/(odds+1)

Si el odds es 3  p=3/4=0.75
ODDS RATIO

 En estadística la odds ratio es el cociente de dos razones: En el


numerador es la razón de la probabilidad de que un evento suceda y
la probabilidad de que no suceda bajo ciertas condiciones y en el
denominador es la razón de la probabilidad de que dicho evento
suceda y la probabilidad de que no suceda bajo las condiciones
complementarias. Es una medida de tamaño de efecto.

Casos Controles Total


Expuestos a b a+b
No expuestos c d c+d
Total a+c b+d N

El cociente a/c es la odds de exposición observada en el grupo de casos. El cociente


b/d es la odds de exposición en el grupo control.
ODDS RATIO

 La odds ratio, en un estudio de casos y controles, es


el cociente entre la odds de exposición observada en
los casos (enfermos) y la odds de exposición del
grupo control.
 Lo que en definitiva no es más que una forma de
expresar la proporción de veces que un suceso ocurra
frente a que no ocurra.
 De tal manera que un OR = 3 debemos leerlo como
3:1, es decir dado que un efecto aparece ante la
presencia de otra variable es de 3 veces más que si
esta variable no está presente.
 En el ejemplo de la tabla sería.
𝑎 𝑐
𝑂𝑅 =
𝑏 𝑑
ODDS RATIO

 Los OR no es más que una forma de expresar la proporción de veces que


un suceso ocurra frente a que no ocurra. De tal manera que un OR = 2,5
debemos leerlo como 2,5:1, mejor aún dado que un efecto aparece ante la
presencia de otra variable es de 2,5 veces más que si esta variable no está
presente.
 Pensado esto así, no siempre es fácil traducirlo en probabilidades, una
forma mucho más fácil de entender para quienes hablamos el castellano.
De modo tal que podemos transformar el OR en probabilidades a partir de
la fórmula:
𝑂𝑅
𝑃𝑟𝑜𝑏 =
1 + 𝑂𝑅
 En este caso si el OR fue de 2,5 entonces aplicando la fórmula la
probabilidad es de 0,714, o lo que es igual del 71,4%. Mientras que en el
caso del OR = 1, la probabilidad es del 50%, es decir que existen en este
último caso las mismas probabilidades que el evento ocurra estando o no
la otra variable en estudio presente.
 Existe cierta confusión al homologarlo con el riesgo relativo, que se usa en
estudios prospectivos o de cohorte, el cual en realidad está comparando
dos tasas de incidencia (o probabilidades acumuladas), una con el factor
de exposición presente y otra con el factor de exposición ausente.
Riesgo Relativo (RR)

 El riesgo relativo es en estadística y en epidemiología el


cociente entre el riesgo en el grupo con el factor de
exposición o factor de riesgo y el riesgo en el grupo de
referencia (que no tiene el factor de exposición) como
índice de asociación.
 RR= incidencia acumulada en expuestos/incidencia
acumulada en no expuestos
 En términos de la tabla.
𝑎 𝑎+𝑏
𝑅𝑅 =
𝑏 𝑐+𝑑
Características del riesgo relativo 1/2

 El riesgo relativo es una medida relativa del efecto


porque indica cuánto más veces tiende a desarrollar el
evento en el grupo de sujetos expuestos al factor de
exposición o factor de riesgo en relación con el grupo
no expuesto. Por ejemplo es relativo que Andrés B
sufra de problemas y que Javier A no sufra de ellos
 El riesgo relativo (RR) no tiene dimensiones.
 El rango de su valor oscila entre 0 e infinito.

 Identifica la magnitud o fuerza de la asociación, lo que


permite comparar la frecuencia con que ocurre el
evento entre los que tienen el factor de riesgo y los
que no lo tienen.
Características del riesgo relativo 2/2

 El RR=1 indica que no hay asociación entre la presencia del


factor de riesgo y el evento.
 El RR>1 indica que existe asociación positiva, es decir, que la
presencia del factor de riesgo se asocia a una mayor
frecuencia de suceder el evento
 El RR<1 indica que existe una asociación negativa, es decir,
que no existe factor de riesgo, que lo que existe es un factor
protector.
 El riesgo relativo no puede utilizarse en los estudios de casos
y controles o retrospectivos ya que no es posible calcular las
tasas de incidencia. En estos casos utilizaremos la odds ratio.
Riesgo Absoluto

 El riesgo absoluto mide la incidencia del daño en la población


total, dicho de otra manera, el riesgo absoluto es la
probabilidad que tiene un sujeto de sufrir un evento a lo largo
de cierto tiempo, mientras que el riesgo relativo compara la
frecuencia con que ocurre el daño entre los que tienen el
factor de riesgo y los que no lo tienen.
 De lo anterior se desprende que la incidencia de una
enfermedad en una población se denomina riesgo absoluto.
Sí definimos enfermedad por éxito o casos.
 Según la tabla el riesgo absoluto de la población total sería
RA=(a+c)/N
 Según la tabla el riesgo absoluto de la población de expuestos es
= a/(a+b)
 Según la tabla el riesgo absoluto de la población de no expuestos
es = c/ (c+d)
Riesgo Absoluto

 El riesgo absoluto puede indicar por ejemplo, la


magnitud del riesgo en un grupo de personas
con una cierta exposición (por ejemplo a una
enfermedad o evento), pero debido a que no
tiene en cuenta el riesgo de “exposición”
(ejemplo enfermedad) en sujetos no expuestos,
no indica si la exposición se asocia a un mayor
riesgo de la enfermedad.
 Por ello es preferible utilizar los ODDS RATIO
Logit y ODDS

 La función logit es una parte importante de la regresión logística


 En matemáticas, especialmente aquellas aplicadas en estadística,
el logit de un número p esta entre 0 y 1
𝑝
𝑙𝑜𝑔𝑖𝑡 𝑝 = 𝑙𝑜𝑔 = 𝑙𝑜𝑔 𝑝 − log⁡( 1 − 𝑝
1−𝑝
 Si p es una probabilidad de “éxito” entonces p/(1 − p) es el
correspondiente odds, y el logit de la probabilidad es el logaritmo
de los odds; similarmente la diferencia entre los logits de dos
probabilidades es el logaritmo del odds ratio (OR), obteniéndose
así un mecanismo aditivo para combinar odds-ratios:
𝑝 1−𝑝 𝑝 𝑞
𝑙𝑜𝑔 𝑂𝑅 = = 𝑙𝑜𝑔 − 𝑙𝑜𝑔
𝑞 1−𝑞 1−𝑝 1−𝑞
= 𝑙𝑜𝑔𝑖𝑡 𝑝 − 𝑙𝑜𝑔𝑖𝑡 𝑞
Modelos
De
Elección
Discreta
MPL

LOGIT

PROBIT

Você também pode gostar