Escolar Documentos
Profissional Documentos
Cultura Documentos
AAI - Aula05 - Logit e Probit
AAI - Aula05 - Logit e Probit
1
Modelo de Probabilidade Linear
Qu and o a var iá ve l de pen de nte é b i nár ia , MQO é ch ama do de
m o d e l o d e p r o b abilid a de l i n e a r.
C o mo Po d e mo s in te r p reter 𝛽𝑗 ? Se j a 𝐸 𝜀 | 𝑋 = 0, e n tã o
∆𝐸 𝑌 |𝑋 ∆𝑃𝑟 𝑌 = 1|𝑋
𝛽𝑗 = =
∆𝑥𝑗 ∆𝑥𝑗
Limitações MPL
Su pos iç ão de Norma lida de : O term o d e erro é i .i .d ., com
d i s tr ibu i ção n o r mal c o m m e d i a z e r o e va r i â n ci a σ ²
𝜀 ~ 𝑁 0; 𝜎 2
𝑉𝑎𝑟 𝜀 |𝑋 = 𝜎 2
C o m o a d is tr ibu ição d o e r r o s e a p r o xi m a d e u m a d i s tr i b ui çã o
Be r n o ul l i , s u a va r iâ n ci a d e p e n d e d e X, p o r i s s o , é
h e te ro ced astico .
0 ≤ 𝐸 𝑌|𝑋 ≤ 1
Ma s , a e s tima ção p o r M Q O n ã o g a r a n te e s ta c o n d i çã o
◦ Pr e vis õ es p o d e m e s ta r fo r a d o i n te r val o d e p r o b a bi l i d ad e
[0 ;1 ];
◦ O e fe i to ma r g i n al Es tima do n o MPL é c o n s tante, ma s
s a b e -se q u e 𝑝 = 𝐸 𝑌 | 𝑋 c r esce l i n e a r m ente c o m 𝑋 . N ã o é
ve r o s símil, p o r e xe m p l o , p r o b abi l i d a de d e te r fi l h o s c r e sce
l i n e a r mente c o m o n ú m e ro d e fi l h o s .
Limitações MPL
U m vi é s n e g a tivo d o c o e fi ci e nte d e d e te rmi n açã o R ² .
O s va l o r e s o b s e rvad os s ã o 1 o u 0 , e n q u a n to a s p r e vi s ões
d e ve m s i tu a r -se e n tr e 0 e 1 : [0 ; 1 ].
O p r i m e i ro e s tá g io p o d e s e r e s ti m ad o p o r M PL .
8
Exemplo
Evans, Farrelly and Montgomery (AER, 1999)
Descritiva - Fumante
. inspect smoker
0 1 16,258
(2 unique values)
MPL: Evans, Farrelly and Montgomery (AER, 1999)
. reg smoker age incomel male black hispanic hsgrad somecol college worka, robust
Robust
smoker Coef. Std. Err. t P>|t| [95% Conf. Interval]
Heterocedasticidade
. imtest,white
Source chi2 df p
12
Modelos Probit e Logit
O q u e o b s e rvamos é u m a va r i á ve l d u mmy , y i , d e fi n i d a p o r
1, 𝑠𝑒 𝑦𝑖∗ > 0
𝑦𝑖 = ቊ
0, 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟á𝑟𝑖𝑜 (3)
13
Modelos Probit e Logit
A d ifere nça ma is comum en tre o M PL dad o em (1) e o mod e lo
d ado por (2) es tá no fato de qu e no pr im e iro a na li s amos a
var iá ve l d ico tômica co mo e la é, e nqu an to em ( 2) ass um i mos a
e xistê nc ia d e uma var iá ve l la ten te su ben te nd i da para a q ua l
o b s e rvam os u ma r e a liz açã o e m p íri ca d i c o tô mi ca .
14
Modelos Logit e Probit
De (2) e (3) temos
( )
k
Pi = P( yi = 1) = P yi 0 = P 0 + j x ji + i 0 =
*
j =1
k
= P i − 0 + j x ji =
j =1
Distribuição acumulada
k
= 1 − F − 0 + j x ji (3)
j =1
15
Modelos Logit e Probit
Em q u e
F ( •) – é u ma fu n ç ã o d e d i s tr i bu i ção a c u m u l ada d e .
1 − F (− z ) = F ( z )
k
Pi = F 0 + j x ji (4)
j =1
Algumas distribuições simétricas: normal, t-Student, logística...
16
Modelos Logit e Probit
C omo os yi o bserva dos s ão ape nas re a l izaç ões de um
pr ocesso Ber nou lli c om pro bab i l i d ades d adas p e la e xpr essão
a nter ior e var ian do de e ven to em e vento (d epe nd endo d o x i j ) ,
p o d e m os e s c rever a fu n ç ão d e ve r o ssi m i l ha nça c o m o
L = Pi (1 − Pi ) (5)
yi =1 yi = 0
17
Modelo Logit
O tip o de mo de lo a va l i ad o de pen derá do pr essu posto
es ta be l ec id o s obre o termo de erro 𝜀 . Se a d is tri b u ição
ac umu l ad a d e 𝜀 for logís tic a, temos o qu e é co nhec i do co mo
mo d e l o l o g it . N e s s e c a s o,
Pi k
ln = 0 + j x ji
1 − Pi j =1
18
Regressão logística
Supondo que temos 2 variáveis explicativas, temos que
Pi
ln = 0 + 1 x1i + 2 x2i
1 − Pi
Logo,
0 + 1 x1i + 2 x2 i
e 1
Pi = P(yi = 1 ) = 0 + 1 x1i + 2 x2 i
=
1+ e 1 + e −( 0 + 1x1i + 2 x2 i )
Modelo Logit
Regressão logística
Assim,
Pi
ln = 0 + 1 x1i + 2 x2i : Logit
1 − Pi
Ainda,
Pi 0 + 1 x1i + 2 x2 i
=e : Chance (odds)
1 - Pi
Transformação logística
Forma de S
0,8
0,7
0,6
0,5
0,4
0,3
Caso
0,2
crescente
0,1
1>0
0
-6 -4 -2 0 2 4 6
0.9
Forma de S
0.8
invertido
0.7
0.6
0.5
Caso 0.4
decrescente
<0
0.3
1 = 1 e 0 = -1, 0 e 1 1
0,9
0,8
0,7
0,6
a=0 =1
0,5 a=−1 =1
a=1 =1
0,4
0,3
0,2
0,1
0
-4 -3 -2 -1 0 1 2 3 4
Regressão logística
Caso x1i = 0 e x2i = 0, temos que
Pi
=e β0
1-Pi
P( X 1 = x1 + 1, X 2 = x2 )
1-P( X 1 = x1 + 1, X 2 = x2 )
e =
β1
P( X 1 = x1 , X 2 = x2 )
1-P( X 1 = x1 , X 2 = x2 )
Modelo Logit
Evans, Farrelly and Montgomery (AER, 1999)
Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
1._at : age = 18
2._at : age = 23
3._at : age = 28
4._at : age = 33
5._at : age = 38
6._at : age = 43
7._at : age = 48
8._at : age = 53
9._at : age = 58
10._at : age = 63
11._at : age = 68
12._at : age = 73
13._at : age = 78
14._at : age = 83
15._at : age = 88
Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
age
_at
1 -.0004809 .0002808 -1.71 0.087 -.0010313 .0000695
2 -.0004782 .0002777 -1.72 0.085 -.0010225 .0000662
3 -.0004755 .0002746 -1.73 0.083 -.0010138 .0000628
4 -.0004727 .0002715 -1.74 0.082 -.0010049 .0000595
5 -.00047 .0002684 -1.75 0.080 -.000996 .0000561
6 -.0004672 .0002652 -1.76 0.078 -.0009871 .0000526
7 -.0004645 .0002621 -1.77 0.076 -.0009781 .0000492
8 -.0004617 .0002589 -1.78 0.075 -.0009691 .0000457
9 -.0004589 .0002557 -1.79 0.073 -.00096 .0000422
10 -.0004561 .0002524 -1.81 0.071 -.0009508 .0000387
11 -.0004533 .0002492 -1.82 0.069 -.0009417 .0000352
12 -.0004504 .0002459 -1.83 0.067 -.0009325 .0000316
13 -.0004476 .0002427 -1.84 0.065 -.0009232 .000028
14 -.0004448 .0002394 -1.86 0.063 -.000914 .0000245
15 -.0004419 .0002361 -1.87 0.061 -.0009047 .0000209
.01
2._at : age = 23
3._at : age = 28
4._at : age = 33
5._at : age = 38
.005
6._at : age = 43
Effects on Pr(Smoker)
7._at : age = 48
8._at : age = 53
9._at : age = 58
0
10._at : age = 63
11._at : age = 68
12._at : age = 73
13._at : age = 78
-.005
14._at : age = 83
15._at : age = 88
Delta-method
dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-.01
age
_at
1 .0090053 .0004877 18.46 0.000 .0080494 .0099612
2 .0083649 .0006155 13.59 0.000 .0071585 .0095714 18 23 28 33 38 43 48 53 58 63 68 73 78 83 88
3 .0067327 .0006035 11.16 0.000 .0055499 .0079155
4 .0043902 .0004921 8.92 0.000 .0034256 .0053548
age in years
5 .0016431 .0003629 4.53 0.000 .0009318 .0023543
6 -.001242 .0003344 -3.71 0.000 -.0018975 -.0005866
7 -.0040235 .0004379 -9.19 0.000 -.0048817 -.0031653
8 -.0064404 .0005568 -11.57 0.000 -.0075317 -.005349
9 -.0081908 .0005965 -13.73 0.000 -.0093598 -.0070217
10 -.0089824 .0005082 -17.68 0.000 -.0099784 -.0079865
11 -.0086673 .00032 -27.08 0.000 -.0092945 -.00804
12 -.0073834 .0002382 -31.00 0.000 -.0078502 -.0069166
13 -.0055577 .0003615 -15.37 0.000 -.0062662 -.0048492
14 -.0037111 .0004256 -8.72 0.000 -.0045452 -.002877
15 -.0022148 .0003821 -5.80 0.000 -.0029638 -.0014659
Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval]
False + rate for true ~D Pr( +|~D) 0.16% False + rate for true ~D Pr( +|~D) 46.34%
False - rate for true D Pr( -| D) 99.24% False - rate for true D Pr( -| D) 32.75%
False + rate for classified + Pr(~D| +) 39.22% False + rate for classified + Pr(~D| +) 67.21%
False - rate for classified - Pr( D| -) 25.05% False - rate for classified - Pr( D| -) 17.03%
A curva começa em (0; 0), correspondendo a c = 1, e continua até (1; 1), correspondendo a c = 0.
Um modelo sem poder de previsão seria uma linha de 45º. Quanto maior o poder preditivo, mais
inclinada a curva e, portanto, a área sob a curva é frequentemente usada como uma medida da
qualidade do modelo.
Um modelo sem poder preditivo tem área 0,5; um modelo perfeito tem área 1.
. lroc
41
Modelo Probit
Caso os erros em (1) sejam normalmente distribuídos,
teremos, então, o modelo probit. Nesse caso,
Zi
t2
F (Z i ) =
1
− 2
exp dt
2
42
Modelo Probit
Interpretação dos parâmetros do Probit
Vamos derivar
Zi
k
t2
Pi = F 0 + j x ji = F (Z i ) =
1
j =1
− 2
exp dt
2
Pi k
= f 0 + j x ji j
x j j =1
43
44
Modelo Probit
Função de Distribuição Acumulada
No caso específico da normal padrão, utilizamos a seguinte notação
z2
y y
( y ) = (z )dz =
1
-
exp − dz.
2π - 2
(z)
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-4,0 -3,7 -3,4 -3,2 -2,9 -2,6 -2,3 -2,0 -1,8 -1,5 -1,2 -0,9 -0,6 -0,4 -0,1 0,2 0,5 0,8 1,0 1,3 1,6 1,9 2,2 2,4 2,7 3,0 3,3 3,6 3,8
z
45
Modelo Probit
Evans, Farrelly and Montgomery (AER, 1999)
.
Interpretação para a estimativa: 𝛽መ > 0 indica aumento de probabilidade de sucesso;
se 𝛽መ < 0, diminui a probabilidade de sucesso.
Interpretação dos parâmetros
Geralmente queremos avaliar os efeitos de cada x sobre as probabilidades
de resposta.
Se x for uma variável contínua, então para pequenas variações em x,
( )
Pˆ (Y = 1 | X) = ˆ0 + ˆ1 x1 + ˆ2 x2 j x j
Delta-method
Margin Std. Err. z P>|z| [95% Conf. Interval]
True
Classified D ~D Total
+ 25 14 39
- 4066 12153 16219
Probit: probit smoker age incomel male black hispanic hsgrad somecol college worka, robust
. estat ic
. test(hsgrad+somecol+college=-2)
chi2( 1) = 1.21
Prob > chi2 = 0.2714