Você está na página 1de 8

AULA:

Regresso Logistica

Prof. Victor Hugo Lachos Davila

Um analista est estudando o efeito do tempo de experincia (X em meses) em programao computacional sobre a habilidade para completar, dentro de um determinado tempo, um tarefa difcil(Y). Vinte e cinco (25) programadores foram selecionadas para o estudo. A varivel preditora, X, corresponde ao meses de experincia. Os resultados foram (experincia em meses, sucesso na tarefa, valores ajustados):
Meses 5 20 13 9 32 24 13 19 4 28 22 8 14 Sucesso Na tarefa Meses Sucesso Na tarefa 0 29 0 1 6 0 0 25 1 0 18 1 1 4 0 0 18 0 1 12 0 0 22 1 0 6 0 1 30 1 1 11 0 1 30 1 0

1.2 1 0.8 Sucesso 0.6 0.4 0.2 0 0 5 10 15 20 25 30 35 Experincia

Parece que a habilidade para completar a tarefa com sucesso parece aumentar com a experincia.

A funo resposta logstica ajustada (15) :

pi =

exp( 3, 0597 + 0 ,1615 X ) 1+ exp( 3, 0597 + 0 ,1615 X )

Para X1=14 meses. O valor ajustado : 0.3102 Interpretao: este valor ajustado a estimativa da probabilidade de que uma pessoa com 14 meses de experincia tenha sucesso para completar a tarefa.

1,0 0,9 0,8 0,7 0,6

pi

0,5 0,4 0,3 0,2 0,1 0,0 0 5 10 15 20 25 30 35

Tempo de experincia
4

Interpretaes: Si e experincia aumenta em uma unidade a chance aumenta em 100*b=6.4% Ou Si e experincia aumenta em uma unidade a chance aumenta em 100*(1exp(b))=(1-1.067138)%100=6.7%

Modelos Logit y Probit


Enfoque Enfoque de de la la variable variable latente latente
1. O enfoque da varivel latente trata o uso de variveis dicotmicas basicamente como um problema de medida, ou seja, - Existe uma varivel latente contnua (Y*) que no observamos diretamente e portanto no podemos mensurar. - O que verdadeiramente observamos um indicador da varivel no observada ou varivel latente Por exemplo, existe propenso dos indivduos a colar, a votar , mas o que verdadeiramente observamos o resultado, a ao y no a propenso. O modelo sob este enfoque pode ser escrito como:

2. 3.

onde

Y * i = 0 + 1 X i + i ,

Yi = 0, se Yi 0,
*

Yi = 1, se Yi > 0,
*

donde, se i simetricamente distribudo, resulta que

P(Yi = 1) = P(Yi > 0) = P( X i + i > 0) = P( i X i )


*

Intuitivamente, dizemos que Y=1, se a parte aleatria menor o igual que a parte sistemtica do modelo. Como o principal problema calculo de probabilidades, ento precisamos de alguma distribuio
6

1. 2.

Se assumimos que os erros seguem uma distribuio logstica, ento obtemos o modelo LOGIT. A pdf padro dada por

exp( ) f ( ) = (1 + exp( )) 2

3.

A cfd padro dado por

exp( x) F ( x) = P( x) = 1 + exp( x)
Assim, assumindo distribuio logstica para , podemos escrever

exp( X i ) P(Yi = 1) = 1 + exp( X i )


4. Assumindo distribuio normal para os erros, segue que:
Xi

P(Y i= 1) = ( X i ) =

t2 1 exp( )dt 2 2
7

Logit possue caudas mais pesadas que o probit. qual , logit ? qual melhor melhor, logit o o probit probit?

1. 2. 3. 4.

Desde um ponto de vista prtico, logit e probit producem resultados similares, devido a que a cdf das duas distribuies diferem ligeiramente s nas caudas. As diferencias so significativas se possuemos muitas observaoes nas caudas. Desde um ponto de vista Bayesiano, estimao considerando Probit matematicamente mais tratavel, Via mtodos frequentistas, podemos usar o algoritmo EM.
8