Você está na página 1de 35

MODELOS DE REGRESSO

TIPOS DE MODELO DE REGRESSO

REGRESSO POLINOMIAL

REGRESSO LOGSTICA

O modelo de regresso no linear logstico utilizado quando a varivel resposta qualitativa com dois resultados possveis. Ex: Sobrevivncia de enxertos de ameixeiras (sobrevive ou no sobrevive). Este modelo pode ser estendido quando a varivel resposta qualitativa tem mais do que duas categorias; por exemplo, a presso sangunea pode ser classificada como alta, normal e baixa.

MODELOS DE REGRESSO COM


VARIVEIS RESPOSTAS BINRIAS
Em muitos estudos a varivel resposta qualitativa tem duas possibilidades e, assim, pode ser representada pela varivel indicadora, recebendo os valores 0 (zero) e 1 (um).

Exemplos:

1)

O objetivo da anlise verificar se uma firma tem ou no um departamento de relao industrial, de acordo com o seu tamanho. A varivel resposta tm duas possibilidades: a firma tem ou no tem o departamento. Estes resultados pode m ser codificados como 1 e 0 (ou vice-versa).

2) Num estudo sobre a participao das esposas no mercado de


trabalho, como funo da idade da esposa, nmero de filhos e rendimento do marido, a varivel resposta Y foi definida do seguinte modo: a mulher participa no mercado de trabalho ou no. Novamente, estas respostas podem ser codificadas como 1 e 0, respectivamente.

INTERPRETAO DA FUNO DE RESPOSTA QUANDO A


VARIVEL RESPOSTA BINRIA

Vamos considerar o modelo de regresso linear simples:

Yi ! F 0  F1 X i  I i 1 Yi ! 0
A resposta esperada dada por:

E (Yi ) ! F 0  F1 X i

(1)

Considere Yi uma v.a. Bernoulli com distribuio de probabilidade:

Yi ! 1 p P (Yi ! 1) ! T i Yi ! 0 p P(Yi ! 0) ! 1  T i

Pela definio de valor esperado, obtemos:

E (Yi ) ! T i
Igualando-se (1) e (2), obtemos:

(2)
(3)

E (Yi ) ! F 0  F1 X i ! T i

Assim, a resposta mdia, quando a varivel resposta uma varivel binria (1 ou 0), sempre representa a probabilidade de Y = 1, para o nvel da varivel preditora Xi. Na figura a seguir, a varivel indicadora Y corresponde se a firma tem ou no tem um departamento de relao industrial e, a varivel preditora X corresponde ao tamanho da firma. A funo resposta mostra a probabilidade que uma firma de um dado tamanho tenha um departamento de relao industrial.

Probabilidade de uma firma ter departamento E(Y) 1

E (Y ) ! F 0  F1 X

0 Tamanho da firma X

Problemas quando a varivel resposta binria


1. Os erros no tem distribuio normal. Cada erro

I i ! Yi  ( F 0  F1 X i )
pode assumir um dos dois valores:

Yi ! 1 I i ! 1  F 0  F1 X i Yi ! 0 I i !  F 0  F1 X i
2. Varincias heterogneas. A varincia de Yi para o modelo de regresso linear simples :

W 2 (Yi ) ! E[(Yi  E (Yi )) 2 ] ! (1  T ) 2 T i  (0  T i ) 2 (1  T i ) W 2 (Yi ) ! T i (1  T i ) ! E (Yi )(1  E (Yi ))

Como:

I i ! Yi  T i ( T i constante)
Temos:

W 2 (I i ) ! T i (1  T i ) ! ( F 0  F1 X i )  (1  F 0  F1 X i )
Depende de Xi

ESTE MODELO FREQENTEMENTE NO REPRESENTA BEM A SITUAO EM ESTUDO. AO INVS, UM MODELO ONDE AS PROBABILIDADES 0 E 1 SO ENCONTRADAS ASSINTOTICAMENTE, COMO MOSTRA A FIGURA A SEGUIR, , DE MODO GERAL, MAIS APROPRIADA.

FUNO RESPOSTA LOGSTICA

Propriedade da funo logstica


Uma propriedade interessante que a funo logstica pode ser linearizada. Denotando-se E(Y) por T, pois a resposta mdia a probabilidade quando a varivel resposta binria. Fazendo-se a transformao:

T T ' ! log e 1T

(6)

obtemos:

T ' ! F 0  F1 X

(7)

Esta transformao chamada de transformao logit da probabilidade T. A razo T/(1- T) na transformao logit chamada de Odds (Chance). A funo resposta transformada (7) denominada como funo resposta logit, e T denominada de resposta mdia logit. Observe em (7) que: -g e T e g para -geXeg.

Uso da funo logstica

Descritivo:

descrever a natureza do relacionamento entre a resposta mdia (isto , a probabilidade de comprar, por exemplo) e uma (ou mais) variveis regressoras. automvel no prximo ano, dado o seu rendimento.

Preditivo: saber se uma pessoa ir comprar um

31

Regresso logstica com uma nica varivel preditora


Modelo de regresso logstica simples
Quando a varivel resposta binria, tomando os valores 1 e 0, com probabilidades T e 1-T, respectivamente, Y uma varivel Bernoulli com parmetro E(Y)= T. O modelo na sua forma usual dado por: Y ! E (Y )  I
i i i

onde:

E (Yi ) ! T i !

exp( F 0  F1 X i ) 1 exp( F 0  F1 X i )

(8)

32

Ex:
Um analista est estudando o efeito do tempo de experincia em programao computacional sobre a habilidade para completar, dentro de um determinado tempo, um tarefa difcil. Vinte e cinco (25) programadores foram selecionadas para o estudo. A varivel preditora, X, corresponde ao meses de experincia. Os resultados foram (experincia em meses, sucesso na tarefa, valores ajustados):

14 29 6 25 18 4 18 12 22 6 30 11 30

0 0 0 1 1 0 0 0 1 0 1 0 1

0.310262 0.835263 0.109996 0.726602 0.461837 0.082130 0.461837 0.245666 0.620812 0.109996 0.856299 0.216980 0.856299

5 0 0.095154 20 1 0.542404 13 0 0.276802 9 0 0.167100 32 1 0.891664 24 0 0.693379 13 1 0.276802 19 0 0.502134 4 0 0.082130 28 1 0.811825 22 1 0.620812 8 1 0.145815

Os resultados so codificados como: Y=Os tempos de experincia so bastante variados, como mostra a primeira coluna dos dados. Para todas as pessoas foi dada a mesma tarefa e os resultados do seu sucesso 1 se a tarefa foi completada com sucesso no tempo permitido, e Y=0 se a tarefa no foi completada com sucesso. O diagrama de disperso dado na figura a seguir.

Somente indica que a habilidade para completar a tarefa com sucesso parece aumentar com a experincia.

34

Fim

Você também pode gostar