Você está na página 1de 8

1. MODELOS PROBABILSTICOS COM VARIVEL DEPENDENTE LIMITADA.

1.1. Modelos com varivel Dependente Binria. Os modelos deste tipo assumem uma varivel dependente Dummy com valores 0 e 1, varivel discreta. A varivel dependente uma varivel Binria (ou dicotmica) uma vez que assume dois valores, 0 ou 1. O valor 1 corresponde a uma certa caracterstica que o indivduo tem (ter casa, ser sindicalizado, ser competente, ter emprego, etc.) O valor 0 corresponde a mesma caracterstica que o indivduo no tem. Estas variveis so qualitativas que no podem ser expressas em certas unidades de medida. Nos modelos onde a varivel dependente Y qualitativa (binria), queremos encontrar a probabilidade de o indivduo ter esta caracterstica, por isso os modelos so conhecidos como modelos probabilsticos. Mais concretamente, o nosso objectivo estimar o valor mdio esperado (condicional) da varivel dependente, para determinados valores das variveis explicativas que podem ser quantitativas ou qualitativas, isto , E(Yi | X1i,X2i,,Xni) que pode ser interpretado como probabilidade condicional, ou seja E(Yi | X1i,X2i,,Xni) = Pr(Yi=1 | X1i,X2i,,Xni)

1.2. O Modelo Probabilstico Linear (MPL) de regresso mltipla Este modelo apresenta-se do seguinte modo: Yi = b0 + b1X1i +..+ bnXni + ui (1)

com Y = 1 se o indivduo possui a caracterstica de interesse (por exemplo, ter casa) Y = 0 se o indivduo no possui esta caracterstica (no ter casa) X1i , .., Xni so as variveis explicativas que podem ser Binrias ou no binrias (por exemplo, X1i pode ser o rendimento, X2i o indivduo ser casado ou solteiro, etc.) Pi a probabilidade de o indivduo possuir esta caracterstica (Yi=1) (1-Pi) a probabilidade de o indivduo no possuir esta caracterstica (Yi=0)
b0 estimado indica a probabilidade de o indivduo possuir esta caracterstica

(ter casa) quando X1i=0 (rendimento 0),., Xni=0.


b1 estimado indica qual o aumento na probabilidade de o indivduo possuir

esta caracterstica (ter casa) quando a varivel X1i (rendimento) aumenta uma unidade, mantendo o resto constante, matematicamente: Pi(Yi=1|X1i) = b1X1i importante admitir os seguintes resultados: E(Yi|X1i ,,Xni) = b0 + b1Xi+..+ bnXni E(Yi) = 1(Pi) + 0(1-Pi) = Pi (mdia) E(Yi|X1i ,,Xni ) = b0 + b1Xi +. +bnXni= Pi (probabilidade condicional) 0 E(Yi|X1i ,,Xni) 1 (restrio) admitindo que E(ui) = 0

1.3. Problemas com a estimao OLS do modelo MPL Podemos estimar o modelo MPL pelo mtodo OLS mas enfrentamos os seguintes problemas: a) Termo de erro Heteroscedstico

se Yi = 1 se Yi = 0

ui = 1-b0-b1X1n-.. -bnXni com probabilidade Pi ui = -b0-b1Xi -.. -bnXni com probabilidade 1-Pi

A varincia condicional do termo de erro dada por var(ui |X1i,.,Xni) = E(Yi| X1i,.,Xni)[1-E(Yi| X1i,.,Xni)] = Pi(1-Pi) = =(-b0-b1Xi -.. -bnXni) (1-b0-b1X1n-.. -bnXni) Como bvio a varincia de ui heteroscedstica dependente da esperana condicional de Yi que por sua vez depende dos valores X1i,,Xni. Sabemos que no caso de Heteroscedasticidade os estimadores OLS no so eficientes e os erros padro no vlidos afectando o normal funcionamento dos testes de hiptese. Uma maneira de resolver o problema de Heteroscedasticidade dividir o modelo pelo factor Pi (1 Pi ) = wi . Este mtodo conhecido como o mtodo dos Mnimos Quadrados Ponderados uma vez que ponderamos as variveis pelo factor 1 / wi .

Yi/ wi = b0/ wi + b1X1i/ wi + + b1Xni/ wi + ui/ wi Este modelo tem um erro Homoscedstico, uma vez que var(ui/ wi ) = (1/wi)var(ui) = wi/wi=1 assim pode ser estimado em dois passos:
(i)

(2)

Estimar o modelo inicial (1) pelo mtodo OLS e obter Yi . A seguir calcule wi = Yi (1 Yi ) Usar os valores wi para transformar os dados do modelo (2) e estima-lo pelo mtodo OLS novamente.

(ii)

b) valores estimados de Yi inadmissveis O problema com a estimao do modelo (2) que pode haver valores de que no respeitam a condio 0 E(Yi| X1i ,,Xni) 1. Pode acontecer encontrar valores estimados da varivel dependente negativos ou superiores a unidade (inadmissveis).

Yi Yi

Neste caso podemos assumir 0 (ou 0,01) quando os valores de Yi aparecem negativos e 1 (ou 0,99) quando aparecem superiores a unidade.

Alternativamente, podemos fazer a estimao do modelo (2) omitindo estas observaes, reduzindo assim o tamanho da amostra, perdendo deste modo graus de liberdade. Um processo mais adequado seria optar por mtodos de estimao que garantem que os valores de Y i se encontram entre 0 e 1. Os modelos logit e probit satisfazem esta condio. c) R2 inadequado Um outro problema com a estimao do modelo MPL que o R 2 tem validade limitada (valores baixos) e no serve como medida de preciso do ajustamento credvel. d) Especificao do modelo MPL no adequada A hiptese que E(Yi|X1i ,,Xni) = b0 + b1X1i +..+ bnXni = Pi admite que a probabilidade de o indivduo possuir certa caracterstica (ter casa) varia linearmente com os valores das variveis explicativas X1i,,Xni. Assume se assim que o efeito marginal de X1i sobre Pi constante ao longo dos indivduos independentemente do seu nvel (rendimento) Contudo, mais provvel nestes modelos probabilsticos que a relao entre Pi e X1i,,Xni seja no linear. Assim, precisamos um modelo probabilstico que satisfaz duas condies:

(i)

A medida que Xi aumenta, Pi= E(Y=1|Xi) aumenta sem assumir valores fora do intervalo 0 e 1. A relao entre Pi e Xi ser no-linear (de preferncia sigmoid)

(ii)

1.4.

Modelos Alternativos no lineares (Logit, Probit)


1.4.1. O modelo Logstico (Logit)

Para evitar os problemas do modelo MPL consideramos o modelo logit que admite que a relao entre Pi=E(Y=1 | X1i ,,Xni) e as variveis explicativas X1i ,,Xni no linear e garante que as probabilidades variam entre 0 e 1. Este modelo assume a seguinte forma Pi = E(Y=1 | X1i,,Xni)= G(b0+b1X1i,,bnXni) com G uma funo que satisfaz a condio 0<G(z)<1, para qualquer valor real z. O modelo logit considera uma funo de distribuio acumulada logstica A funo no linear logit dada pela seguinte relao: Pi=E(Y=1|X1i ,,Xni)=eb0+b1X1i+.+bnXni / [1+ e b0+b1X1i +.+bnXni] (3)

O mtodo da Mxima Verosimilhana normalmente utilizado para a estimao do modelo (3). O objectivo deste mtodo maximizar a funo da Verosimilhana (ou o logaritmo desta), isto , obter (atravs dum processo iterativo) os valores dos parmetros do modelo de modo que a probabilidade de observar os valores de Yi seja a mais alta (mxima) possvel. Observaes:
5

(i) Neste tipo de estimaes no-lineares com varivel dependente binria, o R2 convencional no uma medida de ajustamento adequada. Como 2 alternativa, o RMcF de McFadden utilizado dado pela relao
LLFur LLFr onde LLFur o logaritmo da funo de verosimilhana do modelo no restrito e LLFr o logaritmo da funo de verosimilhana do modelo restrito
2 RMcF = 1

apenas com a parte constante. (ii) para testar a significncia global dos coeficientes do modelo a varivel utilizada conhecida como Likelihood-Ratio, dada pela estatstica: LR = 2(LLFur-LLFr) ~ xn2 com n o nmero das restries. (iii) Os coeficientes estimados do modelo logit no tm uma interpretao fcil e directa. Para serem comparveis com os coeficientes estimados do modelo probabilstico linear tm de ser divididos pelo factor 4. 1.4.2. O Modelo Probit Como foi referido, para explicar o comportamento duma varivel dependente binria temos de utilizar uma funo de distribuio acumulada adequada. O modelo logit utiliza a funo acumulada logstica, dada pela equao (3), contudo existem outras alternativas. O Modelo probit (ou Normit) uma alternativa do modelo logit que admite a funo de distribuio Normal (standard) para expressar a relao no linear entre as probabilidades estimadas da varivel dependente e as variveis explicativas. O Modelo probit admite a seguinte hiptese: Ii = b0 + b1X1i +..+bnXni (4)

onde Ii um ndice no observado dependente das variveis X1i,.,Xni de tal modo que quanto maior o valor do ndice Ii maior a probabilidade de o indivduo possuir a caracterstica de interesse. Assume-se tambm que corresponde um nvel limiar (crtico) do ndice Ii* tal que, se Ii* Ii o indivduo possui a caracterstica de interesse (tem casa), caso contrrio no possui esta caracterstica. Admitindo a hiptese da normalidade, a hiptese de que Ii* Ii pode ser apresentada do seguinte modo: Pi = Pi(Yi=1 | X1i,.,Xni) = P(Ii* Ii ) = P(Zi b0 + b1X1i +..+bnXni) = = F(b0 + b1X1i +..+bnXni ) onde Zi ~ N(0, 1) e
Ii

(5)

F (Ii ) =

1 2

( Z e

/ 2)

dZ =

b0 + 1 X 1i + + n X ni b ... b 2 1 e ( Z / 2 ) dZ 2

Esta funo permite que a probabilidade Pi permanea entre 0 e 1, ou seja


Z +

lim F ( Z ) = 1

lim F ( Z ) = 0

O modelo probit estimado pelo mtodo da Mxima Verosimilhana, mtodo de estimao no linear. Os coeficientes estimados do modelo probit no tm uma interpretao fcil e directa. Para serem comparveis com os coeficientes estimados do modelo probabilstico linear tm de ser divididos pelo factor 2.5. Probit ou Logit?

Os resultados das estimaes dos modelos logit e probit so similares em termos de significncia estatstica e preciso de ajustamento, contudo, os valores dos coeficientes estimados no so directamente comparveis. A principal diferena entre os dois modelos est no facto de a distribuio logstica apresentar caudas ligeiramente mais grossas do que a distribuio normal do modelo probit, isto , a probabilidade condicional Pi se aproxima mais lentamente para o 0 ou 1 do que no caso do modelo probit. Basicamente, no h razo forte que justifica optar por um dos dois modelos, uma vez que o mtodo de estimao o mesmo (mtodo da Mxima Verosimilhana) diferem apenas na funo de distribuio acumulada. Na prtica, o modelo logit mais utilizado devido a sua especificao matemtica mais simples. Por outro lado, existe a seguinte relao (equivalncia) entre os coeficientes estimados dos modelos probit e logit: blogit*0.625= bprobit e inversamente bprobit*1.6 (=1/0.625) = blogit

Referncias: Gujarati N. Damodar (2003), Basic Econometrics, 4th edition, McGrawHill, chapter 15. Wooldridge M. Jeffrey (2003), Introductory Econometrics, 2nd edition, Thomson, sections 7.5, 8.5 and 17.1.

Você também pode gostar