Escolar Documentos
Profissional Documentos
Cultura Documentos
AULA EXTRA
Anlise de Regresso Logstica
Ernesto F. L. Amaral
13 de dezembro de 2012
Metodologia de Pesquisa (DCP 854B)
p / (1 p) = p / q = 0,75 / 0,25 = 3
RAZO DE CHANCES
Razo de chances para variveis dependentes binrias a
razo entre a chance de uma linha (ou coluna) de uma
tabela 2x2, dividida pela chance da outra linha (ou coluna):
Dilma
Serra
Total
Homem
52
39
91
Mulher
43
44
87
Total
95
83
178
relao s mulheres:
[p1 /(1- p1 )] / [p2 /(1- p2 )] = 1,33 / 0,96 = 1,39
FUNO DE RESPOSTA
QUANTO VARIVEL DEPENDENTE BINRIA
Vamos considerar o modelo de regresso linear simples:
Yi 0 1 X i i
1
Yi
0
Yi 1 P(Yi 1) i
Yi 0 P(Yi 0) 1 i
LOGITO
O logito (logit) equivale ao logaritmo natural (base e) da
chance:
E (Yi ) 0 1 X i i
Assim, a resposta mdia, quando a varivel resposta uma
varivel binria (1 ou 0), representa a probabilidade de Y = 1,
para o nvel da varivel independente Xi.
10
REGRESSO LOGSTICA
COM UMA VARIVEL INDEPENDENTE
Consideraes tericas e prticas sugerem que quando a
varivel resposta binria, a forma da funo resposta ser
frequentemente curvilnea.
As funes respostas (valores preditos) das figuras so
denominadas funes logsticas, cuja expresso :
E (Y )
exp( 0 1 X )
1 exp( 0 1 X )
Forma equivalente:
E (Y ) 1 exp 0 1 X
11
E (Y )
exp( 0 1 X )
1 exp( 0 1 X )
12
E (Y )
exp( 0 1 X )
1 exp( 0 1 X )
13
REGRESSO LOGSTICA
COM MAIS DE UMA VARIVEL INDEPENDENTE
Funo com uma varivel independente:
exp( 0 1 X )
1 exp( 0 1 X )
E (Y )
exp( ' X )
E (Y ) 1exp('X)
Uma forma equivalente dada por:
E (Y ) (1 exp( X))
'
EQUAO DE REGRESSO
A parte linear da equao da regresso logstica usada
para encontrar a probabilidade de estar em uma categoria,
baseado na combinao de variveis independentes.
14
15
AJUSTANDO O MODELO
A funo log-verossimilhana estende-se diretamente para
o modelo de regresso logstica mltipla, dada por:
n
i 1
i 1
'
-1
'
exp(b' Xi )
i 1exp(b X ) (1 exp( b Xi ))
'
'
-1
exp(b0 b1 X i )
1 exp(b0 b1 X i )
exp(b0 b1 X )
1 exp(b0 b1 X )
' b0 b1 X
onde:
log e 1
'
16
TESTE DE QUI-QUADRADO
DA RAZO DE VEROSSIMILHANA
Logaritmo da verossimilhana (Log-likelihood):
i 1
17
18
19
TESTE DE WALD
Cada coeficiente avaliado usando o teste de Wald, que
simplesmente um teste de escore z:
20
PSEUDO
R2
21
22
23
24
25
VARIVEL DEPENDENTE
Varivel dependente indica se a criana abandonou a
escola entre 2004 e 2005:
26
27
VARIVEIS INDEPENDENTES DA ME
Indicao se me chefe do domiclio.
Cor/raa.
Anos de escolaridade.
Idade.
28
29
DESCRIO DA AMOSTRA
Distribuio percentual de crianas por grupos de renda
domiciliar per capita e recebimento do benefcio.
Programa
Bolsa Famlia
R$100,00
R$200,00
Sim
68,39%
64,71%
59,75%
No
31,61%
35,29%
40,25%
N casos (n)
3.312
6.761
9.232
30
R$100,00
R$200,00
Sim
1,10%
1,42%
1,30%
No
2,39%
1,97%
1,80%
Diferena
1,28%***
0,55%***
0,50***
31
R$50,00
R$100,00 R$200,00
Variveis de domiclio
N de membros da famlia
1,122
1,124***
1,108***
Idosos no domiclio
1,454
1,678
1,331
Rede de gua
1,066
0,767
0,694*
Iluminao eltrica
1,270
1,106
1,293
Coleta de lixo
0,994
0,756
0,621**
Rural
ref.
ref.
ref.
Urbano
1,729
1,910*
2,309***
Sul/Sudeste
ref.
ref.
ref.
Norte/Centro-Oeste
2,536**
1,889**
1,630**
Nordeste
3,035**
2,248***
2,064***
R$50,00
1,974***
ref.
2,248**
ref.
1,267
0,701
0,251*
1,507
ref.
1,170
0,053***
32
R$100,00 R$200,00
1,445*
ref.
2,029***
ref.
1,195
0,898
0,440*
4,757***
ref.
1,111
0,532
1,508**
ref.
1,465**
ref.
1,135
0,902
0,481*
4,534***
ref.
1,109
0,645
R$50,00
33
R$100,00 R$200,00
Variveis da me
1,325
1,411
1,838***
0,731
0,643*
0,565***
0 hora/semana trabalho
ref.
ref.
ref.
0,257*
0,920
1,177
0,736
0,744
0,907
0,904
1,790**
1,529*
ref.
ref.
ref.
2,975
1,089
0,854
2,399
1,241
1,050
2,084
1,563
1,443
R$50,00
34
R$100,00 R$200,00
Variveis da criana
Idade
1,174**
1,226***
1,194***
Criana trabalha
1,417
1,177
1,465
Me reside no domiclio
0,218***
0,455**
0,610*
Beneficirio do
Programa Bolsa Famlia
0,428***
0,662**
0,666**
3.312
6.761
9.232