Você está na página 1de 5

UNIVERSIDADE DE SÃO PAULO

FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE


GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS

DISCIPLINA: EAC 0516 – MÉTODOS QUANTITATIVOS II

PROFA. DRA. TATIANA ALBANEZ

LISTA 4

ALUNO: VANDRÉ RICARDO HENRIQUE - 3140555

SÃO PAULO

2019
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE
GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS

O arquivo “Empréstimo” apresenta sete variáveis referentes a 189 pessoas que são clientes
de um banco. O objetivo da análise é estimar a probabilidade de um cliente tomar empréstimo
(Y) com base em algumas de suas características, como: idade (em anos), tempo no emprego
(em semanas), sexo (0-fem, 1-masc), histórico de inadimplência (0-não; 1-sim), estado civil
(0-solteiro, 1-casado), o fato de já ter sido demitido por justa causa (0-não, 1-sim) e a
quantidade de vezes que comprou bens duráveis no último ano. Dessa forma, o banco
pretende mover esforços no sentido de oferecer empréstimo para clientes com alta
propensão.
Por meio de uma regressão logística, estime o modelo e responda:

a) Quais variáveis são significativas para se estimar a propensão a empréstimo dadas


as características quantitativas e qualitativas associadas a cada cliente?

. logit emprestimo idade t_emprego sexo hist_inadimp casado justa_causa


bens_duraveis

Iteration 0: log likelihood = -117.336


Iteration 1: log likelihood = -105.77405
Iteration 2: log likelihood = -105.53684
Iteration 3: log likelihood = -105.5361
Iteration 4: log likelihood = -105.5361

Logistic regression Number of obs = 189


LR chi2(7) = 23.60
Prob > chi2 = 0.0013
Log likelihood = -105.5361 Pseudo R2 = 0.1006

-------------------------------------------------------------------------------
emprestimo | Coef. Std. Err. z P>|z| [95% Conf. Interval]
--------------+----------------------------------------------------------------
idade | -.0392149 .034962 -1.12 0.262 -.1077393 .0293094
t_emprego | -.0128826 .00653 -1.97 0.049 -.0256812 -.0000841
sexo | .5370143 .3419941 1.57 0.116 -.1332818 1.20731
hist_inadimp | .6044751 .3466816 1.74 0.081 -.0750085 1.283959
casado | 1.778122 .6815769 2.61 0.009 .4422563 3.113989
justa_causa | .6150716 .4642458 1.32 0.185 -.2948334 1.524977
bens_duraveis | -.0100743 .1720554 -0.06 0.953 -.3472968 .3271482
_cons | 1.180072 1.0729 1.10 0.271 -.9227726 3.282918
-------------------------------------------------------------------------------
Verificando-se o output acima, obtido por meio do Stata, observa-se as variáveis
significativas por estarem na região de H1 (5%), conforme a probabilidade Z (P>|z|), são:
t_emprego, casado.

b) Estime novamente o modelo sem as variáveis que apresentaram problemas de


significância (estatística Z ou Wald) pelo método stepwise;

SÃO PAULO

2019
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE
GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS

. stepwise, pr(0.05): logit emprestimo idade t_emprego sexo hist_inadimp casado


justa_causa bens
> _duraveis
begin with full model
p = 0.9533 >= 0.0500 removing bens_duraveis
p = 0.2465 >= 0.0500 removing idade
p = 0.1551 >= 0.0500 removing justa_causa
p = 0.0948 >= 0.0500 removing sexo

Logistic regression Number of obs = 189


LR chi2(3) = 17.45
Prob > chi2 = 0.0006
Log likelihood = -108.61021 Pseudo R2 = 0.0744

------------------------------------------------------------------------------
emprestimo | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
casado | 1.789359 .694479 2.58 0.010 .4282048 3.150513
t_emprego | -.0153987 .0065162 -2.36 0.018 -.0281703 -.0026272
hist_inadimp | .727888 .3267995 2.23 0.026 .0873728 1.368403
_cons | .8926096 .8293495 1.08 0.282 -.7328856 2.518105
------------------------------------------------------------------------------
Verificando o output acima, ao utilizar o método stepwise, constata-se que as variáveis com
significância estatística, conforme a probabilidade Z (P>|z|), são: casado, t_emprego e
hist_inadimp.

c) Qual o poder explicativo deste último modelo?

. stepwise, pr(0.05): logistic emprestimo idade t_emprego sexo hist_inadimp casado


justa_causa b
> ens_duraveis
begin with full model
p = 0.9533 >= 0.0500 removing bens_duraveis
p = 0.2465 >= 0.0500 removing idade
p = 0.1551 >= 0.0500 removing justa_causa
p = 0.0948 >= 0.0500 removing sexo

Logistic regression Number of obs = 189


LR chi2(3) = 17.45
Prob > chi2 = 0.0006
Log likelihood = -108.61021 Pseudo R2 = 0.0744
------------------------------------------------------------------------------
emprestimo | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
casado | 5.985613 4.156882 2.58 0.010 1.5345 23.34803
t_emprego | .9847192 .0064166 -2.36 0.018 .9722228 .9973762
hist_inadimp | 2.070703 .6767046 2.23 0.026 1.091303 3.929072
_cons | 2.441493 2.024851 1.08 0.282 .4805204 12.40506
------------------------------------------------------------------------------
Note: _cons estimates baseline odds.

SÃO PAULO

2019
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE
GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS

Conforme output acima, constata-se que, conforme o Pseudo R2, o modelo tem poder
explicativo tem valor igual a 0,0744.

d) Calcule a probabilidade de obtenção de um empréstimo por uma pessoa de 20 anos,


com 130 semanas no mesmo emprego, do sexo masculino (1), sem histórico de
inadimplência (0), solteiro (0), que já perdeu o emprego por justa causa (1) e que
comprou duas vezes bens duráveis no último ano;

. stepwise, pr(0.05): logit emprestimo idade t_emprego sexo hist_inadimp casado


justa_causa bens
> _duraveis
begin with full model
p = 0.9533 >= 0.0500 removing bens_duraveis
p = 0.2465 >= 0.0500 removing idade
p = 0.1551 >= 0.0500 removing justa_causa
p = 0.0948 >= 0.0500 removing sexo

Logistic regression Number of obs = 189


LR chi2(3) = 17.45
Prob > chi2 = 0.0006
Log likelihood = -108.61021 Pseudo R2 = 0.0744

------------------------------------------------------------------------------
emprestimo | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
casado | 1.789359 .694479 2.58 0.010 .4282048 3.150513
t_emprego | -.0153987 .0065162 -2.36 0.018 -.0281703 -.0026272
hist_inadimp | .727888 .3267995 2.23 0.026 .0873728 1.368403
_cons | .8926096 .8293495 1.08 0.282 -.7328856 2.518105
------------------------------------------------------------------------------
Verificando o output acima, ao calcular a probabilidade de obtenção de empréstimo, conforme
os valores indicados no item d, temos o seguinte resultado:

= 0,257309 ≈ 25,73%

SÃO PAULO

2019
UNIVERSIDADE DE SÃO PAULO
FACULDADE DE ECONOMIA, ADMINISTRAÇÃO E CONTABILIDADE
GRADUAÇÃO EM CIÊNCIAS CONTÁBEIS

e) Considerando um ponto de corte igual a 0,5, esta pessoa seria classificada em qual
categoria?

. estat class, cutoff(0.5)

Logistic model for emprestimo

-------- True --------


Classified | D ~D | Total
-----------+--------------------------+-----------
+ | 12 7 | 19
- | 47 123 | 170
-----------+--------------------------+-----------
Total | 59 130 | 189

Classified + if predicted Pr(D) >= .5


True D defined as emprestimo != 0
--------------------------------------------------
Sensitivity Pr( +| D) 20.34%
Specificity Pr( -|~D) 94.62%
Positive predictive value Pr( D| +) 63.16%
Negative predictive value Pr(~D| -) 72.35%
--------------------------------------------------
False + rate for true ~D Pr( +|~D) 5.38%
False - rate for true D Pr( -| D) 79.66%
False + rate for classified + Pr(~D| +) 36.84%
False - rate for classified - Pr( D| -) 27.65%
--------------------------------------------------
Correctly classified 71.43%
--------------------------------------------------

. lsens

Considerando o output acima da tabela de classificação, o percentual de acerto de clientes que


tomarão empréstimo é de 20,34% e o percentual de acerto dos que não tomariam empréstimo é de
94,62%. Observando que o resultado obtido no item d foi um percentual de 74,27%, a pessoa com os
valores e características indicados no item anterior estaria classificada na categoria dos que não
tomariam empréstimo.

SÃO PAULO

2019

Você também pode gostar