Você está na página 1de 10

Roteiro de Estudo — Métodos Quantitativos Aplicados a Serviços Financeiros

Prof. Dr. José Roberto Frega — 25 de novembro de 2018

1 Ativos Financeiros
1.1 Análise Preliminar de Dados de Ativos Financeiros
Os ativos financeiros normalmente se apresentam sob a forma de cotações ao longo do tempo, sendo essa uma
forma inadequada para os procedimentos de análise.
Desta forma, é necessário, antes de mais nada, calcular os retornos dos ativos (na verdade, os log-retornos),
segundo a fórmula
 
xi
reti = log = log ( xi ) − log ( xi−1 ) (1)
x i −1

Tabela 1: Tabela de Cotações de ativos

GE PBR AMZN AAPL WMT BABA PG XOM NYA


1 13.24 11.72 1797.17 201.50 88.24 185.27 80.65 80.39 12902.40
2 13.17 11.92 1834.33 207.39 88.76 182.60 82.00 79.91 12898.10
3 13.14 12.53 1823.29 207.99 89.60 180.84 82.33 80.20 12953.30
4 13.10 12.50 1847.75 209.07 89.67 178.62 82.52 80.18 12964.30
5 13.16 12.38 1862.48 207.11 89.77 179.92 82.64 81.27 12999.60
6 13.05 12.12 1886.52 207.25 90.05 177.52 82.35 80.73 12987.90

Por meio das fómulas do EXCEL

=LN(<x[t]>)-LN(<x[t-1]>)

aplica-se a fórmula (1) à tabela 1 e obtem-se os retornos

Tabela 2: Tabela de Retornos de Ativos

GE PBR AMZN AAPL WMT BABA PG XOM NYA


2 -0.005301 0.016921 0.020466 0.028812 0.005876 -0.014516 0.016600 -0.005989 -0.000333
3 -0.002281 0.049908 -0.006037 0.002889 0.009419 -0.009685 0.004016 0.003623 0.004271
4 -0.003049 -0.002397 0.013326 0.005179 0.000781 -0.012352 0.002305 -0.000249 0.000849
5 0.004570 -0.009646 0.007940 -0.009419 0.001115 0.007252 0.001453 0.013503 0.002719
6 -0.008394 -0.021225 0.012825 0.000676 0.003114 -0.013429 -0.003515 -0.006667 -0.000900
7 -0.008465 -0.013289 0.006341 0.007834 -0.011616 -0.001861 -0.011603 -0.005092 -0.002405

Considerando que a taxa livre de risco (risk-free) é a taxa do 10-yr bond do Tesouro Americano, que deve
ser considerada para esse estudo como sendo 3.06% ao ano, calculam-se os excessos de retorno dos ativos,
subtraindo deles a taxa risk-freeefetiva diária, por meio da fórmula

rfdiaria = (1 + rfanual )(1/Ndias) − 1 (2)

onde Ndias é o número de dias úteis de trabalho do ativo. No presente caso, considerar Ndias = 251. Assim,
rfdiaria = 0.0120092%.
Assim, os excessos de retorno ficam

1
Tabela 3: Tabela de Excessos de Retornos de Ativos

GE PBR AMZN AAPL WMT BABA PG XOM NYA


2 -0.005421 0.016801 0.020346 0.028692 0.005756 -0.014636 0.016480 -0.006109 -0.000453
3 -0.002401 0.049788 -0.006157 0.002769 0.009299 -0.009805 0.003896 0.003502 0.004150
4 -0.003169 -0.002517 0.013206 0.005059 0.000661 -0.012472 0.002185 -0.000369 0.000729
5 0.004450 -0.009766 0.007820 -0.009539 0.000994 0.007132 0.001333 0.013383 0.002599
6 -0.008514 -0.021345 0.012705 0.000556 0.002994 -0.013549 -0.003635 -0.006787 -0.001021
7 -0.008585 -0.013409 0.006221 0.007714 -0.011736 -0.001981 -0.011723 -0.005212 -0.002525

Com isso, pode-se calcular os retornos médios e as volatilidades de cada ativo:

Tabela 4: Médias e Volatilidades de Excessos de Retornos de Ativos

GE PBR AMZN AAPL WMT BABA PG XOM NYA


Média -0.006887 0.002493 -0.002295 -0.001798 0.000714 -0.002878 0.001485 -0.000580 -0.000919
Desvpad 0.026895 0.031507 0.025563 0.019989 0.014214 0.026608 0.013199 0.011745 0.008328

O último título examinado (NYA) não é propriamente um título negociável. Ele é a cotação Dow-Jones da
Bolsa de NY. Será usado como referência para o estudo do CAPM.
Vamos, portanto, trabalhar com os 8 primeiros ativos listados.

1.2 Montagem de portfolio


Um portfolio eficiente é uma combinação de ativos em uma carteira que atinja algumas condições predetermi-
nadas (minima variância, máximo retorno, máximo Sharpe, etc.). Vamos considerar algumas situações mas,
para tal, deve-se montar um portfolio, com alguma combinação de ativos. Por exemplo:

Tabela 5: Pesos para Excessos de Retornos de Ativos

GE PBR AMZN AAPL WMT BABA PG XOM


1 0.06 0.16 0.13 0.04 0.21 0.21 0.00 0.19

Aplicando esses pesos à tabela de excessos de retorno, tem-se

Tabela 6: Tabela de Excessos de Retornos de Ativos com Carteira

GE PBR AMZN AAPL WMT BABA PG XOM CARTEIRA


2 -0.005421 0.016801 0.020346 0.028692 0.005756 -0.014636 0.016480 -0.006109 0.003130
3 -0.002401 0.049788 -0.006157 0.002769 0.009299 -0.009805 0.003896 0.003502 0.007692
4 -0.003169 -0.002517 0.013206 0.005059 0.000661 -0.012472 0.002185 -0.000369 -0.001224
5 0.004450 -0.009766 0.007820 -0.009539 0.000994 0.007132 0.001333 0.013383 0.003589
6 -0.008514 -0.021345 0.012705 0.000556 0.002994 -0.013549 -0.003635 -0.006787 -0.005758
7 -0.008585 -0.013409 0.006221 0.007714 -0.011736 -0.001981 -0.011723 -0.005212 -0.005414

Com isso, pode-se calcular também o retorno médio e a volatilidade da carteira:

Tabela 7: Médias e Volatilidades de Excessos de Retornos de Ativos e Carteira

GE PBR AMZN AAPL WMT BABA PG XOM CARTEIRA


1 -0.006887 0.002493 -0.002295 -0.001798 0.000714 -0.002878 0.001485 -0.000580 -0.000949
2 0.026895 0.031507 0.025563 0.019989 0.014214 0.026608 0.013199 0.011745 0.013411

2
Percebe-se que a escolha dos pesos provocou um retorno negativo da carteira, apesar da baixa volatilidade.
Pode-se usar um otimizador não-linear para melhorar essa carteira, por exemplo maximizando o seu índice
de Sharpe, que é a razão entre a média dos retornos e a volatilidade da carteira.
x̄i
Sharpe = (3)
si

Tabela 8: Médias, Volatilidades e Sharpe de Excessos de Retornos de Ativos e Carteira

GE PBR AMZN AAPL WMT BABA PG XOM CARTEIRA


Média -0.006887 0.002493 -0.002295 -0.001798 0.000714 -0.002878 0.001485 -0.000580 -0.000949
Desvpad 0.026895 0.031507 0.025563 0.019989 0.014214 0.026608 0.013199 0.011745 0.013411
Sharpe -0.256075 0.079137 -0.089785 -0.089952 0.050217 -0.108163 0.112544 -0.049346 -0.070781

Nota-se o melhor indice de Sharpe para o ativo PG, vamos tentar montar uma carteira ainda melhor.

Tabela 9: Pesos Ótimos para Excessos de Retornos de Ativos

GE PBR AMZN AAPL WMT BABA PG XOM


1 0.000 0.215 0.000 0.000 0.031 0.000 0.754 0.000

Tabela 10: Médias, Volatilidades e Sharpe de Excessos de Retornos de Ativos e Carteira Ótima

GE PBR AMZN AAPL WMT BABA PG XOM CARTEIRA


Média -0.006887 0.002493 -0.002295 -0.001798 0.000714 -0.002878 0.001485 -0.000580 0.001678
Desvpad 0.026895 0.031507 0.025563 0.019989 0.014214 0.026608 0.013199 0.011745 0.012489
Sharpe -0.256075 0.079137 -0.089785 -0.089952 0.050217 -0.108163 0.112544 -0.049346 0.134383

Como retorno anualizado da carteira, define-se

retanual = (1 + retdiario )(Ndias) − 1 (4)

Nota-se um excelente desempenho do Índice de Sharpe para a Carteira apresentada, com um retorno anuali-
zado de 51.3%.
Suponha agora que seu cliente, por exemplo, quer pelo menos 25% de AAPL na carteira. Pode-se verificar o
desempenho rodando o otimizador mais uma vez com a inclusão dessa restrição.

Tabela 11: Pesos Ótimos para Excessos de Retornos de Ativos com AAPL=0.25

GE PBR AMZN AAPL WMT BABA PG XOM


1 0.000 0.225 0.000 0.250 0.000 0.000 0.525 0.000

Tabela 12: Médias, Volatilidades e Sharpe de Excessos de Retornos de Ativos e Carteira Ótima com AAPL=0.25

GE PBR AMZN AAPL WMT BABA PG XOM CARTEIRA


Média -0.006887 0.002493 -0.002295 -0.001798 0.000714 -0.002878 0.001485 -0.000580 0.000891
Desvpad 0.026895 0.031507 0.025563 0.019989 0.014214 0.026608 0.013199 0.011745 0.012358
Sharpe -0.256075 0.079137 -0.089785 -0.089952 0.050217 -0.108163 0.112544 -0.049346 0.072129

Houve uma queda desempenho do Índice de Sharpe para a Carteira apresentada, com um retorno anualizado
de 24.1%.

3
1.3 Modelo CAPM
O CAPM (Capital Assets Pricing Model) é um modelo que permite avaliar o risco sistemático a que um ativo
financeiro está submetido. Ele é implementado por meio de uma regressão linear com a forma

ret.rfativo = α + β ret.rfmercado (5)

Um ativo bem comportado apresentará α = 0 e 0 6 β 6 1 para um ativo conservador e β > 1 para um ativo
agressivo.
No EXCEL, o α é calculado por meio da função =INTERCEPT(<ativo>;<mercado>) e o β por meio da função
=SLOPE(<ativo>;<mercado>). Essa é a parte simples, que dá como resultado, para cada um dos ativos,

Tabela 13: Coeficientes alfa e beta dos ativos

GE PBR AMZN AAPL WMT BABA PG XOM


alfa -0.006530 0.003824 -0.000308 -0.000435 0.001302 -0.001165 0.001816 0.000324
beta 0.388691 1.448603 2.162810 1.484167 0.640480 1.865121 0.359616 0.984095

O classifica os ativos GE, WMT, PG, XOM como conservadores e os ativos PBR, AMZN, AAPL, BABA como agressivos.
Para sabermos se os coeficientes α e β são diferentes de zero, é necessário fazer um teste t para cada um deles,
da seguinte forma:
r
∑y−α−β x
SE = (6)
N−2
s
SE2
SEβ = (7)
∑ ( x − x̄ )2
s
∑ x2
SEα = SEβ (8)
N
coef
tcoef = (9)
SEcoef

onde y é o ativo a ser analisado e x é o mercado contra o qual esse ativo será analisado e N é o número de
observações; o EXCEL possui uma fórmula para calcular SE, que é o começo de nossos cálculos; essa fórmula
é

=STEYX(<ativo>;<mercado>)

Aplicando essa fórmula a nossos dados, obtém-se

Tabela 14: Erro padrão da regressão CAPM dos ativos

GE PBR AMZN AAPL WMT BABA PG XOM


alfa -0.006530 0.003824 -0.000308 -0.000435 0.001302 -0.001165 0.001816 0.000324
beta 0.388691 1.448603 2.162810 1.484167 0.640480 1.865121 0.359616 0.984095
SE 0.027049 0.029486 0.018377 0.015916 0.013347 0.021887 0.013023 0.008523

Como passo seguinte, cria-se uma coluna acessória subtraindo-se a média do retorno do mercado de cada um
dos retornos do mercado.
A seguir, usa-se a função do EXCEL SUMSQ(<x-xmedio>) e obtém-se o valor 0.0054094.
Aplicando-se a fórmula (7) a cada ativo, obtém-se o erro padrão do coeficiente Beta:

4
Tabela 15: Erro padrão do Beta da regressão CAPM dos ativos

GE PBR AMZN AAPL WMT BABA PG XOM


alfa -0.006530 0.003824 -0.000308 -0.000435 0.001302 -0.001165 0.001816 0.000324
beta 0.388691 1.448603 2.162810 1.484167 0.640480 1.865121 0.359616 0.984095
SE 0.027049 0.029486 0.018377 0.015916 0.013347 0.021887 0.013023 0.008523
se.beta 0.367769 0.400903 0.249863 0.216396 0.181473 0.297583 0.177067 0.115880

Usando a fórmula (8) obtém-se o erro padrão do coeficiente Alfa

Tabela 16: Erro padrão do Alfa da regressão CAPM dos ativos

GE PBR AMZN AAPL WMT BABA PG XOM


alfa -0.006530 0.003824 -0.000308 -0.000435 0.001302 -0.001165 0.001816 0.000324
beta 0.388691 1.448603 2.162810 1.484167 0.640480 1.865121 0.359616 0.984095
SE 0.027049 0.029486 0.018377 0.015916 0.013347 0.021887 0.013023 0.008523
se.beta 0.367769 0.400903 0.249863 0.216396 0.181473 0.297583 0.177067 0.115880
se.alfa 0.003081 0.003359 0.002093 0.001813 0.001520 0.002493 0.001484 0.000971

A seguir, aplica-se a fórmula (9) a cada um dos coeficientes e seu respectivo erro padrão, obtendo-se a estatís-
tica t e, a seguir, a sua probabilidade associada por meio da fórmula do EXCEL =2*(1-T.DIST(<t>;<N-2>;1))
onde N é o número de casos coletados. Essa fórmula dá a probabilidade bilateral de que o coeficiente seja zero.

Tabela 17: Significâncias dos coeficientes da regressão CAPM dos ativos

GE PBR AMZN AAPL WMT BABA PG XOM


alfa -0.006530 0.003824 -0.000308 -0.000435 0.001302 -0.001165 0.001816 0.000324
beta 0.388691 1.448603 2.162810 1.484167 0.640480 1.865121 0.359616 0.984095
SE 0.027049 0.029486 0.018377 0.015916 0.013347 0.021887 0.013023 0.008523
se.beta 0.367769 0.400903 0.249863 0.216396 0.181473 0.297583 0.177067 0.115880
se.alfa 0.003081 0.003359 0.002093 0.001813 0.001520 0.002493 0.001484 0.000971
t.alfa -2.119317 1.138479 -0.147321 -0.239776 0.856413 -0.467156 1.224015 0.334174
t.beta 1.056890 3.613351 8.655990 6.858583 3.529333 6.267574 2.030962 8.492326
p.alfa 0.037330 0.258496 0.883269 0.811150 0.394462 0.641725 0.224728 0.739169
p.beta 0.293910 0.000540 0.000000 0.000000 0.000711 0.000000 0.045756 0.000000

Dessa análise, depreende-se que todos os ativos estão devidamente ligados ao mercado, exceto no caso do
ativo GE, que apresenta uma anomalia no Beta, indicando desconexão do mercado e no Alfa, indicando que
os retornos estão anormalmente baixos.
O ativo PG deve ser monitorado pois parece estar quase se desvinculando do mercado.

2 Modelos de Previsão
2.1 Regressão Logística
A regressão logística é usada como método eficiente de previsão do comportamento de uma variável dicotô-
mica em função de variáveis que possivelmente são preditivas desse comportamento.
Suponhamos o seguinte conjunto de dados relativos a clientes

5
Tabela 18: Dados de clientes

nfilhos renda casado casap mulher grinst adimplente


1 1 18.5 0 0 1 1 1
2 1 20.3 1 0 1 1 1
3 2 8.6 1 0 0 0 0
4 3 17.6 1 0 0 0 1
5 0 21.1 1 0 1 1 1
6 3 20.9 1 0 1 2 1

Onde as variáveis são definidas como

1. nfilhos: número de filhos

2. renda: renda, em milhares de R$

3. casado: 1 se tem cônjuge, 0 se não

4. casap: 1 se possui casa própria, 0 se não

5. mulher: 1 se é gênero feminino, 0 se não

6. grinst: grau de instrução — 0) sem instrução formal; 1) nível fundamental; 2) nível médio; 3) nível
superior; 4) pós-graduado

7. adimplente: 1 se o cliente é adimplente, 0 se não

A tarefa da regressão logística consiste em tentar explicar a influência das variáveis antecedentes sobre a con-
dição do cliente ser adimplente ou não, construindo um modelo que depois permita fazer previsões sobre
futuros clientes.
Para tal, usaremos as propriedades da curva logística para permitir a estimação dos parâmetros utilizando o
EXCEL. Uma curva logística tem a forma
1.0
0.8
0.6
plogis(x, 0, 1)

0.4
0.2
0.0

−4 −2 0 2 4

Figura 1: Curva Logística

6
e tem como equação

ez 1
p= = (10)
1+e z 1 + e−z
onde

z = β 0 + β 1 x1 + β 2 x2 + · · · + β n x n (11)

sendo pi a probabilidade de um indivíduo atingir o estado 1 levando em consideração as variáveis xi . O


problema consiste em encontrar um conjunto de β i que otimize a previsão do estado do indivíduo.
Ao aplicarmos a função definida nas fórmulas (10) e eqrefeq:logistica:y obtém-se a probabilidade p de que um
indivíduo com aquelas características atinja o valor 1 para a sua variável dependente.
Esse tipo de equação também pode ser resolvido utilizando o SOLVER do EXCEL, fazendo-o maximizar uma
função chamada de verossimilhança. Por esse motivo essa solução se chama de máxima verossimilhança.
Para uma função logística, a função de verossimilhança tem a forma

L( p, x ) = ∏ ( p y + (1 − p)(1 − y)) (12)

Como esse produtório pode levar a valores muito pequenos, normalmente usa-se o logaritmo da função de
verossimilhança, que vai gerar um somatório

LL( p, x ) = log ∏ ( p y + (1 − p)(1 − y)) = ∑ (log ( p y + (1 − p)(1 − y)))



(13)

O SOLVER necessita ser inicializado com um objetivo que é maximizar o somatório dos logaritmos das veros-
similhanças, alterando as variáveis correspondentes a β 0 (constante) a β 7 . Assim, tem-se algo como

Tabela 19: Dados de clientes

Const nfilhos renda casado casap mulher grinst adimplente z p L LL


1 1 1.0 18 0 0 1 1 1
2 1 1.0 20 1 0 1 1 1
3 1 2.0 9 1 0 0 0 0
4 1 3.0 18 1 0 0 0 1
5 1 0.0 21 1 0 1 1 1
6 1 3.0 21 1 0 1 2 1

Supondo um vetor beta de coeficientes com valores beta = [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
Na coluna z usa-se a função =SUMPRODUCT(<betas>;<valoresx>), gerando os valores

Tabela 20: Dados de clientes com z

Const nfilhos renda casado casap mulher grinst adimplente z p L LL


1 1 1.0 18 0 0 1 1 1 2.2500
2 1 1.0 20 1 0 1 1 1 2.5300
3 1 2.0 9 1 0 0 0 0 1.2600
4 1 3.0 18 1 0 0 0 1 2.2600
5 1 0.0 21 1 0 1 1 1 2.5100
6 1 3.0 21 1 0 1 2 1 2.8900

A seguir, usa-se a formula (10) implementada no EXCEL como


texttt=1/(1+EXP(<z>)) e obtém-se

7
Tabela 21: Dados de clientes com p

Const nfilhos renda casado casap mulher grinst adimplente z p L LL


1 1 1.0 18 0 0 1 1 1 2.2500 0.9047
2 1 1.0 20 1 0 1 1 1 2.5300 0.9262
3 1 2.0 9 1 0 0 0 0 1.2600 0.7790
4 1 3.0 18 1 0 0 0 1 2.2600 0.9055
5 1 0.0 21 1 0 1 1 1 2.5100 0.9248
6 1 3.0 21 1 0 1 2 1 2.8900 0.9473

A seguir, usa-se a fórmula (12) e obtém-se

Tabela 22: Dados de clientes com L

Const nfilhos renda casado casap mulher grinst adimplente z p L LL


1 1 1.0 18 0 0 1 1 1 2.2500 0.9047 0.9047
2 1 1.0 20 1 0 1 1 1 2.5300 0.9262 0.9262
3 1 2.0 9 1 0 0 0 0 1.2600 0.7790 0.2210
4 1 3.0 18 1 0 0 0 1 2.2600 0.9055 0.9055
5 1 0.0 21 1 0 1 1 1 2.5100 0.9248 0.9248
6 1 3.0 21 1 0 1 2 1 2.8900 0.9473 0.9473

Tomando-se o logaritmo natural, com a função


texttt=LN(<L>)

Tabela 23: Dados de clientes com LL

Const nfilhos renda casado casap mulher grinst adimplente z p L LL


1 1 1.0 18 0 0 1 1 1 2.2500 0.9047 0.9047 -0.1002
2 1 1.0 20 1 0 1 1 1 2.5300 0.9262 0.9262 -0.0766
3 1 2.0 9 1 0 0 0 0 1.2600 0.7790 0.2210 -1.5097
4 1 3.0 18 1 0 0 0 1 2.2600 0.9055 0.9055 -0.0993
5 1 0.0 21 1 0 1 1 1 2.5100 0.9248 0.9248 -0.0781
6 1 3.0 21 1 0 1 2 1 2.8900 0.9473 0.9473 -0.0541

Somando-se os valores da coluna LL, obtém-se ∑ LL = −724.6658651, que é o valor provisório da nossa função
objetivo a ser maximizada.
Usando o SOLVER, obtém-se os seguintes valores para o vetor beta:

beta = [−6.2975, −0.5394, 0.3602, 1.8458, −0.1566, 0.532, 0.095]

gerando os resultados

Tabela 24: Dados de clientes no ponto de solução

Const nfilhos renda casado casap mulher grinst adimplente z p L LL


1 1 1.0 18 0 0 1 1 1 0.4536 0.6115 0.6115 -0.4918
2 1 1.0 20 1 0 1 1 1 2.9478 0.9502 0.9502 -0.0511
3 1 2.0 9 1 0 0 0 0 -2.4328 0.0807 0.9193 -0.0841
4 1 3.0 18 1 0 0 0 1 0.2695 0.5670 0.5670 -0.5675
5 1 0.0 21 1 0 1 1 1 3.7753 0.9776 0.9776 -0.0227
6 1 3.0 21 1 0 1 2 1 2.1801 0.8984 0.8984 -0.1071

8
Somando-se os valores da coluna LL, obtém-se ∑ LL = −260.1676157, que é o valor máximo da nossa função
objetivo.
A interpretação dos coeficientes fica ainda mais interessante ao calcularmos o valor

exp.beta = e β (14)

implementado no EXCEL por meio da função


texttt=EXP(<beta>). Ao aplicar a função exponencial, tem-se como resultado

exp.beta = [0.0018, 0.5831, 1.4336, 6.3332, 0.855, 1.7024, 1.0996]

que pode ser intepretado da seguinte forma

1. e β1 = 0.5831102 indica que cada filho a mais leva o indivíduo 42% a mais na direção da inadimplência.

2. e β2 = 1.4335968 indica que cada mil reais a mais no salário leva o indivíduo 43% a mais na direção da
adimplência.

3. e β3 = 6.3331951 indica que ter um companheiro leva o indivído a ser 6.33 vezes mais adimplente que
aquele que não tem.

4. e β4 = 0.8550363 indica que o indivíduo possuir casa própria o leva cerca de 15% a mais na direção da
inadimplência.

5. e β5 = 1.7023927 indica que o indivíduo ser mulher o leva cerca de 70% a mais na direção da adimplência.

2.1.1 Previsão
Cada indivíduo que recebeu uma probabilidade p maior que 0.5 foi previsto como adimplente, então pode-se
confrontar esse resultado com a realidade.
Tabela 25: Dados de clientes com a classificação prevista

Const nfilhos renda casado casap mulher grinst adimplente z p y


1 1 1.0 18 0 0 1 1 1 0.4536 0.6115 1
2 1 1.0 20 1 0 1 1 1 2.9478 0.9502 1
3 1 2.0 9 1 0 0 0 0 -2.4328 0.0807 0
4 1 3.0 18 1 0 0 0 1 0.2695 0.5670 1
5 1 0.0 21 1 0 1 1 1 3.7753 0.9776 1
6 1 3.0 21 1 0 1 2 1 2.1801 0.8984 1

Comparando as colunas adimplente e y, pode-se verificar a quantidade de acertos em cada categoria. Esse
tabelamento se chama confusion matrix:

Tabela 26: Confusion matrix

0 1
0 322 57
1 66 155

onde nas linhas está a categoria observada e nas colunas a categoria prevista. Isso indica que, de 379 inadim-
plentes, o modelo previu corretamente 322 e que de 221 adimplentes, o modelo previu corretamente 155.
Assim, pode-se dizer que o modelo previu corretamente 79.5% do total de casos, sendo que 85% dos casos
inadimplentes e 70.1% dos casos adimplentes.

9
Suponha agora que um indivíduo que tem 1 filho, com renda de 10 mil reais, solteiro, com casa própria,
do gênero masculino, com grau de instrução superior venha a pedir a concessão de crédito. Baseado nesse
modelo, qual a probabilidade dele ser um bom cliente?
Sabe-se que

z = β 0 + β 1 x1 + β 2 x2 + β 3 x3 + β 4 x4 + β 5 x5 + β 6 x6 (15)
1
p= (16)
1 + e−z
logo,

z = −6.2975 + −0.5394 · 1 + 0.3602 · 10 + 1.8458 · 0 + −0.1566 · 1 + 0.532 · 0 + 0.095 · 3 = −3.1066 (17)


1 1
p= = = 0.0428358 (18)
1 + e−z 1 + e−(−3.1066)
Ou seja, a probabilidade de um indivíduo com essas características vir a ser um bom cliente é de aproximada-
mente 4.3%.

10

Você também pode gostar