Você está na página 1de 13

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

Curso: Pós-graduação em Atuária


Disciplina: Modelos de regressão
Professora: Mariane Branco Alves
Alunos: Rye Takeda
Data: 25/12/2019

Relatório sobre Regressão para dados binários

1. Objetivo:

O presente relatório tem como objetivo apresentar o melhor modelo para análise de risco de crédito
baseado num banco de dados do histórico do conjunto de dados financeiros alemão, quantitativos e
qualitativos, fornecida pelo Prof. Hofmann.

Este conjunto de dados German credit (Tuffery, 2011 e Nisbet et al. ,2011) contém dados de 1000
indivíduos e seu histórico de crédito classifica as pessoas descritas por um conjunto de atributos como
riscos de crédito bons ou ruins.

2. Introdução:

O principal objetivo da Análise de Regressão é analisar a relação entre uma variável resposta e uma ou
mais variáveis explicativas, para identificar uma função que a descreva.
Os Modelos Lineares Generalizados (GLM) surgem a partir das limitações da Análise de Regressão Linear.

Com o modelo GLM é possível modelar variáveis de interesse que assumem a forma de contagem,
contínuas simétricas e assimétricas, binárias e categóricas.

Trata-se de um modelo de regressão para variáveis dependentes ou de resposta binomialmente


distribuídas. É útil para modelar a probabilidade de um evento ocorrer como função de outros fatores. É
um modelo linear generalizado que usa como função de ligação a função logit.

A função de ligação “logit” é utilizada na modelagem de fenômenos que podem ser resumidos em uma
variável binária, ou seja, se ocorreu ou não um evento.

Em comparação com a regressão linear, a regressão logística distingue-se essencialmente pelo fato de
que a variável resposta é categórica decorrente da utilização do mecanismo para combinar razões de
chance.

Fonte: pt.wikipedia.org

3. Metodologia:

A metodologia aplicada ao presente trabalho se baseou no desenvolvimento dos seguintes passos:

a) Obtenção dos dados financeiros alemão (Tuffery, 2011 e Nisbet et al. ,2011);

b) Analise exploratória dos dados das covariáveis (Credit.Amount, Purpose, Value.Savings.Stocks,


Duration.of.Credit..month., Account.Balance ) e a resposta Crediability;

c) Ajuste do modelo de GLM para variáveis binárias ;

d) Interpretação do modelo.
4. Desenvolvimento:

O trabalho consiste da análise exploratória dos dados para verificar o comportamento da variável
resposta (Creditability) conforme as covariáveis de entrada (Credit.Amount, Purpose,
Value.Savings.Stocks, Duration.of.Credit..month., Account.Balance), e posterior ajuste GLM para
verificação das covariáveis explicativas com maior significância e que apresente um melhor modelo.

A) Análise exploratória das covariáveis e resposta

0 – tipo de credor bom


1 – tipo de credor mau

Valor de crédito: Apesar da pouca diferença entre a mediana do valor de crédito dos bons credores
(2574,5) e maus credores (2244), o gráfico mostra a maior parte dos maus credores possuem valores de
crédito inferiores aos bons credores.
Finalidade do crédito: A maior concentração de crédito tem a finalidade de compra de carro novo para
os bons credores e de compra de rádio ou televisão para os maus credores. Em segundo lugar os bons
credores utilizam o crédito para compra de rádio ou televisão, também, e em seguida para a compra de
móveis ou equipamentos. Já os maus credores para a compra de carro novo, seguido de móveis ou
equipamentos. Para ambos os tipos de credores o crédito é menos frequentemente usado para
pagamento de reparos e aparelhos domésticos, em ordem decrescente.

Poupança/Títulos: Ambos os tipos de credores possuem seu maior número com valores inferiores a
100DM, sendo que o número de maus credores dessa categoria é quase o dobro de bons credores.
Tempo de crédito: O gráfico mostra que a duração média do crédito dos bons credores foi maior do que
a dos maus credores.

Status da conta existente: O gráfico de barras mostra que o número de bons credores que não possuem
conta corrente é bem inferior aos maus credores que não possuem.
Tempo X valor do crédito: O gráfico nos mostra uma maior concentração em valores de crédito menores
tomados por um curto período de tempo.

B) Ajuste modelo de regressão para dados binários

B.1) Primeira parte

Ajuste 1: Valor de crédito (variável quantitativa)

Call: glm(formula = Creditability ~ Credit.Amount, family = binomial(link =


"logit"), data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.7672 -1.2937 0.7313 0.7998 1.5610

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.388e+00 1.343e-01 10.334 < 2e-16 ***
Credit.Amount -1.422e-04 2.944e-05 -4.831 1.36e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 817.42 on 698 degrees of freedom
AIC: 821.42

Number of Fisher Scoring iterations: 4


Ajuste 2: Finalidade (variável qualitativa)

Call:
glm(formula = Creditability ~ Purpose, family = binomial(link = "logit"),
data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.9728 -1.3632 0.6736 0.8849 1.1774

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.42674 0.16326 2.614 0.008954 **
Purpose1 1.28624 0.36600 3.514 0.000441 ***
Purpose2 0.33540 0.24815 1.352 0.176497
Purpose3 0.94109 0.23928 3.933 8.39e-05 ***
Purpose4 0.26640 0.72571 0.367 0.713548
Purpose5 0.04326 0.59301 0.073 0.941844
Purpose6 0.13287 0.39700 0.335 0.737855
Purpose8 1.36502 1.09239 1.250 0.211458
Purpose9 0.30896 0.30161 1.024 0.305650
Purpose10 -0.42674 1.01324 -0.421 0.673634
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 813.93 on 690 degrees of freedom
AIC: 833.93

Number of Fisher Scoring iterations: 4

Ajuste 3: Poupança/Títulos (variável qualitativa)

Call: glm(formula = Creditability ~ Value.Savings.Stocks, family =


binomial(link = "logit"), data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.1460 -1.4636 0.6195 0.9160 0.9160
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.6515 0.1017 6.404 1.51e-10 ***
Value.Savings.Stocks2 0.1251 0.2717 0.460 0.645339
Value.Savings.Stocks3 0.9580 0.4264 2.247 0.024648 *
Value.Savings.Stocks4 1.5458 0.6170 2.505 0.012232 *
Value.Savings.Stocks5 0.9019 0.2558 3.526 0.000422 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 816.54 on 695 degrees of freedom
AIC: 826.54

Number of Fisher Scoring iterations: 4

Ajuste 4: Tempo de crédito

Call: glm(formula = Creditability ~ Duration.of.Credit..month., family =


binomial(link = "logit"), data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.8710 -1.1510 0.6912 0.8576 1.4792
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.809141 0.178760 10.121 < 2e-16 ***
Duration.of.Credit..month. -0.041591 0.006927 -6.004 1.92e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 803.83 on 698 degrees of freedom
AIC: 807.83

Number of Fisher Scoring iterations: 4

Ajuste 5: Status da conta

Call: glm(formula = Creditability ~ Account.Balance, family = binomial(link =


"logit"), data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.0596 -1.1651 0.5054 0.9184 1.1898

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.70306 0.18864 -3.727 0.000194 ***
Account.Balance 0.67407 0.07681 8.776 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 752.04 on 698 degrees of freedom
AIC: 756.04

Number of Fisher Scoring iterations: 4

Resumo do ajuste: englobando todas as covariáveis do exemplo anterior:

Call: glm(formula = Creditability ~ ., family = binomial(link = "probit"),


data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.6721 -0.8496 0.4655 0.7502 1.9070

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.131e-02 1.777e-01 -0.345 0.73014
Credit.Amount -4.796e-05 2.651e-05 -1.809 0.07048 .
Duration.of.Credit..month. -2.128e-02 5.914e-03 -3.598 0.00032 ***
Account.Balance 3.407e-01 4.674e-02 7.290 3.11e-13 ***
Purpose1 1.016e+00 2.402e-01 4.232 2.32e-05 ***
Purpose2 2.332e-01 1.642e-01 1.420 0.15552
Purpose3 4.752e-01 1.553e-01 3.059 0.00222 **
Purpose4 2.007e-01 4.796e-01 0.418 0.67559
Purpose5 -4.757e-02 4.019e-01 -0.118 0.90577
Purpose6 1.156e-01 2.706e-01 0.427 0.66912
Purpose8 4.500e-01 6.556e-01 0.686 0.49251
Purpose9 3.502e-01 2.061e-01 1.699 0.08934 .
Purpose10 6.689e-01 6.922e-01 0.966 0.33394
Value.Savings.Stocks2 1.564e-02 1.810e-01 0.086 0.93114
Value.Savings.Stocks3 1.639e-01 2.607e-01 0.629 0.52963
Value.Savings.Stocks4 7.076e-01 3.441e-01 2.056 0.03974 *
Value.Savings.Stocks5 4.256e-01 1.623e-01 2.622 0.00875 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 685.48 on 683 degrees of freedom
AIC: 719.48

Number of Fisher Scoring iterations: 5

Ajuste Step: Verificar quais as covariáveis possuem menor AIC para ajuste do modelo final

Start: AIC=719.48
Creditability ~ Credit.Amount + Duration.of.Credit..month. +
Account.Balance + Purpose + Value.Savings.Stocks

Df Deviance AIC
<none> 685.48 719.48
- Credit.Amount 1 688.87 720.87
- Value.Savings.Stocks 4 696.95 722.95
- Purpose 9 710.25 726.25
- Duration.of.Credit..month. 1 698.58 730.58
- Account.Balance 1 740.78 772.78

Call:
glm(formula = Creditability ~ Credit.Amount + Duration.of.Credit..month. +
Account.Balance + Purpose + Value.Savings.Stocks, family = binomial(link =
"probit"), data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.6721 -0.8496 0.4655 0.7502 1.9070

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.131e-02 1.777e-01 -0.345 0.73014
Credit.Amount -4.796e-05 2.651e-05 -1.809 0.07048 .
Duration.of.Credit..month. -2.128e-02 5.914e-03 -3.598 0.00032 ***
Account.Balance 3.407e-01 4.674e-02 7.290 3.11e-13 ***
Purpose1 1.016e+00 2.402e-01 4.232 2.32e-05 ***
Purpose2 2.332e-01 1.642e-01 1.420 0.15552
Purpose3 4.752e-01 1.553e-01 3.059 0.00222 **
Purpose4 2.007e-01 4.796e-01 0.418 0.67559
Purpose5 -4.757e-02 4.019e-01 -0.118 0.90577
Purpose6 1.156e-01 2.706e-01 0.427 0.66912
Purpose8 4.500e-01 6.556e-01 0.686 0.49251
Purpose9 3.502e-01 2.061e-01 1.699 0.08934 .
Purpose10 6.689e-01 6.922e-01 0.966 0.33394
Value.Savings.Stocks2 1.564e-02 1.810e-01 0.086 0.93114
Value.Savings.Stocks3 1.639e-01 2.607e-01 0.629 0.52963
Value.Savings.Stocks4 7.076e-01 3.441e-01 2.056 0.03974 *
Value.Savings.Stocks5 4.256e-01 1.623e-01 2.622 0.00875 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 685.48 on 683 degrees of freedom
AIC: 719.48

Number of Fisher Scoring iterations: 5

Ajuste final: Após análise do AIC

Call: glm(formula = Creditability ~ Credit.Amount +


Duration.of.Credit..month. + Account.Balance + Purpose +
Value.Savings.Stocks, family = binomial(link = "probit"), data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.6721 -0.8496 0.4655 0.7502 1.9070

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -6.131e-02 1.777e-01 -0.345 0.73014
Credit.Amount -4.796e-05 2.651e-05 -1.809 0.07048 .
Duration.of.Credit..month. -2.128e-02 5.914e-03 -3.598 0.00032 ***
Account.Balance 3.407e-01 4.674e-02 7.290 3.11e-13 ***
Purpose1 1.016e+00 2.402e-01 4.232 2.32e-05 ***
Purpose2 2.332e-01 1.642e-01 1.420 0.15552
Purpose3 4.752e-01 1.553e-01 3.059 0.00222 **
Purpose4 2.007e-01 4.796e-01 0.418 0.67559
Purpose5 -4.757e-02 4.019e-01 -0.118 0.90577
Purpose6 1.156e-01 2.706e-01 0.427 0.66912
Purpose8 4.500e-01 6.556e-01 0.686 0.49251
Purpose9 3.502e-01 2.061e-01 1.699 0.08934 .
Purpose10 6.689e-01 6.922e-01 0.966 0.33394
Value.Savings.Stocks2 1.564e-02 1.810e-01 0.086 0.93114
Value.Savings.Stocks3 1.639e-01 2.607e-01 0.629 0.52963
Value.Savings.Stocks4 7.076e-01 3.441e-01 2.056 0.03974 *
Value.Savings.Stocks5 4.256e-01 1.623e-01 2.622 0.00875 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 685.48 on 683 degrees of freedom
AIC: 719.48

Number of Fisher Scoring iterations: 5

B.2) Segunda parte

Modelo binomial com a função de ligação “probit”

Call:
glm(formula = Creditability ~ Credit.Amount + Purpose + Value.Savings.Stocks +
Duration.of.Credit..month. + Account.Balance, family = binomial(link = "probit"),
data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.6680 -0.8500 0.4652 0.7504 1.9145

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.730e-01 1.608e-01 1.698 0.089468 .
Credit.Amount -4.840e-05 2.668e-05 -1.814 0.069670 .
Purpose1 1.019e+00 2.405e-01 4.236 2.28e-05 ***
Purpose2 2.346e-01 1.644e-01 1.427 0.153627
Purpose3 4.737e-01 1.557e-01 3.043 0.002339 **
Purpose4 2.012e-01 4.798e-01 0.419 0.674914
Purpose5 -4.819e-02 4.025e-01 -0.120 0.904697
Purpose6 1.158e-01 2.709e-01 0.427 0.669186
Purpose8 4.481e-01 6.563e-01 0.683 0.494795
Purpose9 3.491e-01 2.063e-01 1.692 0.090629 .
Purpose10 6.757e-01 6.928e-01 0.975 0.329412
Value.Savings.Stocks2 1.060e-02 1.835e-01 0.058 0.953959
Value.Savings.Stocks3 1.640e-01 2.609e-01 0.629 0.529503
Value.Savings.Stocks4 7.043e-01 3.444e-01 2.045 0.040859 *
Value.Savings.Stocks5 4.248e-01 1.626e-01 2.613 0.008969 **
Duration.of.Credit..month. -2.128e-02 5.918e-03 -3.596 0.000323 ***
Account.Balance2 3.632e-01 1.431e-01 2.539 0.011110 *
Account.Balance3 6.889e-01 2.270e-01 3.035 0.002409 **
Account.Balance4 1.026e+00 1.441e-01 7.124 1.05e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 685.45 on 681 degrees of freedom
AIC: 723.45

Number of Fisher Scoring iterations: 5

Modelo binomial com a função de ligação “logit”

Call:
glm(formula = Creditability ~ Credit.Amount + Purpose + Value.Savings.Stocks +
Duration.of.Credit..month. + Account.Balance, family = binomial(link = "logit"),
data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.5831 -0.8255 0.4664 0.7377 1.9218

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 4.543e-01 2.673e-01 1.700 0.089155 .
Credit.Amount -7.547e-05 4.521e-05 -1.669 0.095072 .
Purpose1 1.720e+00 4.239e-01 4.058 4.94e-05 ***
Purpose2 3.914e-01 2.773e-01 1.412 0.158050
Purpose3 8.072e-01 2.676e-01 3.017 0.002555 **
Purpose4 3.076e-01 8.110e-01 0.379 0.704480
Purpose5 6.397e-02 6.831e-01 0.094 0.925395
Purpose6 2.324e-01 4.669e-01 0.498 0.618604
Purpose8 6.571e-01 1.155e+00 0.569 0.569356
Purpose9 6.219e-01 3.529e-01 1.762 0.078047 .
Purpose10 1.200e+00 1.173e+00 1.023 0.306415
Value.Savings.Stocks2 1.632e-02 3.126e-01 0.052 0.958370
Value.Savings.Stocks3 3.201e-01 4.734e-01 0.676 0.498986
Value.Savings.Stocks4 1.290e+00 6.502e-01 1.983 0.047339 *
Value.Savings.Stocks5 7.972e-01 2.888e-01 2.761 0.005765 **
Duration.of.Credit..month. -3.745e-02 1.010e-02 -3.706 0.000211 ***
Account.Balance2 5.845e-01 2.375e-01 2.461 0.013849 *
Account.Balance3 1.176e+00 3.955e-01 2.972 0.002957 **
Account.Balance4 1.751e+00 2.531e-01 6.917 4.62e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 685.00 on 681 degrees of freedom
AIC: 723

Number of Fisher Scoring iterations: 5

Modelo binomial com a função de ligação “cloglog”

Call:
glm(formula = Creditability ~ Credit.Amount + Purpose + Value.Savings.Stocks +
Duration.of.Credit..month. + Account.Balance, family = binomial(link = "cloglog"),
data = dados)

Deviance Residuals:
Min 1Q Median 3Q Max
-2.8344 -0.9133 0.4745 0.7741 1.7561

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -8.374e-02 1.685e-01 -0.497 0.61920
Credit.Amount -5.892e-05 2.864e-05 -2.057 0.03964 *
Purpose1 1.011e+00 2.232e-01 4.530 5.91e-06 ***
Purpose2 2.215e-01 1.636e-01 1.354 0.17567
Purpose3 4.492e-01 1.484e-01 3.028 0.00246 **
Purpose4 2.805e-01 4.659e-01 0.602 0.54718
Purpose5 -2.868e-01 4.240e-01 -0.677 0.49870
Purpose6 1.936e-02 2.692e-01 0.072 0.94266
Purpose8 5.020e-01 5.597e-01 0.897 0.36974
Purpose9 3.227e-01 2.024e-01 1.594 0.11084
Purpose10 4.867e-01 7.897e-01 0.616 0.53768
Value.Savings.Stocks2 2.760e-03 1.766e-01 0.016 0.98753
Value.Savings.Stocks3 9.171e-02 2.227e-01 0.412 0.68045
Value.Savings.Stocks4 6.323e-01 2.839e-01 2.227 0.02595 *
Value.Savings.Stocks5 3.171e-01 1.462e-01 2.168 0.03014 *
Duration.of.Credit..month. -1.915e-02 6.055e-03 -3.162 0.00157 **
Account.Balance2 3.954e-01 1.500e-01 2.636 0.00839 **
Account.Balance3 6.599e-01 2.092e-01 3.155 0.00161 **
Account.Balance4 9.846e-01 1.392e-01 7.072 1.53e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 841.21 on 699 degrees of freedom


Residual deviance: 686.85 on 681 degrees of freedom
AIC: 724.85

Number of Fisher Scoring iterations: 7

C) Interpretação dos coeficientes do modelo da letra B

No ajuste para os dados binários foram utilizados modelos de regressão com a utilização de apenas 700
observações. Para o ajuste com dos modelos utilizando as funções de ligação probito, logito e log-log
(segunda parte B.2), foram analisadas todas as covariáveis relacionadas na primeira parte da letra B.1
(Ajuste 1, Ajuste 2, Ajuste 3, Ajuste 4 e Ajuste 5).
Observamos que os AIC’s obtidos na análise feita englobando todas as 5 covariáveis foram os seguintes:

Modelo AIC
Probito 723,45
Logito 723
Log-log 724,85

Teste de hipótese a um nível de significância de 5%

D) Interpretação dos coeficientes do modelo da letra B

Analysis of Deviance Table

Model: binomial, link: probit

Response: Creditability

Terms added sequentially (first to last)

Df Deviance Resid. Df Resid. Dev Pr(>Chi)


NULL 699 841.21
Credit.Amount 1 23.626 698 817.59 1.170e-06 ***
Duration.of.Credit..month. 1 15.451 697 802.14 8.467e-05 ***
Account.Balance 1 79.427 696 722.71 < 2.2e-16 ***
Purpose 9 25.765 687 696.95 0.002232 **
Value.Savings.Stocks 4 11.470 683 685.48 0.021763 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

A um nível de significância a 5% todas as covariáveis explicativas são significativas para o modelo.

E) Aplicando o modelo as 300 amostras que ficaram de fora e analisando o erro


A análise do gráfico acima dos resíduos das 300 amostras deixadas de fora mostra que, apesar dos
baixos valores de resíduos, não possuem um padrão assimétrico desejável, ou seja o modelo não se
ajusta bem às 300 amostras.

Você também pode gostar