Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo—Redes neurais são ferramentas poderosas para classificação Algoritmo (GA) e Enxame de Partículas Binárias (BPS)
e regressão, mas é difícil e demorado determinar a melhor arquitetura Otimização. A função objetivo a maximizar é a curva ROC (Receiver
para um determinado problema. Neste artigo, dois algoritmos Operating Characteristic) e as variáveis de decisão são o número de
evolucionários, Algoritmos Genéticos (GA) e Binary Particle Swarm camadas ocultas e sua função de ativação, o número de unidades
Optimization (BPS), são usados para otimizar a arquitetura de uma Rede ocultas em cada camada, a função de ativação da camada de destino
Neural Perceptron Multi-Layer (MLP), a fim de melhorar o poder preditivo
e se usar polarização ou ter uma conexão direta entre a camada de
do risco de crédito scorecards. Os resultados mostram que ambos os
entrada e saída. Embora uma metodologia de otimização semelhante
métodos superam a regressão logística e uma rede neural padrão em
tenha sido desenvolvida em outras áreas, no caso do GA [3][18], até
termos de previsibilidade, mas o AG consome mais tempo do que o
onde sabemos, essas metodologias não foram aplicadas para
BPS. O poder preditivo de ambos os métodos é semelhante ao do
melhorar os scorecards de risco de crédito.
Global Optimum, mas é encontrado em um tempo razoável.
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
padronizada e a TABELA I apresenta a estatística descritiva das sete camada pode ter a opção de polarização ativada. Um termo de polarização
variáveis, enquanto a TABELA II apresenta a correlação entre elas. pode ser tratado como um peso de conexão de uma unidade especial com
A correlação máxima entre as sete variáveis é de 0,017. Finalmente, um valor de ativação constante diferente de zero. O termo "bias" é geralmente
a TABELA III mostra como os dados originais são divididos usado em relação a uma "unidade de polarização" com um valor constante de
aleatoriamente em três conjuntos de dados diferentes usados para o um.
desenvolvimento e validação do scorecard. A unidade de polarização única é conectada a todas as unidades ocultas
ou de saída que precisam de um termo de polarização. Portanto, os termos de
viés podem ser aprendidos como outros pesos.
TABELA II. MATRIZ DE CORRELAÇÃO
X1 x2 X3 X4 X5 X6 X7
X1 1 0,001 -0,005 0,004 0,017 0,003 0,000
726
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
727
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
solução é alcançada. Para informações mais detalhadas sobre as TABELA V. FUNÇÕES DE CAMADAS OCULTAS
Logística:
Linear:
Logística M:
Softmax:
Gauss:
Logística:
Escondido
Linear: Camada Alvo
Camadas Camada Alvo
Ativação
Ativação Viés
Função
artano:) Função
11 = Tan H 11 = Gauss
728
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
Da mesma forma, as variáveis dos cromossomos/partículas são poder preditivo em todos os níveis de risco. A única alternativa que
codificadas conforme mostrado na TABELA VI. supera ligeiramente o desempenho do AG e do BPS é o ótimo global
Finalmente, existem algumas definições-chave que são específicas (71,26%), mas a diferença é tão pequena que não representa uma
para cada um dos algoritmos de otimização. Para o AG existe o melhora significativa na predição
tamanho total da população, o número de indivíduos de “elite” e a poder.
porcentagem de genes a sofrer mutação de toda a população
TABELA VII. MEDIDAS DE COMPARAÇÃO
cromossômica. Correspondentemente, o tamanho da população é de
16 indivíduos (cromossomos), os quatro melhores cromossomos da Modelo Tempo de CPU ROC (m) Chamadas de função
solução permanecerão inalterados e a porcentagem de mutação é de MLP padrão 68,09% 2 1
2% dos genes da população total. No caso do BPS, o tamanho da 1 1
Regressão Logística 65,92%
população é igual a 10, o número de iterações é definido como 10, o
GA-MLP 71,25% 559 274
peso da inércia é 0,6 e tanto c1 quanto c2 são definidos como 0,6.
BPS - MLP 71,25% 204 100
71,35%
71,20%
71,05%
70,90%
70,75%
70,60%
70,45%
ROC
70,30%
Figura 5. Curva ROC de comparação
70,15%
70,00%
A comparação das curvas ROC obtidas pelo GA, e o BPS na rede
MLP e as outras três 69,85%
BPS GA
alternativas são exibidas na Fig. 5. A área sob a curva ROC do GA e o 69,70%
729
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
Adicionalmente, uma terceira comparação foi feita em relação No modelo de cobrança, as economias foram calculadas como a
à evolução da função de otimização (curva ROC) a cada iteração. diferença nas taxas anuais de cobrança. A economia alcançada
As curvas de aprendizado do GA e BPS são mostradas na Fig. 6. pelo poder preditivo adicional dos modelos GA/BPS sobre a
A curva de aprendizado do GA tem inclinação de 0,0006 enquanto Regressão Logística foi de US$ 33.490. Da mesma forma, a
a do BPS tem inclinação de 0,0018 o que se traduz em um aumento economia da rede GA/BPS sobre o modelo de Rede Neural MLP
médio de 208,65% na velocidade de evolução do ROC das redes foi de US$ 12.997.
resultantes em cada iteração do BPS sobre o GA. Por fim, como o modelo de cartão de crédito de aquisição
desenvolvido para o estudo deste trabalho também está sendo
Da mesma forma, é importante observar que, mesmo na
utilizado pelo banco, os cálculos de poupança também foram
primeira iteração, ambos os algoritmos de otimização superam o
medidos pela perda esperada anual. A economia do GA/BPS sobre
poder preditivo da Regressão Logística final e da Rede Neural MLP
padrão. a Regressão Logística e o MLP padrão foi de US$ 225.216 e US$
181.152, respectivamente.
B. Impacto no mundo Por fim, a fim de mostrar que é necessário alterar a arquitetura
real Além dos dados usados para desenvolver os modelos de da rede neural MLP para melhor se adequar a cada modelo e,
originação de cartão de crédito referidos neste caso de estudo, os portanto, é eficiente usar o algoritmo de otimização para isso. A
algoritmos de otimização foram usados para desenvolver dois TABELA IX mostra as diferentes arquiteturas finais das Redes
modelos adicionais com conjuntos de dados completamente Neurais encontradas com os algoritmos GA/BPS para cada modelo.
diferentes que também estão sendo usados atualmente pelo banco:
i ) A modelo de comportamento do cartão de crédito e um ii) modelo
TABELA IX. ARQUITETURA DE REDE NEURAL GA/PSO MLP
de cobrança [4]. Para cada modelo foi calculada uma Regressão
Logística, uma Rede Neural default, um BPS e um AG. Para ambos Escondido Alvo
direto Escondido Alvo
Escondido Escondido
os casos, os resultados dos algoritmos de otimização foram os Modelo
Unidades
íon de Camadas
Camadas
Ativação
Camada
Ativação Camada
Camadas
conexão Viés Viés
mesmos e, portanto, apenas um é exibido. Função Função
Para mensurar o impacto gerado no banco pela aplicação da Aquisição 2 6 0 1 BRONZEADO SOF 0
rede resultante BPS/GA sobre o modelo de Regressão Logística e
Comportamento 3 3 0 1 TANH Logística 0
o modelo de Rede Neural default, foram realizadas duas
comparações. A primeira comparação refere-se à diferença entre o Coleções 1 5 0 1 BRONZEADO
logística 1
730
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
deve ser abordado como selecionar variáveis antes de usá-las para o (1)
desenvolvimento da Rede Neural e como simplificar a interpretação de
metodologias complexas para apresentar à alta administração. Como não temos o saldo de cada cliente, ele é estimado como o
limite médio de crédito multiplicado pela utilização média.
SERRA. CONCLUSÃO
não é uma boa prática usar uma única arquitetura para desenvolver População acima do corte 2.574 2.502 $ 1.575.288 36.156
diferentes modelos. Clientes ruins esperados $ 1.531.224 $ 1.350.072 2.206
Além disso, os resultados experimentais mostraram que com muito Perda esperada
menos esforço computacional o AG e o BPS usados para otimizar a Rede B. Modelo de comportamento
Neural MLP chegaram a um resultado aproximadamente igual ao ótimo
global. Além disso, como a diferença entre as curvas ROC dos algoritmos O processo de cálculo da economia do modelo de comportamento é
de otimização e o ótimo global é insignificante, ilustramos que isso não semelhante ao modelo de aquisição, no qual a economia é definida como
representa uma melhoria no poder preditivo do scorecard. as diferenças da perda esperada. Dada a diferente utilização do modelo
comportamental versus modelo de aquisição, a perda esperada é
calculada como o saldo dos clientes inadimplentes que estavam acima do
Também é importante dizer que o AG e o BPS superaram os ponto de corte no momento da estratégia de aumento do limite de crédito.
resultados da Regressão Logística e os resultados da Rede Neural MLP
padrão.
TABELA XII. SUPOSIÇÕES DO MODELO DE COMPORTAMENTO
Por fim, embora ambos os algoritmos de otimização tenham
apresentado o mesmo valor ROC final, o BPS superou o GA em tempo de Variável Valor
CPU e chamadas de função. Número de clientes 844.177
Linha de crédito média $ 1.500
APÊNDICE Linha de crédito média
58,0%
% aumentada
Cálculo da poupança para cada modelo usando o banco
Linha de crédito média
informações internas: aumentado
$ 870
Gravidade 85,0%
A. Modelo de aquisição
Utilização média 48,0%
Para o modelo de aquisição a economia é definida como a diferença
de perda esperada entre os modelos. Para calcular a perda esperada, TABELA XIII. CÁLCULO DA PERDA ESPERADA DO MODELO DE COMPORTAMENTO
Utilização média 48,0% Para o modelo de cobrança, a economia será calculada como a
diferença nas taxas de cobrança. Uma política interna estabelece que
Uma taxa de aprovação fixa de 53,08% foi encontrada após a todo cliente com probabilidade de inadimplência superior a 15% deve ser
determinação do ponto de corte estatístico no modelo de Regressão contatado pela equipe de cobrança.
Logística [8]. Em seguida, para cada modelo, a taxa ruim acima do ponto Portanto, a economia é calculada como a diferença entre o número de
de corte estatístico é calculada. clientes abaixo do ponto de corte multiplicado pelo custo de uma ação de
Conforme mostrado em [8], a perda esperada de um cliente é definida cobrança.
da seguinte forma:
731
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.
Machine Translated by Google
TABELA XIV. SUPOSIÇÕES DO MODELO DE COLEÇÃO [7] R. Matignon. Modelagem de redes neurais usando SAS Enterprise Miner.
Casa Aitor. 2005.
Variável Valor
[8] E. Mays. Credit Scoring para Gestores de Risco. O Manual para Credores. Thomson
Número médio de
541.234 Sudoeste. Mason, Ohio. 2004.
clientes por mês
[9] F, Rosenblatt. Princípios de Neurodinâmica. Spartan, Washington,
Custo por cliente por
$ 1,06 DC. 1962.
mês
[10] Ajuda e documentação do SAS Institute Inc. Sas, Proc Neural. Instituto SAS, Cary,
NC. 2010.
TABELA XV. CÁLCULO DE CUSTOS DO MODELO DE COLETA
[11] LC Tomás. Credit Scoring e suas aplicações. Sião, Filadélfia. 2002.
Padrão GA/ PSO
Modelo Logística MLP MLP
[12] LC Tomás. Modelos de crédito ao consumidor: preços, lucro e
População abaixo do ponto de corte 13,0% 12,7% 12,5%
Portfólios. Oxford, Nova York. 2009.
Clientes com ações de
70.415 68.802 67.779 [13] B. Wamer, M. Misra. Compreendendo Redes Neurais como Ferramentas
cobrança por mês Estatísticas. A Associação Americana de Estatísticos. 1996.
Clientes com ações de
844.975 825.620 813.345 [14] R. Eberhart e J. Kennedy, Um novo otimizador usando a teoria do enxame de
cobrança por ano
partículas, Proc. Sixth International Symposium on Micro Machine and Human
Custo por ano $ 894.679 $ 874.186 $ 861.189
Science (Nagoya, Japão), IEEE Service Center, Piscataway, NJ, pp. 39-43, 1995.
REFERÊNCIAS
[15] J. Kennedy e R. Eberhart, "Particle Swarm Optimization", IEEE International
[1] C. Abranhams, M. Zhang, Fair Lending Compliance. John Wiley & Conference on Neural Networks (Perth, Austrália), IEEE Service Center,
Filhos, Inc. 2009. Piscataway, NJ, IV, pp. 1942-1948, 1995.
[2] PD Allison. Regressão Logística utilizando o sistema SAS: Teoria e [16] J. Kennedy e R. Eberhart, Uma versão binária discreta do algoritmo de enxame de
Aplicativo. Instituto Sas e Wiley. partículas, IEEE International Conference on Systems, Man, and Cybernetics,
1997.
[3] Paasch, Carsten AW Detecção de fraude de cartão de crédito usando redes neurais
artificiais ajustadas por algoritmos genéticos. Universidade de Ciência e [17] MA Khanesar, M. Teshnehlab, MA Shoorehdeli, Uma nova otimização de enxame
Tecnologia de Hong Kong. 2008. de partículas binárias, IEEE 15ª Conferência do Mediterrâneo sobre Controle e
Automação, 2009.
[4] R. Anderson. O kit de ferramentas de pontuação de crédito: teoria e prática para
gerenciamento de risco de crédito de varejo e automação de decisões. Oxofrd [18] Frank HF Leung, membro, IEEE, HK Lam, SH Ling e Peter KS Tam, ajuste da
University Press Inc, Nova York. 2007. estrutura e parâmetros de uma rede neural usando um algoritmo genético
aprimorado, transações IEEE em redes neurais, VOL. 14, Nº. 1 de janeiro de
[5] R. Haupt, S. Haupt. Algoritmos Genéticos Práticos, segunda edição.
2003.
John Wiley & Filhos. Nova Iorque. 2004.
[6] D. Lawrence, A. Solomon. Gestão de um negócio de crédito ao consumidor.
Salomão, Nova York. 2002.
732
Uso licenciado autorizado limitado a: UNIVERSIDADE DE SAO PAULO. Baixado em 04 de abril de 2023 às 01:39:28 UTC do IEEE Xplore. Restrições aplicadas.