Escolar Documentos
Profissional Documentos
Cultura Documentos
Recebido: 14 de agosto de 2021, Resumo—A maioria das grandes instituições brasileiras que trabalham com concessão
de crédito utiliza modelos de crédito para avaliar o risco de empréstimos ao consumidor.
Recebido em forma revisada: 15 de setembro de 2021,
Qualquer aprimoramento nas técnicas que venha a trazer maior precisão de um modelo
Aceito: 22 de setembro de 2021,
de previsão proporcionará retorno financeiro à instituição. A primeira fase deste estudo
Disponível online: 30 de setembro de 2021 introduz os conceitos de crédito e risco. Posteriormente, com uma amostra de candidatos
©2021 O(s) autor(es). Publicado por AI de uma grande instituição financeira brasileira, três modelos de pontuação de crédito são
Publicação. Este é um artigo de acesso aberto sob construídos aplicando essas técnicas distintas: Regressão Logística, Redes Neurais e
a licença CC BY (https:// Algoritmos Genéticos. Por fim, a qualidade e o desempenho desses modelos são
creativecommons.org/licenses/by/4.0/). avaliados e comparados para identificar o melhor. Os resultados obtidos pelos modelos
de regressão logística e rede neural são bons e muito semelhantes, embora o primeiro
Palavras-chave—risco de crédito , modelos de credit
seja um pouco melhor. Os resultados obtidos com o modelo de algoritmo genético também
scoring, algoritmos genéticos, regressão logística,
são bons, mas um pouco inferiores. Este estudo mostra os procedimentos a serem
redes neurais.
adotados por uma instituição financeira para identificar o melhor modelo de crédito para
avaliar o risco de empréstimos ao consumidor. A utilização do modelo mais adequado
favorecerá a definição de uma estratégia empresarial adequada, aumentando assim os
lucros.
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
Uso mais extensivo dos modelos nos anos sessenta (1997) destacam ainda a Análise Discriminante, Regressão Linear e
negócios transformados no mercado americano (Thomas, 2000). Não Árvores de Decisão como métodos que podem ser usados na prática.
só as empresas da área financeira, mas também os grandes varejistas Não existe um método claramente melhor que os outros, tudo depende
passaram a utilizar modelos de credit scoring para realizar vendas a de como a técnica eleita se ajusta aos dados.
prazo para seus consumidores. Varejistas como Wards, Bloomingdale's
e JC Penney foram alguns dos pioneiros nesse segmento.
6. Definição dos critérios de comparação dos modelos
(1992) sugere uma amostra de 1.500 clientes bons e 1.500 clientes ruins Para a realização deste estudo foi feito um sorteio aleatório num
para alcançar resultados robustos. universo de clientes do banco, 10.000 contratos de crédito, considerados
Habitualmente são utilizadas três amostras, uma para construção do como bons e 10.000 considerados como maus. Todos esses contratos
modelo, outra para a validação do modelo e uma terceira para testar o já haviam vencido, ou seja, a amostra foi coletada após o vencimento
modelo.
da última parcela de todos os contratos. Este é um banco de dados
4. Análise descritiva e preparação dos dados histórico
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
para construção do modelo, 8.000 dados (4.000 bons e 4.000 ruins), o ÿ 'X Z
e e
segundo para validação do modelo construído, 6.000 dados (3.000 =
p(X) E(Y) = =
'X Z
bons e 3.000 ruins) e o terceiro também com 6.000 (com a mesma ÿ1e+ 1e+
divisão igualitária) para testar a modelo obtido. Inicialmente, neste trabalho serão incluídas todas as variáveis para
a construção do modelo; porém no modelo logístico final, apenas
3.3 As Variáveis algumas das variáveis serão selecionadas. A escolha das variáveis
será feita por meio do método forward stepwise, que é o mais utilizado
o disponível explicativo variáveis têm
em modelos de regressão logística.
características que podem ser divididas em dois grupos: Variáveis do
Arquivo de Referência e Variáveis de Utilização e Restrição. As
variáveis do arquivo de referência estão relacionadas ao Fensterstock (2005) aponta as seguintes vantagens no uso da
cliente e as Variáveis de Utilização e Restrição referem-se à restrição regressão logística para a construção de modelos:
de crédito e aponta sobre os demais
• O modelo gerado leva em consideração a correlação entre
operações de crédito existentes no mercado. variáveis, identificando relações que não seriam visíveis e eliminando
As variáveis do arquivo de referência, bem como as de variáveis redundantes;
Utilização e Restrição são coletadas quando o cliente
contrata o produto. •
Leva em consideração as variáveis individualmente e
Essa definição da Variável Dependente, também chamada de • O usuário pode verificar as fontes de erro e otimizar o modelo.
independentes podem ser categóricas (desde que dicotomizadas após apresentam um modelo matemático baseado na estrutura neural de
a transformação) ou contínuas (Almeida et al., 2020). organismos inteligentes e que adquirem conhecimento através da
experiência.
O modelo de Regressão Logística é um caso particular dos Modelos Foi somente na década de oitenta que, devido ao maior poder
Lineares Generalizados (Lopes et al., 2017). A função que caracteriza computacional, as redes neurais foram amplamente estudadas e
o modelo é dada por (Ye & Bellotti, 2019): aplicadas. Rojas (1996) destaca o desenvolvimento do algoritmo de
retropropagação como o ponto de virada para a popularidade das redes
neurais.
ln ÿ p(X)
ÿ
ÿÿ ÿ ÿ ÿ 1 p(X) = ÿ COM
= 'X Um modelo de rede neural artificial processa certas características
e produz respostas como as do cérebro humano. As redes neurais
ÿ
ÿ
artificiais são desenvolvidas usando modelos matemáticos nos quais
' (ÿn
ÿ= , ÿ1
) ÿ0 , ÿ2
,..., : vetor dos parâmetros as seguintes suposições são feitas (Rojas, 1996):
associado às variáveis
p(X)=E(Y=1|X): probabilidade do indivíduo ter sido 1. O processamento da informação ocorre dentro dos chamados
classificado como bom, dado o vetor X. neurônios;
Essa probabilidade é expressa por (Gonçalves et al., 2013): 2. Os estímulos são transmitidos pelos neurônios através de
conexões;
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
3. Cada conexão é associada a um peso que, em uma rede 1. As redes feedforward com uma única camada são as redes
neural padrão, se multiplica ao receber um estímulo; mais simples, nas quais há apenas uma camada de entrada e uma
camada de saída. Algumas redes que utilizam esta arquitetura são:
4. Cada neurônio contribui para a ativação Hebb Network, perceptron, ADALINE, entre outras.
•
Os sinais são apresentados na entrada;
3. Redes recorrentes: neste tipo de rede, a camada de saída
• Cada sinal é multiplicado por um peso que
possui pelo menos uma conexão que realimenta a rede. As redes
indica sua influência na saída da unidade;
denominadas BAM (Biderectal Associative Memory) e ART1 e
• A soma ponderada dos sinais que produz ART2 (Adaptative Resonance Theory) são redes recorrentes.
um nível de atividade é feito;
• Se este nível exceder um limite, a unidade produz um A qualidade mais importante das redes neurais é a capacidade
saída. de “aprender” de acordo com o ambiente e, assim, melhorar seu
desempenho (Deiu-merci & Mayou, 2018).
Existem sinais de entrada X 1 ,x 2 ,...,
Xp 1 e
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
A ideia dos algoritmos genéticos se assemelha à evolução das • Continuam a ser pouco utilizados para problemas de avaliação de
espécies proposta por Darwin: os algoritmos vão evoluir com o passar risco de crédito (Fensterstock, 2005)
das gerações e os candidatos à solução do problema que se quer •
Exigem um grande esforço computacional (Berry &
resolver “mantêm-se vivos” e reproduzem-se (Silva et al., 2019 ).
Linoff, 2004)
•
Estão disponíveis em apenas alguns softwares (Berry &
O algoritmo é composto por uma população que é representada por
Linoff, 2004)
cromossomos que são apenas as várias soluções possíveis para o
Critérios de Avaliação de Desempenho
problema proposto. As soluções que são selecionadas para formar novas
soluções (a partir de um cruzamento) são selecionadas de acordo com Para avaliar o desempenho do modelo foram selecionadas duas
a aptidão dos cromossomos pais. Assim, quanto mais apto for o amostras, uma para validação e outra para teste.
cromossomo, maior a possibilidade de se reproduzir. Este processo é Ambos eram do mesmo porte (3.000 clientes considerados bons e 3.000
repetido até que a regra de parada seja satisfeita, ou seja, para encontrar considerados ruins, para cada um). Além das amostras, são utilizados
uma solução muito próxima da esperada. outros critérios, que são apresentados nesta seção.
Cross-over: dois pais são escolhidos e a partir deles é gerada uma Neste trabalho, como não há informações a priori sobre o que seria
descendência, com base em um critério de cruzamento específico. O mais atrativo para a instituição financeira
mesmo critério é usado com outro (identificação dos clientes bons ou ruins), o produto entre a pontuação
cromossomo e o material de ambos os cromossomos é de acertos dos clientes bons e ruins (Ih) será utilizado como indicador de
trocado. Se não houver cruzamento, a prole é uma cópia exata dos pais. acertos para avaliar a qualidade do modelo. Este indicador privilegiará
os modelos com maiores pontuações de acertos para ambos os tipos de
clientes. Quanto maior for o indicador, melhor será o modelo.
Mutação é uma alteração em um dos genes do cromossomo. O
objetivo da mutação é evitar que a população convirja para um máximo
local. Assim, caso ocorra essa convergência, a mutação garante que a 3.9 O teste de Kolmogorov-Smirnov
população salte sobre o ponto mínimo local, buscando atingir outros O Kolmogorov-Smirnov (KS) é o outro critério frequentemente
pontos máximos. utilizado na prática e utilizado neste trabalho (Fonseca et al., 2019; Lin,
2013; Machado, 2015).
Verificação do critério de parada: criada uma nova geração, verifica- O teste KS é uma técnica não paramétrica para determinar se duas
se o critério de parada e caso este critério não tenha sido atendido, volta- amostras foram coletadas da mesma população (ou de populações com
se para a etapa da função de aptidão. distribuições semelhantes)(Jakliÿ et al., 2018). Este teste é baseado na
distribuição acumulada das pontuações dos clientes
Os seguintes pontos positivos na utilização de
algoritmos genéticos devem ser destacados: considerados bons e ruins.
• Para verificar se as amostras têm a mesma distribuição, existem
Ao contrário das redes neurais, elas produzem resultados
explicáveis (Berry & Linoff, 2004) tabelas a serem consultadas de acordo com o nível de significância e
• tamanho da amostra (Siegel & Castellan Jr, 2006). Neste trabalho, como
Seu uso é fácil (Berry & Linoff, 2004)
as amostras são grandes, a tendência é que todos os modelos rejeitem
• Eles podem trabalhar com um grande conjunto de dados e
a hipótese de distribuições iguais. O melhor modelo será aquele com
variáveis (Fensterstock, 2005)
maior
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
valor no teste, pois esse resultado indica um spread maior entre o bom • As variáveis telefone comercial e telefone residencial foram
e o ruim. recodificadas na forma binária como titularidade ou não;
Os riscos relativos também foram calculados para o eleito foi forward stepwise.
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
hipótese estatística de que as classificações previstas nos grupos são produzida pela camada de saída. Na segunda etapa, a saída obtida é
iguais às observadas. Portanto, este é um teste de adequação do comparada à saída desejada para esse padrão específico.
modelo aos dados.
Se não estiver correto, o erro é estimado. O erro é propagado a partir
A estatística qui-quadrado apresentou o resultado 3,4307, com
da camada de saída para a camada de entrada, e os pesos das
oito graus de liberdade e nível descritivo igual a 0,9045. Este resultado
conexões das unidades das camadas internas vão sendo modificados,
leva à não rejeição da hipótese nula do teste, endossando a aderência
enquanto o erro é retropropagado. Este procedimento é repetido nas
do modelo aos dados.
iterações sucessivas até que o critério de parada seja atingido.
As redes MLP podem ser treinadas usando os seguintes Inicialmente, a classificação ruim é de 50%, pois a alocação de
algoritmos: Gradiente Descendente Conjugado, Levenberg Marquardt, um indivíduo como cliente bom ou ruim é aleatória; com o aumento
Retropropagação, Propagação Rápida ou Delta bar-Delta. O mais das iterações, atinge-se o melhor resultado de 30,6% de erro para a
comum (Rojas, 1996) é o algoritmo Backpropagation que será amostra de treinamento e de 32,3% para a amostra de validação.
detalhado mais adiante.
O modelo implementado possui uma camada de entrada de Algumas das estatísticas da rede adotada estão na tabela 2.
neurônios, uma camada de saída de um único neurônio, que
corresponde ao resultado se um cliente é bom ou ruim na classificação Tabela 2: Estatísticas da rede neural
da rede. Ele também tem um intermediário
Estatísticas obtidas Teste Validação
camada com três neurônios, pois foi a rede que apresentou os
melhores resultados, tanto na consulta de maior percentual de acertos Classificação incorreta de casos 0,306 0,323
quanto na consulta de redução do erro médio. Redes com um, dois ou erro médio 0,576 0,619
quatro neurônios também foram testadas neste trabalho.
erro quadrático médio 0,197 0,211
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
Além do erro de classificação e do erro médio, também são Função Fitness: cada cliente foi associado ao
apresentados o erro quadrático e os graus de liberdade. estimativa de uma pontuação e classificada como boa ou ruim.
O erro quadrático médio é calculado pela média dos quadrados das Comparando com as informações já conhecidas a priori sobre a
diferenças entre o observado e o obtido da rede. natureza do cliente, pode-se calcular a precisão de cada cromossomo.
O indicador de acertos (Ih), será a função fitness, ou seja, quanto
maior o indicador melhor será o cromossomo.
O número de graus de liberdade do modelo está relacionado ao
número de pesos estimados, à ligação de cada um dos atributos aos
neurônios do Seleção: Neste trabalho foi utilizado um elitismo de 10% para
camada intermediária e para a ligação da camada intermediária com a cada nova geração, os vinte melhores cromossomos são mantidos
a saída. enquanto os outros cento e oitenta são formados por cruzamento e
mutação.
4.4 Algoritmos Genéticos
Cross-over: para escolher os pais para cruzamento foi utilizado o
O algoritmo genético foi utilizado para encontrar uma equação
método conhecido como roleta para seleção
discriminante que permitisse pontuar os clientes e, posteriormente,
entre esses vinte cromossomos que foram mantidos (Oreski et al.,
separar os bons dos ruins de acordo com a pontuação alcançada. A
2012). Nesse método, cada indivíduo recebe uma probabilidade de
equação pontua os clientes e os com maior pontuação são
ser sorteado de acordo com seu valor da função de aptidão.
considerados bons, enquanto os ruins são os com menor pontuação.
Essa rota foi adotada por Metawa et al., (2017) e Picinini et al. (2003).
Para o processo de troca de material genético foi utilizado um
método conhecido como uniform cross-over (Galvan, 2016). Nesse
O algoritmo implementado foi semelhante ao apresentado em
tipo de cross-over, cada gene do cromossomo do filho é escolhido
Picinini et al. (2003). Cada uma das 71 categorias de variáveis recebeu
aleatoriamente entre os genes de um dos pais, enquanto o segundo
um peso aleatório inicial.
filho recebe os genes complementares do segundo pai.
A esses setenta e um coeficientes foi introduzido mais um, uma
constante aditiva incorporada à equação linear. O valor da pontuação
do cliente é dado por: Mutação: no processo de mutação, cada gene do cromossomo é
Sj = ÿ ()
wi pij ,
onde tem 0,5% de probabilidade de sofrer mutação. Sempre que um gene
é escolhido para mutação, a alteração genética é realizada,
=1
eu
adicionando um pequeno valor escalar k neste gene. No experimento
S
j = Pontuação obtida pelo cliente j descrito, um valor variando entre -0,05 e + 0,05 foi sorteado
aleatoriamente.
wi = Peso relativo à categoria i
Verificação do critério de parada: um número máximo
bebida = indicador binário igual a 1, se o cliente j tiver de gerações igual a 600 foi definido como o critério de parada. Após
seiscentas iterações, o cromossomo adequado será a solução.
a categoria i e 0, inversamente.
Assim, o problema que o algoritmo tem que resolver é encontrar maior que -0,15 seriam descartadas por não terem peso significativo
para o modelo. Neste trabalho, após realizar uma análise de
o vetor W= [ ] resultando emw,w,...,
um2 w721
sensibilidade, decidiu-se que as variáveis com peso maior que 0,10
critério de classificação com bom índice de acertos na previsão do
ou menor que – 0,10 seriam consideradas significativas para o modelo.
desempenho do pagamento do crédito.
Essa regra não foi aplicada para a constante, que se mostrou
Seguindo as etapas de um algoritmo genético, tem-se: importante para o modelo mesmo com valor abaixo do corte.
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
logística Ruim Bom % Correto Ruim Bom % Correto Ruim Bom % Correto
Regressão
Ruim 2833 1167 70,8 2111 889 70,4 2159 841 72,0
Bom 1294 2706 67,7 1078 1922 64,1 1059 1941 64,7
Total 4127 3873 69.2 3189 2811 67,2 3218 2782 68.3
Redes neurais
Ruim 2979 1021 74,5 2236 764 74,5 2255 745 75.2
Bom 1430 2570 64,3 1177 1823 60,8 1193 1807 60.2
Total 4409 3591 69,4 3413 2587 67,7 3448 2552 67,7
Genético
Algoritmos
Ruim 2692 1308 67.3 1946 1054 64,9 2063 937 68,8
Bom 1284 2716 67,9 1043 1957 65,2 1073 1927 64.2
Total 3976 4024 67,6 2989 3011 65,1 3136 2864 66,5
Todos apresentaram bons resultados de classificação, pois, segundo Os valores de KS em todos os modelos podem ser considerados bons.
Picinini et al. (2003): “modelos de credit scoring com taxas de acerto Novamente, Picinini et al. (2003) explicam: “O teste Kolmogorov Smirov
acima de 65% são considerados bons pelos especialistas”. (KS) é utilizado no mercado financeiro como um dos indicadores de
eficiência dos modelos de credit scoring. Um modelo que apresenta
valor de KS igual ou superior a 30 é considerado bom pelo mercado”.
As porcentagens de acerto foram muito semelhantes nos modelos
Aqui, novamente, os modelos de regressão logística e rede neural
de regressão logística e rede neural e um pouco menores para o modelo
apresentam resultados muito próximos, superiores aos obtidos pelo
de algoritmos genéticos. Outro resultado interessante é que, com
algoritmo genético.
exceção dos algoritmos genéticos, os modelos apresentaram a maior
taxa de acertos para clientes ruins, com taxa superior a 70% para
clientes ruins nas três amostras dos modelos logísticos e de redes Na escolha do modelo que melhor se ajusta a esses dados e na
neurais. análise segundo os indicadores Ih e KS, optou-se pelo modelo construído
por regressão logística. Embora os resultados tenham sido muito
A Tabela 4 apresenta os resultados dos critérios Ih e KS que foram
semelhantes aos alcançados pelas redes neurais, este modelo
escolhidos para comparar os modelos.
apresentou os melhores resultados na amostra de teste, sugerindo que
Tabela 4: Índices de comparação
é o mais adequado para aplicação em outras bases de dados. Entretanto,
Eles Teste de Validação de Treinamento deve-se ressaltar que a adoção de qualquer um dos modelos traria bons
34 30 32 Algoritmos Genéticos.
Algoritmo genético
Ao desenvolver os modelos de credit scoring alguns cuidados
devem ser tomados para garantir a qualidade do modelo e sua
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
resultados um pouco melhores que o modelo construído por redes neurais Mercados Financeiros Globais (2ª ed.). John Wiley & Filhos.
e ambos foram melhores que o modelo baseado [8] Crook, JN, Edelman, DB, & Thomas, LC (2007).
Desenvolvimentos recentes na avaliação do risco de crédito ao consumidor.
em algoritmos genéticos.
European Journal of Operational Research, 183(3), 1447–1465.
Este estudo não teve como objetivo uma abordagem mais detalhada https://doi.org/10.1016/j.ejor.2006.09.100 [9] Deiu-
das técnicas enfocadas. As redes neurais e os algoritmos genéticos merci, KK, & Mayou, M. (2018). Segurança de Dados de Rede para o
apresentaram uma extensa gama de estruturas e variações que podem Sistema de Detecção na Internet das Coisas com Abordagem Deep
(e devem) ser melhor exploradas. Os algoritmos genéticos, por serem Learning. International Journal of Advanced Engineering Research
and Science, 5(6), 208–213. https://doi.org/10.22161/ijaers.5.6.34
um método bastante flexível, ainda pouco pesquisado em problemas de
[10] Fensterstock, A. (2005). Pontuação de
concessão de crédito, podem ser utilizados de diversas formas para
crédito e o próximo passo.
otimizar resultados.
Crédito comercial, 46–50.
Nesse tipo de problema, novas técnicas como análise de [11] Fonseca, S. E., Santos, A. de O., Pereira, M. V. L., & Camargos, M.
sobrevivência não devem ser negligenciadas e merecem atenção em A. de. (2019). Análise do Impacto de Variáveis Macroeconômicas
estudos futuros. no Desempenho Financeiro e Endividamento de Empresas Listadas
na B3. Revista Contábilbil, 93–114. https://doi.org/10.4270/
Universo ruc.2018429 [12] Galvan, P. (2016). Educational
14(4),
REFERÊNCIAS Evaluation and Prediction of School
Performance through Data Miningand Genetic Algorithms. International
[1] Abdou, HA, & Pointon, J. (2011). CREDIT SCORING, TÉCNICAS
Journal of Advanced Engineering Research and Science, 3(10),
ESTATÍSTICAS E CRITÉRIOS DE AVALIAÇÃO: UMA REVISÃO
215–220. https://doi.org/10.22161/ijaers/3.10.34
DA LITERATURA.
Sistemas Inteligentes em Contabilidade, Finanças e 18(2–3), Gestão,
https://doi.org/10.1002/isaf.325 59–88.
[13] Gonçalves, E. B., Gouvêa, M. A., & Mantovani, D. M. N.
(2013). Análise de risco de crédito com o uso de regressão logística.
[2] Akkoç, S. (2012). Uma comparação empírica de técnicas convencionais,
Revista Contemporânea de Contabilidade, 10(20), 139–160. https://
redes neurais e o modelo híbrido Adaptive Neuro Fuzzy Inference
doi.org/10.5007/2175- 8069.2013v10n20p139 [14] Gouvêa, M. A.,
System (ANFIS) de três estágios para análise de pontuação de
Gonçalves, E. B., &
crédito: o caso dos dados de cartão de crédito turcos. Jornal Europeu
Mantovani, D. M. N.
de Pesquisa Operacional, 222(1), 168–178. https://doi.org/10.1016/
(2012). Aplicação De Regressão Logística E Algoritmos Genéticos
j.ejor.2012.04.009 [3] Almeida, FP, Gouveia, RGL de, Lima, MKG Na Análise De Risco De Crédito. Revista
de, Ribeiro, FABS, Mendonça, JP, & Oliveira, J. Universo 84–102.
Contábil,
do N.
https://doi.org/10.4270/ruc.2012214 [15]
Mão, DJ e Henley, WE (1997). Métodos de classificação estatística em
(2020). Coocorrência de Fatores Econômicos, Políticos e Ambientais
pontuação de crédito ao consumidor: uma revisão. Jornal da Royal
na Percepção de Grupos Sociais no Município de Uberlândia (Minas
Statistical Society: Série A (Statistics Society), 160(3), 523–541.
Gerais, Brasil) em
https://doi.org/10.1111/J.1467-985X.1997.00078.X
Sobre os Casos Notificados de Dengue. International Journal of
Advanced Engineering Research and Science, 7(4), 145–156. https://
[16] Jain, A., Patel, H., Nagalapatti, L., Gupta, N., Mehta, S., Guttula, S.,
doi.org/10.22161/ijaers.74.17 [4] Amaral, GH
Mujumdar, S., Afzal, S., Sharma Mittal, R., & Munigala, V. (2020).
de O., & Iquiapaza, RA (2020).
Visão geral e importância da qualidade de dados para tarefas de
Determinantes de Inadimplência e de Recuperação de Crédito em
aprendizado de máquina. Proceedings of the ACM SIGKDD
um Banco de Desenvolvimento. BASE –
International Conference on Knowledge Discovery Data Mining,
Revista de Administração e Contabilidade Da Unisinos, 17(3), 483– e
3561–3562. https://doi.org/10.1145/3394486.3406477 [17] Jakliÿ, J.,
519. https://doi.org/10.4013/base.173.05 [5] Berry, M. J. a.,
Grublješiÿ, T., & Popoviÿ, A. (2018). O papel da
& Linoff, G. S. (2004). Data mining techniques: for marketing, sales, and
compatibilidade na previsão de intenções de uso de inteligência de
customer relationship In Portal.Acm.Org. management. https://
negócios e análise. International Journal of Information Management,
books.google.com.br/books?hl=pt
43 (agosto), 305–318.
BR&lr=&id=AyQfVTDJypUC&oi=fnd&pg=PR37&dq=be
Eric Bacconi Gonçalves et al. Jornal Internacional de Pesquisa e Ciência de Engenharia Avançada, 8(9)-2021
[23] McCulloch, WS, & Pitts, W. (1943). Um cálculo lógico das idéias imanentes
na atividade nervosa. O Boletim de Biofísica Matemática 1943 5:4, 5(4),
115–133. https://doi.org/10.1007/BF02478259 [24] Metawa, N., Hassan,
MK, & Elhoseny, M. (2017).
Bookman.
[31] Silva, MF da, Silva, WG da, Carvalho, RL de, Silva, EM da, & Almeida,
T. da S. (2019). Análise de Algoritmo Genético para sistemas digitais
de síntese modelados em máquina de estados finitos. Jornal
Internacional de Avançado