Uma abordagem alternativa de behavioral scoring

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL
INSTITUTO DE MATEMTICA
DEPARTAMENTO DE ESTATSTICA
UMA ABORDAGEM ALTERNATIVA DE

BEHAVIORAL SCORING USANDO MODELAGEM
HBRIDA DE DOIS ESTGIOS COM
REGRESSO LOGSTICA E REDES NEURAIS.
Autora: Luciane de Godi Moraes

Orientadora: Professor Dra. Lisiane Priscila Roldo Selau
Porto Alegre, Julho de 2012.

Universidade Federal do Rio Grande do Sul
Instituto de Matemtica
Departamento de Estatstica
UMA ABORDAGEM ALTERNATIVA DE

BEHAVIORAL SCORING USANDO MODELAGEM
HBRIDA DE DOIS ESTGIOS COM
REGRESSO LOGSTICA E REDES NEURAIS.
Autora: Luciane de Godi Moraes
Monografia apresentada para obteno

do grau de Bacharel em Estatstica.
Banca Examinadora:
Professora Dra. Lisiane Priscila Roldo Selau
Marcos Roberto Eilert de Souza
Porto Alegre, Julho de 2012.
Dedico este trabalho aos meus queridos pais: Ana Maria e Orides.
" do buscar e no do achar que nasce o que eu no conhecia."

Clarice Lispector
Agradecimentos
Deus, que em sua fora natural sempre guiou meu caminho.

Ao apoio incondicional dos meus pais (Ana Maria e Orides) e irmos (Luciano e
Fabiano) para que esta etapa iniciasse e fosse concluda.
Aos meus familiares e amigos que me incentivaram em cada momento de dificuldade
e entenderam os longos momentos de ausncia.
A minha v Georgina, in memoriam, por todo o carinho e apoio aos meus sonhos.
Ao maior presente que a vida me deu, meu amor, meu companheiro, meu amigo, meu
tudo - Marcelo Sartori. Por ter acompanhado com pacincia todos os momentos
dessa etapa da minha vida, minhas decises, indecises, frustraes e conquistas.
Aos amigos da CEU, que sempre ficaro no corao, pelas lies de luta,
perseverana e pelos momentos de alegria.
Universidade Federal do Rio Grande do Sul (UFRGS), pelos anos de moradia e
assistncia. Por proporcionar um ensino de qualidade e um engrandecimento pessoal
inigualvel.
Aos professores e colegas do Bacharelado em Estatstica, em especial a turma
2008/01, pelo conhecimento e companheirismo.
A minha orientadora Prof. Dra. Lisiane Selau pela pacincia e dedicao durante a
realizao deste trabalho.
Aos meus colegas de trabalho pela confiana e oportunidade de executar meus
conhecimentos. Pelo fornecimento de condies para que esse trabalho fosse
realizado.
Sumrio
Resumo ......................................................................................................................... 1
1. Introduo .............................................................................................................. 1
2. Fundamentao Terica ........................................................................................ 4
2.1 Behavioral Scoring ............................................................................................ 5
2.2 Modelagem Hbrida........................................................................................... 6
2.3 Regresso Logstica ......................................................................................... 7
2.4 Redes Neurais .................................................................................................. 9
3. Sistemtica para Desenvolvimento do Modelo .................................................... 12
4. Resultados ........................................................................................................... 16
5. Concluses .......................................................................................................... 23
Referncias Bibliogrficas ........................................................................................... 25
Abstract ....................................................................................................................... 27
Este artigo ser submetido REVISTA BRASILEIRA DE ESTATSTICA
UMA ABORDAGEM ALTERNATIVA DE BEHAVIORAL SCORING USANDO

MODELAGEM HBRIDA DE DOIS ESTGIOS COM REGRESSO LOGSTICA E
REDES NEURAIS.
Luciane de Godi Moraes
Lisiane Priscila Roldo Selau
Departamento de Estatstica,
Universidade Federal do Rio Grande do Sul, UFRGS,
Av. Bento Gonalves, 9500 Prdio 43 -111, CEP 91509-900, Porto Alegre, RS,
e-mail: lu.godoi.m@gmail.com
Resumo
Com o crescimento progressivo nos volumes de concesso de crdito no Brasil, as
empresas esto buscando melhorar na assertividade da concesso e agilidade na
anlise do crdito, no somente para novos clientes como tambm para clientes
antigos. Tcnicas quantitativas vm sendo difundidas para a construo de modelos
de previso de risco de crdito que, baseadas tanto em informaes cadastrais,
quanto no histrico de relacionamento do cliente na empresa, predizem um
comportamento padro de risco. O objetivo deste artigo propor uma sistemtica
para construo de modelos de previso de risco de crdito baseados em dados
comportamentais (Behavioral Scoring), utilizando um processo de modelagem hbrida
de dois estgios com regresso logstica e redes neurais e avaliar seu desempenho.
Todas as etapas de construo do modelo so discutidas detalhadamente, sendo
abordado desde o planejamento e definies do modelo at a validao da frmula de
pontuao. O modelo foi aplicado em uma amostra de 9.070 clientes de uma
instituio financeira de atuao nacional. Os resultados para esse estudo especfico
apontaram que o mtodo de modelagem hbrida desenvolvido apresentou
superioridade s tcnicas tradicionais, ressaltando que o apoio dos resultados da
regresso logstica, como ns de entrada da rede neural, contornaram as
caractersticas indesejveis das redes neurais, como processamento lento e
dificuldade na interpretao das variveis.
Palavras-chave: anlise de crdito, behavioral scoring, modelagem hbrida,
regresso logstica, redes neurais.
1. Introduo
No Brasil, a concesso de crdito sempre foi lenta e escassa, devido a polticas mal
concebidas e ao processo inflacionrio do passado. Entretanto, em consequncia da
maior estabilidade da economia brasileira nos ltimos anos, aps a implantao do
Plano Real, as empresas tm percebido o crdito como um gerador de riquezas e de
novos negcios (GOLDBERG apud BUENO, 2003).
Junto ao aumento da demanda pelo crdito e a grande competio industrial, surgiu a

necessidade de tomar melhores decises sobre o crdito, principalmente quanto
anlise do seu risco. Jorion (1997) afirma que esse risco pode ser definido como a
possibilidade de a contraparte no cumprir as obrigaes monetrias contratuais
relativas s transaes financeiras. Esse no cumprimento das obrigaes contratuais
chamado de inadimplncia e deve ser monitorado.
Dessa forma, em vez de visar todos os clientes ou fornecer o mesmo incentivo a
todos, as empresas podem selecionar apenas aqueles clientes que atendem a certos
critrios de rentabilidade com base em suas necessidades individuais ou
comportamentos de compra (DYCHE; DYCH, 2001). Para isso, impossvel, tanto em
termos econmicos quanto humanos, realizar tantas anlises de maneira subjetiva,
principalmente pelo fato desses ambientes serem dinmicos e com constantes
alteraes, em que as decises devem ser tomadas rapidamente e em nmero cada
vez maior (MENDES FILHO et al., 1996).
Portanto, algumas autoridades bancrias, como o Bank of International Settlements
(BIS), o Banco Mundial e o FMI, desenvolveram uma srie de lies, todas
encorajando as instituies financeiras a desenvolverem modelos internos para
melhor quantificar os riscos financeiros (EMEL et al., 2003). Assim, instituies
financeiras de muitos pases, entre eles o Brasil, esto intensificando e aperfeioando
metodologias de estudos sobre prticas que auxiliam no controle dos riscos; tendo,
como ferramentas poderosas para apoio deciso de crdito, os mtodos estatsticos
e as abordagens de inteligncia artificial (THOMAS, 2000).
Esses mtodos so usados na elaborao dos modelos de Credit Scoring que
consistem em uma das principais ferramentas de suporte concesso de crdito. O
desenvolvimento desses modelos, segundo Louzada (2008), baseia-se na construo
de um procedimento formal para determinar quais caractersticas do cliente esto
relacionadas, significativamente, com o seu risco de crdito e qual a intensidade e
direo desse relacionamento. O objetivo bsico a gerao de uma pontuao, pela
qual os clientes possam ser classificados conforme a sua chance de inadimplncia.
Modelos de Credit Scoring se subdividem em Application Scoring e Behavioral
Scoring. Os modelos desenvolvidos com base nos dados de solicitao de abertura
de novas contas so chamados de Application Scoring e quando essas contas
comearem a amadurecer pode ser desenvolvido modelos de Behavioral Scoring
2
(MORRISON, 2003). Ento, com a necessidade de automatizar o processo de

deciso de crdito, juntamente com o aumento macio de informaes sobre as
transaes dos consumidores bancrios (AKHAVEIN, 2005), a utilizao de modelos
comportamentais (Behavioral Scoring) cada vez mais necessria s organizaes,
apesar de menos conhecidos, mas igualmente importantes, visto que at so mais
eficazes do que modelos que consideram apenas dados cadastrais (Application
Scoring) (THOMAS, 2000).
Desta forma, enquanto o principal objetivo dos modelos de aprovao de crdito
estimar a probabilidade de um novo solicitante de crdito se tornar inadimplente com
a instituio em determinado perodo, os modelos comportamentais estimam a
probabilidade de inadimplncia daqueles que j so clientes, j que so incorporadas
variveis que retratam a histria do cliente com a instituio, alm das informaes
cadastrais. Assim, segundo Thomas (2000), a pontuao de crdito para j clientes
ajuda tanto na deciso referente a novo limite de crdito, na identificao dos clientes
que so mais rentveis, nas aes de marketing, na oferta de novos produtos, como
tambm na cobrana, na mensurao do risco e no controle das perdas; enfim, em
todas as decises relativas ao gerenciamento do crdito de clientes que j possuem
uma relao ou um histrico com a instituio.
Para tanto, geralmente duas ferramentas estatsticas so mais comumente utilizadas,
a anlise discriminante e a regresso logstica (THOMAS, 2000). Recentemente, as
redes neurais esto se tornando tambm uma alternativa muito popular nas tarefas de
anlise de crdito (CORRAR, et al., 2007) e apresentam grandes vantagens em
relao s tcnicas convencionais (WEST, 2000; LEE et al., 2002; BAESENS et al.,
2003; SELAU, 2011) como capacidade de processamento paralelo, generalizao e
acurcia na classificao no linear (LEE; CHEN, 2002).
Contudo, diversos pesquisadores, como Chung e Gray (1999), Hand e Henley (1997)
criticam o tempo elevado de treinamento das redes neurais, limitando, com isso, a
aplicabilidade na manipulao de problemas de modelagem de crdito. Dessa forma,
percebe-se na literatura que, tcnicas estatsticas e de aprendizagem de mquina
para classificao de crdito tm sido extensivamente estudadas, sendo que
recentemente os estudos esto focados em modelos hbridos, combinando diferentes
tcnicas de aprendizagem que tm mostrado resultados promissores. Tsai e Chen
(2010) inovaram testando vrias combinaes de modelos hbridos, enquanto outros
3
pesquisadores mostraram a eficincia desses modelos em comparao s tcnicas

individuais (LEE, et al., 2002; HSIEH, 2005; JAIN, et al., 2007; KIM, et al., 2007;
CHEN, et al., 2009). Seu estudo indicou que a anlise de regresso logstica, utilizada
como primeiro componente, combinada com redes neurais como o segundo
componente foi superior aos outros modelos, tanto em discriminao, quanto em
maximazao do lucro. Neste tipo de modelagem as variveis significativas obtidas na
regresso logstica so utilizadas como ns de entrada do modelo de redes neurais, a
fim de melhorar a deciso da estrutura da rede e dar suporte s dificuldades de
interpretao dos resultados obtidos (LEE, et al., 2002; CHEN, et al., 2009; TSAI, et
al., 2010; WANG, et al., 2011; GHODSELAHI, 2011).
Sendo assim, o objetivo desse artigo propor uma sistemtica para construo de
modelos de previso de risco de crdito baseados em dados comportamentais,
utilizando um processo de modelagem hbrida de dois estgios com regresso
logstica e redes neurais.
Este artigo est organizado em cinco sees. Aps a introduo apresentada nesta
seo inicial, a segunda seo traz a fundamentao terica, onde exposto o
referencial sobre Behavioral Scoring, modelos hbridos e as tcnicas utilizadas para
sua construo. Na terceira seo detalhada a sistemtica proposta para a
construo do modelo. Na quarta seo so apresentados os principais resultados da
construo do modelo e avaliao do desempenho em um banco de dados de
clientes de uma instituio financeira de atuao nacional. Na ltima seo so
apresentadas as consideraes finais do estudo, as principais concluses obtidas e a
discusso das possveis pesquisas futuras.
2. Fundamentao Terica
Modelos de previso de risco de crdito vm sendo amplamente estudados e
ganhando foras devido a sua importncia para a sade de instituies financeiras, j
que o sucesso dessas instituies est diretamente relacionado a sua capacidade de
gerir os riscos (GHODSELAHI, 2011). Para lidar com estes desenvolvimentos, esto
sendo utilizadas ferramentas matemticas e estatsticas cada vez mais sofisticadas,
sendo que, conforme Tsai e Chen (2010), uma pequena melhora na preciso da
classificao de crdito pode resultar numa grande reduo do risco e gerar
significativa economia para a instituio.
4
2.1 Behavioral Scoring

Para que se possa ir alm de apenas identificar os riscos dos clientes, a empresa
precisa deter informaes do comportamento do cliente (THOMAS et al., 2001), com
variveis que demostrem o histrico com a empresa concedente, os atrasos de
pagamento do cliente, a utilizao mdia do limite de crdito, o tempo de
relacionamento com a empresa, entre outras (MCNAB; WYNN, 2000; SECURATO,
2002) e/ou buscar em dados externos informaes comportamentais do cliente.
Percebendo esse ciclo do cliente na instituio, vrios autores, como Thomas et al.
(2001); Hand (2001); Morrison (2003); Sarlija et al. (2009), dividem os modelos de
Credit Scoring em duas categorias principais: (i) Application Scoring pontuao de
um novo cliente, que considera variveis cadastrais, como sexo, idade, escolaridade e
indica um fenmeno esttico e (ii) Behavioral Scoring pontuao de um cliente
antigo, que considera variveis comportamentais, como movimentao financeira,
quantidades de parcelas pagas em atraso, alm das variveis cadastrais e indica um
fenmeno dinmico. Outros autores, como Sics (2010) e Louzada (2008),
acrescentam uma terceira categoria: Collection Scoring pontuao utilizada para
prever eventos futuros em relao cobrana de inadimplentes. Assim, a principal
diferena entre esses modelos est no conjunto de variveis disponveis para estimar
a qualidade de crdito do cliente, ou seja, quanto mais precoce o estgio do ciclo de
crdito, menor o nmero de informaes especficas sobre o cliente de que dispe a
instituio.
Para construo de modelos Behavioral Scoring necessrio escolher um ponto de
observao (THOMAS, 2000), sendo que preciso haver dados sobre o
comportamento do cliente antes e aps esse ponto (THOMAS, 2000; MCNAB;
WYNN, 2000; ANDERSON, 2007). O perodo de tempo de observao anterior ao
ponto chamado de perodo de desempenho ou de observao por Thomas et al.
(2001) e geralmente 6 a 12 meses, j Sarlija et al. (2009) nomeam esse perodo
como sendo de execuo, usando 6 meses em seu estudo. As caractersticas
observadas durante este tempo que precede o ponto de observao sero utilizadas
para o desenvolvimento do modelo. O perodo aps o ponto de observao o
perodo de resultados, que normalmente tomado como 12 meses (THOMAS et al.,
2001), sendo que Sarlija et al. (2009) usaram 6 meses, e nesse perodo que o
cliente classificado como bom ou mau pagador, dependendo de seu estado no final.
Thomas et al. (2001) alertam que uma das desvantagens para construir um
5
Behavioral Scoring que normalmente necessrio histrico de dois anos e,

portanto, a populao na qual aplica-se o modelo pode ser bastante diferente daquela
de quando foi construdo. Talvez por isso, Sarlija et al. (2009) utilizam um perodo de
6 meses antes e depois do ponto de observao.
2.2 Modelagem Hbrida
Em minerao de dados, a abordagem de hibridao tem sido uma rea de pesquisa
ativa para melhorar a classificao, a previso e o desempenho de modelos de
pontuao de crdito. Em geral, segundo Tsai e Chen (2010), o modelo hbrido
baseado na combinao de duas tcnicas diferentes, podendo ser tcnicas de
agrupamento ou de classificao. Anlise Discriminante, Regresso Logstica, rvore
de Deciso, Redes Neurais e Redes Bayesianas so exemplos de tcnicas de
classificao; enquanto K-means exemplo de tcnica de agrupamento.
Modelos hbridos vm sendo utilizados, principalmente, para melhorar inconvenientes
das tcnicas de inteligncia artificial (LEE et al., 2002), j que a primeira tcnica
servir para orientar o processamento da segunda (GHODSELAHI, 2011), diminuindo
o tempo de processo e facilitando, atravs do primeiro mtodo, a identificao da
relevncia das variveis significativas (LEE; CHEN, 2005).
Para demonstrar a viabilidade e eficcia da proposta da modelagem hbrida em duas
etapas, apresentada na Tabela 1 uma lista de alguns artigos que usaram modelos
hbridos para a pontuao de crdito, apesar de ainda haver poucos estudos
enfocando esse desenvolvimento. Nesses trabalhos os modelos hbridos so
comparados com alguns modelos singulares de diferentes tcnicas quantitativas,
sendo que todos os pesquisadores concluram que modelos hbridos aumentam a
preciso da classificao em relao a modelos de apenas uma etapa.
Percebendo essa corrente de estudos, Tsai e Chen (2010) inovaram comparando
diferentes modelos hbridos para pontuao de crdito a fim de identificar a melhor
combinao em termos de preciso da previso, da taxa de erro e do lucro mximo.
Verificaram em seus estudos que a regresso logstica utilizada como primeira
componente combinada com redes neurais como segundo componente superior
aos demais modelos. Portanto, o presente artigo apoia-se na concluso de Tsai e
Chen (2010), usando o resultado da regresso logstica como ns de entrada da rede
neural, garantindo uma melhor interpretao do modelo e menor tempo de
6
processamento, alm dos benefcios j mencionados. As duas tcnicas que sero

utilizadas seguem descritas na sequncia.
Tabela 1 - Autores que utilizaram modelagem hbrida para a pontuao de crdito.
Pesquisador
Tcnicas
Avaliao
Lee et al. (2002)
Anlise Discriminante + Redes

Neurais
Preciso; Taxa de
Erro; Interpretao;
Convergncia
Hsieh (2005)
Cluster + Redes Neurais
Preciso; Taxa de Erro
Regresso Multivariada
Lee e Chen (2005)
No-Paramtrica (MARS) + Redes

Neurais
Huang et al. (2004)

Zhang et al. (2008)
Algoritmos Genticos + SVM

(Suport Vetor Machine)
Preciso; Taxa de
Erro; Interpretao
Preciso
2.3 Regresso Logstica

A tcnica de regresso logstica surgiu apenas nos anos 80 com estudos de Ohlson
(1980), justificando o uso pela imponncia sobre da anlise discriminante de algumas
condies para as variveis preditoras, como: normalidade na distribuio dos erros e
matrizes de varincia-covarincia iguais entre os grupos analisados; e tambm pela
baixa interpretao intuitiva fornecida pelo escore da anlise discriminante.
Em 1989, Hosmer e Lemeshow tambm mostraram que a utilizao da tcnica de
regresso logstica adequada em muitas situaes, porque permite que se analise o
efeito de uma ou mais variveis preditoras (categricas ou mtricas) sobre uma
varivel resposta dicotmica, representando a presena (1) ou ausncia (0) de uma
caracterstica. A regresso logstica tem por objetivo encontrar um modelo explicativo
para o comportamento da probabilidade de sucesso, em termos das variveis
preditoras. Dessa forma, a regresso logstica especificamente desenhada para
prever a probabilidade de um evento ocorrer, sendo essa probabilidade classificada
entre o intervalo 0 e 1.
Sendo assim, o valor esperado das variveis preditoras passa por um processo de
transformao logstica em que so transformadas numa razo de probabilidades e
posteriormente em uma varivel de base logartmica. Portanto, devido natureza no
linear dessa transformao, utiliza-se o mtodo de mxima verossimilhana, em vez
de utilizar o mtodo de mnimos quadrados utilizado na regresso linear, para estimar

os coeficientes (HOSMER; LEMESHOW, 1989; HAIR et al., 2005).
O modelo de previso da regresso logstica pode ser obtido pela equao 01 e 02.
p = 1 / (1+ e-z)
(01)
Z = ln (p / (1 -p)) = b0 + b1.X1 + b2.X1 ++ bn.Xn
(02)
onde:
p = probabilidade do evento ocorrer;
1 - p = probabilidade do evento no ocorrer;
Xi = variveis preditoras;
bi = coeficientes a serem estimados para cada uma das variveis.
Notamos que, a funo p normaliza a sada do modelo para o intervalo [0,1],
informando a probabilidade do evento de interesse. Para testar a significncia dos
coeficientes, utiliza-se a estatstica de Wald (HAIR et al., 2005). Com o uso dessa
estatstica, o teste de hipteses pode ocorrer como em regresso mltipla.
Corrar et al. (2007), destacam a tcnica de regresso logstica, pela possibilidade de
contornar certas restries encontradas em outros modelos multivariados. Contudo, o
modelo de regresso logstica sensvel colinearidade entre as variveis (HAIR et
al., 2005). Por isso, Corrar et al. (2007) indicam, como uma das aes corretivas para
os problemas de multicolinearidade, o uso do mtodo stepwise para escolha de
variveis que iro compor o modelo considerado. O procedimento de avaliao das
variveis
preditoras
desconsidera
variveis
que
apresentem
sinais
de
multicolinearidade, optando por manter no modelo apenas aquelas de maior

significncia estatstica (SELAU, 2011).
Portanto, de maneira geral, a regresso logstica permite identificar e remover
caractersticas que j foram detectadas por outras variveis e assegura que toda
caracterstica importante do cliente permanea na sua pontuao (THOMAS et al.,
2002).
2.4 Redes Neurais

Redes neurais uma tcnica de tratamento de dados que recentemente tem
despertado interesse no apenas de pesquisadores da rea de tecnologia, como
tambm da rea de negcios (CORRAR et al., 2007), devido ao seu desempenho ser
muitas vezes superior a outros mtodos de estatstica multivariada (WEST, 2000; LEE
et al., 2002; BAESENS et al., 2003; SELAU, 2011).
As redes neurais so sistemas de inteligncia artificiais, inspirados no funcionamento
de um crebro humano, contendo propriedades particulares como capacidade de
aprendizado, de generalizao, ou de organizao dos dados (KRSE; SMAGT,
1996; KHONEN,1988). Alm da capacidade de aprendizado, onde os erros de sada
retornam ao incio da rede e so ajustados adequadamente, a rede neural tem outra
vantagem sobre as tcnicas estatsticas, de no necessitar de uma suposio inicial
de um modelo probabilstico pr-estabelecido para estimar os parmetros de um
suposto modelo.
Segundo Gonalves (2005), h quatro etapas para a estrutura e operao das redes
neurais: (i) o processamento das informaes ocorre dentro dos chamados neurnios;
(ii) os estmulos so transmitidos pelos neurnios por meio de conexes; (iii) cada
conexo associa-se a um peso, que numa rede neural padro multiplica-se ao
estimulo recebido; e (iv) cada neurnio contribui para a funo de ativao para
determinar o estimulo de sada.
Haykin (2001) apresenta as unidades bsicas da rede, onde existem trs camadas: a
de entrada, a intermediria (onde o processo refinado) e a de sada. Nestas
camadas encontram-se os neurnios (Figura 1), que so conectados por sinapses ou
pesos.
Castro Junior (2003) apresenta que para os processamentos que ocorrem em cada
neurnio tem-se uma soma ponderada das entradas e calcula-se um valor de sada,
resultando na equao 03.
vk = T (wkj . xk )
(03)
Sendo xk o elemento de sada; wkj o coeficiente de ponderao entre os elementos k e

j, que representam o conhecimento obtido pela rede; T uma funo de transferncia
tambm chamada de funo de transformao e vk ser a funo de ativao. Em
9
geral as funes de ativao do tipo sigmides so as mais usadas, por serem

limitadas e possurem derivada contnua, exigncia para o uso de algoritmos do tipo
Backpropagation utilizados em mltiplas camadas (RUMELHART; McCLELLAND,
1986).
Figura 1 - Modelo estrutural de uma rede neural

Fonte: Haykin (2001).
Inicialmente a camada de entrada era ligada diretamente camada de sada, obtendo

apenas uma camada, chamadas de Perceptron, sendo eficazes apenas para
conjuntos de treinamento linearmente separvel (ROSENBLATT, 1958). Em
decorrncia disso, foram desenvolvidas as redes Multilayer Perceptron (MLP), que
possuem uma ou mais camadas intermediarias (ocultas), permitindo, assim, a soluo
para conjuntos de dados no separveis linearmente.
O algoritmo mais conhecido e considerado essencial para treinamento de redes
neurais o Backpropagation (FAUSETT, 1994; YU et al., 2002), desenvolvido com o
objetivo de obter os pesos que minimizem a funo de erros apresentada na equao
04.
E = 1/2 (tj - yi)2, para 1 j m.
(04)
Para a minimizao da funo calculam-se as derivadas de E com relao aos pesos

e vieses da superfcie de erros.
Segundo Loesch e Sari (1996), o algoritmo Backpropagation, pode ser dividido em 5
passos: (i) apresentao de um padro de entrada e da sada desejada; (ii) clculo
dos valores de sada; (iii) ajuste dos pesos da camada de sada; (iv) ajuste de pesos
10
das camadas escondidas; e (v) verificao da magnitude do erro. Na Figura 2 temos a

ilustrao de uma rede MLP e a retro-propagao dos erros.
Figura 2 - Rede MLP e retro-propagao dos erros.

Fonte: Patterson (1995).
Apesar das redes neurais terem se estabelecido como uma alternativa aos
tradicionais modelos estatsticos (CORRAR et al., 2007; LAHSASNA, 2010) e de
muitos estudos na rea de crdito terem concludo que as redes neurais superam os
tradicionais mtodos estatsticos em termos de preciso de classificao (WEST,
2000; LEE et al., 2002; BAESENS et al., 2003; SELAU, 2011), Hair et al. (2005) alerta
para a aplicao de redes neurais em problemas que necessitem previso e
classificao, com interesse na preciso da classificao e no na interpretao da
variveis preditoras. Outros pesquisadores, como Chung e Gray (1999), Hand e
Henley (1997) tambm criticam o tempo elevado de treinamento das redes neurais,
limitando, com isso, a aplicabilidade na manipulao de problemas de modelagem de
crdito, apesar de que a tecnologia de processamento evoluiu significativamente,
desde ento.
Por isso, nesse artigo, prope-se uma abordagem de modelos hbridos, que conforme
j mostrado aqui, vm sendo utilizada para melhorar inconvenientes das tcnicas de
inteligncia artificial, diminuindo o tempo de processo e facilitando, atravs do
primeiro mtodo, a identificao da relevncia das variveis significativas.
11
3. Sistemtica para Desenvolvimento do Modelo

Para elaborao do modelo a ser testado, optou-se por seguir as etapas de
desenvolvimento de um sistema de Behavioral Scoring baseado em Sics (1998) e
Sics (2010), que consistem em 7 etapas principais, expostas na Figura 3.
Figura 3 - Etapas para o desenvolvimento do modelo.
Planejamento e definies
Deve estar claro qual o pblico a ser atingido pelo modelo, ou seja, se necessrio
limitar o modelo para determinado produto, o que geralmente ocorre quando h uma
grande diversificao. Tendo claro o pblico, definir os conceitos para diviso dos
grupos em termos de aceitao de desempenho.
Deve haver a diviso em 3
diferentes faixas de atrasos: (i) Bons clientes com pouco ou nenhum atraso no
perodo de observao; (ii) Indeterminados clientes com atrasos definidos como
intermedirios; (iii) Maus -
clientes com atrasos significativos (SELAU,2011). A
relevncia dos atrasos deve seguir a regra j existente em cada instituio, conforme
seu negcio e produto. Consideram-se, para a construo do modelo, apenas os
12
grupos de bons e maus clientes, a fim de intensificar a separao dos perfis

(SELAU,2011; SICS,2010).
Identificao das variveis preditoras
Para o desenvolvimento de um Behavioral Scoring, alm das tradicionais variveis
disponveis nos sistemas de cadastro como: sexo, idade, endereo, estado civil, entre
outras; tambm devem ser includas variveis que traduzam o comportamento do
cliente na empresa, como: tempo de relacionamento, histrico de crdito, histrico de
inadimplncia, histrico de investimento, entre outras. Nessas variveis histricas,
interessante avaliar suas derivadas, como a soma e a mdia das mesmas em
determinados perodos (SICS, 2010; THOMAS, 2000). Muitas vezes esses
histricos, assim como as suas quebras, no esto consolidados nos sistemas das
empresas, necessitando a elaborao de cada varivel.
Amostragem e coleta dos dados
Para construo de modelos Behavioral Scoring necessrio escolher um ponto de
observao, sendo que preciso haver dados sobre o comportamento do cliente
antes e aps este ponto. O perodo de tempo de observao anterior ao ponto
chamado de perodo de desempenho histrico e geralmente de 6 a 12 meses. As
caractersticas observadas durante este tempo que precede o ponto de observao
sero utilizadas para o desenvolvimento do modelo. O perodo aps o ponto de
observao o perodo de resultados, que normalmente tomado tambm como 6 a
12 meses, e nesse perodo que o cliente classificado como bom ou mau,
conforme ilustrado na Figura 4.
Predio
Perodo Histrico
Perodo de Observao
tempo
Ponto de
Observao
Resultado
Bom / Mau
Figura 4 Esquema para obteno da amostra do modelo.
13
Repete-se essa seleo para diferentes pontos de observao, em datas diferentes,

objetivando a construo de diversas safras. Muitos autores selecionam as safras a
fim de controlar possveis sazonalidades (SICS, 2010), outros apenas para
aumentar o volume de dados a serem estudados (SICS, 2010; THOMAS et al.,
2001).
Tendo sido definidas a populao e as variveis, deve-se selecionar uma amostra
desses clientes com um tamanho adequado para que possam ser analisados
estatisticamente, geralmente utiliza-se uma proporo de 20 observaes para cada
varivel a ser analisada (SELAU, 2011). Por fim, necessita-se do particionamento da
amostra, sendo reservada uma parte dela para anlise e outra para a validao/teste
do modelo treinado, que ser usada na verificao do poder preditivo do modelo.
Sugere-se que a haja uma proporo entre 70% e 80% da amostra de anlise, devido
a maior importncia na construo do que na validao do modelo (LOUZADA et al.,
2008; SICS, 2010; SELAU, 2011).
Analise dos dados
A avaliao da consistncia e do preenchimento dos dados imprescindvel,
estatsticas descritivas podem ajudar a detectar essas inconsistncias. A deteco da
presena de valores discrepantes (outliers) muito importante, pois mesmo sendo
reais, podem comprometer a estimativa dos pesos das variveis (SICS, 2010). Alm
disso, devem ser avaliados os valores faltantes (missing), podendo efetuar excluso
de observaes, ou utilizar mtodos de imputao. Variveis com muitas observaes
faltantes devem ser descartadas da anlise. Nessa etapa tambm se pode elaborar
novas variveis a partir da combinao de outras j coletadas.
Analise bivariada
O objetivo aqui confrontar cada varivel explicativa com os grupos determinados de
bons e maus pagadores e avaliar o poder discriminador individual. Quanto maior a
diferena entre o percentual de bom e mau, maior ser a contribuio da varivel para
a predio. O agrupamento das classes podem ser selecionado por vrios critrios,
entre os mais conhecidos est o Information Value de Kulbak (SICS, 2010).
O Information Value (IV) utiliza-se da soma dos pesos das evidncias (WOE), que
nada mais do que o logaritmo natural da probabilidade de ser bom dada a categoria,
pela probabilidade de ser mau (equao 05), dada a categoria, ponderados aps o
agrupamento das categorias, conforme equao 06.
14
WOE = ln [ P(c | Bom) / P(c | Mau) ]
(05)
IV = [ P(c | Bom) - P(c | Mau) ] . WOE
(06)
Aps a avaliao dos melhores nveis de cada varivel, deve-se criar a varivel
dummy para cada atributo que far parte da anlise multivariada. Essa varivel
assumir apenas o valor 0 ou 1 (ex.: estado civil solteiro = 1, caso contrrio =0).
Dessa forma, os problemas de no linearidade sero evitados (SELAU, 2011).
Obteno da frmula preliminar
A determinao dos pesos de cada atributo para o clculo do escore final realizado
com base nas tcnicas quantitativas explicadas na fundamentao terica (Seo 2).
Hoje em dia h muitas tcnicas para clculo de escore, contudo, cabe ao analista
verificar suas necessidades e o poder de cada uma delas. Nesse estudo sugere-se o
uso de uma modelagem hbrida em duas etapas, sendo a primeira uma regresso
logstica, cujos resultados e variveis selecionadas serviro de entrada para uma rede
neural.
A complexidade de execuo do modelo adequado deve ser sempre levada em conta,
no subestimando nenhuma etapa, a fim de obter o melhor resultado. Para isso, os
pressupostos de cada tcnica devem ser seguidos. Na regresso logstica deve-se
atentar para a verificao da ausncia de multicolinearidade, e para isso pode-se
lanar mo do mtodo stepwise, j presentes em muitos softwares estatsticos, assim
as variveis preditoras sero incorporadas no modelo automaticamente. J na rede
neural h uma flexibilidade, no necessitando nenhuma verificao prvia quanto a
pressuposies para o uso.
A escolha do software tambm um passo que deve ser realizado com cuidado, dado
que necessrio verificar os recursos e caractersticas de cada um.
Analise da validao da frmula de pontuao
H muitas tcnicas estatsticas para testar o desempenho dos modelos e auxiliar na
escolha, entre elas: (i) estatstica de Kolmogorov-Smirnov (KS); (ii) rea abaixo da
curva ROC (AUC); e (iii) ndice de Gini.
A estatstica KS construda calculando a mxima diferena entre as distribuies
acumuladas de bons e maus. A Tabela 2 indica os nveis de aceitao para um
modelo construdo com base no comportamento do cliente em termos de KS. Esse
nvel de aceitao pode variar conforme a margem de lucro da empresa, o valor
15
mdio dos produtos, a rea de aplicao do modelo, entre outros fatores; ou seja,
classificao mostrada na Tabela 2 apenas um indicativo da qualidade do modelo,
cabendo ao analista avaliar a relevncia do resultado em seu negcio.
Tabela 2 Valor de KS x Capacidade de discriminao.
KS
KS<=40
40<= KS<50
50<= KS<60
60<=KS<70
KS>=70
Caracterstica da Discriminao
Discriminao baixa
Discriminao aceitvel
Discriminao boa
Discriminao muito boa
Discriminao excelente
Fonte: Sics (2010).
A anlise da curva ROC (receiver operating characteristic plots) baseia-se na

sensibilidade e na especificidade. Sensibilidade pode ser entendida como a
capacidade de identificar os maus crditos; j a especificidade como a capacidade de
identificar os bons crditos. Para um determinado escore X, a especificidade medida
pela relao de bons corretamente classificados, ou seja, a proporo de bons cujo
escore maior ou igual a X e a medida (1-especificidade), utilizada na curva ROC,
representa os bons classificados como maus. Um grfico dos resultantes pares de
sensibilidade e 1-especificidade constitui uma curva ROC (LOUZADA, et al.; 2008).
Para calcular a rea abaixo da curva ROC (AUC: Area Under Curve), computada a
sensibilidade e a especificidade para cada valor de X, variando do menor para o maior
escore. Assim, quanto maior, melhor o modelo, sendo que se o valor for acima de 0,7
o modelo aceitvel (SICS, 2010).
O ndice de GINI refere-se a duas vezes a rea entre e a diagonal que cruza o grfico
em 45 e a curva ROC, esse coeficiente sumariza o desempenho do modelo sobre
todos os pontos de corte. Quanto maior este valor, melhor a predio do modelo.
4. Resultados
Os resultados sero apresentados na mesma sequncia dos passos mostrados na
sistemtica da seo anterior, de forma que fiquem evidenciadas as etapas
percorridas para a obteno do modelo.
Planejamento e definies
Devido diversidade de pblico atendida e da gama de produtos, procurou-se
delimitar o alvo do modelo. Assim o foco foi na avaliao do risco do cliente, apenas
16
pessoa fsica, e que j tiveram alguma operao de crdito pessoal durante o tempo
de anlise. Dessa forma, o modelo servir de apoio s novas decises de concesso
de crdito pessoal para j clientes, contribuindo para o controle dos atrasos de
pagamentos. Conforme o conhecimento de analistas da instituio, os clientes foram
divididos em trs grupos, de acordo com o tempo de atraso, nos ltimos 6 meses que
antecederam a observao, sendo eles: (i) Bom: cliente com atraso at 30 dias; (ii)
Intermedirio: cliente com atraso entre 31 e 60 dias; e (iii) Mau: cliente com atraso
superior a 60 dias.
Identificao das variveis preditoras
Como o modelo a ser construdo trata-se de um Behavioral Scoring necessita-se de
informaes histricas alm das tradicionais do cadastro, como idade, estado civil,
CEP, renda, patrimnio, entre outras. Portanto houve a necessidade da consolidao
desses dados para obteno das variveis histricas comportamentais. Com a
varredura de bases mensais houve a transformao de variveis que consolidam o
comportamento do cliente na instituio. Essa etapa tambm muito importante, pois
dela depende no s a construo das variveis que resumem a totalidade da ao
no tempo observado, como tambm suas possveis derivaes. Ao exemplo da
informao de investimento do cliente ao longo do perodo histrico observado, podese apenas criar uma varivel binria, indicando que o cliente teve ou no algum
investimento durante o perodo histrico, que nesse estudo foi de 6 meses; ou ainda,
sobre a mesma informao, criar outra varivel que compute o total investido nesse
perodo; ou que demonstre a mdia de investimento, como tambm poder haver
quebras em decorrncia do tempo observado. Todas essas sero variveis
candidatas a entrarem no modelo, sendo que a mais significativa para discriminao
ser escolhida. Seguindo esses passos de decomposio das informaes
disponveis, foram obtidas 82 variveis para o inicio do estudo, sendo dessas 40
cadastrais e 42 histricas. Todas as variveis ainda passaro pela avaliao de
outliers, de missings e pela categorizao (quando necessria), para ento ser
medida a importncia de cada uma (individualmente e no conjunto) na discriminao
final de bom e mau pagador.
Amostragem e coleta dos dados
Nesse estudo foi adotada a prtica de observao de 6 meses tanto no horizonte do
passado quanto no do futuro, em relao ao ponto de observao, conforme j
ilustrado na Figura 4.
17
Alm disso, foram consideradas 9 safras, sendo que cada uma com o ponto de
observao em um diferente ms. A inteno inicial era analisar 12 safras,
abrangendo todos os meses, contudo no houve histrico suficiente na empresa.
Portanto, considerou-se suficiente apenas 9 safras, seja pelo tamanho da amostra e
por presumidamente abranger alguma sazonalidade, se assim houvesse. Para a
marcao de bom e mau pagador na amostra, considerou-se todo o perodo de
observao, ou seja, uma vez ocorrida a marcao de mau pagador aps o ponto de
observao, ela permanecer, independe se o cliente tornou-se bom ainda dentro
desse perodo. Ou seja, uma vez marcado como mau pagador no perodo de
observao, essa informao ser gravada e permanecer.
Dessa forma, apresenta-se na Tabela 3 o total de clientes na amostra, conforme a
data do ponto de observao, e a quantidade por tipo de cliente.
Base desenvolvimento
Tabela 3 - Nmero total de clientes na amostra, conforme a data do ponto de observao e a

quantidade por tipo de cliente.
Data da
Observao
abr/10
mai/10
jun/10
jul/10
ago/10
set/10
out/10
nov/10
dez/10
Total
Total de Clientes
da Amostra
7.449
8.638
9.089
10.913
10.985
9.186
10.258
11.827
13.521
129.427
Bom
Mau
Indeterminado
6.541
7.664
8.185
9.893
10.009
8.296
9.203
10.673
12.138
82.602
450
523
425
513
469
431
509
545
670
4.535
458
451
479
507
507
459
546
609
713
4.729
Por exemplo, foram 13.521 clientes que tiveram ponto de observao em dezembro
de 2010, sendo que as variveis histricas que predizem seu comportamento na
instituio foram coletadas de junho de 2010 at o incio de dezembro de 2010. J o
comportamento do cliente ser medido nos 6 meses posteriores, ou seja, de janeiro
de 2011 at junho de 2011.
Esses so os valores j desconsiderando observaes com inconsistncia no
preenchimento. As observaes com problemas totalizaram menos de 1% da base
inicial. A partir de ento, foram separadas amostras para anlise e teste,
considerando todos os 4.535 clientes identificados como maus e uma amostra
aleatria para selecionar outros 4.535 clientes identificados como bons do total de
82.602 clientes bons na amostra inicial, formando uma amostra com 50% de cada
grupo, totalizando 9.070 clientes para o estudo.
18
Visto que a verdadeira proporo de maus na populao em estudo muito baixa (em
torno de 5%), poderia haver problema de discriminao na amostra, dado que a
maioria seria de bons clientes. Por este motivo, todos os maus foram utilizados e
apenas uma amostra de bons clientes. Contudo, desconsiderou-se a verdadeira
proporo entre os grupos para uma correo no resultado final. Na finalizao,
realizado um ajustamento com a priori da verdadeira proporo, atravs de um
recurso no processo de deciso disponvel no SAS Enterprise Miner.
Com base na amostra final, de 9.070 clientes, foi separada de forma aleatria, a
amostra de anlise, utilizada para a construo do modelo; e a amostra de teste,
utilizada para o teste do modelo, na proporo de 70% e 30%, respectivamente.
Anlise dos dados
Houve necessidade de codificar os valores que estavam marcados como missings,
quando na verdade indicavam a nulidade da respectiva varivel. Oito variveis
cadastrais e trs histricas foram excludas por apresentarem mais de 50% de
missings. Outra anlise importante dos outliers, pois em dados financeiros comum
haver muita discrepncia nas variveis. O tratamento dos outliers ocorreu no
momento da modelagem via SAS Enterprise Miner, atravs da funo Replacemente,
que facilita a recodificao dos valores discrepantes. Esses valores podem ser
considerados missings, ou incorporados considerando-o como sendo pertencentes
aos quartis extremos da distribuio da varivel, ou ainda estabelecer um limite de
forma manual. Nessa etapa muito importante a opinio de um analista para que
identifique o que realmente um outlier ou uma informao incorreta. Obtiveram-se,
assim, cinco variveis que foram limitadas, consideram os valores fora do intervalo
como sendo missings; foi o caso de tempo do ltimo depsito com valores negativos,
tornando os valores negativos missings, por exemplo. Para outras 32 variveis foram
recodificados os valores discrepantes, ao exemplo da soma de investimento que foi
limitada a R$500.000, pois havia poucos casos que destoavam deste valor.
Anlise bivariada
Nessa seo analisa-se a relao entre a varivel resposta, que identifica o bom e o
mau cliente e as demais variveis. Nessa fase, vinte e sete variveis foram rejeitadas
da anlise por terem poder de discriminao muito prximo de zero, esse poder foi
medido pela estatstica de Gini e pelo Information Value. Porm, seis dessas
continuaram por serem importantes, segundo experincia de analistas.
19
Para incluir algumas variveis, como CEP residencial, na anlise foi necessrio
categoriz-las, devido ao elevado nmero de atributos de cada uma delas. Para tal
agrupamento foi utilizado o apoio da funo Interactive Grouping disponvel no SAS
Enterprise Miner, onde se categoriza as variveis conforme o peso da evidncia
(WOE). Aps, cada grupo formado transforma-se em uma varivel dummy que sero,
portanto, as variveis preditoras para a construo do modelo. Com esse artifcio
evitam-se problemas decorrentes da no linearidade dos atributos no clculo da
anlise multivariada. Com isso obteve-se um total de cento e quatorze variveis
dummies, alm das treze que j eram binrias, transformadas em dummies, e ainda
foram mantidas vinte e duas variveis intervalares, alm da varivel resposta com a
informao de bom e mau cliente, e a varivel chave que identifica o cliente,
totalizando assim 151 variveis para o incio da anlise.
Obteno da frmula preliminar
Para a construo do modelo, tanto para a parte da regresso logstica quanto para a
parte da rede neural, o software utilizado foi o SAS enterprise Miner verso 6.1 e 6.2.
Na construo do modelo de regresso logstica, utilizou-se o mtodo stepwise, com
0,05 de significncia para entrada e sada de variveis. Como vantagem, esse mtodo
proporciona ao corretiva para o problema de multicolineariedade, pois desconsidera
variveis que apresentam sinais de multicolineariedade, optando por manter no
modelo as de maior significncia (SELAU, 2011). Algumas variveis foram
reagrupadas, a fim de facilitar a entrada no modelo. No foram adicionados efeitos de
interao de variveis no modelo a fim de melhorar a compreenso do modelo final.
Segundo SICS (2010), modelos de Credit Scoring encontrados no mercado no tm
utilizado essa prtica.
Para a composio do modelo logstico, 32 variveis dummies e 5 intervalares foram
significativas, sendo que 7 dummies e 1 intervalar proviam das informaes
cadastrais e 25 dummies e 4 intervalares so variveis de comportamento obtidas na
observao do cliente durante o perodo histrico. Pde-se perceber que as variveis
histricas agregam mais informao que as variveis cadastrais, ajudando no poder
de discriminao do modelo.
Para preservar as informaes da empresa em que se est realizando o estudo, as
variveis sero apresentadas na frmula final de forma codificada, permitindo a
identificao se a varivel de origem cadastral ou histrica. O cdigo obedece at
quatro dgitos: XYZW, sendo que se X=D a varivel dummy, se X=I a varivel
20
intervalar; se Y=C a varivel cadastral, se Y=H a varivel histrica; Z o nmero

identificador da varivel e W indica o grupo da varivel, quando essa for dummy.
Supondo que estado civil seja a varivel identificada com o nmero 3 (Z=3), essa
varivel proveniente das informaes cadastrais (Y=C), alm disso, ela uma
varivel dummy (X=D) e possui dois grupos (W=1 e W=2), logo obtm a
decomposio DC31 e DC32. So esses cdigos contidos na equao 07, que
apresenta a frmula obtida com a regresso logstica.
1
P(Y=1) =
1 + exp (-1,6295 0,0934 DC11 + 0,8232 DC21 + 0,1951 DC22 0,3816 DC25 + 0,2350 DH32
+ 0,3193 DH33 0,1873 DC42 + 1,2688 DH51 + 0,2577 DH52 0,2198 DH54 0,6264 DH55
+ 0,3493 DH71 + 0,0210 DH72 0,0470 DH81 + 0,1791 DH82 + 0,5048 DH91 + 0,1183 DH92
0,3361 DH93 0,5991 DH101 0,3137 DH102 0,0703 DH102 + 0,3694 DH104 0,8232 DH111
0,1534 DH112 + 0,2203 DH113 + 0,2555 DH114 0,7681 IH12 0,0932 IH13 0,0127 IH14
+ 0,0142 IC15 0,1359 IH16 0,1291 DC17)
(07)
As 14 variveis com sinais positivos so associadas com ser bom pagador e as 17 de

sinais negativos com ser mau pagador. Assim possvel identificar o perfil do cliente
desejado; se o cliente casado, possui relacionamento com a empresa por mais de
um ano, no apresentou cheque devolvido nos ltimos seis meses, possui veculo,
entre outras, tem maior probabilidade de ser um bom pagador.
Todas as variveis e resultados que compuseram o modelo final de regresso
logstica serviro como ns de entrada da rede neural. Dessa forma, o modelo final
ser um hibrido da regresso logstica com a rede neural. Assim, garante-se a
melhora na deciso da estrutura da rede, alm de dar um suporte s dificuldades de
interpretao dos resultados obtidos.
A rede neural foi construda atravs da funo de ativao sigmide e o algoritmo de
aprendizado supervisionado de retropropagao de erro. Vrias redes foram criadas,
todas usando a regresso logstica como entrada, diferenciando-se nas quantidades
de neurnios na camada oculta para verificar o desempenho quanto predio dos
bons e maus clientes. Sendo assim, a RN2 foi a melhor rede, tanto para a amostra de
anlise, quanto para a de teste, conforme os resultados apresentados na Tabela 4,
com as trs melhores redes construdas.
Tabela 4 - Comparao dos melhores modelos neurais construdos.
Modelo
N Neurnios camada oculta
RN1
RN2
RN3
28
30
35
Anlise
61
62
62
KS
Validao
58
61
60
21
Anlise da validao da frmula de pontuao

Depois de concludas as duas partes do modelo hibrido, regresso logstica unida
com a rede neural, verifica-se o quo eficiente tornou-se o modelo. Para isso utilizouse indicadores que iro embasar a concluso: (i) estatstica de Kolmogorov-Smirnov
(KS); (ii) rea abaixo da curva ROC (AUC); (iii) ndice de Gini. Todas as medidas
devem ser avaliadas tanto na amostra de anlise, utilizada para o desenvolvimento do
modelo, como na amostra de teste, necessria para garantir que o modelo seja
adequadamente utilizado para previso. Pela natureza das variveis, os modelos de
Behavioral Scoring apresentam melhores resultados em comparao aos modelos de
Aplication Scoring.
No estudo aqui apresentado, foi proposta uma nova abordagem de modelagem
utilizando um modelo hbrido. Dessa forma, para verificar o poder de predio da
hibridao das tcnicas (regresso logstica seguida de rede neural) em relao
regresso logstica pura, apresenta-se a Tabela 5 expondo as comparaes. Nela
percebe-se que houve um acrscimo significativo em todos os indicadores para o
modelo hbrido.
Tabela 5 - Comparao dos modelos.
Indicador
KS
ROC
GINI
Regresso logstica
59
0,87
0,73
Regresso logstica + Rede neural

61
0,94
0,76
Em termos do valor de KS, o modelo hbrido conseguiu alcanar um nvel muito bom
de diferena entre as distribuies acumuladas de bons e maus clientes, sendo que a
regresso logstica tambm apresentou um nvel bom. Alguns pontos a mais nessa
diferena podem significar aumento nos lucros para uma empresa, portanto essa
diferena deve ser considerada e se possvel medida em termos de retorno
monetrio. O valor da rea sobre a curva ROC no modelo hbrido tambm foi bastante
expressivo, indicando que a capacidade de identificar corretamente os maus crditos
(sensibilidade), assim como a capacidade de identificar os bons crditos
(especificidade) est bem ajustada, chegando bem prximo a 1, valor mximo.
Tambm o ndice de Gini, que sumariza o desempenho do modelo sobre todos os
pontos de corte, apresentou melhora no modelo hbrido.
22
5. Concluses
Esse artigo apresentou uma sistemtica para a construo de um modelo de
Behavioral Scoring, propondo um processo de modelagem hbrida de dois estgios
com regresso logstica e redes neurais. Todos os passos para a obteno do modelo
foram abordados, tanto em relao obteno das variveis e amostras, quanto na
abordagem das tcnicas. Esse trabalho inova no s no detalhamento do processo de
construo de um Behavioral Scoring, como tambm quanto abordagem de
modelos hbridos, que esto sendo recentemente estudados internacionalmente,
sendo esse um dos precursores na apresentao dessa tcnica com dados
brasileiros. Dessa forma, o modelo aqui desenvolvido pode servir de apoio para
pesquisadores e analistas de empresas que desejam desenvolver seus modelos.
A tcnica de modelagem hbrida aqui desenvolvida foi condizente com estudos j
realizados, apresentando superioridade tradicional (regresso logstica). Alm disso,
com o apoio dos resultados da regresso logstica, como ns de entrada da rede
neural, tcnica que vem sendo cada vez mais utilizada, contornaram-se as
caractersticas indesejveis das redes neurais, como processamento lento e
dificuldade na interpretao das variveis. Cabe ressaltar que, a busca por uma rede
neural mais eficiente de suma importncia e depende da experincia do
pesquisador, visto que algumas redes treinadas (RN1), tendo como ns de entrada os
resultados da regresso logstica, alcanaram os mesmos indicadores de eficincia
da regresso logstica, sendo aconselhvel, nesses casos o uso dos modelos mais
simples que alcanam o mesmo resultado, ou seja, o modelo mais parcimonioso.
Portanto, a utilizao de modelos de previso de risco de crdito que utilizam as
variveis comportamentais dos clientes elimina a subjetividade da anlise tradicional,
aproveitando as informaes ricas do comportamento do cliente que se encontram
armazenadas em bancos de dados, muitas vezes inutilizveis. Alm disso, a
padronizao do procedimento de deciso e a velocidade na anlise do crdito so
ganhos que aumentam a rentabilidade da empresa, garantindo uma maior eficincia
no atendimento dos clientes.
Durante a execuo desse trabalho surgiram algumas questes que no foram
abordadas nesse artigo e a seguir sero apresentadas como sugestes para
trabalhos futuros: (i) estudar o impacto do uso de grupos de clientes bons e maus de
tamanhos iguais ou diferentes na estimao e previso do modelo; (ii) avaliar, a partir
23
de uma medida de retorno monetrio, o quanto o aumento no valor de KS de 59

(regresso logstica) para 61 (regresso logstica + rede neural) pode trazer de
retorno que se justifique o uso de modelos hbridos; (iii) utilizar algoritmos genticos
para encontrar os parmetros timos da redes neurais e a quantidade tima de
neurnios da camada oculta; (iv) aplicar o modelo construdo para avaliar os ganhos
reais em termos de reduo da inadimplncia; (v) utilizar mtodos ensemble (TWALA,
2010; WANG et al., 2011) em modelos de Behavioral Scoring.
24
Referncias Bibliogrficas
ABDOU, H. A. An evaluation of alternative scoring models in private banking. The
Journal of Risk Finance, v.10 n.1, p.38-53, 2009.
AKHAVEIN, J.; FRAME, W.S; WHITE, L. J. The diffusion of financial innovations: An
examination of the adoption of small business credit scoring by large banking
organizations. The Journal of Business, v.78, n.2, p.577-596, 2005.
BAESENS, B.; SETIONO, R.; MUES, C.; VANTHIENEN, J., Using neural network rule
extraction and decision tables for credit-risk evaluation. Management Science, v.49,
n.3, p.312-329, 2003.
BEE, W. Y.; SENG, H. O.; NOR, M. H. Using data mining to improve assessment of
credit worthiness via credit scoring models. Expert Systems with Applications, v.38,
p.13274-13283, 2011.
BUENO, V. F. F. Avaliao de risco na concesso de crdito bancrio para
micros e pequenas empresas. Florianpolis: UFSC, 2003. Dissertao (Mestrado
em Engenharia da Produo), Programa de Ps-Graduao em Engenharia de
Produo, Universidade Federal de Santa Catarina, 2003.
CHEN, W.; MA, C.; MA, L. Mining the customer credit using hybrid support vector
machine technique. Expert Systems with Applications, v.36, p.7611-7616, 2009.
CHENG, L. H.; MU, C.C; CHIEH, J.W. Credit scoring with a data mining approach
based on support vector machines. Expert Systems with Applications, v.33, p.847856, 2007.
CHUNG, H. M.; GRAY, P. Special section: data mining. Journal of Management
Information Systems, v.16, n.1, p.11-16, 1999.
CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. Anlise multivariada: para cursos
de administrao, cincias contbeis e economia. So Paulo: Atlas, 2007.
DYCHE, J.; DYCH, J. The CRM handbook: a business guide to customer
relationship management. Reading, MA: Addison-Wesley, 2001.
EMEL, B. A; ORAL, M; REISMAN, A.; YOLALAN, R. A credit scoring approach for the
commercial banking sector. Socio-Economic Planning Sciences, v.37, p.103-123,
2003.
FINLAY, S. Credit scoring for protability objectives. European Journal of
Operational Research, v.202, 2010.
GANG, W.; JIAN, M.; LIHUA, H.; KAIQUAN, X. Two credit scoring models based on
dual strategy ensemble trees. Knowledge-Based Systems, v.26, p.61-68, 2011.
GHODSELAHI, A. A hybrid support vector machine ensemble model for credit scoring.
International Journal of Computer Applications, v.17, n.5, p. 975-8887, 2011.
HAIR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C. Anlise multivariada
de dados. 5.ed. Porto Alegre: Bookman, 2005.
HAND, D.J.; HENLEY, W. E. Statistical classification methods in consumer credit
scoring: a review. Journal of the Royal Statistical Society. Series A (Statistical in
society), v.160, p.523-541, 1997.
HAYKIN, S. Redes neurais: princpios e prtica. Trad. Paulo Martins Engel. 2.ed.
Porto Alegre: Bookman, 2001.
25
HOSMER, D. W.; LEMESHOW, S. Applied logistic regression. New York: John

Wiley & Sons, 1989.
HSIEH, N. C. An integrated data mining and behavioral scoring model for analyzing
bank customers. Expert Systems with Applications, v.27, p.623-633, 2004.
HSIEH, N.C., Hybrid mining approach in the design of credit scoring models. Expert
Systems with Applications, v.28, p.655-665, 2005
HUANG, Z.; CHEN, H.; HSU, J. C.; CHEN, H. W.; WU, S. Credit rating analysis with
support vector machines and neural networks: a market comparative study. Decision
Support Systems, v.37, p.543-558, 2004
JORION, P. Value at risk: the new benchmark for controlling market risk. New
York, Mc Graw Hill, 1997.
KIM, M.K.; SOHN, S.Y. Cluster-based dynamic scoring model. Expert Systems with
Applications, v.32, p.427-431, 2007.
LAHSASMA, A.; AINON, N. R.; WAH, Y. T. Credit scoring models using soft
computing methods: a survey. The International Arab Journal of Information
Technology, v.7, n.2, p.115-123, 2010.
LEE, T.; CHIU, C.; LU, C.; CHEN, I. Credit scoring using the hybrid neural discriminant
technique. Expert Systems with Applications, v.23, n.3, p.245-254, 2002.
LEE, T.S.; CHEN, I. F. A two-stage hybrid credit scoring model using articial neural
networks and multivariate adaptive regression splines. Expert Systems with
Applications, v.28, p.743-752, 2005.
LEWIS, E. M. An introduction to credit scoring. San Rafael: Fair, Isaac and Co.,
Inc. 1992.
LOESCH, C.; SARI, S.T. Redes neurais artificiais: fundamentos e modelos.
Blumenau, FURB, 1996.
LOUZADA, F.; AMARAL, G. J. A.; GUIRADO, L.; SILVA, P. H. F.; ABREU, H. J. ;
FERREIRA, M. R. P. Medidas estatsticas da capacidade preditiva de modelos de
classificao em credit scoring. P@rtes (So Paulo), v. 68, p.7-28, 2008.
MCCLELLAND, J. L.; RUMELHART, D. E. & the PDP research group. Parallel
distributed processing: explorations in the microstructure of cognition. v.
II. Cambridge, MA: MIT Press, 1986.
MCNAB, H.; WYNN, A. Principles and practice of consumer credit risk
management, CIB Publishing, Canterbury, 2000.
MENDES FILHO, E. F.; CARVALHO, A. C. P. L. F.; MATIAS, A. B. Utilizao de redes
neurais artificiais na anlise de risco de crdito a pessoas fsicas. In: III Simpsio
Brasileiro de Redes Neurais, Recife. Anais. 1996.
MORRISON, A. D, The economics of capital regulation in financial conglomerates.
Geneva Papers on Risk and Insurance: Issues and Practice, 2003.
SARLIJA, N.; BENSIC, M.; SUSAC, Z. M. Comparison procedure of predicting the
time to default in behavioural scoring. Expert Systems with Applications, v.36,
p.8778-8788, 2009.
SAUNDERS, A. Medindo o risco de crdito: novas abordagens para value at risk
e outros paradigmas. Rio de Janeiro: Qualitymark, 2000.
26
SECURATO, J. R. Crdito: anlise e avaliao de risco. So Paulo: Saint Paul,

2002.
SELAU, L. P. R. Construo de modelos de previso de risco de crdito. Porto
Alegre: UFRGS, 2008. Dissertao (Mestrado em Engenharia da Produo),
Programa de Ps-Graduao em Engenharia de Produo, Universidade Federal do
Rio Grande do Sul, 2008.
SELAU, L. P. R.; RIBEIRO, J. L. D. Systematic approach to construct credit risk
forecast models. Pesquisa Operacional, v.31, p.1-17, 2011.
SICS, A. L. Credit scoring: desenvolvimento de um sistema de credit scoring Parte
II. Tecnologia de Crdito. So Paulo: Serasa, n.5, 1998.
SICS, A. L. Desenvolvimento, implantao, acompanhamento. So Paulo:
Blucher, 2010.
STEINER, M. T. A.; CARNIERI, C.; KOPITTKE, B. H.; STEINER NETO, P. J.
Sistemas especialistas probabilsticos e redes neurais na anlise do crdito bancrio.
Revista de Administrao, v.34, n.3, p.56-67, 1999.
SUSTERSIC, M.; MRAMOR, D.; ZUPAN, J. Consumer credit scoring models with
limited data. Expert Systems with Applications, v.36, p.4736-4744, 2009.
THOMAS, L.C. A survey of credit and behavioural scoring: forecasting nancial risk of
lending to consumers. International Journal of Forecasting, v.16, p.149-172, 2000.
TSAI, C.F.; CHEN, M.L. Credit rating by hybrid machine learning techniques. Applied
Soft Computing, v.10, p.374-380, 2010.
TWALA, B. Multiple classifier application to credit risk assessment. Expert Systems
with Applications, v.37, p.3326-3336, 2010.
WANG, G.; HAO, J.; MA, J.; JIANG, H. A comparative assessment of ensemble
learning for credit scoring. Expert systems with applications, v.38, p.223-230, 2011.
WEST, D. Neural network credit scoring models. Computers and Operations
Research, v.27, n.11-12, p.1131-1152, 2000.
WONG, B. K.; SELVI, Y. Neural network applications in finance: a review and analysis
of literature. Information & Manegement, v.34, p.129-129, 1998.
YU, X.; EFE, M. O.; KAYNAK, O. A general backpropagation algorithm for feedforward
neural networks learning. IEEE Trans. on Neural Networks, v.13, n.1, p.251-254.
2002.
AN ALTERNATIVE APPROACH FOR SCORING BEHAVIORAL USING HYBRID

MODELING TWO-STAGE WITH LOGISTIC REGRESSION AND NEURAL
NETWORKS.
Abstract
With the progressive growth in lending volumes in Brazil, companies are seeking
improvement in assertiveness and flexibility in granting credit analysis, not only for
27
new customers but also to existing clients. Multivariate techniques have diffused to
build predictive models of credit risk that, based on both registration information, and
also in the history of the customer relationship in the company, predicting a pattern of
risk behavior. The aim of this paper is to propose a system for building predictive
models of credit risk based on behavioral data (Behavioral Scoring), using a process
of two-stage hybrid modeling with logistic regression and neural networks and
evaluate their performance. All stages of construction of the model are discussed in
detail, being approached from planning and definition of the model to the analysis of
the validation of the scoring formula. The model was applied to a sample of 9070
customers of a financial institution of national performance. The results for this
particular study showed that the developed hybrid modeling technique was superior to
traditional, stressing that the support of the logistic regression results as input nodes of
neural network bypassed the undesirable characteristics of neural networks, such as
slow processing and difficulty in interpretation of the variables.
Keywords: credit scoring, behavioral scoring, hybrid modeling, logistic
regression, neural networks.
28

Uma abordagem alternativa de behavioral scoring

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Uma abordagem alternativa de behavioral scoring

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

UMA ABORDAGEM ALTERNATIVA DE

Autora: Luciane de Godi Moraes

Porto Alegre, Julho de 2012.

UMA ABORDAGEM ALTERNATIVA DE

Autora: Luciane de Godi Moraes

Monografia apresentada para obteno

Porto Alegre, Julho de 2012.

" do buscar e no do achar que nasce o que eu no conhecia."

Deus, que em sua fora natural sempre guiou meu caminho.

Este artigo ser submetido REVISTA BRASILEIRA DE ESTATSTICA

UMA ABORDAGEM ALTERNATIVA DE BEHAVIORAL SCORING USANDO

Junto ao aumento da demanda pelo crdito e a grande competio industrial, surgiu a

(MORRISON, 2003). Ento, com a necessidade de automatizar o processo de

pesquisadores mostraram a eficincia desses modelos em comparao s tcnicas

2.1 Behavioral Scoring

Behavioral Scoring que normalmente necessrio histrico de dois anos e,

processamento, alm dos benefcios j mencionados. As duas tcnicas que sero

Lee et al. (2002)

Anlise Discriminante + Redes

Cluster + Redes Neurais

Preciso; Taxa de Erro

No-Paramtrica (MARS) + Redes

Huang et al. (2004)

Algoritmos Genticos + SVM

2.3 Regresso Logstica

de utilizar o mtodo de mnimos quadrados utilizado na regresso linear, para estimar

Z = ln (p / (1 -p)) = b0 + b1.X1 + b2.X1 ++ bn.Xn

multicolinearidade, optando por manter no modelo apenas aquelas de maior

2.4 Redes Neurais

Sendo xk o elemento de sada; wkj o coeficiente de ponderao entre os elementos k e

geral as funes de ativao do tipo sigmides so as mais usadas, por serem

Figura 1 - Modelo estrutural de uma rede neural

Inicialmente a camada de entrada era ligada diretamente camada de sada, obtendo

Para a minimizao da funo calculam-se as derivadas de E com relao aos pesos

das camadas escondidas; e (v) verificao da magnitude do erro. Na Figura 2 temos a

Figura 2 - Rede MLP e retro-propagao dos erros.

3. Sistemtica para Desenvolvimento do Modelo

Figura 3 - Etapas para o desenvolvimento do modelo.

Deve haver a diviso em 3

clientes com atrasos significativos (SELAU,2011). A

grupos de bons e maus clientes, a fim de intensificar a separao dos perfis

Figura 4 Esquema para obteno da amostra do modelo.

Repete-se essa seleo para diferentes pontos de observao, em datas diferentes,

WOE = ln [ P(c | Bom) / P(c | Mau) ]

IV = [ P(c | Bom) - P(c | Mau) ] . WOE

A anlise da curva ROC (receiver operating characteristic plots) baseia-se na

Tabela 3 - Nmero total de clientes na amostra, conforme a data do ponto de observao e a

intervalar; se Y=C a varivel cadastral, se Y=H a varivel histrica; Z o nmero

As 14 variveis com sinais positivos so associadas com ser bom pagador e as 17 de

N Neurnios camada oculta

Anlise da validao da frmula de pontuao

Regresso logstica + Rede neural

de uma medida de retorno monetrio, o quanto o aumento no valor de KS de 59

HOSMER, D. W.; LEMESHOW, S. Applied logistic regression. New York: John

SECURATO, J. R. Crdito: anlise e avaliao de risco. So Paulo: Saint Paul,

AN ALTERNATIVE APPROACH FOR SCORING BEHAVIORAL USING HYBRID

Você também pode gostar