Escolar Documentos
Profissional Documentos
Cultura Documentos
WANTOIR FEITEN
WANTOIR FEITEN
BLUMENAU, NOVEMBRO/1999
BANCA EXAMINADORA
ii
iii
AGRADECIMENTOS
iv
SUMRIO
LISTA DE FIGURAS .............................................................................................................viii
LISTA DE TABELAS ............................................................................................................... x
RESUMO .................................................................................................................................. xi
ABSTRACT .............................................................................................................................xii
1 INTRODUO....................................................................................................................... 1
1.1 Objetivos do Trabalho .......................................................................................................... 2
1.2 Organizao do Trabalho...................................................................................................... 2
2 INTELIGNCIA ARTIFICIAL.............................................................................................. 3
2.1 Conceituao ........................................................................................................................ 3
2.2 Objetivos da Inteligncia Artificial ...................................................................................... 3
2.3 Aplicaes da Inteligncia Artificial .................................................................................... 3
2.4 SISTEMAS ESPECIALISTAS ............................................................................................ 4
2.4.1 Conceituao ..................................................................................................................... 4
2.4.2 Evoluo dos Sistemas Especialistas................................................................................. 4
2.4.3 Arquitetura de um Sistema Especialista ............................................................................ 5
2.4.3.1 Base de Conhecimentos.................................................................................................. 5
2.4.3.2 Motor de Inferncia ........................................................................................................ 6
2.4.4 Representao do Conhecimento....................................................................................... 6
2.4.5 Ferramentas de construo de Sistemas Especialistas....................................................... 7
2.4.6 Limitaes de um Sistema especialista ............................................................................. 7
3 TEORIA DOS CONJUNTOS DIFUSOS ............................................................................... 9
3.1 Definio .............................................................................................................................. 9
3.2 Funo de Pertinncia......................................................................................................... 10
3.3 Sistemas Difusos ................................................................................................................ 11
vi
5.2.2 Julgamento....................................................................................................................... 28
5.2.3 Ambiente ......................................................................................................................... 28
5.3 Risco ................................................................................................................................... 29
5.4 Anlise Discriminante ........................................................................................................ 29
5.5 Modelo de Escoragem ........................................................................................................ 31
6 O PROTTIPO ..................................................................................................................... 35
6.1 Introduo........................................................................................................................... 35
6.2 Modelagem Essencial ......................................................................................................... 35
6.3 Plataforma de Desenvolvimento......................................................................................... 38
6.4 Aquisio do Conhecimento............................................................................................... 39
6.5 Representao do Conhecimento ....................................................................................... 42
6.6 Utilizao de Data Mining.................................................................................................. 42
6.7 Modelagem Difusa ............................................................................................................. 43
6.7.1 Conjuntos difusos ............................................................................................................ 44
6.7.2 Funes de pertinncia .................................................................................................... 45
6.7.3 Mquina de inferncia ..................................................................................................... 46
6.8 Testes Realizados ............................................................................................................... 47
7 CONCLUSES E SUGESTES.......................................................................................... 51
7.1 Concluses.......................................................................................................................... 51
7.2 Limitaes .......................................................................................................................... 51
7.3 Sugestes para trabalhos futuros ........................................................................................ 52
APNCIDE 1 - REGRAS UTILIZADAS ............................................................................... 53
REFERNCIAS BIBLIOGRFICAS ..................................................................................... 56
vii
LISTA DE FIGURAS
Figura 1: Componentes de um Sistema Especialista .................................................................. 5
Figura 2: Exemplo de funo de pertinncia ............................................................................ 11
Figura 3: Conjunto difuso de nmeros reais prximos de 6..................................................... 12
Figura 4: Conjunto difuso convexo .......................................................................................... 13
Figura 5: Conjunto difuso no convexo ................................................................................... 13
Figura 6: Os passos do processo de KDD ................................................................................ 16
Figura 7: Modelo recebe entradas e produz informaes......................................................... 23
Figura 8: Correlao entre caractersticas ................................................................................ 32
Figura 9: Distribuio de score - 1 ........................................................................................... 32
Figura 10: Distribuio de score - 2 ......................................................................................... 33
Figura 11: Ponto de corte 1 ...................................................................................................... 33
Figura 12: Ponto de corte 2 ...................................................................................................... 33
Figura 13: Divergncia ............................................................................................................. 34
Figura 14: Modelo Ambiental - diagrama de contexto ............................................................ 35
Figura 15: Modelo Comportamental - diagrama de fluxo de dados (DFD) ............................. 36
Figura 16: Modelo Entidade x Relacionamento ....................................................................... 37
Figura 17: Menu Principal (Creditor)....................................................................................... 39
Figura 18: Cadastro .................................................................................................................. 40
Figura 19: Dados Pessoais........................................................................................................ 40
viii
ix
LISTA DE TABELAS
Tabela 1: Tabela de score de duas caractersticas - idade ........................................................ 30
Tabela 2: Tabela de score de duas caractersticas - casa prpria/alugada ................................ 31
Tabela 3: Perfil exemplo........................................................................................................... 48
Tabela 4: Dados cadastrais do cliente exemplo........................................................................ 48
RESUMO
xi
ABSTRACT
xii
1 INTRODUO
Acompanhando a economia nacional nos ltimos anos, verifica-se que as diversas
mudanas promovidas pelo governo impactaram diretamente a concesso de crdito pessoal,
tanto no setor bancrio/financeiro como no comrcio. O processo de mudana de atitude, no
que tange o crdito para pessoas fsicas, dos tempos da inflao elevada para o momento de
estabilidade, gerou uma desorientao para as pessoas e para as instituies financeiras,
acarretando um aumento considervel na inadimplncia [ALM92].
Neste instante, aprofundaram-se os estudos na anlise de caractersticas das pessoas,
para desenvolver Sistemas de Apoio Deciso capazes de auxiliar na definio de quanto
poderia ser concedido de crdito. Muitos dos modelos de anlise de crdito para pessoas
fsicas desenvolvidos at o presente baseiam-se em clculos matemticos, suscetveis a falhas
por no considerar fatores de natureza humana. Desenvolveram-se tambm estudos utilizando
Inteligncia Artificial, especificamente com Sistemas Especialistas Probabilsticos, que
utilizam Bases de Conhecimento e regras de produo.
Este trabalho consiste numa pesquisa sobre o processo de anlise e concesso de
crdito para pessoas fsicas, e desenvolvimento de um prottipo para este fim, utilizando
Inteligncia Artificial, atravs de tecnologia de Sistemas Especialistas associado a mtodos de
data mining e lgica difusa. As informaes sobre os clientes sero coletadas atravs de
mdulo de cadastro, para posteriormente serem utilizadas na definio do perfil do cliente
ideal para concesso de crdito, minimizando o risco de inadimplncia.
Para a determinao do perfil do cliente ideal ser utilizada a filosofia de data mining,
para vasculhar os dados cadastrais dos clientes e descobrir caractersticas associadas aos
clientes que no apresentem histricos de inadimplncia. Este perfil ser utilizado ento, pelo
analista de crdito, para calcular o valor considerado tecnicamente possvel de ser
emprestado, para determinado cliente, com menor risco de inadimplncia. Este clculo ser
baseado em informaes obtidas pelo estudo dos conceitos e mtodos para concesso de
crdito utilizados atualmente, mas aplicados de forma distinta da usual. A definio deste
valor ser feita com uso de lgica difusa, atravs de inferncia com regras de produo, que
faro ponderaes entre as caractersticas do perfil do cliente ideal e as caractersticas do
cliente para o qual se deseja conceder crdito.
2 INTELIGNCIA ARTIFICIAL
2.1 CONCEITUAO
H muito tempo os pesquisadores e cientistas estudam a inteligncia humana com o
intuito de entender seu funcionamento. Diversas pesquisas foram desenvolvidas tentando
reproduzir a forma humana de pensar.
No mbito da computao, utiliza-se a expresso Inteligncia Artificial para designar o
estudo do comportamento inteligente. Mas o que a Inteligncia Artificial? Segundo
[RAB95], " o resultado da aplicao de tcnicas e recursos, especialmente de natureza no
numrica, viabilizando a soluo de problemas que exigiriam do humano certo grau de
raciocnio e de percia". Para [HAR88], "a Inteligncia Artificial um campo de estudos que
busca o desenvolvimento de sistemas inteligentes. Um sistema inteligente aquele capaz de
resolver problemas, que, quando resolvidos por humanos, exigem um comportamento dito
inteligente".
MECANISMO DE
APRENDIZAGEM E
AQUISIO DO
CONHECIMENTO
MOTOR DE
INFERNCIA
QUADRO NEGRO
SISTEMA DE
JUSTIFICAO
SISTEMA DE
CONSULTA
Fonte: [HEI95]
[PER95],
Para [PAC91], uma anlise do processo de resoluo de problemas por parte do ser
humano evidencia que este freqentemente considera situaes com informaes de natureza
qualitativa, incompleta ou incerta. O ser humano, quando busca por determinada soluo,
pressupe que o tratamento de informaes de tal natureza no se constitui em um obstculo
intransponvel. Para os sistemas especialistas, no entanto, o tratamento deste tipo de
informaes problemtico e tem sido alvo de amplos estudos.
Contudo, para manipular informaes de natureza qualitativa, incompleta ou incerta,
pode-se associar aos sistemas especialistas a Teoria dos Conjuntos Difusos. Esta teoria ser
abordada no captulo 3.
3.1 DEFINIO
Na teoria clssica dos conjuntos, um elemento pertence ou no a um determinado
conjunto, restringindo as fronteiras dos conjuntos e dando o mesmo peso a diferentes objetos.
Para conjuntos ordinrios, podemos associar o valor 1 aos elementos pertencentes a um
conjunto e 0 para os elementos que no pertencem a ele. A funo que associa estes valores
denominada de funo caracterstica do conjunto.
A teoria dos conjuntos difusos tambm permite que se tenha uma funo caracterstica,
a qual chamada de funo de pertinncia. Esta funo de pertinncia, em geral, assume
valores no intervalo [0,1] e faz com que um objeto passe a no mais ser classificado como
10
2,5
1,0
0,75
Pequeno
Mdio
Grande
0,25
Fonte: [WEL94]
Utilizando este exemplo, assumindo que o valor de x seja 2,5, tem-se um valor que
est contido no conjunto difuso pequeno com um grau de pertinncia igual a 0,75 e
pertencendo a mdio com um grau de pertinncia igual a 0,25.
11
1,0
h
0,0
(6-)
(6+)
Fonte: [RAU96]
Para [ROS95], um conjunto difuso convexo descrito por uma funo de pertinncia
cujos valores de pertinncia so crescentes, ou decrescentes, ou ainda crescentes e
12
A(y)
1,0
A(z)
A(x)
0,0
A(z)
A(x)
A(y)
0,0
x
13
3.7 DESFUSIFICAO
Existem situaes em que a sada de um processo difuso necessita ser um valor
quantitativo. Este valor pode ser apurado a partir de um nmero difuso, atravs do processo
denominado desfusificao. Segundo [ROS95], existem, pelo menos, sete mtodos
pesquisados e popularizados, de desfusificao, destacando-se o da pertinncia mxima, o
mtodo
da
centride
mdia
14
ponderada
da
pertinncia
mxima.
4 DATA MINING
4.1 DEFINIO
A evoluo tecnolgica dos ltimos anos tornou relativamente fcil o acmulo de
dados. Como conseqncia surgiram grandes repositrios de dados, agregados de forma
organizada e eficiente. Ao mesmo tempo, informao passa a ser valorizada como nunca antes
na histria, e os dados armazenados, vasculhados por especialistas, a procura de tendncias e
padres.
Entretanto, a anlise desses dados ainda demorada, dispendiosa, pouco automatizada,
e sujeita a erros, mal-entendidos e falta de acurcia. A automatizao dos processos de anlise
de dados, com a utilizao de softwares ligados diretamente massa de informaes, se
tornou uma necessidade, j que o aproveitamento das informaes j existentes,
transformando-as em conhecimento, permite avanos sem paralelo na histria do
desenvolvimento dos bancos de dados [FIG98].
Neste captulo apresentado o Data Mining, que a explorao e anlise, por meios
automticos ou semi-automticos, de uma grande quantidade de dados para descobrir padres
e regras significativos [BER97]. Sero descritas as etapas do Processo de KDD (Knowledge
Discovery in Databases - KDD) e as tarefas que o Data Mining pode desempenhar.
Fonte: [FIG98]
Os dados pr-processados devem ainda passar por uma transformao que os armazena
adequadamente, visando facilitar o uso das tcnicas de Data Mining. Em algumas aplicaes
de Data Mining mais especficas, ferramentas avanadas de representao de conhecimento
podem descrever o contedo de um banco de dados por si s, usando esse mapeamento como
uma meta-camada para os dados.
16
17
exemplo, pode-se voltar o processo de KDD para uma etapa anterior, desde que a tcnica e os
dados empregados permitam.
4.4.1 CLASSIFICAO
Classificao uma tcnica que consiste na aplicao de um conjunto de exemplos
pr-classificados para desenvolver um modelo capaz de classificar uma populao maior de
registros. Em geral, algoritmos de classificao incluem rvores de deciso ou redes neurais, e
comeam com um treinamento a partir de transaes-exemplo. O algoritmo classificador usa
estes exemplos para determinar um conjunto de parmetros, codificados em um modelo, que
ser mais tarde utilizado para a discriminao do restante dos dados.
Uma vez que o algoritmo classificador foi desenvolvido de forma eficiente, ele ser
usado de forma preditiva para classificar novos registros naquelas mesmas classes prdefinidas.
Alguns exemplos de Classificao so:
a) classificar pedidos de crditos como de baixo, mdio e alto risco;
b) esclarecer pedidos de seguro fraudulentos;
c) atribuir palavras-chave a artigos jornalsticos.
18
4.4.2 ESTIMATIVA
Uma variao do problema de classificao envolve a gerao de valores ao longo das
dimenses dos dados: so os chamados algoritmos de estimativa. A estimativa lida com
resultados contnuos, ao contrrio da classificao que lida com resultados discretos.
Fornecidos alguns dados, usa-se a estimativa para estipular um valor para alguma varivel
contnua desconhecida como receita, altura ou saldo de carto de crdito.
Ao invs de um classificador binrio determinar um risco positivo ou negativo, a
tcnica gera valores de escore, dentro de uma determinada margem. A abordagem de
estimativa tem a grande vantagem de que os registros individuais podem ser agora ordenados
por classificao, e as redes neurais so adequadas a esta tarefa.
Exemplos de estimativa incluem:
a) estimar o nmero de filhos numa famlia;
b) estimar a renda total de uma famlia;
c) estimar o valor em tempo de vida de um cliente.
19
4.4.4 PREVISO
A previso o mesmo que classificao ou estimativa, exceto pelo fato de que os
registros so classificados de acordo com alguma atitude futura prevista. Em um trabalho de
previso, o nico modo de confirmar a preciso da classificao esperar para ver.
Essa tarefa uma variante do problema de agrupamento por afinidades, onde as regras
encontradas entre as relaes podem ser usadas para identificar seqncias interessantes, que
sero utilizadas para predizer acontecimentos subsequentes. Nesse caso, no apenas a
coexistncia de itens dentro de cada transao importante, mas tambm a ordem em que
aparecem, e o intervalo entre elas. Seqncias podem ser teis para identificar padres
temporais, por exemplo entre compras em uma loja, ou utilizao de cartes de crdito, ou
ainda tratamentos mdicos.
Exemplos de tarefas de previso:
a) previso de quais clientes sairo nos prximos seis meses;
b) previso da quantia de dinheiro que um cliente utilizar caso seja oferecido a ele
um certo limite de carto de crdito.
4.4.5 SEGMENTAO
A segmentao um processo de agrupamento de uma populao heterognea em
vrios subgrupos ou clusters mais homogneos. O que a distingue da classificao que a
segmentao no depende de classes pr-determinadas.
20
21
22
[BER97]
23
Segundo [BER97], para criar um modelo para Data Mining, deve-se ter em mente o
seguinte:
a) um dos perigos no uso de modelos o excesso ou a carncia de dados;
b) tanto o Data Mining direto quanto o indireto usam modelos, mas de maneira
diversa;
c) alguns modelos expem sua finalidade melhor que outros;
d) alguns modelos so mais fceis de aplicar que outros.
Cada tcnica de data mining possui tarefas onde elas so melhores aplicveis. Cada
classe de aplicao em data mining tem como base um conjunto de algoritmos que sero
usados na extrao de relaes relevantes dentro de uma massa de dados: anlise de
seqncias, clusterizao, classificao, estimativas e regras de associao. Outras tcnicas
mais recentes incluem lgica difusa (fuzzy logic) e algoritmos genticos. Cada uma destas
propostas difere quanto classe de problemas que o algoritmo ser capaz de resolver.
4.5.2 MBR
O MBR (Memory-Based Reasoning raciocnio baseado em memria) uma tcnica
de data mining dirigida que usa exemplos conhecidos como modelo para fazer previses
sobre exemplos desconhecidos. O MBR procura os vizinhos mais prximos nos exemplos
conhecidos e combina seus valores para atribuir valores de classificao ou de previso
[BER97].
Os elementos-chave no MBR so a funo de distncia usada para encontrar os
vizinhos mais prximos e a funo de combinao, que combina valores dos vizinhos mais
prximos para fazer uma previso. Uma vantagem do MBR sua habilidade de aprender
sobre novas classificaes simplesmente introduzindo novos exemplos no banco de dados.
Uma vez encontrada a funo de distncia e a funo de combinao corretas tendem a
24
permanecer muito estveis, mesmo com a incorporao de novos exemplos para novas
categorias nos dados conhecidos. Alis, esta uma caracterstica que diferencia o MBR da
maior parte das outras tcnicas de data mining.
25
26
5 ANLISE DE CRDITO
5.1 INTRODUO
A deciso em finanas sempre objeto de muitos cuidados por parte dos executivos
financeiros. Em condies limites, poder significar o fracasso ou o sucesso de toda uma
administrao. O ato de decidir, segundo [SEC96], a mais importante funo do
administrador e a que envolve a maior relao custo-benefcio, quando se trata do
administrador financeiro.
Pode-se compreender ento, que uma deciso tomada hoje dever causar uma srie de
efeitos no futuro, embora existam grandes dificuldades em estabelecer claramente estes
efeitos, ou mesmo instrumentos para detect-los e quantific-los. O executivo financeiro est
constantemente tomando decises dentro de um ambiente de mudanas, onde o risco e a
incerteza preponderam em termos de conjuntura econmica, poltica e social [SEC96].
Apresenta-se nos tpicos a seguir as questes consideradas mais importantes para um
processo de anlise de crdito.
experincia;
b)
julgamento;
c)
ambiente.
5.2.1 EXPERINCIA
A experincia provm de um conjunto de situaes vividas por uma pessoa ou
empresa, e tanto maior quanto maior for o nmero de exposies ao processo decisrio.
Quando se pensa em experincia importante considerar o nmero de exposies a diferentes
processos de deciso, o nvel de responsabilidade do envolvido na tomada da deciso, com
quem a compartilhou ou se era nica e, finalmente, os resultados obtidos [SEC96].
5.2.2 JULGAMENTO
Normalmente uma deciso tomada com base em experincias do passado, porm, em
algumas situaes, se obrigado a contrariar a experincia. " nestas ocasies que aparece
certa habilidade inata aos tomadores de deciso" [SEC96].
A ocorrncia destes fatos amplia a experincia e conduz a um ciclo que envolve
experincias e julgamentos. O julgamento tem muito a ver com a questo poltica dentro da
organizao; isso deve levar a uma postura objetiva na realizao de um trabalho, de forma a
tomar-se a deciso de qualidade boa ao invs de ficar procurando a tima [SEC96]. O
julgamento , ainda, o responsvel pelo exame da possibilidade de a deciso ser ou no
efetivada.
5.2.3 AMBIENTE
O ambiente, dentro de um processo de tomada de deciso, deve ser analisado sob dois
aspectos, antes e depois da deciso. fundamental que o ambiente, do ponto de vista anterior
ao instante da deciso, seja cultivado para que se facilite o processo decisrio. importante a
diversificao do fluxo de informaes e a conscincia do grupo que decide em relao a sua
cultura [SEC96].
No aspecto do ambiente ps deciso, [SEC96] declara que deve ser levado em conta
que as decises podem afetar pessoas, suas crenas, opinies e conceitos pr-estabelecidos.
Dentro deste quadro torna-se importante ao administrador no s a tomada de deciso, mas
tambm a explicao da mesma.
28
5.3 RISCO
Na rea financeira, o risco e a incerteza esto presentes em um grande nmero de
decises que, em conjunto, podem conduzir ao fracasso ou ao sucesso. A definio mais
simples e prtica parece ser dada por [SOL81]: "risco o grau de incerteza a respeito de um
evento". Um "evento certo" tratado no estudo das probabilidades como correspondendo
probabilidade de 100% de que ocorra. Desta forma, "sempre que estivermos diante de eventos
que apresentam certo grau de incerteza, podemos estabelecer uma correspondente
probabilidade de ocorrncia do evento" [SEC96].
O grau de incerteza, ou seja, o risco, estar intimamente ligado com a probabilidade de
ocorrncia dos eventos em estudo. A condio limite ser a condio de incerteza plena em
que no se quer ou no se tem condies de usar o conceito de probabilidades para a avaliao
do evento.
29
de clientes daquela instituio, um de bons e outro de maus, para que sejam determinadas
quais as caractersticas comuns.
Por caracterstica, neste caso, devem ser consideradas variveis como idade, tempo de
emprego, valor do patrimnio, etc. Os valores que as caractersticas assumem so
denominados de atributos. Abaixo, um exemplo extrado de [PET73] ilustra a anlise
discriminante.
Se aceitar todos os clientes que procurarem a instituio, encontrar-se- dezesseis
clientes bons para cada cliente mau. Esta relao pode ser expressa dizendo-se que a
"probabilidade da populao" [PET73] de dezesseis para um.
Supondo-se tambm que cada cliente mau gere um prejuzo mdio de R$ 400,00 e que
cada cliente bom gere um lucro mdio de R$ 20,00. O ponto de equilbrio ser de 400/20, ou
seja, vinte para um. Isto equivale a dizer que ser preciso vinte clientes bons para pagar um
mau.
Imaginando-se que na amostra, as variveis (caractersticas) idade e tipo de residncia
tenham apresentado o seguinte comportamento:
Tabela 1: Tabela de escore de duas caractersticas - idade
Idade
% de bons
% de maus
Probabilidade
At 30
10
40
1/4
31 a 40
20
30
2/3
41 a 50
30
20
3/2
Acima de 50
40
10
4/1
100 %
100 %
30
% de bons
% de maus
Probabilidade
Prprio
60
30
2/1
Alugado
30
60
1/2
Outros
10
10
1/1
100 %
100 %
31
idade
Idade
Tempo de
emprego
Casa
prpria/
alugada
Tempo de
residncia
Quantidade
3200 bons
200 maus
1/2
1/1
Relaes de probabilidade
Este grfico, em nmeros absolutos de bons e maus clientes no muito til para
leitura e anlise. O mesmo grfico, registrando porcentagens destes mesmos clientes facilita a
visualizao, como observado na figura 10.
32
maus
bons
100
10
20
50
80
110
pontos
Supondo que se quisesse colocar um ponto de corte a 65 pontos, para eliminar todos os
maus clientes, perder-se-a cerca de 40% dos clientes potencialmente bons.
Figura 11: Ponto de corte 1.
%
maus
bons
100
10
20
50
80
110
pontos
Entretanto, colocando-se o ponto de corte a 25, com o intuito de incluir quase todos os
bons clientes, aceitar-se- cerca de 50% dos clientes potencialmente maus.
Figura 12: Ponto de corte 2.
%
maus
bons
100
10
20
50
80
110
33
pontos
Assim, quanto mais afastadas estiverem as curvas, mais eficiente ser o sistema. A
distncia entre os picos das curvas chamada de "divergncia" e mede o "poder
discriminante" do sistema.
Figura 13: Divergncia.
maus
bons
100
Sistema A
0
%
10
20
50
maus
80
110
pontos
bons
100
Sistema B
10
20
50
80
110
34
pontos
6 O PROTTIPO
6.1 INTRODUO
A proposta de construir um prottipo de um sistema especialista utilizando-se a teoria
dos conjuntos difusos e a tcnica de data mining para anlise de seleo estatstica, aplicados
na rea de anlise de crdito, objetiva apoiar o especialista na realizao de suas tarefas. O
desenvolvimento de um prottipo deve necessariamente possuir uma especificao, onde
define-se os requisitos da aplicao.
O passo inicial da fase de especificao do sistema um levantamento de dados e
informaes para nortear o desenvolvimento do prottipo. Este levantamento feito
contatando-se o usurio, e elaborando-se uma descrio textual, por exemplo. A partir desta
descrio, parte-se para a etapa de modelagem do prottipo. No captulo 5 foi feita a descrio
do processo de anlise de crdito, e com as informaes coletadas pode-se realizar diversas
representaes que auxiliam a implementao do prottipo, de acordo com a modelagem
essencial.
Dados adicionais
Definio de perfil
Atribuio de limite
ANALISTA
DE
CRDITO
2.
3.
4.
1)
2)
3)
4)
CLIENTE
CLIENTE
CLIENTE
ANALISTA
DE
CRDITO
Dados pessoais
MANTER
CADASTRO DE
DADOS
PESSOAIS
Dados
Pessoais
Dados profissionais
MANTER
CADASTRO DE
DADOS
PROFISSIONAIS
Dados
Profissionais
Dados adicionais
MANTER
CADASTRO DE
DADOS
ADICIONAIS
Dados
Adicionais
DEFINIR PERFIL
DO CLIENTE
CONSIDERADO
IDEAL
Definio de perfil
36
Arquivo de
Perfil
5)
6)
ANALISTA
DE
CRDITO
ATRIBUIR
LIMITE DE
CRDITO DO
CLIENTE
Atribuio de limite
GERAR
RELATLORIO
DE LIMITE DE
CRDITO
Limite de
Crdito
Limite de
Crdito
ANALISTA
DE
CRDITO
Dicionrio de dados:
Dados Pessoais = CPF + { nome + sexo + rua + nmero + bairro + cidade + estado + CEP +
naturalidade + data de nascimento}
37
Dados Profissionais = CPF + { profisso + renda mensal + nome da empresa + tempo de emprego}
Dados Adicionais = CPF + { estado civil + nmero de filhos + grau de instruo + tipo de reresidncia + tipo de veculo + conceito subjetivo}
Atribuio de Limite = {CPF + valor deferido}
Relatrio de Limite de Crdito = CPF + nome + data do limite + valor calculado + valor deferido}
A partir do MER so definidas as tabelas que comporo o projeto lgico do prottipo,
definidas na forma da entidades identificadas, descritas a seguir:
a) Tabela Dados Pessoais: CPF, nome do cliente, sexo, rua, nmero, bairro, cidade, estado,
CEP, naturalidade e data de nascimento;
b) Tabela Dados Profissionais: CPF, profisso, salrio, nome da empresa e tempo de
emprego;
c) Tabela Dados Adicionais: CPF, estado civil, nmero de filhos, grau de instruo, tipo de
residncia, tipo de veculo e conceito subjetivo;
d) Tabela Limite de Crdito: CPF, valor calculado, valor deferido e data do limite.
e) Arquivo de Perfil: idade ideal, residncia ideal, veculo ideal, instruo ideal, estado civil
ideal, tempo de emprego ideal e sexo ideal.
38
39
A ordem na aquisio do conhecimento dada pela ordem dos botes na tela, de cima
para baixo:
a) Dados Pessoais: os dados pessoais do cliente consistem em informaes acerca de
sua identificao e local de residncia (figura 19);
Figura 19: Dados Pessoais.
40
41
42
43
Os dados dos limites de crdito j definidos podem ser recuperados digitando-se o CPF
do cliente no campo prprio e acionando-se em seguida o boto "Recuperar". Se no houver
limite definido, pode-se calcular o limite acionando-se o boto "Calcular". Aps informado o
valor deferido para o cliente, pelo especialista, este pode ser gravado na tabela Limites.DB,
referida no captulo 7.3. Estes dados tambm podem ser impressos.
ao infinito) reais.
b) Para o requisito Instruo, o conjunto difuso foi construdo tendo por base o
nmero de anos necessrios para se alcanar cada grau de formao. Para cada grau
foi definida uma varivel lingustica, associada ao nmero de anos necessrios para
seu atingimento. Conjunto: (analfabeto, primrio, ginsio, segundo grau, terceiro
grau, ps-graduao, mestrado, doutorado).
c) No caso do requisito Idade, o conjunto difuso foi construdo a partir da informao
do perfil definido, conforme explicado no tpico 6.6. Esta informao tomada
como valor mximo inteiro positivo, sendo que o menor valor inteiro positivo
sempre ser 0 (zero). O limite superior definido pela varivel "Idade" do perfil do
cliente ideal definido.
44
45
cliente)*100)
d) Tempo de Emprego: Quando o tempo de emprego do cliente for igual ao do perfil
definido, atribudo o grau de pertinncia igual a 100, caso contrrio, aplicada a
funo abaixo, onde o valor lingustico atribudo de acordo com a varivel
lingustica. Para cada tempo de emprego, identificados atravs das variveis
lingusticas, so definidos os valores lingsticos, atribuindo-se um valor numrico.
FP = (valor lingustico /10)*80.
e) Filhos: Para cada varivel lingustica criada atribudo um valor ligustico.
Quando o valor lingustico for igual a dois, atribudo o grau de pertinncia igual a
100, caso contrrio, aplicada a funo de pertinncia abaixo.
FP = 100 - ((valor lingustico/10)*80).
Para as demais variveis existem somente duas funes de pertinncia. A primeira
possui valor de pertinncia igual a 1,0, quando o cliente possui a caracterstica desejada. A
segunda atribui valor de pertinncia igual a 0,0.
46
47
23 anos
De familiares
Prprio
Mestrado
Solteiro
Dois a cinco anos
Feminino
22 anos
Prpria
Prprio
Terceiro grau
Solteiro
Dois a cinco anos
Masculino
Nenhum
R$ 2.900,00
Regra 1
SE Idade do Cliente (22) = Idade do Perfil (23)
ENTO Valor de Pertinncia = 100
SENO SE Idade do Cliente (22) > Idade do Perfil (23)
ENTO Valor de Pertinncia = ((Idade do Cliente - Idade do Perfil) /Idade do
Perfil)*100
SENO Valor de Pertinncia = ((Idade do Perfil (23) - Idade do Cliente (22)) /Idade do
Cliente (22))*100
Valor de Pertinncia Idade = 5
Regra 2
SE Residncia do Cliente (Prpria) = Residncia do Perfil (De familiares)
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Valor de Pertinncia Residncia = 0
Regra 3
SE Veculo do Cliente (Prprio) = Veculo do Perfil (Prprio)
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Valor de Pertinncia Veculo = 100
48
Regra 4
SE Estado Civil do Cliente (Solteiro) = Estado Civil do Perfil (Solteiro)
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Valor de Pertinncia Estado Civil = 100
Regra 7
SE Sexo do Cliente (Masculino) = Sexo do Perfil (Feminino)
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Valor de Pertinncia Sexo = 0
49
Regra 9
SE Salrio do Cliente (2.900) < 500
ENTO Valor de Pertinncia = (300/30)
SENO SE Idade do Cliente (2.900) < 3000
ENTO Valor de Pertinncia = (300/15)
SENO Valor de Pertinncia = (300/10)
Valor de Pertinncia Salrio = 20
Clculo do Limite de Crdito
Limite de Crdito Sugerido = ((VP_Idade + VP_Resid + VP_Veiculo
+ VP_Instruc + VP_EstCivil + VP_TpEmpr
+ VP_Sexo + VP_Filhos) /800) * ((VP_Salario
* Salrio do Cliente) / 100)) * 12);
Limite de Crdito Sugerido = (((5 + 0 + 100 + 100 + 53 + 100 + 0 + 100) /800)
* ((20 * 2.900) / 100) * 12);
Limite de Crdito Sugerido = R$ 3.985,00
50
7 CONCLUSES E SUGESTES
7.1 CONCLUSES
A proposta do presente trabalho foi de demonstrar a utilizao da tecnologia dos
sistemas especialistas, unindo a teoria dos conjuntos difusos e tcnicas de data mining,
aplicados na rea de anlise de crdito para pessoas fsicas, objetivando auxiliar o profissional
responsvel por esta tarefa a definir um valor de Limite de Crdito.
O sistema especialista no domnio do conhecimento no qual foi construdo demonstrou
que os objetivos pretendidos foram alcanados, mostrou-se muito til a unio da teoria dos
conjuntos difusos e tcnicas de data mining. A soma desta tecnologias demonstrou a
possibilidade de utilizao de sistemas especialistas na rea de anlise de crdito para pessoas
fsicas, na forma de uma ferramenta de apoio deciso, liberando o especialista para outras
atividades correlacionadas.
Constatou-se que alguns problemas do mundo real tem revelado a necessidade de tratar
dados imprecisos e qualificativos. Mostra-se neste campo, uma crescente aplicao da lgica
difusa. As perspectivas neste rea so promissoras j que sistemas especialistas podem fundirse a tcnicas de data mining e teoria dos conjuntos difusos para solucionarem problemas
cada vez mais complexos.
7.2 LIMITAES
O prottipo construdo possui algumas limitaes, como geralmente acontece em
trabalhos desenvolvidos em um espao curto de tempo como o definido para este estudo.
Pode-se citar as seguintes limitaes:
a) uso de poucas variveis na definio do perfil do cliente ideal desejado;
b) no implementao de mdulo de manuteno das regras, acarretando necessidade
de alterao do cdigo fonte do prottipo;
c) no foi realizado estudo comparativo sobre as tcnicas de data mining a fim de
identificar qual se mostraria mais adequada ao projeto.
52
Regra 2
SE Residncia do Cliente = Residncia do Perfil
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Regra 3
SE Veiculo do Cliente = Veiculo do Perfil
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Regra 4
SE Estado Civil do Cliente = estado Civil do Perfil
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
Regra 5
SE Instruo do Cliente = Instruo do Perfil
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = (Valor Lingstico/24)*80
Regra 6
SE Tempo de Emprego do Cliente = Tempo de Emprego do Perfil
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = (Valor Lingstico/10)*80
Regra 7
SE Sexo do Cliente = Sexo do Perfil
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 0
54
Regra 8
SE Nmero de Filhos do Cliente = 'Nenhum'
ENTO Valor de Pertinncia = 100
SENO Valor de Pertinncia = 100 - ((Valor Lingstico/10)*80)
Regra 9
SE Salrio do Cliente < 500
ENTO Valor de Pertinncia = (300/30)
SENO SE Idade do Cliente < 3000
ENTO Valor de Pertinncia = (300/15)
SENO Valor de Pertinncia = (300/10)
55
REFERNCIAS BIBLIOGRFICAS
[ALM92]
[AVI98]
[BER97]
[CAN98]
[FAY96]
FAYYAD, Usama M... [et all]. Advances in knowledge discovery and data
mining. Mento Park : AAAI : MIT, 1996.
[FIG98]
[HAR88]
[HAR98]
[HEI95]
[LAP93]
56
[LEV88]
[PAC91]
[PER95]
[PET73]
[RAB95]
[RAU96]
[RIB87]
57
[ROS95]
[SEC96]
[SOL81]
[WEL94]
58