Você está na página 1de 26

Criando eficazes modelos

baseados em AI com custo


baixo e em prazos curtos

1
O Boom de AI
“Signs of the AI boom are everywhere. Last year, Google was rumoured
to have paid $400m for DeepMind, a London-based AI startup. It
snatched the firm from under the nose of Facebook, which boasts its
own dedicated AI research laboratory, headed by Yann LeCun, a star
researcher hired from New York University.

Google once employed Andrew Ng, an AI guru from Stanford


University—until Baidu poached him last year to head up a new, Silicon
Valley-based lab of its own. Firms such as Narrative Science, in Chicago,
which hopes to automate the writing of reports (and which is already
used by Forbes, a business magazine, to cover basic financial stories),
and Kensho, of Cambridge, Massachusetts, which aims to automate
some of the work done by ‘quants’ in the financial industry, have been
showered in cash by investors.” (The Economist, May 9th 2015)

2
Investimento anual em AI (US)

Fonte: Statista https://www.statista.com/statistics/672712/ai-funding-united-states/


3
Os principais obstáculos
✓ Custo elevado de desenvolvimento e operação;

✓ Muitas ferramentas ainda pouco testadas;

✓ Time-to-market longo, incluindo ciclos de


codificação, testes, etc.;

✓ Poucos casos de sucesso apresentados pela maioria


das ferramentas.

✓ Overfitting e efeito Caixa-preta


4
As soluções de AI da IntelliSearch
As soluções da Ward Systems são de fato do tipo híbrido, em que a
rede neural (ANN) é supervisionada – durante o ciclo de
treinamento - e tem sua performance otimizada por um algoritmo
genético. Ele seleciona, ao longo de várias “gerações”, as melhores
combinações de parâmetros da rede neural, com as seguintes
vantagens sobre redes neurais “não supervisionadas”:

✓ Impede overfitting aos dados usados no treinamento (in-sample) melhorando


a capacidade de generalização quando atuando sobre dados “off-sample”;
✓ Quanto mais gerações percorridas durante o ciclo de treinamento, melhor o
“fitting” aos dados “off-sample”;
✓ Evita que a rede, durante o ciclo de treinamento, fique presa sobre um
máximo/mínimo local, e em vez disso busque o ponto ótimo “global”.
✓ Elimina o efeito “caixa-preta”, normalmente encontrado em ANNs não
supervisionadas, exibindo quais variáveis têm mais importância na
capacidade preditiva e/ou classificatória.
5
As soluções de AI da IntelliSearch
Já são aplicadas há anos na elaboração de modelos de
várias naturezas, como por exemplo:
✓ Parâmetros de risco financeiro, operacional e ambiental;

✓ Projeção de cenário e de parâmetros macroeconômicos;

✓ Projeção de evolução de ativos e de segmentos da economia;

✓ Classificação e categorização (“clustering”) de clientes,


mercados, ativos, incluindo mining para oferta de produtos de
crédito, e classificação de clientes e contratos para ações de
cobrança.
✓ Predição de parâmetros financeiros e econômicos, incluindo
scoring, PD, LGD, LCC, EL etc.).
6
Em modelagem de score, ANNs têm se mantido no topo

3,1 Neural Networks


O número é o valor do
ranking de cada 3,3 SVM RBF LS
algoritmo. Quanto
menor, melhor.
4.0 Logit regression

4.9 SVM LF LS

5.2 Linear discriminant analysis

5.3 Bayesian probabilistic networks

7.0 Naive Bayesian networks

Fonte: Credit Technology Dec/2015 – Serasa Experian 7


As soluções de AI da IntelliSearch

✓ Conforme demonstrado no gráfico anterior, Redes Neurais


superam, em capacidade preditiva e classificatória todas as
outras abordagens utilizadas no mercado (regressão logística,
SVMs Naïve Bayes,...), para aplicações em scoring, tanto no
desempenho máximo quanto no médio.

✓ No caso do desempenho mínimo, as redes neurais puras caem


nas “armadilhas” do overfitting e dos máximos/mínimos locais,
deixando escapar o máximo/mínimo global.

✓ Por isso utilizamos o modelo híbrido, com o ciclo de treinamento


supervisionado por um algoritmo genético e/ou PSO (particle
swarm optimization), que impede o overfitting e garante o
alcance do máximo/mínimo global.
8
Soluções de Redes Neurais otimizadas por
Algoritmos Genéticos da IntelliSearch

➢ NeuroShell Classifier;
➢ NeuroShell Predictor;
➢ Chaos Hunter.

Obs.: Os nomes de produtos apresentados neste slide e nos demais são de propriedade da
Ward Systems, parceira da IntelliSearch
9
A IntelliSearch adiciona uma camada de software e
de serviços às ferramentas da Ward Systems
Camada de
tratamento de
dados e
interface de
módulos Chaos
Hunter (*)

Captura e pré- Integração com


processamento de dados aplicações da
organização
Integração

NeuroShell NeuroShell
Predictor (*) Classifier (*)
Interface com o
(*) Marcas usuário final
registradas da (web and/or mobile)
10
Ward Systems
Seleção de variáveis

11
Seleção das funções componentes do modelo

12
Seleção das funções componentes do modelo (não
apenas redes neurais e algoritmos genéticos

13
Treinamento do modelo

14
Importância relativa das variáveis de input

15
Acompanhamento da convergência do modelo
durante o treinamento

16
Comparação com resultado real ou com o modelo de referência

17
Matriz de classificações e desvios
(para aplicações classificatórias como mining e cobrança)

18
Gráfico de dispersão
(para aplicações de modelagem de score, PD, LGD)

19
Curva ROC

20
Comparação com resultado real ou com o modelo de referência

21
A IntelliSearch e a Ward Systems
✓ A IntelliSearch tem mais de 12 anos de experiência contínua na
utilização de ferramentas da Ward Systems, e nesse tempo
desenvolveu metodologias e camadas de software adicionais
(interfaces, normalizadores de dados de input e output para redes
neurais, algoritmos de “seeding”).
✓ Nossa longa cooperação com a Ward Systems também nos dá o
privilégio de determos conhecimentos sobre a melhor forma de
configurar os parâmetros de otimização (treinamento de redes
neurais), além de técnicas para seleção de dados de treinamento.
✓ Finalmente, como únicos parceiros ativos no Brasil temos a total
credibilidade e autorização da Ward Systems para prestarmos
suporte local e consultoria relativa a seus softwares.
✓ Pela mesma condição de parceria, conseguimos obter descontos
para nossos clientes, em relação ao preço de lista.
22
Vantagens sobre outras plataformas de AI
✓ Treina rápido e com relativamente poucos dados.
✓ “Time to Market” curto (3 a 4 semanas em média).
✓ Algoritmos exaustivamente testados durante mais de 18 anos, e
ao mesmo tempo mantidos “cutting edge”. Evitam overfitting e o
efeito “caixa-preta”.
▪ Turboprop2 (aperfeiçoamento do “Cascade Correlation” de Scott
Fahlman;
▪ GRNN (genetic regressive neural network) é uma rede neural
probabilística (modelo desenvolvido por Donald Specht) com
treinamento supervisionado por um algoritmo genético) usando a
técnica “one-hold-out” para manter sempre parte da amostra in-
sample como out-of sample para teste de fitting durante o ciclo de
treinamento. Para alguns casos usamos também PSO
✓ Executável (run-time) pode ser facilmente incorporado a qualquer
plataforma, como DLL, ActiveX, etc. 23
A IntelliSearch e a Ward Systems

✓ Para cases locais e globais há uma lista parcial no website da


Ward Systems).

http://www.wardsystems.com/index.asp e

http://www.wardsystems.com/apptalk.asp (seções “Financial


applications” e “business predictions”)

24
Nossas referências
 Clientes em Finance:
Banco Cacique: Otimização do processo de report para a matriz do SG
Banco Votorantim: Montagem do processos de atendimento a IM de RM
FEBRABAN: Suporte de definições e PMO da Comissão de Gestão de Riscos e
ao grupo de trabalho (GTRP) de redução de custos de observância
Serasa Experian: Montagem e validação de modelos de suporte (para scores
e parâmetros de Basileia) das IFs clientes da organização

Nossa rede de correspondentes locais e internacionais:


Contínua atualização junto à FEBRABAN
Rede de colaboradores e parceiros internacionais, na Espanha, UK, HK, e
Áustria
Parcerias locais com a Serasa Experian
25
Obrigado pela atenção
• Entre em contato conosco para mais detalhes de como
desenvolver e aplicar as ideias aqui apresentadas

Av. das Nações Unidas, 12495 – 15º andar

04578-000 – São Paulo – SP – Brasil

+55 11 2844-1871

www.intellisearch.com.br

19

Você também pode gostar