Escolar Documentos
Profissional Documentos
Cultura Documentos
Operations
DATA SCIENCE & ARTIFICIAL INTELLIGENCE – MBA+
- Python
- Conda (Anaconda, Miniconda, etc.)
- PyCharm (pode ser Community Edition)
- GIT
MachineLearning + Operations
• Uso de Memória
• TPS (Transações por Segundo)
• Logs
• ...
• etc
Entrada (Parâmetros)
Saída (Resposta)
API executada
Sistemas
Entrada (Parâmetros)
API de ML
Valores Reais Curador de
Saída (Resposta) Camada de (Feedback) Modelos
Persistência de I/O
Entrada (Parâmetros)
Sistemas
Saída (Resposta) Real (Feedback)
Derrapada (drift) a 300 km por hora em 2016 de Erik Jones devido pneu furado.
A B B A B C A A B B A B A A B B A B
Curador de Modelos
Hamlet
A B B A B C A A B B A B A A B B A B
Feedback
A B B A B A A A B B A B A B B B A B
Eu não confio
em você.
Monitoramento Automático
A B B A B C A A B B A B A A B B A B
Feedback
A B B A B A A A B B A B A B B B A B
Tempo
• O segundo modelo avalia qual será o gasto estimado com despesas ordinárias, ou seja, exclui-se as despesas
excepcionais
Baseline Mês 3
Mês 1 Mês 2
• Faça um notebook Python (no Colab, por exemplo) que avalia se em algum dos meses o modelo de
classificação ou o modelo de regressão devem ser reavaliados. Justifique em quais meses.
• Os dados podem ser obtidos em:
https://storage.googleapis.com/ds-publico/IA/MonitoringDrifts.csv
MLOPS – Prof. MSc. Elthon Manhas de Freitas
Model Drift : Limitações
Acabo de me
Pra mim já deu! Não
atualizar, estou
consigo acompanhar
pronto para o
tanta mudança!
trabalho!
De acordo com seu propósito, alguns tem uma vida útil menor ou maior.
Classificação de “Tagueamento” de Previsão de Estimativa de
Documentos Imagens Demandas Tempo de Entrega
De acordo com seu propósito, alguns tem uma vida útil menor ou maior.
50,00%
40,00%
30,00%
20,00%
10,00%
0,00%
Treiname D+0 D+5 D+15 D+30
nto
Não 78,80% 78,70% 77,50% 80,00% 90,00%
Sim 21,20% 21,30% 22,50% 20,00% 10,00%
Mudança na
média, desvio
padrão e quartis
SD = 17.30205 SD = 24.28474
Var = 299.3609 Var = 589.7487
Correlação baixa
0.2455437
Idade
Gênero
Gênero
Renda
Renda
Após 30 dias de modelo
Escolaridade
Escolaridade
Só me mostre os
dados de entrada que "Eu não conto nada para ele,
porque ele toma uma cerveja
eu digo se há desvios!
e conta para todo mundo"
baseline
BaseDefault01.csv BaseMesAnterior.csv BaseMesAtual.csv
O documento a seguir avalia DataDrift (desvio dos dados) entre o baseline e o mês anterior.
Explore com o professor e avalie como é feito um processo simples de monitoramento de DataDrift.
Na seqüencia, faça você a análise de desvio dos dados presentes no mês atual.
https://colab.research.google.com/drive/1Bj4kz7ll3GAv8FfppNvzZv2OE151UwPg?usp=sharing
Entrada (Parâmetros)
Recorrente
Mudanças recorrentes ou
sazonais, como Natal, Black
Friday, etc. Tempo
Parte do
Pipeline
Relatório Alguns tipos de desvios já são
previstos desde a concepção
Automatizado do modelo.
Análise O processo de avaliação é
Regras são configuradas
bem definido e recorrente,
Pontual gerado por processos para que o modelo reinicie o
pipeline de treinamento.
Um examinador independente automáticos.
extrai e avalia periodicamente Obs: requer MLOps nível 1
e, se necessário, envia para Desvios importantes são
retreino. prontamente identificados e
alertas são disparados.
Nível 2
• Automação
Nível 1 completa
• Existe alguma
Nível 0 automação
• Sem automação
nos processos de
ML
ML Ops
Data Model Model Model Source
Preparation Training Evaluation Validation Code
Code Implantação
Repository
Experimento manual, passos manuais
Analistas
Semi manual:
Modelo
cria Serving de
Exploração/Experimentação e Desenvolvimento Treinado modelo
(imagem, p.e.)
Stagging / Produção
Model Serving
Serviço de
Predição
ML Ops
Data Model Model Model Source
Preparation Training Evaluation Validation Code CD : Pipeline de
Code
Repository Implantação
Experimento Orquestrado
Analistas
Semi
Extração manual
ML Metadata Scripts ML Metadata Store
Offline Exploração/Experimentação e Desenvolvimento
Store
Stagging / Produção ML Metadata Store,
Feature inicialmente Registro de
Store compartilhado Modelos
Modelo
Data Data Model Model Model Model Serving Treinado
Extraction Preparation Training Evaluation Validation (geralmente
imagem)
Pipeline automatizado Dados de
Produção
Gatilho Serviço de
/ regra Predição
Monitoramento
Versioning
Data Model Model Model Source
Preparation Training Evaluation Validation Code CI, Build & Test Pipeline Package
Code
Repository
Experimento Orquestrado
Analistas
ML Metadata Store Dev
Extração
Offline Exploração/Experimentação e Desenvolvimento CD : Pipeline de
Implantação
Stagging / Produção
Feature
Store
Docker Host(s)
IP/PORTA/ Modelo
ENDPOINT
de ML 1
Modelo
Cliente 2 de ML n
Aplicação
Web Banco de
Logs
Dados