Você está na página 1de 3

THE MACHINE LEARNING CANVAS Designed for: Introdução a Ciencia de dados Designed by: Rafael Couto de Oliveira Date:

for: Introdução a Ciencia de dados Designed by: Rafael Couto de Oliveira Date: Iteration:
.

7 - PREDICTION 6- DECISIONS 1- VALUE 3- DATA 2- DATA SOURCES


TASK PROPOSITION COLLECTION
How are predictions turned into Where can we get (raw)
Type of task? Entity on which predictions proposed value for the end-user? Mention Who is the end-user? What are their Strategy for initial train set & continuous information on entities and observed
are made? Possible outcomes? Wait time parameters of the process / application objectives? How will they benefit from update. Mention collection rate, holdout outcomes? Mention database tables, API
before observation? that does that. the ML system? Mention on production entities, cost/constraints to methods, websites to scrape, etc.
workflow/interfaces. observe outcomes.
*Verificar melhores preços *Tabela de produtos e preços dos
Entrada: Lista de itens, dentro de um range de distância Usuário final: Consumidor de *Coletar dados a partir de notas supermercados
quantidades e localização do (50 km por exemplo) supermercados fiscais físicas (?)
usuário *Tabela de supermercados e seus
*Comparar distancia e preços em Objetivo: Elencar melhores *Coletar dados a partir de notas dados (Nome, rede, endereço, se
Saída: Lista de lojas e quais itens relação direta ao local preços dos supermercados da fiscais eletrônicas (base governo) permite entrega, se permite
e quantidades adquirir nessas região/cidade para uma (?) compra online)
lojas. *Comparar diferença de preço determinada lista de compras
com distância do local do (considerando produtos e *Coletar dados de sites dos *Valores de combustíveis
usuário marcas, diferentes supermercados (tabloides online
envasamentos) via Web Scrapping) *Input de localização do usuário

9 - IMPACT 8- MAKING Motivo: Gerar economia ao 5- BUILDING 4 - FEATURES


SIMULATION PREDICTIONS consumidor e visibilidade de MODELS
menor preço dada a grande Input representations
Can models be deployed? Which test data When do we make real-time / batch How many prod models are needed? available at prediction time,
quantidade de lojas extracted from raw data sources.
to assess performance? Cost/gain values pred.? Time available for this + When would we update? Time available
for (in)correct decisions? Fairness featurization + post-processing? for this (including featurization and
constraint? Compute target? analysis)? ABT com chave primaria sendo
o produto (ID sequencial,
Comparar resultado do modelo Frequência de atualização de Prescritivo / Determinístico produto, marca, volume, tipo da
com a lista de compra do mercado dados: Diária embalagem).
mais próximo ou da preferência Linear (baseado no algoritmo
do cliente Frequência de execução: Sempre esboçado) Preços de cada mercado em
que solicitado colunas diferentes.
Método de Otimização
Data de atualização por loja

10 - MONITORING Comparar resultado obtido na


“simulação” com o resultado real
Metrics to quantify value creation and e elencar quais foram as
measure the ML system’s impact in
production (on end-users and business)? dificuldades ou diferenças
encontradas

Version 1.1. Created by Louis Dorard, Ph.D. Licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Please keep this mention and the link to ownml.co when sharing. OWNML.CO
1 - Goal/Objetivo: Qual é a sua proposta de valor?

Modelo para elencar melhores preços dos supermercados da região/cidade dado uma determinada lista de
compras, considerando produtos, marcas e envasamentos diferentes. O objetivo principal é geral economia ao
consumidor e visibilidade dos menores preços, uma vez que existe uma enorme gama de lojas que comercializam os
mesmos produtos a diferentes preços.

2 - Data Sources/Recursos de Dados:

Para elaborar esse modelo é necessário, em ordem de importância, as seguintes informações:

 Tabela de produtos e seus preços por supermercado;


 Tabela de supermercados e seus dados como nome, localização;
 Cadastro nacional de produtos para padronização da entrada de dados;
 Localização do usuário;
 Valores de combustíveis para comparação e precificação de distancias;

3 - Data Collection/Coleta de Dados:

O desafio principal desse modelo é como coletar os dados de forma correta. Algumas formas de conseguir esses
dados são:

 Coletar dados dos tabloides online das redes de supermercado via Web Scrapping;
o https://sm.condor.com.br/
o https://delivery.supermuffato.com.br/
o https://mercado.carrefour.com.br/
 Coletar dados a partir de base de dados governamentais;
o Cadastro nacional de produtos (https://cnp.gs1br.org/);
 Coletar dados a partir de notas fiscais eletrônicas;
 Coletar dados a partir de notas fiscais físicas (análise cognitiva);
 Coletar dados a partir de tabloides físicos (análise cognitiva);

4 - Features/ Preparar as Variáveis:

A partir das tabelas de produtos e


supermercados, é possível elaborar uma ABT onde a
chave primária é um ID baseado no produto, marca e Numérica Discreta ID
volume (por exemplo: uma Coca-cola 1L de garrafa pet
Categórico Nominal Descrição
tem um ID, enquanto uma Coca-cola 1L de garrafa de
vidro tem outro ID, pois são produtos semelhantes Categórico Ordinal Volume
porem diferentes do ponto de vista mercadológico). Categórico Nominal Embalagem
Categórico Nominal Loja 1
Categórico Nominal Local 1
Numérica Contínua Preço 1
Numérica Contínua Atualização 1
(...) (...)
Categórico Nominal Loja n
Categórico Nominal Local n
Numérica Contínua Preço n
Numérica Contínua Atualização n
5 - Buiding Models/ Construção de Modelos:

O modelo para resolver esse problema deve ser um modelo de otimização prescritivo determinístico convexo
linear (LP), uma vez que a função objetivo apresenta características lineares (f(x)=ax+b):

Esboço do modelo

Variáveis de decisão:

 X1, X2, X3, ..., Xn: Quantidades dos produtos 1, 2, 3, ..., n;


 Y1, Y2, Y3, ..., Yn: Preço dos produtos 1, 2, 3, ..., n;
 D1, D2, D3, ..., Dn: Distancia do usuário até a loja 1, 2, 3, ..., n;
 C: Valor do combustível para precificação da distância;

Função Objetivo

Min = [(X1.Y1)+(D1.C)] + [(X2.Y2)+(D2.C)] + (...) + [(Xn.Yn)+(Dn.C)]

Restrições técnicas

 D1, D2, D3, ..., Dn < 50 km (Considerar apenas lojas num raio de 50km)
 Caso seja escolhido o mesmo Dn para vários produtos, considerar apenas um;

6 - Decisions/ Decisão:

O modelo deve procurar o mínimo global, a partir das variáveis, levando em consideração apenas lojas num
entorno de 50 km (podendo vir a ser ajustável), utilizando o valor dos combustíveis como uma forma de precificar a
distância. Além disso, deve ser capaz de considerar apenas um “custo de distância” por loja, uma vez que se supõe
que o cliente irá aquela loja apenas uma vez para adquirir múltiplos produtos.

7 - Prediciton Task - ML Task / Predições:

Baseado no input do cliente de quais produtos, quantidades e localização que se encontra, o modelo deve
retornar uma lista de lojas, quais itens e suas quantidades a se adquirir nas mesmas, baseado no mínimo global
encontrado.

8 - Making Predictions/Fazendo Previsões:

A frequencia de atualização dos dados deve ser diária ou se possível inferior, para procurar garantir que os
preços utilizados no modelo serão de fato encontrados nas lojas. O modelo deve rodar sempre que for solicitado, à
critério do cliente, conforme a demanda de compras.

9 - Offline Evaluation - Impact Simulation/ Simulação:

Para avaliar o resultado da otimização do modelo, será comparada a lista otimizada com a lista de produtos
baseada nos preços do supermercado disponível mais próximo, verificando qual é a economia de compra em múltiplas
lojas contra o valor obtido em uma única loja. Em versões futuras, pode-se solicitar qual a preferência de loja ao cliente
para comparação.

10 - Monitoring - Validation/ Monitoramento-Validação:

Para fins de monitoramento, deve-se comparar os resultados da otimização do modelo com os resultados
obtidos na prática. O fato de ter o preço de itens de outras lojas, torna possível a comparação de valor com possíveis
promoções. Porém existe também a possibilidade de alteração de preço para mais, o que mostraria uma necessidade
de ajuste na base dos preços.

Exemplos similares: https://www.proteste.org.br/suas-contas/supermercado/simulador/guia-de-supermercado

https://menorpreco.notaparana.pr.gov.br/index

Você também pode gostar