Escolar Documentos
Profissional Documentos
Cultura Documentos
Machine Learning
RECONHECIMENTO DE
DÍGITOS MANUSCRITOS
OpenAI GPT-3
200
150
#Parameters (B)
100
50
0
BERT RoBERTa GPT-2 T5 Turing NLG GPT-3
Model
ML:
Uso de modelos estatísticos que
aprendem e melhoram por meio da Machine Learning
exposição a dados
Deep Learning:
Subconjunto de técnicas de ML, onde
redes neurais profundas aprendem Deep Learning
através de dados
APRENDIZADO DE MÁQUINA
Entrada
(inputs)
Programa
PROGRAMAÇÃO TRADICIONAL
Entrada
Programa Resultado
(inputs)
PROGRAMAÇÃO TRADICIONAL
Entrada
Programa Resultado
(inputs)
Desempenho
Atualização
PROGRAMAÇÃO TRADICIONAL
Entrada
Programa Resultado
(inputs)
processo manual
Desempenho
Atualização
MACHINE LEARNING
Dados
Entrada
MACHINE LEARNING
Dados
Modelo
Entrada Resultado
Parâmetros ou Regras Implícitas
MACHINE LEARNING
Dados
Rótulo (label)
Modelo
Entrada Resultado Desempenho
Parâmetros ou Regras Implícitas
MACHINE LEARNING
Dados
Rótulo (label)
Modelo
Entrada Resultado Desempenho
Parâmetros ou Regras Implícitas
Atualização
novo
exemplo
Modelo treino
Estruturados (tabulares)
#4 40 1 20
DADOS REAIS SÃO COMPLEXOS
Estruturados (tabulares)
#4 40 1 20
DADOS REAIS SÃO COMPLEXOS
Estruturados (tabulares)
#4 40 1 20
● Diferentes tipos de dados
Desestruturados
○ imagem, áudio, texto
DATA E ML
OS TIPOS DE
APRENDIZADOS
Machine Learning
Classificação Regressão
(retorna classes) (retorna um número real)
APRENDIZADO SUPERVISIONADO
X Y
Entrada f(X) Saída
(features) (target)
APRENDIZADO SUPERVISIONADO
X Y
f(X) Saída
Entrada (target)
#1 45 200 mil
X f(X) Valor real (y)
#2 35 153 mil
#3 65 400 mil
#1 25 ???
#2 75 ???
REGRESSÃO
Área m² (X) Preço R$ (y)
#1 45 200 mil
X f(X) Valor real (y)
#2 35 153 mil
#3 65 400 mil
Preço
X
X
Área m² (X) Preço R$ (y)
X X
X
#1 25 ??? X
X
#2 75 ???
área
REGRESSÃO
Conjunto de treinamento
Área m² (X) Preço R$ (y)
#1 45 200 mil
X f(X) Valor real (y)
#2 35 153 mil
#3 65 400 mil
Preço
X
X
Área m² (X) Preço R$ (y)
X X
X
#1 25 ??? X
X
#2 75 ???
área
REGRESSÃO
Conjunto de treinamento
Área m² (X1) Área m² (X2) Preço R$ (y)
#1 45 1 200 mil
X f(X) Valor real (y)
#2 35 1 153 mil
#3 65 2 400 mil
#1 25 1 ???
#2 75 3 ???
CLASSIFICAÇÃO
Conjunto de treinamento
Gato ou
Imagem (X)
Cachorro (Y)
#1 Cachorro
X f(X) Classe (y)
#2 Gato
#3 Cachorro
#1 ???
#2 ???
CLASSIFICAÇÃO
Conjunto de treinamento
Gato ou
Imagem (X)
Cachorro (Y)
#1 Cachorro
X f(X) Classe (y)
#2 Gato
#3 Cachorro
X1
X
Gato ou X O
Imagem (X) X
Cachorro (Y) X
X X
#1 ??? X
#2 ??? X2
APRENDIZADO NÃO-SUPERVISIONADO
● Clusterização (agrupamento)
● Detecção de anomalias
● Redução de dimensionalidade
FEATURE 2
FEATURE 2
FEATURE 1 FEATURE 1
Fonte: Hands-on machine learning with scikit-learn, keras, and tensorflow, 2019
ML NO DIA A DIA
Produtos de dados
Engenheiro de ML
Cientista de Dados
Analista de Dados
Análises e tomada
de decisão
★ ★★ ★★★
Maturidade em dados
Entendimento do problema
Treinamento do modelo
Avaliar desempenho
Realizar predições
Apresentar soluções
Fonte: Hands-on machine learning with scikit-learn, keras, and tensorflow, 2019
CONCLUSÃO
PANORAMA GERAL ...
● Aprendizado de máquina permite que computadores aprendam a partir dos dados
○ Geração de insights