Escolar Documentos
Profissional Documentos
Cultura Documentos
Chico Camargo
Primeiro, um glossário
Existem algoritmos de aprendizado de máquina que usam
matemática + estatística para encontrar padrões em dados.
https://www.theverge.com/2019/3/5/18251326/ai-startups-europe-fake-40-percent-mmc-report
https://mmc.vc/research/the-state-of-ai-2019-divergence-a-quick-read-deck
Aprendizado de máquina
● Esta cor is #eeff41
● Aprendizado tem 11 letras
● “máquina” em inglês é “machine”.
?
● Isso vale como aprendizado?
O que está faltando?
Aprendizado de máquina
“O aprendizado denota mudanças no sistema que são
adaptativas no sentido de que permitem que o sistema execute
a mesma tarefa (ou tarefas dentro de uma população de tarefas
semelhantes) de forma mais eficiente na próxima vez.”
● Planejamento e ação
○ Jogando jogos, dirigindo um carro
● Previsão:
○ Vendas, receita, clientes, tempo…
Aprendizado de máquina
● Regressão
● Classificação
● Agrupamento (clustering)
● Seleção de modelos
● Estatística Bayesiana
● Redução de dimensionalidade
Aprendizado de máquina
Dois tipos principais de algoritmos de machine learning:
Aprendizado Supervisionado
? ? ?
quartos banh. preço ano_cons. area preço_p_area altitude cidade
área
previsão
preço
Se assumirmos que o preço é
proporcional à área da casa…
…podemos prever o preço
preço
área
Mas proporcional como?
preço
área
Mas proporcional como?
preço
área
Mas proporcional como?
preço
área
Mas proporcional como?
preço
área
Mas proporcional como?
preço
área
Existe uma única resposta?
preço
área
Modelos diferentes =
suposições diferentes x = área
y = preço
preço
área
Modelos diferentes =
suposições diferentes x = área
y = preço
preço
área
Modelos diferentes =
suposições diferentes x = área
y = preço
preço
área
Para mexer nessa função: desmos.com/calculator
Modelos diferentes =
suposições diferentes x = área
y = preço
preço
área
Mas como proceder?
preço
área
Mas como proceder?
preço
área
Mas como proceder?
preço
área
Mas como proceder?
preço
área
Mas como proceder?
Valores
aleatórios?
Mas como proceder?
valores_a = [0.1, 0.2, 0.3, 0.4, 0.5]
valores_b = [ 5, 10, 15, 20, 30]
for a in valores_a:
for b in valores_b:
# faz o gráfico
# vê se fica bom?
Mas como proceder?
valores_a = [0.1, 0.2, 0.3, 0.4, 0.5]
valores_b = [ 5, 10, 15, 20, 30]
for a in valores_a:
for b in valores_b:
# faz o gráfico
# vê se fica bom?
Busca em grade
Dá pra fazer algo melhor que isso?
Qualidade do
ajuste
espaço de iterações (passos)
parâmetros
Aumentando o ajuste…
Como proceder? Passo a passo.
Erro
espaço de iterações (passos)
parâmetros
…ou diminuindo o erro.
Calculando o erro:
Erro grande
price
sqft
Calculando o erro:
Erro grande
price
sqft
Calculando o erro:
Erro menor
price
sqft
Calculando o erro:
Erro menor
price
sqft
Calculando o erro:
Erro pequeno
price
sqft
Classificação
y
● Usando apenas x e y
● Tem como prever quais
pontos são vermelhos
e quais são azuis?
OU:
● Como classificar os pares
(x , y) em azul ou vermelho?
x
Regressão Classificação
Classificação é usada em todo lugar
Classificação é usada em todo lugar
?
?
Classificação de imagens
Classificação de imagens
Classificação é aprendizado supervisionado.
Ilustração: @Ciaraioch
Classificação é aprendizado supervisionado.
não
Luminosidade
Regressão Logística
Input:
sim x = dados contínuos
y = dados binários
não
x
Regressão Logística
y
Input:
1 x = dados contínuos
y = dados binários
0 x
Regressão Logística
y Input:
x = dados contínuos
1
y = dados binários
O modelo:
0 x
Regressão Logística
y Input:
x = dados contínuos
1
y = dados binários
O modelo:
0 x
Regressão Logística
y Input:
x = dados contínuos
1
y = dados binários
O modelo:
0 x
Regressão Logística
y Input:
x = dados contínuos
1
y = dados binários
O modelo:
0 x
Regressão Logística
y O modelo:
A interpretação:
O modelo te dá
0 x
a probabilidade de y = 1,
para um dado valor de x
Regressão Logística
y O modelo:
A interpretação:
O modelo te dá
0 x
a probabilidade de y = 1,
para um dado valor de xi
A Matriz de Confusão
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
2. Classificação
https://colab.research.google.com/drive/1UFx4st
I1R0bcaGh3SzXGjKfbmULcvlIQ?usp=sharing