Escolar Documentos
Profissional Documentos
Cultura Documentos
Machine Learning
Machine
Learning
Deep
Learning
Machine Learning
Treinamento
Supervisionado
Treinamento não
Supervisionado
Aprendizado por
Reforço
Machine Learning
A máquina é treinada por meio de
Treinamento dados de entrada e saída esperada.
Supervisionado Regressão (Linear Simples ou Múltipla;
Logística; SVM)
Classificação (Naive Bayes; Support
Treinamento não Vector Machine – SVM
Supervisionado Árvore de Decisão – apresentação visual
da informação
(K-Nearest Neighbours KNN; Decision
Aprendizado por
Tree)
Reforço
Machine Learning
Treinamento
Supervisionado
Treinamento não
Supervisionado
Aprendizado por
Reforço
Machine Learning
A máquina recebe os dados ficando por
Treinamento sua conta aprender padrões e
Supervisionado categorias dentro do conjunto de dados.
Agrupamento (Clustering): elementos
do cluster compartilham de um
Treinamento não conjunto de propriedades comuns. (K-
Supervisionado means; Mean-Shift, DBSCAN)
Aprendizado por
Reforço
Machine Learning
Associação: extrair um conjunto de
Treinamento regras a partir do conjunto de itens mais
Supervisionado frequentes na base de dados. Procurar
padrões na ordem da escolha (a priori;
Euclat; FP-growth)
Treinamento não
Supervisionado
Aprendizado por
Reforço
Machine Learning
Redução Dimensional (Generalização):
Treinamento Monta características específicas em
Supervisionado mais alto grau (Princial Componente
Analysis (PCA), Singular Value
Decomposition, Ltent Diridhlet
Treinamento não Allocation, Latent Semantic Analysis
Supervisionado
Aprendizado por
Reforço
Machine Learning
Treinamento
Supervisionado
Treinamento não
Supervisionado
Aprendizado por
Reforço
Machine Learning
A máquina aprende sozinha por meio
de um fator de recompensa para cada
Treinamento tarefa executada. O acerto e erro
Supervisionado retroalimentam para aprender (o acerto
é reforçado; o erro mudança de
estratégia)
Treinamento não Os dados de treino depende da ação
Supervisionado tomada
Uma ação leva a um estado e gera uma
recompensa (visão curto, médio e longo
Aprendizado por prazo) -> qual a melhor ação ? Ao longo
Reforço prazo o algoritmo aprende o que fazer.
(Q-Learning; SARSA, DQN, A3C, GA)
Projeto de Machine Learning
•Entender o problema/definir objetivos
•Coletar/analisar os dados
•Preparar dados
•Construir modelo
•Validar o modelo
Abra o ORANGE para explorar o
• Importar os dados
• Aplicar o modelo
• Avaliar o resultado
Orange Data Mining
• Importar os dados
• Aplicar o modelo
• Avaliar o resultado
Orange Data Mining
• Importar os dados
• Aplicar o modelo
• Avaliar o resultado
Orange Data Mining
• Importar os dados
• Aplicar o modelo
• Avaliar o resultado
Orange Data Mining
• Importar os dados
• Aplicar o modelo
• Avaliar o resultado
Orange Data Mining
• Importar os dados
• Aplicar o modelo
• Avaliar o resultado
Prática 1 – Classificação (Treino)
• Base de dados contendo 150 observações: comprimento e largura das pétalas e sépalas e seu nome
• R. A. Fisher (1936). «The use of multiple measurements in taxonomic problems». Annals of Eugenics
. 7: 179–188. doi:10.1111/j.1469-1809.1936.tb02137.x
• Pode um conjunto de 4 observações numéricas levar a um target categórico ?
• Qual o melhor modelo para isso ?
• Quais as métricas usadas para esta avaliação ?
1º) Chamar dados
2º) Visualizar dados (não necessário)
3º) Escolher/Treinar
4º) Avaliação dos modelos usados
4º
3º
2º
Matriz de Confusão
• Exibe a distribuição das classes (dados conhecidos)
versus as classes previstas (o que o algoritmo encontrou)
Previsto
TRUE (+) FALSE (-)
Qtd de vezes que algo TRUE foi previsto Qtd de vezes que algo TRUE foi classificado
como TRUE(+) pelo modelo como FALSE(-) pelo modelo
TRUE TP FN
ERRO DO TIPO II
Dados Qtd de vezes que algo FALSE foi previsto Qtd de vezes que algo FALSE foi previsto
Conhecidos como TRUE(+) pelo modelo como FALSE(-) pelo modelo
FALSE
FP TN
ERRO DO TIPO I
Matriz de Confusão
• E para 3 ou mais classes ? Usando o case IRIS
• https://medium.com/human-in-a-machine-w
orld/mae-and-rmse-which-metric-is-better-e6
0ac3bde13d
Prática 3 – Frutas & Vegetais (Treino e Teste)
TESTE2.OWS
• Objetivo da prática: Carregamento de duas bases de dados (treino e
teste); Avaliar o melhor algoritmo; Salvar os resultados do teste
• Arquivos fruits-and-vegetables-treino.csv e fruits-and-vegetables-
teste.csv
aulas\carlos.fragoso\ML
• Fonte: GITHUB Canal do Sandeco
• https://github.com/sandeco/ORANGE_CANVAS/tree/master/%2304%
20-%20Predi%C3%A7%C3%B5es
Para ligar o arquivo teste, você
deverá escolher o melhor
algoritmo. Veja que o input do
algoritmo deverá conter os
dados do aprendizado.