Escolar Documentos
Profissional Documentos
Cultura Documentos
Mineração de Dados em
Biologia Molecular Principais tópicos
Métodos baseados em Aprendizado baseado em instâncias
distância Conceitos básicos
KNN
Raciocínio Baseado em Casos
André C. P. L. F. de Carvalho Conclusão
Monitor: Valéria Carvalho
Exemplos:
Algoritmo k-vizinhos mais próximos
Raciocínio Baseado em Casos
1
27/09/2012
m
Valor de r leva a diferentes distâncias
dist = ∑(p
k =1
k − qk ) 2 1 (L1): Distância bloco cidade (Manhattan)
Hamming (valores binários)
2 (L2): Distância Euclidiana
∞ (L∞): Distância suprema
Distância quadrada
dist = MAX (| pk − qk |)
Distância Manhattan
Exercício Exercício
Calcular a distância entre os exemplos Encontrar a distância entre os exemplos
abaixo usando as distâncias abaixo utilizando a distância Manhattan
Manhattan 110000, 111001, 000111, 001011, 100111,
101001
Eucilidiana
Quadrada Ex1 = (3, 1, 10, 2)
Ex2 = (2, 5, 3, 2)
2
27/09/2012
3
27/09/2012
4
27/09/2012
Classe Classe
saudável saudável
3-NN 3-NN
Classe Classe
5-NN
doente doente
? ?
Exame 1 Exame 1
27/09/2012 AndréAndré
PoncededeCarvalho
Leon F de
- ICMC/USP
Carvalho 25 27/09/2012 André de Carvalho - ICMC/USP 26
5
27/09/2012
Exercício Exercício
Seja o seguinte cadastro de pacientes: Usar K-NN e os exemplos anteriores
para definir as classes dos exemplos de
Nome Febre Enjôo Manchas Dores Diagnóstico teste
Usar k = 1, 3 e 5
João sim sim pequenas sim doente
Pedro não não grandes não saudável Exemplos de teste
Maria sim sim pequenas não saudável (Luis, não, não, pequenas, sim)
José sim não grandes sim doente
Ana sim não pequenas sim saudável (Laura, sim, sim, grandes, sim)
Leila não não grandes sim doente
6
27/09/2012
Caso aprendido
27/09/2012 AndréAndré
PoncededeCarvalho
Leon F de
- ICMC/USP
Carvalho 41 27/09/2012 André de Carvalho - ICMC/USP 42
7
27/09/2012
Perguntas