Escolar Documentos
Profissional Documentos
Cultura Documentos
Supervisionada
• Regressão
• Logit / Softmax
• SVM
• Árvore de Decisão
• Random Forest
Agora vamos ver algumas técnicas não
supervisionadas…
Música: erudita, popular, religiosa, etc. Filmes: animação, comédia, drama, etc. Grupos de mensagem
Categorizações Comuns
Qual seria a
forma natural
de agrupar?
Com base em quais atributos definimos similaridades?
Clusterização está
entre as técnicas
mais usadas em
ciência de dados!
https://www.kdnuggets.com/poll
s/2011/algorithms-analytics-
data-mining.html
Problema:
Mas, por quê estas Presumindo que k seja conhecido, o número de
técnicas são tão usadas? possíveis formas de agrupar N objetos em k
clusters quantas seriam as formas de agrupá-los?
Solução
$
1 𝑘
𝑁𝑀 𝑁, 𝐾 = ∗ * ∗ 𝑘−𝑖
𝑘! 𝑖
!"#
K-Means
Utilização em computação Gráfica
Triangularização de Delaunay
Atribuir cada objeto Atualiza posição do
Escolher K para o cluster do centroide como
centroides centroide mais média dos
próximo elementos do grupo
Nã
o
Objetivo: “Finding groups of objects such that the objects in a group are
similar (or related) to one another and different from (or unrelated to) the
objects in other groups.” (Tan et al., 2006)
Força
https://www.naftaliharris.com
/blog/visualizing-k-means-
clustering/
Regra do Cotovelo