Escolar Documentos
Profissional Documentos
Cultura Documentos
DADOS APLICADA
Pedro Henrique Bragioni Las Casas
pedro.lascasas@dcc.ufmg.br
Processo
Weka – uma Ferramenta Livre para Data
Mining
O que é Weka?
• Weka é um Software livre do tipo open source para
mineração de dados, desenvolvido em Java.
• Escolha de K?
• Existe um K' melhor do que o K?
Agrupamento
• Existem diversos outros algoritmos para agrupamento
• X-means
• EM
• Lógica Fuzzy
• Agrupamento hierárquico
Classificação
• Predição de uma categoria ou classe discreta.
• Como entrada: instâncias para as quais as classes são
conhecidas.
• Com isso criamos um classificador ou modelo (fase de
treinamento).
• Como entrada em uma segunda fase, temos vários dados
para os quais as classes não são conhecidas.
• Usamos o classificador para indicar classes para estes dados.
• Podemos avaliar o modelo classificando instâncias com classes
conhecidas.
Classificação
Classificação
• Métodos de classificação supervisionada:
• Baseados em separabilidade (entropia): árvores de decisão e
variantes.
• Baseados em particionamento: SVM (support vector machines).
Classificação
• Árvores de Decisão
• Uma árvore representa uma função discreta para aproximar/
representar os dados de treinamento
• Árvores de Decisão classificam instâncias ordenando-as da raíz
para algum nó folha
• Cada nó da árvore representa um atributo
Classificação
• Árvores de Decisão
• Considere a tomada de decisão para o problema “Jogar Tênis”
• Classifica se um determinado dia é adequado ou não para jogar
tênis
• Por exemplo:
• Tendo a instância:
• <Panorama=Ensolarado, Temperatura=Quente, Umidade=Alta>
• Saída:
• Não!
Classificação