Escolar Documentos
Profissional Documentos
Cultura Documentos
Weka
Eduardo Corrêa Gonçalves
Escola Nacional de Ciências Estatísticas (IBGE/ENCE)
Rua André Cavalcanti, 106, Centro – 20.231-050 – Rio de Janeiro – RJ
eduardo.correa@ibge.gov.br
1
Tópicos da Apresentação
Apresentação da Ferramenta
2
Parte I. Introdução à Mineração de Dados
3
O que é Mineração de Dados?
4
Algoritmos: a Essência da Mineração de Dados
5
Propriedades Básicas de um “Diamante de Informação”
• O conhecimento descoberto através de processos de mineração de dados é
considerado interessante quando apresenta certas propriedades:
Validade Inesperabilidade
Interpretabilidade Novidade
Utilidade
6
Fraldas e Cerveja (1/3)
7
Fraldas e Cerveja (2/3)
• Por que a regra foi considerada tão interessante?
8
Fraldas e Cerveja (3/3)
• A regra é interpretável.
• Pôde ser entendida e explicada pelos analistas. Sugere que nas noites
de quinta-feira, os casais jovens se preparam para o fim-de-semana
estocando fraldas para os bebês e cerveja para o papai.
9
Como Surgiu a Mineração de Dados? (1/3)
10
Como Surgiu a Mineração de Dados? (2/3)
11
Como Surgiu a Mineração de Dados? (3/3)
12
O que a Mineração de Dados Pode Fazer? (1/10)
13
O que a Mineração de Dados Pode Fazer? (2/10)
• Tarefa 1: DESCOBERTA DE ASSOCIAÇÕES
14
O que a Mineração de Dados Pode Fazer? (3/10)
• Tarefa 1: DESCOBERTA DE ASSOCIAÇÕES (Continuação...)
• Outras aplicações
para as Regras de
Associação
• Sistemas de
Recomendação: são
sistemas que, de
maneira autônoma,
sugerem itens que
considera
interessantes para
um usuário (livros,
notícias, músicas,
vídeos, etc).
15
O que a Mineração de Dados Pode Fazer? (4/10)
• Tarefa 2: DESCOBERTA DE PADRÕES SEQUENCIAIS
16
O que a Mineração de Dados Pode Fazer? (5/10)
17
O que a Mineração de Dados Pode Fazer? (6/10)
• Tarefa 3: CLASSIFICAÇÃO
18
O que a Mineração de Dados Pode Fazer? (7/10)
• Tarefa 3: CLASSIFICAÇÃO (Continuação...)
19
O que a Mineração de Dados Pode Fazer? (8/10)
1
Exemplo retirado do tutorial "A Gentle Introduction to Machine Learning and Data Mining for the Database
Community" apresentado por Eamonn Keogh no 18o Simpósio Brasileiro de Bancos de Dados – SBBD 2003
20
O que a Mineração de Dados Pode Fazer? (9/10)
21
O que a Mineração de Dados Pode Fazer? (10/10)
• Outras Tarefas
22
Como Minerar Dados? (Técnicas de Data Mining)
• O conceito de técnica de mineração de dados é diferente do conceito de
tarefa.
Tarefa Técnicas
Regras de Associação Apriori, FP-Growth, DCI, ECLAT, Closet.
23
Contexto Atual da Mineração de Dados (1/2)
• Exemplos:
24
Contexto Atual da Mineração de Dados (2/2)
25
Weka – uma Ferramenta Livre para Data Mining
26
O que é Weka?
27
O Livro da Weka
28
Como usar a Weka?
• Interface Gráfica: o
ambiente Weka
Explorer permite a
execução dos
algoritmos de data
mining da Weka de
forma interativa.
• Veremos um
exemplo nessa
apresentação!
29
Bases de Dados ARFF (1/5)
30
Bases de Dados ARFF (2/5)
31
Bases de Dados ARFF (3/5)
• Exemplo: Weather.ARFF
32
Bases de Dados ARFF (4/5)
33
Bases de Dados ARFF (5/5)
34
Weka em Ação – Mineração de um Classificador
35
O que é Classificação? (1/2)
36
Base de Dados para Classificação (1/2)
• Exemplo - BD de uma
locadora de veículos
* Base de dados exemplo retirada de : “DataMining” - Luís Alfredo Vidal de Carvalho, Ed. Ciência Moderna, 2001
37
Base de Dados para Classificação (2/2)
38
Weka em Ação (1/18)
39
Weka em Ação (2/18)
40
Weka em Ação (3/18)
41
Weka em Ação (4/18)
42
Weka em Ação (5/18)
43
Weka em Ação (6/18)
44
Weka em Ação (7/18)
45
Weka em Ação (8/18)
46
Weka em Ação (9/18)
47
Weka em Ação (10/18)
48
Weka em Ação (11/18)
• Naïve Bayes
• Redes Neurais
• k-Nearest Neighbor
49
Weka em Ação (12/18)
50
Weka em Ação (13/18)
51
Weka em Ação (14/18)
52
Weka em Ação (15/18)
53
Weka em Ação (16/18)
54
Weka em Ação (17/18)
55
Weka em Ação (18/18)
56
Conclusões e Comentários Finais
57
Conclusões e Comentários Finais
• Sobre a Weka...
http://www.cs.waikato.ac.nz/ml/weka/
58
Conclusões e Comentários Finais
• Sobre a Weka...
59
Referências
[BL97] M. J. A. Berry e G. Linoff. Data Mining Techniques for Marketing, Sales and Customer
Support. Wiley Computer Publishing, 1997.
[HK06] J. Han e M. Kamber. Data Mining: Concepts and Techniques. 2a Edição, Morgan Kaufmann,
2006.
[San05] R. Santos. “Weka na Munheca: um Guia para Uso do Weka em Scripts e Integração com
Aplicações Java”. Instituto Nacional de Pesquisas Espaciais (INPE), 2005.
[TSK06] P. Tan, M. Steinbach e V. Kumar. Introdução Ao Data Mining - Mineração de Dados. Ed.
Ciência Moderna, 2009 (ed. original em Inglês publicada em 2006).
[WFH11] I. H. Witten, E. Frank, M. A. Hall. Data Mining: Practical Machine Learning Tools and
Techniques. 3rd Edition, Morgan Kaufmann, 2011.
60