Escolar Documentos
Profissional Documentos
Cultura Documentos
bases de dados):
Nomes alternativos:
Descoberta (minerao) de conhecimento em banco de dados
aprendizado de mquina
Aplicaes em Potencial
Anlise de dados e suporte a decises
Anlise de mercado
Anlise de risco
Deteco de fraude
Outras Aplicaes
Minerao de texto (news group, email, documentos XML e HTML)
Web mining
novos clientes
Informaes sumrias
Relatrios multidimensionais e estatsticos
1 - SELEO
2 - PR-PROCESSAMENTO
(Limpeza + Enriquecimento)
3 - TRANSFORMAO
4 - MINERAO
5 - INTERPRETAO
3
Regras e
Padres
2
Dados
Pr-processados
1
Dados
Dados
Selecionados
Dados
Transformados
Conhecimento
Algoritmos de Minerao
O algoritmo de minerao o mecanismo que cria um
Weka
O pacote de software Weka (Waikato Environment for
Weka
Essa subrea pretende desenvolver algoritmos e
dos dados fornecidos recorrendo a tcnicas de dataminning tentando, indutivamente, a partir dos padres
encontrados gerar hipteses para solues e no
extremos inclusive teorias sobre os dados em questo.
Tarefas de Minerao
De acordo com os objetivos pretendidos, podem ser
Tcnicas de Minerao
As principais tcnicas so:
Classificao
Agrupamento
Regras de Associao
Classificao
A classificao um conceito bastante conhecido do
homem.
Por
Weka Exemplo
Aps executar o software Weka
Clique em Explorer.
Weka - Ambiente
Weka Exemplo
Selecione Open File...
Abrir o arquivo tempo.arff
University of Waikato
21
Temperatura
humidade
Ventando
Nublado
76
90
FALSE
Ensolarado
80
86
TRUE
Chuvoso
70
100
FALSE
Testando o modelo
Crie um arquivo chamado tempo_real.arff (wordpad)
@relation weather_real_data
@data
nublado,76,90,FALSE,yes
ensolarado,80,86,TRUE,yes
chuvoso,70,100,FALSE,yes
Erros no modelo
s
vezes
nosso
modelo
contem
algumas
inconsistncias. Vamos criar uma inconsistncia no
modelo e verificar se o classificador capaz de detectala.
Inserindo a inconsistncia
Na base de dados tempo.arff insira a linha abaixo:
nublado,70,80,TRUE,no
Execute novamente o treinamento
do algoritmo.
Mais um exemplo
Vamos agora utilizar um outro algoritmo muito
Naive Bayses
Naive Bayses
Analise a sada do algoritmo ?
Alguma classe classificada de forma incorreta ?
Visualize a classificao de erros
1
Agrupamento
A tarefa de agrupamento bastante parecida com a de
classificao.
Agrupamento
Observe o agrupamento definido
na base de dados. Temos 2 grupos:
Jogar/SIM = 9
Jogar/NO = 5
Agrupamento
Para o nosso propsito importante que os dados no
2
3
Agrupamento
Agrupamento
Agrupamento Output
Agrupamento
O algoritmo foi eficiente par a essa base de dados?
Lembre-se dos dados originais.
Observe o agrupamento definido
na base de dados. Temos 2 grupos:
Jogar/SIM = 9
Jogar/NO = 5
Associao
Essa tarefa visa identificar grupos de fatos que ocorrem em
Algoritmo Apriori
Apriori um algoritmo clssico para aprendizado de
Weka Apriori
Trabalha apenas com atributos nominais e binrios
OK
Weka Apriori
Trabalha apenas com atributos nominais e binrios
Problema !!!!
Weka Apriori
possvel converter atributos ?
SIM e o software Weka prov esses recursos.
2
3
Melhorando as regras
Exerccios
Suponha que voc deseje treinar um sistema para que