Escolar Documentos
Profissional Documentos
Cultura Documentos
Roteiro
Motivao
Exemplo preliminar
Conceitos bsicos
Processo de kdd
Mtodos de minerao de dados Tcnicas Exemplos Referncias
Motivao
Aproveitamento da informao permite ganho de competitividade: conhecimento poder (e poder = $$!) Motivao
Motivao
Os recursos de anlise de dados tradicionais so inviveis para acompanhar esta evoluo Morrendo de sede por conhecimento em um oceano de dados
Motivao
Motivao
Soluo:
ferramentas de automatizao das tarefas repetitivas e sistemtica de anlise de dados ferramentas de auxlio para as tarefas cognitivas da anlise integrao das ferramentas em sistemas apoiando o processo completo de descoberta de conhecimento para tomada de deciso
Motivao
Exemplo Preliminar
Conceitos
Minerao de dados o passo do processo de KDD que produz um conjunto de padres sob um custo computacional aceitvel; KDD utiliza algoritmos de data mining para extrair padres classificados como conhecimento. Incorpora tambm tarefas como escolha do algoritmo adequado, processamento e amostragem de dados e interpretao de resultados; Conceitos
Etapas do Processo
Processo
Processo
Seleo de Dados
Processo 11
Processo mnimo
Operaes como identificao de rudos, outliers, como tratar falta de dados em alguns campos, etc.
Processo
Pr-Processamento
Estgio de limpeza dos dados, onde informaes julgadas desnecessrias so removidas. Reconfigurao dos dados para assegurar formatos consistentes (identificao)
Ex. : sexo = F ou M sexo = M ou H
Processo 13
Processo mnimo
Reduo de dimensionalidade, combinao de atributos;
Processo
Transformao
Transformam-se os dados em formatos utilizveis. Esta depende da tcnica data mining usada.
Disponibilizar os dados de maneira usvel e navegvel.
Processo 15
Processo mnimo
Escolha e execuo do algoritmo de aprendizagem de acordo com a tarefa a ser cumprida
Processo
Data Mining
Processo 17
Processo mnimo
Interpretao dos resultados, com possvel retorno aos passos anteriores;
Processo
Interpretao e Avaliao
Identificado os padres pelo sistema, estes so interpretados em conhecimentos, os quais daro suporte a tomada de decises humanas
Processo 19
Mtodos de minerao de dados normalmente so extenses ou combinaes de uns poucos mtodos fundamentais;
Porm, no vivel a criao de um nico mtodo universal: cada algoritmo possui sua prpria tendncia indutiva;
Mtodos
Tarefas bsicas
Previso
Clculo de variveis de interesse a partir dos valores de um conjunto de variveis de explicao; comumente visada em aprendizado de mquina/estatstica; Exemplos: classificao e regresso;
Mtodos
Tarefas bsicas
Descrio
Reportar relaes entre as variveis do modelo de forma simtrica; princpio, est mais relacionada ao processo de KDD; Exemplos: agrupamento, sumarizao (incluindo sumrio de textos), dependncias, anlise de desvio;
Mtodos
Um hiperplano paralelo de separao: pode ser interpretado diretamente como uma regra:
se a renda menor que t, ento o crdito no deve ser liberado
x
x x
x
o o o
Exemplo:
rvores de deciso; induo de regras
dbito
t
x: exemplo recusado o: exemplo aceito
renda
Mtodos
sem crdito
x o
o o
x
x x
x
o o o
o o o
dbito
t
x: exemplo recusado o: exemplo aceito
renda
Mtodos
x
x x
x
o o o
dbito
t
x: exemplo recusado o: exemplo aceito
renda
Mtodos
x
x x
x
o o o
dbito
t
x: exemplo recusado o: exemplo aceito
renda
Mtodos
Agrupamento Exemplo:
vector quantization;
+
+ +
+
+ + +
dbito
t
+: exemplo
renda
Mtodos
Regras de associao
98% dos consumidores que adquiriram pneus e acessrios de automveis tambm se interessaram por servios automotivos; descoberta simtrica de relaes, ao contrrio de mtodos de classificao
Tcnicas
CBR
Exemplos
Exemplos
Exemplos
Exemplos
Exemplos
Exemplos
Introduo
Exemplos
Roupas de inverno e guarda chuvas encalhadas no nordeste Batedeiras 110v a venda em SC onde a corrente eltrica 220v
Exemplos
Exemplos
Exemplos
Exemplos
Informix
IBM
http://www.informix.com
http://www.ibm.com Exemplos
Concluses
Data mining um processo que permite compreender o comportamento dos dados. Data mining analisa os dados usando tcnicas de aprendizagem para encontrar padres e regulariedades nestes conjuntos de dados. um problema pluridisciplinar, envolve Inteligncia Artificial, Estatstica, Computao Grfica, Banco de Dados. Pode ser bem aplicado em diversas reas de negcios Concluses
Referncias
Fayyad et al. (1996). Advances in knowledge discovery and data mining, AAAI Press/MIT Press. Holsheimer, M. & Siebes, A.P.J.M. Data Mining: The Search for Knowledge in Databases, 1994. http://www-pcc.qub.ac.uk/tec/courses/datamining http://www.rio.com.br/~extended http://www.datamining.com http://www.santafe.edu/~kurt http://www.datamation.com http://www-dse.doc.ic.ac.uk/~kd http://www.cs.bham.ac.uk/~anp http://www.dbms.com http://www.infolink.com.br/~mpolito/mining/mining.html http://www.lci.ufrj.br/~labbd/semins/grupo1 Referncias