Escolar Documentos
Profissional Documentos
Cultura Documentos
edermatias@up.com.br
Roteiro
Caractersticas Bases de dados para Data Mining Como funciona o processo de Data Mining Aplicabilidade Avaliao de Competncia(s)
Data Mining
Minerao de Dados
Descoberta de padres
Surgiu como uma proposta e necessidade em que recursos de anlise de dados tradicionais so inviveis para acompanhar evoluo da competitividade do uso da informao Aplica conceito de processo iterativo de criao, teste e refinamento de hipteses Foco na descoberta do conhecimento
Data Mining
Sistemas Transacionais so desenvolvidos para atender s demandas de um grupo de usurios, gestores e corporaes
Aplica o conceito de regras fixas e prdeterminadas Fazem aquilo a que foram programadas para fazer Fornecem base para tomada de deciso, mas sempre a deciso tomada por um usurio ou gestor
Data Mining
Sistemas de Data Mining so capazes de tomar decises baseado em regras, clculos, inteligncia artificial, heurstica e reconhecimento de padres
No necessitam diretamente de um usurio para tomada de deciso muito preciso nas afirmativas, mas ainda depende de entrada de dados primria para autoregenerar e melhorar as decises tomadas
Data Mining
Motivao para uso de Data Mining
Morrendo de sede de informao num oceano de dados
CEO do Wall Mart
Data Mining
INTERPRETAO/ AVALIAO DATA MINING CONHECIMENTO
?
PADRES
PR-PROCESSAMENTO
SELEO
FAYYAD 1996
Data Mining
Os problemas de anlise de dados para tomada de deciso so muito grandes:
BD da Wal-Mart: 20 milhes de transaes por dia Data Warehouse da Mobil: 100 TB BD da NASA: recebe de satlites 50 GB por hora
Dados de 2007
Data Mining
Utilizado como:
Ferramentas de automatizao das tarefas repetitivas e sistemtica de anlise de dados Ferramenta de auxlio para as tarefas cognitivas da anlise Integrao das ferramentas em sistemas apoiando o processo completo de descoberta de conhecimento para tomada de deciso
Data Mining
NO a soluo definitiva para os problemas computacionais
Sempre h interveno humana num deterninado momento
10
Artificial
Produzido pela arte ou pela indstria; no natural. Dissimulado, disfarado, fingido.
Aurlio Buarque de Holanda Ferreira
11
12
KDD
Objetivo de se utilizar tcnicas de KDD
Ser correto (quanto possvel) Ser compreensvel por usurios humanos Ser interessante, til e principalmente surpreendente
13
KDD
KDD utiliza sempre regras binrias do tipo SE x ENTO y Quais os clientes que tm alta probabilidade de comprar videogames? Exemplo de conhecimento extrado do Banco de Dados
SE (idade < 18) E (profissao = estudante) ENTO (compra = videogame) 90%
14
KDD
Sexo M M F F F M M F F M Pas Frana Inglaterra Franca Inglaterra Frana Alemanha Alemanha Alemanha Frana Frana Idade 25 21 23 34 30 21 20 18 34 55 Comprar sim sim sim sim no no no no no no
15
KDD
SE (pas = Alemanha) ENTO (comprar=no) SE (pas = Inglaterra) ENTO (comprar = sim) SE (pas = Frana E idade <= 25) ENTO (comprar = sim) SE (pas = Frana E idade > 25) ENTO (comprar = no)
16
Data Mining
rvores de deciso:
Representaes simples do conhecimento Utilizao de regras condicionais A partir de um conjunto de valores decide SIM ou NO Mais rpida e mais compreensvel que redes neurais Exemplo: Sair ou no de acordo com o tempo
17
Data Mining
18
19
20
21
22
Anomalias detectadas:
Roupas de inverno e guarda chuvas encalhadas no nordeste Batedeiras 110v a venda em SC onde a tenso 220v
23
Resultado em trs anos o banco lucrou 30 milhes de dlares com a carteira de emprstimos.
24
Data Mining
Empresas de software para Data mining:
SAS Information Havesting Red Brick Oracle Sybase Informix IBM
25
Data Mining
Concluses
Data mininig um processo que permite compreender o comportamento dos dados Data mining X Data warehouse Tem um suporte muito forte em I. A. Pode ser bem aplicado em diversas reas S ser eficiente se o valor das informaes extradas exceder o custo do processamento dos dados brutos. Ainda no h um consenso entre os autores e pesquisadores.
26
Data Mining
Aplicativo ALICE
http://alice.pandorabots.com/
27
Validao de Competncia(s)
1. Com base nos conceitos aplicados a Data Mining, escolher uma das tcnicas de implementao e redigir um texto explicativo do funcionamento da tcnica escolhida.
rvores Binrias Algoritmos genticos Reder Neurais Lgica Fuzzy
28
Validao de Competncia(s)
REGRAS!
Atividade individual Entregar material por e-mail at aula AMT dia 25/06/2012 necessrio encontrar pelo menos um exemplo prtico da tcnica de Data Mining escolhida.
29