Escolar Documentos
Profissional Documentos
Cultura Documentos
Contexto e motivao
David Correa Martins Jr
david.martins@ufabc.edu.br
(baseado em material cedido pelos profs. Ronaldo Prati e Carlos Santos)
Minerao de Dados
Minerao de Dados
Telescpios
Etimologia
Decises
Alto
Valor
Conhecimento
Informao
Dados
Interessantes
Alto
Volume
Dados Brutos
Baixo
Valor
Curso em 1 slide
Dados
Informao
Apresentao
Conhecimento
Precursores
Precursores
Bases de
maiores
Transaes bancrias
Utilizao de cartes de crdito
Dados governamentais
Medies ambientais
Dados clnicos
Projetos genoma
Informaes disponveis na web
Crescimento do GenBank
1982-2005
Seqncias (milhes)
Fonte: Genbank
Pares de bases
seqncias
Alguns nmeros:
Transaes eletrnicas
Controle e monitoramento
Introduo
Introduo
Sim
1. Agrupar documentos
similares retornados pelo
Google de acordo com seu
contexto.
2. Descobrir se certos nomes
aparecem com mais
frequncia em
determinadas regies da
cidade (periferia, centro,
bairros abastados,)
Tarefas de minerao
Tarefa
Regras de Associao
Anlise de Sequncias
Classificao
Agrupamento
Anomalias (Outliers)
Descoberta de informao
Extrao (ou reconhecimento) de padres
Extrao de conhecimento
Descoberta de conhecimento em bancos de
dados (Knowledge Discovery Databases KDD)
Recursos de minerao
Visualizao
Estatstica descritiva
Anlise exploratria de dados
Estatstica Inferencial (modelos no
paramtricos)
Sistemas dinmicos
Aprendizado de mquina
Otimizao
Bancos de dados
Minerao de Dados
Bases de Dados
Aprendizado
de Mquina
Estatstica
Biologia
Minerao
De Dados
Reconhecimento
de Padres
Algoritmos
Visualizao
Processamento
Paralelo
MD x SGBD
Atividades Descritivas:
Regras de Associao
Regras que associam um atributo de uma relao
a outro
Exemplo - base de dados de um supermercado
Agrupamento
Dado um conjunto de objetos, colocar os objetos em grupos
baseados na similaridade entre eles
Utilizado para encontrar padres inesperados nos dados
Atividades Preditivas:
Classificao e Regresso
Sistemas de MD aprendem a partir de exemplos
como particionar ou classificar os dados
Exemplo - base de dados de clientes de um banco
Pergunta:
Robs
inimigos
Robs
inimigos
Robs
amigos
Robs
inimigos
Robs
amigos
Robs
inimigos
Robs
amigos
Robs
inimigos
Robs que tem a antena azul so amigos
Temas recorrentes em MD
Escolha de representao/abstrao
Interdependncia entre
representao/mtodos
Escolhas devem ser orientadas a objetivos
No se deixar enganar por suas hipteses
Algoritmos iterativos/aproximaes
sucessivas
Identificao do Problema
Pr-processamento
Seleo e Reduo
Extrao e Integrao
Limpeza
Transformao
4.
Teste do modelo
5.
Interpretao e avaliao
MD e AM
AM
Novas habilidades
Novo conhecimento
Novas formas de organizar o conhecimento existente
Definio
Aplicaes
Aplicaes
Aplicaes
Seimans Medical
Ferramenta de MD para o tratamento de
ataques cardacos
Inclusive texto
Aplicaes
Seimans Medical
Aplicaes
Aplicaes
Aplicaes
Probabilidade de abusos
Potencial de perdas de receita
Resultados
Produtos de MD
Model 1
Mais produtos
PRW
Mitos
Agradecimentos