Você está na página 1de 22

WBA0121_v2_0

Gestão Estratégica da
Informação
Tema 04 – Mineração de dados
Bloco 1

Prof. Me. Flavio Clesio


Introdução

• Apresentar conceitos básicos sobre


mineração de dados.
• Mostrar alguns frameworks de aplicação
em projetos de mineração de dados.
• Entender os diferentes contextos de
aplicações de mineração de dados e as
suas potencialidades.
Cenário atual

Com o advento dos meios informacionais e


com a redução dos preços de armazenagem
e processamento computacional, a tarefa de
realizar o armazenamento de dados, que
antes poderia ser algo custoso para as
organizações, hoje está altamente acessível.
Dentro desde cenário, inúmeros negócios
conseguem gerar inúmeros dados em alta
escala utilizando os mecanismos de banco
de dados.
Contexto atual

Dado esse contexto, a mineração de dados


vem para auxiliar as empresas a
alavancarem os seus resultados através do
uso desses dados. A mineração de dados
em sua essência é a transformação de
dados em informações através de regras e
padrões previamente desconhecidos em
conhecimento acionável.
Definição

A definição clássica de mineração de dados


por FRAWLEY, PIATETSKY-SHAPIRO,
MATHEUS (1992) em que eles afirmam que
mineração de dados é a extração não trivial
de informação implícita, previamente
desconhecida e potencialmente útil,
proveniente dos dados.
Definição

Já em TURBAN, (2009) mineração de dados


ou data mining é definida como uma classe
de análise de informações, baseada em
bancos de dados, a qual procura padrões
ocultos em uma coleção de dados que
podem ser usados para prever
comportamentos futuros; e pode, por
exemplo, ajudar as empresas de varejo a
encontrar clientes com interesses em comum.
Objetivo

O objetivo geral da mineração de dados é


encontrar padrões frequentes, associações,
correlações, ou estruturas casuais através de
conjuntos de itens ou objetos em bases de
dados transacionais, bases de dados relacionais
e outros repositórios de informações.
Evolução da mineração de dados
Evolução da Mineração de Dados
Passo Evolucionário Questão de Negócios Tecnologia que permitiu o avanço
Coleção de Dados Qual foi o meu lucro nos
Computadores, discos e fitas.
(1960s) últimos 5 anos?

Como estavam as vendas no Barateamento dos sistemas de


Acesso aos Dados
Nordeste em março do ano armazenamento e bancos de dados
(1980s)
passado? relacionais.

Como estavam as vendas no


Data Warehousing e Barateamento dos sistemas de
Nordeste em março do ano
Suporte à Decisão armazenamento, bancos de dados
passado? Faça um Drill
(1990s) multidimencionais e Data Warehouses.
Down até Fortaleza.

Qual a projeção de vendas Barateamento dos sistemas de


que devemos ter para armazenamento, bancos de dados
Data Mining (2000s)
Fortaleza em março do ano multidimencionais, Data Warehouses,
que vem? Por quê? e Algoritmos Computacionais.
Questões de negócios
Coleta de Acesso a Mecanismo de
Evolução Mineração de Dados
Dados Dados Suporte à Decisão

Onde
Onde foram as vendas
Qual foi a receita ocorreram as Onde serão as vendas
Questão de no nordeste no último
do meu negócio vendas do no nordeste no próximo
negócios ano? Vamos olhar em
no último ano? nordeste no mês?
profundidade no Piauí.
último ano?

Tecnologia que Fitas de Bancos de Armazéns de Dados e Algoritmos avançados,


garantiu a computadores e dados bancos de dados multiprocessadores e big
evolução discos. relacionais. multidimensionais. data.

Entrega de
dados
Entrega de Entrega de dados Entrega de informação
dinâmicos do
Características dados diâmicos do passado de forma proativa e
passado à
sumarizados. em múltiplos níveis. prospectiva .
nível de
registros.
Gestão Estratégica da
Informação
Tema 04 – Mineração de dados
Bloco 2

Prof. Me. Flavio Clesio


Inferências em mineração de dados

As inferências em mineração de dados


podem ser na busca de relacionamentos
entre os dados, isto é, correlações implícitas
e explícitas; avaliação de tendências, ou
seja, identificar se há padrões cíclicos,
sazonais, ou mesmo passeio aleatório dos
dados; e identificação de padrões que
podem ser regras, classificações, etc.
Tarefas de mineração de dados

As principais tarefas da mineração de dados


são classificação (análise preditiva), análise
de clusters (análise descritiva), regras de
associação (análise descritiva), regressão
(análise preditiva), classificação bayesiana
(análise preditiva).
Classificação

Nas tarefas de classificação, os algoritmos


têm como principal tarefa realizar a
discretização entre uma ou mais classes,
dizendo se aquele registro em particular
pertence a uma classe ou não.

(continua)
Classificação

Por exemplo, os sistemas de escoragem de


crédito (credit scoring), no momento em que
recebem uma submissão de proposta de
empréstimo, têm que classificar de acordo
com os dados do cliente se pode conceder o
empréstimo ou não. Os principais
algoritmos de classificação são: Random
Forests, Redes Neurais, Árvores de Decisão,
e Regressão Logística.
Análise de Clusters

As tarefas de análise de clusters são mais


voltadas para uma análise descritiva de
padrões de grupos, naturalmente formados
pelos algoritmos em que os eles são
formados de acordo com a coesão entre os
membros desse grupo (cluster) e a
dissimilaridade entre outros.

(continua)
Análise de Clusters

Por exemplo, se tivermos elementos como


[Banana, Maçã, Pera, Caneta, Mesa, Caderno]
poderíamos intuitivamente agrupar em dois
clusters em que teremos [Banana, Maçã,
Pera], em um cluster representado por frutas,
e [Caneta, Lápis, Caderno] no outro cluster,
representando materiais de escritório.
Os algoritmos mais comuns para essa tarefa
são K-Means, Self-Organizing Maps, DBScan,
OPTICS e Dendogramas.
Regras de associação

A técnica de extração de regras de associação


é geralmente um dos exemplos mais usados
de como a mineração de dados pode
influenciar positivamente os negócios. No
caso, essas regras se dão através da análise
de inúmeras transações que ocorrem em uma
base de dados, em que são extraídas regras
relativas a essas transações na ordem de
relacionar diversos itens dentro de uma regra
do tipo SE... ENTÃO.
(continua)
Regras de associação

Alguns exemplos são: SE cliente comprou


pão, ENTÃO ele comprou manteiga; SE o
cliente comprou tomate, ENTÃO ele também
comprou cebola; Cervejas Premium ⇒
Porções de Queijos [0.5% , 60%] Leia-se:
Se vende Cerveja Premium, então vende
Porções de Queijos em 60% dos casos, em
0.5% de todas as transações.

(continua)
Regras de associação

Essas regras são geralmente analisadas de


acordo com a frequência em que ocorrem
dentro de um conjunto de transações.
O algoritmo mais utilizado para essa tarefa
é o "A Priori".
KDD

O KDD (Knowledge Discovery in Databases)


também conhecido como processo de
descoberta de conhecimento, foi idealizado
por FRAWLEY, PIATETSKY-SHAPIRO,
MATHEUS (1992), no qual os autores
estabeleceram alguns passos para a captação
de informação útil e aplicação de algoritmos
para contextos de negócios em que essas
informações seriam transpostas para um
conhecimento aplicável.
Casos de sucesso de aplicação

• A.C. Milan (Clube de Futebol): Contusões.


• Wall Mart I (Rede de Hipermercados):
Remédios e Gripe.
• Wall Mart II (Rede de Hipermercados):
Fraldas e Cervejas.
• Oakland Athetics (Clube de Baseball):
Moneyball.

Você também pode gostar