Você está na página 1de 24

WBA0748_v1.

Modelagem e arquitetura do
Data Warehouse (DW)
Mineração de Dados em Data
Warehouse
Fundamentos da Mineração de Dados

Bloco 1
Anderson da Silva Marcolino
Fundamentos da Mineração de Dados
A Mineração e Dados, ou Data Mining, faz parte
de um processo denominado Descoberta do
Conhecimento em Bancos de Dados (Knowledge
Discovery in Databases - KDD).
• O objetivo é descobrir padrões úteis em
dados para fornecer subsídios às
tomadas de decisão (inteligência de
negócio).
Fundamentos da Mineração de Dados
• A Descoberta do Conhecimento em Bancos de Dados
(KDD) é composta por cinco fases:

• Dados >> Seleção dos dados >> Dados


Selecionados.

• Pré-processamento >> Dados pré-processados.

• Transformação >> Dados transformados.

• Mineração de Dados >> Padrões.

• Interpretação >> Conhecimento.


Fundamentos da Mineração de Dados

• Logo, Mineração de Dados (DM) é a mineração ou


descoberta de informações em função de padrões
ou regras em grande quantidade de dados, sejam
em bases de dados convencionais ou não.
• É aí que entram os DWs.
Fundamentos da Mineração de Dados
• DM utiliza técnicas de inteligência artificial para encontrar
relações de similaridade ou discordância entre dados.

• O objetivo é encontrar automaticamente:

• Padrões.

• Anomalias.

• Regras.

• Com o propósito de transformar dados em


informações para a tomada de decisão ou
avaliações de resultados.
Fundamentos da Mineração de Dados

Figura 1 – Processo de Mineração de Dados

Pré-processamento de
dados Processo analítico
Saída
Coleta de
Extração para
dados Limpeza e Construção Construção
de analista.
integração do Bloco 1 do Bloco 2
features

Feedback (opcional).

Feedback (opcional).

Fonte: Aggarwal (2015, p. 4).


Mineração de Dados em Data
Warehouse
Mineração em DW

Bloco 2
Anderson da Silva Marcolino
Mineração de Dados em DW

• Na Mineração de Dados, bases de dados


transacionais, processadas com OLTP e OLAP
não estão prontas para a mineração.
• Lembrando:
• Online Transaction Processing (OLTP).
• Online Analytical Processing (OLAP).
Mineração de Dados em DW

• OLAP consolidam em vários níveis os fatos e


dimensões variadas.
• As ferramentas de Data Mining vão além, realizando
inferências, tentando descobrir possíveis fatos e
correlações não explicitadas nos dados de um DW.
• Contudo, um DW é essencial!
Mineração de Dados em DW

• Os DW, no contexto da Mineração de Dados, são


bases que possuem os dados pré-processados.
• Banco de dados modelados no esquema
Estrela ou Floco de Neve para permitir a
transformação e posterior mineração.
Mineração de Dados em DW

• Para a mineração de dados em DW ou outros tipos


de bases, são necessárias técnicas que permitam
tal mineração.
• Importante salientar que a mineração busca
informações que possam auxiliar na tomada
de decisões.
Mineração de Dados em DW

• Exemplo:
• Relação entre homens casados e compra
de fraldas ou cervejas no Walmart.
• Lojas brasileiras que identificaram
anomalias de vendas.
Mineração de Dados em DW
• Técnicas de descoberta de conhecimento, podemos
destacar:
• Associação.
• Descrição de classes.
• Classificação.
• Agrupamento (clustering).
• Descoberta de padrões sequenciais.
• Descoberta de padrões em séries temporais.
• Regressão.
• Redes neurais.
• Algoritmos genéticos.
Teoria em Prática
Bloco 3
Anderson da Silva Marcolino
Reflita sobre a seguinte situação
• Considerando as especificidades da Mineração de
Dados e a necessidade de adotar técnicas para a
realização da mineração e obtenção do
conhecimento, classifique em termos de:
• Curva de aprendizado e utilização.
• Especificidades de negócios/ uso.
• Aplicação junto com um DW.
As técnicas apresentadas.
Norte para a resolução
• Identificar as nove técnicas e caracterizá-las
individualmente, para posterior embasamento.
• Ter em mente que um DW ou outro tipo de base
pode ser utilizado para a mineração de dados.
• Ferramentas específicas para a aplicação de
determinadas técnicas.
Dicas do(a) Professor(a)
Bloco 4
Anderson da Silva Marcolino
Leitura Fundamental
Prezado aluno, as indicações a seguir podem estar disponíveis
em algum dos parceiros da nossa Biblioteca Virtual (faça o login
através do seu AVA). Algumas indicações também podem estar
disponíveis em sites acadêmicos como o Scielo, repositórios de
instituições públicas, órgãos públicos, anais de eventos
científicos ou periódicos científicos, acessíveis pela internet.
Isso não significa que o protagonismo da sua jornada de
autodesenvolvimento deva mudar de foco. Reconhecemos que
você é a autoridade máxima da sua própria vida e deve,
portanto, assumir uma postura autônoma nos estudos e na
construção da sua carreira profissional.
Por isso, te convidamos a explorar todas as possibilidades da
nossa Biblioteca Virtual e além! Sucesso!
Indicação de leitura 1
O texto exemplifica metodologias de Data Mining,
fundamentais para a mineração de dados.
Leitura do capítulo Aplicar metodologias de Data
Mining (mineração de dados) (página 223 até 232).

Referência:
VIDA, E. da S. et al. Data Warehouse. Porto Alegre: SAGAH, 2021.
Indicação de leitura 2
O capítulo indicado mostra os conceitos essenciais para
mineração de dados e descoberta de conhecimento
com base em dados.
Leitura do capítulo Processo de KDD: conceitos básicos
(página 18 até 33).

Referência:
GOLDSCHMIDT, R.; PASSOS, E. Data Mining. Gulf Professional Publishing,
2005.
Dica do(a) Professor(a)
Como dica, segue recomendação do aplicativo, disponibilizado na
Google Play, chamado Data Mining Tutorial, que apresenta
minitutoriais sobre mineração de dados e diversos conteúdos
educacionais sobre a temática.

Figura 2 – Aplicativo Data Mining Tutorial na Google Play

Fonte: print de tela de


https://play.google.com/store/apps/details?id=com.bee.dataming.Tutorial.
Acesso em: 4 ago. 2022.
Referências
AGGARWAL, C. C. et al. Data mining: the textbook. New York:
Springer, 2015.
GOLDSCHMIDT, R.; PASSOS, E. Data Mining. Gulf Professional
Publishing, 2005.
PITON, R. Data Warehouse passo a passo: o guia prático de
como construir um data warehouse do zero. Porto Alegre:
Raizzer, 2018.
KIMBALL, R.; ROS, M. O kit de ferramentas de data warehouse:
o guia completo para modelagem dimensional. John Wiley &
Filhos, 2011.
KIMBALL, R. The Data Warehouse Toolkit: guia completo para
modelagem dimensional. Rio de Janeiro: Campus, 2002.
VIDA, E. da S. et al. Data Warehouse. Porto Alegre: SAGAH,
2021.
Bons estudos!

Você também pode gostar