Você está na página 1de 4

9/25/00

Data Warehouse O que é Data Warehouse?

Um Data Warehouse é um conjunto de dados baseado em


Data Mining assuntos, integrado, não volátil, e variável em relação ao
tempo, de apoio às decisões gerenciais.
William Immon - 1992
Geraldo Robson. Mateus
Departamento de Ciência da Computação
Universidade Federal de Minas Gerais
Belo Horizonte - MG

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

Data Warehouse e
O que é Data Warehousing?
Banco de Dados Operacional
OLAP (On-line Analytical Procesing) ■ OLTP (On-line Transaction
- Consultas dinâmicas - Dimensões Processing) - Consultas SQL
Dados históricos - exibem tendência prontas - Tabelas Data Warehousing não é um produto, e sim uma estratégia
de comportamento ■ Dados operacionais que reconhece a necessidade de armazenar dados,
Dados integrados ■Dados dispersos separadamente, em sistemas de informação e consolidá-los,
Número Reduzido de Transações ■ Grande número de Transações
de forma a assistir diversos profissionais de uma empresa na
(1/dia, 1/semana) (frequentemente atualizado)
tomada de decisões de modo rápido e eficaz.
Grande número de registros ■ Número de registros variável

Usuário: gerentes e executivos para ■ Usuário: profissional operacional

tomada de decisões. Mas não há um da empresa e está preocupado em


padrão. executar as operações de modo
Analisa os dados eficiente, e não como elas ocorrem
■ Entrada de dados (armazenar)

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

Por que Data Warehousing? Tipos de Data Warehouse


A informação é o bem mais valioso para uma empresa;
Decisões precisam ser tomadas rapidamente e corretamente,
usando todo dado disponível; Marketing - Avalia a performance comercial de um produto ou
Usuários são “experts” em negócios, e não profissionais em serviço a partir de diversas perspectivas diferentes
tecnologia; Financeiro - Monitoram a performance comercial em termos
A quantidade de dados está dobrando a cada 18 meses, o que afeta financeiros
o tempo de resposta e a habilidade de compreender seu conteúdo; Comportamental - Contêm informações individuais a respeito de
Estratégias de competição - diferencial positivo em relação a cada cliente e seus comportamentos.
concorrência;
Análise do perfil do mercado;

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

1
9/25/00

Data Warehouse Incremental Arquitetura de um Data


Abordagens de implementação de DW (Top-Down e Up);
Projeto de impacto:
Warehouse
Projetos envolvem compromisso, recursos financeiros e pessoal, Aquisição da Informação: Esta camada é responsável por reunir,
sujeitos a variações. (Tempo, orçamento, etc) refinar, limpar e agregar o dados dos sistemas de produção. O dado
Custos envolvidos aumentam a pressão por resultados, recomenda-se deve estar correto e prover um único significado para facilitar na
iniciar um projeto-piloto de escopo e proporções reduzidos, mas com
tomada de decisão.
retorno considerável;
Armazenamento da Informação: Esta camada provê o armazém da
Criação de Data Marts Integrados (Data Marts extraem e ajustam porções de DWs informação.
Disponibilização da Informação: Esta camada é parte da arquitetura
aos requisitos específicos de grupos/departamentos)
disponibilizados em prazos e
custos menores, mais gerenciável. que suportará um conjunto de ferramentas de apresentação e análise.
(Relatórios e consultas)

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

Arquitetura de um Data Warehouse (DW) DW


Dados Operacionais ERP Fontes de Dados Externos

Data Mart - São


subconjuntos DM DM DM
departamentais focados
em assuntos selecionados.
Reunir
Refinar
O DW é formado por fontes de
Camada de Aquisição da Informação Agregar dados internas (dados resultantes
Armazenar Consultas Análise
das transações diárias das
Relatórios Multidimensional Data Mining
atividades de negócio ) e externas
OLAP
(indicadores econômicos de uma
região, dados demográficos, dados
DW sobre o desempenho dos OLAP - On Line Analytical Processing
Suportam análise sofisticada, atendem a um número de dimensões
concorrentes e o perfil dos clientes
potenciais) elevado e possibilitam a análise do negócio a partir de grandes conjuntos de dados
Montagem
Camada de Armazenamento da Informação Todas as vendas
realizadas, em cada
Geografia

Acesso e Análise Data Marts extraem e região geográfica para


DM DM
ajustam porções de DWs cada tipo de produto
LAN aos requisitos específicos
Camada de Entrega da Informação Tempo
Gerente de Produto Gerente de Crédito de grupos/departamentos Produto

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

Por que DW para Intranet?


O que é DW para Intranet?

Melhora a capacidade de comunicação e


Combinação de tecnologias que permite que
colaboração dentro da empresa;
seus usuários gerem dinamicamente uma pesquisa
no banco de dados, analisando e formatando os
resultados na forma de arquivos texto ou imagem. Atinge um número grande de usuários sem
conhecimentos técnicos.

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

2
9/25/00

Diferenças entre DM e OLAP


O que é Data Mining?
Data Mining OLAP
Mineração dos dados : usa complexas pesquisas em Método alternativo (trabalha Trabalha com alguns dados
contra todos os dados de um e tem que perfurar (drill-
grandes volumes de dados para explorar e identificar down) em busca de
grupo) e automático (estuda
relacionamentos entre variáveis que antes eram o dados e apresenta o detalhes. Explorados
previamente independentes. Isso permite que as “achado”) para descobrir manualmente.
organizações gerenciem relacionamentos de causa e padrões nos dados. Exploração através da
efeito mais eficientemente, e antecipem políticas para Questão desconhecida e a verificação - o analista
ferramenta é utilizada para elabora uma hipótese para
isso. confirmá-la ou refutá-la.
busca de conhecimentos.

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

Como implementar um Data


Aplicações de Data Mining
Mining
Algoritmos baseados em redes neurais, estatísticas ou Cross-selling: Identificar associação entre produtos,
algoritmos de aprendizado, capazes de explorar procurando tirar proveito dessas associações.
gigantescas bases de dados em busca de informações que Up-selling: Identificar entre os clientes atuais aqueles
ajudam as empresas a decifrar o comportamento do que tem potencial para adquirir produtos que
consumidor, a compra de suprimentos, administrar as proporcionem maior lucro para a companhia. Em um
áreas comerciais e financeira de forma transparente. serviço de TV por assinatura, por exemplo, uma forma
Ferramentas capazes de aprender a partir dos dados, de realizar up-selling seria identificar o perfil dos
gerando e validando enormes volumes de hipóteses e compradores de Pay-Per-View e utilizar este perfil para
destacando conhecimento interessante para o usuário, dirigir uma campanha aos clientes que tem as mesmas
descobrindo conhecimento novo, útil e interessante. características, mas ainda não compram este produto;

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

Aplicações de Data Mining Algumas barreiras do uso de


DM
Fidelização: Descobrir o perfil, situação e •Altos custos;
combinação de fatores que estão relacionados com •Complexidade de ferramentas;
a perda de clientes, para que se trabalhe estes •Preparação dos dados para mineração (80% do
clientes e mantenha o relacionamento, dentro da trabalho). Os dados devem estar limpos, consistentes e
filosofia de que manter um cliente conquistado é livres de excessivas nulidades;
mais barato que conquistar novos clientes. •Dificuldade em se estimar a taxa de retorno do
investimento. Uma vez que o objetivo do DM é descobrir
tendências em dados invisíveis de outra maneira, torna-se
impossível estimar a partir de algo desconhecido.
Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações

3
9/25/00

Bibliografia
Um projeto de Data Warehouse nunca
termina! As fontes de dados mudam, as Data Warehouse - Conceitos e Soluções
necessidades dos usuários também mudam, Adelize Generini de Oliveira
o número deles aumenta, as regras de Data Mining - A hands-on approach for bussiness professionals
Robert Groth
mercado se alteram, os usuários demandarão Data Warehouse Intranet
mais informações. Enfim, data warehousing Internet
não é um destino; é uma viagem. http://www.datawarehouse.inf.br/

Curso de Sistemas de Telecomunicações Curso de Sistemas de Telecomunicações