Você está na página 1de 49

Sistemas Apoio a Deciso

Data Warehouse

Conceito
Uma coleo de dados orientada por assuntos, integrada, variante no tempo, e no voltil, que tem por objetivo dar suporte aos processos de tomada de deciso. W. H. Inmon, pai do DW

Data Warehouse
'' um ambiente, no um produto'' Ambiente expansvel e planejado Uma construo arquitetnica de sistemas de

informao
Fornece informaes histricas de apoio deciso Uma plataforma com dados integrados -> tratamento

adequado informao
3

Data Warehouse
Integrao efetiva de base de dados

operacionais Apoio aos DSS, EIS e processos empresariais Auxlio descoberta e explorao de tendncias empresariais importantes O Data Warehouse projetado para resolver a incompatibilidade de sistemas de informaes transacionais e operacionais. Estas duas classes de sistemas so projetados para satisfazer diferentes exigncias. 4

Caractersticas de um DW

1. Orientado por assunto


Orientado ao redor do principal assunto da organizao Em contrapartida, o ambiente operacional organizado por aplicaes funcionais, orientadas por processos/funes

2. Integrao de dados
Migrao de dados de diversas bases operacionais para uma base analtica
Necessidade de integrar dados

3. Desempenho nas consultas


Separao de dados operacionais dos dados analisados: anlise dos dados operacionais causa degradao de desempenho
Fatores crticos para SO: desempenho e tempo de resposta

Vrias possibilidades de consulta: explorao detalhada ou resumida


8

4. Dados no volteis
Aps insero no DW, no podem ser feitas mudanas Muito difcil, mas no impossvel, manter dados atualizados no DW Falhas: sincronizao entre dados operacionais e DW
9

4. Dados no volteis
insero excluso alterao alterao insero excluso Operacional Data Warehouse acesso carga

10

5. Armazenamento por longos perodos


Dados histricos so fundamentais para SAD Dados ativos e inativos misturados no SO diminuem o desempenho das transaes DW: arquivam pores do SO Dados mantidos por longos perodos
mais de 5 anos comum
11

5. Armazenamento por longos perodos


Sempre existe o elemento tempo na estrutura da chave Custo de manuteno dos dados baixo Custos maiores incorrem da transferncia da base operacional para a base analtica
12

6. Modelo de dados expansvel


Modelagem bem feita garante base eficiente e expansvel Capacidade de acomodar todos os dados de negcio de diversas bases operacionais Normalmente, abordagem incremental
13

7. Transies da base operacional


DW armazena snapshots (amostras) do estado da base operacional.Isto , um Data Warehouse no reflete todas as transies da base operacional. Definio do intervalo entre snapshots em funo da preciso da informao requerida pelo negcio

14

8. Normalizao dos dados


Normalizao: Definir o formato lgico adequado para as estruturas de dados identificados no projeto lgico do sistema, com o objetivo de minimizar o espao utilizado pelos dados e garantir a integridade e confiabilidade das informaes.
Essencial para as bases de dados relacionais preservarem a consistncia da informao e tornar o relacionamento entre entidades de dados (registros) Requer navegao atravs de tabelas para composio de uma informao.

15

9. Termos de negcios uniformes


Nomes utilizados na base operacional transformados em termos de negcios uniformes para facilitar o entendimento. Base operacional: nomes codificados, difceis de entender, muito genrico para negcios especficos, softwares que restringem formato e comprimento de termos
Mesmo identificador: cliente, costumer, cust_id, cli_id Aplicaes diferentes usam diversos termos para o mesmo atributo

DW: termos de negcio padro, autoexplicativos


Apenas um termo deve ser utilizado

16

10. Transformao fsica


a) Definio fsica nica de um atributo DW: tipos e tamanhos nicos para o um mesmo dado DW: mesmo padro de nomes em todos os lugares

17

10. Transformao fsica


b) Uso consistente de valores de uma entidade Aplicaes fontes podem utilizar diferentes valores de atributos para denotar a mesma coisa Valores diversificados devem ser convertidos um nico valor Exemplo: gnero de indivduos
Masculino e Feminino M e F H e M 0 e 1 masc e fem

DW opta por somente uma representao

18

Modelo Multidimensional Exemplo


Assunto Vendas FATO: VENDA DIMENSES: CLIENTE;LOCAL;PRODUTO E TEMPO MEDIDA: QUANTIDADE; VALOR E LUCRO Para representar este modelo usado um esquema conhecido como ESTRELA (star scheme)

Cliente

Local VENDA Produto

Tempo

Vendedor

19

Modelo Multidimensional
Modelo Estrela (Representao Relacional)
Local Cod_Local End Regio

Cliente Cod_Cliente Nome

Produto Cod_Produto Nome Marca Categoria

Vendas Cod_Cliente Cod_Local Cod_Produto Cod_Tempo Cod_Vendedor Valor Quantidade Lucro

Tempo Cod_Tempo Dia Ms Ano

Vendedor Cod_Vendedor Nome CPF


20

Visualizao do Modelo
CUBO
RJ 2001

L O C A L

SP RJ MG PA RS A B C D PRODUTO

2003 2002 TEMPO 2001

21

Data WebHouse

22

O crescimento da Web
Vem fechando para a linha de frente operacional. Os atuais SAD requerem muitas vezes respostas em tempo real. A revoluo da Web impulsionou o data warehouse para o centro do palco. Ele deve ser o motor que controla ou analisa o uso da web.
23

O que o site deve prover


Larga variedade de servios para clientes externos e fornecedores. Servios para clientes internos. Consultas de relatrios a partir de resultados obtidos em Data Mining Suporte a dvidas Saudaes customizadas
24

Dificuldades
Com a evoluo do DW surgiram 3 dificuldades principais:
Oportunidade: resultados dos negcios devem ser avaliados em tempo real. Volume de dados: o volume de dados cresceu muito. Tempo de resposta: tempo de resposta na web um fator crtico de sucesso.

25

O Data Webhouse
Da combinao do Data Warehouse com a Web, surge o Data Webhouse. Quando trazemos a atividade do usurio na Web para o Data Warehouse, trazemos esta fonte de dados de grande volume e no tratada para um ambiente estruturado, a fim de analis-la e, alternativamente, adapt-la e combin-la com fontes de dados convencionais existentes
26

O Data Webhouse
O Data Webhouse pode tornar-se um dos elementos centrais da empresa moderna, focada no cliente, fornecendo informaes competitivas e essenciais a gerentes e responsveis pelas decises estratgicas. Os resultados so negcios melhor posicionados para manter a empresa sadia e competitiva.
27

Porque trazer a Web para o Warehouse ??


Significa trazer comportamentos para o warehouse. Parte das transaes dos sistemas provem dos sistemas WEB. Mas eles registram somente a etapa final, ou seja, a venda. No se tem idia do que conduziu o cliente a fazer a compra.
28

A seqncia de cliques no somente mais uma fonte de dados


uma coleo desenvolvida da fonte de dados. Arquivos de log Registro de acessos do provedor Cookies

29

Clickstream
o registro da seqncia de cliques que o usurio faz dentro do site. Tem como funo identificar sesses de sucesso e sem sucesso e determinar se esto efetivamente atraindo e retendo clientes.

30

Benefcios do clickstream
Capturar logs de seqncia de cliques e convert-los em tabelas de banco de dados. Mesclar informaes demogrficas e de conta de clientes com os dados das sequncias de cliques. Interpretar caminho trilhados pelos clientes no site da Web de sua empresa Identificar sesses que resultam em abandonar o carrinho de compras.
31

Benefcios do clickstream
Identificar seqncias de ao no site da Web que resultam em comportamentos sem fins lucrativos. Utilizar o data warehouse para guiar respostas dos clientes que aparecem no site. Ajudar o departamento de marketing a determinar se seu canal de vendas on-line lucrativo Disponibilizar servios de data warehouse como consultas, para diversos grupos que se conectam ao site.
32

Analisando o comportamento
No basta colocar cada clique em um banco de dados. Exemplos de comportamentos:
Recolhimento de informaes gerais Pesquisa Divertimento, curiosidade Download Localizao das informaes procuradas Evento assassino de sesso (usurio saiu) Caminho errado Usurio zangado Usurio feliz Usurio tranqilizado

33

Elementos de monitorao
A origem do usurio
De onde veio o visitante ? Como ele encontrou seu site? Como chegou a uma pgina especfica ? Como chegou a um formulrio de compra?
34

Identificao de usurio
Usurios da Web desejam ser annimos. possvel que ele minta No possvel ter certeza sobre qual membro da famlia est acessando o site.

35

Identificao de usurio
Deixe a identidade separada no warehouse. Isso permite que ele tenha mais segurana. No confie nas informaes de identidade que no possam ser validadas de alguma maneira. Usurios podem usar diversos computadores (casa, escritrio, hotel). Utilizando login e senha para entrar no 36 site possvel monitorar por ele vai.

Anlise comportamental
Um comportamento de usurio durante uma visita a um site da Web pode fornecer valiosas informaes sobre a eficcia do site, bem como sobre os hbitos de navegao do usurio. H muitos aspectos que podem ser medidos e registrados por um site da web e adequadamente instrumentalizado.
37

Anlise comportamental
Ponto de entrada
O usurio entrar na sua pgina atravs da URL que aponta para a pgina principal. Mas nem sempre isso acontece. Ele pode digitar uma URL que vai direto a uma pgina qualquer do site, ou fazer isso atravs de um link externo. Esta informao importante para o marketing e projeto.

38

Anlise comportamental
Permanncia
o tempo em que o usurio realmente tem uma pgina da Web visvel no navegador. Se o tempo de permanncia em uma pgina da web for curto podemos concluir que a pgina foi acessada erroneamente ou que o contedo no era interessante para o usurio. Pode-se estabelecer um tempo de permanncia esperado e medir isso.

39

Anlise comportamental
As palavras que um usurio digita em um formulrio da web podem nos dizer muito sobre ele e sobre a usabilidade do site. Se o usurio percorre vrios nveis at chegar a uma informao tem-se um sistema efetivo de indexao. Se ele abandona a consulta depois de vrias tentativas pode-se ter um problema. Para monitorar a pesquisa precisa-se capturar as palavras-chave, a contagem 40 do resultado e o prprio resultado.

Anlise comportamental
Ponto de sada
Quando um usurio sair do seu site ele geralmente no deixar nenhum rastro, porque no haver nenhum meio de exigir que ele faa o logoff.

41

Submarino

42

43

44

45

46

47

48

49

Você também pode gostar