Você está na página 1de 6

Resumo AGBD Rebecca

Data Warehouse
um conjunto de dados baseado em assuntos, integrado, varivel em relao ao tempo. Serve para a tomada de deciso, sendo tambm uma reunio de diversos bancos. Data Warehouse e Banco de Dados Operacional OLAP (On-line Analytical Procesing- Consultas dinmicas - Dimenses -Dados histricos - exibem tendncia de comportamento -Dados integrados e nmero reduzido de Transaes (1/dia, 1/semana) -Grande nmero de registros -Usurio: gerentes e executivos para tomada de decises. Gera um mtodo de acessar, visualizar, e analisar dados corporativos com alta flexibilidade e performance. -Analisa os dados -Atravs de um OLAP se faz a consulta ao Data Warehouse. OLTP (On-line Transaction Processing) Consultas SQL prontas - Tabelas -Dados operacionais e dispersos -Grande nmero de Transaes(frequentemente atualizado) -Nmero de registros varivel -Usurio: profissional operacional da empresa e est preocupado em executar as operaes de modo eficiente, e no como elas ocorrem -Entrada de dados (armazenar) O nvel operacional e o nvel administrativo utilizam OLTP (vendas, compra, RH, cho de fbrica, etc.) para operaes que ocorrem no dia-dia da empresa. O nvel de conhecimento e o nvel estratgico da empresa (os administradores por exemplo) utilizam o OLAP para as tomadas de decises e assim traar um planejamento estratgico. O que Data Warehousing? uma estratgia que reconhece a necessidade de armazenar dados, separadamente, em sistemas de informao e consolid-los, de forma a ajudar vrios profissionais de uma empresa na tomada de decises de modo rpido e eficaz. Por que Data Warehousing? -A informao o bem mais valioso para uma empresa; -Decises precisam ser tomadas rapidamente e corretamente, usando todo dado disponvel; -A quantidade de dados est dobrando a cada 18 meses, o que afeta o tempo de resposta e a habilidade de compreender seu contedo; -Estratgias de competio - diferencial positivo em relao a concorrncia; -Anlise do perfil do mercado;

Tipos de Data Warehouse Marketing - Avalia a performance comercial de um produto ou servio a partir de diversas perspectivas diferentes Financeiro - Monitoram a performance comercial em termos financeiros Comportamental - Contm informaes individuais a respeito de cada cliente e seus comportamentos. Data Warehouse Incremental -Abordagens de implementao de DataWarehouse (Top-Down e Up -Top-down: quando a empresa cria um DW e depois parte para a segmentao, ou seja, divide o DW em reas menores gerando assim pequenos bancos orientados por assuntos departamentalizados.; Botton-up: quando a situao inversa. A empresa por desconhecer a tecnologia, prefere primeiro, criar um banco de dados para somente uma rea.); Custos envolvidos aumentam a presso por resultados, recomenda-se iniciar um projetopiloto de escopo e propores reduzidos, mas com retorno considervel; -Criao de Data Marts Integrados (Data Marts extraem e ajustam pores de DWs aos requisitos especficos de grupos/departamentos; um sub-produto departamental) disponibilizados em prazos e custos menores. Arquitetura de um Data Warehouse Aquisio da Informao: Reune, refina, limpa e agrega os dados dos sistemas de produo. O dado deve estar correto e prover um nico significado para facilitar na tomada de deciso. Armazenamento da Informao: Esta camada prov o armazm da informao. Disponibilizao da Informao: Esta camada parte da arquitetura que suportar um conjunto de ferramentas de apresentao e anlise. (Relatrios e consultas).

O que DW para Internet e o por que disso? a combinao de tecnologias que permite que seus usurios gerem dinamicamente uma pesquisa no banco de dados, analisando e formatando os resultados na forma de arquivos texto ou imagem. Melhora a capacidade de comunicao e colaborao dentro da empresa e atinge um nmero grande de usurios sem conhecimentos tcnicos. O que Data Mining? a parte comportamental do Data Warehouse (perfil do cliente, por exemplo) para auxlio de tomada de deciso. Data Mining vs OLAP A diferena bsica entre ferramentas OLAP e data mining est na maneira como a explorao dos dados abordada. Com ferramentas OLAP a explorao feita na base da verificao, isto , o analista conhece a questo, elabora uma hiptese e utiliza a ferramenta para confirm-la. Com data mining, a questo total ou parcialmente desconhecida e a ferramenta utilizada para a busca de conhecimento. Em suma, o Data Mining usa padro de dados, o OLAP explora cada uma das situaes. Como implementar um Data Mining Entre algumas formas, pode-se usar ferramentas capazes de aprender a partir dos dados, gerando e validando enormes volumes de hipteses e destacando conhecimento interessante para o usurio, descobrindo conhecimento novo, til e interessante. Aplicaes de Data Mining -Cross-selling: Identificar associao entre produtos, procurando tirar proveito dessas associaes.

-Up-selling: Identificar entre os clientes atuais aqueles que tem potencial para adquirir produtos que proporcionem maior lucro para a companhia. Em um servio de TV por assinatura, por exemplo, uma forma de realizar up-selling seria identificar o perfil dos compradores de Pay-Per-View e utilizar este perfil para dirigir uma campanha aos clientes que tem as mesmas caractersticas, mas ainda no compram este produto; Fidelizao: Descobrir o perfil, situao e combinao de fatores que esto relacionados com a perda de clientes, para que se trabalhe estes clientes e mantenha o relacionamento. Algumas barreiras do uso de Data Mining -Altos custos e Complexidade de ferramentas; Preparao dos dados para minerao (80% do trabalho). Os dados devem estar limpos, consistentes e livres de excessivas nulidades; Dificuldade em se estimar a taxa de retorno do investimento, pois torna-se impossvel estimar a partir de algo desconhecido. ------Um projeto de Data Warehouse nunca termina!

BANCO DE DADOS DISTRIBUDOS


Processamento distribudo: necessria a Internet, mquinas conectadas entre si em uma rede de comunicao e o modo Cliente/Servidor. Caso Simples:

Onde: Execuo - Back end do SGBD (servidor) Aplicao: Front end (os clientes) Sistema de Banco de Dados Distribudo Cada servidor pode servir a muitos clientes e cada cliente pode ter acesso a muitos servidores. Transparncia Ponto de Vista Lgico: Gerenciamento de dados pelo SGBD

Definio de Trabalho:

Sistema de Banco de Dados Distribudo consiste em uma coleo de sites, interligados atravs de algum tipo de rede de comunicao. Lgica - SGBD local Pesquisa original: Distribuio geogrfica Primeiras instalaes comerciais: Distribuio Local. Vantagens: Por que so desejveis? Empresas distribudas logicamente e fisicamente. Dados distribudos relevncia operao Ilhas de informaes.

Sistema distribudo fornece pontes para conectar estas ilhas. Permite: - Estrutura do banco de dados reflita Estrutura da empresa. Rede Local (LAN Local Area Network) Proliferao: Redes Remotas (WANs Wide Area Networks) - distribuio geogrfica. Sistema distribudo fornece pontes para conectar estas ilhas. Permite: -Estrutura do Banco de Dados reflita Estrutura da Empresa. -Dados Locais instalao local -Dados remotos disponveis em real-time. -Eficincia de processamento -Facilidade de acesso

Desvantagens: -Complexidade ponto de vista tcnico para Implementador -Princpio Fundamental: Para o usurio, um sistema distribudo deve parecer exatamente como um sistema no distribudo. 12 objetivos: (a Rebecca adora incluir questes de cite...cite os 20 principios do no sei o que, cite as 7 leis do no sei o que l....ento achei melhor incluir no resumo....rs) 1. Autonomia Local (Todas as operaes site X so controladas por ele mesmo.Nenhum site X deve depender de outro site Y para sua operao bem sucedida) 2. No dependncia de um site central (Site central pode ser um gargalo ou Sistema Vulnervel) 3. Operao continua (Confiabilidade , Disponibilidade para Parada no planejada (falha) e Parada planejada.) 4. Independncia de localizao (Os usurios no sabem qual a localizao de armazenamento fsica dos dados; mas operam como se estivessem locados na mesma estrutura fsica.) 5. Independncia de fragmentao (Desempenho e Freqncia, pois um sistema de bancos de dados distribudo dever acatar a possibilidade fragmentar os dados de forma a manter em um site as informaes que seus clientes solicitam mais, distribuindo assim os dados e o processamento das informaes.) 6. Independncia de replicao (Trabalhar com Cpias e Rplicas) 7. Processamento de consultas distribudo (Consulta em localizaes diferentes e Otimizao) 8. Gerenciamento de transaes distribudo (Recuperao: garante a transao atmica (tudo ou nada). Cada transao consiste em vrios agentes, onde o processo executado em favor da transao) 9. Independncia do hardware (Desejvel executar o mesmo SGBD em diferentes plataformas de hardware, participando como parceiras em um sistema distribudo.) 10. Independncia do sistema operacional (Desejvel executar o mesmo SGBD em diferentes plataformas de sistemas operacionais:Uma verso OS/390, uma verso UNIX e uma verso Windows participar do mesmo sistema distribudo.) 11. Independncia da rede (Desejvel admitir o mesmo SGBD em diversas redes de comunicaes distintas.) 12. Independncia do SGBD (Necessrio que as instncias do SGBD em sites diferentes admitam todas a mesma interface. O Sistema distribudo ideal deve proporcionar independncia do SGBD). Problemas dos Bancos de Dados Distribudos -Redes Remotas: WAN Lentas. -Processamento de consultas -Gerenciamento de catlogos -Propagao de atualizaes -Recuperao -Concorrncia