Você está na página 1de 13

1 2 3 4

Indice
Introduo ................................................................................................................................ 2 Surgimento............................................................................................................................... 3 Caractersticas .......................................................................................................................... 3 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. Orientao por assunto ou temas ...................................................................................... 3 Integrao ......................................................................................................................... 4 Varincia no tempo .......................................................................................................... 4 No volatidade.................................................................................................................. 4 Localizao....................................................................................................................... 5 Credibilidade dos Dados .................................................................................................. 6 Granularidade ................................................................................................................... 7 Planejamento do Projeto................................................................................................... 7 Definio dos Requisitos de Negcio .............................................................................. 7 Projeto de Arquitetura Tcnica. .................................................................................... 8 Modelo Dimensional. ................................................................................................... 8 Especificao de Implementao para Usurios Finais. ............................................... 8 Seleo de Produtos e Instalao. ................................................................................. 9 Projeto Fsico. ............................................................................................................... 9 Concepo e Desenvolvimento de Apresentao de Dados. ........................................ 9 Desenvolvimento de Aplicativos para Usurios Finais. ............................................... 9 Execuo. .................................................................................................................... 10 Manuteno e Crescimento ........................................................................................ 10

Ciclo de Vida do Data Warehouse. ......................................................................................... 7 1.8. 1.9. 1.10. 1.11. 1.12. 1.13. 1.14. 1.15. 1.16. 1.17. 1.18.

6 7

Concluso .............................................................................................................................. 12 Bibilografia ............................................................................................................................ 13

Create By Update Machine

Introduo

Um DataWarehouse, ou armazm de dados um banco de dados com dados histricos usados para anlise e decises das mais exticas perguntas realizadas por executivos. Os dados contidos nos Data Warehouse so sumarizados, peridicos e descritivos. Com a manipulao desses dados os executivos podem tomar decises baseadas em fatos e no em intuies e especulaes. Os DataWarehouses so projetados para processamento on-line analtico (OLAP, On-line AnalyticalProcessing) ao invs do processamento transacional on-line (OLTP, On-line TransactionalProcessing). Ferramentas OLAP para pesquisa inteligente de dados so chamadas de data mining. Delimitando a abrangncia dos dados a uma rea de negcio da empresa o data warehouse passa a se denominar data mart. possvel implementar um data warehouse com vrios data marts distribudos. O contedo de requerimentos de data warehouse foi encontrado na lngua inglesa desde j pedimos as nossas desculpas por qualquer erro de sintaxe ou de traduo uma vez que no usamos nenhum tradutor.

Create By Update Machine

Surgimento

Os data warehouse surgiram como conceito acadmico na dcada de 80. Com o amadurecimento dos sistemas de informao empresariais, as necessidades de anlise dos dados cresceram paralelamente. Os sistemas OLTP no conseguiam cumprir a tarefa de anlise com a simples gerao de relatrios. Nesse contexto, a implementao do data warehouse passou a se tornar realidade nas grandes corporaes. O mercado de ferramentas de data warehouse, que faz parte do mercado de Business Intelligence, cresceu ento, e ferramentas melhores e mais sofisticadas foram desenvolvidas para apoiar a estrutura do data warehouse e sua utilizao.

Atualmente, por sua capacidade de sumarizar e analisar grandes volumes de dados,o data warehouse o ncleo dos sistemas de informaes gerenciais e apoio deciso das principais solues de business intelligence do mercado.O armazenamento se d num depsito nico, que seja de rpido acesso para as anlises. Tal armazenamento conter dados histricos advindos de bancos de dados transacionais que servem como backend de sistemas como ERPs e CRMs. Quanto mais dados do histrico das operaes da empresa, melhor ser para que a anlise destas informaes reflita o momento da empresa.

Caractersticas
1.1. Orientao por assunto ou temas

A orientao por assunto uma caracterstica marcante de um Data Warehouse, pois toda modelagem ser voltada em torno dos principais assuntos da empresa. Enquanto todos os sistemas transacionais esto voltados para processos e aplicaes especficas, os Data Warehouses objetivam assuntos.

Create By Update Machine

1.2.

Integrao

Facilmente o mais importante aspecto do ambiente de Data Warehouse que dados criados dentro de um ambiente de Data Warehouse so integrados sempre com nenhuma exceo. A melhor essncia do ambiente de warehouse que dados contidos dentro dos limites do warehouse esto integrados. A integrao mostra-se de diferentes maneiras: na conveno consistente de nomes, na forma consistente das variveis, na estrutura consistente de cdigos, nos atributos fsicos consistente dos dados, e assim por diante.

1.3.

Varincia no tempo

Segundo W.H.Inmon, os Data Warehouses so variveis em relao ao tempo, isso nada mais do que manter o histrico dos dados durante um perodo de tempo muito superior ao dos sistemas transacionais, vejamos abaixo mais algumas caractersticas. Num Data Warehouse normal mantermos um horizonte de tempo bem superior ao dos sistemas transacionais, enquanto no OLTP mantemos um histrico curto dos dados, no Data Warehouse guardamos esses dados num perodo maior. Isso bastante lgico porque num sistema transacional a finalidade de fornecer as informaes no momento exato, j no Data Warehouse, o principal objetivo analisar o comportamento das mesmas durante um perodo de tempo maior. Fundamentados nessa variao, os gerentes tomam as decises em cima de fatos e no de intuies.

1.4.

No volatidade

No Data Warehouse existem somente duas operaes, a carga inicial e as consultas dos frontends aos dados. Isso pode ser afirmado porque a maneira como os dados so carregados e tratados completamente diferente dos sistemas transacionais. Enquanto nesses sistemas temos vrios controles e updates de registros, no Data Warehouse temos somente inserts e selects de dados. Por exemplo, num sistema de contabilidade podemos fazer alteraes nos registros. J no

Create By Update Machine

Data Warehouse, o que acontece somente ler os dados na origem e grav-los no destino, ou seja, no banco modelado multidimensional.

As caractersticas do Data Warehouse levam a um ambiente que muito diferente dos ambientes operacionais clssicos. Como a fonte de quase todos os dados do Data Warehouse o ambiente operacional, sempre uma tentao pensar que existe uma redundncia macia do dados entre este ambiente o e Data Warehouse. Deve-se considerar os seguintes fatos:

Os dados so filtrados a medida que passam de um ambiente para o outro O horizonte de tempo de dados muito diferente do ambiente operacional para o Data Warehouse O Data Warehouse possui dados resumidos os quais no so encontrados no ambiente operacional Os dados sofrem uma transformao fundamental na medida em que passam para o Data Warehouse.

1.5.

Localizao

Os dados podem estar fisicamente armazenados de trs formas: Num nico local centralizando o banco de dados em um Data Warehouse integrado, procurando maximizar o poder de processamento e agilizando a busca dos dados. Esse tipo de armazenagem bastante utilizada, porm h o inconveniente do investimento em hardware para comportar a base de dados muito volumosa, e o poder de processamento elevado para atender satisfatoriamente as consultas simultneas de muitos usurios. Os distribudos so Data Marts, armazenados por reas de interesse. Por exemplo, os dados da gerncia financeira num servidor, dados de marketing noutro e dados da contabilidade num terceiro lugar. Essa pode ser uma sada interessante para quem precisa de bastante performance,

Create By Update Machine

pois isso no sobrecarrega um nico servidor, e as consultas sero sempre atendidas em tempo satisfatrio. Armazenados por nveis de detalhes, em que as unidades de dados so mantidas no Data Warehouse. Pode-se armazenar dados altamente resumidos num servidor, dados resumidos noutro nvel de detalhe intermedirio no segundo servidor e os dados mais detalhados (atmicos), num terceiro servidor. Os servidores da primeira camada podem ser otimizados para suportar um grande nmero de acessos e um baixo volume de dados, enquanto alguns servidores nas outras camadas podem ser adequados para processar grandes volumes de dados, mas baixo nmero de acesso. Para mudar de nvel necessrio que ocorra um dos seguintes eventos: os dados so sintetizados, arquivados ou eliminados. O processo de sintetizao interage no nvel mais alto de detalhamento (dados detalhados atuais) para os nveis seguintes (levemente e altamente resumidos). Quando termina determinado perodo de tempo (semana, ms, trimestre, ano), os dados so indexados por estes perodos e armazenados nos seus respectivos nveis de detalhamento. Para facilitar o acesso aos dados, estes devem estar sintetizados e indexados de vrias maneiras. Portanto, ao mesmo tempo que ocorre o agrupamento por datas, tambm pode ocorrer a sintetizao por grupos e subgrupos. Cada nvel possui um horizonte de tempo definido para a permanncia dos dados. Ento o fato de os dados serem transportados para nveis mais elevados no implica na excluso do nvel anterior. Um processo denominado processo de envelhecimento ocorre quando este limite ultrapassado e, portanto os dados podem ser transferidos para meios de armazenamentos alternativos ou passar de dados detalhados atuais para dados detalhados antigos.

1.6.

Credibilidade dos Dados

A credibilidade dos dados muito importante para o sucesso de qualquer projeto. Discrepncias simples de todo tipo podem causar srios problemas quando se quer extrair dados para suportar decises estratgicas para o negcio das empresas. Dados no dignos de confiana podem

Create By Update Machine

resultar em relatrios inteis, que no tm importncia alguma, assim como uma lista de pacientes do sexo masculino e grvidos, por exemplo.

1.7.

Granularidade

Granularidade nada mais do que o nvel de detalhe ou de resumo dos dados existentes num Data Warehouse. Quanto maior for o nvel de detalhes, menor ser o nvel de granularidade. O nvel de granularidade afeta diretamente o volume de dados armazenados no DataWarehouse, e ao mesmo tempo o tipo de consulta que pode ser respondida.

Ciclo de Vida do Data Warehouse.


1.8. Planejamento do Projeto.

Planejamento visa identificar a definio e alcance do projeto de data warehouse, incluindo a justificao de negcios e estudos de viabilidade. Planejamento do projeto se concentra em recursos, perfis, tarefas, duraes e sequenciamento. O plano de projeto resultante identifica todas as tarefas associadas a LDB e identifica o estgio partidos involucradas.Esta centra-se na definio do projecto (fase de identificao do projeto para saber onde h a necessidade do armazm de dados).

1.9.

Definio dos Requisitos de Negcio

Um fator determinante para o sucesso de um processo de armazenamento de dados a interpretao correta dos diferentes nveis de exigncias expressas pelos diferentes nveis de usurios. A tcnica utilizada para aliviar as necessidades dos analistas de negcios difere das abordagens tradicionais de dados impulsionada [Inm92] [Gol99]. Designers de armazns de dados deve compreender os principais fatores que impulsionam o negcio para efetivamente determinar os requisitos e traduzi-los em consideraes de design apropriadas.
Create By Update Machine

1.10. Projeto de Arquitetura Tcnica. Ambientes de data warehousing requerer a integrao de vrias tecnologias. Voc deve saber trs coisas: requisitos de negcio, atuais ambientes tcnicos e orientaes tcnicas para a estratgica futuro planejado esta forma de estabelecer o desenho da arquitetura tcnica dos dados de ambiente de data warehousing. 1.11. Modelo Dimensional. A definio de requisitos de negcios determinar os dados necessrios para cumprir os requisitos analticos dos usurios. Modelos de design de dados para apoiar estas requerem uma abordagem diferente ao usado em sistemas operacionais. Basicamente voc comea com uma matriz determina a dimensionalidade de cada indicador e, em seguida, especificar os diferentes nveis de detalhe (atributos) dentro de cada conceito de negcio (dimenso), bem como a granularidade de cada indicador (varivel ou mtrica) e hierarquias diferentes que formam o modelo de negcio dimensional (BDM) ou mapa tridimensional.

1.12. Especificao de Implementao para Usurios Finais. Nem todos os usurios do warehouse precisa do mesmo nvel de anlise. por isso que nesta fase identifica os diferentes papis ou perfis de usurio para determinar os diferentes tipos de aplicaes necessrias com base no escopo dos diferentes perfis (gesto, analista de negcios, fornecedores, etc.) Kimball se concentra no processo Criar aplicativo "modelos". Ele comea por definir o conceito de aplicao do usurio final e de seu papel no acesso a informaes de negcios. Ele fornece um quadro metodolgico bastante normal no que tem de desenvolvimento de aplicaes (como pedaos de software) se refere.

Create By Update Machine

1.13. Seleo de Produtos e Instalao. Usando o projeto de arquitetura tcnica como um quadro, temos de avaliar e selecionar os componentes especficos da arquitetura, como a plataforma de hardware, o motor de banco de dados, a ferramenta de ETL ou desenvolvimento relevante, ferramentas de acesso, etc Uma vez avaliados e selecionados certos componentes proceder com a instalao e test-los em um armazenamento de dados integrado.

1.14. Projeto Fsico. O projeto fsico do banco de dados centra-se na seleo das estruturas necessrias para apoiar o projeto lgico. Alguns dos principais elementos deste processo so a definio de convenes de nomenclatura padro e base de dados ambiente configuraes especficas. Estratgias de indexao e particionamento tambm so determinadas nesta fase.

1.15. Concepo e Desenvolvimento de Apresentao de Dados. Esta fase tipicamente o mais subestimado das tarefas em um projeto de data warehouse. Os principais sub-passos nesta rea so ciclo de vida: extrao, transformao e carregamento (ETL processo). So definidos como aqueles extrao de processos necessrios para a obteno de dados que carregam o fardo dos fsicos modelo acordado.As mesmos processos so definidos como processos de converso de detransformacin ou recodificar a fonte de dados, a fim de realizar Modelo carga efetiva Fsica .

1.16. Desenvolvimento de Aplicativos para Usurios Finais. De acordo com a especificao de aplicativos do usurio final, o desenvolvimento de

Create By Update Machine

aplicaes que envolvam os usurios finais e metadados configuraes do relatrio especficos.Una construo uma vez que tenha concludo todas as etapas de especificao e ter a oportunidade de trabalhar com alguns dados de teste, iniciar o desenvolvimento de aplicaes. Escolhendo uma implementao de abordagem de desenvolvimento de aplicativos e Testes e verificao de dados 1.17. Execuo. A implementao representa a convergncia de tecnologia, dados e aplicativos de negcios do usurio final acessvel deusuarios do desktop. Existem vrios fatores adicionais para assegurar uma operao confivel de todas essas peas, que incluem treinamento, suporte tcnico, comunicao, estratgias de feedback. Todas estas tarefas devem ser levados em conta antes de qualquer usurio pode acessar o data warehouse.

1.18. Manuteno e Crescimento Como sempre enfatiza, Armazenamento de dados um processo (etapas definidas, com incio e fim, mas a natureza espiral) como acompanhando a evoluo da organizao ao longo de sua histria. Eles precisam continuar as pesquisas de forma consistente para acompanhar a evoluo dos objetivos a serem alcanados. De acordo com Kimball diz. Ao contrrio dos sistemas tradicionais, as mudanas no desenvolvimento devem ser vistos como sinais de sucesso e fracasso. importante definir prioridades para lidar com as novas exigncias dos usurios e, assim, evoluir e crescer.

Create By Update Machine

Create By Update Machine

Concluso

Aqui estoalguns dos benefcios do uso do Data Warehouse: Mantm o histrico de dados, mesmo se os sistemas transacionais no os fizerem; Integra os dados de vrios sistemas, permitindo uma viso consolidada de toda a operao, principalmente quando uma organizao possui vrias empresas com sistemas de informaes diferentes e trabalha agressivamente em aquisies e fuses; Melhora a qualidade dos dados, criando uma padronizao de cdigos e descries e identificando e corrigindo dados ruins; Apresenta as informaes da organizao de forma consistente; Fornece um nico modelo de dados para toda a organizao, independente da fonte; Reestrutura os dados de modo a satisfazer as necessidades dos usurios do negcio; Reestrutura os dados para melhorar o desempenho de consulta, mesmo para consultas analticas complexas, sem afetar os sistemas em operao; Agrega valor s aplicaes de negcio operacional, principalmente a gesto de relacionamento com clientes (CRM).

Create By Update Machine

Bibilografia

http://social.technet.microsoft.com/wiki/contents/articles/6934.oltp-x-olap-pt-br.aspx, Acesso 20/05/2013 http://www.scribd.com/doc/8504866/Metodologia-para-Implantacao-de-Data-Warehouse Acesso, 20/05/2013 http://marielitaortega.files.wordpress.com/2012/02/ciclo-de-vida1 Acesso, 20/05/2013

Create By Update Machine