Você está na página 1de 10

Data Warehousing

Andrey C. M. da Silva, Edilson L. Leão, Klebson C. Silva, Nalberth L. Castro,


Wendel M. S. Magalhães

Faculdade de Sistemas de Informação – Universidade Federal do Pará (UFPA)


Cametá – PA – Brasil
{andreycarlos1590, leaoedilson44, klebsoncarmo1, nalberthcastro1510,
wm.magalhaes88}@gmail.com

Abstract. This article objectively addresses the main concepts of Data


Warehousing, taking into account its applicability in the area of data
management, as well as showing its architecture, modeling, processes,
practices to be applied using this technology, as well as the future vision on
the use of Data Warehousing.
Resumo. O presente artigo aborda de maneira objetiva, os principais
conceitos de Data Warehousing, levando em consideração sua aplicabilidade
na área de gerenciamento de dados, além de mostrar sua arquitetura,
modelagem, processos, práticas a serem aplicadas usando essa tecnologia,
bem como a visão futura sobre o uso do Data Warehousing.

1. Introdução
O gerenciamento de dados tornou-se uma das atividades mais importantes nas
organizações, tais como, manter informações históricas de forma agrupada e possível de
serem consultadas. Essas informações poderiam ser usadas por áreas estratégicas da
organização para auxiliar em tomadas de decisão. Para Soares (1998), a diversidade de
sistemas nas organizações acarretou um aumento do volume de informações
processadas e uma maior distribuição das mesmas, causando uma complexidade em seu
gerenciamento. A necessidade de mudanças foram atendidas com a tecnologia de Data
Warehousing(Favareto 2007). Esta tecnologia está centrada na figura do Data
Warehouse (DW), uma base de dados capaz de manipular um grande volume de
informações com bom desempenho.

2. Fundamentos do Data Warehousing


O Data Warehousing é uma ferramenta indispensável para as empresas que buscam
uma tomada de decisão mais assertiva e baseada em dados confiáveis. Como afirma Bill
Inmon, criador do conceito de Data Warehouse, “um Data Warehouse não é apenas um
depósito de dados, é um ambiente que fornece informações confiáveis e relevantes para
a tomada de decisão”. (Inmon, 2012)
O processo de construção de um Data Warehouse é complexo e envolve
diversas etapas, como a modelagem dimensional e a extração, transformação e carga de
dados. Como destaca Ralph Kimball, “a modelagem dimensional é a técnica chave para
projetar e construir um Data Warehouse bem-sucedido". (Kimball, 2013)
O sucesso dessa tecnologia é determinado pela qualidade dos dados e pela
habilidade em transformá-los em informações úteis. Como explica W. H. Inmon, “a
qualidade dos dados deve ser verificada continuamente, pois dados sujos ou
inconsistentes podem levar a decisões erradas”. (Inmon, 2012)
É uma ferramenta crucial para a análise de informações em larga escala,
permitindo que as empresas identifiquem tendências, oportunidades de negócios e
gargalos em suas operações. Como destaca Bill Inmon, “o Data Warehouse se concentra
no suporte à tomada de decisões estratégicas da empresa”. (Inmon, 2012)
O Data Warehousing tem evoluído nos últimos anos para se adaptar às
mudanças no ambiente de negócios, como o aumento da quantidade e variedade de
dados e a necessidade de análise em tempo real. Como afirma Ralph Kimball, “o Data
Warehouse moderno deve ser ágil e flexível, permitindo rápida adaptação às mudanças
no ambiente de negócios”. (Kimball, 2013)
Considerando as citações dos autores acima, podemos listar algumas das
principais vantagens e benefícios do uso de Data Warehouses para análise de dados, são
elas:
● Análise de dados mais complexas e detalhadas:
Permitem a realização de análises mais avançadas e detalhadas, combinando diferentes
fontes de dados para gerar informações mais profundas sobre o negócio. Isso é possível
porque o armazenamento de dados em um data warehouse torna os dados mais
acessíveis e úteis para os usuários finais.
● Tomada de decisão mais eficiente:
Ajudam a tornar a tomada de decisão mais eficiente, permitindo que as decisões sejam
mais baseadas em fatos sólidos e em tempo real. Com parâmetros de análise claros e
dados precisos disponíveis, as decisões podem ser tomadas com rapidez e confiança.
● Identificação de tendências e padrões:
Facilitam a identificação de tendências e padrões nos dados. Com as informações
armazenadas em um data warehouse, os usuários finais podem analisá-las de forma
mais completa e fácil, permitindo a identificação de tendências e padrões relevantes
para o negócio.
● Centralização de informações:
Centraliza as informações em um único local, o que significa que todos os
departamentos e membros da organização têm acesso aos mesmos dados. Isso
possibilita a colaboração entre áreas e uma melhor integração de processos de negócio.

3. Arquitetura do Data Warehousing


Para Ralph Kimball (2013), “A arquitetura de um Data Warehousing é projetada para
fornecer uma visão única e integrada dos dados, permitindo análises consistentes e
confiáveis em toda a organização.” Segundo o autor, a arquitetura de um DW é de suma
importância para o bom desempenho na gestão de grandes volumes de dados, sendo
assim, é necessário conhecer as partes que integram essa arquitetura.
Considerando que Data Warehousing transforma dados operacionais em
informação voltada à tomada de decisão estratégica, principalmente dentro de empresas.
Então é evidente que surjam dúvidas com relação ao funcionamento desse sistema e
como é sua estrutura. A figura 1 exemplifica a arquitetura de funcionamento de um
Data Warehouse, que vai desde a extração de dados, passando pelo armazenamento e
por uma transformação utilizando ETL, que por sua vez chega ao DW para então
finalizar o processo com a tomada de decisões.

Figura 1: Arquitetura de um Data Warehouse.


A arquitetura típica de um data warehouse geralmente envolve várias camadas
que desempenham funções específicas. Para melhor explicar sobre as camadas, listam-
se abaixo as mais comuns em um data warehouse:
● Extração de Dados:
Nesta camada, os dados são coletados de diversas fontes, como bancos de dados
transacionais, sistemas legados, aplicativos, arquivos de dados, entre outros. Os dados
podem ser obtidos por meio de processos de extração, usando técnicas como extração
direta de bancos de dados ou extração de arquivos. O objetivo é reunir os dados
necessários para a construção do data warehouse.
● Armazenamento:
Após a extração, os dados passam por processos de transformação para garantir sua
qualidade e integridade. Nessa camada, os dados são limpos, padronizados e
enriquecidos, eliminando erros e inconsistências. As transformações podem incluir
filtros, agregação, junções, cálculos derivados e normalização. O objetivo é preparar os
dados para serem armazenados e disponibilizados para análise.
● Transformação:
Nesta camada, os dados transformados são armazenados no data warehouse. O
armazenamento geralmente é organizado em estruturas otimizadas para consulta e
análise, como tabelas dimensionais e fatos. As tabelas dimensionais contêm atributos
descritivos que fornecem contexto aos dados, enquanto as tabelas de fatos contêm
métricas e medidas quantitativas. O armazenamento pode ser implementado usando
bancos de dados especializados para data warehousing, como o Oracle, SQL Server,
Teradata ou soluções baseadas em nuvem, como o Amazon Redshift ou o Google
BigQuery.
● Acesso aos Dados:
Essa camada permite que os usuários acessem e analisem os dados armazenados no
Data Warehouse. Existem diferentes formas de acesso aos dados, incluindo relatórios
pré-configurados, consultas ad-hoc, ferramentas de visualização de dados e interfaces de
programação de aplicativos (APIs) para integração com outras aplicações. O acesso
pode ser realizado por meio de ferramentas de business intelligence (BI), como Tableau,
Power BI ou através de linguagens de consulta, como SQL. Além dessas camadas
principais, também é comum ter camadas adicionais no Data Warehouse, como os
Metadados e o Gerenciamento de Dados.
Vale ressaltar que a arquitetura de um data warehouse pode variar dependendo
dos requisitos específicos de uma organização e das tecnologias adotadas. A descrição
acima representa uma visão geral da arquitetura típica, mas os detalhes e a
complexidade podem variar em diferentes implementações de Data Warehouse.
É relevante também, considerar os diferentes tipos de abordagens arquiteturais
existentes em uma arquitetura de DW, bem como a descrição referente a cada uma, as
principais são:
● Data Warehouse Centralizado:
Nesta abordagem, todas as fontes de dados são integradas em um único local
centralizado, conhecido como Data Warehouse. Essa solução oferece uma visão
unificada dos dados para toda a organização. Os dados são extraídos, transformados e
carregados (ETL) para o data warehouse, onde são armazenados de forma estruturada e
otimizada para consulta. Essa arquitetura é útil quando há a necessidade de análises
complexas e de alto desempenho em uma ampla gama de dados.
● Data Marts:
Os data marts são subconjuntos especializados do data warehouse centralizado, focados
em atender às necessidades de um departamento específico ou de um grupo de usuários.
Em vez de consolidar todos os dados em um único local, os dados relevantes para cada
área de negócio são extraídos e armazenados em um data mart separado. Isso permite
uma resposta mais ágil e direcionada às necessidades analíticas de cada equipe,
tornando a análise de dados mais eficiente.
● Data Warehouses Virtuais:
Os data warehouses virtuais, também conhecidos como data warehouses lógicos, são
soluções que fornecem uma camada de abstração sobre várias fontes de dados
heterogêneas, sem a necessidade de consolidar fisicamente os dados. Em vez de mover
e armazenar os dados em um local centralizado, os data warehouses virtuais acessam e
integram os dados em tempo real, permitindo consultas e análises unificadas sem
duplicação dos dados. Essa abordagem é adequada para ambientes com fontes de dados
dispersas e em constante mudança, permitindo uma visão unificada sem a necessidade
de criar uma infraestrutura de armazenamento adicional.
Essas são apenas algumas das abordagens arquiteturais possíveis para
implementar soluções de armazenamento e análise de dados. A escolha da melhor
abordagem dependerá das necessidades e requisitos específicos de cada organização.
4. Modelagem Dimensional
Com a crescente necessidade de expandir os bancos de dados para análise, a modelagem
dimensional tem se mostrado mais adequada aos sistemas de Data Warehouse, Em
primeiro lugar, porque este tipo de modelo é o que apresenta mais habilidade para
refletir a consistência e a lógica dos negócios. Em segundo lugar, porque ele se mostra
capaz de relevar o processo de tomada de decisão dada sua forma inusitada de
apresentação de dados referentes aos negócios
Kimball (1996) descreve o Modelo Dimensional ou Star Schema como sendo o
modelo cujos principais componentes são as tabelas de fato e as tabelas de dimensões.
Seu diagrama assemelha-se a uma estrela, com uma grande tabela no centro rodeada por
tabelas menores, exibidas em padrão radial.
Neste modelo, a tabela central ou de Tabela de Fatos é a maior de todas as
tabelas existentes. É onde se localiza o “grão” ou foco da consulta sobre a área de
medição do negócio. Esta tabela é simples e altamente desnormalizada. Por definição,
ela armazena fatos reais sob forma de atributos numéricos, aditivos, sumarizados e com
relacionamento do tipo muitos-para-muitos. Sua chave primária tem apenas uma coluna
chave por dimensão, mas contém um conjunto de duas ou mais chaves estrangeiras que
representam sua junção ou interseção com as chamadas tabelas de dimensão.
Kimball (1998) descreve as Tabelas de Dimensão como conjuntos de tabelas de
acompanhamento que lhes provêem informações textuais, ou descritivas e que servem
de base para a integridade referencial para qualquer tabela de fato com a qual possuem
junção. Segundo os mesmos autores, a maioria das tabelas de dimensão contém
atributos (campos) textuais, que agrupam e limitam as buscas dentro do Data
Warehouse.
● Tabelas de fato:
Tabelas Fato são tabelas para armazenamento de medidas. A maioria das medidas
armazenadas em Tabelas Fato dizem respeito a séries temporais, em que são
armazenados timestamps e chaves estrangeiras conectando a dimensões de data
calendário.
Cada linha em uma Tabela Fato corresponde a um evento de medição. A ideia
de que um evento de medição no mundo físico tem um relacionamento de um para um
com uma única linha na tabela de fatos correspondente é um princípio fundamental para
a modelagem dimensional. Todo o resto é construído a partir dessa premissa
(KIMBALL e ROSS, 2013).
Tabelas Fato são a figura central de qualquer modelo dimensional. Toda Tabela
Fato deve possuir uma única e explícita granularidade definida. A granularidade de uma
Tabela Fato deve ser definida durante o processo de modelagem.
Kimball e Ross (2010) recomendam que a definição da granularidade (explicitar
exatamente o que uma Tabela Fato representa) seja a primeira ação a ser realizada na
modelagem de uma Tabela Fato. Podem ser feitas declarações atômicas ou de alto nível,
representando agrupamentos e sumarização. Após definir a granularidade, deve-se então
definir precisamente as dimensões possíveis associadas.
● Tabela de dimensão:
As tabelas de Dimensões contém descrições textuais sobre cada um dos elementos que
fazem parte do processo, as tabelas dimensionais contém vários atributos que descrevem
em detalhes todas as características que possam definir e serem úteis para futuras
pesquisas no Data Warehouse.
A dimensão Produto deve ter descrições curtas e detalhadas sobre o produto,
deve também ter o tamanho, peso, categoria, cor, departamento, marca, tipo da
embalagem, etc. Ou seja, todos os atributos que podem definir o produto e que possam
ser utilizados para futuras pesquisas e análises que ajudarão o empresário a tomar
decisões sobre seu negócio.
● Modelagem Estrela (Star Schema):
No modelo estrela todas as tabelas relacionam-se diretamente com a tabela de fatos,
sendo assim as tabelas dimensionais devem conter todas as descrições que são
necessária para definir uma classe como Produto, Tempo ou Loja nela mesma, ou seja,
as tabelas de dimensões não são normalizadas no modelo estrela, então campos como
Categoria, Departamento, Marca contêm suas descrições repetidas em cada registro,
assim aumentando o tamanho das tabelas de dimensão por repetirem essas descrições de
forma textual em todos os registros.
O esquema estrela é uma estrutura simples, com poucas tabelas e
ligações(relacionamentos) bem definidas (POE, KLAUER, BROBST, 1998),
assemelha-se ao modelo de negócios, o que facilita a leitura e entendimento, não só
pelos analistas, como por usuários finais não familiarizados com estruturas de banco de
dados. Permite a criação de um banco de dados que facilita a execução de consultas
complexas, podendo ser realizadas de modo eficiente e intuitivo pelo usuário.
● Modelagem Floco de neve (Snow Flake):
No modelo Floco as tabelas dimensionais relacionam-se com a tabela de fatos, mas
algumas dimensões relacionam-se apenas entre elas, isto ocorre para fins de
normalização das tabelas dimensionais, visando diminuir o espaço ocupado por estas
tabelas, estão, informações como Categoria, Departamento e Marca tomaram-se tabelas
de dimensões auxiliares.
São desenvolvidos de modo a suportar capacidade de armazenamento da
descrição de produtos, mercados e empresas em um único local através do uso de uma
combinação de normalização de bancos de dados. Visando manter a integridade dos
dados e reduzindo seu número para alcançar uma performance mais elevada. Estes
modelos incorporam grandes tabelas de dimensão que possuam uma junção lógica com
tabelas de fato. Suas tabelas principais de dimensão são parecidas com as tabelas de
dimensão do modelo estrela, entretanto, suas colunas de atributos contém chaves para as
tabelas outrigger em vez de descrições de texto.

5. Processo de ETL
De acordo com Hokama et al. (2004) no ambiente de Data Warehouse, os dados são
inicialmente extraídos de sistemas operacionais e de fontes externas, posteriormente
integrados e transformados (limpos, eliminados, combinados, validados, consolidados,
agregados e sumarizados), antes de serem carregados no data warehouse. Esses
processos são chamados de Extração, Transformação e Carga (Extract Transform Load
- ETL) que para Ferreira et al. (2010) é o processo mais complexo na construção de um
sistema DW, após esses processos, finalmente, os usuários acessam o DW de modo a
obterem informações que permitam a tomada de decisões.
O ETL é um processo que se divide em três fases:
● Extração:
A extração é o primeiro passo na obtenção de dados para o ambiente do DW. Significa
basicamente ler e entender as fontes de dados e copiar as partes necessárias para a área
de transformação de dados, a fim de serem trabalhadas posteriormente. Na grande
maioria dos DW, os dados provêm de várias fontes diferentes e independentes, podendo
ser essas fontes as bases de dados dos sistemas transacionais, planilhas excel, etc.
● Transformação de dados:
Após a extração dos dados dos sistemas fontes, são realizadas uma série de atividades
sobre esses dados de modo a convertê-los em formato adequado para carga no Data
Warehouse e valioso para o negócio. A transformação dos dados poderá envolver um ou
vários processos, dependendo da necessidade e situação. Seguem alguns dos processos
mais comumente utilizados:
➢ limpeza: constitui no conjunto de atividades realizadas, sobre os dados extraídos,
de modo a corrigir o uso incorreto ou inconsistente de códigos e caracteres
especiais, resolver problemas de conflito de domínios, tratar dados perdidos,
corrigir os valores duplicados ou errados. Independente do problema a ser
solucionado pelo processo de limpeza, a finalidade é deixar os elementos de
dados dentro de formatos padrões (uniformizados), não duplicados, corretos,
consistentes e espelhando a realidade;
➢ eliminação: constitui em desconsiderar os campos e dados provenientes de
sistemas legados que não são úteis ao DW;
➢ combinação: é realizada quando fontes de dados possuem exatamente os
mesmos valores de chaves representando registros iguais ou complementares;
➢ desnormalização e normalização: o padrão no processo de transformação é
reunir as hierarquias de dados, separadas em várias tabelas devido à
normalização, dentro de uma única dimensão, de forma desnormalizada. Pode
ocorrer, entretanto, que dados provenientes do processo de extração estejam 18
completamente desnormalizados dentro de arquivos texto, nesse caso é possível
que seja necessário normalizar partes dos registros.
➢ cálculos, derivação e alocação: são transformações a serem aplicadas às regras
do negócio identificadas durante o processo de levantamento de requisitos. É
conveniente que as ferramentas a serem empregadas possuam um conjunto de
funções, tais como manipulação de textos, aritmética de data e hora, entre outras.
● Carga de dados:
Após os dados serem transformados, eles são carregados no DW. A parte de carga dos
dados também possui uma enorme complexidade, e os seguintes fatores devem ser
levados em conta:
➢ Integridade dos dados: no momento da carga, é necessário checar os campos que
são chaves estrangeiras com suas respectivas tabelas para certificar-se de que os
dados existentes na tabela da chave estrangeira estão de acordo com a tabela da
chave primária;
➢ Tipo de carga a ser realizada - incremental ou a total: a carga incremental
normalmente é feita para tabelas de fatos e a carga total é feita em tabelas de
dimensão onde o analista terá que excluir os dados existentes e incluí-los
novamente. Mas isso depende da necessidade do negócio em questão;
➢ Otimização do processo de carga: todo banco de dados possui um conjunto de
técnicas para otimizar o processo de carga, tais como evitar a geração de log
durante o processo, criar índices e agregar dados. Muitas dessas características
podem ser invocadas dos bancos de dados ou registradas em scripts através da
utilização de ferramentas sobre a área de organização de dados;
➢ Suporte completo ao processo de carga: o serviço de carga também precisa
suportar as exigências antes e depois da carga atual, como eliminar e recriar
índices e particionamento físico de tabelas e índices.
A figura 2 descreve de forma geral o processo de ETL. A camada inferior
representa o armazenamento dos dados que são utilizados em todo o processo. No lado
esquerdo pode-se observar os dados “originais” provenientes, na maioria dos casos, de
BD ou, então, de ficheiros com formatos heterogêneos, por exemplo de texto. Os dados
provenientes destas fontes são obtidos (como é ilustrado na área superior esquerda da
figura 2), por rotinas de extração que fornecem informação igual ou modificada,
relativamente à fonte de dados original.
Posteriormente, esses dados são propagados para a Data Staging Area (DSA)
onde são transformados e limpos antes de serem carregados para o DW. O DW é
representado na parte direita da figura e tem como objetivo o armazenamento dos dados.
O carregamento dos dados no DW, é realizado através das atividades de carga
representadas na parte superior direita da figura.

Figura 2: Ilustração do processo de ETL.

6. Melhores Práticas para Data Warehousing


É importante saber como se deve adotar as melhores práticas para DW, levando em
consideração diretrizes essenciais que devem ser seguidas em sua construção, dentre
elas estão:
● Identificação das fontes de dados:
Um data warehouse normalmente extrai dados de várias fontes. Você deve
identificar todas as fontes que contribuirão para fornecer os dados necessários para
atingir seus objetivos e escolher os pontos/elementos fundamentais. As fontes de dados
podem ser de qualquer tipo — outros bancos de dados, aplicativos, mídias sociais,
pesquisas, sensores IoT, etc.
● Criação do modelo de dados:
Como agora todas as fontes de dados e elementos estão definidos, é hora de criar
um banco de dados central para todos os elementos, para formar o armazém. Um
modelo de banco de dados ilustra todas as entidades e/ou objetos que irão para o data
warehouse e suas propriedades. Uma boa ferramenta de modelagem de dados também
ajudará a projetar o modelo em um esquema de banco de dados no gerenciador de sua
escolha.
● Construção de uma staging area:
Depois que os dados são carregados, a staging area — ou área de
armazenamento temporário — é usada para combinar dados de várias fontes,
transformações, validações e limpeza. Os dados geralmente são transformados em um
esquema em estrela antes do carregamento de um Data Warehouse.
● Criação de documentos de dados internos:
Isso é importante, especialmente se você não deseja que seu armazém de dados
seja uma caixa-preta, onde apenas alguns engenheiros sabem como usá-lo. Se seus
usuários não entenderem, não terão certeza de consultá-lo. Sempre que um relatório for
criado (ou atualizado), atualize este documento para refletir qualquer novo nível de
entendimento comercial de seus dados.

7. Tendências e Desafios Futuros


Certamente existem várias tendências emergentes no campo do data warehousing e que
são relevantes para o aprimoramento do uso dessa tecnologia e que ainda são
considerados desafios para o futuro. Dentre elas destacam-se três mais relevantes:
● Data Warehousing na Nuvem:
A adoção de data warehousing na nuvem está se tornando cada vez mais
popular. As soluções de data warehouse baseadas na nuvem, como Amazon Redshift,
Google BigQuery e Azure Synapse Analytics, oferecem escalabilidade, flexibilidade e
facilidade de gerenciamento, permitindo que as organizações armazenem e analisem
grandes volumes de dados de forma eficiente e econômica.
● Big Data:
O crescimento exponencial dos dados, tanto estruturais quanto não estruturados,
impulsionou a necessidade de integração de big data com data warehousing. As
organizações estão buscando soluções que possam lidar com o processamento e análise
de grandes volumes de dados, além de permitir a integração com dados tradicionais em
seus data warehouses.
● Data Lakes:
Data lakes são repositórios de dados brutos e não processados, que podem ser
utilizados em conjunto com data warehousing. Os data lakes permitem a captura e o
armazenamento de dados em sua forma bruta, sem a necessidade de estruturá-los
antecipadamente. Com a adoção de técnicas de processamento e análise avançadas,
como Apache Hadoop e Spark, os dados podem ser refinados e integrados ao data
warehouse para análises mais aprofundadas.

8. Conclusão
O presente artigo esteve abordando sobre os data warehousing, mostrando que nos dias
de hoje, o gerenciamento de dados é indispensável para as grandes organizações e
instituições que armazenam um grande volume de dados. Diante disso, há a
necessidade de aderir informações que auxiliem as mesmas a ter o entendimento do seu
contexto mercantil e estrutural. Sendo assim, o principal objetivo é ter uma base de
informações confiáveis para análise e tomadas de decisões com melhor coerência para a
corporação.

Referências
Devlin, Barry (2013) “Business unIntelligence: Insight and Innovation Beyond
Analytics and Big Data”.
Favaretto, F. (2007) “Melhoria da qualidade da informação no controle da produção:
estudo exploratório utilizando Data Warehouse”. Production, 17, pages 343-353.
Ferreira, J., Miranda, M., Abelha, A., & Machado, J. (2010). “O processo etl em
sistemas data warehouse”. In INForum (p. 757-765). sn.
Hokama, D. D. B., Camargo, B., Fujita, D., Fogliene, F., & JL, V. (2004). “A
modelagem de dados no ambiente Data Warehouse”. São Paulo, v. 32.
Inmon, W. H. (2012). “Building the Data Warehouse”.
Inmon, W. H., & Hackathorn, R. D. (1994). “Using the Data Warehouse”.
Inmon, B., Strauss, D., & Neushloss, G. (2010). “DW 2.0: the architecture for the next
generation of data warehousing”.
Kimball, R. (2013). “The Data Warehouse Toolkit: The Definitive Guide to
Dimensional Modeling”.
Kimball, R., & Ross, M. (2002). “The data warehouse toolkit: practical techniques for
building dimensional data warehouses. Morgan Kaufmann”.
Krishnan, Krish. (2013) “Data Warehousing in the Age of Big Data: A volume in MK
Series on Business Intelligence”, pages 127 - 145.
Ponniah, Paulraj. (2010) “Data Warehousing Fundamentals: A Comprehensive Guide
for IT Professionals”, pages 45-70.
Soares, Vânia J. Araujo (1998) “Modelagem incremental no ambiente de data
warehouse”. Rio de Janeiro.

Você também pode gostar