Você está na página 1de 5

DATA WAREHOUSING (DW): DATA

WAREHOUSE, DATA MART E PROCESSO


ETL
Edison Andrade Martins Morais

-1-
Introdução
Você estudará o processo de Data Warehousing (DW), identificando seus principais
conceitos e elementos: Data Warehouse, Data Mart e Processo ETL (extração, carga e
transformação de dados). Vamos lá?

Data Warehousing (DW)


Trata-se de um processo abrange obtenção, armazenamento, tratamento e
disponibilização dos dados. Confira na figura 1 a visualização desse processo.

Figura 1 - Processo de Data Warehousing.


Fonte: Turban et al. (2009, p. 61).

Compreendido esse conceito, veja no item a seguir, em detalhes, os principais


elementos e conceitos que compõem o processo de Data Warehousing (DW).

Data Warehouse

Também denominado Armazém de Dados, e um conjunto de dados produzido para


oferecer suporte a tomada de decisões, além de ser um repositório de dados atuais e
históricos, de possível interesse dos gerentes de toda a organização (TURBAN et al.,
2009).

-2-
Laudon e Laudon (2007), por sua vez, definem o processo como um banco de dados
que armazena dados correntes e históricos de potencial interesse para tomadores de
decisão na empresa. Esses dados se originam de diversos outros sistemas, como
vendas, recursos humanos, clientes, produção, entre outros.
A principal função do DW é consolidar e padronizar essas informações, de maneira que
possam ser utilizadas pela organização para tomada de decisão em nível gerencial.

você sabia?
Banco de dados é uma coleção de dados relacionados e definidos
como fatos conhecidos que podem ser registrados.
Um banco de dados é projetado, construído e alimentado com
dados para uma finalidade específica. Possui um grupo específico
de usuários e algumas aplicações previamente concebidas nas
quais esses usuários estão interessados (NAVATHE; ELMASRI,
2011).

Acompanhe na figura 2 os componentes de um DW e observe que ele extrai e


transforma dados a partir da leitura de fontes de dados (operacionais ou históricos)
internas e externas; tais dados são disponibilizados para consultas ou análises.

Figura 2 - Componentes de um Data Warehouse.


Fonte: Laudon e Laudon (2007, p. 150).

No DW os dados geralmente estão estruturados em formato próprio para atividades de


processamento analítico, como Data Mining, consultas, geração de relatórios ou outras

-3-
aplicações de suporte a decisão. Em outras palavras, um Data Warehouse e uma
coleção de dados orientada por assunto, integrada, variável no tempo e não volátil que
auxilia no processo de tomada de decisão da gerência.
O DW pode ser mais abrangente, compreendendo dados de diversos sistemas que
atendem a toda a organização, ou mais restrito, considerando apenas um subconjunto
deles.
Os DW mais restritos, menores e descentralizados formam os Data Mart, que você
estudará a seguir.

Data Mart

Para iniciarmos os estudos deste tópico, veja como Turban et al. (2009, p. 58) definem
o conceito de Data Mart: “e um subconjunto de um Data Warehouse, que normalmente
consiste em uma única área temática (p. ex., marketing, operações)”.
Dessa forma, podemos dizer que esse subconjunto representa uma porção resumida e
altamente especializada dos dados organizacionais. Geralmente são descentralizados,
tendo seus dados armazenados em bases separadas, com o principal objetivo de
atender a uma população específica de usuários.
Tenha em mente que é possível criar Data Marts exclusivos para a área de vendas ou
marketing, por exemplo, que serviriam para tratar de informações relacionadas a
clientes.
As principais vantagens dessa abordagem são a maior agilidade de geração e acesso
à informação e o custo menor de criação, se comparado à criação do Data Warehouse
de toda a organização.
Conforme você observou na figura 2, os Data Warehouse e os Data Marts são criados
a partir da extração e da transformação de dados obtidos de um banco de dados. O
nome desse processo é extração, carga e transformação de dados, também chamado
de ETL. Vamos entender esse conceito no próximo tópico.

Processo ETL (extração, carga e transformação de dados)

Extração, carga e transformação de dados (ETL, do inglês Extract, Transform and


Load) é a parte central (núcleo) do processo de Data Warehousing. Consiste na leitura
dos dados de um ou mais bancos (extração), conversão em um novo formato
(transformação) e colocação no Data Warehouse (carga) (TURBAN et al., 2009).
A transformação ocorre com o uso de regras ou tabelas de busca ou com a
combinação entre dados.
As três funções de banco de dados são integradas em uma ferramenta para extraí-los
de um ou mais bancos e coloca-los em outro banco de dados ou DW consolidados.

-4-
Conclusão
Nesta unidade você estudou o processo
de Data Warehousing (DW), identificando
seus principais conceitos e elementos:
Data Warehouse, Data Mart e Processo
ETL (extração, carga e transformação de
dados).
Nesta unidade, você teve a oportunidade
de:

• Compreender o processo de Data Warehousing (DW).

• Identificar os principais conceitos e elementos do processo de Data Warehousing


(DW).

LAUDON, Kenneth; LAUDON, Jane. Sistemas de Informação Gerenciais. 7. ed. São


Paulo: Pearson Prentice Hall, 2007.
NAVATHE, Shamkant; ELMASRI, Ramez. Sistemas de banco de dados. 6. ed. São
Paulo: Pearson Addison Wesley, 2011.
TURBAN, Efraim et al. Business Intelligence: um enfoque gerencial para a
inteligencia do negocio. Porto Alegre: Bookman, 2009.

-5-

Você também pode gostar