Você está na página 1de 12

ARMAZENAMENTO DE DADOS

AULA 2:
COMPONENTES DE UM DATA WAREHOUSE

Elaborado por: Edivaldo Rodrigues João


O Data Warehouse possui estruturas e características que
suportam análise de grande volumes de dados gerados
pelas organizações. Para entender melhor sobre o
funcionamento de um DW, é necessário compreender
melhor sua arquitectura através dos seus componentes.

Em muitas bibliografias, é possível encontrar a composição


de um Data Warehouse em 4 áreas destintas:

- Fontes/Provedores de Dados
- Área de Estágio / Staging Area (ETL)
- Armazém de Dados / Data Warehouse
- Área de Apresentação / Presentation Area

02
Componentes de um Data Warehouse

03
Fonte: Internet (Autor desconhecido)
Fontes/Provedores de Dados
(Data Sources)

As fontes de dados, referem-se à todos os dados


que irão compor as informações do DW, ou seja, o
locais de onde são extraídos os dados para o DW.

Estas fontes podem ser internas ou externas,


desde que, as mesmas forneçam dados
corporativos e que contribuam na tomada de
decisão. Compreende os sistemas transacionais,
arquivos em diversos formatos (XLS, TXT, DOC,
etc), sistemas de CRM, ERP, entre vários outros.

04
ETL – Extract, Transform & Load
O ETL é o principal actividade de condução dos dados das
fontes até o armazenamento definitivo no DW. É
responsável por todas as tarefas de extração, tratamento e
limpeza dos dados, e inserção na base do DW.

Staging Area

Staging Area é uma área de armazenamento temporário


onde acontece a actividade de ETL. Auxilia a transição dos
dados das origens para o destino final no DW. Ou seja, sua
responsabilidade é auxiliar na transição das informações
entre a fonte e o destino final;

Entre as ferramentas de ETL, também podemos destacar:

IBM Information Server Data Stage;


Oracle Data Integrator (ODI);
Informatica Power Center;
Pentaho Data Integration.
05
E – Extract / Extração

Extração: coleta e extração de dados brutos de


uma ou diversas fontes.

O processo de extração de dados consiste em se


comunicar com outros sistemas ou bases de dados
para capturar os dados que serão inseridos no
destino, seja uma Staging Area ou outro sistema.

06
T – Transofrmation / Transformação

Transformação: transformação dos dados brutos


em dados modelados.

O processo de Transformação de Dados é


composto por várias etapas : padronização,
limpeza, qualidade. Dados vindos de sistemas
diferentes tem padrões diferentes seja de
nomenclatura ou mesmo de tipos de dados
( VARCHAR2 Oracle ou VARCHAR Sql Server, por
ex. )

07
L – Load / Carregamento (Carga)

Carga: é o carregamento dos dados coletados e


organizados para o data warehouse.

No terceiro e último passo do processo de ETL, é


feito o carregamento dos dados já organizados em
um novo repositório.

Isso ocorre em um ambiente corporativo (data


warehouse) ou em um ambiente departamental
(data mart). Ou seja, processo de Load é a etapa
final do ETL onde os dados são lidos das áreas de
estágio e preparação de dados, carregados no
Data Warehouse ou Data Mart Final.

08
Armazém de Dados (DW)

Trata-se da estrutura propriamente dita de


armazenamento das informações decisivas.
Apenas os dados com valor para a gestão
corporativa estarão reunidos no DW. Esta estrutura,
pode ser representada em um único conjunto de
informações ou em vários subconjuntos (data
marts) representados por assuntos.

09
Data Mart
Data Mart é uma estrutura similar ao do DW, porém com uma proporção menor de
informações. Trata-se de um subconjunto de informações do DW que podem ser identificados
por assuntos ou departamentos específicos. O conjunto de Data Marts em conformidade
dentro da organização compõe o DW.

10
Área de Apresentação
A área de apresentação dos dados é o local em que os dados ficam organizados,
armazenados e tornam-se disponíveis para serem consultados directamente pelos
usuários através de ferramentas de acesso à dados. Ou seja, essa área é a única área
visível aos gestores de negócios (tomadores de decisão) através das ferramentas de
acesso a dados.

Desta forma, podemos considerar como sendo a área de inteligência de negócios


(Business Intelligence - BI).

Ferramentas de acesso a dados – O último componente principal do ambiente de data


warehouse é a ferramenta de acesso a dados. Por definição, toda ferramenta de acesso a
dados consulta os dados na área de apresentação do DW.

11
Obrigado

Email: edivaldo.rodriguesjoao@gmail.com

Você também pode gostar