Você está na página 1de 5

O que é um Data Warehouse?

Um Data Warehouse é um repositório de informação com características específicas, onde a


informação está estruturada e

organizada de modo a que a análise por parte dos gestores das organizações (através de
ferramentas de fácil utilização que

actuam sobre o Data Warehouse, permitindo-lhes através de selecções tipo Drill-Down


navegarem sobre a informação) seja a

pretendida (e disponível o mais rapidamente possível) de modo a ajudá-los nas decisões que
irão tomar.

Objetivo do Data Warehouse?


De modo a facilitar a análise, a informação pretendida deverá estar armazenada num
repositório central de uma forma bem

definida e estruturada, de modo a conjugar toda a informação heterogénea, organizando-a


quer por assuntos

quer mantendo o historial do seu conteúdo em termos de tempo, de modo a puder responder
o mais eficiente possível ás querys

de análise invocadas. Este é o objectivo de um Data Warehouse.

Caracteristicas de um Data Warehouse?


Organizada por assuntos, Informação Integrada, A informação é não volátil, Informação
Temporal.

O que é um Data Mats?


Os Data Marts, não são mais do que Data Warehouses específicos por assunto. Numa
organização de venda a retalho por exemplo, podemos ter um

Data Mart para encomendas, outro para facturação, e por aí em diante. Um Data Mart é um
subconjunto de um Data Warehouse.
Porquê da necessidade de um Data Warehouse?
Como a informação está centralizada e é de qualidade/consistente,uma vez que para se
construir um Data Warehouse,

existe na fase de análise de requisitos a análise de informação que se irá extrair dos sistemas
operacionais, com um DataWarehouse, as organizações beneficiam mais com as decisões que
os seus gestores tomam, uma vez que a informação estáorientada por assuntos específicos da
área de negócio/actividade da organização, e mantém o historial dessa mesma informação ao
longo do tempo.

Conforme o crescimento da empresa, o volume de informação pretendida aumenta e muitas


vezes o sistema não consegue oferecer isso, onde muitas vezes querys mais complexas podem
demorar uma eternidade, havendo uma necessiade de tomadas de decisões rápidas por parte
dos gestores, para que haja análises de dados mais rápidas, daí a necessidade de um Data
Warehouse.

Planeamento de um Data Warehouse?


Após a análise de requisitos dos dados e da sua qualidade, é efetuada a extração de
informação a partir das várias fontes heterogéneas para a zona que se denomina de
concentração de dados, cujo objectivo é a limpeza e transformação dos dados, conforme se
pode analisar na figura 1. Uma da forma lógica mais eficiente para o desenho da estrutura dos
Data Marts, denomina-se Modelação Dimensional, cujo objectivo essencial é criar uma
estrutura, de modo que a informação fique estruturada, permitindo aumentar a performance
de resposta às análises pretendidas. A zona de extracção de informação, é uma zona onde são
colocados processos/scripts de importação da informação contida nas fontes de dados dos
sistemas operacionais. Este é o primeiro desafio que encontramos na construção de um Data
Warehouse.

Figura 1- Estrutura de um Data Warehouse


Quando se inicia a transferência ou povoamento da informação para o Data Mart, da primeira
vez que se povoa, seleciona-se uma amostra da informação que se encontra na zona de
concentração de dados, e depois transfere-se tudo de uma vez só para o data Mart.

Depois das scripts de povoamento estarem implementadas, e todos os requisitos em termos


de tolerância a falhas assegurados, é efectuado o povoamento dos Data Marts.

Figura 2- Exemplo de um modelo dimensional de um Data Warehouse

Como a informação está disponível no Data Warehouse, poder-se-á efectuar a passagem da


informação para sistemas multidimensionais como hiper-cubos
Sistemas de Processamento Analítico
A informação está estruturada segundo o modelo dimensional (tabela de factos, dimensões e
medidas): - Modelo designado de: - Estrutura em estrela (gastámos mais espaço, mas temos
mais eficiência); - Estrutura em floco de neve (gasta menos espaço, mas é menos eficiente na
pesquisa de informação); ● A dimensão mais importante de um DW é a dimensão Tempo.

OLAP
OLAP é uma arquitectura de base de dados, definida e estruturada de modo a permitir, por um
lado às ferramentas de apoio à decisão um fácil manuseamento dos dados de modo a
“navegarem” sobre eles, analisando várias dimensões, e por outro, fornecer aos agentes de
decisão o acesso a queries de análise complexas, obtendo o menor tempo de resposta possível,
permitindo-lhes efectuar análises comparativas e personalizadas através de várias vistas de
negócio, onde por vezes a própria conjugação destas várias vistas permite por exemplo, a
descoberta de tendências de negócio, novas orientações de mercado, entre outras.

As funcionalidades do OLAP

• Cálculos e modelações ao longo dos dados, através de hierarquias de análise.

• Visualizar subconjuntos de informação (Slicing) através de vistas, permitindo descobrir


tendências de negócio.

• Analisar agregações (Roll-up) e refinamentos (Drill-down) nas análises pretendidas.

• Analisar e percorrer detalhes dos dados (Reach-through).

• Analisar conjugações de várias vistas nas comparações dimensionais (Rotation).

• Facilitar a geração de queries de uma forma simples, amigável e transparente

Outra das vantagens da arquitectura OLAP, é a possibilidade de acrescentar ou retirar


dimensões aos cubos, não afectando a rentabilidade da resposta às queries, nem grandes
alterações às ferramentas e processos analíticos já implementados.
Conclusões
Neste documento apresentamos alguns desafios na construção de um Data Warehouse. Como
pudemos analisar, estes desafios são enormes. O sucesso do planeamento de um Data
Warehouse depende sempre de um conjunto de factores, como o tempo de planeamento e a
complexidade das scripts de processamento de informação, em conjugação com as falhas
inesperadas que poderão ocorrer, mas que devem ser contempladas. As vantagens para uma
organização que tire partido de um conjunto de informação fiável contida num Data
Warehouse, poderá representar na sobrevivência e expansão dessa organização no mercado.
As decisões que são tomadas tem uma base de informação fidedigna, onde o gestor de decisão
tem nas suas mãos dados sólidos, consistentes e completos sobre o historial da actividade da
sua organização, mas com mais puder de análise que a informação contida inicialmente nos
sistemas operacionais. Todas as fases de construção do Data Warehouse são de extrema
importância. A análise de requisitos do objectivo de negócio ou de actividade da organização,
de modo a definir e construir o modelo dimensional do Data Warehouse são o fundamento do
sucesso da sua construção, uma vez que é a partir deste modelo que todo o processo de
extracção, selecção, transformação, povoamento dos Data Marts, e disponibilidade dos dados
se inicia refletindo-se no puder de análise da informação armazenada

Você também pode gostar