Você está na página 1de 3

Perguntas

===================================================================================
====================

a) Qual é a dimensão mais importante num Data Warehouse?


b) Qual a diferença entre um Data Mart, uma estrutura em estrela e uma estrutura em
floco de neve? Em que situações se utilizam
c) Qual a operação SQL que a modelação multidimensional tenta colmatar em termos
desempenho?
d) Oue tipo de estruturas de dados são geradas a partir de um DW?
e) Qual a diferença entre os sistemas OLTP - Online Transaction Processing System e
OLAP-Online Analytical Processing?
f) Indique que operações/Comandos SQL são executadas nos sistemas OLTP e sobre um
DW
g) Quais as cinco funções de agregação usadas no processamento de agregação de
dados usando sistemas OLAP?
h) Considere que tem um Data Mart com 3 dimensões (Tempom Produto e Loja) e a
quantidade como medida. A partir deste DataMart, quais e quantas estruturas de
dados serão geradas?
i) Descreva como é feita, ao long do tempo, a manutenção incremental dos dados num
Data Warehouse?

Respostas
===================================================================================
====================

a) A dimensão mais importante em um Data Warehouse é a dimensão temporal. A


inclusão do tempo como uma dimensão permite a análise e compreensão das mudanças ao
longo do tempo, possibilitando a identificação de tendências, padrões sazonais e
análises comparativas.

b) Um Data Mart é uma subdivisão de um Data Warehouse que se concentra em um


determinado assunto, como vendas, estoque ou marketing. Ele contém um subconjunto
de dados do Data Warehouse, otimizado para atender às necessidades específicas de
um grupo de usuários ou departamento.

Uma estrutura em estrela é um tipo de modelo dimensional usado em um Data Mart, no


qual uma tabela central (tabela de fatos) está conectada a várias tabelas de
dimensão em um padrão de estrela. Isso permite consultas rápidas e simples, pois
todas as dimensões estão diretamente conectadas à tabela de fatos.

Uma estrutura em floco de neve é um modelo dimensional semelhante à estrutura em


estrela, mas com dimensões normalizadas. Isso significa que as tabelas de dimensão
podem ser divididas em várias tabelas para evitar redundância de dados. Embora essa
abordagem possa economizar espaço de armazenamento, pode aumentar a complexidade
das consultas.

As estruturas em estrela e em floco de neve são usadas em diferentes situações


dependendo das necessidades de análise, da quantidade de dados e do desempenho
desejado. A estrutura em estrela é mais adequada para consultas rápidas e simples,
enquanto a estrutura em floco de neve pode ser mais adequada para casos em que a
normalização das dimensões é importante ou quando há limitações de espaço de
armazenamento.

c) A modelação multidimensional tenta colmatar a operação SQL de agregação em


termos de desempenho. A agregação envolve a combinação de valores em uma dimensão
específica para fornecer informações resumidas, como somas, médias ou contagens. A
modelação multidimensional pré-calcula essas agregações e as armazena em estruturas
otimizadas, como cubos OLAP, para fornecer respostas rápidas a consultas agregadas.

d) A partir de um Data Warehouse, várias estruturas de dados podem ser geradas,


como:

- Cubos OLAP: estruturas multidimensionais que armazenam dados pré-agregados,


permitindo análises rápidas e flexíveis.
- Data Marts: subconjuntos de dados do Data Warehouse que se concentram em um
determinado assunto ou departamento.
- Tabelas de fatos: tabelas que contêm medidas quantitativas e chaves estrangeiras
para as dimensões.
- Tabelas de dimensão: tabelas que descrevem as características das dimensões, como
tempo, produto e localização.
- Índices: estruturas otimizadas para acelerar a recuperação de dados com base em
critérios específicos.

e) Os sistemas OLTP (Online Transaction Processing System) são projetados para


processar transações em tempo real, geralmente em ambientes operacionais. Eles são
otimizados para inserção, atualização e exclusão de registros individuais e são
usados para suportar operações diárias, como processamento de ped

idos, transações financeiras e gerenciamento de inventário.

Os sistemas OLAP (Online Analytical Processing) são projetados para análise e


consulta de grandes volumes de dados em tempo não real. Eles são otimizados para
consultas complexas e agregações de dados para suportar análises de negócios e
tomada de decisões. Os sistemas OLAP geralmente envolvem consultas
multidimensionais e a análise de tendências e padrões.

f) As operações/comandos SQL executados nos sistemas OLTP estão principalmente


relacionados a transações de banco de dados, como inserção (INSERT), atualização
(UPDATE) e exclusão (DELETE) de registros. Também podem ser executadas consultas
básicas (SELECT) para recuperação de dados.

Nos Data Warehouses (DW), os comandos SQL executados envolvem principalmente


consultas complexas para análise e extração de informações, como seleção de dados,
filtragem, agregação, junção de tabelas e ordenação. Também podem ser executadas
operações de atualização de dados para manutenção do DW, como a inserção de novos
dados provenientes de fontes externas.

g) As cinco funções de agregação usadas no processamento de agregação de dados


usando sistemas OLAP são:

1. SUM (soma): Calcula a soma dos valores em uma coluna ou medida.


2. COUNT (contagem): Conta o número de registros em uma coluna ou medida.
3. AVG (média): Calcula a média dos valores em uma coluna ou medida.
4. MIN (mínimo): Retorna o valor mínimo em uma coluna ou medida.
5. MAX (máximo): Retorna o valor máximo em uma coluna ou medida.

Essas funções são usadas para resumir os dados em diferentes níveis de agregação,
permitindo análises rápidas e respostas a consultas complexas.

h) A partir do Data Mart com 3 dimensões (Tempo, Produto e Loja) e a quantidade


como medida, serão geradas as seguintes estruturas de dados:

- Tabela de fatos: Essa tabela conterá as medidas quantitativas, como a quantidade


de produtos vendidos, e as chaves estrangeiras para as dimensões Tempo, Produto e
Loja.
- Tabelas de dimensão: Serão criadas três tabelas de dimensão, uma para cada
dimensão mencionada. Cada tabela conterá as informações específicas relacionadas à
dimensão, como data, características do produto e informações da loja.

- Cubo OLAP: Pode ser gerado um cubo OLAP com base nas dimensões e medidas
mencionadas. O cubo OLAP permitirá consultas multidimensionais e análises rápidas
com diferentes níveis de agregação.

i) A manutenção incremental dos dados em um Data Warehouse é realizada ao longo do


tempo para atualizar e adicionar novos dados. Geralmente, isso envolve processos de
extração, transformação e carga (ETL). A manutenção incremental pode ser realizada
de várias maneiras, dependendo dos requisitos específicos do Data Warehouse.

As etapas típicas para a manutenção incremental de dados em um Data Warehouse


incluem:

1. Extração: Os dados são extraídos de fontes externas, como bancos de dados


operacionais, arquivos ou feeds de dados.

2. Transformação: Os dados extraídos passam por processos de lim

peza, filtragem e transformação para garantir a consistência e a integridade dos


dados no Data Warehouse. Isso pode incluir a padronização de formatos, correção de
erros e o cálculo de novas métricas ou indicadores.

3. Carregamento: Os dados transformados são carregados no Data Warehouse. Isso pode


ser feito por meio de processos de inserção, atualização ou exclusão, dependendo
das mudanças nos dados.

4. Atualização incremental: Para manter os dados atualizados ao longo do tempo,


apenas as alterações incrementais são processadas nas atualizações posteriores.
Isso geralmente é feito identificando registros novos ou modificados desde a última
carga e aplicando as alterações apropriadas no Data Warehouse.

Esse processo de manutenção incremental é executado em intervalos regulares,


dependendo da frequência de atualização dos dados fonte e dos requisitos de
negócios.

Você também pode gostar