Análise de Informações: Data Warehouse e Business Intelligence (BI); e
Modelagem Multidimensional
O esquema em que as tabelas de dimensão estão ligadas apenas a uma tabela de
fatos é o Esquema Estrela (Star Schema). O Modelo Snowflake realmente acrescenta graus de normalização às tabelas de dimensões, eliminando redundâncias. No entanto, como os dados estão normalizados, as consultas são mais complexas e a obtenção de informações será menos eficientes do que no Modelo Estrela. Operação Drill-Through, permite atravessar de uma informação contida em uma dimensão para uma informação contida em outra dimensão. Quando temos um modelo multidimensional com dimensões normalizadas, é criada uma estrutura de Flocos de Neve (SnowFlake Schema). A operação de Roll Up permite a navegação entre os níveis de dados que vão desde o mais detalhado até o mais sumarizado. Aplicações OLTP trabalham com dados voláteis e passíveis de inserção, alteração ou exclusão, já as aplicações OLAP trabalham com dados não voláteis e históricos; ETL é capaz de extrair dados de fontes homogêneas ou heterogêneas Os dados quantitativos são objetivos e os dados qualitativos são subjetivos. Além disso, os dados quantitativos são mais indicados para previsões de longo prazo No esquema flocos de neve, uma tabela fato pode estar a uma profundidade de duas ou mais tabelas da tabela dimensão. As limitações dos bancos de dados relacionais que utilizam modelo entidade- relacionamento podem ser superadas por meio do uso de ferramentas OLAP (Online Analytical Processing). Drill-Down realmente aumenta o nível de detalhamento (ou diminui o nível de granularidade) Drill-Up aumenta o nível de granularidade (ou reduz o nível de granularidade) A abordagem floco de neve realmente é normalizada, o que minimiza a redundância de dados nas tabelas. Dica: a abordagem sNowflake ou floco de Neves é... Normalizada! Transação de dados são realizadas por modelos transacionais Roll-up é o operador que se relaciona ao processo de apresentar dados do nível mais baixa da hierarquia de dados de um esquema para níveis mais altos Um banco de dados multidimensional em uma empresa: tem seus dados oriundos de bancos de dados transacionais. Pivot, que permite ao usuário realizar uma alteração de uma hierarquia ou orientação dimensional para outra. A operação de Drill Down permite a navegação entre os níveis de dados que vão desde o mais sumarizado até o mais detalhado, portanto ela permite visualizar dados detalhados, até o menor nível de granularidade da tabela de fatos. No Modelo Flocos de Neve, as tabelas dimensionais podem estar ligadas a outras tabelas dimensionais É no Modelo Estrela que todas as tabelas dimensionais se relacionam diretamente com a Tabela de Fatos. A estrutura relacional oferece baixa redundância de dados e suporte à normalização até a segunda forma normal A operação que permite buscar informações que vão além do nível de granularidade existente na estrutura dimensional é o DRILL-THROUGH. A Operação Drill-Across permite ao usuário pular um nível intermediário dentro de uma mesma dimensão A Operação que permite atravessar de uma informação contida em uma dimensão para uma informação contida em outra dimensão é a Drill-Through A ferramenta para exploração de um Data Warehouse é o OLAP. Ambientes OLTP realizam muitas transações, logo suportam operações DML como UPDATE (Atualização) e DELETE (Remoção) A tabela de fatos possui uma chave primária composta e as tabelas de dimensão possuem uma chave primária simples. Em um modelo dimensional, a tabela de fatos armazena medições, métricas ou fatos numéricos de um processo de negócio. As operações de projeção são aquelas que selecionam um subconjunto de uma relação – no nosso caso, dimensão. trata-se do Slice and Dice. A chave primária de cada tabela de dimensões será uma chave estrangeira da tabela de fatos. Um modelo multidimensional é formado por dimensões, e por uma coleção de itens composta de dados de medidas e de contexto, denominada fato Os três elementos básicos de um modelo multidimensional são Fatos, Dimensões e Medidas ou Métricas. Surrogate Key (Chave Substituta) DW é não-volátil; O modelo de dados denominado multidimensional se aplica para banco de dados com a tecnologia Data Warehouse. A operação que salta um nível intermediário dentro de uma mesma dimensão é o Drill- Across. Apresentação de dados com níveis de detalhamento cada vez maiores é a funcionalidade da Operação Drill Down. OLTP: poucos registros organizados por registro e por processo; OLAP: muitos registros organizados por arrays e por assunto. Um modelo de banco de dados multidimensional está mais fortemente relacionado com Data Warehouse. Na verdade, o Modelo Estrela não fornece explicitamente suporte a hierarquias de atributos – essa é uma característica do Modelo Flocos de Neve. Tabulação transversal é apenas uma outra forma de dizer que houve a alteração de uma hierarquia ou orientação dimensional para outra, logo se trata da Operação Pivô. A HOLAP (Hybrid OLAP) consegue combinar vantagens de alta performance da Tecnologia MOLAP e alta escalabilidade da Tecnologia ROLAP.