Escolar Documentos
Profissional Documentos
Cultura Documentos
Processo de ETL em
Data Warehouse
Anderson Varago
Roteiro de Estudos- Processo de ETL em Data Warehouse:
o que é, e como usá-lo.
Introdução
Este roteiro de estudos busca instruir sobre uma arquitetura para
organização do Data Warehouse, de modo flexível mudanças de requisitos de
projeto e indica um possível caminho para realizar a modelagem de dados de um
ambiente de Data Warehouse de forma incremental.
• Ser uma fonte de informação adaptável e maleável. Deve ser projetado para
mudança constante, sem que todo o sistema tenha que ser alterado;
Um Data Warehouse pode ter vários objetivos, mas no que diz respeito à
sua utilização e implantação, passa pelos seguintes critérios:
A abordagem bottom-up tem sua realização por meio de uma análise dos
requisitos de forma global, de onde surge uma lista de data marts a serem
implementados e a forma como serão integrados. A principal desvantagem é
representada pela falta de padronização dos Data Marts, gerando redundância
dos dados e resultando em dados inconsistentes, devido a diferentes
representações das fontes de dados. Esse fator traz problemas na integração dos
dados e em sua confiabilidade.
3.1 Talend
Talend Open Studio traz soluções para integração de dados, Big Data entre
outros e, dentro do processo de ETL, fornece uma curva de aprendizado alta.
3.2 Pentaho
3.3 Knowage
● Knowage Server: um servidor com suíte completa, que permite criar desde
Data Sources até relatórios.
Roteiro de Estudos- Processo de ETL em Data Warehouse:
o que é, e como usá-lo.
● Knowage Report Designer: Utilizado para criar relatórios e publicá-los no
servidor.
b) limpeza;
Conclusão
Durante esse trabalho, foi possível trabalhar diversos assuntos que
projetam o conhecimento acerca de Data Warehouse. Pudemos discorrer
durante os estudos desta unidade, como se define um DW e quais as
características que promovem sua aplicação.
Roteiro de Estudos- Processo de ETL em Data Warehouse:
o que é, e como usá-lo.
Também foi possível identificar abordagens que auxiliam e definem a
implementação de DW, de modo que direcionam adequadamente os
trabalhos e permite conduzi-lo.
Bibliografia
BARBIERI, Carlos. BI – Business Intelligence: Modelagem e Tecnologia. Rio de
Janeiro: Editora Axcel Books, 2001.
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Lifecycle Toolkit: Expert
Methods For Designing, Developing and Deploying Data Warehouses. John Wiley&
Sons Inc., New York: 1998.
PRIMAK, Fábio Vinícius. Decisões com B.I Business Intelligence. Rio de Janeiro:
Ciência Moderna, 2008.
VASSILIADIS, Panos et al. Aktos: towards the modeling, design, control and
execution of ETL processes. 2001.