Escolar Documentos
Profissional Documentos
Cultura Documentos
Construindo um Projeto
de Analise de Dados de
um Sistema de E-
commerce
Wesley Steve
Engenheiro de Dados | Desenvolvedor ETL | 2 articles Follow
Analista de BI | Data Engineer | Python | SQL |…
RESUMO
Palavras chave
I - INTRODUÇÃO
1. Contexto
2. Objetivo
3. Motivação
4. Matérias
Este trabalho esta sendo realizado utilizando os seguintes
recursos tecnológicos, modelos ou práticas
5. Metodologia do Trabalho
• Definição do problema
• Perguntas de negócio
• Conhecendo os dados
• Apresentando os resultados
• Técnicas utilizadas
II REVISÃO DE TECNOLIGIAS E
PRÁTICAS
1. Data Warehouse
Data warehouse (DW) está classificado como um
repositório central para armazenagem de dados que são
coletados de diferentes fontes de dados, como (Sistemas
ERPs, planilhas Excel, sistemas de CRMs entre outros). Ele é
projetado para fornecer suporte a atividades relacionadas à
business inteligence (BI). Os data warehouses, tem como
propósito armazenar dados de diversas fontes que foram
tratadas e estruturadas de acordo com o modelo de dados
dimensional, mantendo um histórico dos dados que foram
coletados, onde este histórico permite que as empresas
levantem insights que as auxiliem nas tomadas de decisões
importantes. Empresas que visam utilizar de recursos de
analises dos dados para melhorar as áreas da empresa que
trazem valor a ela, deveriam utilizar do recurso de data
warehouse (armazém de dados) para armazenagem dos
dados e permitindo que as análises sejam mais
performáticas do que se utilizar do recurso de banco de
dados transacional (OLTP) da empresa, onde cada um
possui papeis diferentes para uma organização (empresa).
O Banco de dados transacional (OLTP), tem como o seu
principal objetivo processar transações de forma contínua,
onde sistemas de diversos segmentos utilizam deste
modelo, como um sistema de armazenamento dos dados.
Já o data warehouse (DW) possui seu modelo de dados do
tipo dimensional e tem como seu principal objetivo
armazenar e organizar dados históricos de diversas fontes
de dados, para analises onde são buscados padrões que
são adquiridos com o tempo. Um projeto de data
warehouse (DW) tem como seu principal papel responder
questões relacionadas as áreas de negócio, sendo que se a
empresa não tiver um proposito definido, de nada irá
adiantar coletar dados de diversos sistemas armazenando e
organizando em um DW. Um esquema de dados de banco
transacional, possui várias tabelas que se relacionam para
organizar e armazenar os dados de forma consistente, já o
esquema de dados de um banco dimensional possui menos
tabelas e menos relacionamentos entre elas, onde se usa
uma ou mais tabelas do modelo transacional para criar o
modelo dimensional. Este modelo dimensional possui dois
tipos, sendo eles: o modelo estrela e o modelo floco de
neve, onde ambos os modelos possuem suas tabelas com
os respectivos nomes (dimensões e fatos). O modelo floco
de neve possui tabela(s) que iram conter dados que
auxiliaram uma ou mais tabelas dimensão, como por
exemplo a (dimensão produto pode ter uma tabela de
categoria de produtos), onde esta tabela de categoria de
produtos esta diretamente ligada a dimensão produto
somente, sendo que a dimensão produto esta ligada a
tabela fato de vendas por exemplo. Já o modelo estrela não
possui essas tabela(s) auxiliares ele somente possui tabelas
dimensão e fato, onde as tabelas dimensões armazenam
dados descritivos e contextuais, que auxiliam a tabela fato a
responder as perguntas de negócio. Já as tabelas fato
armazenam dados calculados. Essas perguntas são feitas à
tabela fato, com os seguintes padrões (o que, onde, como e
por que) aconteceu uma determinada situação. Esta
estrutura de dados é utilizada para oferecer melhor
desempenho durante a execução de consultas complexas,
onde são executas em dados que são do tipo leitura e não
necessitam garantir integridade.
2. ETL
3. ELT
Processo ELT
4. Power BI
1. Problema de Negócio
2. Perguntas de Negócio
3. Coleta de Dados
link: https://www.kaggle.com/datasets/olistbr/brazilia
n-ecommerce
4. Banco de Dados
6. Data Warehouse
7. ELT
8. Configuração docker-compose
);
);
);
);
);
);
Figura 18 - Order_Items
);
);
Figura 22 - Dim_Sellers
);
Figura 23 - Dim_Customers
);
CREATE UNIQUE INDEX idx_dim_customers_pk ON
public.dim_customers USING btree (sk_customer_id);
Figura 24 - Dim_Products
);
CREATE UNIQUE INDEX idx_dim_products_pk ON
public.dim_products USING btree (sk_product_id);
Figura 25 - Dim_Payments
);
);
Report this
Published by
Reactions
1 Comment
Most relevant
Add a comment…
Like · 1 Reply
Wesley Steve
Engenheiro de Dados | Desenvolvedor ETL | Analista de BI | Data Engineer | Python |
SQL | Power BI | Pentaho | Linux |
Follow