Você está na página 1de 30

wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Aula 1 Imprimir

ARQUITETURA DE DADOS CORPORATIVOS


Dados estruturados, segundo Somasundaram (2011, p. 26), são categorizados como quantitativos,
possuem estruturas �xas, com o mesmo formato para que todos seus registros possam ser recuperados
e processados com e�ciência.

15 minutos

INTRODUÇÃO

Olá Estudante!

Seja bem-vindo ao início desta aula que nos traz o assunto sobre Arquitetura de Dados Corporativos, em
especi�co os tipos de dados utilizados pelas empresas, ou seja, a seleção destes dados que podem ser
recebidos por outras empresas (fornecedores e clientes) e na própria empresa (dados internos
departamentais). Todos estes dados são recebidos, armazenados e enviados aos departamentos pelos

arquitetos de dados que são responsáveis pelo gerenciamento do ciclo de vida destes dados que são
transformados em informações necessárias para a tomada de decisão de cada setor envolvidos nos processos
operacionais, táticos e analíticos desta empresa.

Esta aula está dividida em três blocos e um estudo de caso, o primeiro bloco está direcionada para os dados
estruturados que possuem um formato de�nido, rígido, no segundo bloco, os dados não estruturados ou
dados sem regras de�nidas para seu armazenamento, ao chegarmos no terceiro bloco, trataremos dos dados

semiestruturados ou estrutura heterogênea e �nalizaremos com nosso estudo de caso.

DADOS ESTRUTURADOS

Dados estruturados, segundo Somasundaram (2011, p. 26), são categorizados como quantitativos, possuem

estruturas �xas, com o mesmo formato para que todos seus registros possam ser recuperados e processados
com e�ciência. Vamos ao primeiro exemplo, onde mostraremos uma tabela como exemplo de dados

estruturados, analise a tabela 1:

Tabela 1 | Dados estruturados em formato de tabela

A B C D

1 Nome do Cliente CPF Endereço Contato/Celular

2 Mario de Souza 111.111.111-11 Rua X, bloco 1 111111111

3 Maria Pires 222.222.222-22 Rua Y, bloco 2 222222222

4 João da Silva 333.333.333-22 Rua Z, bloco 3 333333333

5 Joana Prado 444.444.444-22 Rua Force, bloco 4 444444444

Fonte: elaborada pelo autor.

1 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Note que na Tabela 1, os dados em colunas e linhas, na visão de Somasundaram (2011), obedecem ou

possuem valores organizados (padronizados), sendo que cada coluna receberá um item especi�co, por

exemplo, a coluna A nos traz o armazenamento do “Nome do Cliente” as linhas de 2 a 5 para a coluna A, traz
somente os nomes dos clientes e assim para as outras linhas e colunas, resumindo, estão devidamente
estruturados.

Segundo Cury (2018), quando se armazena dados do tipo estruturado, por exemplo se for textual, não
carregará (importará) dados do tipo numérico, vamos a mais alguns exemplos de dados estruturados:

• Um SGBD ou Sistema de Gerenciamento de Banco de Dados: Conforme a necessidade do sistema, cria-se,

entidades e relacionamentos em forma de tabelas;

• Os dados em uma tabela de uma mesma pessoa, ou seja, os dados desta pessoa estarão estruturados, se
houver relação entre si.

• As informações (dados) de pessoas diferentes, terão seus valores diferentes, porém, utilizam uma estrutura

homogênea ou igual ao serem armazenados.

• Planilhas de Excel.

• Arquivos XML.

• Arquivos do tipo CSV.

• Arquivos do tipo JSON.

Vamos analisar mais um exemplo de dados estruturados, os arquivos do tipo JSON (JavaScript Object
Notation), que segundo Somasundaram (2011), é um tipo de formatação que estrutura dados do tipo texto e
faz a transmissão de um sistema para o outro, vamos ver um exemplo na prática dos dados estruturados do

tipo JSON:

Figura 1 | Fragmentos de linhas de códigos do tipo JSON

Fonte: elaborada pelo autor.

Note que, as linhas de códigos são armazenadas seguindo uma notação especi�ca, são organizados, conforme

os elementos: vírgula (,); colchetes [...], chaves ({ }) e por ultimo dois pontos (:).

Caro Aluno!

Chegamos ao �nal de nosso primeiro bloco da aula, onde pudemos visualizar o conceito e as características

dos tipos de dados estruturados, �ca o convite para você, nosso aluno, acessar o o próximo bloco

2 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

VIDEOAULA: DADOS ESTRUTURADOS

Neste vídeo, vamos visualizar e discutir sobre o primeiro bloco que tratou em especi�co sobre o tema: dados
estruturados, ou informações organizadas, rigorosamente, armazenadas em SGBD’s, �elmente gerenciadas

pela equipe de Tecnologia da Informação, responsável pelo recebimento externo, monitoramento e

disponibilização desta informação aos departamentos. Serão citados exemplos de arquivos do tipo

estruturado.

Videoaula: Dados estruturados

Para visualizar o objeto, acesse seu material digital.

DADOS NÃO ESTRUTURADOS

Chegamos ao início do segundo bloco, com o intuito de lhe direcionar e ampliar sua vontade em pesquisa com
ênfase em dados não estruturados, ao contrário de dados estruturados, os arquivos do tipo não estruturados,
estão presentes em nova vida a todo momento, seja, contato de clientes que podem ser armazenados de

diversas formas e tipos, pode ser em notas autoadesivas, mensagens de e-mail entre outros tipos de arquivos,
que veremos logo a seguir, ainda neste bloco.

Cury et. al. (2018), são dados armazenados não estruturados, ou seja, não possuem organização de suas

estruturas bem de�nidas, compreendem aproximadamente de 70 a 80% dos dados que trafegam pelo
mundo, isto, devido ao grande avanço das tecnologias que dominam este tipo de dado, como: fotos, palavras

de um texto (editor de texto Word), áudios, vídeos, entre outras que não é possível sua estruturação, vamos a
um exemplo, mostrado na Figura 2:

Figura 2 | Fragmento de um arquivo do editor de texto Word

Fonte: elaborada pelo autor.

Note na Figura 2 que se trata de um arquivo, desenvolvido em um editor de texto, é do tipo não estruturado

ou seja, não tem um limite prede�nido ou restrições, o autor do texto escreve o que der vontade, o mesmo
acontece com imagens que podem ser inseridas internamente neste próprio texto, ou externamente como os

websites, sms, chaves de acesso, na visão de Edelwess e Galante (2011), os dados não estruturados possuem

características desfavoráveis para os arquitetos de dados que manipulam estas informações no processo de
desenvolvimento e armazenamento de dados, vamos a elas:

• Os dados �cam presentes na forma bruta devido as suas extensões.

3 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

• Os sistemas gerenciadores de banco de dados, recebem estes dados de diversas fontes diferentes.

• Os dados não estruturados são qualitativos, ou seja, informações coletadas na extensão texto.

Sob o olhar Pinto (2020), os pro�ssionais encontraram uma forma de rastrear e manipular os dados não

estruturados que é através do aprendizado de máquina ou machine learning que serve para os arquitetos de

dados poderem analisar e compreender por equações matemáticas, linguagens de programação e softwares

cada vez mais avançados que possam transformar as dúvidas em indicadores para compreender estes dados
de forma bruta.

Segundo Somasundaran e Shrivastava (2011), quando os SGBD’s conseguem por intermédio de softwares,
compreenderem e rastrear os dados não estruturados, levam-se vantagens no mundo competitivo para

tomada de decisões, pois estes dados, deixam de coadjuvantes (lixo eletrônico) para transforma-se em dados
estatísticos, Pinto (2020) conclui que se pode com isso, extrair dos dados não estruturados os seguintes

benefícios:

• Avanço nos negócios ou Business intelligence: utiliza-se dados de fontes internas e externas para melhor
compreender e poder analisa-las, pode-se utilizar o Hotjar como suporte para compreender a satisfação dos
clientes no site, movidos em sua maioria a dados não estruturados.

• Novos produtos de mercado: compreender, analisar e extrair dados não estruturados de seus clientes,
para atuar nos gargalos que podem atrapalhar os negócios da empresa.

Bons estudos!

VIDEOAULA: DADOS NÃO ESTRUTURADOS

Neste vídeo evidenciamos os “Dados não estruturados”, que tem como conceito seu armazenamento não
estruturado, suas características e exemplos destes tipos de dados, com o intuito de complementar e sanar
algumas dúvidas que possam lhe ajudar a compreender melhor sobre o assunto.

Videoaula: Dados não estruturados

Para visualizar o objeto, acesse seu material digital.

DADOS PARCIALMENTE ESTRUTURADOS

Estamos no terceiro bloco, onde trataremos dos “Dados Parcialmente Estruturados”, ou seja, imaginemos uma

empresa que possua armazenamentos distintos, no primeiro caso, os dados que chegam de origens diversas
e são armazenados nos SGBD’s, de�nidos e interpretados por uma linguagem de programação como o SQL,

estamos falando dos dados estruturados. Já no segundo caso, outro setor desta empresa, recebe e armazena
dados que são difíceis de interpretá-los, como postagens em redes sociais, estamos falando dos Dados não

Estruturados”, agora para complementarmos este bloco, estaremos falando dos “Dados Semiestruturados”.

Segundo Edelwess e Galante (2011), Dados Semiestruturados, estão localizados entre os dois primeiros tipos
de dados, citados neste bloco, ou seja, entre os dados estruturados e os não estruturados. Cury et al (2018),

nos con�rma que este tipo de dado não é armazenado em um SGBD (Sistema Gerenciador de Banco de

Dados), porem, seus dados possuem propriedades organizadas (interna). Vamos a um exemplo do código

HTML, mostrado a seguir:

<! <!DOCTYPE html>

4 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

<html>

<head>

<meta charset="utf-8">

<title>Dados Semiestruturados</title>

</head>

<body>

<img src="imagens/firefox-icon.png" alt="dados semiestruturados">

</body>

</html>

<body>

Neste fragmento de código HTML é possível evidenciar que não existe limite na quantidade de informação,
porém, necessita-se respeitar uma hierarquia semântica, por isso, é um exemplo de dado semiestruturado.

Na visão de Somasundaram e Shrivastava (2011), este tipo de dado por ser chamado de à posteriori, ou seja,

sua estrutura será de�nida após a presença dos dados, isto é feito, após serem os dados serem analisados,
conseguindo identi�car dados semelhantes e suas diferenças, por isso, são conhecidos como “auto
descritivos”, onde, o esquema, estará internamente inserido no meio destes dados implicitamente. Vamos a
mais um exemplo de dado semiestruturado, onde mostra uma imagem digital:

Figura 3 | representação de uma imagem digital

Fonte: Wikipedia Commons.

A imagem digital é um típico exemplo de dado semiestruturado, pois, possui atributos estruturais, porém, sua

estrutura não é prede�nida, pode ser obtida de fontes diferentes como um celular, utilizando todas as suas
estruturas para este aparelho que após armazenar estas informações, podem receber outras tags.

Para �nalizar este bloco, segundo Cury et. al. (2018), a Figura 4 nos mostra a comparação entre os tipos de

dados abordados nos blocos 1, 2 e 3 desta aula:

Figura 4 | Tipos de Dados

5 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Fonte | elaborada pelo autor.

VIDEOAULA: DADOS PARCIALMENTE ESTRUTURADOS

Neste vídeo, será abordado o tema dados semiestruturados, ou seja, �cam entre estruturados e não
estruturados, recebem e armazenam dados, como o HTML que possuiu sua própria estrutura, mas recebe

diversos tipos de dados, totalmente diferentes uns dos outros, por isso são chamados de semiestruturados.

Videoaula: Dados parcialmente estruturados

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Um colaborar recém contratado de uma empresa que oferece como serviço o armazenamento em nuvem
para diversas empresas, não teve o treinamento especi�co sobre os processos e interatividade com os

softwares e armazenadores de dados, que são enviados por diversas empresas de segmentos bem diferentes,
distintos, que levaram este colaborar e levantar e questionar alguns colegas sobre os dados que estava

recebendo para armazenamento, em uma das reuniões o analista de sistema sênior, se deparou com o

colaborador, conversando com um colega de trabalho e lhe indagando sobre algumas questões. Este
colaborador começou a receber alguns dados de diferentes extensões, alguns como, planilhas de Excel e
tabelas de bancos de dados, outros como, fotos, áudios, vídeos e outros como, arquivos HTML. Seu objetivo

como Arquiteto de Dados é descobrir que tipos de dados são estes de acordo com os seguintes requisitos:

• Pesquisar e discorrer sobre os dados estruturados, não estruturados e semiestruturados.

• Identi�car e separar os dados de acordo com seu tipo e estrutura.

• Discorra sobre estes tipos de dados.

RESOLUÇÃO DO ESTUDO DE CASO

Diante da discussão, você como analista, propõe que os colaboradores re�itam sobre os diversos tipos de

dados, Estruturados, Não estruturados e Semi estruturados e a partir daí percebam a necessidade de se

6 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

pesquisar sobre os conceitos, características e tipos de softwares armazenadores que tem a capacidade de

receber, armazenar e analisar os dados que chegam até os domínios da empresa, com isso, saberão lidar com

os desa�os impostos pelas empresas que con�am nos trabalhos de manipulação de dados de sua empresa.

• Planilhas de Excel e tabelas de bancos de dados são dados estruturados.

• Fotos, áudios, vídeos são dados não estruturados.

• Arquivos HTML são dados semiestruturados.

 Saiba mais

Olá Estudante!

Acesse o livro pela biblioteca digital!

SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de


Informações. [Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/.

Acompanhe o material complementar conforme a Figura 5 a seguir:

Figura 5 | Tipos de Dados

Fonte: elaborada pelo autor.

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

Aula 2

CONSTRUINDO UM DATA WAREHOUSE


Olá Estudante! Vamos tratar da implantação e con�guração de um Data Warehouse, ferramenta esta que

7 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

surgiu com o intuito de armazenar uma grande quantidade de dados. Vivemos em um mundo
corporativo, onde as empresas investem alto em novas tecnologias, desde sua infraestrutura,
colaboradores capacitados e ferramentas virtuais que podem fazer a diferença no mundo dos negócios,
onde a palavra erro, tornou-se um pesadelo para muitos administradores.
16 minutos

INTRODUÇÃO

Olá Estudante!

Seja bem-vindo a aula que evidencia “Construindo um Data Warehouse” ou “Armazém de Dados”, esta grande

ferramenta armazenadora de dados vem crescendo e se �rmando cada vez mais em empresas que utilizam
os dados recebidos, fazendo seu armazenamento para utilizar esses dados em prol de informações que serão
a base para estratégicas corporativas e tomadas de decisões.

Logo no primeiro bloco, será abordado sobre a implantação e con�guração de um Data Warehouse seus
conceitos básicos para implantação desta ferramenta nas empresas, em seguida como con�gurar o Data
Warehouse. No segundo bloco, que evidencia sobre “Metadados em Data Warehouse”, trata da origem dos

dados que foram coletados e armazenamentos, sua facilidade em de�nição de qualquer tipo de dados, para o
terceiro bloco: “Repositórios no uso do Data Warehouse que mostra ao usuário um conjunto de dados que
especi�ca diferentes tipos de tipos ou propriedades de visualização.

IMPLANTAÇÃO E CONFIGURAÇÃO DE UM DATA WAREHOUSE

Olá Estudante! Vamos tratar da implantação e con�guração de um Data Warehouse, ferramenta esta que
surgiu com o intuito de armazenar uma grande quantidade de dados. Vivemos em um mundo corporativo,

onde as empresas investem alto em novas tecnologias, desde sua infraestrutura, colaboradores capacitados e
ferramentas virtuais que podem fazer a diferença no mundo dos negócios, onde a palavra erro, tornou-se um
pesadelo para muitos administradores.

Na visão de Vida (2021, p. 14), O data warehouse permite que sejam realizadas consultas a �m de extrair
informações para a tomada de decisão. Os dados quando chegam no Data Warehouse já foram tratados pelos

recebedores, com isso, elimina-se as redundâncias, está sendo muito utilizada pelas empresas para o

armazenamento de dados, pode-se analisar e comparar dados para tomadas de decisões. Segundo
Somasundaram e Shrivastava (2011), para se implantar, construir, os administradores de dados, sejam de

empresas terceirizadas ou da própria empresa, seguem alguns passos importantes para o êxito desta

implantação como mostra o Quadro 1:

Quadro 1 | Passos para construção de um Data Warehouse

1. Identi�car de onde vem Os dados chegam de diversas fontes, saber de onde elas vêm é um trunfo

os dados (fontes) importante para o repositório de dados da empresa, pois elimina-se dados
inseguros vindos de aplicativos, diversos tipos de mídias, entre outra

2. Criação do banco de Escolher uma boa ferramenta para modelar seus dados, e criar suas

dados principal entidades e objetos são premissas para a criação do banco principal.

8 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

3. Desenvolvimento da Area Combina os dados oriundos de diversas fontes, transforma-se os dados em

de armazenamento conjuntos de estrelas para distribuição dos dados antecedendo o

temporário (staging) carregamento do Data Warehouse.

4. Criação interna dos Este item é de suma importância, pois ao criar seus dados internamente,

dados você não �cará refém de alguns arquitetos que criam os dados para si

próprios como estratégia para não perderem o vínculo. Compreensão e

treinamento da equipe interna é uma boa estratégia.

5. Dados não íntegros Isto acontece quando há diversas fontes indevidas, fazer a rastreabilidade

para compreensão, assim como registrá-los para possível entendimento e


tomada de decisão.

6. Tecnologia muito A construção de seu Data Warehouse é muito importante para o

complexa armazenamento e manipulação de seus dados, porém, a de�nição de seus


requisitos com antecedência, direciona a equipe a fazer as escolhas
assertivas para aquisição dos hardwares e softwares compatíveis para os
processos da empresa.

Fonte: adaptado de Vida (2021).

Os passos do Quadro 1, são necessários para o desenvolvimento de um DW (Data Warehouse), Vida (2021, p.
128), o DW tem uma grande validade quando é possível utilizar as informações para melhorar um

produto/serviço, de forma a antecipar decisões ou mesmo aprimorar os caminhos que já estão sendo
seguidos.

Um DW é con�gurado em diversos bancos de dados simultaneamente, devidamente organizados em tabelas

como SQL (Standard Query Language ou Linguagem de Consulta Padrão), onde se de�ne nas colunas, os tipos
e descrições dos dados que serão utilizados de acordo com a necessidade dos pro�ssionais envolvidos. As
tabelas podem ser armazenadas em pastas (VIDA, 2021). Estas são algumas informações relevantes sobre

Data Warehouse’s, não deixe de pesquisar e se preparar cada vez mais para este desa�o.

Bons Estudos! i

VIDEOAULA: IMPLANTAÇÃO E CONFIGURAÇÃO DE UM DATA WAREHOUSE

Este vídeo tem como objetivo, complementar algumas informações sobre Implantação e Con�guração de um

DW, os passos para construção desta ferramenta que tem a capacidade de não somente armazenar, mas
organizar os dados em tabelas e colunas, para se obter tomadas de decisões, consolidação dos dados,

analises históricas com qualidade e segurança.

Videoaula: Implantação e con�guração de um Data Warehouse

Para visualizar o objeto, acesse seu material digital.

METADADOS EM DATA WAREHOUSE

Olá Estudante! Imagine a quantidade de dados que chegam de diversas origens, como, sites, outros

repositórios, blogs, clientes, fornecedores, uma in�nidade de dados que são armazenados no DW em tabelas,

9 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

especi�cados em colunas para que possam ser extraídos pelos usuários destes dados, mas o que vem a ser

estes metadados em DW?

Somasundaram e Shrivastava (2011), a�rmam que metadados especi�cam o que são os outros dados que
estão contidos nas colunas dos DW’s que fazem parte das pastas que armazenam os dados do DW. Vida
(2021, p. 28), nos conceitua que, os metadados são de�nidos como dados sobre dados, ou seja, são

informações que descrevem as informações que estão armazenadas. Vida (2021), con�rma que os metadados
podem ser classi�cados nas seguintes formas de acordo com o Quadro 2:

Quadro 2 | Classi�cação dos metadados

Metadados Recursos

Negócios Utilizam linguagens de negócios, seu signi�cado para direciona-las ao destino correto e
também se forem alteradas, atualizadas.

Técnicos Utilizam linguagens técnicas para descreverem internamente sobre o andamento dos dados
em uma aplicação do DW.

Fonte: adaptado de Vida (2021).

Com a colaboração de Vida (2021, p. 29), vamos analisar a Figura 1, que mostra a forma conceitual da
arquitetura de DW:

Figura 1 | Arquitetura conceitual de DW

Fonte: Vida (2021, p. 29).

Note que neste modelo conceitual segundo Vida (2021), pode ser dividido em diversos departamentos o Data

Mart’s, são monitorados e gerenciados por vários servidores sendo assim, multidimensionais. Um DW
segundo Alves (2014 apud Vida (2021), pode se dividir nas seguintes formas de acordo com Quadro 3:

Quadro 3 | Divisões de um DW

1. BD operacional e de Trata-se os dados antes de envia-los ao DW.

fontes externas

10 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

2. Acesso aos Dados É a ponte entre as ferramentas que os usuários acessam e a informação

3. Transporte da Faz a gestão da transmissão da informação em rede.


informação

4. Acesso a informação Interatividade entre usuários e informação.

5. Gestão dos processos Controla e gerencia as tarefas entre os processos.

6. Gestão de Replicação Tem a capacidade de seleciona, pode editar, faz resumos se necessário e
consegue combinar o carregamento de dados no DW.

Fonte: adaptado de Alves (2014 apud Vida (2021).

Podemos comparar DW com DM (Data Mart), segundo Victor (2017): um DW é corporativo, o DM é

departamental; no DW detalha-se os dados, em DM nível de granularidade alto; em DW sua estrutura possui


normas, já em DM, seu esquema é do tipo estrela; exporta as informações muito bem; os DM’s são ótimos
para consultas; entre outras muitas funcionalidades de Data Warehouse e Data Mart. Pode-se perceber que

estas ferramentas, tanto os DW’s quanto os DM’s possuem características que ajudam muito os usuários que
dependem destas ferramentas para conclusão de seus processos. Não deixe de acessar nossa biblioteca e
procurar por VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]:
Grupo A, 2021. Sendo esta uma obra excelente para pesquisas complementares e continuidade no ensino
aprendizagem.

Bons estudos!

VIDEOAULA: METADADOS EM DATA WAREHOUSE

Este vídeo, mostra um complemento sobre “Metadados em DW, ou seja, conceitua a ideia de dados sobre
dados, identi�ca as informações que estão armazenadas nas tabelas, a classi�cação dos Metadados, assim

como sua arquitetura e divisões em um Data Warehouse. É o momento de discutirmos e exempli�carmos


cada item descrito.

Videoaula: Metadados em Data Warehouse

Para visualizar o objeto, acesse seu material digital.

REPOSITÓRIOS NO USO DO DATA WAREHOUSE

Olá Estudante, podemos começar com a seguinte indagação, o que são e até onde irão os repositórios? Com

certeza é o tipo de questionamento que todas as empresas em atividade discutem em suas reuniões em
pauta, sobre “O QUE, DE QUAL ORIGEM, COMO ARMAZERNAR UM GRANDE NUMERO DE DADOS. Estamos na

era do Big Data, Ciência de Dados, onde convive-se com bilhões ou mais de dados que chegam até as
empresas com o intuito de transformar-se em algum indicador, seja para o bem ou para o mal, o que importa

é pensar em investimentos em ferramentas, treinamentos e softwares cada vez mais convincentes.

Os repositórios ou armazenadores de um DW, são locais de grande capacidade de armazenamento de dados,


ou seja, não podemos compará-los a simples armazenadores como um pendrive ou locais em nuvem que

oferecem armazenamentos gratuitos como a ferramenta Dropbox da Google. A Figura 2, mostra os

componentes de armazenamento de um DW:

11 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Figura 2 | Componentes de armazenamento de um DW

Fonte| Machado (2017, p.14).

Segundo Machado (2017), vamos começar pelas fontes A, B e C, pode vir de diversas origens, a área de
concentração conhecida como ETL (Extraction Transformation Loading ou Extração e Transformação de Carga)
no caso os dados que chegam, é o local onde trata-se os dados antes de serem armazenados, ou seja, os
metadados que ao serem devidamente analisados seguem para os Data Mart que são sub departamentos do
Data Warehouse, assim, seguem para os Negócios na Rede (BI).

Complementa Machado (2017), os dados quando chegam ao estágio do ETL, começam a transforma-se em

informação, organizando-as em tabelas, que estarão dispostas em pastas para serem utilizadas pelos usuários
�nais, estas informações tornam-se relatórios, indicadores chave de desempenho. Machado (2017) nos
elucida que a Figura 2 pode ser resumida no Quadro 4 da seguinte forma:

Quadro 4 | Resumo dos componentes de armazenamento de um DW

1. Tratamento de Extração e carga dos dados entre dois modelos, OLTP (Processamento de
Dados transações online) e DW

2. Organização de Modelo do tipo dimensional.


Dados

3. Software Especi�co Utiliza-se a ferramenta OLAP para acessar o DW.

4. Hardware Utiliza-se um computador com processamento paralelo.

Especi�co

Fonte: adaptado de Machado (2017).

Ou seja, pode-se resumir que os repositórios de dados no uso do DW, conhecidos como grandes bibliotecas

de dados, capazes de converter-se em informações, possuem capacidade para receber, organizar e direcionar
os dados transformados em informações, prontamente para serem gerenciados pelos administradores de

dados que fazem destes dados, informações importantes para o desempenho de seus processos corporativos
diários.

VIDEOAULA: REPOSITÓRIOS NO USO DO DATA WAREHOUSE

Neste vídeo, estaremos compartilhando informações relevantes sobre os repositórios no uso do DW,

compreender como os dados chegam até o ETL, ao chegar neste estágio, compreender como são tratados e

12 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

dispostos para os Data Mart’s, subdepartamentos responsáveis por armazenarem e produzirem informações

que estarão dispostas para sua extração.

Videoaula: Repositórios no uso do Data Warehouse

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Um Arquiteto de Dados, que trabalha em uma das empresas que prestam serviços de armazenamento de
dados na nuvem, participou de uma reunião onde a discussão em pauta era sobre a qualidade e desempenho

no armazenamento de dados.

Enquanto um grupo defendia que o armazenamento atual era ultrapassado e que mesmo havendo
inconsistência como sobrecarga de dados, superaquecimento de hardware entre outros problemas, seria

preferível continuar com o atual armazenador de dados. Outros do setor eram a favor de mudanças
imediatas. O colaborador indagou: Quem de vocês garanti que a empresa não terá um colapso se continuar
com esse armazenador ultrapassado? Seu objetivo é escolher e implantar os passos para resolução dos

seguintes requisitos:

• Descobrir de onde vem os dados.

• Criar um banco de dados principal, um armazenamento temporário.

RESOLUÇÃO DO ESTUDO DE CASO

Diante da discussão, o grupo a favor de mudanças imediatas, propuseram a diretoria a construção de um


Data Warehouse desde seu início, com a ajuda de uma empresa especializada em armazenadores deste porte.
Com o aval para a implantação, veri�cou-se que:

1. A primeira ação foi Identi�car de onde vem os dados (fontes).

2. Criar um banco de dados principal.

3. Desenvolver uma Area de armazenamento temporário (staging) – ETL.

4. Criar internamento os dados.

5. Rastrear e agir contra dados não íntegros.

6. Tomar cuidado ao escolher a tecnologia para que não haja complexidade na usabilidade do sistema.

13 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

 Saiba mais

SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de

Informações. [Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:

https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 12 dez. 2021.

VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A,
2021. 9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books

/9786556901916/. Acesso em: 11 dez. 2021.

Olá Estudante!

Acompanhe a Figura 3:

Figura 3 | Resumo visual sobre construindo um Data Warehouse

Fonte: elaborada pelo autor.

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

Aula 3

INGESTÃO DE VARIEDADES DE DADOS


Seja bem-vindo a aula de “Arquitetura de Dados”, que evidencia neste primeiro bloco, “Fonte de Origem
de Dados”, ou seja, as empresas do mundo corporativo, são departamentais, e para que estes setores
funcionem corretamente, necessitam de algum tipo de informação, que foram originadas de uma fonte,
que é responsável por suprir estas empresas por dados que serão transformados por grandes
computadores em informações que serão uteis para o desenvolvimento desta empresa.

17 minutos

14 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

INTRODUÇÃO

Olá Estudante,

Estamos iniciando a aula sobre “Ingestão de Variedades de Dados”, continuação de conteúdo para a disciplina

Arquitetura de Dados, que evidencia o recebimento, armazenamento e distribuição de dados, qualquer que
seja sua fonte de dados como os DW’s, planilhas gerenciais, , armazenadores de documentos, seja físicos, ou
nuvem, a ingestão de dados tem como objetivo receber dados de diversas origens, armazená-los e poder
transferir estes dados transformados em informações para seus destinos especí�cos de acordo com a

necessidade de cada local que irá receber estas informações.

No primeiro bloco, é evidenciado a “Fonte de Origens de Dados”, ou seja, de onde vem os dados que serão
armazenados organizadamente, para o segundo bloco, focou-se em “Modelo de Loja de dados Operacionais-

ODS”, seu conceito e características e para �nalizar, “Modelagem de dados dimensionais – OLAP” que se
conceitua em de�nir as atividades de consulta por intermédio de um conjunto de técnicas para podermos
tratar os dados e enviá-los para diversos departamentos.

FONTE DE ORIGEM DE DADOS

Olá Estudante!

Seja bem-vindo a aula de “Arquitetura de Dados”, que evidencia neste primeiro bloco, “Fonte de Origem de
Dados”, ou seja, as empresas do mundo corporativo, são departamentais, e para que estes setores funcionem
corretamente, necessitam de algum tipo de informação, que foram originadas de uma fonte, que é
responsável por suprir estas empresas por dados que serão transformados por grandes computadores em
informações que serão uteis para o desenvolvimento desta empresa.

Segundo Campello e Caldeira (2007), fontes de origens dos dados, são centros armazenadores de dados que

serão transformados em informação e serão armazenados, organizados e manipulados para serem


encaminhados para seus destinos nos casos internos de determinada empresa, podendo ser seus

departamentos, ou externamente, clientes e fornecedores desta informação.

Na visão de Favero (2017), temos alguns exemplos de fontes que originam os dados, entre eles: Bancos de
Dados físicos ou em nuvem, planilhas eletrônicas, arquivos com extensão: CSV, XML, editores de texto,

sistemas gerenciadores da informação (ERP’s, CRM’s, periódicos, tcc’s, artigos cientí�cos e tudo o que posso
trafegar pelos ambientes físicos e ou externamente, como por exemplo clientes e fornecedores.

As fontes de origens de dados tornaram-se assuntos de muita discussão entre as lideranças das empresas
corporativas, governamentais, entre outras, pois, vivemos na era da informação rápida, acessível por
intermédio de muitas ferramentas, com isso, as fontes, multiplicaram de maneira desordenada, junto com as

vantagens que isto traz, também recebemos desvantagens como fontes não con�áveis, desorganizadas que

fazem um estrago enorme nos bancos de dados das empresas. Beluzzo (2003) nos alerta sobre como

identi�car as fontes de informações, analise o Quadro 1 a seguir:

Quadro 1 | Tipos de fontes de origens de dados

15 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

1. Fontes Este tipo de fonte de informações não pode ser modi�cado: Teses de doutorado,

Primárias dissertações de mestrado, patentes requeridas, normas técnicas validadas, nomes de

empresas e suas marcas comerciais.

2. Fontes Este tipo de fonte de informações são os organizadores das fontes primarias e

secundárias direcionam os leitores para este tipo de informação, ou sejam, possuem documentos

primários, podem ser: as bases de dados, os diversos bancos de dados, dicionários,

feiras, livros, manuais.

3. Fontes Este tipo de fonte de informações indica, direcionam os leitores para a pesquisarem as

Terciárias informações primarias e secundarias, é um guia, são eles: Bibliogra�as, diretórios, revisão
de literatura.

Fonte: adaptado de Cunha (2001).

Sob a re�exão de Le Coadic (1996), as informações podem vir de fontes diferentes como mostra a Figura 1 a
seguir:

Figura 1 | Diversas fontes de dados

Fonte: elaborada pelo autor.

Note que na Figura 1 os dados que chegam até a área de concentração que chamamos de staging, onde os

dados �cam temporariamente e são transformados e entregues para os Data Warehouse’s, sendo
selecionados os dados que interessam aos BD’s, ou seja, armazenar o máximo de dados possíveis.

VIDEOAULA: FONTE DE ORIGEM DE DADOS

Olá Estudante!

Neste vídeo, vamos conceituar as fontes de origens dos dados, de onde surgem, para qual local esses dados
se concentram, no caso estamos falando da área de concentração que tem um papel decisivo no

armazenamento desses dados.

Videoaula: Fonte de origem de dados

Para visualizar o objeto, acesse seu material digital.

16 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

MODELO DE LOJA DE DADOS OPERACIONAIS- ODS

Olá Estudante!

Seja bem-vindo a nosso segundo bloco, com ênfase em complementar o primeiro bloco com o assunto:

“Modelo de Loja de Dados Operacionais – do inglês Operational Data Store, este modelo vem ajudando as
empresas a armazenarem o maior número de dados possíveis, independentemente de seu tipo de origem,

oriundos de fontes diversas como citadas no primeiro bloco, ou seja, estamos na era do trafego de

informações por diversos meios eletrônicos, sendo eles, �xos em departamentos, ou dispositivos moveis
como notebooks e smartphones, além de outros canais que simpli�cam a rota dos dados, com isso, chegam
em grande volume de dados, o que é chamado de Big Data. Qual o conceito e como é a estrutura do ODS?

Segundo Favero (2017), um Modelo de Loja de Dados Operacionais – ODS, foi pensada e construída como
Base para recepção e integração de dados, voláteis (recebem e podem ser extraídos a qualquer momento).

Beluzzo (2001) nos alerta para a importância do processo deste estágio onde chegam os dados na sua forma
“bruta”, ou seja, podem ser estruturados que tem possuem forma e regras organizadas, não estruturados,
sendo o contrário dos dados estruturados, pois não possuem regras ou quantidades de dados ou
semiestruturados que �cam entre os dados estruturados e não estruturados, ou seja, possuem regras ou

semântica (arquivos XML) porem não determina-se a quantidade de dados que podem chegar até o ODS.

Vamos analisar a Figura 2, que nos mostra, na visão de Somasundaram e Shrivastava (2011), o
posicionamento estratégico do ODS:

Figura 2 | Posicionamento do ODS no trafego de Dados

Fonte: adaptado de Somasundaram e Shrivastava (2011).

Note que a Figura 2 no (s mostra o posicionamento estratégico do ODS entre os dados brutos enviados de

origens diversas, estes são extraídos pelo ODS e a área de “Staging – área de preparação dos dados”, ou seja,
é uma das área mais importantes como repositório dos dados de origem, pois, as empresas podem reter um

maior volume de dados para poderem analisar primeiramente antes de transformarem os dados no estágio
posterior (ETL – Extract, Transform e Load – Extrair, Transformar e Carregar), antecedendo a chegado destes

dados, transformados em informação até o Data Warehouse.

Le Coadic (1996), nos complementa sobre as características e importância do componente ODS, que além de

extrair os dados brutos, tem a capacidade de ser exercer diversas funções como: limpeza de dados (lixo
eletrônico), detecta dados redundantes e veri�ca sua integração aos negócios da empresa que está recebendo

estes dados, além de substituírem estes dados pelos que chegam, sendo seu armazenamento temporário

diferentemente do Data Warehouse onde as informações mantem-se em seu estado permanente.i

VIDEOAULA: MODELO DE LOJA DE DADOS OPERACIONAIS- ODS

17 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Olá Estudante!

Neste vídeo vamos tratar do componente ODS, sua importância no ato do recebimento dos dados brutos,

oriundos de diversas fontes de dados, o tratamento e extração dos dados que interessam o próximo bloco
onde serão transformados e preparados para o armazenamento �nal.

Videoaula: Modelo de loja de dados Operacionais- ODS

Para visualizar o objeto, acesse seu material digital.

MODELAGEM DE DADOS DIMENSIONAIS - OLAP

Olá Estudante!

Estamos iniciando nosso terceiro e último bloco, da disciplina Arquitetura de Dados que evidencia o tema:
Modelagem de Dados Multidimensionais – OLAP do inglês Online Analytical Processing), chegamos ao termino

do ciclo que envolve o trafego de dados que tem como destino os super armazenadores, como por exemplo o
Data Warehouse que está em evidencia nestes três blocos, mostramos os dados que chegam até o
armazenador temporário, chamado de modelo de loja de dados operacionais ou ODS, passamos pelo
transformador de dados ou Extração, Transformação e Carregamento de dados – ETL até chegar ao Data
Warehouse, onde os dados permanecerão organizados e armazenados, neste bloco vamos evidenciar a

informação pós Data Warehouse, o Processamento Analítico Online desta informação.

Vida (2021, p. 173), nos a�rma que um Data Warehouse pode ser conceituado como um repositório analítico
capaz de oferecer um conjunto de consultas agregadas, sumarizadas e derivadas, de forma rápida e

compactada. Ao chegar neste estágio os dados que viraram informação serão tratados como: “conjuntos de
informações orientados por assunto, eles não são voláteis, estas informações são monitoradas, manipuladas
e representadas pelos arquitetos, engenheiros ou analistas de dados por dois tipos de dados:

• Indicadores: monitora-se as medidas que são os processos armazenados do DW.

• Informações de apoio aos indicadores: chamados de modelagem de dados analíticos, sua


representatividade e armazenamento.

Segundo Vida (2021), os dados podem ser armazenados, cruzando as linhas e colunas, chamado de

modelagem multidimensional, sendo um formato, conhecido por processamento analítico online ou OLAP.
Sua representação é realizada por intermédio de uma �gura geométrica o “Cubo de Dados”, são operações

complexas realizadas por consultas. Na visão de Vida (2021, p. 174), as medidas são representadas pelas

células desse cubo, os lados, pelas suas respectivas dimensões, o que costuma ser chamado de hipercubo.
Este cubo pode cruzar as informações, que serão disponibilizados nos lados do cubo, havendo mais um

indicador, por exemplo local, produto e tempo, neste caso são três indicadores, com isso, podemos dizer que

é um cubo tridimensional, vamos analisar a Figura 3, de Vida (2021, p. 175):

Figura 3 | Cubo Tridimensional

18 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Fonte: Mannino (2008, apud Vida (2021, p. 175).

Note que a Figura 3 nos mostra a distribuição de três indicadores, local a esquerda, produto centralizado e o

tempo a direita do cubo, com isso, pode-se cruzar as informações e ou indicadores de acordo com a

necessidade da análise que cada fará ao realizar a leitura do cubo. Veja alguns exemplos de combinações

analíticas, de acordo com Vida (2021, p. 175), analisando o Quadro 3 a seguir:

Quadro 3 | Possíveis combinações realizada com o cubo tridimensional

Local Produto Tempo

Qual local vende mais determinado produto em determinado período de tempo?

Produto Local Tempo

Que produto foi o mais vendido para determinado local em determinado dia?

Produto Local Tempo

Qual o produto foi o menos vendido para determinado local em determinado período de tempo?

Fonte: adaptado de Vida (2021, p. 175).

Vida (2021), nos elucida que estes cruzamentos de dados permitem acesso rápido as informações que se
tornarão relevantes aos indicadores desejados pela gestão corporativa da empresa. Vida (2021, p. 176), trata-

se de repositórios não relacionais conhecidos como multidimensional database, os quais armazenam os


dados num formato de arrays dimensionais.

VIDEOAULA: MODELAGEM DE DADOS DIMENSIONAIS - OLAP

Olá Estudante!

Fechamos com ênfase em Modelagem de Dados Dimensionais – OLAP, completa-se um ciclo de informações
desde os dados brutos, passando pela extração e armazenamento de dados temporários, transformando e

carregando-os no Data Warehouse e por �m direciona-os para os operadores analíticos – OLAP, onde estes se

encarregam de cruzar as informações utilizando-se a técnica de cubos multidimensionais para levantamento


de indicadores.

Videoaula: Modelagem de dados dimensionais - OLAP

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Em uma empresa do segmento de vendas de smartphones, vende diversas marcas de telefonia móvel pela

internet e faz suas entregas via correio, em uma de suas reuniões rotineiras, de três supervisores, um deles,
questionou a quantidade de produtos vendidos dentro do estado de são em cidades próximas a empresa em

19 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

um raio de 300 kms, como poderíamos fazer esse cruzamento de dados? Outro supervisor respondeu dizendo

que seria perda de tempo �car levantando esses dados e que deixasse o departamento de vendas e entregas

fazerem suas atividades sem supervisão. Prontamente o terceiro supervisor sugeriu o cruzamento de dados
extraídos do Data Warehouse.

Os locais, produtos e quantidades vendidas, pedidas pelo primeiro supervisor eram:

• Locais: Indaiatuba; Campinas; Jundiai; Bragança Paulista – a sede da empresa �ca em Valinhos.

• Produtos: (A) Xiomi; (B) Zenfone; (C) Iphone; (D) Sansung;

O relatório extraído do Data Warehouse descreveu os seguintes itens e seus valores:

• Para Indaiatuba vendeu-se, 250 unidades do produto A, 135 do produto B, 115 do produto C e 117 do

produto D.

• Para Campinas vendeu-se, 850 unidades do produto A, 435 do produto B, 315 do produto C e 317 do
produto D.

• Para Jundiai vendeu-se, 350 unidades do produto A, 235 do produto B, 215 do produto C e 417 do produto
D.

• Para Bragança Paulista vendeu-se, 150 unidades do produto A, 135 do produto B, 85 do produto C e 37 do
produto D.

Como você cruzaria esses Dados, criando um novo indicador Total de Vendas, produtos por local?

RESOLUÇÃO DO ESTUDO DE CASO

Diante dessa discussão, o resultado foi realizar os cruzamentos dos dados por intermédio de uma
representação multidimensional, de fácil manipulação, mostradas no Quadro 4 a seguir:

Quadro 4 | Cruzamento de Dados / Estudo de Caso

Produtos

Local Xiaomi Zenfone Iphone Samsung Total de Vendas

Indaiatuba 255 135 115 117 622

Campinas 850 435 315 317 1917

Jundiai 350 235 215 417 1217

Bragança Paulista 150 135 85 37 407

Fonte: adaptado de Vida (2021, p. 176).

Note que ao fazermos um cruzamento multidimensional, os supervisores terão os indicadores sobre os locais,

os produtos e as quantidades vendidas, assim, poderão ter uma informação mais rápida, com isso, as
tomadas de decisões �uirão mais assertivas para cada item rastreado.

 Saiba mais

20 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Para saber mais, sugere-se pesquisar, utilizando a seguinte bibliogra�a:

VIDA, E. S.; ALVES, Nicolli.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]:

Grupo A, 2021. 9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books


/9786556901916/.

Bons Estudos.

Para complementar nosso material, uma forma bem intuitiva de aprendizagem para resumir nosso material,
mostrado na Figura 4 a seguir:

Figura 4 | Ingestão de variedade de dados

Fonte: adaptada de Somasundaram e Shrivastava (2011)

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

Aula 4

ODS PARA DATA WAREHOUSE


Chegamos ao nosso primeiro bloco, onde evidencia-se “Mover dados de um ODS”, ou seja, mover dados
de um armazenador de dados, fato este, comum entre as empresas pois estamos na era da informação,
da big data, ciência de dados, onde busca-se receber os dados de maneira rápida e consistente, atualizá-
las se necessário para que os lideres corporativos.

16 minutos

INTRODUÇÃO

Olá Estudante!

Nesta aula que trata do assunto: ODS (Operational Data Store – Armazenamento de Dados Operacional) para

Data Warehouse, consiste em discutirmos sobre como as empresas estão se preparando para os diversos
tipos de armazenamentos de dados, ou seja, que tipo de ferramenta, software e ou pro�ssional o mercado

oferece para comporem a equipe que faz a gestão empresarial, dinâmica e e�ciente.

No primeiro bloco, o tema envolve sobre como mover os dados de um ODS, ou como é operacionalização de
um ODS que possui como ação, receber dados para armazena-los em sua área de dados operacionais, sendo

21 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

a última captura de dados operacionais do tipo relacional. Em seu segundo bloco, como consultar dados por

intermédio da SQL (Standard Query Language – linguagem de consulta padrão), concluindo com o terceiro

bloco sobre como construir relatórios, utilizando armazenadores de dados.

MOVER DADOS DE UM ODS

Olá Estudante!

Chegamos ao nosso primeiro bloco, onde evidencia-se “Mover dados de um ODS”, ou seja, mover dados de

um armazenador de dados, fato este, comum entre as empresas pois estamos na era da informação, da big
data, ciência de dados, onde busca-se receber os dados de maneira rápida e consistente, atualizá-las se
necessário para que os lideres corporativos.

Segundo Sarkis (2001, p. 33), O Armazenamento de Dados Operacionais ODS (Operational Data Store),
constitui a base do processamento informacional operacional, e seu uso destina-se aos gerentes que

precisam tomar decisões instantâneas, ou seja, é um repositório onde estão armazenados, dados que podem
ser atualizados, devido a isso, os administradores possuem uma visão coletiva operacional desta informação.

Observe na Figura 1 o posicionamento estratégico do ODS relacionado ao trafego de dados:

Figura 1 | Armazenamento de Dados Operacionais – ODS

Fonte: adaptado de Vida (2017).

Note que a Figura 1 mostra o trafego dos dados que chegam por intermédio do processamento de transações

online – OLTP, chegam até a Staging Area (área de preparação dos dados), que antecedem o Armazenamento
de Dados Operacional – ODS, os dados ao chegarem no estágio do ODS, apesar de serem de diversas origens,

possibilita a integração destes dados, mantem-se o desempenho no momento de seu armazenamento,

mesmo fazendo uso da consulta, este desempenho mantem-se integro (SOMASUNDARAM E SHRIVASTAVA,
2011).

Na visão de Koball et al (2003), os tipos de usuários (consumidores) do ODS, pode-se citar dois tipos ou

categorias: Usuários Principais– este tipo de usuário conhece sobre o assunto que está procurando,
desenvolve trabalhos rotineiros setoriais e outro tipo de categorização são os Usuários Secundários ou tipos

de usuários que não sabem o que estão pesquisando, porem �cam atentos aos padrões e seus
relacionamentos não usuais.

22 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Segundo Victor (2017), pode-se mover dados de um ODS para outros sistemas por intermédio de duas

situações: a primeira situação é pela pessoa ou administrador destes dados que consegue inseri-los

diretamente no SGBD ou Sistema de Gerenciamento de Banco de Dados, organizados. Já a segunda situação


que é pelo computador, ou por um sistema que move diretamente os dados sem o acompanhamento da
pessoa, estes dados podem chegar até o Banco de Dados, mal organizados, sendo necessário em alguns

casos a reformulação de alguns processos de dados pelo administrador ao se deparar com estes dados
menos organizados.

Na visão de Sarkis (2001), existem tipos de ODS, vamos analisa-los no Quadro 1 a seguir:

Quadro 1 | Tipos de ODS

1. ODS Pode-se copiar tabelas em uma determinada base de dados, porém, não possui integração
classe 0 de dados, seu ciclo de dados é curto.

2. ODS Os dados são direcionados para o ODS em atacado, as transações são executadas no

classe I ambiente operacional, depois segue para o ODS, também os dados não são integrados, nem
acertados para seguirem para o DW.

3. ODS Os dados são integrados, porem ocorrem um certo atraso para chegarem até o ODS, de
classe II ou difícil construção devido aos softwares de integração, como vantagem, os dados chegam
III ajustados no DW.

4. ODS IV De fácil construir, desde que o DW esteja construído e preparado para receber os dados do
ODS IV, este ODS é suprido por dados analíticos extraídos do DW pelo analista para serem

inseridos neste ODS.

Fonte: adaptado de Sarkis (2001).

Estas categorizações ajudam aos analistas se combinadas as classes ao armazenamento de dados de forma
integrada e que resulta em processos e indicadores satisfatórios para o trafego de dados das empresas.

VIDEOAULA: MOVER DADOS DE UM ODS

Olá Estudante!

Este vídeo trata do assunto mover dados de um armazenador de dados operacional, ou seja, qual o conceito

de um ODS, de onde vem os dados e como é direcionado estes dados para o Data Warehouse. Quais são os
tipos de usuários que direcionam dados para o ODS e como é movido estes dados para o DW.

Videoaula: Mover dados de um ODS

Para visualizar o objeto, acesse seu material digital.

CONSULTAS USANDO SQL

Olá Estudante

Neste segundo bloco, foi evidenciado sobre “Consultas usando SQL”, ou seja, o usuário de muitas empresas

de diversos segmentos que necessitem trabalhar com dados de uma forma segura e e�ciente, estruturada e

23 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

ágil em suas transações internas ou externas, por isso, que muitas, milhares destas empresas optam pela

linguagem SQL, por oferecer todos estes atributos.

Segundo Nield (2016), a sigla SQL (Structure Query Language ou Linguagem de Consulta Estruturada, é uma
linguagem para consulta de dados relacionais, nasceu por volta da década de 70, desenvolvida pela empresa
IBM, que tinha como conceito, mostrar a implementação do modelo entidade – relacionamento proposto até

então por E. F. Codd (matemático britânico).

A linguagem SQL, na visão de Taylor (2016), é utilizada para fazer buscas e extrações de dados de um

determinado SGBD, a �m de suprir o usuário de informações necessárias para conclusão de suas tarefas

rotineiras. Nield (2016), alerta para o momento de estar fazendo a busca destas informações, para não
comprometer ou mudar algum comando que mudaria os dados relacionais do banco de dados.

Segundo Nield (2016), o comando SELECT é um dos mais importantes quando se utiliza a linguagem SQL, em

se tratando de consultar algum tipo de dado ou extrair algumas informações, vamos acompanhar no Quadro
2 a seguir algumas funcionalidades que acompanham o comando SELECT:

Quadro 2 | Funcionalidades do Comando SELECT

1. SELECT simples Recupera dados de um objeto do BD, como por exemplo uma tabela.

2. Comando Where Sua funcionalidade é permitir condições de �ltragem de dados.

3. Comando Order Utiliza o comando ORDER BY para ordenação de dados.

4. Junção de Tabelas Sua funcionalidade é permitir que duas ou mais tabelas sejam unidas.

5. Comando Join Pode-se unir tabelas com este comando, porem deve-se utilizar a palavra

reservada JOIN

6. Comando FULL OUTER Pode-se combinar INNER e OUTER.


JOIN

7. UNION Segunda forma de junção de tabelas com este comando.

8. AGRUPAMENTO Utiliza-se o parâmetro GROUP BY, retorna informações que estavam


agrupadas.

9. HAVING Pode-se aplicar o �ltro na funcionalidade GROUP BY.

Fonte: adaptado de Nield (2016).

Segundo Nield (2016), pode-se aplicar na consulta de dados uma in�nidade de recursos para tornar sua

consulta as informações, mais e�cientes, dinâmicas para satisfazer as necessidades de cada empresa. Vamos
a alguns exemplos de consultas a informações aplicando alguns comandos do Quadro 2:

1 | SELECT CODIGO, NOME FROM FORNECEDOR

2 | SELECT * FROM FORNECEDORES // Um Detalhe sobre este pequeno código é o asterisco

que é a representatividade de todos os campos envolvidos na produção deste pequeno


código.

Vamos a um segundo exemplo, utilizando a função WHERE:

1| SELECT CODIGO, NOME FROM FORNECEDORES

24 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

2| WHERE CODIGO = 05

3| SELECT CODIGO, NOME FROM FORNECEDORES

4| WHERE UF = ‘PR’

5| SELECT CODIGO, NOME FROM FORNECEDORES

6| WHERE CODIGO >= 50 AND CODIGO <= 250

7| SELECT CODIGO, NOME FROM FORNECEDORES

8| WHERE UF = ‘SC’ OR UF = ‘RS’

Estes são exemplos de consultas usando alguns comandos SQL, sabendo que existem muitos destes

comandos disponíveis para serem utilizados. Fica o convite para você acessar e se aprofundar um pouco mais
sobre este assunto.

Bons estudos!

VIDEOAULA: CONSULTAS USANDO SQL

Olá Estudante!

Neste vídeo aborda-se o assunto “Consultas usando SQL”, começamos com o conceito, seu surgimento e o
responsável pelo surgimento por esta linguagem de consulta estruturada. Entender o porquê de ser uma das
linguagens mais utilizadas no mundo, seus principais comandos de consultas.

Videoaula: Consultas usando SQL

Para visualizar o objeto, acesse seu material digital.

CONSTRUIR RELATÓRIOS

Olá Estudante!

Estamos concluindo mais uma aula, sobre “ODS para Data Warehouse”, com ênfase neste terceiro bloco,
“Construir Relatórios”, se observarmos o peso que tem essas palavras, “Construir” e “Relatórios, ambas são

muito importantes para o cotidiano das empresas, seja governamental ou privada, a construção de relatórios

tornou-se um fator indispensável pelas empresas, pois, a competitividade de mercado, exige tomadas de
decisões corretas, assertivas, para que os supervisores, gerentes ou diretores possam ter esse suporte nos

momentos mais difíceis de sua caminhada empresarial.

Segundo Damas (2007), o usuário pode criar diversos tipos de relatórios gerados de uma base de dados, seja
ela, uma planilha simples ou complexa, assim como um banco de dado mais simples como o Microsoft Access

ou nomes conhecidos do mercado pela sua robustez e capacidade de armazenamento, importação e


exportação de dados como o Oracle, SQL Server, MySQL, PostgreSQL, MongoDB. Independente da marca ou

valor de mercado, o que importa é proporcionar as empresas, armazenamentos con�áveis, facilidade em sua

usabilidade, assim como importação e exportação de dados para que se possa gerar relatórios condizentes

com as necessidades dessa empresa.

Na visão de Cardoso (2009), estas ferramentas citadas os BD’s em especi�co a linguagem SQL (assunto de

nosso segundo bloco) se transformam em grandes gerados de relatórios, com o intuito de proporcionar ao

25 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

usuário departamental, dados que se transformam em indicadores oriundos de relatórios que especi�cam

detalhes, números, nomes, códigos que são a base para os gestores em sua tomada de decisão. Damas (2007)

nos mostra algumas vantagens, com relação aos relatórios gerados de bancos de dados como o SQL, analise o
Quadro 3 a seguir:

Quadro 3 | Vantagens de relatórios gerados de BD’s

1. Visão decisiva dos Um BD pode armazenar desde a planta (layout) até os itens de menor e maior

projetos relevância na gestão de um projeto.

2. Importação de A importação de dados para relatórios não se restringe a ambientes de redes


Dados internas, mas sim, pode-se utilizar as redes para importação de dados com
extensões diversi�cadas com XML, HTML, ferramentas como Power BI se

destacam nesta vantagem.

3. Sua empresa com Os grandes bancos de dados podem se comunicar entre empresas, matriz e

maior mobilidade e �lial, empresa – cliente; empresa fornecedores, a comunicação �ui com maior
�exibilidade integrada nas informações.

4. Dados Brutos em Os BD’s conseguem em sua performance, receber dados brutos, oriundos de
Dados Analíticos diversas origens, estes dados tornam-se organizados, para depois, gerarem

informações analíticas que serão preponderantes para tomada de decisões


departamentais e corporativas.

5. Segurança e controle As novas versões de banco de dados como SQL, buscam soluções e atualizações
na geração de dados constantemente contra invasores indesejados que põem em risco a integridade

dos dados.

Fonte: adaptado de Damas (2007).

Vamos a um exemplo prático da interface um Banco de Dados SQL, analise a Figura 2 a seguir:

Figura 2 | Interface de um BD SQL

Fonte: Wikipedia Commons.

A Figura 2 mostra uma interface do Banco de Dados SQL, observe a quantidade de tabelas que possibilitam ao

usuário uma imensidão de relatórios, assim como os comandos que acompanham estas tabelas.

26 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

VIDEOAULA: CONSTRUIR RELATÓRIOS

Olá Estudante!

Este vídeo nos direciona a complementarmos algum ponto do material escrito que evidencia, “Construir

relatórios”, onde evidenciou-se o conceito e as vantagens de se gerar relatórios de banco de dados,

independentemente de sua marca ou valor, o importante é que seja consistente e integro no armazenamento,

gerenciamento e capacidade de se gerar relatórios importantes para tomada de decisões corporativas.

Videoaula: Construir relatórios

Para visualizar o objeto, acesse seu material digital.

ESTUDO DE CASO

Em uma empresa transportadora de diversos tipos de cargas, começou como toda empresa familiar, ou seja,
seus fundadores, pés do chão, porém, muito restritos a atualizações, mudanças e investimentos ferramentais.
Em uma das reuniões foram detectados diversos itens departamentais abaixo do esperado, a ferramenta

geradora de relatórios é o Microsoft Excel, que apesar de possuir muitos recursos, deixava a desejar aos
novos investimentos. Um dos colaboradores, perguntou, os itens de seu departamento estão muito ruins de
compreender, outro colaborador, teve um insight e proporcionou uma resposta ao colega. Além de quase

obsoleto, você não teve treinamento na tarefa.

Seu objetivo como Arquiteto de Dados, poderia produzir uma melhoria no armazenamento, importação e
exportação de dados neste caso, seguindo os seguintes requisitos:

• Sanar os problemas de abrangência de dados.

• Monitorar as melhorias que acresceram nos últimos dias.

• Veri�car a necessidade de novos indicadores.

RESOLUÇÃO DO ESTUDO DE CASO

Depois de analisarem muito as propostas das empresas, um consultor, levou até essa empresa a melhor

solução, a implantação de um Banco de Dados SQL, depois de implantada e os colaboradores devidamente


treinados na tarefa, vamos as vantagens da empresa com a nova ferramenta:

• Aumentou a abrangência no trafego da informação.

• Permitiu uma maior importação e exportação de dados.

• Melhorou a mobilidade e �exibilidade.

• Surgiram os indicadores analíticos.

• Pode-se gerar relatórios com maior con�ança.

 Saiba mais

Olá Estudante!

27 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

Este vídeo nos traz um complemento sobre ODS e Data Warehouse:

Disponível em: https://www.youtube.com/watch?v=xLlCKS8IRMA&ab_channel=TIFLIX.

Quer saber mais sobre SQL e relatórios:

TAYLOR, A. G. SQL Para Leigos. Brasil, Alta Books Editora, 2016.

VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A,
2021. 9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books

/9786556901916/. Acesso em: 11 dez. 2021.

Olá Estudante!

Acompanhe o material complementar para a disciplina ODS para Data Warehouse, conforme a Figura 3 a

seguir:

Figura 3 | ODS para Data Warehouse

Fonte: ellaborada pelo autor.

Resolução do Estudo de Caso

Para visualizar o objeto, acesse seu material digital.

28 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

REFERÊNCIAS
8 minutos

Aula 1

CURY, T. E.; BARRETO, J. S.; SARAIVA, M. O.; AL., Et. Estrutura de Dados. [Digite o Local da Editora]: Grupo A,
2018. 9788595024328. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788595024328/.

Acesso em: 14 de nov. 2021.

EDELWEISS, N.; GALANTE, R. Estruturas de Dados - V18 - UFRGS. [Digite o Local da Editora]: Grupo A, 2011.

9788577804504. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788577804504/. Acesso

em: 15 dez. 2021.

PINTO, R, A. et al. Estrutura de dados. Disponível em: Minha Biblioteca, Grupo A, 2020.

SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de Informações.


[Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:

https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 14 de nov. 2021.

Aula 2

ALVES, W. P. Banco de dados. São Paulo: Erica, 2014.

KOBALL, A. et al. Informática na Educação Baseado em Data Warehouse com Aplicação na Gestão Ambiental.
Anais do V Encontro de Estudantes de Informática do Tocantins. Palmas, TO. outubro, 2003. pp. 131-138.

MACHADO, A. L. Administração do Big Data. Editora Senac São Paulo. 2017.

SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de Informações.


[Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:
https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 12 dez. 2021.

VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A, 2021.

9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786556901916/. Acesso

em: 11 dez. 2021.

VICTOR, D. Tecnologia da Informação com ênfase em BI. Gestão Tributária. 2017.

Aula 3

BELUZZO, C. R. B. Novas condutas de gestão de serviços de informação. São Paulo: USP/SINi, 2003.

CAMPELLO, B.; CALDEIRA, P. T. Introdução às fontes de informação. [Digite o Local da Editora]: Grupo

Autêntica, 2007. 9788582179611. Disponível em: https://integrada.minhabiblioteca.com.br/#/books

/9788582179611/. Acesso em: 20 dez. 2022.

CUNHA, M. B. Para saber Mais: fontes de informação em ciência e tecnologia. Brasília: Briquet de Lemos, 2001.

29 of 30 27/03/2022 09:14
wlldd_212_u3_arq_dad https://conteudo.colaboraread.com.br/202201/EAD/ARQUITETURA_DE_DADOS...

FAVERO, L. P. Manual de Análise de Dados - Estatística e Modelagem Multivariada com Excel®, SPSS® e

Stata®. Editora : GEN LTC; 1ª edição. 2017.

LE COADIC, Y. A ciência da informação. Brasília: Briquet de Lemos, 1996.

SOMASUNDARAM, G.; SHRIVASTAVA, 9A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de

Informações. [Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:

https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 01 jan. 2022.

VIDA, E. S.; ALVES, Nicolli.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A,

2021. 9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786556901916/.

Acesso em: 01 jan. 2022.

Aula 4

ALVES, W. P. Banco de dados. São Paulo: Erica, 2014.

CARDOSO, V. Linguagem SQL, fundamentos e práticas - 1ª edição . [Digite o Local da Editora]: Editora Saraiva,

2009. 9788502200463. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788502200463/.

Acesso em: 03 dez. 2022.

DAMAS, L. SQL - Structured Query Language, 6ª edição. [Digite o Local da Editora]: Grupo GEN, 2007.
9788521632450. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9788521632450/. Acesso

em: 03 dez. 2022.

KOBALL, A. et al. Informática na Educação Baseado em Data Warehouse com Aplicação na Gestão Ambiental.
Anais do V Encontro de Estudantes de Informática do Tocantins. Palmas, TO. outubro, 2003. pp. 131-138.

NIELD, T. Introdução à Linguagem SQL: Abordagem prática para iniciantes. (2016). Brasil: Novatec Editora.

MACHADO, A. L. Administração do Big Data. Editora Senac São Paulo. 2017.

SARKIS, L. C. Data Warehouse: o Processo de Migração de Dados. Dissertação (Mestrado em Ciência da

Computação – Universidade Federal de Santa Catarina. Santa Catarina, p. 142. 2001.

SOMASUNDARAM, G.; SHRIVASTAVA, A.; SERVIÇOS, EMC. E. Armazenamento e Gerenciamento de Informações.

[Digite o Local da Editora]: Grupo A, 2011. 9788577807642. Disponível em:

https://integrada.minhabiblioteca.com.br/#/books/9788577807642/. Acesso em: 12 dez. 2021.

TAYLOR, A. G. SQL Para Leigos. Brasil, Alta Books Editora, 2016.

VIDA, E. S.; ALVES, N.SR; FERREIRA, R. GC; AL., Et. Armazém de dados. [Digite o Local da Editora]: Grupo A, 2021.
9786556901916. Disponível em: https://integrada.minhabiblioteca.com.br/#/books/9786556901916/. Acesso
em: 11 dez. 2021.

VICTOR, D. Tecnologia da Informação com ênfase em BI. Gestão Tributária. 2017.

WIKILIVROS. SQL/Linguagem de consulta de dados. Disponível em:< https://pt.wikibooks.org/wiki/SQL

/Linguagem_de_consulta_de_dados>. Acesso em: 12 de dez. 2013.

30 of 30 27/03/2022 09:14

Você também pode gostar