Escolar Documentos
Profissional Documentos
Cultura Documentos
Roteiro de
Estudos
Estudos
Existem dois tipos de arquitetura de dados e cada qual tem a sua aplicabilidade. A arquitetura
de dados mais estruturada está relacionada às aplicações operacionais e transacionais de uma
organização. Já dentro de uma arquitetura de dados multidimensional semiestruturada e não
estruturada, as aplicações dizem respeito à descoberta de inteligência de diversas fontes para a
tomada de decisão gerencial e estratégica.
Compreenderemos, além dos conceitos de arquiteturas de dados estruturados, por meio dos
princípios de gerenciamento de banco de dados relacionais e da linguagem SQL, os conceitos
de arquitetura de dados não-estruturados, pelas linguagens NoSQL. Veremos também os
conceitos das bases multidimensionais (data warehouse e data marts) e o uso da inteligência
arti cial, especi camente, relacionado à mineração de dados.
Já em nos modelos não estruturados e semiestruturados, podem ser classi cados em chave-
valor (key-value), orientados a documentos (document), coluna familiar (column family) e banco
triplo (triple). O tipo “chave-valor”, segundo Rockenbach, Anderle, Griebler e Souza (2018) são
aqueles bancos que possuem informações associadas à respectiva chave. Muito utilizados em
sistemas web e-commerce. No modelo orientado a documentos, as informações são
armazenadas em árvores tipo XML. Já em um modelo do tipo “colunas familiares”, a estrutura é
equivalente à tradicional, contudo, as informações são armazenadas em colunas em vez de
linhas. E, por m, no modelo banco triple, as informações são armazenadas em registros
triplos: sujeito, propriedade e relacionamento.
LEITURA
ACESSAR
Arquitetura de Dados
Estruturados: Banco de Dados
Relacionais e os Princípios da
Linguagem SQL
Para obter uma melhor e ciência nos projetos de banco de dados, tanto na questão de
otimização de consultas como no acesso aos dados, é necessário compreender a arquitetura
interna do gerenciador de banco de dados, indexação de tabelas, estruturas de
armazenamento, controle de concorrência e a recuperação de falhas. Silberschatz, Korth e
Sudarshan (2006) comentam que os sistemas de banco de dados são projetados para gerenciar
grandes blocos de informação e para gerenciar tal quantidade de informação, é necessário
de nir estruturas para armazenamento de informação e fornecer mecanismo para
manipulação de informações.
O Sistema de Gerenciamento de Dados (SGBD), segundo Date (2003, p. 37), é um software que
trata de todo o acesso ao banco de dados. Conceitualmente, o SGBD realiza uma intercepção
de alguma solicitação advinda dos usuários pelas aplicações. Esse procedimento é realizado
por meio de alguma linguagem de manipulação de dados, como o SQL. Após a intercepção, o
SGBD inspeciona um esquema externo para este usuário (esquema conceitual), o mapeamento
conceitual interno e a de nição do banco de dados armazenado. Para Feitosa (2013, p. 73), o
SGBD é um software executado no nível de serviços, ou seja, um serviço é executado em
segundo plano (background), no qual aguarda requisições do programa/usuário. Para se
comunicar com o SGBD, é necessário construir uma aplicação que estabeleça conexões com
uma porta lógica e o SGBD. O fabricante dos SGBD devem fornecer aplicações com interfaces,
para realizar o gerenciamento do banco de dados. O SGBD recebe comando SQL por esta porta
lógica em uma cadeia de caracteres tipo string. Na sequência, o SGBD realiza a análise de
sintaxe desta cadeia de caracteres e o executa. O esquema abaixo ilustra as principais
funcionalidades de execução de um SGBD.
Figura 1 - Funcionalidade de um SGBD
Fonte: Elaborada pelo autor.
Na Figura 1, após a requisição do usuário por uma consulta de relatório de clientes por meio de
uma aplicação especí ca, veja que o serviço irá utilizar o processador de DQL (linguagem de
consultas de dados), veri cando a sintaxe, inspecionando os esquemas da base de dados,
executando a instrução SQL e retornando ao usuário as informações solicitadas.
A estrutura de gerenciamento de banco de dados é formada por uma série de objetos, como
compiladores, mecanismos de avaliação, gerenciadores, dicionários de dados, arquivos,
registros, campos e índices. A maioria dos bancos de dados da atualidade são modelos
relacionais, projetados com a sub linguagem DML (Linguagem de Manipulação de Dados) e DDL
(Linguagem de De nição de Dados) nos seus SGDs (Sistemas Gerenciadores de Banco de
Dados). Já uma estrutura de Sistema de Banco de Dados é mais ampla e é composta de três
camadas de acesso e de processamento de dados, como: 1. Processador de consulta; 2.
Gerenciador de armazenamento; e 3. Armazenamento em disco, como ilustra a Figura 2, a
seguir:
LEITURA
Outro grande armazém de dados não estruturados é o big data. Segundo Alexandre e Cavique
(2013, p. 38), “o NoSQL vem trazer solução para o grande volume de informação que é gerada e
tem que ser analisada e com a necessidade das organizações manterem a informação durante
um longo período de tempo, o Big Data”.
[...] o termo NoSQL é geralmente interpretado como Not Only SQL [...] e tem
como nalidade transmitir a ideia de que muitas aplicações precisam de
sistemas diferentes dos sistemas SQL relacionais tradicionais para ampliar suas
necessidade de gerenciamento de dados. A maioria dos sistema NoSQL são
bancos de dados distribuídos ou sistemas de armazenamento distribuído com
foco no armazenamento de dados semiestruturados, alto desempenho,
disponibilidade e replicação de dados, e escalabilidade, ao contrário da ênfase
em consistência imediata de dados, linguagens de consultas poderosas [Caso
da SQL] e armazenamento de dados estruturados.
Os sistemas big date utilizam NoSQL e possuem características denominadas 3V, volume,
velocidade e variedade de dados. O que difere um sistema de dados data warehouse, data
mining e big data é a sua organização, arquitetura e volume de seus dados.
LEITURA
ACESSAR
LEITURA
Descrição: os dados do data warehouse são coletados de bases transacionais pela ETL
(extração, transformação e leitura), após armazenados de forma catalogada no armazém de
dados. O data warehouse também podem gerar pequenos cubos de dados, os data marts.
Observe, na Figura 3, que todas as bases transacionais internas e externas passam por uma
extração de dados sendo consolidadas em um enorme cubo de dados (warehouse) e depois
em cubos menores (data marts). Estes cubos de dados possuem dimensões diferentes das
bases transacionais e operacionais. São bancos de dados multidimensionais. A dimensão de
um banco de dados é uma característica da informação. Cada camada de um data warehouse
ou data mart representa um tipo de informação. E o cubo é a representação da
multidimensionalidade dessas informações.
Observe também, na gura, que os cubos data marts são criados de forma personalizada, para
facilitar as extensivas pesquisas por assuntos especí cos, como um data mart especí co de
vendas com informações do mercado e da concorrência, ou um data mart de produção x
estoque x pedidos ou ainda um data mart de informações do mercado econômico- nanceiro x
mercado de ações.
Para Alves (2018, p. 136), a “orientação por assunto é uma característica marcante de um DW,
pois toda modelagem é desenhada em torno dos principais assuntos da empresa. Já os
sistemas transacionais estão voltados para processos e aplicações especí cas”.
Com o cubo de vendas com várias dimensões inter-relacionadas, é possível veri car quais
foram os produtos vendidos, em determinada região, por clientes especí cos. Uma possível
tomada de decisão seria a atuação de uma maior força de vendas para as regiões de menor
venda ou efetuar ainda um marketing mais agressivo para estes determinados clientes ou
regiões. Se acrescentarmos uma nova dimensão ao cubo, por exemplo, “contas a receber” da
base nanceira, rodando o extrator de dados, migra-se, assim, dados do data warehouse e gera-
se um novo data mart (produtos x clientes x região x contas a receber). Por meio da adição
dessa nova dimensão ao data mart, é possível detalhar qual a razão de possíveis inadimplências
de clientes, mesmo que tenham uma alta quantidade de pedidos fechados (alta quantidade de
vendas). A análise pelo cruzamento das informações com um data mart se torna mais rica e
rápida para a tomada de decisão. Em um DW ou DM (data mart), “as informações fornecem
padrões consistentes, gerando, assim, relacionamentos informacionais correlacionados e
transformando a informação em nova informação” (ALVES, 2018, p. 136). Com estas
ferramentas de business intelligence, dos modelos de data warehouse e de data mart são
reduzidas as customizações de programas especí cos para a criação de relatórios a partir das
bases transacionais e operacionais. Reduzem também o tempo de extração de dados das
bases, evitando a elaboração de planos de otimização de índices e estudo de recuperação de
dados.
LEITURA
A mineração de dados pode levar a uma capacidade preditiva e analítica poderosa de dados. As
funcionalidades da mineração de dados são usadas, para especi car os tipos de informações
nas tarefas descritivas e preditivas. As tarefas descritivas caracterizam as propriedades gerais
dos dados, já as preditivas fazem inferência a partir dos dados, objetivando predições. Para
encontrar informações necessárias em uma base de dados, é necessário se chegar a uma
análise descritiva ou agrupamento. Já para uma descoberta de conhecimento, é necessário
fazer com que o algoritmo aprenda de acordo com o seu desempenho (classi cando,
estimando ou associando dados).
É possível dividir uma mineração de dados em uma sequência de etapas para a descoberta do
conhecimento:
Segundo Sferra e Corrêa (2003, p. 136) citados por Alves (2018, p. 136), o data mining, também
conhecido como mineração de dados,
LEITURA
Vimos que este armazenamento adaptável dentro das organizações pode ser constituído de
um conjunto de ferramentas de recuperação e armazenamento de informações operacionais,
táticas e estratégicas. As informações operacionais são atendidas pelas arquiteturas de dados
mais estruturados como as bases transacionais e relacionais. Já as informações táticas e
estratégicas são atendidas pelas arquiteturas de dados semi e não estruturados, como as
bases multidimensionais e as NoSQL.
CARDOSO, V.; CARDOSO, G. Sistema de banco de dados. São Paulo: Saraiva, 2012.
DATE, C. J. Introdução a sistema de banco de dados. 8. ed. Rio de Janeiro: Elsevier, 2003.
ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. 7. ed. São Paulo: Pearson Education
do Brasil, 2018.
GRAVES, M. Projeto de banco de dados com XML. São Paulo: Pearson Education do Brasil,
2003.
SILBERSCHATZ, A.; KORTH, H. F.; SURDARSHAN, S. Sistemas de banco de dados. Rio de Janeiro:
Elsevier, 2006.