Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Em um cenário hipercompetitivo, é necessário que os gestores sejam assertivos nas tomada de decisões
operacionais, táticas e estratégicas. Em contrapartida, a tecnologia da informação deve estar preparada, para
atender a organização por meio de métodos e ferramentas tecnológicas, apoiando os gestores de forma a
obterem informação inteligente. Nesse sentido, é necessário compreender os conceitos de arquitetura de
dados estruturados e não estruturados. Dentro da arquitetura de dados estruturados, veremos os conceitos
de sistemas de bancos de dados transacionais e operacionais, especícos para a tomada de decisão
operacional e tática. Na arquitetura não estruturada, veremos os conceitos e ferramentas para manipulação
de dados multidimensionais, especícos para a tomada de decisão tática e estratégica.
Caro(a) estudante, ao ler este roteiro, você vai:
compreender os conceitos de arquitetura de dados estruturados e não estruturados; estudar
a arquitetura de dados estruturados: os banco de dados relacionais e os princípios da
linguagem SQL; compreender a arquitetura de dados não estruturados: business intelligence e os
princípios da linguagem NoSQL;
compreender os conceitos das base multidimensionais: data warehouse e data marts; reetir sobre o uso da
inteligência articial e do data mining (mineração de dados).
Introdução
Atualmente, os sistemas computacionais têm a nalidade de assegurar que todas as informações imputadas,
em transações ou em concorrência, devem ser armazenadas com segurança, em termos de conabilidade,
integridade e eciência.
Existem dois tipos de arquitetura de dados e cada qual tem a sua aplicabilidade. A arquitetura de dados mais
estruturada está relacionada às aplicações operacionais e transacionais de uma organização. Já dentro de
uma arquitetura de dados multidimensional semiestruturada e não estruturada, as aplicações dizem respeito
à descoberta de inteligência de diversas fontes para a tomada de decisão gerencial e estratégica.
Contudo, é de responsabilidade do gestor de TI a escolha por sistemas de banco de dados consistentes,
seguros e ecientes. Já a sua programação, para a manipulação coerente dos dados, é de responsabilidade do
analista ou administrador de sistemas e banco de dados. Portanto, conhecer os conceitos, características e as
diversas técnicas, para gerenciar dados estruturados, semi e não estruturados, para as suas aplicações
organizacionais, são de grande importância para estes prossionais.
Compreenderemos, além dos conceitos de arquiteturas de dados estruturados, por meio dos princípios de
gerenciamento de banco de dados relacionais e da linguagem SQL, os conceitos de arquitetura de dados não-
estruturados, pelas linguagens NoSQL. Veremos também os conceitos das bases multidimensionais (data
warehouse e data marts) e o uso da inteligência articial, especicamente, relacionado à mineração de dados.
Conceitos de Dados Estruturados e não Estruturados
Atualmente, com a criação das mais diversas tecnologias móveis e web, houve uma necessidade do
desenvolvimento de novas estruturas de dados, mais ágeis e diversicadas, como as arquiteturas de dados
semiestruturados e não estruturados. Os dados estruturados em sistemas de bancos de dados relacionais e
transacionais, a rigor, seguem padrões normalizados para efetuarem os devidos relacionamentos. Já nos
modelos semi e não estruturados, devido a suas essências de aplicabilidade, não possuem uma normalização
ou padrão.
Os sistemas de bancos de dados relacionais seguem uma característica de relação entre tabelas formadas por
linhas (registros, objetos) e colunas (campos, atributos). Para Ramakrishnan e Gehrke (2011, p. 50, grifado),
“o principal construtor para representar dados no modelo relacional é a relação. Uma relação consiste em um
esquema de relação e em uma instância de relação”. A instância da relação se refere a uma tabela (no
paradigma relacional) ou classe (no paradigma orientado a objeto) que contém todos os registros de dados
ou uma coleção de objetos. Já o esquema de relação descreve o cabeçalho da tabela, ou seja, os campos da
tabela, ou atributos de uma classe ou também denominados de “colunas de uma tabela”. Uma tabela, para
Heuser (2004), é um conjunto ordenado de linhas, também chamadas de tuplas. Cada tupla é um registro de
dados. Um exemplo é uma tabela de funcionários de uma empresa (tabela Funcionario) em que cada linha ou
registro é composta de uma série de campos (ou atributo).
Já em nos modelos não estruturados e semiestruturados, podem ser classicados em chavevalor (key-value),
orientados a documentos (document), coluna familiar (column family) e banco triplo (triple). O tipo “chave-
valor”, segundo Rockenbach, Anderle, Griebler e Souza (2018) são aqueles bancos que possuem informações
associadas à respectiva chave. Muito utilizados em sistemas web e-commerce. No modelo orientado a
documentos, as informações são armazenadas em árvores tipo XML. Já em um modelo do tipo “colunas
familiares”, a estrutura é equivalente à tradicional, contudo, as informações são armazenadas em colunas em
vez de linhas. E, por m, no modelo banco triple, as informações são armazenadas em registros triplos: sujeito,
propriedade e relacionamento.
Na Figura 1, após a requisição do usuário por uma consulta de relatório de clientes por meio de uma
aplicação especíca, veja que o serviço irá utilizar o processador de DQL (linguagem de consultas de dados),
vericando a sintaxe, inspecionando os esquemas da base de dados, executando a instrução SQL e retornando
ao usuário as informações solicitadas.
A estrutura de gerenciamento de banco de dados é formada por uma série de objetos, como compiladores,
mecanismos de avaliação, gerenciadores, dicionários de dados, arquivos, registros, campos e índices. A
maioria dos bancos de dados da atualidade são modelos relacionais, projetados com a sub linguagem DML
(Linguagem de Manipulação de Dados) e DDL (Linguagem de Denição de Dados) nos seus SGDs (Sistemas
Gerenciadores de Banco de Dados). Já uma estrutura de Sistema de Banco de Dados é mais ampla e é
composta de três camadas de acesso e de processamento de dados, como: 1. Processador de consulta; 2.
Gerenciador de armazenamento; e 3. Armazenamento em disco, como ilustra a Figura 2, a seguir:
A linguagem SQL (Structured Query Language) foi desenvolvida pela IBM, na década de 1970, para
implementações em modelos relacionais, tornando-se padrão, desde 1986, quando a ANSI (American
National Standards Institute) endossou a SQL como linguagem padrão para os bancos de dados relacionais.
Essa poderosa linguagem é utilizada, para consultar, criar tabelas, inserir, excluir e alterar dados em um
banco de dados.
A SQL é uma linguagem declarativa, ou seja, ela permite denir metadados (DDL - Linguagem de denição de
dados), manipular dados (DML - Linguagem de manipulação de dados) e denir comandos para a segurança e
integridade dos dados (DCL - Linguagem de controle de dados). O usuário, pelos comandos SQL, consegue
montar consultas complexas e poderosas sem criar um código de programação (CARDOSO; CARDOSO, 2012).
Sistemas de banco de dados
Autor: Ramez Elmasri e Shamkant B. Navathe
Editora: Pearson Education do Brasil
Ano: 2018
[...] o termo NoSQL é geralmente interpretado como Not Only SQL [...] e tem como
nalidade transmitir a ideia de que muitas aplicações precisam de sistemas diferentes
dos sistemas SQL relacionais tradicionais para ampliar suas necessidade de
gerenciamento de dados. A maioria dos sistema NoSQL são bancos de dados
distribuídos ou sistemas de armazenamento distribuído com foco no armazenamento
de dados semiestruturados, alto desempenho, disponibilidade e replicação de dados, e
escalabilidade, ao contrário da ênfase em consistência imediata de dados, linguagens
de consultas poderosas [Caso da SQL] e armazenamento de dados estruturados.
Os sistemas big date utilizam NoSQL e possuem características denominadas 3V, volume, velocidade e
variedade de dados. O que difere um sistema de dados data warehouse, data mining e big data é a sua
organização, arquitetura e volume de seus dados.
Em um sistema de banco de dados do tipo big data, o armazenamento é realizado a partir de um grande
volume de dados não estruturados ou semiestruturados. Já no data mining e no data warehouse, o
armazenamento, em volume menor, é feito a partir de bases estruturadas, semiestruturadas e não
estruturadas.
NoSQL no suporte à análise de grande volume de dados
Autores: Joel Alexandre e Cavique Luís
Ano: 2013
Projeto de banco de dados com XML
Autor: Mark Graves
Editora: Pearson Education do Brasil
Ano: 2003
Figura 3 - Business intelligence por meio de um projeto de data warehouse Fonte: Elaborada pelo autor.
Descrição: os dados do data warehouse são coletados de bases transacionais pela ETL (extração,
transformação e leitura), após armazenados de forma catalogada no armazém de dados. O data warehouse
também podem gerar pequenos cubos de dados, os data marts.
Observe, na Figura 3, que todas as bases transacionais internas e externas passam por uma extração de dados
sendo consolidadas em um enorme cubo de dados (warehouse) e depois em cubos menores (data marts).
Estes cubos de dados possuem dimensões diferentes das bases transacionais e operacionais. São bancos de
dados multidimensionais. A dimensão de um banco de dados é uma característica da informação. Cada
camada de um data warehouse ou data mart representa um tipo de informação. E o cubo é a representação
da multidimensionalidade dessas informações.
Observe também, na gura, que os cubos data marts são criados de forma personalizada, para facilitar as
extensivas pesquisas por assuntos especícos, como um data mart especíco de vendas com informações do
mercado e da concorrência, ou um data mart de produção x estoque x pedidos ou ainda um data mart de
informações do mercado econômico-nanceiro x mercado de ações.
Para Alves (2018, p. 136), a “orientação por assunto é uma característica marcante de um DW, pois toda
modelagem é desenhada em torno dos principais assuntos da empresa. Já os sistemas transacionais estão
voltados para processos e aplicações especícas”.
A estrutura multidimensional facilita a pesquisa para a geração de relatórios e grácos sumarizados e de forma
analítica, dependendo dos recursos da ferramenta de leitura do cubo. Após a criação do cubo data mart, os
usuários, por aplicativos especícos de leitura, podem destrinchar e detalhar as informações por meio da
adição de dimensões, cruzando-as para visualização. Esse procedimento é denominado de análise
multidimensional. O diagrama da Figura 4, abaixo, ilustra um cubo representando as três dimensões de
informações (produto x cliente x região). Mas a representação na prática da multidimensionalidade é innita.
Figura 4 - Diagrama representando as três dimensões de um cubo de informação de vendas Fonte: Elaborada pelo autor.
[...] é uma tecnologia que emergiu da intersecção de três áreas: estatística clássica,
inteligência articial e aprendizado máquina, sendo a primeira mais antiga delas.
Observa-se que o Data Mining é parte de um processo conhecido como KDD
(Knowledge Discovery in DataBase) - em português: Descoberta do conhecimento em
base de dados.
O BI está relacionado a um processo de captura, processamento e análise de dados para a elaboração de
estratégias e tomada de decisão corporativa, podendo alcançar resultados surpreendentes na busca de
inteligência nos negócios.
Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações
Autor: Leandro Nunes de Castro e Daniel Gomes Ferrari
Editora: Saraiva
Ano: 2016
Conclusão
A compreensão da arquitetura de dados estruturados, não estruturados e suas particularidades híbridas
fazem dos analistas, preparadores de dados e gestores, importantes articuladores coadjuvantes da estratégia
organizacional. Por isso, os prossionais de tecnologia devem entender que os sistemas da atualidade
necessitam de um armazenamento adaptável, advindo de diversas fontes de dados, de forma segura,
conável, íntegra e eciente.
Vimos que este armazenamento adaptável dentro das organizações pode ser constituído de um conjunto de
ferramentas de recuperação e armazenamento de informações operacionais, táticas e estratégicas. As
informações operacionais são atendidas pelas arquiteturas de dados mais estruturados como as bases
transacionais e relacionais. Já as informações táticas e estratégicas são atendidas pelas arquiteturas de dados
semi e não estruturados, como as bases multidimensionais e as NoSQL.