Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Roteiro de
Estudos
Autor: Me. Jackson Luis Schirigatti
Revisor: Douglas Melman
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 1/18
21/03/2022 20:30 Roteiro de Estudos
Introdução
Atualmente, os sistemas computacionais têm a finalidade de assegurar que todas as
informações imputadas, em transações ou em concorrência, devem ser armazenadas com
segurança, em termos de confiabilidade, integridade e eficiência.
Existem dois tipos de arquitetura de dados e cada qual tem a sua aplicabilidade. A arquitetura
de dados mais estruturada está relacionada às aplicações operacionais e transacionais de uma
organização. Já dentro de uma arquitetura de dados multidimensional semiestruturada e não
estruturada, as aplicações dizem respeito à descoberta de inteligência de diversas fontes para a
tomada de decisão gerencial e estratégica.
Contudo, é de responsabilidade do gestor de TI a escolha por sistemas de banco de dados
consistentes, seguros e eficientes. Já a sua programação, para a manipulação coerente dos
dados, é de responsabilidade do analista ou administrador de sistemas e banco de dados.
Portanto, conhecer os conceitos, características e as diversas técnicas, para gerenciar dados
estruturados, semi e não estruturados, para as suas aplicações organizacionais, são de grande
importância para estes profissionais.
Compreenderemos, além dos conceitos de arquiteturas de dados estruturados, por meio dos
princípios de gerenciamento de banco de dados relacionais e da linguagem SQL, os conceitos
de arquitetura de dados não-estruturados, pelas linguagens NoSQL. Veremos também os
conceitos das bases multidimensionais (data warehouse e data marts) e o uso da inteligência
artificial, especificamente, relacionado à mineração de dados.
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 2/18
21/03/2022 20:30 Roteiro de Estudos
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 3/18
21/03/2022 20:30 Roteiro de Estudos
LIVRO
Estruturas de Dados
Autor: Nina Edelweiss e Renata Galante
Editora: Grupo A
Ano: 2011
Comentário: a obra é resultado da experiência das autoras em
sala de aula. O título apresenta uma base para o ensino das
estruturas de dados “listas” e “árvores”, conforme proposto no
currículo de referência da Sociedade Brasileira de Computação.
O livro tem linguagem didática e acessível, com temática atual e
relevante.
Arquitetura de Dados
Estruturados: Banco de Dados
Relacionais e os Princípios da
Linguagem SQL
Para obter uma melhor eficiência nos projetos de banco de dados, tanto na questão de
otimização de consultas como no acesso aos dados, é necessário compreender a arquitetura
interna do gerenciador de banco de dados, indexação de tabelas, estruturas de
armazenamento, controle de concorrência e a recuperação de falhas. Silberschatz, Korth e
Sudarshan (2006) comentam que os sistemas de banco de dados são projetados para gerenciar
grandes blocos de informação. Para gerenciar tal quantidade de informação, é necessário
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 4/18
21/03/2022 20:30 Roteiro de Estudos
Na Figura 1, após a requisição do usuário por uma consulta de relatório de clientes por meio de
uma aplicação específica, veja que o serviço irá utilizar o processador de DQL (linguagem de
consultas de dados), verificando a sintaxe, inspecionando os esquemas da base de dados,
executando a instrução SQL e retornando ao usuário as informações solicitadas.
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 5/18
21/03/2022 20:30 Roteiro de Estudos
A estrutura de gerenciamento de banco de dados é formada por uma série de objetos, como
compiladores, mecanismos de avaliação, gerenciadores, dicionários de dados, arquivos,
registros, campos e índices. A maioria dos bancos de dados da atualidade são modelos
relacionais, projetados com a sub linguagem DML (Linguagem de Manipulação de Dados) e DDL
(Linguagem de Definição de Dados) nos seus SGDs (Sistemas Gerenciadores de Banco de
Dados). Já uma estrutura de Sistema de Banco de Dados é mais ampla e é composta de três
camadas de acesso e de processamento de dados, como: 1. Processador de consulta; 2.
Gerenciador de armazenamento; e 3. Armazenamento em disco, como ilustra a Figura 2, a
seguir:
A linguagem SQL (Structured Query Language) foi desenvolvida pela IBM, na década de 1970,
para implementações em modelos relacionais, tornando-se padrão, desde 1986, quando a ANSI
(American National Standards Institute) endossou a SQL como linguagem padrão para os
bancos de dados relacionais. Essa poderosa linguagem é utilizada para consultar, criar tabelas,
inserir, excluir e alterar dados em um banco de dados. A SQL é uma linguagem declarativa, ou
seja, ela permite definir metadados (DDL - Linguagem de definição de dados), manipular dados
(DML - Linguagem de manipulação de dados) e definir comandos para a segurança e
integridade dos dados (DCL - Linguagem de controle de dados). O usuário, pelos comandos
SQL, consegue montar consultas complexas e poderosas sem criar um código de programação
(CARDOSO; CARDOSO, 2012).
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 6/18
21/03/2022 20:30 Roteiro de Estudos
LIVRO
[...] o termo NoSQL é geralmente interpretado como Not Only SQL [...] e tem
como finalidade transmitir a ideia de que muitas aplicações precisam de
sistemas diferentes dos sistemas SQL relacionais tradicionais para ampliar suas
necessidades de gerenciamento de dados. A maioria dos sistemas NoSQL são
bancos de dados distribuídos ou sistemas de armazenamento distribuído com
foco no armazenamento de dados semiestruturados, alto desempenho,
disponibilidade e replicação de dados, e escalabilidade, ao contrário da ênfase
em consistência imediata de dados, linguagens de consultas poderosas [Caso
da SQL] e armazenamento de dados estruturados.
Os sistemas big data utilizam NoSQL e possuem características denominadas 3V, volume,
velocidade e variedade de dados. O que difere um sistema de dados data warehouse, data
mining e big data é a sua organização, arquitetura e volume de seus dados.
Em um sistema de banco de dados do tipo big data, o armazenamento é realizado a partir de
um grande volume de dados não estruturados ou semiestruturados. Já no data mining e no
data warehouse, o armazenamento, em volume menor, é feito a partir de bases estruturadas,
semiestruturadas e não estruturadas.
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 8/18
21/03/2022 20:30 Roteiro de Estudos
LIVRO
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&cd… 9/18
21/03/2022 20:30 Roteiro de Estudos
LIVRO
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 10/18
21/03/2022 20:30 Roteiro de Estudos
As fontes de bases de dados do data warehouse são bases transacionais e operacionais internas
e externas (OLTP – Online Transaction Processing ou processamento de transações em tempo
real, que incluem inserções, atualizações e exclusões, além de requisitos de consultas), que
correspondem às informações das diversas áreas organizacionais internas, como marketing,
vendas, estoque, faturamento. E as bases externas são as que contêm informações sobre a
concorrência, do negócio e setor, análise do mercado de ações etc. Para Alves (2018, p. 132), “o
DW armazena e combina estes dados, gerando algumas informações e ferramentas, por
exemplo, para consultas de informações e relatórios de diversos tipos, oferecendo uma visão
multidimensional da empresa”. As informações destas bases de dados passam por um
processo de extração, transformação e carregamento (ETL – Extraction, Transformation, and
Loading) e são armazenadas para dentro de um armazém de dados, como ilustra a Figura 3,
abaixo, representando um data warehouse. O data warehouse surgiu, na década de 1980, por
meio de um conceito acadêmico, para suprir a deficiência dos sistemas transacionais e
operacionais OLTP, ao realizar as tarefas de análise com tarefas de relatórios consolidados.
Hoje, o data warehouse faz parte de uma das principais soluções de business intelligence do
mercado.
Observe, na Figura 3, que todas as bases transacionais internas e externas passam por uma
extração de dados sendo consolidadas em um enorme cubo de dados (warehouse) e depois
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 11/18
21/03/2022 20:30 Roteiro de Estudos
em cubos menores (data marts). Estes cubos de dados possuem dimensões diferentes das
bases transacionais e operacionais. São bancos de dados multidimensionais. A dimensão de
um banco de dados é uma característica da informação. Cada camada de um data warehouse
ou data mart representa um tipo de informação. E o cubo é a representação da
multidimensionalidade dessas informações.
Observe também, na figura, que os cubos data marts são criados de forma personalizada, para
facilitar as extensivas pesquisas por assuntos específicos, como um data mart específico de
vendas com informações do mercado e da concorrência, ou um data mart de produção x
estoque x pedidos ou ainda um data mart de informações do mercado econômico-financeiro x
mercado de ações.
Para Alves (2018, p. 136), a “orientação por assunto é uma característica marcante de um DW,
pois toda modelagem é desenhada em torno dos principais assuntos da empresa. Já os
sistemas transacionais estão voltados para processos e aplicações específicas”.
Já a ferramenta OLAP (On-Line Analytical Processing, processamento analítico on-line, em
português) realiza análises que requerem um maior armazenamento e processamento.
A estrutura multidimensional facilita a pesquisa para a geração de relatórios e gráficos
sumarizados e de forma analítica, dependendo dos recursos da ferramenta de leitura do cubo.
Após a criação do cubo data mart, os usuários, por aplicativos específicos de leitura, podem
destrinchar e detalhar as informações por meio da adição de dimensões, cruzando-as para
visualização. Esse procedimento é denominado de análise multidimensional. O diagrama da
Figura 4, abaixo, ilustra um cubo representando as três dimensões de informações (produto x
cliente x região). Mas a representação na prática da multidimensionalidade é infinita.
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 12/18
21/03/2022 20:30 Roteiro de Estudos
Com o cubo de vendas com várias dimensões inter-relacionadas, é possível verificar quais
foram os produtos vendidos, em determinada região, por clientes específicos. Uma possível
tomada de decisão seria a atuação de uma maior força de vendas para as regiões de menor
venda ou efetuar ainda um marketing mais agressivo para estes determinados clientes ou
regiões. Se acrescentarmos uma nova dimensão ao cubo, por exemplo, “contas a receber” da
base financeira, rodando o extrator de dados, migra-se, assim, dados do data warehouse e gera-
se um novo data mart (produtos x clientes x região x contas a receber). Por meio da adição
dessa nova dimensão ao data mart, é possível detalhar qual a razão de possíveis inadimplências
de clientes, mesmo que tenham uma alta quantidade de pedidos fechados (alta quantidade de
vendas). A análise pelo cruzamento das informações com um data mart se torna mais rica e
rápida para a tomada de decisão. Em um DW ou DM (data mart), “as informações fornecem
padrões consistentes, gerando, assim, relacionamentos informacionais correlacionados e
transformando a informação em nova informação” (ALVES, 2018, p. 136). Com estas
ferramentas de business intelligence, dos modelos de data warehouse e de data mart são
reduzidas as customizações de programas específicos para a criação de relatórios a partir das
bases transacionais e operacionais. Reduzem também o tempo de extração de dados das
bases, evitando a elaboração de planos de otimização de índices e estudo de recuperação de
dados.
Explore mais o assunto sobre análise multidimensional nas recomendações a seguir.
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 13/18
21/03/2022 20:30 Roteiro de Estudos
LIVRO
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 14/18
21/03/2022 20:30 Roteiro de Estudos
A mineração de dados pode levar a uma capacidade preditiva e analítica poderosa de dados. As
funcionalidades da mineração de dados são usadas para especificar os tipos de informação nas
tarefas descritivas e preditivas. As tarefas descritivas caracterizam as propriedades gerais dos
dados, já as preditivas fazem inferência a partir dos dados, objetivando predições. Para
encontrar informações necessárias em uma base de dados, é preciso chegar a uma análise
descritiva ou agrupamento. Já para uma descoberta de conhecimento, é necessário fazer com
que o algoritmo aprenda de acordo com o seu desempenho (classificando, estimando ou
associando dados). Um exemplo de uso de predição ou classificação é a tarefa realizada através
de árvore de decisão, como no caso de uma financeira de cartão que concederá ou não o
crédito a uma pessoa ou empresa.
É possível dividir uma mineração de dados em uma sequência de etapas para a descoberta do
conhecimento:
As ferramentas de inteligência nos negócios (BI - business intelligence), como o data mining, é um
dos principais subsídios da inteligência competitiva organizacional.
Segundo Sferra e Corrêa (2003, p. 136) citados por Alves (2018, p. 136), o data mining, também
conhecido como mineração de dados,
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 15/18
21/03/2022 20:30 Roteiro de Estudos
LIVRO
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 16/18
21/03/2022 20:30 Roteiro de Estudos
Conclusão
A compreensão da arquitetura de dados estruturados, não estruturados e suas
particularidades híbridas fazem dos analistas, preparadores de dados e gestores, importantes
articuladores coadjuvantes da estratégia organizacional. Por isso, os profissionais de tecnologia
devem entender que os sistemas da atualidade necessitam de um armazenamento adaptável,
advindo de diversas fontes de dados, de forma segura, confiável, íntegra e eficiente.
Vimos que este armazenamento adaptável dentro das organizações pode ser constituído de
um conjunto de ferramentas de recuperação e armazenamento de informações operacionais,
táticas e estratégicas. As informações operacionais são atendidas pelas arquiteturas de dados
mais estruturados como as bases transacionais e relacionais. Já as informações táticas e
estratégicas são atendidas pelas arquiteturas de dados semi e não estruturados, como as
bases multidimensionais e as NoSQL.
Referências Bibliográficas
ALEXANDRE, J.; CAVIQUE, L. NoSQL no suporte à análise de grande volume de dados. Revista
de Ciências da Computação, n. 8, 2013. Disponível em:
https://core.ac.uk/download/pdf/61423439.pdf. Acesso em: 21 mar. 2019.
ALVES, E. B. Sistemas de informações em marketing: uma visão 360º das informações
mercadológicas. Curitiba: InterSaberes, 2018.
CARDOSO, V.; CARDOSO, G. Sistema de banco de dados. São Paulo: Saraiva, 2012.
CASTRO, L. N.; FERRARI, D. G. Introdução à mineração de dados: conceitos básicos, algoritmos
e aplicações. São Paulo: Saraiva, 2016.
DATE, C. J. Introdução a Sistemas de Bancos de Dados. 8. ed. Rio de Janeiro: Elsevier, 2003.
EDELWEISS, N.; GALANTE, R. Estruturas de Dados. São Paulo: Grupo A, 2011. v. 18. (Minha
Biblioteca).
ELMASRI, R.; NAVATHE, S. B. Sistemas de banco de dados. 7. ed. São Paulo: Pearson Education
do Brasil, 2018.
FEITOSA, M. P. Fundamento de banco de dados: uma abordagem prático-didática. São Paulo:
Edição do autor, 2013.
GRAVES, M. Projeto de banco de dados com XML. São Paulo: Pearson Education do Brasil,
2003.
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 17/18
21/03/2022 20:30 Roteiro de Estudos
https://student.ulife.com.br/ContentPlayer/Index?lc=UyCTnnuNr00KJeNMo%2bM0YA%3d%3d&l=O2s3F2QUtdRZBIkEgY3p%2bQ%3d%3d&c… 18/18