Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
de criar algum sentido e dar mais eficiência durante uma busca. Tem uma importância vital para
instituições que agregam quantidades massivas de informação e a mais de duas décadas se tornou a
principal peça nos sistemas de informação e segurança de dados. Os primeiros bancos de dados
surgiram em meados dos anos 70 como mainframes e desde então estão em constante necessidade
de mudanças e adaptações tendo em vista como a tecnologia avança junto com a quantidade de
informação que produzimos e processamos. Os bancos de dados acabam dependendo da capacidade
velocidade de transmissão e análise como por exemplo a evolução das fitas, discos rígidos e SSD, e da
quantidade de informação que geramos.
Os dados são meramente informações armazenadas em forma de código através de uma observação
e uma interpretação superficial de algum fenômeno ou objeto. Os tipos de dados representam. Os
bancos de dados tradicionais operam com basicamente três tipos de dados, sendo eles os numéricos,
data e hora e tipos literais (baseado no SQL). Cada tipo terá suas ramificações e peculiaridades,
entretanto atualmente temos dados diferentes que também precisam ser armazenados e
processados, como textos estruturados, imagens, áudio, vídeo, dados complexos (que não possuem
ponto de referência comparativa), genômico, espacial, dados que compõem algum objeto, e dentre
outros diversos que podem aparecer, adicionando novos tipos de dados nativos e permitir tipos
definidos pelo usuário (UDT).
Inicialmente os bancos de dados eram um tanto quanto limitados, entretanto ainda eram melhores
que arquivos físicos, principalmente no quesito de consultas, os dados presentes precisavam se
relacionar com outros elementos ou outras tabelas. O usuário do banco de dados é aquele que
simplesmente interage com o mesmo, direta ou indiretamente. Temos diversos tipos de usuários
sendo eles:
Cada usuário deverá seguir regras e limitações, o usuário final por exemplo vai acessar o banco
indiretamente por meio de aplicações e desconhece a existência do SGBD ele visualizara tudo por
meio de interfaces gráficas que digerem as informações para ele. Temos também os desenvolvedores
e usuários especializados que terão acesso pleno aos bancos, manipulando as informações na entrada
e na saída, irão produzir estruturas de organização e as aplicações para o usuário final. Temos um
meio de campo que entende dos conceitos e reconhece as nuances dos bancos de dados, mas não
irão manipula-los diretamente. E os administradores que cuidará da saúde dos dados fazendo com
que eles se relacionem da melhor maneira possível, determina o modo como as aplicações lida com
as informações e conhece a semântica dos dados.
O modelo de arquivos armazena os dados diretamente em arquivos organizados pelo tipo de uso,
possui dados redundantes, sem escalabilidade, Dependência entre aplicação e estrutura dos dados,
cada manipulação dependia de um programa (ou método) específico, segurança baixa e difícil
representação. O modelo de arquivos é limitado na questão de separação e isolamento dos dados,
gera dependência entre dados e programa, pode gerar incompatibilidade de formatos de arquivos, só
funciona a partir de consultas pré-determinadas. O modelo hierárquico define a organização e o
acesso aos dados e cada nó pode ter diversos filhos. O modelo de redes cada registro pode ter diversos
pais, é composto de conjuntos, cada conjunto tem registro dono e registro membro e um membro
pode ter diversos donos. O modelo relacional consiste na independência de dados com
implementação e armazenamento em hardware, navegação automática (alto nível) e linguagem não-
procedural. O modelo entidade relacionamento representa as informações como entidades que
representam entes do mundo real, e essas entidades se relacionam entre si. O modelo Orientado a
Objetos (seguindo o caminho da programação orientada a objetos) tinha grande expectativa que fosse
o modelo vigente atual mais usado e efetivo, entretanto os modelos se encontram estagnados a vários
anos, utiliza de classes, objetos, encapsulamento, relacionamento de herança, associação e possuem
polimorfismo. O modelo objeto-relacional funciona basicamente como uma extensão do modelo
tradicional SQL com algumas funções extras que permitem estender o banco de dados com tipos e
funções específicas da aplicação, incluem consultas envolvendo objetos, atributos multivalorados,
TADs, métodos e funções como predicados de busca em uma consulta. O modelo multidimensional
armazena os dados em arrays multidimensionais com um número fixo de dimensões, visualização
“tridimensional”.
3) O data Lake é um ambiente onde se é armazenado grande quantidade de dados brutos(ainda não
foram processados para uma finalidade específica. Os dados em um data lake são definidos só depois
de serem consultados. Os cientistas de dados podem acessar as informações brutas quando
necessário por meio de modelagem preditiva ou ferramentas analíticas mais avançadas) e em
formatos nativos, com os data lakes, você tem uma visão não refinada dos dados. Essa estratégia de
gerenciamento é cada vez mais usada por empresas que querem um grande repositório holístico para
armazenar dados, o que proporciona uma escalabilidade nunca antes imaginada para o ambiente de
bancos de dados. Os data lakes exigem governança e manutenção contínuas para que os dados
possam ser usados e acessados. Sem esse controle, há o risco deles se tornarem lixo eletrônico –
inacessíveis, pesados, caros e inúteis. Os dados são recolhidos de aplicações, bancos de dados, data
warehouses e em tempo real por streaming. Os usuários nesse sistema estão sempre tentando
autenticar e refinar os dados, pode-se acessar, preparar e analisar os dados com muito mais
velocidade e precisão ao se utilizar os data lakes. Possibilita o acesso a uma variedade grande de dados
que se processada e refinada corretamente é de muito valor, usada para prever aplicações analíticas
e em reportar dados “normais” principalmente quando existe variedade de tipos de dados.