Você está na página 1de 3

1)Bancos de dados são lugares onde conjuntos de informações são armazenados e manipulados afim

de criar algum sentido e dar mais eficiência durante uma busca. Tem uma importância vital para
instituições que agregam quantidades massivas de informação e a mais de duas décadas se tornou a
principal peça nos sistemas de informação e segurança de dados. Os primeiros bancos de dados
surgiram em meados dos anos 70 como mainframes e desde então estão em constante necessidade
de mudanças e adaptações tendo em vista como a tecnologia avança junto com a quantidade de
informação que produzimos e processamos. Os bancos de dados acabam dependendo da capacidade
velocidade de transmissão e análise como por exemplo a evolução das fitas, discos rígidos e SSD, e da
quantidade de informação que geramos.

Os dados são meramente informações armazenadas em forma de código através de uma observação
e uma interpretação superficial de algum fenômeno ou objeto. Os tipos de dados representam. Os
bancos de dados tradicionais operam com basicamente três tipos de dados, sendo eles os numéricos,
data e hora e tipos literais (baseado no SQL). Cada tipo terá suas ramificações e peculiaridades,
entretanto atualmente temos dados diferentes que também precisam ser armazenados e
processados, como textos estruturados, imagens, áudio, vídeo, dados complexos (que não possuem
ponto de referência comparativa), genômico, espacial, dados que compõem algum objeto, e dentre
outros diversos que podem aparecer, adicionando novos tipos de dados nativos e permitir tipos
definidos pelo usuário (UDT).

Inicialmente os bancos de dados eram um tanto quanto limitados, entretanto ainda eram melhores
que arquivos físicos, principalmente no quesito de consultas, os dados presentes precisavam se
relacionar com outros elementos ou outras tabelas. O usuário do banco de dados é aquele que
simplesmente interage com o mesmo, direta ou indiretamente. Temos diversos tipos de usuários
sendo eles:

Fonte pg.12: http://www.dsc.ufcg.edu.br/~cesp/publications/Palestra_Grupo_PET_DSC_UFCG.pdf

Cada usuário deverá seguir regras e limitações, o usuário final por exemplo vai acessar o banco
indiretamente por meio de aplicações e desconhece a existência do SGBD ele visualizara tudo por
meio de interfaces gráficas que digerem as informações para ele. Temos também os desenvolvedores
e usuários especializados que terão acesso pleno aos bancos, manipulando as informações na entrada
e na saída, irão produzir estruturas de organização e as aplicações para o usuário final. Temos um
meio de campo que entende dos conceitos e reconhece as nuances dos bancos de dados, mas não
irão manipula-los diretamente. E os administradores que cuidará da saúde dos dados fazendo com
que eles se relacionem da melhor maneira possível, determina o modo como as aplicações lida com
as informações e conhece a semântica dos dados.

Os modelos de dados são coleções de construções lógicas, dados estruturados relacionando-se a um


banco de dados. Temos modelos conceituais que são de uma natureza lógica de representar dados,
se encontra distante da tecnologia, os modelos lógicos por outro lado estão próximos da tecnologia e
enfatiza a forma como os dados são representados pelo banco de dados.

O modelo de arquivos armazena os dados diretamente em arquivos organizados pelo tipo de uso,
possui dados redundantes, sem escalabilidade, Dependência entre aplicação e estrutura dos dados,
cada manipulação dependia de um programa (ou método) específico, segurança baixa e difícil
representação. O modelo de arquivos é limitado na questão de separação e isolamento dos dados,
gera dependência entre dados e programa, pode gerar incompatibilidade de formatos de arquivos, só
funciona a partir de consultas pré-determinadas. O modelo hierárquico define a organização e o
acesso aos dados e cada nó pode ter diversos filhos. O modelo de redes cada registro pode ter diversos
pais, é composto de conjuntos, cada conjunto tem registro dono e registro membro e um membro
pode ter diversos donos. O modelo relacional consiste na independência de dados com
implementação e armazenamento em hardware, navegação automática (alto nível) e linguagem não-
procedural. O modelo entidade relacionamento representa as informações como entidades que
representam entes do mundo real, e essas entidades se relacionam entre si. O modelo Orientado a
Objetos (seguindo o caminho da programação orientada a objetos) tinha grande expectativa que fosse
o modelo vigente atual mais usado e efetivo, entretanto os modelos se encontram estagnados a vários
anos, utiliza de classes, objetos, encapsulamento, relacionamento de herança, associação e possuem
polimorfismo. O modelo objeto-relacional funciona basicamente como uma extensão do modelo
tradicional SQL com algumas funções extras que permitem estender o banco de dados com tipos e
funções específicas da aplicação, incluem consultas envolvendo objetos, atributos multivalorados,
TADs, métodos e funções como predicados de busca em uma consulta. O modelo multidimensional
armazena os dados em arrays multidimensionais com um número fixo de dimensões, visualização
“tridimensional”.

As corporações em relação ao passar do tempo foram basicamente a ignição e o motor das


necessidades de inovações dos bancos de dados que com o crescimento demandava cada vez mais a
habilidade de guardar e processar dados de forma eficiente, dependendo de serviços terceirizados de
alto custo (empresas e operações grandes), a transição de bancos simples para o que temos
atualmente como o data lake. As empresas/corporações médias e pequenas estão bem servidas com
sistemas mais simples e geralmente gratuitos. Os bancos de dados nesse meio servem para aumentar
a produtividade, alinhar diferentes setores, reduzir riscos de operação, possibilita a segurança, e uma
melhor tomada de decisão. O modelo relacional é um modelo em que os registros são tabelados e
estruturados em colunas e linhas, que podem se relacionar através de chaves. Esse é o tipo mais
comum de banco de dados já o modelo não relacional São modelos de bancos de dados que não usam
a linguagem SQL porque lida com formatos de dados que são menos convencionais, um banco de
dados não relacional pode ser ideal para ambientes onde o modelo de dados é mais volátil (Maior
parte das grandes empresas alimentam seus bancos de dados com inúmeros tipos e formatos fazendo
que os bancos não relacionais sejam necessários).
2) O ecossistema onde está inserido a Big Data é totalmente relacionado a analises, se os algoritmos
eficientes não tem suporte de uma base de dados robusta eles não podem operar de forma eficiente.
Sobre a questão de armazenamento se trata de um ambiente flexível onde as necessidades ditam o
quanto será necessario e ao decorrer do uso mudanças podem ocorrer, tendo-se diversas ferramentas
para solucionar diversos casos diferentes. O processamento é na verdade o ato de fazer com que os
dados estejam prontos para o consumo dos analistas, por ser um ambiente com dados massivos os
ambientes computacionais precisam ser de alta performance para que isso possa ser gerenciado e
escalado caso necessário, as vezes os dados precisam ser digeridos de outro banco de dados. Os
analistas por sua vez organizam e transformam esses dados que a princípio parecem dispersos em
informações realmente uteis e que interliguem diversos setores da empresa. Agrupando as
informações vemos que big data é a junção de elementos físicos (hardware, modo de uso e tecnologia
empregada), software (aplicações, serviços de bancos interligados), métodos de gerenciamento
SGBD’s, e a capacidade de absorver, propagar e analisar dados de todos os tipos de usuários.

3) O data Lake é um ambiente onde se é armazenado grande quantidade de dados brutos(ainda não
foram processados para uma finalidade específica. Os dados em um data lake são definidos só depois
de serem consultados. Os cientistas de dados podem acessar as informações brutas quando
necessário por meio de modelagem preditiva ou ferramentas analíticas mais avançadas) e em
formatos nativos, com os data lakes, você tem uma visão não refinada dos dados. Essa estratégia de
gerenciamento é cada vez mais usada por empresas que querem um grande repositório holístico para
armazenar dados, o que proporciona uma escalabilidade nunca antes imaginada para o ambiente de
bancos de dados. Os data lakes exigem governança e manutenção contínuas para que os dados
possam ser usados e acessados. Sem esse controle, há o risco deles se tornarem lixo eletrônico –
inacessíveis, pesados, caros e inúteis. Os dados são recolhidos de aplicações, bancos de dados, data
warehouses e em tempo real por streaming. Os usuários nesse sistema estão sempre tentando
autenticar e refinar os dados, pode-se acessar, preparar e analisar os dados com muito mais
velocidade e precisão ao se utilizar os data lakes. Possibilita o acesso a uma variedade grande de dados
que se processada e refinada corretamente é de muito valor, usada para prever aplicações analíticas
e em reportar dados “normais” principalmente quando existe variedade de tipos de dados.

Você também pode gostar