Escolar Documentos
Profissional Documentos
Cultura Documentos
Apresentação
Nos últimos anos houve um aumento expressivo da geração de dados, e o armazenamento
tradicional, utilizando dispositivos físicos ou sistemas simples de acesso de arquivo, deixou de ser
capaz de suprir as necessidades atuais.
Novas tecnologias surgiram para atender à demanda de big data, o que inclui requisitos básicos
como velocidade e integridade dos dados armazenados, além de permitir a edição e gravação das
modificações de forma que seja tolerante a falhas.
Bons estudos.
Nos últimos anos, o consumo brasileiro da plataforma de streaming Netflix cresceu 90%. A
expectativa de adesão de novos serviços desse tipo é grande e foi documentada pela PWC, como é
possível ver na figura a seguir.
Surgiu uma nova plataforma de streaming no mercado e você foi contratado para ajudar na escolha
da melhor solução de armazenamento para essa plataforma. Algumas informações lhe foram
passadas:
- O plano é começar com um catálogo pequeno e aumentar ao longo do tempo, de acordo com a
aderência das assinaturas.
- Em uma pesquisa de mercado, foi definido um preço inicial para a assinatura mensal da
plataforma, que não opera com uma grande margem de lucro.
- A empresa pensa em futuramente oferecer outras mídias além de vídeo.
- Não há um espaço físico muito grande na sede da empresa.
Qual forma de armazenamento você indicaria e quais vantagens dela sustentam a sua preferência?
Infográfico
O armazenamento em nuvem é a forma mais recente de armazenar grandes volumes de dados de
forma eficiente. Embora ofereça serviços pagos, o crescimento dessa tecnologia é evidente tanto
para o uso de empresas quanto para o uso pessoal.
Confira neste Infográfico algumas metas para o crescimento da computação em nuvem a partir de
2020.
Aponte a câmera para o
código e acesse o link do
conteúdo ou clique no
código para acessar.
Conteúdo do livro
Lidar com o armazenamento de dados é um dos maiores desafios de se trabalhar com big data, mas
o avanço tecnológico nessa área vem facilitando bastante a tomada de decisões a esse respeito. Se
antes os armazenamentos eram feitos em discos locais de modo direto, hoje já é possível lidar com
outras estruturas de armazenamento, inclusive com a tecnologia de distribuição de arquivos em
blocos.
Mais recentemente houve avanços também na área da computação em nuvem voltada para o
armazenamento de grandes volumes. Esse tipo de tecnologia não só possibilita melhor custo-
benefício, como também facilita o acesso dos arquivos em qualquer região do planeta, desde que
haja Internet. Cada tipo de armazenamento tem vantagens e desvantagens que devem ser
analisadas minuciosamente antes da implementação do sistema escolhido.
No capítulo Frameworks de armazenamento de dados de big data, da obra Framework de big data,
você vai conhecer as principais formas de armazenamento de dados e os frameworks gratuitos e
pagos existentes no mercado.
Boa leitura.
FRAMEWORK
DE BIG DATA
Introdução
Com o aumento exponencial do volume e da complexidade de dados
gerados a cada segundo, muitas ferramentas de processamento e arma-
zenamento existentes ficaram defasadas. Nos últimos anos, novas tecno-
logias foram surgindo, com o objetivo de suprir as atuais necessidades, e
que continuam avançando cada vez mais. Para obter um armazenamento
seguro e efetivo, há alternativas gratuitas e pagas, cada uma com suas
particularidades, vantagens e limitações.
Neste capítulo, você irá conhecer os principais frameworks para arma-
zenamento de grandes volumes de dados e compreender as diferenças
entre os modelos tradicionais de armazenamento e os modelos espe-
cíficos para big data.
2 Frameworks de armazenamento de dados de big data
RAID;
DAS;
NAS;
SAN;
IP-SAN.
Você já parou para pensar que o armazenamento digital possui cerca de 300 anos?
Confira a matéria disponível no link a seguir (PPLWARE, 2013), que traz a história do
armazenamento desde os cartõezinhos furados (IBM cards), em 1725, até o armaze-
namento em nuvem atual.
https://qrgo.page.link/fhUiC
AWS. Armazenamento na nuvem com a AWS. AWS, [s. l.], [201–?]. Disponível em: https://
aws.amazon.com/pt/products/storage/. Acesso em: 23 jan. 2020.
CAVANILLAS, J. M.; CURRY, E.; WAHLSTER, W. New horizons for a data-driven economy: a
roadmap for usage and exploitation of big data in Europe. Springer, 2016.
MICROSOFT AZURE. O que é armazenamento em nuvem? Microsoft Azure, [s. l.], [201–?].
Disponível em: https://azure.microsoft.com/pt-br/overview/what-is-cloud-storage/.
Acesso em: 23 jan. 2020.
PPLWARE. A história do armazenamento digital. PPLWARE, [s. l.], 2013. Disponível em:
https://pplware.sapo.pt/internet/a-historia-do-armazenamento-digital/. Acesso em:
23 jan. 2020.
REDHAT. Armazenamento de arquivos, em blocos ou de objetos? Red Hat, [s. l.], [201–?].
Disponível em: https://www.redhat.com/pt-br/topics/data-storage/file-block-object-
-storage. Acesso em: 23 jan. 2020.
SHVACHKO, K. et al. The hadoop distributed file system. In: SYMPOSIUM ON MASSIVE
STORAGE SYSTEMS AND TECHNOLOGIES, 26., 2010, Incline Village, NV. Annals [...]. In-
cline Village, NV: IEEE, 2010. p. 1–10. Disponível em: https://storageconference.us/2010/
Papers/MSST/Shvachko.pdf. Acesso em: 23 jan. 2020.
SOMASUNDARAM, G. Armazenamento e gerenciamento de informações: como armazenar,
gerenciar e proteger informações digitais. Bookman Editora, 2009.
Frameworks de armazenamento de dados de big data 15
Os links para sites da Web fornecidos neste capítulo foram todos testados, e seu fun-
cionamento foi comprovado no momento da publicação do material. No entanto, a
rede é extremamente dinâmica; suas páginas estão constantemente mudando de
local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade
sobre qualidade, precisão ou integralidade das informações referidas em tais links.
Dica do professor
As tecnologias para o armazenamento de dados estão evoluindo a todo o vapor e não pararão tão
cedo. Se hoje já é possível carregar uma grande quantidade de arquivos, amanhã será possível levar
todo um banco de dados no bolso.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
Exercícios
1) Sabe-se que, independente de qual seja, as formas de armazenamento de dados devem ser
capazes de gravar, armazenar e permitir a leitura de informações. Entretanto, quando se
trata de um grande volume de dados, apenas isso não é o suficiente. É necessário que sejam
cobertos pelo menos outros três pontos cruciais para a manipulação de big data. Quais são
eles?
4) O armazenamento em nuvem vem ganhando cada vez mais espaço. Os serviços prestados
pela Amazon (S3), Microsoft (Azure) e Google (Cloud Storage) são alguns dos principais do
mercado.
Entre eles existem muitas coisas em comum, mas um se distingue principalmente por:
A) preço.
B) elasticidade.
C) abordagem de armazenamento.
D) quantidade de disponibilidade.
E) durabilidade.
Qual dos itens a seguir representa uma vantagem do armazenamento em nuvem em relação
ao on-premise?
A) O armazenamento em nuvem tem tecnologias mais modernas e mais fáceis de serem usadas
por pessoas sem conhecimento prévio.
B) O HDFS não permite que os dados sejam armazenados de modo distribuído e, por isso, não é
vantajoso.
C) O HDFS na verdade é mais vantajoso que o armazenamento em nuvem porque podemos usar
o espaço livre do disco em outro momento.
D) O armazenamento em nuvem é mais barato porque o usuário geralmente só paga pelo que
consome.
Veja, Na Prática, como foi que o cofundador do Airbnb se saiu migrando o seu serviço de
armazenamento para o Amazon Web Service.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
Saiba +
Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor:
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.