Escolar Documentos
Profissional Documentos
Cultura Documentos
Revisão Textual:
Prof. Ms. Luciano Vieira Francisco
Conceitos Iniciais sobre Big Data
Caro Aluno(a)!
Normalmente com a correria do dia a dia, não nos organizamos e deixamos para o
último momento o acesso ao estudo, o que implicará o não aprofundamento no material
trabalhado ou, ainda, a perda dos prazos para o lançamento das atividades solicitadas.
Assim, organize seus estudos de maneira que entrem na sua rotina. Por exemplo, você
poderá escolher um dia ao longo da semana ou um determinado horário todos ou alguns
dias e determinar como o seu “momento do estudo”.
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de
discussão, pois estes ajudarão a verificar o quanto você absorveu do conteúdo, além de
propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de
troca de ideias e aprendizagem.
Bons Estudos!
UNIDADE
Conceitos Iniciais sobre Big Data
Introdução ao Tema
Conceitos de Big Data
Mayer-Schonb e Cukier (2014) mencionam que Big Data refere-se a grandes con-
juntos de dados que são difíceis de armazenar, pesquisar, visualizar e analisar como, por
exemplo, uma empresa aérea que coleta dez terabytes de dados de sensores durante
trinta minutos de voo do avião. Nathan e Warren (2015) mencionam que Big Data é
usado comercialmente para se analisar grandes quantidades de dados para se tomar de-
cisões, baseando-se na análise do comportamento e preferências do consumidor.
Os V em Big Data
Conforme observam Zikopoulos e Eaton (2011), a IBM caracteriza e define a
tecnologia de Big Data por três aspectos conjuntos: pelo seu volume, sua velocidade e
a variedade de dados, ou simplesmente V3, como se observa na Figura 1:
Structured &
Batch
Ve
y
Unstructured
iet
loc
Var
ity
Big Streaming
Structured Data Data
Zettabytes Terabytes
Volume
Figura 1
Fonte: Adaptado de Zikopoulos e Eaton, 2011
6
Volume de Dados
Por que o volume é tão grande? É importante que você perceba e se faça esta per-
gunta, procurando exemplos dessas grandes massas geradas de dados.
O grande volume de dados armazenados está explodindo. No ano de 2000 eram
800.000 petabytes (PB) de dados que foram armazenados no mundo. Observa-se,
porém, que grande parte dos dados que estão sendo criados não são analisados. Espera-
se chegar em 35 zettabytes (ZB) em 2020. Outros exemplos interessantes são:
• Twitter gera mais de sete terabytes (TB) de dados a cada dia;
• Facebook gera dez TB.
Vê-se ainda que algumas empresas geram terabytes de dados a cada hora de cada
dia do ano, de modo que já não é inédito organizações individuais possuírem clusters de
armazenamento com petabytes de dados.
Por que o volume é tão grande?
A diminuição dos custos de produção de dados, o volume de dados da World
Wide Web (WWW) tem crescido rapidamente, dispositivos móveis e ubíquos, sensores
sem fio estão gerando dados a cada minuto ou segundo. A troca de dados em massa
está ocorrendo a cada segundo entre os milhares de milhões de serviços de internet,
aplicações científicas, vigilância por vídeo, registros médicos, dados operacionais da
empresa, manufatura discreta, e-commerce etc., são todas as fontes de dados grandes.
Em 2011, a International Data Corporation alegou que a informação do mundo
está dobrando a cada dois anos. Naquele ano, o mundo tinha gerado um escalonamento
de 1,8 ZB (10^21 B) de dados, um aumento de 0,6 ZB ano a ano.
Por fim, prevê-se que em 2020 o mundo gerará até 35 ZB de dados – e isto coloca
desafios significativos para o armazenamento.
O atual volume de dados disponíveis para as organizações está em ascensão, enquanto
o percentual de dados que essas podem analisar está em declínio, conforme se pode
observar na Figura 2:
Figura 2
Fonte: Adaptado de Zikopoulos e Eaton, 2011
7
7
UNIDADE
Conceitos Iniciais sobre Big Data
Big
Data
WEB
CRM
ERP
Figura 3
8
Velocidade nos Dados
O quão rápido é rápido? Pense quanto a exemplos.
9
9
UNIDADE
Conceitos Iniciais sobre Big Data
Segue a indicação de leitura do item 2.3.1 Big Data quanto às definições sobre Big Data:
KIRA, Tarapanoff. Big Data. In: Análise da informação para tomada de decisão, desafios
e soluções. Curitiba, PR: Intersaberes, 2015a. (item 2.3.1).
Segue a indicação de leitura do item 2.4.1.2 Benefícios do Big Data:
________. Benefícios do Big Data. In: Análise da informação para tomada de
decisão, desafios e soluções. Curitiba, PR: Intersaberes, 2015b. (item 2.4.1.2).
Segue a indicação de leitura do item 2.4.2.1 Desafios e oportunidades:
________. Desafios e oportunidades. In: Análise da informação para tomada de
decisão, desafios e soluções. Curitiba, PR: Intersaberes, 2015c. (item 2.4.2.1).
Segue a indicação de leitura do item capítulo 1, item 1. Big data and analytics overview:
WEI-DONG, Zhu et al. Big Data and analytics overview. In: Building Big Data and analytics
solutions in the cloud. [S.l.]: IBM, 2014a. (Col. IBM Redbook; cap. 1; item 1).
https://goo.gl/TtAaDU
Segue a indicação de leitura do item capítulo 1, item 1.1 Examples of big data and analytics:
________. Examples of Big Data and analytics. In: Building Big Data and analytics
solutions in the cloud. [S.l.]: IBM, 2014b. (Col. IBM Redbook; cap. 1; item 1.1).
https://goo.gl/TtAaDU
Segue a indicação de leitura do item capítulo 1, item 1.2 IBM Big Data and Analytics
platform:
________. Big Data and analytics platform. In: Building Big Data and analytics
solutions in the cloud. [S.l.]: IBM, 2014c. (Col. IBM Redbook; cap. 1; item 1.2).
https://goo.gl/TtAaDU
10
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Sites
Você realmente sabe o que é Big Data?
CHEDE, Cezar [CTAURION]. Você realmente sabe o que é Big Data? IBM Developer
Works, 30 abr. 2012.
https://goo.gl/5p55Q1
Big Data Analytics: Você sabe o que é?
HEKIMA. Big Data analytics: você sabe o que é? Big Data Business, 25 jan. 2017.
https://goo.gl/lAJ6mo
O Que é Big Data e como usar na sua Pequena Empresa
TARIFA, Alexandre. O que é Big Data e como usar na sua pequena empresa. Exame,
16 set. 2014.
https://goo.gl/Jh1fz3
Livros
Understanding Big Data: Analytics for Enterprise Class Hadoop and Streaming Data
ZIKOPOULOS, Paul; EATON, Chris. Understanding Big Data: analytics for enterprise
class hadoop and streaming data. [S.l.]: McGraw-Hill Osborne Media, 2011.
11
11
UNIDADE
Conceitos Iniciais sobre Big Data
Referências
MAYER-SCHONB, V.; CUKIER, K. Big Data: A Revolution ThatWill Transform How
We Live, Work, and Think. 2014. ed. [S.l.]: Eamon Dolan/Mariner Books, March 2014.
NATHAN, N.;WARREN, J. Big Data: Principles and best practices of scalable realtime
data systems. 1. ed. [S.l.]: Manning Publications, May 2015.
SMITH, I. The Internet of Things 2012: New Horizons. [S.l.]: CASAGRAS2, 2012.
SOUZA, Alberto Messias da Costa. Uma nova arquitetura para internet das coisas
com análise e reconhecimento de padrões e processamento com Big Data.
2015. Tese (Doutorado em Sistemas Eletrônicos) - Escola Politécnica da Universidade
de São Paulo, São Paulo, 2015. Disponível em: <http://www.teses.usp.br/teses/
disponiveis/3/3142/tde-20062016-105809> . Acesso em: 7 mar. 2017.
ZIKOPOULOS, Paul; EATON, Chris. Understanding Big Data: analytics for enterprise
class hadoop and streaming data. [S.l.]: McGraw-Hill Osborne Media, 2011.
12