Escolar Documentos
Profissional Documentos
Cultura Documentos
-1-
Introdução
A partir de agora, você irá compreender o que é Big Data, identificando seus principais
conceitos, seu contexto de utilização atual e sua relação com a Inteligência de
Negócios.
Conceito
O termo Big Data refere-se a um conjunto de informações que não podem ser tratadas
por processos ou ferramentas tradicionais de análise de dados, como mineração de
dados ou textos. Atualmente, há um grande volume desse tipo de dado, e as
organizações não sabem como extrair informações úteis delas, uma vez que esses
dados se encontram em seu formato mais “bruto” – semiestruturado ou não
estruturado. (ZIKOPOULOS et al., 2012).
você sabia?
Para aprender mais sobre Big Data, você pode recorrer a alguns
livros sobre o assunto. A obra Think Bigger: Developing a
Successful Big Data Strategy for Your Business (RIJMENAM, 2014)
apresenta as melhores práticas de empresas que implementaram
uma estratégia de Big Data, incluindo Walmart, Walt Disney e Shell.
Já no livro Big Data: Como Extrair Volume, Variedade, Velocidade e
Valor da Avalanche de Informação Cotidiana (MAYER-
SCHÖNBERGER; CUKIER, 2013), dois especialistas explicam o
que é o Big Data, como ele mudará nossas vidas e o que podemos
fazer para nos protegermos de seus perigos.
Como você pode conferir na figura 1, basicamente, os dados que o Big Data deve
tratar têm as seguintes características: volume, variedade e velocidade.
-2-
Figura 1 - Componentes do Big Data.
Fonte: Zikopoulos et al. (2012, p. 5).
Volume de dados
O volume de dados armazenados atualmente é gigantesco. Nos anos 2000, havia
aproximadamente 800.000 petabytes (PB) armazenados no mundo. Para 2020, a
estimativa é de que haja cerca de 35 zettabytes (ZB). Apenas o Twitter, por exemplo,
gera mais de 7 terabytes (TB) de dados todos os dias. Já o Facebook gera cerca de 10
TB diários. Para termos uma ideia do que isso representa em quantidade de conteúdo,
veja a relação entre as medidas utilizadas na computação:
-3-
• 1 terabyte (TB ou Tbytes): 1024 gigabytes;
Variedade de dados
A segunda questão a ser considerada no Big Data é a variedade de dados disponível.
O volume de dados associado à variedade torna mais difícil o desafio de
processamento.
É importante compreender que variedade de dados quer dizer que eles surgem de
diferentes fontes, como celulares, sensores ou redes sociais, e estão armazenados em
diferentes formatos: estruturado (bancos de dados, por exemplo), semiestruturado
(geralmente associados a metadados) e não estruturado (arquivos em diferentes
formatos, como áudios, vídeos, imagens, documentos, páginas Web, postagens em
redes sociais, e-mails, planilhas etc.).
-4-
Estima-se que a quantidade de dados em formato estruturado disponível represente
cerca de 20% do total. Uma vez que esse tipo de dado é mais fácil de ser tratado, o
desafio da variedade é o tratamento de dados em formatos semiestruturados e não
estruturados.
Velocidade de dados
A terceira e última questão a ser considerada no Big Data é a velocidade de tratamento
dos dados gerados. Em outras palavras, devemos associar o termo velocidade a quão
rapidamente os dados são gerados, armazenados, processados e disponibilizados
para consulta. O desafio é: quanto mais rápido isso acontecer, melhor.
Imagine, por exemplo, a situação em que uma empresa monitora o comportamento de
seus clientes em redes sociais. Quando um desses clientes postar um comentário ruim
a respeito da empresa, a questão passará a ser em quanto tempo esse comentário
deve ser encontrado. Em seguida, em quanto tempo o comentário deve ser processado
e, finalmente, uma resposta deve ser dada ao cliente.
Essa ideia de velocidade no tratamento dos dados, associada ao volume e à
variedade, forma o tripé básico do Big Data.
Considerando o conceito do Big Data como um conjunto de gigantesco volume e
variedade de dados estruturados, semiestruturados e não estruturados, que devem ser
processados com velocidade adequada, a ideia é que o núcleo da Inteligência de
Negócios passe a ser o Big Data, visando a um alcance maior em relação ao BI
tradicional, que é aplicado apenas em dados estruturados.
Conclusão
Nesta unidade você compreendeu o que é
Big Data, identificando seus principais
conceitos, seu contexto de utilização atual
e sua relação com a Inteligência de
Negócios.
Nesta unidade, você teve a oportunidade
de:
-5-
MAYER-SCHÖNBERGER, Viktor; CUKIER, Kenneth. Big Data: como extrair volume,
variedade, velocidade e valor da avalanche de informação cotidiana. Rio de Janeiro:
Campus, 2013.
RIJMENAM, Mark Van. Think bigger: developing a successful big data strategy for
your business. New York: Amacom, 2014.
ZIKOPOULOS, Paul et al. Understanding Big Data: analytics for enterprise class
hadoop and streaming data. New York: McGraw-Hill, 2012.
-6-