Você está na página 1de 6

BIG DATA

Edison Andrade Martins Morais

-1-
Introdução
A partir de agora, você irá compreender o que é Big Data, identificando seus principais
conceitos, seu contexto de utilização atual e sua relação com a Inteligência de
Negócios.

Conceito
O termo Big Data refere-se a um conjunto de informações que não podem ser tratadas
por processos ou ferramentas tradicionais de análise de dados, como mineração de
dados ou textos. Atualmente, há um grande volume desse tipo de dado, e as
organizações não sabem como extrair informações úteis delas, uma vez que esses
dados se encontram em seu formato mais “bruto” – semiestruturado ou não
estruturado. (ZIKOPOULOS et al., 2012).

você sabia?
Para aprender mais sobre Big Data, você pode recorrer a alguns
livros sobre o assunto. A obra Think Bigger: Developing a
Successful Big Data Strategy for Your Business (RIJMENAM, 2014)
apresenta as melhores práticas de empresas que implementaram
uma estratégia de Big Data, incluindo Walmart, Walt Disney e Shell.
Já no livro Big Data: Como Extrair Volume, Variedade, Velocidade e
Valor da Avalanche de Informação Cotidiana (MAYER-
SCHÖNBERGER; CUKIER, 2013), dois especialistas explicam o
que é o Big Data, como ele mudará nossas vidas e o que podemos
fazer para nos protegermos de seus perigos.

Como você pode conferir na figura 1, basicamente, os dados que o Big Data deve
tratar têm as seguintes características: volume, variedade e velocidade.

-2-
Figura 1 - Componentes do Big Data.
Fonte: Zikopoulos et al. (2012, p. 5).

Volume de dados
O volume de dados armazenados atualmente é gigantesco. Nos anos 2000, havia
aproximadamente 800.000 petabytes (PB) armazenados no mundo. Para 2020, a
estimativa é de que haja cerca de 35 zettabytes (ZB). Apenas o Twitter, por exemplo,
gera mais de 7 terabytes (TB) de dados todos os dias. Já o Facebook gera cerca de 10
TB diários. Para termos uma ideia do que isso representa em quantidade de conteúdo,
veja a relação entre as medidas utilizadas na computação:

• 1 byte: 8 bits (1 caractere);

• 1 kilobyte (kB ou Kbytes): 1024 bytes;

• 1 megabyte (MB ou Mbytes): 1024 kilobytes;

• 1 gigabyte (GB ou Gbytes): 1024 megabytes;

-3-
• 1 terabyte (TB ou Tbytes): 1024 gigabytes;

• 1 petabyte (PB ou Pbytes): 1024 terabytes;

• 1 exabyte (EB ou Ebytes): 1024 petabytes;

• 1 zettabyte (ZB ou Zbytes): 1024 exabytes;

• 1 yottabyte (YB ou Ybytes): 1024 zettabytes.

Vale ressaltar, entretanto, que essas estimativas de crescimento poderão estar


desatualizadas em pouco tempo, uma vez que a velocidade de crescimento dos dados
vem aumentando com uma rapidez praticamente exponencial. Mas você sabe por que
isso acontece?
A resposta é simples: nós gravamos praticamente tudo. Arquivos de todos os tipos são
armazenados: documentos, fotos, vídeos, entre outros. Imagine, então, a quantidade
de informações que cada pessoa usuária de tecnologia gera no mundo diariamente.
Além disso, o surgimento da ideia da computação em nuvem (do inglês cloud computing
) contribuiu ainda mais para esse crescimento, uma vez que as pessoas deixaram de
armazenar seus arquivos apenas em computadores pessoais ou celulares, passando a
guardá-los em servidores compartilhados e interligados por meio da Internet.
A grande vantagem da computação em nuvem está no fato de que os dados
armazenados estão disponíveis o tempo todo, a qualquer hora, e podem ser acessados
de qualquer lugar do mundo, sem a necessidade de instalação de programas
adicionais. O acesso a programas, serviços e arquivos torna-se, então, remoto,
realizado por meio da Internet.
Considerando esse volume de dados disponível, o principal desafio é como gerenciá-
los – como coletar, tratar e analisar. Essa talvez seja uma das principais questões com
as quais os mecanismos de busca, como o Google, devem lidar atualmente.

Variedade de dados
A segunda questão a ser considerada no Big Data é a variedade de dados disponível.
O volume de dados associado à variedade torna mais difícil o desafio de
processamento.
É importante compreender que variedade de dados quer dizer que eles surgem de
diferentes fontes, como celulares, sensores ou redes sociais, e estão armazenados em
diferentes formatos: estruturado (bancos de dados, por exemplo), semiestruturado
(geralmente associados a metadados) e não estruturado (arquivos em diferentes
formatos, como áudios, vídeos, imagens, documentos, páginas Web, postagens em
redes sociais, e-mails, planilhas etc.).

-4-
Estima-se que a quantidade de dados em formato estruturado disponível represente
cerca de 20% do total. Uma vez que esse tipo de dado é mais fácil de ser tratado, o
desafio da variedade é o tratamento de dados em formatos semiestruturados e não
estruturados.

Velocidade de dados
A terceira e última questão a ser considerada no Big Data é a velocidade de tratamento
dos dados gerados. Em outras palavras, devemos associar o termo velocidade a quão
rapidamente os dados são gerados, armazenados, processados e disponibilizados
para consulta. O desafio é: quanto mais rápido isso acontecer, melhor.
Imagine, por exemplo, a situação em que uma empresa monitora o comportamento de
seus clientes em redes sociais. Quando um desses clientes postar um comentário ruim
a respeito da empresa, a questão passará a ser em quanto tempo esse comentário
deve ser encontrado. Em seguida, em quanto tempo o comentário deve ser processado
e, finalmente, uma resposta deve ser dada ao cliente.
Essa ideia de velocidade no tratamento dos dados, associada ao volume e à
variedade, forma o tripé básico do Big Data.
Considerando o conceito do Big Data como um conjunto de gigantesco volume e
variedade de dados estruturados, semiestruturados e não estruturados, que devem ser
processados com velocidade adequada, a ideia é que o núcleo da Inteligência de
Negócios passe a ser o Big Data, visando a um alcance maior em relação ao BI
tradicional, que é aplicado apenas em dados estruturados.

Conclusão
Nesta unidade você compreendeu o que é
Big Data, identificando seus principais
conceitos, seu contexto de utilização atual
e sua relação com a Inteligência de
Negócios.
Nesta unidade, você teve a oportunidade
de:

• Compreender o que é Big Data.

• Identificar os principais conceitos relacionados a Big Data, seu contexto de


utilização atual e sua relação com a Inteligência de Negócios.

-5-
MAYER-SCHÖNBERGER, Viktor; CUKIER, Kenneth. Big Data: como extrair volume,
variedade, velocidade e valor da avalanche de informação cotidiana. Rio de Janeiro:
Campus, 2013.
RIJMENAM, Mark Van. Think bigger: developing a successful big data strategy for
your business. New York: Amacom, 2014.
ZIKOPOULOS, Paul et al. Understanding Big Data: analytics for enterprise class
hadoop and streaming data. New York: McGraw-Hill, 2012.

-6-

Você também pode gostar