Escolar Documentos
Profissional Documentos
Cultura Documentos
Big Data é uma coleção de conjuntos de dados tão grandes e complexos que se torna difícil de
processar usando ferramentas de gestão de bases de dados disponíveis ou aplicações tradicionais de
processamento de dados.
-Wikipedia
Assets de informações de alto volume, alta velocidade e / ou alta variedade que exigem formas
inovadoras e económicas de processamento de informações que permitem uma visão aprimorada,
tomada de decisões e automação de processos.
- Doug Laney
“(…) alguns definiram Big Data como uma quantidade que excede um petabyte - um milhão de
gigabytes. ”
- “Whats is Big Data?”, University of Winsconsin
Apesar de não existir uma definição universalmente aceite, ao
analisar as várias definições de Big Data podemos chegar às
seguintes conclusões:
• Big Data são dados em grande volume(> 1 petabytes)
• Big Data não é apenas um tipo de dados
• Big Data são dados que são gerados a um ritmo mais
acelerado que dados no passado de todos os tipos de fontes
• Big Data são dados que necessitam de métodos mais recentes
de armazenamento, de processamento, de análise, de
visualização e de integração
Foi a partir dessas características básicas que surgiu o que é conhecido como os 3
V’s, estabelecido por Doug Laney em 2001 [6,9]:
Volume - A quantidade de dados gerados e armazenados. O tamanho dos dados
determina o valor e o insight potencial e se eles podem ser considerados Big Data
ou não. O tamanho de Big Data geralmente é maior do que terabytes e petabytes.
Variedade - O tipo e a natureza dos dados. Big Data extrai de texto, imagens,
áudio, vídeo; além disso, completa as peças que faltam por meio da fusão de dados.
Velocidade - A velocidade com que os dados são gerados e processados para
atender às demandas e desafios que se encontram no caminho de crescimento e
desenvolvimento. Big Data geralmente está disponível em tempo real. Em
comparação com pequenos dados, Big Data é produzido de forma mais contínua.
E com o tempo, mais V’s foram adicionados. Primeiro pela IBM, que adicionou [6]:
Veracidade - A veracidade ou confiabilidade dos dados, que se refere à qualidade e
ao valor dos dados. Big Data não deve ser apenas grande, mas também confiável
para agregar valor na análise.
Fabricação - Armados com a visão que Big Data pode fornecer, os fabricantes
podem aumentar a qualidade e a produção, minimizando o desperdício -
processos que são fundamentais no mercado altamente competitivo de hoje.
Cada vez mais fabricantes estão a trabalhar numa cultura baseada em análise, o
que significa que podem resolver problemas com mais rapidez e tomar
decisões de negócios mais ágeis. [1]
Bancos - Armados com a visão que Big Data pode fornecer, os fabricantes podem
aumentar a qualidade e a produção ao mesmo tempo em que minimizam o
desperdício - processos que são fundamentais no mercado altamente competitivo de
hoje. Cada vez mais fabricantes estão a trabalhar numa cultura baseada em análise, o
que significa que podem resolver problemas com mais rapidez e tomar decisões de
negócios mais ágeis. [1]
As principais tecnologias de Big Data são divididas em 4 campos, que são classificados da
seguinte forma [11]:
• Data Storage
• Data Mining
• Data Analytics
• Data Visualization
A seguir podemos ver algumas tecnologias que se enquadram nessas categorias junto com as
empresas que as estão a usar.
DATA STORAGE
Hadoop
Quando se trata de Big Data, o Hadoop é a primeira tecnologia a entrar
em ação. Baseado na arquitetura de MapReduce, o Hadoop ajuda no
processamento de trabalhos relacionados a batch e processar
informação do batch. Hadoop foi construído para armazenar e
processar os dados num ambiente de processamento de dados
distribuídos junto com hardware comum e um modelo de execução de
programação simples. Também pode ser usado para armazenar e
analisar os dados presentes em várias máquinas diferentes com alta
capacidade de armazenamento, velocidade e baixo custo. [2, 3, 11, 16]
Desenvolvido por: Fundação Apache em 2006
7 “What is “Big Data” — Understanding the History” por James Winegar, towards data science,
visitado em 10 de junho de 2021 - https://towardsdatascience.com/what-is-big-data-understanding-
the-history-32078f3b53ce
“A brief history of big data everyone should read” por Bernard Marr, World Economic Forum,
8 visitado em 10 de junho de 2021 - https://www.weforum.org/agenda/2015/02/a-brief-history-of-big-
data-everyone-should-read/
9 “Big Data”, Wikipedia, visitado em 12 de junho de 2021 - https://en.wikipedia.org/wiki/Big_data
“Top 10 In-Demand Big Data Skills To Land ‘Big’ Data Jobs in 2021” por Utkarsh Singh, upGrad blog,
10 visitado em 12 de junho de 2021 - https://www.upgrad.com/blog/big-data-skills/
11 “Top Big Data Technologies that you Need to know” por Ravi Kiran, Edureka, visitado em 12 de
junho de 2021 - https://www.edureka.co/blog/top-big-data-technologies/
“What Is Kafka? A Super-Simple Explanation Of This Important Data Analytics Tool”, Bernard Marr
17 & Co., visitado em 17 de junho de 2021 - https://www.bernardmarr.com/default.asp?contentID=1525