Escolar Documentos
Profissional Documentos
Cultura Documentos
Big Data
Apresentação
Esta aula tem o objetivo de apresentar outras características importantes, no que diz
respeito à definição de um Big Data.
É normal nos referirmos aos 5Vs (valor, variedade, velocidade, veracidade e volume)
como sendo as principais caraterísticas do Big Data, mas existem outras características
que são essenciais nesse ambiente.
Vamos abordar algumas dessas principais características, como escalabilidade,
integridade, acessibilidade, privacidade e diversidade, além de outras que discutiremos
ao longo desta aula.
Além disso, ainda vamos tratar de um ponto crítico, que é a questão temporal dos dados
em Big Data e de como lidamos com dados de formatos tão distintos.
Vamos nessa!
Livro Eletrônico
faculdade.grancursosonline.com.br 1 de 8
Professor(a): Anderson Nascimento
1. Escalabilidade;
2. Diversidade;
3. Temporalidade;
4. Incrementalidade;
5. Complexidade;
6. Integridade;
7. Acessibilidade;
8. Privacidade;
9. Diversidade;
10. Moralidade.
A seguir, vamos discutir um pouco sobre cada uma dessas características.
1) Escalabilidade
O Big Data é altamente escalável, o que significa que ele pode lidar com o aumento
exponencial no volume, na variedade e na velocidade dos dados. À medida que a quantidade
de dados cresce, os sistemas e a infraestrutura relacionada devem ser capazes de expandir
e se adaptar para suportar esse crescimento sem comprometer o desempenho.
2) Diversidade
A diversidade de fontes de dados é outro ponto característico de um Big Data, pois
seu conteúdo advém de uma ampla gama de fontes, incluindo sistemas internos de uma
organização, dispositivos móveis, sensores, redes sociais, sites, transações on-line, entre
outros. Essa diversidade de fontes oferece uma visão mais abrangente e holística dos dados,
permitindo a geração de insights que vão além do que é possível, utilizando-se apenas dos
dados transacionais.
3) Temporalidade
Os dados de um Big Data, muitas vezes, são gerados e analisados em tempo real ou
próximo disso. Na prática, isso quer dizer que os dados são processados e analisados em
um tempo que precisa ser razoável, para que possibilite a tomada de decisões imediata. A
capacidade de capturar, processar e extrair insights de dados, em tempo real, é fundamental
em diversas áreas, como mercado financeiro, marketing, produção, segurança, medicina
e logística.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 2 de 8
Professor(a): Anderson Nascimento
4) Incrementalidade
O Big Data possui o potencial de gerar valor incremental, à medida que mais dados são
adicionados e analisados, ou seja, conforme mais informações são coletadas e integradas,
novos insights e oportunidades podem ser descobertos. Esse valor incremental é resultado
da análise contínua dos dados, em um ciclo de feedback, permitindo ajustes e melhorias
contínuas em estratégias e processos.
5) Complexidade
O Big Data é complexo devido à sua natureza heterogênea, à diversidade de fontes, à
variedade de formatos e ao volume massivo. Lidar com essa complexidade exige abordagens
e ferramentas especializadas, como algoritmos de processamento distribuído, técnicas
avançadas de análise de dados e infraestrutura escalável. A complexidade do Big Data exige
uma compreensão profunda dos desafios associados à captura, ao armazenamento, ao
processamento e à análise desses dados.
6) Integridade
A integridade se refere à garantia de que os dados sejam precisos, consistentes e
confiáveis ao longo do tempo. Isso envolve a implementação de mecanismos de controle
de qualidade de dados, bem como a validação, a verificação e a correção de erros, para
garantir a integridade dos dados ao longo de sua vida útil.
7) Acessibilidade
O Big Data deve ser acessível a diferentes usuários e sistemas, para permitir a análise
e o compartilhamento de informações de forma eficiente. Isso pode envolver a utilização
de tecnologias de armazenamento e acesso distribuído, bem como a adoção de padrões
e protocolos de interoperabilidade, para facilitar o acesso e o intercâmbio de dados entre
diferentes plataformas.
8) Privacidade
A característica da acessibilidade traz junto questões importantes sobre privacidade
e segurança. Com o aumento da quantidade e da sensibilidade dos dados no Big Data, a
privacidade e a segurança se tornam preocupações essenciais. É necessário implementar
medidas de segurança robustas para proteger os dados contra acessos não autorizados,
violações de privacidade e ataques cibernéticos. Técnicas como anonimização, criptografia,
controle de acesso e políticas de privacidade são algumas das estratégias que devem ser
utilizadas para garantir a segurança e a privacidade dos dados no contexto do Big Data.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 3 de 8
Professor(a): Anderson Nascimento
9) Diversidade
O Big Data pode ser aplicado em diversas áreas e setores, como saúde, finanças, varejo,
marketing, logística, ciência, governo, entre outros. Essa diversidade de aplicações destaca a
versatilidade e a importância do Big Data em impulsionar a inovação, a tomada de decisões
baseada em dados e o desenvolvimento de soluções personalizadas para desafios específicos
em diferentes domínios.
10) Moralidade
O Big Data também apresenta desafios éticos e morais significativos, como a
responsabilidade no uso dos dados, a transparência nas práticas de coleta e análise,
a equidade na utilização dos insights gerados pelos dados e a minimização de vieses e
discriminações. Lidar com essas questões éticas é fundamental para garantir que o Big
Data seja utilizado de maneira responsável e beneficie a sociedade como um todo.
Essas características do Big Data são importantes para entender a complexidade e
as oportunidades associadas ao tratamento e à análise de conjuntos de dados em larga
escala. Porém, vale a pena destacar que essa lista não esgota o rol de características que
encontramos nesse incrível universo de dados, podendo existir outros pontos de atenção
não citados neste texto.
Todas as dez características de um Big Data, que acabamos de discutir, aliadas aos 5
Vs e incrementadas por outras variáveis importantes do dia a dia, mostram o quão crítico
parece ser lidar com tantas informações e com tantos formatos diferentes.
Há grande dificuldade em gerenciar e equilibrar questões como volume e velocidade,
assim como manter a característica da temporariedade dentro de um intervalo de tempo
aceitável.
Atualmente, os dados de um Big Data são gerados em velocidade incrível, principalmente
com a proliferação de dispositivos conectados e sistemas em tempo real. Isso requer a
capacidade de capturar, processar e analisar os dados rapidamente, a fim de obter insights
valiosos em tempo hábil.
De acordo com Hurwitz et al. (2015), os aspectos de tempo real de Big Data podem
ser revolucionários quando as empresas precisam resolver problemas significantes. O que
acontece quando uma empresa pode lidar com dados que são transmitidos em tempo real?
Em geral, essa abordagem é mais relevante quando a resposta para o problema é sensível
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 4 de 8
Professor(a): Anderson Nascimento
ao tempo e decisiva para os negócios. Isso pode estar relacionado com uma ameaça a algo
importante, como a detecção de desempenho de equipamento de hospital ou a antecipação
de um risco potencial de intrusão.
Assim, dependendo da aplicação, não há a opção de trabalhar com os dados de um Big
Data que não seja o de tempo real.
Na mesma literatura, o autor mostra uma lista de exemplos que podem trazer vantagens
para o Big Data de tempo real:
Se esse for o caso, ou se o problema que estivermos enfrentando exigir de fato que
o modelo seja construído tendo como base o tempo real, os seguintes pontos devem ser
considerados, de acordo com Hurwitz et al. (2015):
Hoje, os ambientes em nuvem são grandes aliados a todo esse processo, já que possuem
grande capacidade de escala, estando o aumento de performance no processamento ou o
aumento de espaço em disco a um clique do administrador da conta.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 5 de 8
Professor(a): Anderson Nascimento
EXEMPLO
Você pode querer cruzar os dados das vendas de uma grande rede varejista com os dados
da oscilação do Dólar, para descobrir o quanto a moeda americana impacta as vendas dessa
rede de lojas. Nesse caso, estaremos integrando uma base relacional com um web scraping
em um site que traz os dados do dólar.
Nesse ponto, falando de maneira inicial, alguns elementos serão fundamentais para
viabilizar todo esse processo: os conectores e os metadados.
Os conectores são pequenos programas que vão permitir que dados de diversas
fontes sejam extraídos para posterior análise. Temos conectores para Enterprise Resource
Planning (ERPs), redes sociais, como Twitter, Facebook e Instagram, entre muitas outras
fontes de dados.
Os conectores também são chamados de APIs e são responsáveis por permitir a extração
de dados sem deixar com que a segurança de determinada aplicação seja comprometida.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 6 de 8
Professor(a): Anderson Nascimento
Nesta aula, avançamos sobre questões diversas relacionadas ao Big Data e às suas
características, indo além dos 5 Vs que normalmente são mencionados na literatura.
O Big Data é um conceito que engloba uma série de características que o tornam único
e desafiador. Uma das principais características do Big Data é a sua escala massiva, com
a geração de uma quantidade impressionante de dados a cada segundo. Esses dados
são provenientes de diversas fontes, como sensores, dispositivos móveis, redes sociais,
transações on-line e muito mais.
De uma maneira resumida, o Big Data é caracterizado por sua escala massiva, sua
variedade de formatos, sua velocidade de geração, sua complexidade, seu valor potencial e
suas preocupações de privacidade e segurança. Compreender essas características e adotar
abordagens adequadas é fundamental para aproveitar ao máximo o potencial do Big Data
e obter insights valiosos para impulsionar a inovação e o crescimento em diversos setores.
Também falamos sobre a temporalidade dos dados, que diferencia projetos que funcionam
em tempo real e não real, o que pode impactar os resultados dos dados disponibilizados
pela arquitetura.
Por fim, levantamos alguns elementos que são essenciais quando abordamos a situação
da diversidade dos dados que transitam pelo ambiente do Big Data.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 7 de 8
Professor(a): Anderson Nascimento
Materiais Complementares
Referências
HURWITZ, Judith et al. Big Data Para Leigos. [s.l.]: Editora Alta Books, 2015. E-book.
ISBN 9786555206906. Disponível em: https://integrada.minhabiblioteca.com.br/#/
books/9786555206906/. Acesso em: 19 jun. 2023.
MORAIS, Izabelly Soares de et al. Introdução a Big Data e internet das coisas (IOT).
Porto Alegre: SAGAH, 2018. Livro digital. (1 recurso on-line). ISBN 9788595027640. Dis-
ponível em: https://integrada.minhabiblioteca.com.br/books/9788595027640. Acesso
em: 19 jun. 2023.
SANTOS, Roger R.; BORDIN, Maycon V.; NUNES, Sergio E. et al. Fundamentos de Big Data.
[s.l.]: Grupo A, 2021. E-book. ISBN 9786556901749. Disponível em: https://integrada.
minhabiblioteca.com.br/#/books/9786556901749/. Acesso em: 19 jun. 2023.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 8 de 8