Escolar Documentos
Profissional Documentos
Cultura Documentos
Big Data
Apresentação
O objetivo desta aula é apresentar os desafios da gestão de Big Data, assim como explicar
importantes conceitos, como datificação e impulsionadores de dados.
A datificação é o processo de gerar informações, a partir dos dados, tendo como objetivo
armazenar, processar e analisar esses dados para que sejam utilizados de maneira eficiente.
Os impulsionadores são os mecanismos de onde são coletados esses dados, podendo
ser sistemas, aplicativos, sensores e robôs, e têm o objetivo de gerar e armazenar qualquer
dado que seja relevante para o negócio.
Após esta aula, você conhecerá um pouco mais sobre o processo de captura e gestão
dos dados.
Vamos nessa!
Dada toda a complexidade de lidar com dados e formatos heterogêneos, assim como
de tratar de todas as características marcantes do Big Data, o processo da sua gestão,
consequentemente, é um dos grandes desafios enfrentados pelos profissionais que cuidam
da gestão de todo o ecossistema.
Um dos pontos que deve ser discutido e que é amplamente significativo é encontrar
uma forma eficiente de coletar, armazenar, processar e analisar essas informações em
larga escala, principalmente dados o avanço da tecnologia e o crescimento cada vez mais
acelerado da quantidade de dados que é gerada a cada minuto.
Livro Eletrônico
faculdade.grancursosonline.com.br 1 de 9
Professor(a): Anderson Nascimento
Como citado no início do texto, o desafio da variedade (um dos 5 Vs) é outro ponto de
atenção, pois os dados, normalmente, vêm de diversas fontes e formatos diferentes, o que
implica a necessidade do uso de ferramentas e tecnologias que garantam, de alguma forma,
uma organização e compatibilidade, para que os dados possam ser analisados em conjunto.
E como armazenamos tudo isso? O crescimento exponencial do volume de dados tem
o seu preço, que é o do armazenamento. O ambiente que servirá de repositório para esses
dados precisa ser altamente escalável, eficiente e, principalmente, gerenciável.
Não adianta, para uma corporação, possuir toneladas de dados se não consegue gerenciar
e produzir inteligência com eles. Há uma piada que gosto muito quando falamos de Big
Data, mais especificamente de Data Lake:
“O problema do Data Lake (lago de dados) é ele acabar se tornando um Data Swamp
(pântano de dados)”.
• Metadados
• Informação em linhas e colunas
• Ausênscia ou poucos metadados • Ferramentas que facilitam a
• Sem governança de dados manipulação
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 2 de 9
Professor(a): Anderson Nascimento
O Data Lake pode ser encarado como uma estrutura que armazena os dados de um Big
Data. A piada quer dizer que um lago malcuidado pode virar um pântano, o que, tecnicamente,
significa algo bastante ruim.
Outro ponto-chave na gestão de um Big Data é a questão da velocidade (mais um V) de
processamento, que também é afetada na proporção do crescimento da quantidade de dados
que a estrutura carrega. O timing do processamento deve ser algo aceitável, ou seja, deve
ser rápido e eficiente, utilizando tecnologias como computação em nuvem e processamento
distribuído, que permitem o processamento paralelo de dados em diferentes servidores.
A qualidade dos dados é outro ponto desafiador na gestão de um Big Data. Após sofrer
sucessivas transformações e carregamentos, os dados correm o risco de estarem incompletos,
inconsistentes e imprecisos. Assim, é necessária a implementação de mecanismos e
ferramentas que vão ajudar a garantir a confiabilidade dos dados, para que o processo de
tomada de decisão não seja prejudicado.
Dentro de todo esse contexto e correndo por fora, está a privacidade e a segurança dos
dados, principalmente nos dias de hoje, por conta das leis de proteção aos dados, como a
GPDR europeia e a LGPD brasileira.
Para estar dentro do que a legislação estabelece, as empresas precisam adotar medidas
rigorosas para proteger esses dados contra as ameaças cibernéticas e todo o tipo de
vazamento – algo que pode colocar a imagem da organização em xeque, fora o pagamento
de multas altíssimas.
Dados todos os pontos sobre a gestão de dados, a verdade é que todo esse esforço
só vale a pena se o resultado disso permitir às corporações a extração de dados úteis e
significativos para a tomada de decisão. Nem sempre será tarefa fácil identificar os padrões
e as tendências relevantes que possam impulsionar a inovação e o crescimento dos negócios.
A análise de Big Data requer as habilidades especializadas e o uso de técnicas avançadas,
como mineração de dados, aprendizado de máquina e inteligência artificial.
Por fim, a gestão de Big Data apresenta uma série de desafios, desde a coleta e o
armazenamento até a análise e a aplicação dos insights. As empresas que conseguem
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 3 de 9
Professor(a): Anderson Nascimento
superar esses desafios e aproveitar o potencial dos seus dados têm uma vantagem
competitiva significativa, podendo tomar decisões mais assertivas e impulsionar o sucesso
dos seus negócios.
2. Datificação de Dados
Quando abordamos os desafios da gestão de um Big Data, não podemos deixar de falar
sobre o processo de datificação de dados. Esse conceito diz respeito a como os processos
de dados têm sido abordados dentro das corporações que possuem os seus processos
orientados a dados.
Vale citar que a datificação tem como fonte os seres humanos, os animais e a natureza
ou, até mesmo, as máquinas, os objetos, os processos e as atividades em geral. Depois de
coletados os dados, as organizações podem rastreá-los, monitorá-los e otimizá-los, de
modo a oferecer novas formas de valor para o próprio negócio e para a sociedade de uma
maneira geral.
Em termos técnicos, podemos dizer que a datificação de dados é o processo de
transformar informações em formato digital por meio da coleta, da estruturação e do
armazenamento sistemático, permitindo a análise e aplicação de algoritmos e de técnicas
computacionais para obter insights, padrões e conhecimentos úteis, visando à tomada de
decisões informada e ao aprimoramento de processos em diversos setores e atividades.
Esse termo surgiu com o aumento exponencial da quantidade de dados gerada e
coletada no cotidiano corporativo, que é impulsionado pelo avanço da tecnologia digital e
da conectividade.
A datificação dos dados vai exigir, previamente, um processo estruturado para coleta,
organização e estruturação dos dados em bancos de dados ou em sistemas de armazenamento
em nuvem. Na fase posterior são aplicadas técnicas de análise de dados, como mineração
de dados, aprendizado de máquina e inteligência artificial, para extrair padrões, tendências
e insights valiosos dos dados.
A datificação de dados tem sido aplicada em diversas áreas, como saúde, finanças,
varejo, manufatura, transporte, marketing, governo, entre outras. Ela possibilita a tomada
de decisões mais informada e embasada em evidências, bem como a personalização de
produtos e serviços, a otimização de processos, a detecção de fraudes, a previsão de
demandas e o aprimoramento da experiência do usuário. Logicamente, também devem ser
aplicadas políticas que garantam as questões de privacidade e segurança, as quais devem
ser observadas ao longo de todo o processo que envolva o Big Data e a filosofia data-driven.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 4 de 9
Professor(a): Anderson Nascimento
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 5 de 9
Professor(a): Anderson Nascimento
1) Identificação dos dados relevantes: nessa fase, devem ser determinados os dados
necessários para a análise e tomada de decisão relacionada ao negócio;
2) Coleta de dados: após a identificação dos dados relevantes, deve-se estabelecer
mecanismos para coletar esses dados. Isso pode envolver a implementação de sistemas
transacionais e de ferramentas de integração de dados que permitam a realização dessas
extrações;
3) Armazenamento e organização: após a coleta, os dados devem ser armazenados
em repositório adequado, como um banco de dados, que permita o acesso e a manipulação
desses dados, de forma simples, e que traga flexibilidade, tendo em vista a conexão de
outras ferramentas de manipulação;
4) Limpeza e tratamento de dados: nessa etapa, trataremos os dados já coletados
e organizados – aqui serão realizadas tarefas de higienização, limpeza e tratamento dos
dados para garantir a qualidade e consistência;
5) Análise de dados: nessa fase, os dados já estão prontos para serem analisados,
e devemos aplicar técnicas diversas para extrair insights e informações úteis. Isso pode
envolver a execução de consultas SQL, a criação de visualizações gráficas e a aplicação de
algoritmos de aprendizado de máquina, para identificar padrões ou prever demandas futuras;
6) Aplicação dos resultados: agora, utilizamos os resultados das análises obtidas, a
partir da análise dos dados, para orientar as decisões e estratégias da empresa;
7) Monitoramento contínuo: por fim, é primordial termos um ciclo de monitoramento
contínuo dos dados definido, para que o processo possa continuar relevante e atualizado.
Mais uma vez, vale a pena citar que esse é apenas um exemplo de processo de datificação
que pode ser bastante útil se aplicado em um ambiente de Big Data.
3. Impulsionadores de Dados
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 6 de 9
Professor(a): Anderson Nascimento
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 7 de 9
Professor(a): Anderson Nascimento
Por fim, todos esses impulsionadores, e tantos outros, serão importantes para a
certificação de que os dados podem fornecer ideias valiosas para a tomada de decisões
estratégicas, impulsionando a datificação e a cultura data-driven.
Material Complementar
Referências
HURWITZ, Judith et al. Big Data Para Leigos. [s.l.]: Editora Alta Books, 2015. E-book.
ISBN 9786555206906. Disponível em: https://integrada.minhabiblioteca.com.br/#/
books/9786555206906/. Acesso em: 19 jun. 2023.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 8 de 9
Professor(a): Anderson Nascimento
MORAIS, Izabelly Soares de et al. Introdução a Big Data e internet das coisas (IOT).
Porto Alegre: SAGAH, 2018. Livro digital. (1 recurso on-line). ISBN 9788595027640. Dis-
ponível em: https://integrada.minhabiblioteca.com.br/books/9788595027640. Acesso
em: 19 jun. 2023.
SANTOS, Roger R.; BORDIN, Maycon V.; NUNES, Sergio E. et al. Fundamentos de Big Data.
[s.l.]: Grupo A, 2021. E-book. ISBN 9786556901749. Disponível em: https://integrada.
minhabiblioteca.com.br/#/books/9786556901749/. Acesso em: 19 jun. 2023.
O conteúdo deste livro eletrônico é licenciado para JHEFFERSON - 01038556104, vedada, por quaisquer meios e a qualquer título, a sua reprodução, cópia, divulgação ou
distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
faculdade.grancursosonline.com.br 9 de 9