Escolar Documentos
Profissional Documentos
Cultura Documentos
1
AULA 02 – CIÊNCIA DE DADOS
Prof. Roberson Alves
2
AGENDA
✓Big Data
✓Atividade prática
3
BIG DATA: V’S
▪O Big Data e a definição dos seus V’s:
▪Volume
▪Velocidade
▪Variedade
▪Valor
▪Veracidade
4
BIG DATA: V’S
▪ Exemplo: Projeto para Cidades Inteligentes
▪ Volume (Volume): Uma empresa de soluções para cidades inteligentes coleta uma
grande quantidade de dados de sensores instalados em toda a cidade. Isso inclui
informações sobre tráfego, consumo de energia, qualidade do ar, níveis de ruído,
sensores de estacionamento e muito mais. O volume massivo de dados requer
soluções escalonáveis de armazenamento e processamento para lidar com a
quantidade de informações geradas.
▪ Velocidade (Velocity): Sensores de tráfego em tempo real coletam informações sobre
congestionamentos, padrões de tráfego e velocidade dos veículos. Esses dados são
processados instantaneamente para otimizar os semáforos e gerar informações em
tempo real para os motoristas sobre rotas mais eficientes, contribuindo para uma
melhor gestão do tráfego na cidade.
▪ Variedade (Variety): A empresa coleta uma variedade de dados, incluindo dados de
sensores, informações de redes sociais, dados governamentais, registros médicos
eletrônicos e dados climáticos. A análise combinada desses diferentes tipos de dados
permite que a cidade tome decisões mais informadas sobre planejamento urbano,
5
serviços públicos e segurança.
BIG DATA: V’S
▪ Veracidade (Veracity): A empresa integra dados de várias fontes,
incluindo sensores e dados de dispositivos IoT (Internet das
Coisas). No entanto, nem todos os dados são garantidamente
precisos. Portanto, a empresa deve implementar técnicas de
qualidade de dados para garantir que as informações coletadas
sejam confiáveis e precisas.
• Objetivos:
• Compreender os conceitos dos 5Vs do Big Data: Volume, Velocidade,
Variedade, Veracidade e Valor;
• Aplicar os conceitos dos 5Vs a um cenário do mundo real;
• Desenvolver habilidades de análise e tomada de decisões com base nos
desafios do Big Data.
• Avaliação
• Nota de autoavaliação(nota até 3); e
• Avaliação do time pelo professor(nota até 5);
• Com base em: sua participação na discussão em time, na precisão e
profundidade de suas análises dos 5Vs e na qualidade de suas
apresentações. 7
BIG DATA – ATIVIDADE PRÁTICA
• Organização
• Formar times com até 4 pessoas;
• Selecionar um cenário do mundo real
com base áreas de desenvolvimento
regional(a seguir) – professor indica a
área para cada time;
• Pesquisem dados e informações de
cenários que ajudem a correlacionar
com os 5Vs.
8
BIG DATA – ATIVIDADE PRÁTICA
9
BIG DATA – ATIVIDADE PRÁTICA
10
BIG DATA – ATIVIDADE PRÁTICA
11
BIG DATA – ATIVIDADE PRÁTICA
• Análise dos 5Vs(1h)
Volume:
Quanta quantidade de dados é gerada, coletada ou processada no cenário escolhido?
Como o aumento do volume de dados afeta a capacidade de armazenamento, processamento e análise?
Quais desafios surgem ao lidar com grandes volumes de dados e como eles são abordados no cenário?
Velocidade:
Como os dados são gerados, atualizados ou coletados no cenário? Eles são gerados em tempo real ou em
intervalos específicos?
Qual é a velocidade de geração ou coleta de dados e como isso afeta a capacidade de análise em tempo
real?
Quais estratégias são usadas para lidar com a velocidade dos dados e garantir que a análise seja eficaz e
em tempo hábil?
Variedade:
Que tipos de dados estão presentes no cenário? Eles são estruturados, semi-estruturados ou não
estruturados?
Como a variedade de dados afeta a forma como eles são armazenados, processados e analisados?
Quais são os desafios de lidar com dados de diferentes formatos e como esses desafios são superados? 12
BIG DATA – ATIVIDADE PRÁTICA
• Análise dos 5Vs(1h)
Veracidade:
Como a qualidade e a precisão dos dados são garantidas no cenário?
Quais são os métodos utilizados para validar a integridade e a
autenticidade dos dados?
Como as fontes de dados são verificadas quanto à confiabilidade e quais
são as implicações de dados imprecisos ou incorretos?
Valor:
Como os dados são transformados em informações valiosas no cenário?
Quais insights ou benefícios podem ser extraídos da análise dos dados?
Como as análises de Big Data contribuem para a tomada de decisões ou
aprimoramento das operações no cenário escolhido? 13
BIG DATA – ATIVIDADE PRÁTICA
• Apresentação(5 minutos cada time)
• Cada time deve apresentar suas descobertas sobre o
cenário e sua análise dos 5Vs. Podem usar gráficos, tabelas
ou exemplos específicos para ilustrar seus pontos.
14