Você está na página 1de 1

RESPOSTA:

A empresa OIL & CIA é uma petroleira que gera muitos dados multivariados, sobre este
cenário, a fim de colaborar para um melhor armazenamento, processamento e análise de
dados.

As características da Big data e os 5vs (1° VOLUME tamanho de dados produzidos / 2°


VELOCIDADE produção de dados / 3° VARIEDADE multiplicidade de tipos de arquivos /

4°VERACIDADE qualidade de dados / 5° VALOR armazenar dados)

Os dados coletados apresentam diversas formas. Eles podem estar estruturados em planilhas
Sistema ERP, podem semiestruturados ou não estruturados, como dados de redes sociais, ou
podem vir de uma rede de sensores sem fio que produzem informações como temperatura,
umidade ou pressão.

Os dados coletados podemos levar para dentro do sistema de arquivos HDFS utilizando o
serviço Sqoop do ecossistema Hadoop. Os dados estruturados, podemos usar o serviço Hive, e
ainda levar os dados não estruturados por meio de Flume, Kafka ou Spark Streaming para a
estrutura do Cassandra, Redis ou Hbase.

Você também pode gostar