Bem-vindo(a) ao Scribd!

6.formatos de Big Data

Enviado por

0% acharam este documento útil (0 voto)

13 visualizações7 páginas

O documento discute formatos de armazenamento de dados para Big Data, comparando armazéns de dados clássicos e modernos. Os formatos modernos tendem a ser abertos, desacoplados de ferramentas e binários/compactados. Exemplos de formatos para Big Data incluem Parquet, ORC e Avro, cada um com suas próprias vantagens para escrita ou leitura de dados. O documento recomenda testes de desempenho para escolher o melhor formato em cada caso.

Descrição original:

Título original

6.Formatos de Big Data

Direitos autorais

Formatos disponíveis

PDF, TXT ou leia online no Scribd

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Denunciar este documento

Direitos autorais:

Formatos disponíveis

Baixe no formato PDF, TXT ou leia online no Scribd

Sinalizar o conteúdo como inadequado

0% acharam este documento útil (0 voto)

13 visualizações7 páginas

6.formatos de Big Data

Enviado por

klinsmann oliveira

Direitos autorais:

Formatos disponíveis

Baixe no formato PDF, TXT ou leia online no Scribd

Sinalizar o conteúdo como inadequado

Pular para a página

Você está na página 1de 7

Pesquisar no documento

Formatos de Big Data

Armazéns de Dados Clássicos

Formatos Proprietários
Armazéns de Dados Modernos
Formatos Abertos
Formatos para
Big Data
• Armazéns de dados modernos
tendem a armazenar dados em
formatos “desacoplados” de
ferramentas e abertos
• Formatos binários, compactados
Formatos para • Suportam Schema
Big Data • Podem ser particionados entre
discos:
• Redundância
• Paralelismo
• Parquet – Colunar, padrão do
Spark
• ORC – Colunar, padrão do Hive
• Avro – Linha
Formatos • Muito atributos e mais escrita –
linha
• Menos atributos e mais leitura,
coluna
• Em geral ORC é mais eficiente na
criação (escrita) e na compressão
• Parquet tem melhor performance
Qual escolher? na consulta (leitura)