Escolar Documentos
Profissional Documentos
Cultura Documentos
- Metadados: É possível definir metadados como dados que explicam outros dados.
-Crawler criado.
No painel da AWS Glue > Crawler, podemos ver que não tem nenhum agendamento de
execução, pois criamos o crawler sob demanda, estão precisamos executar
manualmente, para isso selecionar o crawler > Executar crawler. Esse crawler vai
ler os arquivos do tipo parquet.
Agora no painel AWS Glue > Seleciona database > podemos verificar uma tabela criada
> essa tabela foi criada pelo crawler e possui todos os metadados da tabela do S3.
Pode-se verificar que os metadados foram reconhecidos:
- Nome da tabela
- Location que é a localuzação no S3
- Database da Glue
- Classification que o tipo de arquivo parquet nesse caso
- Input format e Output format, são o formato de entrada e saida de
dados
- Em "Serde serialization lib" foi definido a biblioteca de
serialização que deve ser usada para ler os arquivos parquet, spark, hive, athena
vão usar.