Você está na página 1de 2

Exercício Hive

1. Verificar os dados na pasta user/aluno/data


arquivo_geral.csv
Se não existir, criar:

 mkdir home/input
 cd home/input
 curl -O https://opendatasus.saude.gov.br/pt_BR/dataset/a2cfca72-d8e8-
4878-b7f5-d97535a991d5/resource/77d8d14a-cf8c-4209-bed3-
3b63ed63fd4f/download/arquivo_geral.csv

2. Mover os dados para o hdfs:


user/aluno/data/
3. Criar o banco de dados “treinamento”
4. Criar a Tabela Hive no BD treinamento

 Tabela externa: tb_dados_covid_ext

Campos:

 regiao string,
 estado string,
 data string,
 casosnovos int,
 casosacumulados int,
 obitosnovos int,
 obitosacumulados int

Propriedades

 Delimitadores: Campo ‘;’ | Linha ‘\n’


 Local ‘user/aluno/data/’
 Sem Partição
 Tipo do arquivo: Texto

5. Visualizar a descrição da tabela tb_dados_covid

6. Verificar as 5 primeiras linhas da table tb_dados_covid

7. Contar linhas da tabela tb_dados_covid

8. Criar a Tabela Hive no BD treinamento


 Tabela interna: tb_dados_covid_mng

Campos:

 regiao string,
 estado string,
 data string,
 casosnovos int,
 casosacumulados int,
 obitosnovos int,
 obitosacumulados int

Propriedades

 Delimitadores: Campo ‘;’ | Linha ‘\n’


 Partição = dt_particao
 Tipo do arquivo: Texto
 tblproperties("skip.header.line.count"="1")’

8. Inserir dados da tabela externa para interna

9. verificar partições da tabela

Você também pode gostar