Você está na página 1de 1

Exercício HDFS

1. Iniciar o cluster de Big Data


docker start $(docker ps -a -q)
2. Acessar o container do namenode.
3. Baixar os dados dos exercícios do treinamento na pasta home/input

 mkdir home/input
 cd home/input
 curl -O https://opendatasus.saude.gov.br/pt_BR/dataset/a2cfca72-d8e8-
4878-b7f5-d97535a991d5/resource/77d8d14a-cf8c-4209-bed3-
3b63ed63fd4f/download/arquivo_geral.csv

4. Criar a estrutura de pastas apresentada a baixo pelo comando: $ hdfs dfs -ls
-R /
user/aluno/data
5. Enviar arquivo “/input/arquivo_geral.csv” para user/aluno/data
6. Verificar as 5 primeiras linhas do arquivo “arquivo_geral.csv”
7. Mostrar ultimas linhas do arquivo “arquivo_geral.csv”
8. Contar linhas do arquivo “arquivo_geral.csv”
9. Criar um arquivo em branco com o nome de “test.txt” em aluno/data
10. Apagar arquivo “test.txt”
11. Exibir o espaço livre e o uso do disco
hdfs dfs -df -h /

Você também pode gostar