Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
Experimente
Pesquisar
Premium grátis
Objetivo
Tutorial prático de implementação de um caso de uso Big Data, faz uso de algumas
funcionalidades básicas de tecnologias do ecossistema Hadoop e de relatórios
QlikView.
Duração
Público alvo
Entusiastas de tecnologia;
Pré-requisitos
Mensagens
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 1/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Pesquisar
Computador com configuração minima 4G de mémoria RAM e processador de 64 Experimente
Premium grátis
bits para execução da VM da Cloudera;
Arquitetura da solução
A seguir a Big Picture da Arquitetura de Solução Batch para realizar o caso de uso:
Metodologia de apoio
Caso ocorra erro em alguma etapa do tutorial, revise e resolva antes de avançar;
Você esta pronto? Então vamos começar!
O software em questão é um emulador de máquina virtual cuja ira executar a
máquina virtual linux da Cloudera.
Abaixo a perspectiva do VirtualBox Manager instalado com êxito:
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 2/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Acima a perspectiva da VM Cloudera iniciada com êxito pelo VirtualBox.
Nessa etapa será criada e carregada a base de dados MySQL cuja representa o "Sistema
de Multas" da solução, o qual é o sistema origem que prove os dados que serão
carregados pelo Sqoop no Hadoop HDFS.
3.1 Baixe o arquivo disponibilizado pelo link, o qual será utilizado para gerar a base de
dados completa: tabela, usuário e dados.
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 3/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
3.3 Execute o comando que cria a base de dados "DBMultas", o usuário "hive_multas"
e a tabela "TB_MULTAS" cuja é carregada com 1.000 registros:
source /home/cloudera/Downloads/TB_MULTAS.sql;
show tables;
A titulo de informação!, a base e os dados em
questão foram gerados com o excelente
"software free": https://mockaroo.com/
Nessa etapa a ferramenta Sqoop realiza a ingestão (carga) dos dados proveniente do
"Sistema de Multas" (MySQL) para o HDFS.
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 4/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Experimente
Pesquisar
Premium grátis
Baixe o arquivo disponibilizado pelo link, cujo contém a instrução Sqoop para fazer a
importação dos dados para o HDFS. Salve-o no diretório /home/cloudera/Downloads
4.2 Abra uma nova janela do console, copie o conteúdo do arquivo baixado e cole no
prompt para importar os dados do sistema de multas para o HDFS.
sqoop import \
--connect jdbc:mysql://localhost/DBMultas \
--username hive_multas \
--password hive_multas \
--table TB_MULTAS \
-m 1 \
--target-dir /user/cloudera/multas
Endereço: localhost:8888
Usuário: cloudera
Senha: cloudera
Nessa etapa a ferramenta Hive é utilizada para criação de uma Tabela Hive externa cuja
armazenará os metadados necessários e fornecera uma abstração para acessar os dados
armazenados no HDFS, utilizando uma linguagem próxima da linguagem SQL.
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 5/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Experimente
Pesquisar
Premium grátis
5.1 Baixe o arquivo disponibilizado pelo link, o qual será utilizado para gerar a base
completa. Salve-o no diretório /home/cloudera/Downloads
5.2 Abra uma nova janela do console e execute o seguinte comando para iniciar o Hive:
hive
5.3 Copie o conteúdo do arquivo baixado, cole no prompt para executar efetivamente o
comando que cria tabela externa:
5.4 Abaixo são executados alguns comandos para consultar via console o hive, e
certificar que ocorreu êxito na criação da tabela:
show tables;
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 6/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Experimente
Pesquisar
Premium grátis
6. Impala
Endereço: localhost:8888
Usuário: cloudera
Senha: cloudera
INVALIDATE METADATA
Nessa etapa são descritos os passos para realizar no sistema operacional Windows a
instalação do driver ODBC (componente de software adaptador que viabiliza a conexão
do QlikView ao Impala).
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 7/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
...
Preencha os campos da tela abaixo usando os próprios valores destacados na cor verde:
Certifique que a VM Cloudera esteja iniciada para que após clicar no botão "Test..."
seja exibido a seguinte tela cuja informa "conexão com sucesso!"
Nessa etapa são descritos os passos para realizar a instalação do QlikView no sistema
operacional Windows.
...
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 8/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
O QlikView faz uso do driver ODBC que foi
instalado no Windows para assim conectarse
ao Impala cujo executa as Queries.
É necessário informar qual será a tabela hive
que será utilizada como fonte de dados para
os relatórios.
Procedimento para carregar os dados na
memoria da máquina que esta executando o
QlikView, isto é, os dados são copiados do
Hadoop.
Média dos anos dos carros por gravidade da
multa
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 9/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Experimente
Pesquisar
Premium grátis
Media: carro_ano
Valor total de multas por sexo do motorista e
gravidade da multa
Soma: multa_valor
Quantidades de multas por local, motorista e
carro.
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 10/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Soma: id
Caso necessite baixe o código fonte que foi desenvolvido para os relatórios acima.
Gostou? Curta, comente ou fale comigo.
Abraços e até a próxima.
Sobre o Autor
Interesses
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 11/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
Academia Experimente
Pesquisar
Premium grátis
MBA em TI (USP).
Outro artigo
adriano.arquiteto.ti@gmail.com
Denunciar
92 gostaram
+82
14 comentários
Bernardo Duarte 4d
Business Intelligence Consultant
Adicione um comentário…
Seguir
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 12/13
01/01/2018 Big Data! Hands On: criando programas em Hadoop e relatórios em 90 minutos. | LinkedIn
https://www.linkedin.com/pulse/big-data-hands-criando-programas-hadoop-e-relat%C3%B3rios-adriano-gomes/?trackingId=AjM9sUZBnymjenywiQSLqg%3… 13/13