Escolar Documentos
Profissional Documentos
Cultura Documentos
Índice
Dynamic Cluster Pentaho Data Integration..........................................................................................2
HACK0001 – Configurando ambiente de desenvolvimento...........................................................2
HACK0002 – Configurando a Master.............................................................................................3
HACK0003 – Configurando a Máquina Slave................................................................................4
HACK0004– Configurando o Pentaho Data Integration.................................................................5
HACK0005– Criando uma transformação para usar Dynamic Cluster...........................................8
HACK0006– Execute ETLs usando Dynamic Cluster..................................................................16
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
<report_to_masters>Y</report_to_masters>
<slaveserver>
<name>slave1-8081</name>
<hostname>IP DO SERVIDOR SLAVE</hostname>
<port>9001</port>
<username>cluster</username>
<password>cluster</password>
<master>N</master>
</slaveserver>
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
</slave_config>
4. Após configurado, execute o carter da seguinte forma:
cd /opt/pentaho/data-integration
sh carter.sh /opt/pentaho/data-integration/pwd/carte-config-8081.xml
HACK0004– Configurando o Pentaho Data Integration
Após iniciar o PDI primeiro temos que declarar a Slave previamente criada e iniciada. Isso é bem
fácil.
1. Inicie o pentaho e crie uma nova transformação Ctrl + N ou File / Novo / Transformação.
2. Vamos em View no painel esquerdo, clique com o botão esquerdo do mouse na pasta “Slave
server” / Novo
3. Isso abrirá uma nova janela na qual você declarará Master como abaixo:
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Lembre-se de NÃO marcar a opção Is the master, pois se trata da maquina Slave (Escrava).
Em Hostname or IP Adress coloque o IP da maquina Slave que configuramos no
HACK0003.
5. Agora temos que declarar o Cluster. No painel esquerdo em View clique com o botão direito
do mouse em Kettle cluster schemas / Novo. Isso abrirá uma nova janela na qual você
preencherá os parâmetros do cluster: Basta digitar um novo nome para o Cluster e, em
seguida, clicar no botão “selecionar servidores”. Agora escolha os dois servidores que
criamos (Master e Slave), marque as opções Sockets data compressed? E Dynamic
Cluster.
Note que em “Master?” Você deve sinalizar qual é a Master e qual não é.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
5. Adicione um Filter Rows e configure para que faça dois fluxos utilizando o campo
anoUltimoPonto, configure como abaixo:
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
9. Agora vamos selecionar quais Steps serão executados em cluster dinamicamente, para isso
vamos selecionar os steps Nomes, Nome Completo, Add constants e Calculator 2 para rodar
dynamicamente, os steps Filter Rows, Calculator e Dummy serão executados local (ou seja
na Master). Clique com o botão direito no step Nomes, nas opções que apareceram clique
em “Clusters...”, em seguida selecione “Dynamic Cluster” e clique em OK. O step ficara
com uma observação “CxN” indicando que está sendo clusterizado.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Repita o mesmo processo para os steps: Nome Completo, Add constants e Calculator 2.
Salve a transformação.
10. Agora você precisa criar dois Runs Configurations. No painel esquerdo clique com o botão
direito em “Run Configuration / New”. O primeiro que vamos criar será o run para
transformação. De o nome de ClusterKtr, em Engine deixe como esta, em Settings marque a
opção Slave Server, em Location deixe Clustered e marque as opções Log remote execution
locally e show transformation. Agora crie outro chamado ClusterKjb, que será usado no job,
é o mesmo processo porém em Location selecione Master, como nos exemplos abaixo:
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
13. O Job deve ficar desta forma. Salve o job com o nome Hack-Dynamic-Cluster
14. Agora vamos executar o Job, clique em Run, em Run configuration selecione ClusterKjb e
clique em Run. Uma tela de log aparecerá. Agora você pode acessar o endereço do carter
que configuramos no HACK0002 e HACK0003. No meu caso minha máquina Master está
com IP 192.168.100.50 e minha máquina Slave está com IP 192.168.100.60.
Com um navegador acesse o endereço:
Para Master: 192.168.100.50:9001
Para Slave: 192.168.100.60:9001
Neste momento sera solicitado login e senha, em nossos hacks sera cluster / cluster para
ambos. Voce verá esta tela:
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
PARA MASTER:
PARA SLAVE
15. Clique Transformation name, você terá uma visão de quais Steps rodaram em Cluster
Dinâmico e quais rodaram local (master), abaixo um painel com relatório da integração e
log. PARA MASTER:
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
PARA SLAVE:
16. Note que nesta tela também podemos analisar a integração em momento de execução, parar
a integração, preparar uma nova e mostrar XML.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.
Todos os direitos reservados, este documento não pode ser compartilhado sem autorização prévia da Ambiente Livre Tecnologia
Uma versão atualizada pode ser adquirida no ambiente de EAD http://www.ambientelivre.com.br/saas/ead/ambientelivre/course/view.php?id=13 para alunos registrados.