Pentaho Data Integration (PDI, ou Kettle) um componente da
sute do Pentaho responsvel pelos processos de ETL. Pentaho Suite Kettle Apesar de ferramentas de ETL serem usadas em projetos de data warehouse, PDI pode tambm ser usado para:
Migrao de dados entre aplicaes/banco de dados
Exportar dados de banco de dados para arquivos texto
Carregar massivamente dados em banco de dados
Data Cleansing disciplina de qualidade/limpeza de dados de data warehouse
Integrao de aplicaes. Aplicaes
Spoon - ferramenta grfica com que se desenha e testa todo processo do PDI
Pan - Programa que pode executar transformaes desenhadas no Spoon e
que estejam tanto em arquivos como em repositrios em banco de dados.
Kitchen -ferramenta usada para executar Jobs a partir de janelas de terminais.
Carter Suporte a configurao de SOA.
Transformao
Rotina com coleo de passos
interligados
O primeiro a fonte de dados
O ltimo representa a sada de dados.
Pode ser colocadas varias fontes
de dados e sadas
recomendado 1 transformao para
Steps Um passo uma unidade mnima dentro de uma transformao.
Grande variedade de passos
Agrupada em categorias ( input , Output, etc)
Os tipos bsicos so : entrada, transformao,
sada Hops
Representao grfica do fluxo de dados entre dois passos (conexo)