Você está na página 1de 10

Pentaho Data Integration (PDI, ou Kettle)

Pentaho Data Integration (PDI, ou Kettle) um componente da


sute do Pentaho responsvel pelos processos de ETL.
Pentaho Suite
Kettle
Apesar de ferramentas de ETL serem usadas em projetos de data warehouse, PDI pode tambm ser
usado para:

Migrao de dados entre aplicaes/banco de dados

Exportar dados de banco de dados para arquivos texto

Carregar massivamente dados em banco de dados

Data Cleansing disciplina de qualidade/limpeza de dados de data warehouse

Integrao de aplicaes.
Aplicaes

Spoon - ferramenta grfica com que se desenha e testa todo processo do PDI

Pan - Programa que pode executar transformaes desenhadas no Spoon e


que estejam tanto em arquivos como em repositrios em banco de dados.

Kitchen -ferramenta usada para executar Jobs a partir de janelas de terminais.

Carter Suporte a configurao de SOA.


Transformao

Rotina com coleo de passos


interligados

O primeiro a fonte de dados

O ltimo representa a sada de dados.

Pode ser colocadas varias fontes


de dados e sadas

recomendado 1 transformao para


Steps
Um passo uma unidade mnima dentro de uma
transformao.

Grande variedade de passos

Agrupada em categorias ( input , Output, etc)

Os tipos bsicos so : entrada, transformao,


sada
Hops

Representao grfica do fluxo de dados entre dois passos (conexo)

Um deles Origem e outro Destino.


Jobs

uma rotina de execuo

Pode executar uma ou mais transformaes

Utilizado para cargas de tabelas fatos

Você também pode gostar