Você está na página 1de 40

PONTIFCIA UNIVERSIDADE CATLICA DE MINAS GERAIS

Instituto de Educao Continuada Especializao em Engenharia de Software

Inteligncia de Negcio com

Aline Marques, Dayseana Guimares, Jaqueline Magalhes e Kelly Fula

Turma 26

INTRODUO
O Pentaho que um poderoso software de Inteligncia de Negcios.

Possui componentes que permitem criar solues para


problemas do mundo real.

Oferece recursos de apoio tomada de deciso

Foi desenvolvido em Java e possui duas verses - Enterprise Edition e Community Edition

uma sute de BI

Possui um conjunto de componentes integrados

Pentaho

Permite criar e entregar solues de BI

Oferece funcionalidades bsicas e complexas

SUITE PENTAHO BI

PERSPECTIVAS DA SUITE PENTAHO BI

O SERVIDOR DE INTELIGNCIA DE NEGCIOS PENTAHO



uma coleo de programas que trabalham em conjunto para fornecer uma srie de funes essenciais para a Suite Pentaho. O servidor Pentaho pode ser dividido em trs camadas:

PLATAFORMA
Componentes que oferecem funcionalidades suporte

COMPONENTES DE BI
Componentes que oferecem tpicas funcionalidades de inteligncia negcio.

CAMADA DE METADADOS
Capaz de gerar o SQL a partir do MQL A MQL criada pelo usurio final atravs da seleo de um conjunto de objetos expostos em um modelo de metadados

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

CAMADA DE APRESENTAO DO PENTAHO


Permite ao usurio final interagir com servidor

uma interface web embutida no Pentaho

Pode ser usada para navegar e abrir e criar contedo de BI

Console de usurio

PROGRAMAS DESKTOP

INTEGRAO DE DADOS COM PENTAHO


o processo de preenchimento com dados do data warehouse projetado

Extrao (Extraction):

Transformao (Transformation):

Carregamento (Loading):

compreende a aquisio de dados de um ou mais sistemas de origem.

muda a forma e/ou contedo dos dados para se encaixar na estrutura do data warehouse de destino.

envia os dados para o data warehouse de destino.

INTEGRAO DE DADOS COM PENTAHO


O processo ETL trata de uma categorizao muito ampla de atividades de integrao de dados. Em cada um dos processos h uma srie de atividades de apoio:
Atividade de extrao Captura de dados alterados: visa identificar os dados que foram alterados desde a ltima extrao. Teste de dados: os dados so armazenados temporariamente em uma rea de teste e chamados imediatamente aps a extrao. Atividade de transformao Validao de dados: processo de verificao dos dados de origem, se esto corretos e se os filtros de dados so vlidos. Limpeza de dados: a atividade de correo de dados invlidos. Decodificao e renomeao: processo de transformao converte os dados em nomes mais descritivos e amigveis aos usurios. Agregao: so dados calculados previamente para serem apresentados aos usurios finais. Gerao e gesto de chaves: os novos fatos do data warehouse possuem chaves substitutas para identificar cada linha.Estas chaves sero utilizadas para posteriores consultas. Atividade de carregamento

Carregar tabelas de fatos: adio de novas linhas com novos dados. Carga e manuteno de tabelas de dimenso: novas linhas de fatos podem dar origem a novas linhas de dimenso.

CONCEITOS DE INTEGRAO DE DADOS E COMPONENTES COM PENTAHO

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

MINERAO DE DADOS COM WEKA

Data Mining is the non-trivial process of identifying valid, novel, potentially useful, and ultimately understandable patterns in data.
U. M. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, From DataMining to Knowledge Discovery: An Overview, in Advances in Knowledge Discovery and Data Mining, edited U.MFayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, AAAI Press/MIT Press, pp. 1-34, 1996.

PROCESSO DE DADOS DE MINERAO

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

CONJUNTO DE DADOS FERRAMENTA DE MINERAO

Classificao

Clustering

Associao

Previso numrica (Regresso)

o processo de diviso de um conjunto de dados em grupos mutuamente exclusivos.

semelhante classificao quando identifica e agrupa os elementos que possuem caractersticas do conjunto de aes ordinrias. A diferena, que, o algoritmo de determinao dos grupos trabalha com base na seleo de um ou de todos os dados disponveis, a classificao j tem os grupos definidos. Outra diferena aprendizagem supervisionada (classificao) versus no-supervisionada (clustering).

A associao tenta descobrir qual a relao entre dois ou mais elementos de dados em um conjunto de dados.

Intuito de prever um resultado numrico com base em eventos passados.

ALGORITMOS DE MINERAO DE
DADOS

Instrumentos tais como, rvores de deciso ou algoritmos de regras. Algoritmos suficientemente poderosos do ponto de vista de previso.

TREINAMENTO E TESTE
Treinamento Testes

EXEMPLO DE USO DO PENTAHO

http://www.estatisticasfutebolbrasileiro.com/

CAMADA DE METADADOS DO PENTAHO

Em um sentido geral, metadados, significa dados que descrevem outros dados.''

A plataforma Pentaho oferece seu prprio mecanismo de armazenamento e acesso a metadados.

VANTAGENS DA CAMADA DE METADADOS DO PENTAHO

Interface de usurio Obtm informaes que querem, em

Poltica de acesso aos dados

permitindo que os mais amigvel. Impacto de mudanas limitado.


Implementao

relatrios sejam adaptados para cada idioma.

um formato que
possam compreender, a partir do repositrio de dados. Usurios de negcios

mais refinada.

Esquema de BD

Suporta vrios locales

CAMADA DE METADADOS DO PENTAHO

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

SUBCAMADAS DA CAMADA DE METADADOS DO PENTAHO

Camada de Apresentao
Camada Lgica
A forma como os objetos a partir da camada fsica relacionam com o negcio. Modelos de Negcios, Tabelas de negocio e colunas de negocio, Relacionamentos.

Camada Fsica
Descritores que correspondem aos objetos de banco de dados. Conexes, Tabelas Fsicas e Colunas de tabelas fsicas.

Contem os objetos de metadados que so visveis ao usurio final. Vises e categorias de negcios

CAMADA DE METADADOS DO PENTAHO

Metadados inseridos pelo banco de dados, assim como os inseridos pelo usurio so definidos usando o Editor de Metadados Pentaho (PME) e armazenados no repositrio de metadados.

Usando as ferramentas de design de relatrio do Pentaho, os usurios finais podem criar reltorios sobre os metadados, sem necessrio conhecimento de detalhes fsicos do banco e de SQL, atravs de uma interface grfica de usurio.

FERRAMENTAS DE RELATRIO

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

FERRAMENTAS DE RELATRIO
Construtor de relatrio
Especificao do relatrio Mecanismo de relatrio Conexo com o banco de dados

Permite definir a especificao do relatrio.

Em formato aberto XML.

Permite executar o relatrio de acordo com a especificao e processar a sada em diferentes formatos.

Permite utilizar o padro middleware, como JDBC para conexo com fontes de dados diferentes.

FERRAMENTAS DE RELATRIO

O Report Designer Pentaho (PRD) a interface grfica para criao, edio e publicao de relatrios para a plataforma Pentaho BI.

Um relatrio dividido em vrias sees de diferentes tipos tais como cabealho e corpo do relatrio, estas sees so flexveis e podem ser adicionadas ou removidas atravs do PRD.

As propriedades que podem ser alteradas usando o PRD. Propriedades so divididas em estilos e atributos, onde o estilo usado para determinar a aparncia do elemento, e os atributos determinam o contedo e o comportamento de um elemento.

FERRAMENTAS DE RELATRIO

Criando conjuntos de dados


PRD pode recuperar dados de vrias fontes de dados, voc ainda pode usar JavaScript como uma fonte de dados. A forma mais comum de construir consultas, no entanto, a utilizao de uma conexo JDBC ou os arquivos de metadados Pentaho.

A parte mais importante da criao de um relatrio determinar quais dados devem ser exibidos e, no caso de PRD, como os dados so agrupados e agregados.

EXEMPLO DO USO DO PENTAHO NA ANLISE DOS AEROPORTOS

http://ison.stratebi.es/aerobrasil/

SOLUES OLAP UTILIZANDO O PENTAHO ANALYSIS SERVICES (PAS)


Permite analisar os dados do banco de dados, fornecendo uma interface de estilo de tabela de referncia cruzada em diferentes dimenses, como por exemplo:

Produto

Tempo

Cliente.

VISO GERAL DO PENTAHO ANALYSIS SERVICES (PAS)


O Mondrian recebe consultas MDX de ferramentas front-end, com o JPivot, e responde enviando um conjunto de resultados multidimensional. O Schema Workbench a ferramenta visual para projetar e testar os cubo do Mondrian. O Mondrian usa o Schema para interpretar o MDX e traduzir em consultas SQL.

O JPivot uma ferramenta de anlise que oferece uma interface para usurio final trabalhar com cubos OLAP.

PAS composto de quatro componentes

O Aggregate Designer uma ferramenta visual para a gerao de tabelas agregadas para acelerar o desempenho do motor analtico.

ARQUITETURA DO PAS
O navegador web do usurio final faz uma solicitao HTTP para visualizar e navegar em uma tabela dinmica OLAP.

O JPivot recebe o pedido e transforma-o em uma consulta MDX. A consulta MDX enviada para o motor Mondrian.

O Mondrian interpreta a consulta MDX e traduz em uma ou mais Consultas SQL.

O RDBMS executa as consultas emitidas pelo Mondrian

O Mondrian processa os resultados recebidos do RDBMS e traduz em um conjunto de resultados multidimensional.

O JPivot utiliza uma pgina HTML para exibir os dados multidimensional, que enviado como resultado para o navegador do usurio.

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

a sigla para expresses multidimensionais

As consultas MDX operam em um cubo e entregam um resultado multidimensional.

uma linguagem utilizada consultar o banco de dados OLAP.

OLAP MDX

um modelo multidimensional

Padro desenvolvido pela Microsoft.

CUBOS DE ANLISE PENTAHO


Cubo
Um cubo simplesmente uma coleo de mltiplas dimenses De acordo com a figura, o cubo composto pela dimenses tempo, produto, e cliente como dimenso, cada uma colocada em um dos lados do cubo. Observando o cubo, cada cliente, produto, e tempo no cubo tem um cruzamento chamado tupla. Cada tupla pode ser uma clula individual ou uma seo no cubo, que podem conter uma ou mais medidas.

Dimenso
pedra fundamental dos cubos OLAP. Os atributos que das dimenses, tais como como vendas, custo e quantidade, so chamados de medidas. EStas medidas representam um valor agregado. A coleo de medidas chamada de dimenso.

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

PAINIS DE CONSTRUO (DASHBOARDS)

um aplicativo Usado para apresentar contedo de BI para os usurios finais.

Contm indicadoreschave Que mostram o desempenho de algum aspecto do negcio, como por exemplo, vendas ou da empresa como um todo.

Forma grfica As mtricas so simbolizadas com fotos, medidores, mostradores e grficos.

Viso geral do negcio Permitindo que os gerentes de negcios possam avaliar o estado de relance.

Indicadores grficos de alto nvel Fornecem interatividad e ao usurio que permite detalhar o contedo de inteligncia de negcios, tais como relatrios ou cubos OLAP.

DASHBOARD FRAMEWORK COMUNIDADE

Os Dashboards do CDF so pginas web que usam a tecnologia AJAX, que combinam componentes de BI, tais como relatrios, grficos, tabelas OLAP, e mapas.

A Comunidade Dashboard Framework (CDF)

um conjunto de tecnologias de cdigo aberto que permite aos desenvolvedores de BI construir dashboards dinmicos para o Servidor BI Pentaho.

CDF DASHBOARDING
1. O usurio final utiliza o navegador e um pedido de HTTP enviado para o servidor Pentaho BI. 2. O servidor Pentaho BI recebe o pedido (contendo nome e o caminho p/ localizar o painel de arquivo .xcdf) e reconhece que deve servir a um painel.

4. A pgina web recebida pelo navegador onde ele lido e renderizado para exibio. O painel inicializado.

3. O arquivo .xcdf especifica o modelo de contedo do painel que combina com o painel de instrumentos de um documento modelo para montar uma pgina web.

5. Os componentes respondem a comandos (atualizao) emitidos pelo objeto.

6. O Servidor Pentaho recebe pedidos enviados pelos componentes, que solicitam a execuo de uma seqncia de ao.

FONTE: BOUMAN, Roland; DONGEN ,Jos van.

7. O servidor Pentaho executa a seqncia de ao

EXEMPLO DE USO DO PENTAHO


Este aplicativo mostra, de diversas maneiras, os investimentos realizados nas Obras do PAC (Programa de Acelerao do Crescimento). Atravs de Pains e Anlises OLAP voc poder cruzar os dados e saber como est sendo investido o dinheiro.

Painel de Controle dos Empreendimentos

Cubo OLAP - Aplicativo Obras do PAC

Fonte: http://www.it4biz.com.br/apps/dados.gov.br/obrasdopac/

REFERNCIAS:

BOUMAN, Roland; DONGEN ,Jos van. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL

Você também pode gostar