Escolar Documentos
Profissional Documentos
Cultura Documentos
Licença
Esta obra está licenciada com uma Licença Creative Commons CC BY-NC. Que permite sua livre
distribuição para fins não comerciais, desde que mantida a autoria
Sobre o autor
Agradecimentos
Incialmente a Deus, pois devemos tudo a Ele. A minha família que sempre está ao
meu lado e também a você por estar lendo este e‐book.
Prefácio
O objetivo deste texto é transmitir a você leitor, um pequeno roteiro de implantação de projetos
de BI, baseado em mais de 20 anos de experiencia na área.
Definição do problema
A maioria dos insucessos nos projetos de BI devem-se a precariedade da definição do problema
que o BI se propõe a resolver. Todo projeto de BI serve para responder as perguntas que o
cliente faz sobre determinadas áreas para decidir suas ações.
Nesta fase definiremos o escopo do projeto, ou seja, as perguntas que nosso BI deverá
responder e quais requisitos serão necessários.
Mas como descobrir o problema que o cliente quer resolver? Como na figura acima, não adianta
ter a melhor ferramenta, os melhores profissionais e os melhores sistemas se eles NÃO atendem
as necessidades do cliente.
Uma dica para descobrir qual o problema que o cliente quer resolver é usando a técnica 5W2H
para descobrir e validar seu entendimento do problema.
Mas como funciona essa técnica? Ela serve para fazer um checklist de atividades específicas que
devem ser desenvolvidas com o máximo de clareza e eficiência por todos os envolvidos em um
projeto.
Caso não estejam disponíveis a TI ou o cliente deverá informar de onde você poderá utilizar os
dados necessários para o projeto.
É importante saber de onde saíram os dados para alimentar os nossos datamarts para evitar
problemas posteriores.
Esses dados vão compor os requisitos necessários para o desenvolvimento do data warehouse
e das consultas para que o BI responda as perguntas que o cliente colocou como objetivo do
projeto.
Modelagem do data warehouse
Mas antes de começarmos nossa modelagem, vamos conceituar o que são sistemas OLTP e
OLAP. Quando devemos usar cada um deles?
O OLTP, do inglês "On-line Transaction Processing", é o termo usado para se referir aos sistemas
transacionais, ou seja, os sistemas utilizados para controlar os processos nas organizações e que
dão suporte às operações do negócio.
Agora que você já sabe as diferenças entre OLTP e OLAP, chegou a hora de entender o que é e
como funciona um cubo analítico, ou seja, com foco total em análise de dados e extração de
informações estratégicas.
O nível gerencial e o nível estratégico da empresa utilizam o OLAP para as tomadas de decisões
e planejamento estratégico.
Veja na tabela abaixo o resumo das principais diferenças entre OLTP e OLAP:
OLTP OLAP
Segundo Bill Inmon : “É um banco de dados, orientado por assunto, integrado, não volátil e
histórico, criado para suportar o processo de tomada de decisão.”
Segundo Ralph Kimball : “Um armazém é uma cópia dos dados da transação especificamente
estruturado para consulta e análise.”
Nós conceituamos como sendo uma cópia das transações orientado por assunto, integrada, não
volátil e histórica que tem como finalidade suportar o processo de tomada de decisão através
de consultas e análises.
Como a maior parte dos dados vem de nosso sistema OLTP, devemos verificar pelo assunto que
o cliente quer trabalhar, qual a tabela que centraliza todos os processos do modulo do assunto.
Por exemplo: se precisamos descobrir qual o produto que vendeu mais no final de semana, para
clientes mulheres com mais de 25 anos? Depois comparar a venda desse produto nos demais
dias da semana? Teremos que criar um datamart de vendas com a tabela do sistema OLTP de
vendas sendo desnormalizada para ter todos os dados das dimensões que servirão de filtro para
as consultas.
O modelo mais utilizado para a criação dos datamarts é o esquema estrela, onde você tem uma
tabela fato, com todos os dados necessários para responder as perguntas, relacionado com as
dimensões que são os filtros das consultas.
Após a modelagem dos dados, devemos criar a estrutura necessária para o nosso data
warehouse/datamart em um banco de dados separado dos sistemas OLTP Se possível em outro
servidor exclusivo para o DW.
Desenho dos processos de ETL
ETL significa Extração, Transformação e Carga (em inglês Extract, Transform and Load) e visa
trabalhar com toda a parte de extração de dados de fontes externas ao DW. Esse processo busca
atender às necessidades de negócios e carga dos dados dentro do Data Warehouse ou Data
Mart.
EXTRAÇÃO: fase em que os dados são extraídos dos OLTPs e conduzidos para a staging area
(área de transição ou área temporária).
O processo de ETL é essencial para a carga das estruturas do Data Warehouse. É nele que
fazemos a ligação entre os sistemas OLTP e o OLAP.
Este processo deve ser bem planejado para evitar problemas futuros e para que não ocasione,
em alguns casos, a interrupção da operação da empresa. Neste processo, os dados são
transformados em informações, para apoiar as decisões organizacionais.
Um bom ETL deve ter escalabilidade e ser apto a ter manutenção. Como vamos tirar um retrato
dos dados da empresa e trata-los para transformar em informação, devemos analisar o tempo
para realizar a operação, pois como trabalha com grandes volumes de dados não é em qualquer
momento que ele poderá ser executado. Devemos também analisar a periodicidade de
execução em função das perguntas que o BI terá que responder.
Um processo bem definido e bem desenvolvido é fator primordial para obter êxito no projeto.
Esse processo, por acontecer na maioria das vezes fora do horário comercial das empresas, não
é visto pela área usuária, por conta disso muitas vezes ele é negligenciado. Mas sem o ETL não
temos BI.
Desenho dos dashboards
Vou citar algumas coisas que temos que levar em conta na construção dos nossos dashboards.
Várias abas não é uma boa opção. Tudo deve estar em uma só tela
Todos os relatórios e informações relevantes devem ser exibidos em uma única tela, sempre
que possível, ao fazê-lo, ele deve permitir analisar os dados de forma mais rápida e com maior
facilidade de compreensão.
Fica bem mais fácil de visualizar se todas as informações estiverem juntas, desta forma, é
possível entender a importância e significado global delas com maior precisão. Com isso,
permitimos comparações mais fáceis e rápidas entre os diferentes tipos de gráficos, bem como
a identificação de tendências e relações dentro do conjunto de dados global, levando a uma
percepção mais profunda. Um painel que é mais longo do que o comprimento de uma tela, e
requer o deslocamento, é menos eficaz. Isso ocorre porque não conseguimos ter uma visão do
todo e perdemos o inter-relacionamento entre elas.
Devemos evitar que os usuários se desloquem para cima e para baixo, em vez da sequencia da
tela. Além disso, os gráficos dentro do painel devem ser ordenados de uma forma que permite
o consumo mais rápido e fácil das informações. Por exemplo, o posicionamento de uma série de
cinco relatórios sobre um painel, onde o significado da primeira não pode ser plenamente
compreendido até que o usuário tenha lido o quarto, acarreta em má compreensão da
informação como um todo.
Personalização é fundamental
Os relatórios e visualizações associados devem ser personalizados para atender às necessidades
e demandas específicas do destinatário (individual ou grupo). Devem ser relevante para o papel
funcional dessa entidade para a organização, para apoiar a tomada de decisões adequadas e
oportunas de cada área. Em princípio, não tem muito sentido misturar informações de várias
áreas da empresa. Como por exemplo: permitir a equipe de marketing saber sobre as iniciativas
de RH?
Desordenar o painel com tipos de gráficos visualmente chamativos que resultam em um assalto
sobre os olhos, e, portanto, chamar a atenção para um único ponto acima de outros dados
exibidos
Conclusão
Um projeto de BI, para ter sucesso, deve ter a participação do cliente de forma efetiva, em
quase todas as fases.
Para chegar nesse nível de disputar com seu cliente, sobre os processos do negócio dele, você
precisará de anos de experiencia e vivência na atividade que seu cliente vive cada dia. Então não
se iluda e aceite que ele sabe mais que você do que ele precisa. Dói menos!
Para exemplificar, a um tempo atrás, fui convidado a desenvolver um projeto de BI para uma
grande empresa de varejo. Eu já tinha na época muita experiencia com banco de dados e
desenvolvimento de ERPs, mas mesmo assim, fiquei durante um mês revisando os processos do
meu cliente e descobrindo o que ele precisava de informações para que o BI desse a ele
informações sobre a área comercial. Depois levamos uma semana para montar todas as
consultas que tinham drill-dawm, pivotamento, relatórios e gráficos. Esse projeto, foi um
sucesso, case apresentado em congresso nacional de informática e ficou durante muitos anos
no ar.
Ferramenta Site
Tableau http://www.tableau.com/
Microsoft Power BI https://powerbi.microsoft.com/pt-br/
Pentaho https://sourceforge.net/projects/pentaho/
IBM WATSON ANALYTICS https://www.ibm.com/br-pt/marketplace/watson-
analytics#product-header-top
QlikView https://www.qlik.com/pt-br
Suporte
Verifique se, no contrato, está incluído o valor da manutenção e suporte. Porque normalmente
esse tipo de ferramenta precisa de um período de adaptação e, certamente, sua equipe
necessitará de apoio durante esse período.
Avaliação
Procure por feedbacks dos usuários e avalie como está o grau de satisfação deles, com relação
ao fabricante da ferramenta. Importante identificar quando o problema é da consultoria ou é
da ferramenta. Obtenha o máximo de informações possíveis para fazer a escolha certa e não se
arrepender posteriormente.
A cada dia surgem novas ferramentas prometendo soluções milagrosas, por isso, fique atento e
seja sensato no momento da escolha. O BI é uma atividade que vem profissionalizando a
maneira como as pessoas tomam decisões e como as empresas se posicionam no mercado.
Até breve!