Você está na página 1de 63

DEPARTAMENTO DE COMPUTAÇÃO

CURSO DE PÓS-GRADUAÇÃO EM ENGENHARIA DE SOFTWARE COM UML


“LATO-SENSU”

Flavio Eduardo Aoki Horita

BUSINESS INTELLIGENCE (BI) APLICADO EM UM SISTEMA AGROPECUÁRIO

Londrina
2011
FLAVIO EDUARDO AOKI HORITA

BUSINESS INTELLIGENCE (BI) APLICADO A UM SISTEMA AGROPECUÁRIO

Trabalho de Conclusão de Curso apresentado à


Banca Examinadora do Curso de Especialização em
Engenharia de Software com UML do Centro
Universitário Filadélfia de Londrina - UNIFIL como
requisito parcial para obtenção do Grau de
Especialista em Engenharia de Software com UML
sob a orientação do Professor MSc. Sergio Akio
Tanaka.

LONDRINA
2011
FLAVIO EDUARDO AOKI HORITA

BUSINESS INTELLIGENCE (BI) APLICADO EM UM SISTEMA AGROPECUÁRIO

Trabalho de Conclusão de Curso apresentado à Banca Examinadora do Curso de


Especialização em Engenharia de Software com UML do Centro Universitário Filadélfia
de Londrina - UNIFIL em cumprimento a requisito parcial para obtenção do título de
Especialista em Engenharia de Software com UML.

APROVADA PELA COMISSÃO EXAMINADORA

EM LONDRINA, 30 DE MARÇO DE 2011.

Prof. MSc. Sergio Akio Tanaka (UNIFIL) - Coordenador (a)


do Curso

Prof. MSc. Sergio Akio Tanaka (UNIFIL) - Orientador (a)

Prof. MSc. Ruy Tsutomu Nishimura (UNIFIL) -


Examinador
Dedico a toda minha família, especialmente a meus pais, Carlos Eduardo
Hiroshi Horita e Clarice Maria Aoki Horita, irmã, Camila Aoki Horita.
Uma dedicação especial a minha namorada, Bruna Rafaela Belavenute, que
sempre esteve presente ao longo do curso me dando suporte e conselhos sempre
que precisei.
AGRADECIMENTOS

Primeiramente a Deus que me deu forças para concluir, mas esta etapa da minha
vida com excelência e sabedoria.

A minha namorada, Bruna, pelo apoio e paciência nas minhas dificuldades e


companheirismo nas minhas felicidades.

Aos meus pais, Carlos e Clarice, que desde a minha graduação me ensinaram que o
conhecimento é o único bem que ninguém tirar de nós e por isso sempre ofereceram
suporte, apoio e incentivo para que eu pudesse realizar mais este trabalho.

Ao pessoal da empresa LidaWeb em particular nas pessoas do Prof. Msc. Ademir


Padilha e meu companheiro de trabalho Luiz Paulo de Oliveira que ao longo do
trabalho estiveram sempre presente ajudando repassando seus conhecimentos e
experiências.

Ao meu orientador, Prof. Msc. Sergio Tanaka, que com toda paciência esteve
sempre corrigindo, auxiliando, orientando, ajudando com conselhos e conversas que
enriqueceram e muito este trabalho.

Aos meus grandes amigos, parceiros e irmãos, Guilherme Nunes Lobo e Fabio
Weiler Almeida, meu primo Vitor Daniel Horita e Willian Yudi Yagui, que estiveram
presentes durante o desenvolvimento do projeto com suas ideias mirabolantes,
porém muito estimulantes.

A todos que participaram da avaliação deste trabalho.

A todos que direta e indiretamente ajudaram para o sucesso desta empreitada.


“Numa escala mais humana, os produtos de software intensivos ajudaram a
curar o doente e deram voz ao mudo, mobilidade ao debilitado e oportunidade ao
incapacitado. De todas essas perspectivas, o software é uma parte indispensável de
nosso mundo moderno”. (Grady Brooch, 1998).
HORITA, F. E. A. Business Intelligence (BI) aplicado em um Sistema
Agropecuário. Londrina, 2010. 62f. Trabalho de Conclusão de Curso (Especialista
em Engenharia de Software) – Especialização em Engenharia de Software com
UML, Centro Universitário Filadélfia de Londrina - UNIFIL, Londrina, 2010.

RESUMO

O Business Intelligence (BI) consiste na utilização de um conjunto de ferramentas


tecnológicas para o processamento de dados procurando construir informações ou
identificar padrões técnicos em tempo hábil para a tomada de decisão em uma
organização. Para tanto, este trabalho procura aplicar o BI em um sistema voltado
para a gestão do agronegócio a fim de que as informações fornecidas por ele sejam
utilizadas para elaborar um benchmarketing comparativo entre os produtores rurais
das chamadas Redes de Propriedades de Referência. De posse destas
informações, um conjunto de referências sociais, técnicas e econômicas serão
identificadas e resultaram em indicadores de desempenho (KPI – Key Performance
Indicators) que serviram para a elaboração de uma cartilha com as melhores
práticas dentre as propriedades da rede. Esta cartilha será elaborada com o objetivo
de diminuir custos de produção, desperdício de materiais e aumentar em sua
essência a produção das propriedades. Além disso, este trabalho apresenta uma
proposta de modelagem dimensional para análise de informações financeiras do
ambiente proposto, suas rotinas de extração, transformação e carga dos dados
localizados nas bases de dados que compõe o ambiente de produção para o Data
Warehouse (DW) utilizado pelo BI. Para a aplicação foi utilizado às ferramentas que
a suíte Pentaho Open Source Community aplicadas na base de dados do sistema
integrado GISAWEB que informatiza as Redes de Propriedades no Paraná,
programa coordenado pelo IAPAR e EMATER-PR. Com o desenvolvimento deste
trabalho foi possível propor um modelo de dados para a obtenção de informações
relevantes para apoiar a tomada de decisão no ambiente agropecuário e também
apresentar uma proposta de estruturação do BI para o mesmo ambiente. A
aplicação da estrutura e do modelo de dados propostos no estudo de caso foi
possível realizar o cruzamento de alguns dados para construir umas informações
relevantes para a tomada de decisão como, por exemplo, atividades com tempo
para descobrir qual atividade teve melhor desempenho por tempo.

Palavras-chave: Business Intelligence, Benchmarketing, Agrobusiness, Data


warehouse, Modelagem Dimensional, Pentaho.
HORITA, F. E. A. Business Intelligence (BI) applied in Agricultural System.
Londrina, 2010. 62f. End of Course Work (Specialist in Software Engineering) –
Specialization in Software Engineering with UML, Centro Universitário Filadélfia de
Londrina - UNIFIL, Londrina, 2010.

ABSTRACT

Business Intelligence (BI) is to use a set of technology tools for data processing
looking for information or identify technical standards in a timely manner for decision
making in an organization. Therefore, this work seeks to implement BI in a system
focused on agribusiness management to ensure that the information provided by it
are used to produce a comparative benchmarketing farmers calls Networks
Properties. With such information, a set of social references, technical and economic
will be identified to produce in performance indicators (KPI - Key Performance
Indicators) which served for the preparation of a primer with the best practices
among the network properties. This primer will be conducted with the aim of reducing
production costs, material waste and increase production at its core properties.
Moreover, this work presents a proposal for dimensional modeling for analysis of
financial information of the proposed environment, their routines of extraction,
transformation and loading of data found in production databases for the Data
Warehouse (DW) used by BI. For the application was used to the tools that the suite
Pentaho Open Source Community implemented in the database of the integrated
system GISAWEB that computerizes Networks Properties in Parana, coordinated
program by IAPAR EMATER-PR. With the development of this work was proposed a
data model to obtain relevant information to support decision in the agricultural
environment and also present a proposal for structuring the BI to the same
environment. The application of the structure and the data model proposed on the
case study was possible crossing some data to construct relevant information for
decision making, for example, crossing activities with time to discover what is the
activity better for the time.

Keywords: Business Intelligence, Benchmarketing, Agrobusiness, Data warehouse,


Dimension Modeling, Pentaho.
LISTA DE FIGURAS

Figura 1 - Visão geral das ferramentas de um ambiente de Business


Intelligence (BI) ......................................................................................................... 21
Figura 2 - Consultas nos diversos níveis do ambiente projetado .............................. 24
Figura 3 - Ambiente Projetado................................................................................... 25
Figura 4 - Exemplo de Modelo Entidade-Relacionamento ........................................ 26
Figura 5 - Exemplo de Tabela Fato (Tabela Fato de Vendas Diárias) ...................... 27
Figura 6 - Exemplo de Tabela Dimensão (Tabela Dimensão Produto) ..................... 28
Figura 7 - Exemplo de Modelagem utilizando o Esquema Floco de Neve ................ 30
Figura 8 - Diferença de interação entre os atores no ambiente coorporativo e no
agropecuário ............................................................................................................. 31
Figura 9 - Exemplo de Modelagem Dimensional ....................................................... 33
Figura 10 - Modelagem Dimensional proposta para o estudo de caso, o
Ambiente Agropecuário ............................................................................................. 41
Figura 11 - Passos para transformação dos dados da tabela de fato
Movimentação Financeira. ........................................................................................ 44
Figura 12 - Passos para elaboração da dimensão Tempo ........................................ 44
Figura 13 - Job (Trabalho) utilizado para o estudo de caso. ..................................... 45
Figura 14 - Relatório simples de atividades gerado no PRD. .................................... 46
Figura 15 - Cruzamento de dados das atividades por tempo no cubo do
Pentaho ..................................................................................................................... 47
Figura 16 - Métricas de despesas e custos das atividades por ano .......................... 47
Figura 17 - Valores de despesas e receitas da atividade Apicultura por
propriedade ............................................................................................................... 48
LISTA DE TABELAS

Tabela 1 - Comparativo entre os principais tipos de Ferramentas de Uso. ............... 22


LISTA DE ABREVIATURAS E SIGLAS

ERP Enterprise Resources Planning


IAPAR Instituto Agronômico do Paraná
EMATER – PR Instituto Paranaense de Assistência Técnica e Extensão
Rural
GISAWEB Gestão Integrada de Sistemas Agropecuários na WEB
UML Unified Modeling Language
OLAP Online Analytical Processing
BI Business Intelligence
DW Data Warehouse
DM Data Mart
ETL Extract, Transform, Load (Extração, Transformação,
Carga).
MD Modelagem Dimensional
TI Tecnologia de Informação
PDI Pentaho Data Integration
PRD Pentaho Report Designer
KPI Key Performance Indicators
DER Diagrama Entidade-Relacionamento
SUMÁRIO

1. Introdução ............................................................................................................... 14
1.1. Justificativa........................................................................................................ 16
1.2. Objetivos ........................................................................................................... 16
1.3. Objetivos gerais ................................................................................................ 16
1.4. Objetivos específicos ........................................................................................ 16
1.5. Metodologias utilizadas ..................................................................................... 17
2. Revisão de literatura .............................................................................................. 19
2.1. Business Inteligence ......................................................................................... 19
2.1.1. Ferramentas do BI.......................................................................................... 20
2.1.1.1. Ferramentas de Construção ........................................................................ 20
2.1.1.2. Ferramentas de Armazenamento ................................................................ 21
2.1.1.3. Ferramentas de Gerência ........................................................................... 21
2.1.1.4. Ferramentas de Uso.................................................................................... 22
2.2. Data warehouse (DW) e Datamart (DM) ........................................................... 23
2.3. Modelagem Dimensional (MD) .......................................................................... 25
2.3.1. Tabelas Fato .................................................................................................. 26
2.3.2. Tabelas Dimensão ......................................................................................... 27
2.3.3. Esquema Estrela (Star Join Schema) ............................................................ 28
2.4. Redes de Propriedades de Referências............................................................ 30
2.5. Benchmarketing ................................................................................................ 32
2.6. Considerações Finais ........................................................................................ 32
3. Aplicaçao do Business Intelligence (BI) no estudo de caso .............................. 35
3.1. Fundamentação teórica..................................................................................... 35
3.2. Contextualização do estudo de caso ................................................................ 36
3.2.1. Definição do escopo do Business Intelligence ............................................... 38
3.3. Modelagem dimensional do Data Warehouse................................................... 38
3.3.1. Dimensão Tempo ........................................................................................... 39
3.3.2. Dimensão Área .............................................................................................. 39
3.3.3. Dimensão Tipo ............................................................................................... 40
4. Resultados e discussão......................................................................................... 43
4.1. Kettle ................................................................................................................. 43
4.2. Schema Worchbench e Report Designer .......................................................... 45
5. Conclusões ............................................................................................................. 49
6. Referências ............................................................................................................. 51
APÊNDICE A ............................................................................................................... 54
14

1. INTRODUÇÃO

A constante busca por eficiência, melhor qualidade e menores custos nos


processos tornaram-se os principais objetivos das empresas, impulsionados
principalmente pela crescente concorrência nos mercados globais e a escassez de
recursos. Buscar atingir os objetivos citados fez com que várias empresas tivessem
que mudar a forma de administrar seus processos, alguns tiveram que ser repensados
e mudados completamente enquanto outros eram focados apenas em sua parte
problemática para que só então sua solução fosse procurada (MAXIMIANO, 2007).
Em paralelo, o avanço da área de tecnologia de informação tornou-se tão
expressivo que passou a ser uma ferramenta comum nas empresas. O principal motivo
para que as empresas incorporassem os sistemas corporativos informatizados (ERPs)
foi por que os gestores e diretores passaram a entender que a área de TI poderia
contribuir muito com as empresas com a redução de pessoa na produção e/ou
escritórios, encurtar distâncias e diminuir tempos, armazenar informações diárias e
permitir a identificação de áreas não atendidas para os clientes, os nichos de mercado.
Os sistemas passaram então a fazer parte dos processos empresariais. Neles
os funcionários registravam suas movimentações diárias, movimentações fiscais,
movimentações financeiras, movimentações de estoques e na grande maioria dos
sistemas essas movimentações estão sempre vinculadas a outros registros como
clientes, regiões, fornecedores e custo, ou seja, o sistema adotado guarda uma grande
massa de dados da empresa.
Posteriormente esses dados são utilizados para gerar relatórios com um
emaranhado de números legível apenas para aqueles mais familiarizados ou após ser
feita uma massiva análise. E como resposta aquele nicho de mercado que deveria ser
facilmente identificado nos relatórios não acontece, a visualização da saúde financeira
da empresa fica difícil de identificar, os gastos desnecessários não são encontrados,
ou seja, o sistema implantado não atende a empresa.
Neste panorama surgiu o Business Intelligence (BI) que consiste na utilização
de ferramentas tecnológicas para realizar extração, armazenamento, publicação e
transformação dos dados contidos nos bancos de dados tradicionais em informações
que servem para auxiliar na identificação de novas tendências, conhecimento dos
costumes dos clientes, fornecedores, concorrentes e a facilitar o acesso às
15

informações, em suma ser uma tecnologia de auxilio a tomada de decisões da alta


gerência (PRISMAK, 2008).
Este trabalho tem como principal objetivo implementar o BI em um sistema
agropecuário e com isso propor uma estrutura capaz de oferecer informações para
apoiar a tomada de decisão no ambiente proposto. Para aplicar os conceitos descritos
será utilizado um conjunto de ferramentas da Pentaho Open Source Community; o
Kettle para fazer a extração, transformação e carga dos dados disponíveis no
GISAWEB para o Data Warehouse (DW) proposto, o Report Designer para emitir os
relatórios simples e o Schema Workbench para gerar os cubos1 Online Analytical
Processing (OLAP) e seu servidor que ira disponibilizar os relatórios e cubos gerados
pelas ferramentas.
A partir da estrutura proposta será possível cruzar alguns dados, originados de
um sistema de informação utilizado por uma propriedade ou um conjunto de
propriedade e que compõe o contexto do BI, com o objetivo de construir ou elaborar
informações que possam servir para apoiar ao proprietário da propriedade a tomar
decisão para aumentar não apenas a quantidade de sua produção, mas também sua
qualidade com menores custos.
Para tanto, o presente trabalho esta estruturado da seguinte maneira: o
capítulo 2 apresenta uma revisão da literatura utilizada neste trabalho, com destaque
para a definição do Business Intelligence, de seu conjunto de ferramentas e os tipos de
distribuição, organização e estruturação de seus dados. Além disso, serão
apresentados os conceitos acerca do DW com um aprofundamento na forma de
modelagem de seus dados, a Modelagem Dimensional (MD). Por fim, são
apresentados, também, conceitos relacionados com o estudo de caso, as definições
das Redes de Propriedades de Referência e do Benchmarketing.
No capitulo 3 será apresentado como o BI foi aplicado no estudo de caso, o
sistema GISAWEB, partindo da apresentação da construção do processo de ETL

1
Cubo: Uma estrutura de dados que agrega as medidas pelos níveis e hierarquias de cada uma das
dimensões. Os cubos combinam várias dimensões (como hora, geografia e linhas de produtos) com
dados resumidos (como os números de vendas ou de registros). São dados materializados, em alguns
casos e é o meio que nos possibilita análises multidimensionais. (SODRÉ, 1997).
16

passando pela geração de simples relatórios para finalizar com a apresentação de um


modelo de analise detalhada de dados, o cubo OLAP.
As discussões e apresentações dos resultados obtidos com a implementação da
tecnologia no estudo de caso são apresentados no capítulo 4.
E finalmente no capítulo 5 serão apresentadas as conclusões obtidas no
trabalho e algumas propostas de trabalhos futuros que podem ser desenvolvidos sobre
o BI no ambiente agropecuário.

1.1. JUSTIFICATIVA

Aplicar o Business Intelligence (BI) em um sistema agropecuário que consiste


em montar uma rede de referências buscando descobrir quais as práticas que melhor
se adaptam às condições ecológicas e socioeconômicas da região em questão, ou
seja, através da análise dos dados oferecidos pelo BI o produtor consegue encontrar a
técnica de produção que melhor se adapta a sua propriedade e assim aplicá-la em
busca de redução de custos e aumento de sua produção.

1.2. OBJETIVOS

Esta seção apresenta os principais objetivos do trabalho.

1.3. OBJETIVOS GERAIS

Apresentar como aplicar um Business Intelligence (BI) em um sistema


agropecuário afim de que este possa auxiliar na obtenção de informações que
poderiam ser utilizadas como diretrizes por uma rede de propriedades de referência
alvo.

1.4. OBJETIVOS ESPECÍFICOS


17

Avaliar os benefícios da aplicação do Business Intelligence (BI) em um sistema


agropecuário que tem como objetivos:
 estudar o Business Intelligence (BI);
 avaliar e comparar ferramentas existentes no mercado;
 aplicar em um estudo de caso utilizando uma das ferramenta avaliadas;
 apresentar e avaliar os resultados gerados pela ferramenta;
 testar a aplicação.

1.5. METODOLOGIAS UTILIZADAS

Segundo Ballman (2005, p. 57) faz-se necessária à observação de métodos e


técnicas de pesquisa a serem aplicadas para que os objetivos sejam alcançados. Este
método proporciona ao pesquisador uma orientação geral, facilitando o processo de
realização, investigação e a interpretação dos resultados. Para tanto, este capitulo
procura apresentar os métodos e as técnicas utilizadas para o desenvolvimento desta
pesquisa.
De acordo com Yin (2005, p.32), estudo de caso é “uma investigação empírica
que, investiga um fenômeno contemporâneo dentro do contexto da vida real”. O estudo
de caso foi uma das técnicas utilizadas neste trabalho.
Por basear-se em um estudo de caso este também precisou de uma pesquisa
bibliográfica para conhecimento dos conceitos estudados. E para isso, SILVEIRA
(2007, apud Fachin, 2001) define esta pesquisa como um conjunto de conhecimentos
reunidos nas obras tendo como base fundamental conduzir o leitor a utilização das
informações coletadas para o desempenho da pesquisa. SILVA & MENEZES (2001,
p.38) ainda complementam afirmando que as principais contribuições desta pesquisa
são conhecer os temas e aspectos já abordados e assim obter informações da
situação atual do tema (estado da arte). Sendo assim, a pesquisa realizou-se a partir
de matérias publicadas em artigos científicos, dissertações, matérias e sites da
internet.
Definiu-se também que os tipos de estudo realizados foram os exploratórios e
descritivos. Segundo SILVEIRA (2007, apud Gil, 2002) a pesquisa exploratória tem
como objetivo proporcionar maior familiaridade com o tema, com vistas a torná-lo mais
explicito. E a pesquisa descritiva objetiva a identificação dos fatores que determinam
18

ou que contribuem para a ocorrência dos fenômenos. Estes foram os tipos de estudo
escolhidos, pois pretende-se além de abordar e explicar o tema com mais clareza e
procura-se descrever os passos realizados para a elaboração da arquitetura do
Business Intelligence (BI).
E por está pesquisa também ser uma pesquisa descritiva, adotou-se como sua
natureza de pesquisa a qualitativa, pois ela além de não utilizar métodos e técnicas
estatísticas ela adota o processo e seu significado como os focos principais de sua
abordagem (SILVA & MENEZES, 2001, p.20).
19

2. REVISÃO DE LITERATURA

Este capítulo tem o objetivo de apresentar os principais conceitos utilizados


neste trabalho, tais como: Business Intelligence (BI), Data warehouse (DW) e DataMart
(DM), Extração, Transformação e Carga (ETL), Benchmarketing e as Redes de
Propriedades de Referência.

2.1. BUSINESS INTELIGENCE

O termo Business Intelligence (BI) traduzido para o português significa


Inteligência de Negócios e representa um conjunto de aplicações que visa,
basicamente, extrair e analisar dados de clientes armazenados em várias fontes para
determinar tendências e oferecer subsídios que auxiliam na tomada de decisão.
Seu surgimento se deu por volta dos anos 80, porém seu conceito
perambulava desde as sociedades do Oriente Médio quando estes analisavam os
comportamentos da natureza e cruzavam com suas experiências a fim de obter
informações para suas tomadas de decisão buscando melhorar as condições de vida e
sobrevivência da sua população.
Com o passar do tempo novas ferramentas surgiram para auxiliar o ser
humano nesta sua tarefa de obter importantes informações para auxiliar em suas
tomadas de decisão. Sem que as empresas percebessem os sistemas passaram a ser
a ferramenta principal para atingir este objetivo, pois após a transição dos cartões
perfurados para a era dos Sistemas Gerenciadores de Banco de Dados (SGBD) e
evolução das linguagens de programação da época (Clipper e Pascal) fizeram com
que as empresas passassem a perceber que os dados gerados diariamente por seus
sistemas poderiam se tornar uma importante fonte geradora de informações decisórias
e que renderiam eventuais lucros (PRIMARK, 2008, p.8).
Apesar de surgir nos anos 80 o BI ganhou adeptos apenas com o surgimento
dos Data warehouse (DW) nos anos 90, considerado um dos principais elementos de
um projeto de BI nele estão contidos os dados obtidos a partir das fontes de dados
disponíveis na empresa (planilhas eletrônicas e sistemas informatizados, por exemplo)
20

e que serão submetidos as ferramentas de análise e mineração de dados procurando


construir e formular informações úteis para seus usuários.
Para aplicar o BI em uma empresa é necessária a implantação de um conjunto
de ferramentas e processos desde os níveis hierárquicos mais baixo até o pessoal que
compõe a alta gerência da empresa. Ao contrário do que pode se pensar este não é
um processo fácil é necessário que alguns passos sejam seguidos para que a
tecnologia consiga atingir seu propósito. Segundo Linden (2011), durante a construção
do ambiente de BI é fundamental que o pessoal da alta gestão esteja comprometida
com o sucesso da tecnologia, pois é através de seu rigor na obtenção das informações
que os objetivos propostos no projeto serão compridos e devidamente seguidos.
Contudo, apenas o apoio da alta gestão pode não ser suficiente é preciso,
também, que haja um envolvimento desta na fase final de elaboração do ambiente.
Este envolvimento procura solucionar alguns dos principais motivos de falha na
implantação da tecnologia, a dificuldade de utilização das ferramentas do BI, definição
dos indicadores de desempenho (KPIs) e a garantia da integridade e qualidade dos
dados através do acompanhamento do projeto e a realização de treinamentos com os
usuários nas ferramentas e sistemas que serão implantados. Mesmo após o fim da
implantação do BI é necessário que haja um constante acompanhamento em seu
ambiente tanto nos processos de ETL quanto definição, obtenção e desenvolvimento
dos novos indicadores que podem vir a surgir.

2.1.1. FERRAMENTAS DO BI

O BI em sua essência é composto por um conjunto de ferramentas que


executadas em conjunto procuram atingir os objetivos que a tecnologia se propõe
atender. Para Barbieri (2001, p.62) a tecnologia pode ser classificada em quatro
grupos de ferramentas as de Construção, Gerência, Uso e Armazenamento conforme
a Figura 1.

2.1.1.1. Ferramentas de Construção


21

As ferramentas de construção como o próprio nome diz objetiva carregar os


dados encontrados nas diversas fontes de dados, transformá-los para o formato
estruturado e integrado para que seja carregado nas estruturas de DW.
Além disso, realizam processos de integração de fontes diferentes, facilitando
a busca em ambientes heterogêneos, a sua transformação via procedimentos escritos,
ou tabelas de pesquisas e permitindo a categorização para os níveis de granularidade2
desejados (BARBIERI, 2001).

Figura 1 - Visão geral das ferramentas de um ambiente de Business Intelligence (BI)


Fonte: Elaborado pelo autor adaptado de Barbieri, 2001.

2.1.1.2. Ferramentas de Armazenamento

Fazem parte das ferramentas de armazenamento o DW, DM e Operational


Data Store (ODS), que tem objeto de armazenar os dados informacionais em vários
graus de relacionamento e categorização, de forma a facilitar e agilizar os processos
de tomada de decisão por diferentes níveis gerenciais (BARBIERI, 2001).
2.1.1.3. Ferramentas de Gerência

2
Granularidade tem a ver com o nível de detalhamento do comportamento de um objeto que é exposto.
Quão mais bem detalhado é o comportamento do seu objeto é exposto, mais fina é sua granularidade.
22

As ferramentas de gerência controlam as permissões de acesso às


ferramentas de armazenamento e de processos de ETL.

2.1.1.4. Ferramentas de Uso

Enquanto os outros tipos de ferramentas controlam e gerenciam a forma com


que os repositórios de informações serão construídos e estruturados. As ferramentas
de uso representam as formas com que estes dados serão disponibilizados para os
usuários dentre eles pode-se citar os relatórios, data mining e OLAP. A Tabela 1
apresenta um comparativo com os principais tipos de ferramentas de uso.

Tabela 1 - Comparativo entre os principais tipos de Ferramentas de Uso.


Tipos de Ferramentas Questão Básica Exemplo de Resposta Usuário Típico e suas
necessidades
Pesquisa e Relatórios “O que aconteceu?” Relatórios mensais de Dados históricos.
venda, histórico do Habilidade técnica
inventário. limitada
OLAP “O que aconteceu e Vendas mensais Visões estáticas da
por quê?” versus mudanças de informação para uma
preços dos visão multidimensional;
competidores. tecnicamente astuto
Data Mining “O que é Modelos de previsão. Tendências e relações
interessante?” entre os dados;
“O que pode tecnicamente astuto.
acontecer?”

Fonte: Elaborado pelo autor adaptado de Primak, 2008.

Com as ferramentas que o mercado oferece fica difícil definir qual conjunto ou
quais ferramentas devem ser utilizadas para implantar o BI em uma empresa. É
importante ressaltar que tudo irá depender da sua necessidade da empresa, ou seja,
esta deverá definir o conjunto de ferramenta que julgar necessário para atender suas
expectativas, porém este conjunto deve oferecer informações seguras, concretas com
o menor tempo e custo possível.
23

2.2. DATA WAREHOUSE (DW) E DATAMART (DM)

A evolução citada dos mercados em conjunto com a dos sistemas de


informação fez com o que a gerência buscasse nestes sistemas, informações que lhes
auxiliasse em sua tomada de decisão. Após está mudança de enfoque estes sistemas
passaram a ser alvo de inúmeras consultas em seus bancos de dados para geração
dos relatórios solicitados pela gerência.
Com o passar do tempo os sistemas mostram-se ineficientes para este tipo de
operação. A simples geração de relatórios não era suficiente para o seu propósito, a
tecnologia de informação passou a ser também um componente imprescindível para
armazenamento de dados, obtenção de informações e geração de conhecimento, itens
necessários para o administrador agir de forma segura e consistente. (PRISMAK,
2008).
E no contexto de armazenamento de informações Inmon e Hackathorn (1997,
p.18) separa os dados em dois tipos: os primitivos e os derivados. Os dados primitivos
são os dados operacionais e podem ser atualizados. Os dados derivados são dados
resumidos ou calculados de forma a atender às necessidades da gerência da empresa;
para armazenar estes dados surgiu então o DW e os DM.
Um DW é um repositório único de dados onde se podem buscar informações
para o conhecimento, inteligência e extensão do aprendizado do negócio; é orientado a
assunto, integrado e alimentado pelos vários sistemas transacionais antes dispersos
na empresa. Complementa Fortulan e Gonçalves Filho (2005 apud HARDING e YU,
1999), o DW extrai, de maneira eficiente, informações valiosas dos bancos de dados
operacionais que estão espalhados por toda a empresa e que, certamente, contêm
dados duplicados ou parcialmente duplicados.
Por isso, antes de povoar um DW com os dados operacionais, estes dados
precisam ser preparados para estarem aptos a serem questionados, pesquisados,
analisados e apresentarem conclusões. Contudo, tem-se que um DW pode ser
aconselhado para em empresas com larga escala de dados, porém para projetos com
pequeno volume de dados os DM são mais indicados por que estes apresentam uma
baixa necessidade de orçamento e menor tempo de implementação.
24

Figura 2 - Consultas nos diversos níveis do ambiente projetado


Fonte: Inmon e Hackathorn (1997, p.21)

Porém para que o BI possa auxiliar de forma eficiente na tomada de decisão é


imprescindível que o ambiente em que seus dados estão armazenados esteja
estruturado para tal, neste contexto Inmon e Hackathorn (1997, p. 19) descreve uma
variação para está estrutura; como mostra a Figura 2, o nível operacional contém os
dados primitivos e de produção. O DW contém dados derivados e dados primitivos não
atualizados. O nível departamental praticamente só contem dados derivados. E o nível
individual é onde a maior parte das análises é feita. Esta separação de dados força
então a adaptação dos bancos de dados transacionais3, ou operacionais, para o
modelo proposto por Inmon (1997, p.21), apresentado na Figura 3.

3
Os bancos de dados transacionais, ou operacionais, armazenam as informações das transações diárias da
empresa, são utilizados por todos os funcionários para registrar e executar operações pré-definidas, por isso seus
dados podem sofrer constantes mudanças. Por não ocorrer redundância nos dados e as informações históricas não
ficarem armazenadas por muito tempo, este tipo de banco de dados não exige grande capacidade de
armazenamento (SOLFA, 2008, p.16).
25

Figura 3 - Ambiente Projetado.


Fonte: Inmon e Hackathorn (1997, p.19).

2.3. MODELAGEM DIMENSIONAL (MD)

Muito comum nos bancos de dados que trabalham em conjunto com os


sistemas disponíveis no ambiente de produção das empresas, o Diagrama Entidade-
Relacionamento (DER) é composto essencialmente por tabelas que se relacionam
entre si, a Figura 4 apresenta um exemplo desta modelagem.
É importante enfatizar que o padrão de representação proposto para o modelo
juntamente com a normalização das tabelas4 pode resultar na dificuldade de seu
entendimento ou de sua análise, pois o contexto em que o sistema está inserido pode
exigir uma elevada quantidade de tabelas e relacionamentos. Entretanto vale ressaltar
que tais técnicas apresentam eficiência e melhoram o desempenho no ambiente
operacional um vez que estes não executem consultas em uma elevada massa de
dados. (BISPO, 1998, p.23).

4
A normalização das tabelas procura eliminar a redundância de dados em suas tabelas, ou seja, uma
tabela Produtos deve ser composta unicamente por campos que estejam relacionados a produtos e não
por campos vinculados a pedidos, notas fiscais ou clientes. Maiores Informações em:
<http://phlonx.com/resources/nf3/>.
26

Figura 4 - Exemplo de Modelo Entidade-Relacionamento


Fonte: Bispo (1998, p.40)

Porém para os ambientes gerenciais onde diversos dados são cruzados a fim
de obter informações importantes para o negócio, ambiente este em que o BI está
mais focado, a massa de dados em que as consultas são realizadas são maiores do
que no ambiente operacional e por este motivo o DER pode ser inapropriado. Para
Kimball (2002, p.12) a Modelagem Dimensional (MD) é mais recomendada para este
tipo de aplicação, pois este contém a mesma informação que no DER, mas agrupa os
dados em um formato que melhora a clareza do usuário e desempenho da consulta
através da diminuição do grau de normalização. A MD também é conhecida como Star
Join Scheme (Modelo Estrela).

2.3.1. Tabelas de Fato

Segundo Kimball (2002, p.16) as tabelas de fatos são as principais tabelas em


uma MD elas representam essencialmente um processo de negócio e nela são
guardadas as medidas numéricas vinculadas mais importantes ao processo. Exemplos
como o valor de faturamento, a quantidade produtos entregues e a quantidade de
entregas são os tipos de dados que estão alocados nesta tabela, ou seja, esta
geralmente guarda informações referentes às transações ou eventos de negócios. A
Figura 5 é um exemplo de tabela fato que representa o volume de vendas diárias.
27

Figura 5 - Exemplo de Tabela de Fato (Tabela Fato de Vendas Diárias)


Fonte: Kimball (2002, p.17)

As tabelas de fato são compostas obrigatoriamente por uma chave primária


composta pelas chaves primárias das tabelas que contêm as descrições do fato, as de
dimensão. Além disso, esta tabela pode conter medidas que variam de numéricas ou
sem medida e podem ser classificadas dentro dos três tipos descritos a seguir:

a) aditivas: são numéricas e são somadas com relação as dimensões


existentes, por exemplo: quantidade, valor total dos itens.
b) semi-aditivas: são numéricas mas não podem ser somadas com relação a
todas as dimensões, por exemplo: o estoque é totalizado ao longo da produto
porém ao longo das dimensões loja e data não existe o menor sentido está
totalização.
c) não-aditivas: dados não numéricos, por exemplo: carro1, carro2, carro3.

Geralmente uma tabela fato apresenta poucas colunas, porém elas consomem
em media 90% do espaço de um DW devido à elevada quantidade de dados que elas
guardam. SOLFA (2005 apud LEME FILHO, 2004, p.176).

2.3.2. Tabelas Dimensão

As tabelas dimensão são compostas pelas informações complementares as


tabelas fato. Segundo Solfa (2005 apud LEME FILHO, 2004) as tabelas de dimensão
estão sempre acompanhadas de tabelas de fatos. Sem os fatos, não há informações
para exibir. A partir da combinação das várias dimensões com o fato, uma informação
é gerada, para que a alta gerência possa tomar suas decisões. Solfa (2005, p.29) cita
um exemplo onde às informações referentes aos processos de distribuição de uma
28

empresa podem ser estudadas pelas transportadoras, pelas seguradoras, por regiões
de destino ou por período de entregas. É possível medir a eficiência das
transportadoras, calcular o índice de sinistros com as seguradoras, analisar quais são
as regiões com maior (ou menor) volume de entregas ou ainda quais são os cúmulos
de entrega.
Estas tabelas são compostas basicamente por colunas que contêm elementos
textuais que descrevem o negócio e uma chave primária que irá compor a chave
composta de sua tabela fato. A identificação de uma tabela dimensão é facilmente
perceptível através da utilização da palavra “por”; por exemplo, quando desejamos
saber o a quantidade de venda de um determinado produto “por” vendedor e “por”
bairros, o a quantidade de venda representa um fato e o vendedor e os bairros
representam as dimensões. A Figura 6 representa um exemplo de tabela dimensão de
produto.

Figura 6 - Exemplo de Tabela Dimensão (Tabela Dimensão Produto)


Fonte: Kimball (2002, p.20)

2.3.3. Esquema Estrela (Star Join Schema)

O esquema estrela é um tipo de abordagem para desenvolvimento da


modelagem dimensional de um DW. A baixa quantidade de tabelas e relacionamentos
resulta em uma estrutura simples que além de diminuir sua complexidade e aumenta
seu desempenho. Devido a simplicidade do esquema pode-se ressaltar que a
construção de consultas torna-se mais fácil além de consumir menos recursos de
banco de dados (SOLFA, 2002). Em contrapartida, devido a integração das
informações em poucas tabelas para que o usuário possa realizar consultas analíticas
29

é necessário utilizar ferramentas desenvolvidas especificamente para este tipo de


modelo.

Figura 8 - Estrutura de uma Modelagem utilizando o Esquema Estrela


Fonte: Hokama et. al. (2004, p.33)

A Figura 8 apresenta a estrutura do esquema estrela, com ela fica fácil


identificar o porquê de sua denominação, nota-se que ao centro temos uma tabela
composta pelas chaves de ligação entre as dimensões e os dados consolidados,
enquanto a sua volta estão as tabelas compostas pelas demais informações que
complementam o fato.
Vale ressaltar que este tipo de esquema não está restrito a apenas uma tabela
fato, ou seja, é possível que haja mais de uma tabela fato se relacionando através de
dimensões, porém é mais comum visualizar o esquema separado por fato devido a sua
baixa complexidade na visualização.

2.3.4. Esquema Floco de Neve (Snowflake)

O esquema estrela será utilizado no estudo de caso deste trabalho, porém é


importante ressaltar que existe outro tipo de esquema para a MD, o Floco de Neve ou
Snowflake.
30

Figura 7 - Exemplo de Modelagem utilizando o Esquema Floco de Neve


Fonte: Hokama et. al. (2004, p.46)

O esquema floco de neve representa uma variação do esquema estrela. Este


esquema aplica a terceira forma normal (3FN) em todas as tabelas dimensão, ou seja,
são retirados das tabelas os campos que são funcionalmente dependentes de outros
campos que não são chave como mostra a Figura 7.
Segundo Hokama et. al. (2004 apud Kimball, 2002) a aplicação deste esquema
resulta em uma diminuição na performance nas consultas devido a necessidade de um
maior número de joins além do aumento da complexidade da modelagem. Em
contrapartida a atualização dos dados no DW será mais rápida devido a normalização
das tabelas. Sabendo das diferenças entre os esquemas é que o arquiteto do data
warehouse definirá qual será a melhor opção para ser aplicada.

2.4. REDES DE PROPRIEDADES DE REFERÊNCIAS

No que tange o ambiente em estudo é preciso salientar uma diferença entre o


empresarial e o agropecuário. Entanto no empresarial uma empresa busca
informações para antecipar ações do mercado (encontrar uma diferenciação de
produtos, maneiras de diminuir seus custos ou um novo nicho de mercado) tendo
sempre uma vantagem competitiva sobre seus concorrentes; no agropecuário um
proprietário procura informações e as compartilha com os demais produtores de sua
31

região, por que para esses não se trata somente de buscar o aumento da produção e
do rendimento dos produtos cultivados, mas, principalmente, o sistema de produção
que melhor se adapta às suas condições ecológicas e socioeconômicas (MIRANDA,
et. al., 2001) como apresentado na Figura 4.

Figura 8 - Diferença de interação entre os atores no ambiente coorporativo e no agropecuário

Este compartilhamento de informações entre as propriedades de uma


determinada região resulta em uma rede de propriedades de referências que tem
seguintes objetivos:

 comprovar se determinados métodos e técnicas trazem benefícios para as


propriedades da rede pois uma tecnologia selecionada com a participação de
agricultores adapta-se localmente melhor do que aquela somente
recomendada pelos técnicos (MIRANDA et. al., 2001);
 coletar e disponibilizar informações que possam servir de orientações para os
produtores;
 ser um centro de capacitação dos produtores.

Têm-se então que os produtores atuais não estão preocupados em buscar


apenas a maior produção que sua propriedade pode gerar, mas sim a produção com
melhor qualidade e eficiência que está pode gerar e compartilhá-la suas técnicas,
tecnologias e métodos com a sua rede de propriedades. Para o produtor ou a rede
definir qual dentre suas produções apresentou os melhores índices de qualidade
versus eficiência estes podem utilizar o benchmarketing em conjunto com o BI.
32

2.5. BENCHMARKETING

Segundo Maximiano (2009, p.338) benchmarketing é a técnica por meio da


qual a organização compara o seu desempenho com o de outra. Por meio do
benchmarketing, uma organização procura imitar outras organizações, concorrentes ou
não, do mesmo ramo de negócios ou de outros que façam algo de maneira
particularmente bem feita. A ideia central da técnica do benchmarketing é a busca das
melhores práticas da administração, como forma de identificar e ganhar vantagens
competitivas.
As melhores práticas podem ser encontradas nos concorrentes, ou numa
organização que esteja num ramo completamente diferente de atuação. Tachizawa,
Cruz Júnior e Rocha (2006, p.282) concluem então que benchmarketing refere-se a um
padrão ou ponto de referência relativo a resultados e processos, que representam as
melhores práticas e desempenhos para atividades similares, dentro e fora da
Companhia.
Aplicar o BI em um sistema agropecuário consiste em abstrair os benchmarks
que melhores se adaptam ao contexto técnico/ambiental em que este está situado
buscando diminuir custos de produção, desperdício de materiais e aumentar em sua
essência a produção das propriedades. Para que estes índices sejam utilizados pelas
lideranças do setor para definir diretrizes e melhorar alocação de recursos e/ou para
organismos certificadores acompanhar o detalhamento dos sistemas de produção.

2.6. CONSIDERAÇÕES FINAIS

Este capítulo fez uma breve descrição dos conceitos que foram abordados
neste trabalho.
Sobre os DW e DM é válido lembrar que sua grande maioria apresenta uma
estrutura dimensional ao contrário dos repositórios de produção que possuem uma
estrutura relacional isso por que a MD procura construir uma tabela que representa
essencialmente uma regra de negócio (vendas, compras, produção) com métricas e
dados aditivos sendo esta conhecida como tabela fato. Esta tabela se relaciona com as
tabelas dimensões que refere-se ao contexto onde acontece o fato, tais como tempo,
33

produtos, ambientes externo e propriedades. A Figura 5 apresenta a modelagem de


um DW voltado para análise de vendas diárias de uma determinada empresa com os
possíveis dados das tabelas.
Permitindo ao usuário observar o banco de dados no formato de um hipercubo
contendo duas, três ou quantas dimensões forem possíveis e aplicáveis. Esta
modelagem proporciona um ganho de tempo na consulta, uma melhor organização do
sistema e principalmente a sua utilização de forma intuitiva para o usuário
(CENTERARIO et. al., 2004).
Para que o BI possa oferecer informações precisas e seguras é imprescindível
que o sistema informatizado que trabalha em paralelo colhendo os dados do dia-a-dia
da propriedade seja operado por técnicos e/ou especialistas da área com
conhecimento para tal buscando garantir a confiabilidade dos dados cadastrados; este
é um ponto importante por que uma vez cadastrado um dado errado no sistema é fato
que as informações geradas pelo BI ao invés de trazer os benefícios citados para a
produção irá prejudicar ou em muitos casos destruir uma produção. Assim como a
análise das informações geradas pelo BI também devem ser analisadas por
profissionais com conhecimento.

Figura 9 - Exemplo de Modelagem Dimensional


34

Fonte: Kimball (2002, p. 24)

Sobre as redes de propriedades de referências vale ressaltar que com base


nos benchmarks resultantes do BI é separado um determinado dia para que os
produtores da rede possam visitar a propriedade que obteve os melhores índices de
eficiência em sua produção e trocar informações sobre os produtos, técnicas e os
resultados que tem alcançado com o sistema produtivo implantado, muitos denominam
esse dia como o “dia de campo” ou “porteira aberta”.
35

3. APLICAÇAO DO BUSINESS INTELLIGENCE (BI) NO ESTUDO DE CASO

Este capítulo tem como objetivo apresentar como foi aplicado o BI no estudo
de caso, um sistema integrado para controle agropecuário. É apresentado um
processo para construção do DW utilizando a suíte Pentaho Open Source Community,
que exerce um papel de grande importância oferecendo as ferramentas para geração
de informação para a tomada de decisão. Para tanto a metodologia do trabalho segue
os seguintes passos:

1. a fundamentação teórica com estudos sobre os temas e tecnologias para


construção do modelo;
2. elaboração e apresentação da estrutura dimensional do DW;
3. construção da estrutura do BI com a utilização de ferramentas como Kettle,
Schema Workbench; e,
4. apresentação e discussão dos resultados obtidos.

3.1. FUNDAMENTAÇÃO TEÓRICA

Durante a fundamentação teórica deste trabalho foi estudado uma das formas
com que os produtores rurais de uma mesma região podem definir quais são as
práticas que melhor se adaptam para as determinadas atividades5 aplicadas, a esta
damos o nome de Redes de Propriedades de Referência6. Entretanto, para que esta
rede chegue ao sucesso é necessário que exista um sistema informatizado integrado
onde são inseridos dados quantitativos e qualitativos relacionados com a sua produção
e neste contexto a técnicas escolhidas e estuda para a definição dos índices que
melhor se adapta para a situação é através do benchmarketing.

5
Entende-se com atividades qualquer sistema de produção que componha o sistema produtivo da
propriedade como um todo. Como exemplo de atividades soja, milho, trigo, leite, bovinos de corte,
laranja, tomate, ervilha, melancia dentre outros.
6
Uma rede é um conjunto de propriedades representativas de determinado sistema de produção
familiar, que após um processo de otimização visando ampliação de sua eficiência e sustentabilidade,
servem como referência técnica e econômica para as outras unidades por ela representadas.
(MIRANDA e DOLIVEIRA, 2005)
36

3.2. CONTEXTUALIZAÇÃO DO ESTUDO DE CASO

Para a construção do DW é necessário definir quais serão as tabelas fato, ou


seja, as tabelas que representam essencialmente um processo de negócio para
posteriormente serem definidas as dimensões envolvidas e que caracterizam e
apresentam as informações referentes ao fato.
Para Kimball (2002, p.30) a primeira etapa no processo de design de um DW
dimensional é definir quais os processos de negócios serão analisados; por exemplo,
pedidos, vendas, compras, produção, na grande maioria dos casos cada processo se
tornará uma tabela de fato. Em segundo, definir qual o nível de granularidade deste
processo, e para isso responder a pergunta “Como você descreve uma linha da tabela
de fato?”; por exemplo, cada item de uma nota fiscal. O passo seguinte seria definir
como descrever os dados do processo; por exemplo, produtos, tempo, nota fiscal,
animal e com isso definir quais são minhas tabelas dimensão. Por fim, definir quais as
medidas para as tabelas de fato serão comparadas ou acompanhadas.
Entretanto, após a realização das etapas acima descritas para
desenvolvimento do modelo de dados dimensional para DW foi necessário à realização
de uma etapa adicional, composta essencialmente pela compreensão e entendimento
da estrutura de dados do sistema integrado disponível no ambiente de produção, no
caso sistema de Gerenciamento Integrado de Sistemas Agropecuários na WEB
(GISAWEB). Este entendimento foi de suma importância para construir e estruturar o
processo de ETL uma vez que através deste foi possível saber quais tabelas da base
de dados do GISAWEB seriam utilizadas para extrair os dados necessários para carga
no DW utilizado pelo ambiente de BI proposto.
Após a realização das etapas descritas acima foram elencados dois processos
do ambiente em questão que são analisados constantemente pelos proprietários e
consequentemente suas informações serviriam como benchmark para a rede em que a
propriedade está inserida, são eles o processo de produção de movimentação
financeira nas áreas de uso.
Sendo o processo de movimentação financeira o escolhido para
desenvolvimento deste trabalho, é através deste que o proprietário lança as receitas e
despesas de sua propriedade. É neste âmbito que Aguiar e Resende (2010, p. 22)
ressaltam que há algum tempo a eficiência da pecuária passou a ser representada
37

pelo lucro e prejuízos gerados pela junção de despesas7 e receitas8, ou seja, o fator
determinante para o lucro da atividade em questão é a diferença entre a renda e os
custos. De posse desta informação o administrador consegue tomar as principais
decisões de uma empresa bem como saber sua viabilidade econômica ou definir o
benchmark para comparação com outras atividades.
O sistema GISAWEB apresenta todos os relacionamentos para que
proprietário ou responsável pela assistência técnica da propriedade possa chegar às
informações descritas no parágrafo anterior. O sistema realiza estas movimentações
de rendas e custos vinculadas com uma área da propriedade sendo a área vinculada
com uma atividade (uma vez que as propriedades podem ser divididas em áreas para
alocação de diferentes atividades como, por exemplo, criação de gado e cultivo de
soja) e vinculadas com um determinado produto devidamente categorizado (vacina de
aftosa como vacinas e medicamentos para bovinos, por exemplo); além disso, o
sistema separa as despesas em fixas e variáveis para oferecer uma analise mais
detalhada da composição das movimentações. Somente através destes
relacionamentos o administrador consegue responder algumas perguntas que serão
relevantes para uma possível tomada de decisão seguem exemplos:

1. É melhor utilizar adubos minerais ou adubos orgânicos?


2. Nesta área é mais lucrativo plantar soja ou milho nesta época do ano?
3. Qual sistema de produção apresenta melhores resultados para cada atividade?
4. Qual é a margem de contribuição de cada sistema de produção para a receita
global da propriedade (Sistema Produtivo)?
5. Qual sistema produtivo gera melhor qualidade de vida para o produtor rural?
6. Posso comparar indicadores financeiros e técnicos de um determinado sistema
de produção?
7. Qual raça (animal) ou variedade de produto (produção agrícola) produz
melhores resultados nas minhas condições?
7
A soma dos valores de todos os recursos (insumos e serviços) utilizados no processo produtivo de
uma atividade agrícola, em certo período de tempo representam os custos de produção. (Aguiar e
Resende, 2010 apud Reis, 2002).
8
Segundo Aguiar e Resende (2010 apud Gottschall et al., 2002), a renda ou receita bruta é o fruto do
somatório do volume vendido multiplicado pelo preço unitário de cada produto.
38

Com base nestas informações o dono da propriedade consegue fazer um


planejamento de rodízio ou não de atividades utilizando os benchmarks de atividades
em quais áreas por período determinado a fim de conseguir atingir o maior lucro;
sendo a divulgação destas informações para todas as propriedades da rede de suma
importância para garantir o sucesso da região em que ela esta inserida.
E como citado, o BI será o grande repositório de informações atuais e
históricas, sobre as quais será possível realizar consultas e tomar as melhores
decisões.

3.2.1. Definição do escopo do Business Intelligence (BI)

Portanto, a partir da contextualização do estudo de caso definiu-se que a área


de assunto estudada seria a das movimentações que englobam toda a parte financeira
da produção, as receitas e as despesas composta pelos custos fixos, custos variáveis
e despesas administrativas. Escolheu-se esta área devido a sua grande relevância e
potencial de geração de informações para analise da produção por áreas da
propriedade.
Com relação, a granularidade dos dados definiu-se que seria útil apresentar os
dados a seguir: a) as atividades e seu grupo; b) as movimentações separadas por ano
e mês; c) quais as receitas e as despesas; e as áreas da propriedade, agrupadas por
propriedade.

3.3. MODELAGEM DIMENSIONAL DO DATA WAREHOUSE (DW)

As seguintes seções apresentam as cinco dimensões e a tabela de fato


estruturada e desenvolvida para analise dos dados voltada para o estudo de caso.
39

3.3.1. Dimensão Tempo

Uma das principais características de um DW é que este deve se situar em um


determinado tempo, isso se deve por que diferente das bases de produção em que
precisamos manter um histórico curto de dados, os DW devem armazenar uma longa
quantidade de dados a fim de garantir a análise do comportamento das informações
durante o decorrer dos anos.
Isto torna obrigatório que todas as tabelas fatos tenham entre seus
relacionamentos um que seja com uma dimensão tempo, ou seja, as tabelas de fato
levaram uma chave que as relaciona com a dimensão tempo; além desta chave esta
dimensão comumente é composta por atributos como feriados, períodos fiscais e
informações tradicionais como mês por extenso ou numérico, dia no mês, dia na
semana, dia da semana, a data por extenso, separada por “/” (barras) ou “-” (traços)
dentre outros atributos. Entretanto, se quisermos relacionar um atributo de hora, é
preferível optar pela criação de uma nova dimensão hora com informações vinculadas
com a mesma, ou seja, no que tange o tempo do fato separamos em data e hora.

3.3.2. Dimensão Área

A dimensão área, também denominada uso-área, torna-se uma das mais


importantes por ela representar as subdivisões de uma propriedade rural e pelo seu
vinculo com sua propriedade e grupo. A partir destes relacionamentos será possível
identificar qual propriedade ou grupo apresenta os melhores ou piores índices
financeiros. Entretanto, mesmo com este alto nível de importância esta é uma
dimensão simples que contempla os campos descritos a seguir:

 sua chave;
 o nome descritivo da área;
 o nome da propriedade vinculada; e,
 o nome do grupo.
40

3.3.3. Dimensão Tipo

Assim como a dimensão de área a de tipo é simples e apresenta os tipos de


custos associados às movimentações financeiras e suas subclassificações. Sendo
importante para descobrirmos quais os tipos das maiores receitas ou despesas. Um
exemplo interessante é o tipo despesa e subcategoria custo fixo. Seus campos
seguem a seguir:

 a chave do tipo;
 o tipo de custo: Receitas ou Despesas;
 sua subclassificação: Fixa, Variável ou Despesas Administrativas.

3.3.4. Dimensão Atividade

A dimensão atividade é uma tabela composta pelas atividades desenvolvidas


nas áreas da propriedade. Através de seus cruzamentos com as dimensões de tempo
e área será possível identificar, através das métricas definidas na tabela de fato,
informações que dizem qual atividade é a mais produtiva em relação ao um tempo e
uma área. Elas serviram para auxiliar o proprietário a elaborar o rodizio de culturas nas
áreas de uso.
Em relação a sua estrutura física, esta tabela é composta simplesmente pelas
três colunas apresentadas a seguir:

 a chave de identificação individual do registro;


 o nome da atividade, que representa sua simples descrição; e,
 a descrição de seu grupo.

3.3.5. Fato Movimentação Financeira


41

E por fim, a tabela de fato, movimentação financeira. Ela representa a “união”


de todas as dimensões apresentadas além de ser composta pelos valores numéricos
importantes para o embasamento das informações.
As movimentações financeiras são classificadas em receitas ou despesas,
sendo que a despesa representa a somatória dos custos fixos, custos variáveis e
despesas administrativas. A diferença entre as despesas e as receitas compõe o lucro
operacional.

Figura 10 - Modelagem Dimensional proposta para o estudo de caso, o Ambiente Agropecuário.

A partir do cruzamento das dimensões e analisando as métricas citadas alguns


tipos de analises são possíveis, além dos citados:

 Qual atividade apresenta maior lucro operacional?


 Qual item de despesa que apresenta maior custo?
 Vale a pena plantar soja a partir de março ou de outubro?
 Qual atividade tem o maior custo fixo?
 Em qual área determinada atividade apresenta o maior lucro operacional?
42

 Qual o grupo de atividade que apresenta o melhor lucro por ano?

Estes são apenas alguns dos exemplos de analises que podem ser extraídas
do modelo proposto. Entretanto, vale ressaltar que o nível de granularidade definido
para este modelo tem como objetivo apresentar informações claras e objetivas sobre
as movimentações financeiras de uma propriedade; caso seja necessário uma analise
mais aprofundada será necessário redefinir as granularidades que compõe as tabelas.
Todo o modelo dimensional descrito anteriormente é apresentado na Figura 10.
43

4. RESULTADOS E DISCUSSÃO

Para que a tecnologia do BI possa ser executada de forma eficiente e consiga


atender as necessidades proposta em seu escopo é preciso que os dados de origem
sejam tratados antes de serem carregados no DW, ou seja, passam pelo processo de
ETL este processo esta alocado no grupo de ferramentas de construção do BI.
Na primeira parte do processo os dados de origem são lidos e compreendidos.
A partir desta compreensão estes dados passam por um processo de transformações
que podem envolver filtragem dos dados, exclusão de dados duplicados, atribuição de
chaves e combinação de dados de diferentes origens. Essa integração dos dados é
necessária para obter-se consistência de nomes, de variáveis de medidas, de
codificação das estruturas e de atributos físicos dos dados (Inmon e Hackathorn,
1997).
Os dados resultantes do processo de transformação são
carregados/armazenados no DW utilizado pelas ferramentas de apresentação.
Para a realização deste processo foi utilizado à ferramenta Kettle que compõe
a suíte de ferramentas open source9 da Pentaho como descrito na seção a seguir.

4.1. KETTLE

O Kettle (Pentaho Data Integration, PDI) é uma das ferramentas que compõe a
suíte open source do Pentaho. É uma ferramenta que oferece diversas funcionalidades
para elaboração do processo de ETL, desde a extração dos dados dos repositórios de
origem até a integração dos mesmos e carga no repositório de destino.
Para realização das funcionalidades citadas a ferramenta divide-se em dois
tipos de atividades, Jobs (Trabalhos) e Transformation (Transformações). Nas
transformações elaboramos o processo de transformação de dados; a extração dos
dados relevantes para construção de uma tabela dimensão, por exemplo. O processo
de transformação é composto por um conjunto de steps (passos) ligados entre si por
uma linha para representar seu fluxo (hops). Na ferramenta estes passos são

9
O termo código aberto, ou open source em inglês, foi criado pela OSI (Open Source Initiative) e
refere-se a software também conhecido por software livre.
44

agrupados por categorias e podem ser deste a leitura de um parâmetro até a validação
de um cartão de crédito. A Figura 11 apresenta como exemplo a transformação dos
dados desde a extração dos lançamentos financeiros no repositório de origem, no caso
o banco de dados do GISAWEB até o passo de inserção dos dados transformados no
DW utilizado pelo BI.

Figura 11 - Passos para transformação dos dados da tabela de fato Movimentação Financeira.

A Figura 12 apresenta com mais complexidade o processo de criação da


dimensão de Tempo.

Figura 12 - Passos para elaboração da dimensão Tempo


Fonte: http://blog.professorcoruja.com/

Esta transformação tem como objetivo gerar dados para a dimensão tempo.
Como se pode ver o processo inicia com a geração de registros para 20 anos a partir
de janeiro de 1997. No passo calculate dimension atributes através de funções Java
são gerados dados separados, ou seja, a partir de uma data extrai-se seu dia, ano, dia
da semana para que eles sejam gravados em suas respectivas colunas.
45

Para que o DW possa oferecer informações precisas em tempo real para seus
usuários é necessário que o processo de ETL seja executa periodicamente ou
automaticamente ou por um responsável. Em geral, este processo pode ser composto
por diversas transformações; por exemplo, geralmente os projetos de BI são
compostos por mais de uma tabela de dimensão e ao menos uma tabela de fato, ou
seja, para cada uma das tabelas pode ser necessário uma transformação sendo
necessário á execução individual de todas essas transformações.
Uma forma de facilitar e/ou automatizar este processo periódico é elaborando
um job (Trabalho). Este pode ser composto por um conjunto de transformações, ou
ações como enviar e-mail, transferir arquivos ou executar instruções em JavaScript,
SQL ou Shell. A Figura 13 apresenta o conjunto de transformações utilizadas no
estudo de caso.

Figura 13 - Job (Trabalho) utilizado para o estudo de caso.

Ressalta-se que assim como nas transformações os passos nos Jobs são
ligados entre si por linhas que representam seu fluxo de execução, também nomeados
de Hops.

4.2. SCHEMA WORCHBENCH E REPORT DESIGNER

Entretanto, apenas o processo de ETL não é suficiente para que o usuário


possa utilizar o BI. Para que o BI passe a oferecer informações precisas, seguras e de
fácil compreensão é preciso utilizar ferramentas para apresenta-las seja através de
46

relatórios simples ou ferramentas de Online Analytical Processing (OLAP) estas


ferramentas compõe o grupo de ferramentas de uso do BI.
Pode-se realizar o desenvolvimento dos relatórios na ferramenta Pentaho
Report Designer (PRD), ferramenta que assim como o Kettle também compõe a suíte
open source da Pentaho. Esta é uma ferramenta simples e que oferecer diversos
recursos para elaboração, pré-visualização e publicação dos relatórios.

Figura 14 - Relatório simples de atividades gerado no PRD.

Um dos recursos que vale ressaltar é a funcionalidade Report Design Wizard


onde através dela podem-se desenvolver relatórios de forma simples, intuitiva e rápida.
A Figura 14 apresenta um relatório simples de atividades gerado no PRD utilizando os
dados carregados no DW do estudo de caso.
As ferramentas de OLAP que tem como capacidade manipular e analisar
grandes volumes de dados sob-múltiplas dimensões em tempo real. Através de um
simples estilo de navegação e pesquisa, usuários finais podem rapidamente analisar
inúmeros cenários, gerar relatórios ad-hoc, e descobrir tendências e fatos relevantes
independente do tamanho, complexidade, e fonte dos dados corporativos. O Mondrian
Schema Workbench, ferramenta que também compõe a suíte open source da Pentaho
oferece suporte para elaboração de cubos OLAP através da criação de um arquivo
XML que descreve quais são os cubos, quais as dimensões e suas respectivas tabelas
associadas.
A Figura 15 apresenta um cubo que cruza as dimensões de atividade por
tempo e mostra as métricas de despesas e receitas. O cubo oferece uma visão de fácil
compreensão através dos recursos de drill-down e drill-up. A partir dele é possível
verificar quais foram os valores dos custos fixos, variável e das despesas
47

administrativas que compõe as despesas e qual foi à receita por ano e através de um
drill-down podemos visualizar esses valores por meses.

Figura 15 - Cruzamento de dados das atividades por tempo no cubo do Pentaho

E através disso, o pessoal da gerencia pode tirar algumas conclusões. Uma


delas é de que a produção esta tendo um ganho apenas em 2010; entretanto, os
resultados apresentados nos anos de 2007, 2008 e 2009 mostrando que a opção de
trocar de atividade deve ser avaliada. A Figura 16 apresenta os dados mostrados no
cubo no formato de gráfico de barras.

Figura 16 - Métricas de despesas e custos das atividades por ano


48

Enquanto a Figura 17 apresenta um cubo onde se procura apresentar os


valores de despesas e receitas da atividade Apicultura dividida pelas propriedades e
suas áreas. Com base neste cubo podem-se obter informações vinculadas ao
desempenho das propriedades para esta determinada atividade, estas podem servir
para o pessoal da gerencia tomar decisões com relação ao planejamento ou troca de
atividade nas propriedades que apresentarem o menor índice de desempenho.

Figura 17 - Valores de despesas e receitas da atividade Apicultura por propriedade

Ressalta-se que tanto as informações obtidas neste segundo cubo podem


ajudar na definição daquelas propriedades que apresentam os melhores índices de
desempenho para a atividade em questão e para que após analises das técnicas
utilizadas por essas propriedades de referencia seja elabora a cartilha com as
melhores práticas da rede de propriedade de referencia.
49

5. CONCLUSÕES

Este trabalho apresentou uma proposta de construção de BI partindo da coleta,


transformação, carga até a apresentação de informações a partir dos dados presentes
em um repositório gerenciado por um sistema de informação que controla os dados de
um ambiente voltado para o agronegócio. A proposta tem como objetivo principal
realizar o levantamento e análise de informações financeiras das produções da
propriedade, ou seja, suas despesas e receitas. Isso por que, essas informações
representarem uma peça fundamental para o benchmarketing comparativo entre as
propriedades de uma rede de referência.
Durante a fase de levantamento de requisitos e definição do escopo do DW
evidenciou ser necessário que haja um modelo para coleta e definição de quais são as
respostas que o usuário deseja ter, ou seja, é preciso que durante a fase de
elaboração seja realizado um contato diretamente com os usuários para definição de
quais serão os processos de negócios que serão avaliadas e somente a partir da
definição desta etapa é a fase de modelagem do DW pode iniciar. Este modelo para
coleta e definição do escopo foi um dos principais problemas encontrados durante a
fase de elaboração isso por que em muitos casos o usuário não sabe exatamente o
que ele deseja com a aplicação da inteligência de negócio.
Outro problema que vale ser ressaltado foi à necessidade de uma etapa para
estudo e compreensão da arquitetura de tabelas e dados no repositório de dados do
ambiente de produção, no caso do GISAWEB. Esta etapa foi muito importante para a
elaboração do processo de ETL no BI.
Para a elaboração dos processos de construção do BI foi utilizado um conjunto
de ferramentas, disponíveis gratuitamente, que viabilizam todo este processo desde a
coleta dos dados nas diversas fontes de dados disponíveis pela propriedade (banco de
dados, documentos Word ou Excel), ETL, modelagem de cubo e apresentação final
para o usuário. As ferramentas citadas são o Kettle, o Schema Workbench e o Report
Designer todas elas compõe o conjunto de ferramentas open source da empresa
Pentaho.
Assim sendo, este trabalho contribuiu para que possam ser esclarecidos os
seguintes tópicos:
50

 qual seria o principal propósito da aplicação do BI no ambiente voltado para


o agronegócio,
 uma proposta de estrutura de aplicação do BI,
 um modelo de dados para obtenção de informações relevantes para uma
possível tomada de decisão no ambiente do agronegócio.

Como pesquisas futuras relacionadas à aplicação do BI no ambiente do


agronegócio indicam-se:

 elaboração de uma metodologia padrão de levantamento de dados para


construção de novos modelos dimensionais de dados,
 estudo comparativo de outras ferramentas para aplicação do BI.
51

6. REFERÊNCIAS

AGUIAR, A. P. A.; RESENDE, J. R. Pecuária de Corte: custos de produção e análise


econômica. 1 ed. Viçosa: Editora Aprenda Fácil, 2010.

BARBIERI, C. BI-Business Intelligence: Modelagem e Tecnologia. Rio de Janeiro:


Editora Axcel Books, 2001.

BISPO, C. A. F. Uma análise da nova geração de sistemas de apoio à decisão.


1998. 174f. Dissertação de Mestrado. Escola de Engenharia de São Carlos,
Universidade de São Paulo, São Carlos, 1998.

CARNEIRO, S. L. et al. AGRUS: um software para a gestão de sistemas de produção


agropecuários em rede. Instituto Paranaense de Assistência Técnica e Extensão
Rural – EMATER. Disponivel em: <
http://www.emater.pr.gov.br/arquivos/File/Gestao_Negocios_Odilio/05_AGRUS_
soft_gestao.pdf>. Acesso em: 25 set. 2010.

CENTENARO, A. C.; DRUZIANI, C. F.; SUCOLOTTI, A. A.; TODESCO, J. L.


Modelando um data warehouse dimensional a partir de um modelo hierárquico. In:
WORKCOMP-SUL, 1, 2004, Palhoça. Santa Catarina: UNISUL – Universidade do Sul
de Santa Catarina, 2004.

FERREIRA, J. E., ITALIANO, I. C.; TAKAI, O. K. Introdução a Banco de Dados.


2005. Disponível em: <http://www.ime.usp.br/~jef/apostila.pdf>. Acesso em 01 jan.
2011.

FORTULAN, M. R.; GONÇALVES FILHO, E. V. Uma proposta de aplicação de


Business Intelligence no chão-de-fábrica. Gestão & Produção, São Carlos, v.12, n. 1,
p.55-66, jan-abr. 2005.

HOKAMA, D. D. B.; CAMARGO, D.; FUJITA, F.; FOGLIENE, J. L. V. A modelagem de


dados no ambiente data warehouse. 2004. 121 f. Trabalho de Conclusão de Curso
(Bacharel em Sistemas de Informação) – Universidade Presbiteriana Mackenzie, São
Paulo.

INMON, W. H; HACKATHORN, R. H. Como usar o Data Warehouse. Tradução de


Olavo Faria. Rio de Janeiro: Infobook, 1997.

KIMBALL, R. The data warehouse toolkit: the complete guide to dimensional


modeling. 2 ed. New York: Wiley Computing Publishing, 2002.

LINDEN, K. H. Z. Dez regras clássicas para implementar Business Intelligence.


ComputerWorld. 2011. Disponível em: <
http://computerworld.uol.com.br/gestao/2011/01/11/dez-regras-classicas-para-
implementar-business-intelligence/ >. Acesso em: 27 dez. 2010.
52

MAXIMIANO, A. C. A. Teoria geral da administração: da revolução urbana à


revolução digital. 6 ed. São Paulo: Atlas, 2007.

MARTIN, T. Reconsidering Multi-Dimensional Schemas. SIGMOD Record, Hartford,


Vol. 33, No. 1, March 2004.

MIRANDA, M., PASSINI, J. J., MIRANDA, G. M., RIBEIRO, M. F. S., SOARES


JÚNIOR, D. A busca de referências técnicas e econômicas para o
desenvolvimento da agricultura familiar no estado do Paraná através de uma
rede de propriedades. In: IV ENCONTRO DA SOCIEDADE BRASILEIRA DE
SISTEMAS DE PRODUÇÃO, 2001, Belém. Anais. Belém: Sociedade Brasileira de
Sistemas de Produção, 2001.

MIRANDA, M. & DOLIVEIRA, D. D. 2005. Redes de referências: um dispositivo de


pesquisa & desenvolvimento para apoiar a promoção da agricultura familiar
paranaense, p. 9-19. In: Redes de referências, um dispositivo de pesquisa &
desenvolvimento para apoiar a promoção da agricultura familiar. Campinas, Conselho
Nacional dos Sistemas Estaduais de Pesquisa Agropecuária (CONSEPA), 41p.

MILANEZ, C. A. Uma arquitetura de data warehouse para apoio à gestão de


projetos em desenvolvimento distribuído de software. 2010. 116f. Dissertação
(Mestrado em Ciência da Computação) – Universidade Estadual de Maringá, Dep. de
Informática, 2010.

MSIAD 2007/2008. Elementos da Modelagem Dimensional. Lisboa, 2007. Disponível


em: <http://mymsiad.blogspot.com/2007/09/o-modelo-dimensional-md-uma-tcnica-
de.html>. Acesso em: 04 out. 2010.

PEDROZO, W. G. Data webhouse – uma ferramenta de suporte a análise de


clickstrem. 2004. 94f. Monografia (Especialização em Ciência da Computação) –
Universidade Estadual de Londrina, Londrina.

PRISMAK, F. V. A importância do BI para pequenas e medias empresas. Oficina da


net. Disponível em:
<http://www.oficinadanet.com.br/artigo/business_intelligence/a_importancia_do_bi_nas
_pequenas_e_medias_empresas>. Acesso em 25 maio 2010.

PRIMAK, F. V. Decisões com B.I.: Business Intelligence. Rio de Janeiro: Editora


Ciência Moderna Ltda., 2008.

ProfessorCoruja.com – Negócios & Tecnologia Gratuita. São Paulo: SOUZA, C. M.


Disponível em: <http://blog.professorcoruja.com/>.

SOLFA, J. E. Business intelligence como instrumento de gestão e planejamento


estratégico. Um conjunto de ferramentas para analise gerencial e estratégica. 2005.
72f. Trabalho de Conclusão de Curso (MBIS – Master Business Information Systems)
– Centro Universitário de Lins, Lins.

SERRA, L. A essência do Business Intelligence. São Paulo: Ed. Berkeley Brasil,


2002.
53

SILVA, E. L.; MENEZES, E. M. Metodologia de pesquisa e elaboração de


dissertação. 3 ed. Florianópolis: Laboratório de Ensino a Distância da UFSC, 2001.

SILVEIRA, F. C. S. Construção de modelo de Business Intelligence para a


controladoria evidenciar informações estratégicas: o caso do SESI – Serviço
Social da Industria do Estado do Rio Grande do Sul. 2007. 386f. Dissertação
(mestrado) – Universidade do Vale do Rio dos Sinos, São Leopoldo.

SORIO, W. O que é Benchmarketing?. Disponível em:


<http://www.guiarh.com.br/z59.htm>. Acesso em: 19 out. 2010.

SODRÉ, P. Cubo x Relatório. linhadecodigo.com. 1997. Disponível em: <


http://www.linhadecodigo.com.br/artigo/1454/Cubo-X-Relat%C3%B3rio.aspx>. Acesso
em: 05 jan 2010.

REGINATO, L.; NASCIMENTO, A. M. Um estudo de caso envolvendo business


intelligence como instrumento de apoio à controladoria. Edição 30 anos de
doutorado, São Paulo, p. 69-83, jun. 2007.

ROLDÁN, M. C. Pentaho 3.2 Data Integration: Extract, transform, validate, and


integrate your data with ease. Birminghm: Packt Publishing, 2010.

TACHIZAWA, T.; CRUZ JÚNIOR, J. B.; ROCHA, J. A. O. Gestão de Negócios: visões


e dimensões empresarias da organização. 3 ed. São Paulo: Atlas, 2006.

TEIXEIRA, L. C. S. A tecnologia Business Intelligence auxiliando na implantação do


Planejamento Estratégico baseado no Balanced Sorecard. Revista Techoje uma
revista de opinião. Disponível em:
<http://www.techoje.com.br/site/techoje/categoria/detalhe_artigo/349>. Acesso em: 06
ago. 2010.

YIN, R. K. Estudo de caso: planejamento e métodos. Porto Alegre: Bookman, 2005.


54

APÊNDICE A

Abaixo segue o artigo desenvolvido a partir desta monografia e apresentado no


13º Simpósio de Iniciação Cientifica da UNILINS realizado em Lins – SP e publicado
na Revista Estudos & Pesquisas da UNILINS Edição 2010 (ISSN – 1415-6709).

BUSINESS INTELIGENCE (BI) APLICADO EM UM SISTEMA


AGROPECUÁRIO

Flávio Eduardo Aoki Horita 1


Sergio Akio Tanaka 2

1
Acadêmico do Curso de Especialização em Engenharia de Software com
UML do Centro Universitário Filadélfia – Unifil, Londrina-PR, Brasil
2
Docente do Curso de Especialização em Engenharia de Software com UML
do Centro Universitário Filadélfia – Unifil, Londrina-PR, Brasil
Resumo

O Business Intelligence (BI) consiste na utilização de um conjunto de


ferramentas tecnológicas para o processamento de dados procurando construir
informações ou o reconhecimento de padrões técnicos em tempo hábil para a
tomada de decisão em uma organização. Esse trabalho procura aplicar o BI em um
sistema voltado para a gestão do agronegócio a fim de que as informações
fornecidas por ele sejam utilizadas para elaborar um benchmarketing comparativo
entre os produtores rurais das chamadas Redes de Propriedades de Referência. De
posse destas informações, pretende-se identificar um conjunto de referências
sociais, técnicas e econômicas que serviram para fundamentar indicadores de
desempenho ou Key Performance Indicators (KPI), utilizados depois para a
elaboração de uma cartilha com as melhores práticas que procura diminuir custos de
produção, desperdício de materiais e aumentar a produção da rede. O trabalho
também apresenta a construção do data warehouse para o ambiente proposto, suas
rotinas de carga e ferramentas de análise dos dados através das ferramentas da
suíte Pentaho Open Source Community aplicadas na base de dados do sistema
integrado GISAWEB que informatiza as Redes de Propriedades de Referências no
Paraná, programa coordenado pelo IAPAR e EMATER-PR.

Palavras chaves – Business Intelligence, Benchmarketing, Agrobusiness,


Data warehouse, Modelagem Dimensional, Pentaho.

Introdução

A constante procura por eficiência, melhor qualidade e menores custos nos


processos tornaram-se os principais objetivos das empresas atuais, impulsionados
principalmente pela crescente concorrência nos mercados globais e a escassez de
recursos. Em paralelo a este fato, o avanço da área de tecnologia de informação fez
com que ela passa-se a exercer um papel fundamental nas empresas modernas,
através da automatização dos processos empresarias e da construção de um
repositório com seus dados, sendo eles passíveis de análises técnicas e financeiras.
56

Entretanto, mesmo estando inundados de dados e informações dificilmente os


sistemas em atividade nas empresas conseguiam fornecer informações seguras,
agéis e precisas para seus gestores. Isso por que além de consumir muito recurso
para seu processamento, quando os relatórios são gerados seu entendimento é
dificultado devido a elevada quantidade de números, siglas e agrupamentos
tornando-o limitado apenas para aqueles com mas conhecimento na regra do
négocio.
Neste panorama surgiu o BI onde através de suas ferramentas é possível
realizar consultas às bases de dados para apresentar informações de forma simples
e rápida, atendendo às necessidades, principalmente do pessoal ligado a gestão das
empresas [1]. A aplicação do BI em uma empresa consiste na implantação de um
conjunto de ferramentas que contempla desde a extração dos dados transacionais
até a apresentação das informações para seus usuários. Sua suíte de ferramentas é
dividida em 4 grupos: as de construção responsáveis pelo processo de extração e
transformação dos dados primitivos10 para os derivados11; as de armazenamento
representadas pelos data warehouse e data marts que tem como objetivo armazenar
os dados derivados; as gerênciais que controlam as permissões de acesso às
ferramentas; e por fim, as de uso que tratam a forma com que os dados serão
apresentados para os usuários. Esta estrutura é apresentada na Figura 1.

Figura 1 - Visão geral das


ferramentas de um ambiente de
Business Intelligence (BI)
Fonte: Adaptado de Barbieri [3]

Entretanto, ressalta-se
que por se tratar de um
conjunto de ferramentas que
trabalham com transformações
de dados primitivos e geração
de informações, é mais

10
Os dados primitivos são os dados operacionais e podem ser atualizados.
11
Os dados derivados são dados resumidos ou calculados de forma a atender às necessidades da gerência da
empresa
57

comum encontrarmos o BI executando em paralelo a um sistema de informação, os


chamados sistema de produção.
Por todos esses motivos, cita-se que o BI pode ser uma das tecnologias
indicadas para aplicação em uma rede de propriedades rurais de referência. Sendo
o principal objetivo da rede comprovar se determinados métodos e técnicas trazem
benefícios para as propriedades que compõe a rede, dispor de um conjunto de
ferramentas que ofereça subsídios para uma análise e apresentação clara dos
dados coletados em campo é de extrema importância [2]. Está análise será
essencial para elaborar um benchmarketing comparativo entre as práticas adotadas
pelas propriedades de rede, mas também para a elaboração de uma cartilha com as
práticas que apresentarem melhor níveis nos indicadores de desempenho definidos
pela rede.

Metodologia e Aplicação

A metodologia de desenvolvimento deste trabalho iniciou-se com uma pesquisa


bibliográfica onde procurou-se construir uma base sólida sobre os temas abordados.
A partir dela, elaborou-se uma estrutura a ser aplicada no data warehouse de
análise de dados do sistema agropecuário. A elaboração deste data warehouse
baseou-se em um modelo desenvolvido por Kimball [4] composto pelas quatro
etapas a seguir:

1. Definição dos processo de negócio;


2. Definição dos níveis de granularidade;
3. Definir os dados do processo, que irão compor as tabelas dimensão; e,
4. Definir as medidas para as tabelas de fato.

As etapas descritas servem para elaborar uma estrutura de dados utilizando a


modelagem dimensional. Para Kimball [4] em comparação com a tradicional
modelagem entidade-relacionamento (DER), a dimensional apresenta melhor
desempenho para consultas e maior facilidade de compreensão. Esta modelagem é
composta por dois tipos de tabelas: as tabelas de fato, apresentada pela Figura 2,
que representam essencialmente um processo de negócio e são compostas por
métricas do fato e chaves derivadas do relacionamento com as tabelas dimensão;
58

Figura 2 - Exemplo de Tabela de Fato (Fato Vendas Diárias)


Fonte: Kimball [4]

As tabelas dimensão são compostas pelas informações complementares às


tabelas de fato. A combinação entre as dimensões com uma tabela de fato gera uma
informação. Isso acaba tornando a existência de uma dimensão dependente de ao
menos uma tabela de fato. Essencialmente as dimensões são compostas por
colunas que contêm elementos textuais que descrevem o negócio e uma chave
primária que irá compor a chave composta de sua tabela de fato. A Figura 3
apresenta um exemplo de tabela dimensão.

Figura 3 - Exemplo de Tabela Dimensão (Dimensão Produto)


Fonte: Kimball [4]

A estruturação entre as tabelas de fato e as dimensões compõe a chamada


arquitetura estrela (Star Join Schema), apresentadoa na Figura 4. Esta arquitetura é
apenas um modelo da modelagem dimensional de dados.
59

Figura 4 - Estrutura de uma Modelagem utilizando o Esquema Estrela


Fonte: Hokama et. al. [5]

Para aplicar os conceitos descritos utilizou-se as ferramentas Kettle, Pentaho


Data Integration, que trabalha na parte de extração, transformação e carga em data
warehouses; o Report Designer, Pentaho Reporting, ferramenta utilizada para
geração de simples relatórios; e por fim, o Mondrian, Pentaho Analysis Services,
utilizado para geração dos cubos multidimensionais; todas as ferramentas compõe a
suíte Pentaho Open Source Community12. Aplicou-se a suíte na base de dados
gerada pelo sistema integrado GISAWEB13, da empresa LIDAWEB, que informatiza
a Rede de Propriedades de Referências no Paraná, pelo programa coordenado pelo
IAPAR e EMATER-PR.

Resultados

Antes da realização das etapas descritas pelo modelo concluiu-se que seria
necessária a realização de uma etapa adicional antes de iniciar a modelagem do
data warehouse. Nesta etapa objetivou-se saber quais os dados primitivos que
seriam transformados para derivados no data warehouse, ou seja, compreender
toda a estrutura de dados do sistema integrado disponível no ambiente de produção,
no caso sistema GISAWEB, e com base neste entedimento construir e estruturar o
processo de ETL14.

12
Suíte de ferramentas open source da empresa Pentaho (http://community.pentaho.com/).
13
Sistema de Gerenciamento Integrado de Sistemas Agropecuários na WEB
14
Sigla que significa Extract, Transform and Load, no português Extração, Transformação e Carga.
60

Após realizar as etapas descritas foi possível elencar diversos processos de


negócio do ambiente estudado
que poderiam sofrer análise de
dados a fim de obter informações
importantes para o proprietário.
Entretanto, o processo que
engloba as movimentações
financeiras foi o processo
escolhido para ser utilizado e
estudado neste trabalho. Isto
porque como ressalta Aguiar e
Resende [6] há algum tempo a

eficiência da pecuária passou a Figura 5 - Modelagem de Dados proposta para Análise das
Movimentações Financeiras em estudo.
ser representada pelo lucro e
prejuízos gerados pelas conjunção de despesas15 e receitas16, ou seja, o fator
determinante para o lucro da atividade em questão passou a ser representado pela
diferença entre a renda e os custos. E assim, obter informações para a correta
compreensão financeira da propriedade é de suma importância para o produtor
moderno.
Para isto, foi proposto a arquitetura de dados apresentada na Figura 5. Nela
pode-se observar a existência de 4 tabelas dimensão (Tipo, Área, Tempo, Atividade)
ligadas a uma tabela de fato (Movimentações Financeiras). A dimensão Tempo é
composta pelos dados descritivos com relação ao tempo do fato. Além dela, a
dimensão Tipo representa os tipos de movimentações financeiras que o fato pode
representar (custo fixo, variável, receita ou despesa); enquanto a dimensão
Atividade que traz todas as informações sobre as atividades que praticadas nas
propriedades (trigo, leite, bovinos de corte, laranja); e por fim a dimensão Área
engloba todas as informações de uma area de produção (sua propriedade e seu
grupo).

15
A soma dos valores de todos os recursos (insumos e serviços) utilizados no processo produtivo de uma atividade
agrícula, em um certo período de tempo representam os custos de produção [6].
16
Segundo Aguiar e Resende [6], a renda ou receita bruta é o fruto do somatório do volume vendido multiplicado
pelo preço unitário de cada produto.
61

A tabela de fato representa as movimentações financeiras, ela é composta por


métricas que serviram de benchmark comparativo entre os cénarios propostos pelas
ferramentas de apresentação, dentre elas cita-se principalmente o Lucro
Operacional que representa a diferença entre as receitas e os custos operacionais.

Discussão e conclusões

Há algum tempo o BI vem desempenhando um papel importante para as


empresas que através da análise dos dados contidos em suas fontes conseguem
obter informações primordiais para a tomada de decisão.
Devido a isto, esta foi a tecnologia escolhida para se aplicada em um
sistema que controla as propriedades rurais em uma rede de referência, compondo
assim o objetivo principal deste trabalho.
Através do modelo de estrutura de dados proposto conseguiu-se responder
algumas perguntas relevantes para a tomada de decisão sobre as movimentações
financeiras da propriedade, seguem alguns exemplos:

1. Qual atividade apresenta maior lucro?


2. Qual item de despesa que apresenta maior custo?
3. Vale a pena plantar soja a partir de março ou de outubro?
4. Nesta área é mais lucrativo plantar soja ou milho nesta época do ano?
5. Qual sistema de produção apresenta melhores resultados para cada
atividade?
6. Qual é a margem de contribuição de cada sistema de produção para a
receita global da propriedade (Sistema Produtivo)?

De posse destas respostas (informações), o proprietário consegue realizar um


planejamento da produção, elaborar a rotação de culturas procurando maximizar sua
produção e aumentar sua receita, tudo isso com base em KPIs apresentados pelo
BI.
Entretanto, identificou-se que apenas implantar a suíte de ferramentas na
empresa não garante o sucesso da tecnologia. É preciso que haja um
comprometimento de todos as pessoas envolvidas no processo mas principalmente
da equipe que compõe a alta gestão pois é através de seu rigor na obtenção de
informações que será possível garantir na confiabilidade dos dados gerados.
62

Outro problema identificado é que deve-se ter uma correta compreensão da


finalidade para o qual o BI está sendo implantando, ou seja, saber quais respostas
(informações) a empresa procura responder (saber), para que a partir daí seja
montada a estrutura de dados que atenda os requisitos solicitados, caso contrário
pode-se acabar elaborando uma estrutura inadequada de dados que resultaria em
respostas (informações) incorretas.
Como proposta para trabalhos futuros no âmbito do BI, pode ser estudado um
workflow ou roteiro completo para auxiliar na construção da estrutura de dados do
data warehouse. E no contexto do estudo de caso pode-se estudar e propor novas
estrutura de tabelas de fato para outros processos de negócio, com por exemplo os
indicadores de produção da propriedade.

Agradecimentos

Ao pessoal da empresa LidaWEB em particular nas pessoas do Prof. Msc.


Ademir Padilha e meu companheiro de trabalho Luiz Paulo de Oliveira que ao longo
do trabalho estiveram sempre presente ajudando repassando seus conhecimentos e
experiências.

Referências Bibliográficas

[1] PRISMAK, F. V. Decisões com B.I. (Business Intelligence). Rio de Janeiro: Ed. Ciencia
Moderna Ltda., 2008.

[2] MIRANDA, M., PASSINI, J. J., MIRANDA, G. M., RIBEIRO, M. F. S., SOARES
JÚNIOR, D. A busca de referências técnicas e econômicas para o desenvolvimento da
agricultura familiar no estado do Paraná através de uma rede de propriedades. In: IV Encontro
da Sociedade Brasileira de Sistemas de Produção, 2001, Belém. Anais. Belém: Sociedade
Brasileira de Sistemas de Produção, 2001.

[3] BARBIERI, C. BI-Business Intelligence: Modelagem e Tecnologia. Rio de Janeiro:


Editora Axcel Books, 2001.

[4] KIMBALL, R. The data warehouse toolkit: the complete guide to dimensional
modeling. 2 ed. New York: Wiley Computing Publishing, 2002.

[5] HOKAMA, D. D. B., CAMARGO, D., FUJITA, F., FOGLIENE, J. L. V. A modelagem


de dados no ambiente data warehouse. 2004. 121 f. Trabalho de Conclusão de Curso
(Bacharel em Sistemas de Informação) – Universidade Presbiteriana Mackenzie, São Paulo.
63

[6] AGUIAR, A. P. A., RESENDE, J. R. Pecuária de Corte: custos de produção e análise


econômica. 1 ed. Viçosa: Editora Aprenda Fácil, 2010.

Você também pode gostar