Você está na página 1de 11

FAPI - FACULDADE DO PIAUÍ

CURSO DE GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO

Antônio Augusto
Aminadabe Naasson
Fabricio Sousa

Desenvolvimento de Data Warehouse e Ferramenta OLAP para Análise de Histórico


de Dados Meteorológicos: Estudo de Caso na Embrapa Meio – Norte.

Teresina-PI
2017
Antônio Augusto
Aminadabe Naasson
Fabricio Sousa

Desenvolvimento de Data Warehouse e Ferramenta OLAP para Análise de Histórico


de Dados Meteorológicos: Estudo de Caso na Embrapa Meio – Norte.

Início do trabalho de conclusão de curso de


graduação em Ciência da Computação que será
apresentado a Faculdade do Piauí - FAPI como
requisito parcial para a obtenção do título de
Bacharel em Ciência da Computação.

Orientador: Prof. Carlos Futino.

Teresina-PI
2017
SUMÁRIO

LISTA DE ABREVIATURAS E SIGLAS ................................................................... 4

LISTA DE FIGURAS ................................................................................................. 5

1 INTRODUÇÃO ................................................................................................... 6
1.1 OBJETIVOS ........................................................................................................ 7
1.2 OBJETIVO GERAL ............................................................................................. 7
1.3 OBJETIVOS ESPECÍFICOS ................................................................................. 7
1.4 JUSTIFICATIVA ................................................................................................. 7

2 REVISÃO BIBLIOGRÁFICA ............................................................................. 7


2.1 Business Intelligence (BI) ...................................................................................... 8
2.2 Extract, Transform and Load (ETL) ...................................................................... 9
2.3 Data Warehouse (DW) ........................................................................................ 10
2.4 Online Analytical Processing (OLAP) ................................................................... 10
2.5 PENTAHO ........................................................................................................ 10

REFERÊNCIAS ....................................................................................................... 10
LISTA DE ABREVIATURAS E SIGLAS

BI Business Intelligence
DW Data Warehouse
OLAP OnLine Analytical Processing
ETL Extract, Transform and Load
LISTA DE FIGURAS

Figura 2.1: Funcionamento básico do business intelligence ........................... 8


Figura 2.2: Visão do ETL ................................................................................. 9
1. INTRODUÇÃO

Atualmente a meteorologia tem uma grande importância para o mundo


moderno, a meteorologia estuda os fenômenos que ocorrem na atmosfera e as
interações entre seus estados dinâmicos, físico e químico, com a superfície terrestre
subjacente (VIEIRA, 2009). Uma ferramenta de fundamental importância neste
processo são as estações meteorológicas, que possuem o papel de monitorar as
condições meteorológicas na lavoura com a responsabilidade de obter dados
climáticos para ajudar agricultores e pesquisadores a tomarem decisões baseadas
nos seus respectivos resultados.

O seguinte trabalho de conclusão de curso aborda o tema


DESENVOLVIMENTO DE DATA WAREHOUSE E FERRAMENTA OLAP PARA
ANÁLISE DE HISTÓRICO DE DADOS METEOROLÓGICOS: ESTUDO DE CASO
NA EMBRAPA MEIO – NORTE. Assim iremos abordar durante o trabalho de
conclusão de curso o que é um Data Warehouse (DW) e suas etapas de
desenvolvimento juntamente com a Ferramenta OLAP (OnLine Analytical
Processing) em um processo de análise de histórico de dados meteorológicos do
estado do Piauí.

A crescente necessidade no mundo atual de cada vez mais obter


informações e conhecimento a partir de dados coletados e armazenados foi de
fundamental importância para iniciarmos o seguinte trabalho em questão, pois
muitas vezes os dados são trabalhados e armazenados de maneira incorreta.
Assim, este trabalho irá apresentar de maneira clara e simplificada como se
iniciar o processo de elaboração de um Data Warehouse e como podemos utilizar
ferramentas de Business Intelligence (BI) para obter informações e conhecimento a
partir de dados brutos que foram inicialmente coletados.

1.1 OBJETIVOS

1.1.2 OBJETIVO GERAL

6
O objetivo geral consiste em analisar os resultados oriundos deste trabalho
de conclusão de curso que pode demonstrar como a Ciência da Computação se
interliga diretamente com outras áreas da ciência e demonstrar alguns
procedimentos necessários para o desenvolvimento de um Data Warehouse,
extração de informações, obtenção de conhecimento e analisar sistemas de apoio a
tomada de decisões.

1.1.3 OBJETIVOS ESPECÍFICOS

O nosso objetivo específico em questão é fazer a implementação dessa


tecnologia na Embrapa Meio – Norte para solucionarmos uma demanda interna que
nos foi proposta, apresentando soluções gratuitas disponibilizadas no mercado que
facilmente suprem com a necessidade em questão. Logo a análise desse trabalho
pode ser aplicada diretamente em outras áreas que se encaixe com a descrição que
iremos abordar, trabalhando com as mesmas tecnologias e ferramentas gratuitas
que iremos descrever.

1.1.4 JUSTIFICATIVA

No ramo da pesquisa é muito exigido dos pesquisadores elaborações de


relatórios técnicos, contendo as diversas informações de como vai a produção do
plantio em paralelo ao clima naquela situação. Isso acaba tomando boa parte do
seu tempo, pois primeiro eles têm que extrair de forma manual os dados das
estações meteorológicas em forma de arquivos “.txt”, depois converter em planilhas
e gráficos no Excel, para só depois verificar o estado do clima a ser analisado,
elaborar relatórios e assim tomar as devidas providências.

É seguindo essa tendência que surgiu a ideia para o desenvolvimento da


seguinte ferramenta deste trabalho, com a criação de um Data Warehouse
contendo, de forma centralizada, as informações necessárias das estações
meteorológicas, para consultas. Além do Data Warehouse, uma aplicação de BI que
poderá gerar relatórios de forma rápida, dinâmica e customizável através de
consultas ao Data Warehouse.

7
2. REVISÃO BIBLIOGRÁFICA

2.1. Business Intelligence (BI)

O termo Business Intelligence (BI) é um termo popular e genérico que foi


promovido por Howard Dresner do Gartner Group em 1989. Ele descreve um
conjunto de conceito e métodos para aprimorar decisões de negócios pelo uso de
sistemas de apoio baseados em fatos. BI é por vezes usado como sinônimo de
ferramentas de geração de relatórios e consultas e sistemas de informação
executivos. Em geral, sistemas de BI são sistemas de apoio à decisão orientados a
dados (POWER, 2017).

Fonte: https://corporate.canaltech.com.br/materia/business-intelligence/conhecendo-a-
arquitetura-de-data-warehouse-19266/
Figura 2.1. Funcionamento básico do Business Intelligence

Diante dessa proposição o ambiente de Business Intelligence deve possuir


cinco características básicas, que são: (i) Extrair e integrar dados de múltiplas
fontes; (ii) Fazer uso da experiência, democratizando o capital intelectual; (iii)
Analisar informações contextualizadas, num nível de totalização e agrupamento
maior; (iv) Identificar relações de causa e efeito; e (v) Desenhar cenários, criar
simulações e estudar tendências (LEME FILHO, 2004).

O principal benefício do BI para a empresa é a sua capacidade de fornecer


informações precisas quando necessárias, incluindo uma visão em tempo real do
desempenho corporativo geral e de suas partes individuais. A partir dos resultados

8
de uma pesquisa entre 510 empresas, que os benefícios do BI são a economia de
tempo, versão única da verdade, melhores estratégias e planos, melhores decisões
táticas, processos mais eficientes e a economia de custos (WIKIPEDIA, 2017).

2.2. Extract, Transform and Load (ETL)

ETL é um processo de extração de dados de diversos sistemas,


transformação desses dados conforme regras de negócios e por fim o carregamento
dos dados geralmente para um Data Mart e/ou Data Warehouse, porém nada
impede que também seja para enviar os dados para um determinado sistema da
organização. A extração e carregamento são obrigatórios para o processo, sendo a
transformação/limpeza opcional, mas que são boas práticas, tendo em vista que os
dados já foram encaminhados para o sistema de destino. É considerada uma das
fases mais críticas do Data Warehouse e/ou Data Mart (WIKIPEDIA, 2017).

Fonte: http://www.devmedia.com.br/extract-transformation-and-load-etl-ferramentas-bi/24408/
Figura 2.2. Visão do ETL

Os projetos de Data Warehouse consolidam dados de diferentes fontes. A


maioria dessas fontes tendem a ser bancos de dados relacionais ou arquivo de
texto, mas podem existir outras fontes. Um sistema ETL tem que ser capaz de se
comunicar com as bases de dados e ler diversos formatos de arquivos utilizados por

9
toda a organização. Essa pode ser uma tarefa não trivial, e muitas fontes de dados
podem não ser acessadas com facilidade (WIKIPEDIA, 2017).

2.3. Data Warehouse (DW)

Data Warehouse é um repositório de dados que possui uma cópia dos dados
transacionais, oriundos dos sistemas operacionais, estruturados especificamente
para consultas e análises (KIMBALL, 1998). Ele forma a infraestrutura de back-end
de uma grande variedade de sistemas de usuário com a função de fornecer
compreensão e ação no que diz respeito às decisões de gestão; os data
warehouses frequentemente possuem um volume substancial de histórico de dados
operacionais de uma organização (EVELSON; NICOLSON, 2008).

2.4. OnLine Analytical Processing (OLAP)

OLAP (OnLine Analytical Processing ou processamento de análises em


tempo real) é uma das ferramentas mais usadas para a exploração de um data
warehouse, isso vai proporcionar a capacidade de manipular e analisar um grande
volume de dados. A ferramenta OLAP irá possibilitar fazer a análise e obter a
visualização dos dados meteorológicos construindo relatórios de maneira rápida,
consistente e interativa para auxiliar tomadas de decisões.

2.5. PENTAHO

O Pentaho é um software desenvolvido em Java utilizado na área de


Business Intelligence (BI) que oferece, principalmente, soluções nas áreas de
integração de dados (ETL – Extract Transform Load), relatórios, análises online
(OLAP – Online Analytical Processing) e mineração de dados. Ele se tornou o
preferido na organização do Big Data por ser open source (código aberto) e por se
integrar facilmente à qualquer infraestrutura de TI. Ainda, os relatórios, vistas de
análises e dashboards gerados pelo Pentaho são customizáveis e intuitivos
(KnowSolution, 2017).

10
REFERÊNCIAS

Vieira, Neise Ribeiro, Poluição do Ar E-papers. Rio, 2009, ISBN 9788576502159,


página 50. Citado na página 6.

KIMBALL, R. Data Warehouse Toolkit. 1.ed. São Paulo; Makron Books, 1998.
Citado na página 10.

KnowSolution. O que é Pentaho®? | KnowSolution. Disponível em:


<http://knowsolution.com.br/o-que-e-pentaho/>. Acesso em: 04 jun. 2017. Citado
nas páginas 10 e 11.

POWER, D. A Brief History of Decision Support Systems. Disponível em:


<http://dssresources.com/history/dsshistory.html>. Acesso em: 04 jun. 2017. Citado
na página 8.

LEME FILHO, Trajano. Business Intelligence no Microsoft Excel. Rio de Janeiro,


Axcel Books do Brasil, 2004. Citado na página 8.

WIKIPEDIA, Business Intelligence – Wikipédia, a enciclopédia livre. Disponível


em: <https://pt.wikipedia.org/wiki/Inteligêcia_empresarial> Acesso em: 04 jun. 2017.
Citado na página 9.

WIKIPEDIA, Extract, transform, load – Wikipédia, a enciclopédia livre.


Disponível em: <https://pt.wikipedia.org/wiki/Extract,_transform,_load> Acesso em:
05 jun. 2017. Citado nas páginas 9 e 10.

EVELSON, B.; NICOLSON, N. Topic Overview: business intelligence.


Cambridge, US: Forrester Research, Inc., 2008. Citado na página 10.

11

Você também pode gostar