Você está na página 1de 23

Implantao de um Data Warehouse para Acompanhamento de Desempenho

dos Cursos em uma Instituio de Ensino Superior


Deploying a Data Warehouse for Performance Monitoring Course in an Institution of
Higher Education
Implementacin de un Data Warehouse para la Supervisindel Rendimiento de
los Cursos en una Institucin de EducacinSuperior
Edgar Luiz de Lima Jnior1
Fabrcio Pires Vasconcellos2
Rodrigo Vitorino Moravia3
Resumo: Este artigo tem como objetivo apresentar a implantao um Data Warehouse em uma
Instituio de Ensino Superior de Belo Horizonte para o auxlio em seu planejamento estratgico. Foi
desenvolvido um modelo dimensional com uma base intermediria, rotinas de tratamento de extrao,
transformao e limpeza dos dados extrado do Excel, alm da ferramenta Web, onde os usurios
podem gerar relatrios on-line conforme a necessidade.
Palavras-chave: Data Warehouse (DW). Extrao, Transformao e Carga (ETL). On-Line Analytical
Processing (OLAP).
Abstract: This article aims to present a Data Warehouse deployment in an Institution of Higher
Education in Belo Horizonte to aid in their strategic planning. A dimensional model was developed with
an intermediate base handlers extraction, processing and cleaning of extracted data from Excel, plus
web tool where users can generate on-line reports as needed.
Keywords: Data Warehouse (DW). Extract, Transform, Load (ETL). On-Line Analytical Processing
(OLAP).
Resumen: Este artculo tiene como objetivo presentar undespliegue de Data Warehouseen una
Institucin de Educacin Superior en Belo Horizonte para ayudaren suplanificacin estratgica. Un
modelo tridimensional se hadesarrolladocon una extraccin manejadores de bases intermedias,
elprocesamiento y lalimpieza de losdatos extrados de Excel, adems de laherramienta web donde
losusuariospuedengenerar informes on-line, segnseanecesario.
Palabras clave: Data Warehouse (DW). Extraccin, Transformacin y Carga (ETL). On-Line Analytical
Processing (OLAP).

1 - INTRODUO
Constitui-se tema deste artigo a implantao de um Data Warehouse em uma
Instituio de Ensino Superior no qual os diretores e coordenadores no possuem
informaes histricas sobre o desempenho dos cursos.
Devido expanso e popularizao da tecnologia em geral, a sociedade ficou
conhecida como a sociedade da informao e, ao elencar caractersticas a ela
pertinentes, mencionam o fenmeno do caos informacional. Nunca havia se
observado um contexto no qual as informaes surgem e so disseminadas de modo
1

Graduando do curso Bacharelado em Sistemas de Informao pela Faculdade Infrium de Tecnologia.


edgarjrbr@gmail.com
2
Mestre em Sistemas de Informao e Gesto do conhecimento pela Fundao Mineira de Educao e Cultura.
Professor da Faculdade Infrium de Tecnologia. fabriciopv@gmail.com
3
Especialista em Gesto da Informao pelo Instituto de Educao Continuada da Pontifcia Universidade Catlica
de Minas Gerais. Professor da Faculdade Infrium de Tecnologia. rodrigo.moravia@gmail.com
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

to rpido entre seus usurios, ainda que haja grandes distncias entre eles. Os
indivduos podem buscar e acessar informaes dos mais variados tipos, porm, por
existir tantas informaes oriundas de mltiplas fontes, os usurios se veem diante do
desafio de se manter atualizados em meio a esse caos informacional, em uma
sociedade cujo ritmo de vida acelerado.
Quando se tem informaes antes dos concorrentes, possvel inovar e
surpreender as expectativas dos clientes, desta forma, aumenta a probabilidade de
fazer com que a empresa se torne referncia de mercado no segmento em questo,
tendo assim um diferencial de sucesso (BARBIERI, 2001).
A informao por si s no um diferencial competitivo para as organizaes,
depende da forma como utilizada. Uma empresa pode ser diferenciada em relao
aos seus concorrentes quando consegue obter algum tipo de diferena ou vantagem
que possa ser comparada e sustentada. Uma das formas de obter essa vantagem
atravs do rastreamento de informaes disponveis que auxilie a empresa a alcanar
um percentual maior de mercado no seu ramo de atuao.
Com tantas informaes e observando-se que estas mudam constantemente,
um dos problemas que as organizaes enfrentam na era da informao a forma de
organizar tantos dados para, enfim, transform-los em informaes teis, relevantes
e estratgicas para o negcio. Dentre as possveis opes de tecnologias para auxiliar
o gerenciamento e organizao destas informaes, o Data Warehouse, tambm
conhecido como DW, est na listagem como um dos candidatos, por se tratar de uma
cpia dos dados transacionais, estruturado para relatrios de anlise de nvel
gerencial.
Com um recurso de permitir que seus usurios unifiquem dados obtidos
externamente organizao com os dados internos da empresa, para a mesma base
de anlises, o Data Warehouse vem se destacando no mercado e sendo utilizado em
diversas organizaes.
O Data Warehouse visa automatizar e melhorar os processos relacionados
tomada de deciso, o uso desta ferramenta nas organizaes de pequeno, mdio ou
grande porte, possibilita a realizao de diversas anlises e projees, podendo
estimar as previses de crescimento da empresa e contribuir para a elaborao de
estratgias (PRIMAK, 2008).
Assim, delimitou-se o tema deste artigo a criao de um Data Warehouse para
o acompanhamento de desempenho de cursos em uma instituio de ensino superior.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

A pergunta norteadora deste estudo no sentido de investigar como a


implantao de um Data Warehouse pode influenciar uma Instituio de Ensino
Superior no seu planejamento estratgico.
O objetivo geral apresentar como se realizou a implantao de um Data
Warehouse em uma Instituio de Ensino Superior de Belo Horizonte para o auxlio
em seu planejamento estratgico. So objetivos especficos: definir e conceituar Data
Warehouse; implantar uma soluo para o auxlio ao planejamento estratgico da
Instituio de Ensino Superior.
A relevncia deste estudo trabalho consiste em mostrar como o Data
Warehouse na instituio auxiliar os tomadores de deciso, alm dos coordenadores
de cursos com informaes histricas sobre o desempenho dos cursos dentro da
instituio, facilitar o planejamento estratgico da mesma.
A pesquisa bibliogrfica, fontes secundrias, tem como base em autores tais
como Barbieri, (2001); Primak (2008), e pesquisa documental baseado na
Microstrategy e Microsoft.
Para compreenso deste tema dividiu-se este artigo em nove sees. A seo
1, esta introduo, e indicativa do estudo; a seo 2 apresenta o Data Warehouse; a
seo 3 aborda a modelagem de dados para Data Warehouse; a seo 4 trata
extrao, transformao e carga dos dados; a seo 5 apresenta a On-Line Analytical
Processing; a seo 6 aborda o Data Warehouse como estratgia competitiva; a
seo 7 apresenta a implantao prtica de um Data Warehouse em uma instituio
de ensino superior de Belo Horizonte; a seo 8 elabora a discusso referente a
implantao do Data Warehouse; a seo 9, tece as concluses do artigo.

2 - DATA WAREHOUSE
O termo Data Warehouse (DW) foi criado por Willian H. Inmon, no incio da
dcada de 1990 e definido por uma srie de autores conforme quadro 1:
O conceito de DW objetiva a definio de uma base de dados preparada em
vrios nveis de granularidade. A ideia via DW armazenar os dados em vrios graus
de relacionamento e sumarizao, de forma a facilitar e agilizar os processos de
tomada de deciso por diferentes nveis gerenciais.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Quadro 1 - Definies de Data Warehouse.


Autor:

Definio:

Peterson, (2001, p.

Um Data Warehouse organizado em reas funcionais e fornece uma

65)

perspectiva histrica sobre operaes corporativas.O Data Warehouse


tambm uma origem de dados. Como seus dados j foram unificados,
homogeneizados e limpos, eles frequentemente so a melhor origem de
dados para anlise de negcio.

Barbieri, (2001, p. 49)

Pode ser definido como um banco de dados, destinado a sistemas de apoio


deciso.

Gomes

Ribeiro,

[...] um repositrio central para todos os tipos significativos de dados que

(2004, p. 191)

vrios sistemas de negcios de uma empresa coletam.

Primak, (2008, p. 5)

[...] uma grande base de dados, ou seja, um repositrio nico de dados


(os

quais

foram

consolidados

organizados)

considerado

pelos

especialistas da rea da informtica como a "pea" essencial para a


execuo prtica de um projeto de Business Intelligence.
Fonte: elaborao do autor

O ambiente de um DW tem como objetivo produzir informaes que devero


atender s necessidades de seus usurios. (ROSINI:PALMISANO, 2003). Observase que o DW definido pelos autores como um repositrio de dados estratgicos para
o auxlio da tomada de deciso.

3 - MODELAGEM DE DADOS PARA DATA WAREHOUSE


O DW orientado por assunto, integrado, variante no tempo e no voltil, para
modelagem de dados quando utiliza-se o modelo dimensional.
O modelo dimensional, conforme Barbieri (2001), formado por tabelas Fato e
tabelas de Dimenso. Esse modelo modifica alguns conceitos que estavam
cristalizados nos projetos tradicionais de Banco de Dados, como por exemplo, a
ordem de distribuio de campos por entre as tabelas, permitindo assim que a
estrutura seja mais voltada para os muitos pontos de entradas especficos, conhecidos
como Dimenso, e menos para os dados granulares em si, conhecidos como Fatos.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Na figura 1, est representado no modelo dimensional um sistema de vendas


a varejo. Neste modelo tem-se uma tabela Fato chamada Vendas, que tem como
mtrica os campos quantidade vendida e o valor em reais. Outra tabela Fato chamada
Estoque que tem como mtrica a quantidade em estoque. E ainda seis tabelas de
Dimenso: Tempo, Produto, Loja, Promoo, Atendente e Nota Fiscal.

Figura 1 - Exemplo de um modelo Dimensional.

Fonte:

BARBIERI, Carlos. B. Business intelligence:


modelagem e tecnologia. Rio de Janeiro: Axcel
Books, 2001

Esse o conceito de modelo Dimensional, que possui as entradas de acesso,


as tabelas de Dimenso, e as tabelas Fatos contendo os fatos que so relevantes.
Dessa forma possvel acessar as mtricas desejadas, combinando atributos das
diversas dimenses, de uma forma objetiva e direta (BARBIERI, 2001).
O Esquema Estrela [...] o formato mais eficiente para armazenar dados
utilizados para anlise do negcio. (PETERSON, 2001, p. 71) O Esquema Estrela
recebe este nome, pela sua aparncia e composto por uma tabela Fato central e um
conjunto de tabelas de Dimenso. Nas Tabelas Fatos, so armazenados os fatos que
sero analisados, e nas tabelas de Dimenso esto contidas todas as perspectivas
pelas quais os fatos sero analisados.
Para Peterson (2001, p.78) a tabela de Fato o corao do esquema em
estrela, o autor acrescenta, que corresponde tabela central que armazena um
conjunto de medidas numricas, que esto associadas a eventos de negcio.
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Nesse sentido Barbieri (2001, p.81), assinala que [...] uma tabela Fato contm
vrios fatos, correspondentes a cada uma de suas linhas. Em cada fato pode ser
armazenado uma ou mais medidas numricas, que representa os valores objetos da
anlise dimensional.
A tabela de Fatos no possui um campo separado para uma chave primria,
ela formada pela composio de todas as chaves estrangeiras das tabelas
Dimenso. Nas tabelas de Fatos, os registros nunca so atualizados a menos que
seja necessrio corrigir um erro, ou fazer uma alterao. Os registros da tabela de
fatos nunca so excludos exceto quando registros antigos esto sendo arquivados.
Exemplificando os valores de medidas que podem ser colocadas em uma
tabela de Fato: o nmero total de itens vendidos; a quantidade monetria da venda; o
lucro sobre o item vendido (BARBIERI, 2001). Na figura 2 foram utilizadas como
valores de medidas: Vendas, Comisso e Desconto.

Figura 2 - Valores de medidas da tabela de fatos

.
Fonte: ROCHA, Reydeval. Introduo ao
Analysis Services 2005. Disponvel
em
<
http://www.devmedia.com.br/introduca
o-ao-analysis-services-2005-parte2/5730> Acesso em: 08 abr. 2014

As tabelas Dimenso, para Barbieri (2001, p.81), representam as entidades de


negcios e constituem as estruturas de entrada que servem para armazenar
informaes como tempo, geografia, produto, cliente, etc. As tabelas de Dimenso
so quase sempre muito pequenas, e armazenam um nmero significativamente
menor de linhas do que as tabelas Fato. Comparado tabela Fatos que sempre tem
mais registros sendo adicionados a ela, as tabelas de Dimenso so relativamente
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

estveis. Algumas delas como a dimenso de tempo raramente so alteradas aps a


sua criao.
Em uma tabela de Dimenso, a chave primria deve ser um campo nico com
um tipo de dados inteiro, afirma Peterson (2001). O autor tambm enfatiza que em um
esquema em estrela quase sempre h uma dimenso de tempo.
A dimenso de Tempo, para Barbieri (2001), necessria em projetos de DW
onde a evoluo dos dados histricos fundamental. Em um DW, segundo Barbieri
(2001, p. 94), as informaes so reunidas com relao a perodos particulares de
tempo. Cada dado vai refletir o seu prprio estado em diferentes momentos no tempo.
Em uma dimenso de tempo, a hierarquia pode ser agregada de diversas
maneiras. O nvel mais baixo da hierarquia de tempo pode ser definido de diferentes
formas, variando, por exemplo, de ano, trimestre, ms e dia, conforme exemplificado
na figura 3.

Figura 3 - Dimenso Tempo.

Fonte: BARBIERI, Carlos. B. Business intelligence:


modelagem e tecnologia. Rio de Janeiro: Axcel
Books, 2001

4 - EXTRAO, TRANSFORMAO E CARGA


A etapa de Extrao, Transformao e Carga, do ingls Extract, Transform,
Load (ETL) uma das mais crticas de um projeto de DW, pois envolve a fase de
movimentao dos dados.
Os sistemas chamados de ETL, conforme Primak (2008), so fundamentais
para preparar os dados que sero armazenados no DW. Embora atualmente j
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

existam produtos que facilitem esse trabalho, este ainda um processo trabalhoso,
detalhado e complexo, e que requer expertise para ser executado de forma adequada
e correta.
Os dados, afirma Rezende (2003), podem apresentar problemas advindos do
processo de coleta, estes problemas podem ser erros de digitao ou erro na leitura
dos dados pelos sensores. O uso de tcnicas de limpeza deve ser aplicado aos dados
para garantir a qualidade. A qualidade dos dados um fator essencial, pois,
possivelmente o resultado do processo de extrao ser utilizado em um processo de
tomada de deciso.
O Structured Query Language (SQL) Server Integration Services (SSIS), de
acordo com Ramalho (2005), uma plataforma utilizada para construir aplicaes de
integrao de dados, que inclui as tarefas conhecidas do pacote ETL para projetos em
DW. Alm de conectar-se a diversas fontes de dados, com o SSIS possvel fazer a
extrao dos dados e misturar os diversos formatos de dados em um nico formato.
A figura 4 mostra como normalmente o SSIS utilizado. Os dados de vrios
bancos de dados, incluindo o SQL Server 2008, podem ser combinados com dados
de outras fontes (RAMALHO, 2005).

Figura 4 - Descrevendo o Server Integration Services


(SSIS)

Fonte: Adaptado de:


MICROSOFT. Entendendo as tecnologias de
Integrao Microsoft. [Redmond], 2005.
Disponvel em <http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XS
LTsection128121120120> Acesso em: 3 out.
2013
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Em alguns casos, faz-se necessrio a limpeza dos dados, para garantir a


padronizao dos dados. Como exemplo, formatos de datas. Em uma fonte de dados
pode-se ter o formato da data dd/mm/yyyy, em outras fontes de dados pode-se ter o
formato da data como 2 de maio de 2014 (RAMALHO, 2005).

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

5 - ON-LINE ANALYTICAL PROCESSING (OLAP)


O termo On-Line Analytical Processing (OLAP) foi citado pela primeira vez em
um artigo escrito por Edgar Frank Codd em 1992. Refere-se a um conjunto de
ferramentas voltadas para acesso e anlise ad-hocde dados, com o objetivo de
possibilitar que analistas, gerentes e executivos consigam transformar dados em
informaes de forma rpida, consistente, amigvel e flexvel, em tempo hbil,
capazes de dar suporte s decises gerenciais.
Alm disso, do ponto de vista de Peterson (2001), o OLAP, uma ferramenta
de software interativa de gerao de relatrios, que apresenta, para os analistas,
diversas visualizaes distintas de uma planilha.
A caracterstica principal das ferramentas OLAP, conforme Primak (2008),
permitir realizar diversas anlises dinmicas e multidimensionais dos dados, apoiando
o usurio final nas suas atividades. Elas possuem uma srie de vises, como por
exemplo, as consultas ad-hoc, onde o prprio usurio consegue gerar consultas de
acordo com suas necessidades de cruzamento dos dados e de uma forma diferente
da usual, que o leva a obter as respostas desejadas. Considerada para Inmon (1999)
como consultas casuais nicas, onde os dados so tratados com parmetros nunca
antes utilizados. Umas das tcnicas possibilitadas pelo OLAP o Drill Down e Drill
UP, que consiste em fazer uma explorao em diferentes nveis de detalhe das
informaes. Com essa tcnica, o usurio pode subir ou descer na hierarquia dentro
do detalhamento do dado conforme figura 5.
Figura 5 - Representao Drill Down e Drill UP

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Fonte:

BARBIERI,
Carlos.
B.
Business
intelligence: modelagem e tecnologia.
Rio de Janeiro: Axcel Books, 2001. p. 42.

6 - DATA WAREHOUSE COMO ESTRATGIA COMPETITIVA


A ideia bsica de Inteligncia Competitiva conforme Barbieri (2001) obter
informaes detalhadas sobre o mercado e os concorrentes. A Inteligncia
Competitiva tambm um Business Intelligence (BI) aplicado ao mundo fora da
fronteira empresarial, que tem o foco em informaes e fatos. As empresas hoje
sentem cada vez ma is a necessidade de aperfeioar o processo de anlise de dados
que possuem armazenados.
Este crescente nmero de informaes pode ser interpretada como um
mal no universo empresarial e dificulta o processo de tomada de deciso, uma vez
que os gestores se sentem impotentes no processo de busca e recuperao dos
dados, que podem ser definido a como um conjunto de registros qualitativos ou
quantitativos que esto organizados e agrupados. Os dados em si no possuem um
significado nem relevncia, porm, aplicados ao contexto correto so importantes, pois
possvel obter informao.
H de se destacar que para Primak (2008), organizaes de pequeno, mdio
ou grande porte, precisam de ferramentas que as auxilie nas mais diferentes situaes
para tomada de deciso, alm de propiciar otimizao do trabalho, reduo de custos,
eliminao de tarefas duplicadas, e permitir previses de crescimento da empresa e
dessa forma contribuir para a elaborao de estratgias. O que est em foco a
necessidade do mercado e no o porte da empresa.
Enfatizam no entanto Leonard e Swap (2003), Inteligncia Analtica a
capacidade de analisar ideias e tomar decises com base na anlise feita. Mesmo
com ferramentas disponveis que so consideradas decisivas, alguns autores
consideram at mais importante que a tecnologia, como afirmam Davenport e Prusak
(1998), so as pessoas que fazem com que a inteligncia analtica funcione.
Isso porque, conforme Primak (2008), tomar uma deciso em uma organizao
requer muito mais que saber utilizar um software. Por mais que uma organizao
disponha de uma ferramenta com diversas funes, de nada adiantar se as pessoas
continuarem a tomar decises ou simplesmente chegarem a concluses baseadas em
suas experincias e no seu prprio conhecimento. Prossegue o autor afirmando que ,
para a implementao efetiva de uma soluo de BI, a condio considerada por
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

grande parte dos analistas de mercado como essencial a de existir um repositrio


nico de dados que seja slido e confivel, ou seja, o DW. Isso porque com o DW
possvel obter uma viso nica, alm de poder tomar decises com base em
informaes precisas e consistentes em uma nica base.
O mercado de Ensino Superior est ficando cada vez mais difcil e competitivo
e, hoje em dia, ter a informao correta no menor tempo possvel, tomar decises
eficazes, adequar-se s oscilaes financeiras e antecipar-se s necessidades dos
seus clientes, o grande diferencial para as empresas que querem se manter frente
no mundo dos negcios.

7 - IMPLANTAO PRTICA DE UM DATA WAREHOUSE EM UMA


INSTITUIO DE ENSINO SUPERIOR DE BELO HORIZONTE
A implantao do Data Warehouse iniciou-se no ms de abril de 2013 com o
levantamento dos dados junto a Instituio de Ensino Superior (IES)

de Belo

Horizonte que possui quatro cursos superiores, concretizando os acessos aos dados
no ms de agosto de 2013.
Verifica-se que os tomadores de deciso, alm dos coordenadores de cursos
desta Instituio de Ensino Superior no possuem informaes histricas sobre o
desempenho dos cursos dentro da instituio, o que dificulta o planejamento
estratgco da mesma.
Constata-se que a tecnologia de Business Intelligence tem apresentado forte
adeso pelas organizaes que desejam obter um suporte tomada de deciso e,
cada vez mais, querem estas informaes em tempo real, a qualquer hora e lugar.
A seguir, descreve-se os passos para criao, desenvolvimento, testes e
implantao de um Data Warehouse em uma Instituio de Ensino Superior (IES).

1) PASSO
Com base no levantamento realizado em abril de 2013 foi proposto e aprovado
o modelo dimensional Estrela como metodologia de modelagem, formado por uma
tabela Fato no centro chamada acompanhamento_cursos, e por um conjunto de 6
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

tabelas de Dimenso, como aluno, curso, perodo, semestre e situao que esto
ligadas tabela Fato conforme pode ser visto na figura 6.

Figura 6 - Esquema do modelo dimensional Estrela

Fonte: dados da pesquisa

Na tabela Fato acompanhamento_cursos, foram definidas as chaves das


dimenses que fazem parte da composio do seu layout (cod_aluno, cod_curso,
num_semestre_ano, cod_periodo, cod_situacao, cod_turno e f_qtd_aluno). A chave da
tabela Fato acompanhamento_cursos uma composio de todas as chaves primrias
das tabelas de Dimenso que se relacionam com a tabela Fato, o que garante a
integridade referencial entre a tabela Fato acompanhamento_cursos e cada uma das
tabelas de Dimenso como apresentado por Peterson (2001, p.78).
As mtricas foram definidas atravs da anlise do levantamento realizado junto
aos coordenadores, onde foi identificado a necessidade de verificar a quantidade de
alunos matriculados, por curso, por sexo e por perodo.
Baseado nisso, verificou-se a necessidade de controlar os seguintes
indicadores

que

foram

utilizados

como

mtricas

na

tabela

Fatoacompanhamento_cursos:Curso;Perodo;Turno;Aluno;Tipo de aluno;Situao do
aluno no curso;Quantidade de alunos.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

No modelo proposto, as tabelas de Dimenso definidas foram: aluno, curso,


periodo, semestre e situao.
Acrescenta-se que esta a parte onde mais gasta tempo para fazer e definir
essa modelagem. A esse respeito Barbieri (2001) enfatiza que uma parte crtica do
projeto, uma vez que alteraes nas estruturas das tabelas principalmente as tabelas
Fato que comparadas s tabelas de Dimenso possuem um volume maior de dados,
pode representar problemas de manuteno no projeto.

2) PASSO
Com o auxlio de um funcionrio da IES, as informaes foram exportadas do
sistema acadmico da IES, atravs de relatrios interno do sistema acadmico para
arquivos com valores separadores por vrgulas.(fig.7).
Figura 7 - Tela de arquivos do tipo Arquivos Separados por Vrgula

Fonte: dados da pesquisa

Na figura 8 apresentada a planilha Excel com todos os dados disponibilizados


pela IES que possuam informaes concentradas em uma nica coluna, como por
exemplo, o semestre, turno e perodo, estavam na mesma coluna.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Figura 8 - Tela de contedo dos dados disponibilizados pela IES

Fonte: dados da pesquisa

Estes arquivos, no apresentam um dicionrio de dados para ajudar na


extrao dos dados. Algumas colunas foram identificadas, conforme o conhecimento
do funcionrio da IES, e vrias colunas, as informaes no aparentam ter nenhum
sentido, no foi possvel decifrar o que cada coluna representava, conforme pode ser
visto na figura 8.
Apresenta- se na figura 9 todos os dados aps o processo de limpeza dos
dados, como por exemplo, o semestre, turno e perodo, foram separados em colunas
distintas.
Figura 9 - Tela de contedo dos dados disponibilizados pela
IES aps a limpeza dos dados.

Fonte: dados da pesquisa

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

A carga dos dados foi feita somente uma vez para as tabelas de Dimenso.
Como os dados que foram obtidos estavam no formato separado por virgulas,
utilizou-se o SSIS para uma simples leitura destes arquivos, definindo quais colunas
deveriam ser carregadas destes arquivos e para qual coluna das respectivas tabelas
deveriam ser destinadas, (fig. 10). Os dados, como em todo projeto de DW, no
sofrem alteraes.

Figura 10 - Tela de rotina de leitura dos dados ferramenta SSIS

Fonte: dados da pesquisa

O processo de ETL foi bastante complexo e os problemas que ocorreram foram,


a falta de um dicionrio de dados para identificao das colunas que seriam
carregadas. Algumas colunas foram identificadas, conforme o conhecimento do
funcionrio da IES, e vrias colunas, as informaes no aparentam ter nenhum
sentido, no foi possvel decifrar o que cada coluna representava.

3) PASSO
A ferramenta OLAP escolhida foi a MicroStrategy, fundada em 1989 por
Michael J. Saylor. AMicroStrategy uma empresa de consultoria focada em solues
para suporte deciso, desenvolvedora da ferramenta OLAP utilizada no projeto. Isto
por possuir uma interface similar ao Windows, tornou-se uma ferramenta de gerao
Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

de relatrios, anlises e monitoramento dos negcios, altamente interativa, intuitiva e


de fcil utilizao pelos usurios finais.
A figura 11 mostra a tela do administrador, onde possvel monitorar e
administrar todos os usurios.

Figura 11 - Tela do Administrador.

Fonte: dados da pesquisa

A estrutura hierrquica das pastas apresentada na figura 12. A pasta


Relatrios Compartilhados, mostra os relatrios gerados e que so compartilhados
com os demais usurios com acesso ao respectivo DW.

Figura 12 - Tela de estrutura hierrquica da pasta Relatrios Compartilhados.

Fonte: dados da pesquisa


Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Os relatrios de grficos que atigiram o objetivo para o auxlio dos tomadores


de deciso, alm dos coordenadores de cursos desta Instituio de Ensino Superior
para a utilizao no planejamento estratgico com informaes histricas sobre o
desempenho dos cursos dentro da instituio so apresentados na figura 13 e 14.

Figura 13 - Tela de relatrio de grficos (Alunos X Curso).

Fonte: dados da pesquisa


Figura 14 - Tela do relatrio de grficos (Situao de alunos por curso).

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

Fonte: dados da pesquisa

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

8 - DISCUSSO SOBRE OS RESULTADOS DE IMPLANTAO DO DATA


WAREHOUSE

Os passos de criao, desenvolvimento, testes e implantao foram


demorados pelo pouco tempo disponvel pelos pesquisadores, mas de muita
relevncia.
Para atender as necessidades de ETL do projeto, a IES utilizou a ferramenta
SSIS, pois foi considerada adequada devido a sua facilidade de desenvolvimento das
rotinas de carga e tambm devido ao seu pipeline de transformao de dados,
considerado apto pela facilidade apresentada de transformar o dado em uma nica
operao. Estas facilidades no so encontradas nas ferramentas tradicionais.
Sobre a ferramenta OLAP, foi escolhida a ferramenta MicroStrategy, pois
dispe do recurso de gerao de relatrios padronizados e dinmicos, que podem ser
customizados pelos usurios em momento de execuo, possibilitando que possuam
viso especfica, graas ao processo de drillup e drilldown. Outra facilidade que foi
levada em considerao no momento da escolha foi a facilidade de adaptao dos
usurios quanto a sua utilizao, uma vez que a ferramenta segue o padro de
usabilidade bem similar ao utilizado pelo Windows.
Os esforos que foram empenhados neste trabalho foram recompensados, j
que foi possvel desenvolver todas as etapas de construo de um DW, contribuindo
para a experincia acadmica do discente, alm de prover instituio um diferencial
competitivo de mercado com uma viso gerencial privilegiada comparando com seus
concorrentes.

9 - CONSIDERAES FINAIS
O presente trabalho apresentou o processo implantao de um Data
Warehouse em uma Instituio de Ensino Superior de Belo Horizonte para o auxlio
em seu planejamento estratgico e definiu e conceituou o Data Warehouse.
Buscou-se reunir no estudo uma base terica que permitisse mostrar o formato
do Data Warehouse como um repositrio de dados para atender diferentes nveis
gerenciais para tomada de deciso.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

A realizao da pesquisa aplicada para a implantao do Data Warehouse na


Instituio de Ensino Superior foi organizada em trs etapas, estas denominadas
passos. Estas etapas foram realizadas tendo-se a base conceitual e terica do
estudo como orientadora da implantao do Data Warehouse.
Verificou-se a pertinncia terica apresentada a um caso especfico, o Data
Warehouse como ferramenta de auxlio em planejamento estratgico na Instituio de
Ensino Superior.
Como projeto futuro, sugere-se uma pesquisa junto a Instituio de Ensino
Superior dos valores efetivos dos ganhos adquiridos aps a implementao e
utilizao destes dados pela Instituio, da mesma forma sugere-se um estudo em
relao ferramenta OLAP MicroStrategy Web utilizada, em relao a outras
ferramentas de software livre (open source).

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

REFERNCIAS
ANTUNES JUNIOR, Delson. Sistema de apoio a deciso baseado em Data
Warehouse para uma indstria qumica. 2009. Trabalho de Concluso de Curso
(Bacharel) - Universidade do Planalto Catarinense, Lages, 2009. Disponvel em: < >.
Acesso em: 22 nov. 2013
BARBIERI, Carlos. B. Business intelligence: modelagem e tecnologia. Rio de
Janeiro: Axcel Books, 2001
DAVENPORT, Thomas H. e PRUSAK, Laurence.
ed, Rio de Janeiro: Campus, 1998

Conhecimento empresarial 14.

GOMES, Carlos Francisco Simes; RIBEIRO, Priscilla Cristina Cabral. Gesto da


cadeia de suprimentos integrada tecnologia da informao. So Paulo: Pioneira
Thomson Learning, 2004.
INMON, W. H.; WELCH, J. D.; GLASSEY, K. L. Gerenciando Data Warehouse.
So Paulo: Makron Books, 1999.
KIMBALL, Ralph; ROSS, Margy. The Data Warehouse Toolkit: guia completo para
modelagem dimensional. 2 ed. Rio deJaneiro: Campus, 2002.
LEONARD, Dorothy; SWAP, Walter. Centelhas Incandescentes: estimulando a
criatividade em grupos. Porto Alegre: Bookman, 2003.
MICROSOFT. Entendendo as tecnologias de Integrao Microsoft. [Redmond],
2005.
Disponvel
em
<http://msdn.microsoft.com/ptbr/library/ms864809%28v=bts.10%29.aspx#XSLTsection128121120120> Acesso em:
3 out. 2013
MICROSTRATEGY.
Best
in
Business
Intelligence.
Disponvel
<http://www.microstrategy.com.br/Company/> Acesso em: 03 out. 2013

em

PETERSON, Timothy. Microsoft Sql Server 2000 Dts. Rio de Janeiro: Campus,
2001.
PRIMAK, Fbio Vincius. Decises com B.I Business Intelligence. Rio de Janeiro:
Cincia Moderna, 2008
RAMALHO, Jos Antnio. Microsoft SQL Server 2005: guia prtico. Rio de Janeiro:
Campus, 2005.
REZENDE, Solange Oliveira. Sistemas Inteligentes: fundamentos e aplicaes.
Barueri: Manole, 2003.
ROCHA, Reydeval. Introduo ao Analysis Services 2005. Disponvel em <
http://www.devmedia.com.br/introducao-ao-analysis-services-2005-parte-2/5730>
Acesso em: 08 abr. 2014.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014

ROSINI, Alessandro Marco; PALMISANO, ngelo. Administrao de sistemas de


informao e a gesto do conhecimento. So Paulo: Pioneira Thomson Learning,
2003.

Revista Pensar Tecnologia, v. 3, n. 2, jul. 2014