2612
Data Warehouse: conceitos e aplicaes*
Resumo
O gerenciamento de dados tornou-se uma das atividades mais im-
portantes nas organizaes. medida que nossa sociedade se orienta cada
vez mais para a informao, organizar dados para maximizar sua utilidade
mostra-se um desafio para o profissional que lida com essa rea. Embora os
sistemas de banco de dados simplifiquem a tarefa de manter e recuperar uma
Daniela Andrade Raslan1 grande quantidade de dados, ainda so encontradas inmeras dificuldades na
Anglica Toffano Seidel Calazans 2 organizao dos dados para utilizar a capacidade total de um banco de dados.
Atualmente, as empresas que mantm um volume muito grande de dados dis-
tribudos em diversos sistemas pela organizao tm optado por uma forma de
gerir suas informaes: o Data Warehouse. O objetivo desta pesquisa iden-
tificar os principais conceitos relacionados a Data warehouse, e verificar sua
disseminao em algumas empresas brasileiras e as vantagens de sua aplica-
o. Por meio do processo de reviso sistemtica um modo de identificar e
avaliar todas as pesquisas relevantes a respeito de uma questo particular, bem
como identificar lacunas capazes de direcionar novas pesquisas e novas ativi-
dades de investigao , verificou-se, inicialmente, a disseminao de con-
ceitos relativos modelagem de dados, a banco de dados e a Data Warehouse.
Com essa investigao, foi possvel verificar como se desenvolveu e se con-
solidou o processo de Data Warehouse. Para verificar a aceitao desse con-
ceito nas empresas da rea de tecnologia da informao, investigou-se junto
a algumas empresas de Braslia a aplicabilidade dos conceitos desse processo
no mercado, o que permitiu relacionar as dificuldades enfrentadas e as desvan-
tagens encontradas para a implantao do processo, bem como as vantagens
alcanadas com o trmino dos projetos.
Palavras-chave: Reviso Sistemtica. Banco de dados. Data Warehouse.
Abstract
Data management has become one of the most important activities in
organizations. As our society is geared increasingly to the information, organi-
ze data to maximize its utility proves a challenge for the professional who deal
with this area. Although database systems simplify the task of maintaining and
retrieving a large amount of data, many difficulties are still encountered in data
organization to utilize the full capacity of a database. Currently, companies
that maintain a very large amount of data distributed across many systems the
organization has opted for a way to manage your information: the Data Wa-
rehouse. The objective of this research is to identify the main concepts related
* Recebido em: 23/09/2013
Aprovado em: 09/04/2014 to data warehouse, and check its spread in some Brazilian companies and the
1
Bacharela e Licenciada em Fsica pela Universi- advantages of their application. Through the systematic review process - a way
dade de Braslia (2006). Graduada em Anlise to identify and evaluate all relevant regarding a particular research question,
e Desenvolvimento de Sistemas pelo UniCEUB as well as identify gaps capable of driving new research and new research ac-
(2013). Atualmente professora de Fsica e Ma- tivities - initially it appeared the spread of concepts relating to data modeling,
temtica da Secretaria de Educao do Distrito the database and the data Warehouse. With this research, we observed how
Federal. it developed and consolidated the process of Data Warehouse. To verify the
2
Doutorado em Cincia da Informao pela acceptance of this concept in the business field of information technology, was
Universidade de Braslia (2008) e mestrado em
investigated with some companies Brasilia the applicability of the concepts of
Gesto do conhecimento e TI pela Universida-
de Catlica de Braslia (2003). Atuou 28 anos this process on the market, allowing relate the difficulties and disadvantages
como especialista da Caixa Econmica Fede- encountered in the implementation process, and the advantages achieved with
ral e atualmente professora titular do Centro the completion of the projects.
Universitrio de Braslia-UniCEUB. Keywords: Systematic Review. Database. Data Warehouse.
Daniela Andrade Raslan, Anglica Toano Seidel Calazan
para determinada questo. A estratgia deve estabelecer Qual a aceitabilidade do conceito de Data Wa-
os critrios para julgar qual literatura concernente ao rehouse pelas corporaes e pelos profissionais da rea,
tema da pesquisa. So trs os estgios da reviso sistem- relacionando as vantagens e desvantagens dessa tecnolo-
tica: 1) Planejamento da Reviso; 2) Realizao da Revi- gia?
so; e 3) Relato da Reviso. Desse modo, os artigos pesquisados na reviso sis-
O Planejamento da Reviso envolve a identifi- temtica responderam s seguintes questes de pesquisas:
cao de o que necessrio para se iniciar a reviso e o O que a modelagem de dados?
desenvolvimento do protocolo de reviso. So definidos Quais as vantagens e desvantagens do uso da mo-
nessa fase o objetivo da pesquisa; as fontes de pesquisa; os delagem de dados?
critrios de incluso e excluso dos artigos de pesquisa; os Qual o tipo de modelagem de dados mais utiliza-
critrios de avaliao dos estudos e os critrios de extra- do?
o de dados de estudo. O desenvolvimento do protocolo O que so banco de dados?
de pesquisa de suma importncia, pois uma maneira Quais os tipos de bancos de dados existentes?
de impedir que a seleo de estudos do pesquisador seja Qual o tipo de banco de dados mais utilizados?
unicamente dirigida s suas expectativas, o que implica O que so os SGBDs e quais suas funes e im-
delimitar as razes e as questes de pesquisa, as quais a portncia?
reviso sistemtica tem a inteno de responder. O pro- Quais so os tipos de SGBD mais largamente utili-
tocolo de pesquisa possibilita que esta seja direcionada zados atualmente no mercado?
de modo imparcial. Com o protocolo, so estabelecidos O que o Data Warehouse?
tambm os termos que sero pesquisados e as fontes de Quais os objetivos da criao de um Data Wa-
dados da pesquisa. rehouse?
A Realizao da Reviso deve registrar as estrat- Quais as etapas de construo de um Data Wa-
gias de busca e seus resultados. As estratgias de busca rehouse e quais os desafios a serem vencidos em cada eta-
so geralmente iterativas e podem se beneficiar de com- pa?
binaes de termos de pesquisas que so derivados das Quais as vantagens e desvantagens da adoo de
questes de pesquisa. Deve ser redigida uma lista de si- um Data Warehouse?
nnimos e abreviaturas que auxiliem as estratgias de Qual a aceitabilidade do conceito de Data Wa-
busca. O processo de realizao de uma reviso sistem- rehouse no mercado?
tica deve ser transparente e replicvel. A reviso deve ser Para estabelecimento do protocolo de pesquisa da
documentada em detalhes suficientes para que os leitores reviso sistemtica, adotaram-se com base nos termos
Portal da CAPES: uma biblioteca virtual que e computao e de tcnicas para a sua implementao e
rene e disponibiliza a instituies de ensino e pesquisa aplicao em sistemas de computador. (JOURNAL OF
no Brasil o melhor da produo cientfica internacional. COMPUTER SCIENCE, 2014]).
Ele conta atualmente com um acervo de mais de 35 mil Como critrios de incluso e excluso de docu-
peridicos com texto completo, 130 bases referenciais, mentos de pesquisa, estabeleceu-se que: 1) os artigos
onze bases dedicadas exclusivamente a patentes, alm de deveriam estar disponveis gratuitamente na web ou
livros, enciclopdias e obras de referncia, normas tcni- impressos, no caso de livros; 2) eles deveriam ser redi-
cas, estatsticas e contedo audiovisual. (CAPES, 2014); gidos em portugus ou ingls; 3) os artigos, dissertaes
Scielo - Scientific Electronic Library Online: mo- e teses deveriam datar entre os anos de 2011 e 2013; 4)
delo para a publicao eletrnica cooperativa de peridi- a primeira seleo dos documentos seria feita pelo t-
cos cientficos na Internet. Foi desenvolvido para respon- tulo que deveria fazer referncia a alguma das questes
der s necessidades da comunicao cientfica nos pases de pesquisa; 5) a segunda seleo dos documentos seria
em desenvolvimento e particularmente na Amrica La- efetuada aps a leitura dos resumos dos documentos em
tina e Caribe. (SCIELO, 2014]) Nesse site foi pesquisada que pelo menos 30% das questes de pesquisa deveriam
a revista JISTEM (Journal of Information Systems and ser respondidas.
Technology Management); A reviso sistemtica foi conduzida no segundo
Journal of Computer Science: revista de Cincia semestre de 2012 e no incio de 2013, entre os meses de
da Computao que tem como objetivo publicar artigos setembro e fevereiro. A tabela abaixo demonstra os resul-
de pesquisa sobre fundamentos tericos da informao tados encontrados:
Portal da CAPES data base, SGBD (concepts, types) 7810 ... ...
As buscas nas fontes de pesquisas citadas permi- plos, por meio da aplicao de um questionrio (conferir
tiram a seleo de trinta documentos que respondiam Apndice), que permitiu aos participantes expressar sua
apenas parcialmente a algumas das questes de pesquisa. avaliao a respeito da elaborao de um Data Warehou-
Aps a leitura integral dos documentos, selecionaram-se se, das dificuldades encontradas nessa elaborao, os ca-
dezenove documentos que respondiam adequadamente sos de sucesso, as vantagens, desvantagens etc. O objeti-
a, pelo menos, 30% das questes de pesquisa e que eram vo foi avaliar se os dados colhidos da reviso sistemtica
disponveis gratuitamente na web. No foi encontrado sobre Data Warehouse so confirmados na prtica pelos
nenhum artigo que respondesse a todas as questes de profissionais que utilizam a teoria.
pesquisa e fizesse a relao entre os temas modelagem Na primeira parte do questionrio, verificou-se o
de dados, banco de dados e Data Warehouse. Os livros perfil do profissional de TI participante para averiguar
pesquisados traziam em sua maioria explicaes mais sua formao e seu entendimento sobre o contedo ava-
completas a respeito dos temas. Aps a leitura dos do- liado. A segunda parte do questionrio permitiu ao parti-
cumentos e livros, retiraram-se dos textos os trechos que cipante expressar suas experincias ao desenvolver proje-
respondiam s questes propostas e posteriormente foi tos ligados a Data Warehouse.
feito um compndio das definies encontradas. A interpretao dos resultados da pesquisa de ca-
sos mltiplos foi feita por meio da condensao de signi-
2.2 Estudos de Caso ficados, isto , a abreviao do texto dos participantes em
Segundo Yin e Martins (2001, 2006 apud CALA- partes mais sucintas identificando pontos comuns entre
ZANS, 2007), o Estudo de Caso uma forma de inves- as diversas falas dos entrevistados.
tigao emprica que permite o estudo de fenmenos
sociais complexos ao analisar o fenmeno contempor- 3 Resultados
neo dentro de seu contexto da vida real. De acordo com Os resultados obtidos por meio da reviso
Martin (2006 apud CALAZANS, 2007, p. 40), O estudo sistemtica permitiram responder aos questionamentos
de caso uma estratgia que pede avaliao quantitativa, elaborados. Assim, a seguir apresentam-se sucintamente
e por isso, de acordo com Cassel & Simon (1994 apud os conceitos de Modelagem de dados, Banco de dados,
CALAZANS, 2007), a pesquisa deve ter foco na interpre- Sistemas Gerenciadores de Banco de Dados e Data
tao e no na quantificao. Ao realizar os estudos de Warehouse.
caso, o pesquisador no tem controle sobre os eventos e
deve descrever, compreender e interpretar o seu resultado
3.1 Modelagem de Dados
(CALAZANS, 2007).
Pode-se afirmar que as informaes, que uma
fornea mecanismos de validao da descrio do am- nais dos programas que acessam os dados.
biente observado. Uma das abordagens de modelagem mais comum
Define-se modelagem de dados como uma tcnica a Entidade-Relacionamento, um modelo de alto nvel e
que visa aperfeioar e dar maior estabilidade organiza- independente do SGBD. Ela foi criada em 1976 por Pe-
o dos dados. Para executar essa tcnica, passos como a ter Chen e tem como conceito essencial a percepo do
observao dos elementos de um ambiente, a elaborao mundo real representada por entidades e relacionamen-
de conceitos sobre esses elementos, a abstrao de carac- tos. A notao que ser utilizada para a representao
tersticas comuns aos elementos e unio desses elementos deste modelo o Diagrama Entidade-Relacionamento
em conjuntos, que representaro a realidade, devem ser (DER), exemplificado na Figura 2, em que os retngu-
percorridos. A modelagem de dados possibilita a criao los representam as entidades (elementos do domnio do
de um modelo de dados, isto , de um conjunto de con- problema) e os losangos representam os relacionamentos
ceitos que podem ser usados para descrever a estrutura entre essas entidades. Naturalmente, existem outros ele-
de um banco de dados. mentos utilizados na construo desse diagrama, como
Para que a modelagem de dados seja feita de for- cardinalidade, agregao, relacionamento ternrio (ou de
ma a retratar a realidade em estudo, o primeiro passo maior grau), autorrelacionamento e generalizao/espe-
deve ser o levantamento e anlise dos requisitos com ob- cializao.
jetivo de entender e documentar como os dados de inte-
resse para o problema so obtidos. Na sequncia cria-se Figura 2 - Notao do Diagrama Entidade Relacionamento
um esquema conceitual de alto nvel. Segundo Elmari
e Navathe (2004), o modelo de dados conceitual uma
descrio concisa dos requisitos de dados e inclui descri-
es detalhadas de tipos de entidades, relacionamentos e
descries. A etapa seguinte a implementao real do Fonte: (ELMASRI; NAVATHE, 2005).
que descreve a estrutura de um banco de dados indepen- que consistem em um grupo de programas que executam
dente de sua classificao. Os objetos, suas caractersticas manipulaes reais sobre o banco de dados e fornecem
e relacionamentos entre elementos da realidade tm a re- uma interface entre os bancos de dados e o usurio ou en-
presentao fiel do ambiente observado, independente de tre os bancos de dados e os programas aplicativos.
quaisquer limitaes impostas por tecnologias, tcnicas O SGBD o responsvel pela manuteno e ar-
de implementao ou dispositivos fsicos. mazenamento dos dados de um BD. Ele contm, portan-
Modelo lgico: modelo de dados que representa to, um catlogo com descrio completa do banco que
a estrutura de um banco de dados conforme vista pelo contm informaes sobre a estrutura de cada arquivo,
usurio do SGBD. Leva em conta limites impostos por o tipo e o formato de armazenamento de cada tipo de
algum tipo de banco de dados como banco de dados hie- dado, restries, entre outros. A informao armazenada
rrquico, banco de dados em rede, banco de dados rela- no catlogo denominada metadados. Os SGBD permi-
cional, banco de dados orientado a objetos etc. tem a correta utilizao e manipulao dos dados em um
Modelo fsico: uma representao grfica do BD ao possibilitar que critrios como integridade, com-
detalhamento fsico das estruturas dos dados que o ban- partilhamento, segurana, controle da redundncia e re-
co de dados ir armazenar. Esse modelo dependente do lacionamento dos dados sejam obedecidos. (ELMASRI;
SGBD que ser implementado. Leva em considerao li- NAVATHE, 2005)
30 mites impostos pelo SGBD e pelos requisitos no funcio- Os SGBD mais utilizados hoje foram concebi-
Data Warehouse: conceitos e aplicaes
dos com base no modelo relacional, criado por Codd da organizao. poca j havia um aumento conside-
em 1970, derivado da teoria matemtica dos conjuntos. rvel nos sistemas de gesto empresarial, e, como con-
Nesse modelo, os dados do banco so representados por sequncia, a quantidade de dados tambm cresceu. Os
meio de suas relaes que consistem em uma coleo de bancos de dados tiveram, ento, de evoluir para atender
tabelas, cada uma designada por um nome nico. a esse crescimento tecnolgico e a toda atmosfera de ges-
A grande quantidade de dados nos bancos de da- toinformatizada. Para essa nova realidade, era preciso
dos informatizados pode produzir conhecimentos valio- trabalhar em um contexto de dados distintos para uni-
sos e teis para a tomada de deciso. A utilidade desses -los externamente. Foi, ento, que um projeto acadmico
dados, no entanto, ir depender da forma com que eles conceitual da dcada de 1980 possibilitou, no incio dos
esto armazenados e organizados e do modo como se- anos 1990, os primeiros testes com Data Warehouse do-
ro acessados. Esse , pois, o objetivo da modelagem de ravante DW.
dados: permitir o entendimento do problema em estudo O DW deve ser entendido como uma estratgia
para que os dados relativos a esse problema possam ser de organizao de dados voltada para a gesto estratgica
armazenados e organizados seguramente no banco de das corporaes, e no para o controle do negcio. Nes-
dados por meio dos SGBD, de modo que possibilitem o se ponto faz-se importante diferenciar Data Warehouse
acesso informao til na tomada de decises. de bancos de dados. Os bancos de dados possuem ope-
A gerao das informaes geradas pelos bancos raes que so transaes repetitivas, estruturadas, isola-
de dados necessrias para uma organizao pode ser feita das, detalhadas, com atualizao ou leitura de dados, e os
por sistemas transacionais ou por sistemas analticos. Os registros so acessados normalmente por chaves prim-
sistemas transacionais so aqueles que se caracterizam rias (CHAUDHURI; DAYAL, 1997, apud CALAZANS,
pela alta taxa de atualizao nos bancos de dados, pelo 2003). Os DW possuem dados sumarizados, agregados e
grande volume de dados e acessos pontuais e por pesqui- consolidados que so armazenados por longos perodos
sas cujos resultados sejam de pequeno volume, at milha- de tempo (CALAZANS, 2003, p.7). DW uma forma de
res de consultas. Esses sistemas so tambm conhecidos gerir volumes muito grande de dados que se encontram,
como sintticos ou ainda OLTP Online Transactional geralmente, espalhados em diversos sistemas de uma or-
Processing -, pois, como o nome sugere, baseiam-se em ganizao. Ele possibilita a anlise de grandes volumes de
transaes. Esses sistemas so utilizados no dia a dia da dados coletados dos sistemas transacionais (OLTP). Em
organizao e desenvolvidos com base nos modelos de outras palavras, os DW das corporaes so construdos
negcio da organizao, de acordo com Gardner (1998, a partir dos diferentes bancos de dados gerenciais de uma
apud CALAZANS, 2003). organizao.
ou codificado como uma linguagem; nem somente um Segurana de informaes para deciso;
modelo de banco de dados ou a constituio de vrios Maior abrangncia na viso de indicadores.
modelos. O sistema de data warehouse deve ser pensado Singh e Malhotra (2011) destacam tambm como
como um processo que est sempre em crescimento para vantagens da adoo dos DW o fato de que o armazena-
disponibilizar informaes que apoiem as decises estra- mento de dados revela-se til na prestao de informa-
tgicas da organizao. es coletivas a todos os seus usurios e que a informao
Os DW proporcionam a integrao slida e con- pode ser facilmente e armazenada de forma segura por
cisa dos dados para a realizao de anlises gerenciais um perodo de tempo mais longo.
estratgicas. uma arquitetura que possibilita a organi- Para que os DW sejam considerados um sucesso,
zao dos dados, como os de clientes e fornecedores e os a comunidade do negcio deve aceit-lo. Os indicadores
de operaes, de modo que eles possibilitem a obteno recolhidos a partir do DW devem atender s demandas
de informaes estratgicas a partir da anlise de dados da gesto estratgica empresarial. Essa comumente a
sob diversas perspectivas, e da capacidade de navegao desvantagem mais destacada pelos profissionais usurios
no nvel de detalhe da informao. O DW organiza infor- dos conceitos de DW: falta de apoio da alta gerncia para
maes de fontes internas da organizao, fontes que em o desenvolvimento do projeto de DW. Outra desvantagem
grande parte dos casos so heterogneas, e fontes exter- costumeiramente descrita a de que o DW deve ser cuida-
nas filtrando, limpando esses dados e preparando-os para dosamente modelado para que de fato atendam s expecta-
a anlise e suporte deciso (MACHADO, 2000). tivas de seus patronos, fornecendo-lhes informaes estra-
Os DW so uma boa soluo para organizaes tgicas, caso contrrio eles tornam-se meras repeties dos
que tm vrias plataformas de hardware e software e que sistemas transacionas j existentes na corporao.
sofrem com a falta de padronizao e integrao dos da- Boateng et al. (2013) cita ainda como desvanta-
dos e com numerosas alteraes nos sistemas transacio- gens o fato de que os armazns de dados no so o am-
nais. Com os DW, pode-se fornecer um modelo de dados biente ideal para dados no estruturados. Alm disso,
comum para diferentes reas de interesse, independente- como no processo de Data Warehousing, os dados devem
mente da fonte de dados. Dessa forma, torna-se mais fcil ser extrados, transformados e carregados no armazm,
de reportar e analisar informaes. As inconsistncias das h um elemento de latncia de dados no DW. E durante
diferentes fontes de dados so resolvidas antes de serem sua vida, os DW podem ter custos elevados e ficarem ob-
carregadas as informaes no DW, o que torna o processo soletos de forma relativamente rpida, o que pode causar
de elaborao de relatrios e anlise muito simples. grandes prejuzos.
Uma das funcionalidades do DW fazer com que Os DW so projetados para tamanhos de cente-
Universitas Gesto e TI, Braslia, v. 4, n. 1, p. 25-37, jan./jun. 2014
as informaes de uma empresa sejam facilmente aces- nas de gigabytes at terabytes e podem armazenar grandes
sadas. De acordo com Kimball (2002), as informaes quantidades de informao, s vezes, divididas em unidades
devem ser compreensveis aos usurios com dados intui- lgicas menores que so chamadas de Data Marts (DM).
tivos e bvios e, ao mesmo tempo, devem possuir dife- Os data marts representam um subconjunto dos
rentes formas de combinao de dados para a gerao das DM que permitem o acesso descentralizado informa-
informaes. Alm disso, as informaes devem ser con- o. Os DM podem ser direcionados a um departamento
sistentes e com dados confiveis. Ainda de acordo com ou rea especfica do negcio (MACHADO, 2000). O es-
Kimball (2002), h outras caractersticas do DW, como quema de dados mais utilizado na construo de um DM
sua adaptabilidade e flexibilidade com relao a mudan- o esquema estrela (Star Schema), tambm conhecido
as e um nvel de segurana que proteja os dados. como Modelagem Multidimensional. (KIMBALL, 2002).
Dentre as vantagens de construo de um DW, Data Warehousing nome dado ao processo sis-
Machado (2000) cita: temtico de construo de um sistema de DW. Esse
Disponibilidade de informaes para a gesto processo composto por uma coleo de tecnologias,
das corporaes; algoritmos, ferramentas, tcnicas e por uma arquitetura
Gerao de curvas de comportamento; concebida para facilitar o armazenamento e o gerencia-
Agilidade no uso de ferramentas de apoio de- mento desses grandes volumes de dados e de vrias ori-
32 ciso; gens, com o objetivo de proporcionar ao trabalhador do
Data Warehouse: conceitos e aplicaes
representado pelos esquemas estrela ou flocos de neve. Independentemente de quo inteligente e pro-
Os esquemas de um DW so uma coleo de ob- dutivo seja o sistema de gerenciamento de informaes
jetos de banco de dados, incluindo tabelas, vises, ndices planejado, construdo e operado, ele basicamente um
e sinnimos. O esquema em estrela, ilustrado na figura repositrio de dados. O valor a esses dados s acres-
3, , talvez, o esquema de armazenamento de dados mais cido por meio das aplicaes analticas que possibilitam
simples. Ele chamado de esquema em estrela porque o o acesso e o processo de apresentao dos dados, infor-
diagrama de entidade-relao desse esquema se asseme- maes e conhecimentos para sustentar investigao e re-
lha a uma estrela, com pontos de irradiao de um ponto soluo de problemas necessidades. Esse o processo de
central. O centro da estrela consiste em uma grande tabe- minerao de dados ou data mining. Sua funo principal
la de fatos e as pontas da estrela so a dimenso. A estrela a varredura de grande quantidade de dados a procura
uma associao entre uma tabela fato e uma srie de de padres e deteco de relacionamentos entre informa-
tabelas de dimenso. Cada tabela de dimenso est asso- es gerando novos subgrupos de dados. Data Mining
ciada tabela de fatos usando uma chave primria para como um agregador e organizador de dados. gigantesco
se juntar a uma chave estrangeira. As tabelas de dimen- o resultado desse processamento como, por exemplo, a
ses no so unidas umas s outras. As principais van- formao de hipteses e principalmente regras de dados
tagens dos esquemas em estrela so o fornecimento de que respondem s questes do negcio.
um mapeamento direto e intuitivo entre as entidades de
negcios, sendo analisados pelos usurios finais, o design 3.5 Estudo de Casos Mltiplos: resultados do ques-
do esquema e o desempenho altamente otimizado para tionrio
consultas tpicas de estrelas devido ao grande nmero Foi realizada a aplicao de questionrios a oito
de ferramentas de buscas j desenvolvidas. (MUHEET; profissionais da rea de TI que trabalhavam em quatro
QUADRI; ZAMAN, 2012). diferentes empresas. A aplicao dos questionrios para
Outro modelo de esquema o floco de neve, um a elaborao do estudo de casos mltiplos objetivava ve-
modelo mais complexo que esquema em estrela. Nesse rificar se havia uma correspondncia entre os contedos
esquema as dimenses visam eliminar a redundncia, obtidos sobre DW com a reviso sistemtica e o uso co-
isto , dados da dimenso so agrupados em vrias tabe- tidiano desses conceitos pelos profissionais no mercado.
las. Esse esquema embora permita uma economia de es- Dentre os participantes, cinco deles trabalham na
pao, aumenta o nmero de tabelas de dimenso e requer rea de tecnologia da informao h mais de vintes anos,
mais chaves estrangeiras. Como consequncia, o resulta- dois participantes trabalham entre dez e vinte anos e um
do consultas mais complexo e o desempenho reduzido participante possui experincia na rea de TI entre cin-
Universitas Gesto e TI, Braslia, v. 4, n. 1, p. 25-37, jan./jun. 2014
(MUHEET; QUADRI; ZAMAN, 2012). co e dez anos. Desses, trs esto aposentados e os outros
ainda desenvolvem atividades ligadas a DW. Quatro pro-
Figura 3 - Esquema Estrela fissionais so especialistas na rea de gesto da tecnologia
e trs possuem nvel de escolaridade stricto sensu. Todos
afirmam conhecer os conceitos de DW e classificam seu
conhecimento sobre o assunto como timo ou bom. Os
entrevistados declararam terem desenvolvido mais de
dois projetos de data warehouse a partir do ano de 1997
e afirmaram em sua maioria que, durante o desenvolvi-
mento dos projetos, tinham 100% do seu tempo envolvi-
do com assuntos correlatos de DW.
Para averiguar a percepo que os entrevistados
tm a respeitos dos objetivos de implantao de um DW,
perguntou-se: quais so, em sua opinio, os principais
objetivos para a implantao de um projeto de Data
Warehouse? Enumere em ordem de importncia. As res-
34 Fonte: Baseado em Muheet, Quadri e Zaman (2012). postas dos participantes esto de acordo com o que foi
Data Warehouse: conceitos e aplicaes
verificado com a reviso sistemtica que a elaborao de tgias que tornavam a empresa mais competitiva. Essas
um projeto de DW deve servir gesto estratgica do ne- descries revelaram-se nas seguintes falas:
gcio. A seguir, parte das falas dos entrevistados: -Em minha opinio a utilizao do BI, com
-Facilitar o acesso a informaes gerenciais com aplicao adequada da informao, o retorno
a resoluo de problemas [...] sempre vantajoso. (sic)
-Resolver a necessidade de informaes geren- -Sim foi muito vantajoso. A empresa necessita-
ciais para um problema especfico [...] va urgentemente ter uma ferramenta gil, como
o DW, para entrar no mercado em igualdade de
-Permitir a execuo de consultas gerenciais condies com as concorrentes.
envolvendo milhares/milhes de registros com
desempenho aceitvel [...] -A empresa onde trabalham atualmente faz uso
extremamente vantajoso das tecnologias de
Ainda com objetivo de analisar a percepo dos Data Warehouse.
profissionais da rea de TI sobre DW, perguntou-se: quais Os participantes que relataram no ter sido vanta-
os benefcios dos projetos de Data Warehouse? Os bene- josa a adoo da arquitetura de data warehouse descreve-
fcios descritos com a implantao de um DW expressa- ram com principal impedimento a falta de preparo e ma-
dos pelos participantes tambm corroboram o resultado turidade da organizao para a adoo dessa abordagem.
alcanado pela reviso sistemtica: Como destacado nas falas a seguir:
-O benefcio da cultura da informao dentro -O processo de data warehousing muito im-
de uma corporao. portante para uma organizao, entretanto nem
-Oferecer dados consistentes e confiveis de su- todas as organizaes esto preparadas para
porte deciso. utiliz-lo.
-Racionalidade no processo. Economia no par- -No foi vantajoso, pois o mesmo nunca foi co-
que computacional. locado em produo devido a problemas polti-
cos dentro da empresa. (sic)
-Divulgao da informao dentro da corpora-
o. Conhecimento informacional de maneira
Os profissionais entrevistados descreverem que
corporativa. a falta de participao corporativa em torno da soluo,
-Possibilidade de recuperar dados histricos a falta de integrao dos dados que compem o DW, as
A mdia de tempo de desenvolvimento de um questes polticas, a falta de maturidade da organizao,
projeto de DW relatada pelos participantes foi de dois a gesto sem objetividade e com pouco conhecimento de
anos e as equipes de desenvolvimento em sua maioria suas necessidades foram as principais dificuldades en-
eram compostas por mais de cinco pessoas. frentadas no processo de implantao de um DW. Devi-
Para alcanar o objetivo especfico de verificao do a isso, todos so unnimes em afirmar que j partici-
das vantagens e desvantagens da adoo de um DW per- param de projetos que foram abandonados antes de sua
descreveram que de modo geral foi vantajoso organi- -O Data Warehouse uma tima ferramenta
para ser utilizada nas organizaes, porm 35
zao porque os DW possibilitavam a obteno de estra-
Daniela Andrade Raslan, Anglica Toano Seidel Calazan
preciso que os usurios tenham conhecimento sistemtica sobre os conceitos de DW foram complemen-
do que o DW e para que serve, alm de um
tados pelo estudo de casos mltiplos realizado com os
conhecimento grande do negcio em que o DW
foi construdo. Isso necessrio para o sucesso profissionais de TI. Foi possvel verificar que os profissio-
do uso da ferramenta [...] nais confirmam a ideia de que um DW consiste em orga-
A avaliao dos questionrios em comparao nizar os dados corporativos de maneira integrada, com
com os resultados da reviso sistemtica descritos est uma nica verso da verdade, em um histrico varivel
em consonncia, o que expressa h uma integrao en- no tempo, gerando uma nica fonte de dados. Em suas
tre a literatura sobre DW e a atuao dos profissionais da descries, os participantes da pesquisa afirmaram que,
rea de tecnologia da informao no mercado. Os benef- entre as principais vantagens da adoo de DW, est a
cios descritos, as vantagens alcanadas com implantao possibilidade de a empresa identificar tendncias em sua
do DW e dificuldades enfrentadas no processo de imple- corporao para posicionar-se estrategicamente no mer-
mentao do DW relatados pelos participantes das entre- cado tornando-se mais competitiva e, consequentemente,
vistas complementam a viso acadmica alcanada pelo aumentando os seus lucros.
processo de reviso sistemtica. Os resultados mostram ainda que a aquisio da
arquitetura de DW vantajosa e, por essa razo, de ampla
4 Consideraes Finais divulgao no mercado. Esse sucesso se deve ao fato de o
O objetivo desta pesquisa foi identificar os con- DW possibilitar s empresas a obteno de formao es-
ceitos relacionados a Data Warehouse (DW) descrevendo tratgica, o que os bancos de dados tambm faziam, mas
as vantagens e desvantagens da adoo dessa arquitetura. de forma ineficiente.
Outro objetivo da pesquisa foi avaliar, junto a empresas
que utilizam bancos de DW, a percepo que os profissio- Referncias
nais da rea de tecnologia da informao tinham sobre o ADHIKARI, A.; JAIN L. C.; RAMANNA, S. Analysing
assunto. eect of database grouping on multi-database mining.
IEEE Intelligent Informatics Bulletin, Hong Kong, v. 12, n.
A metodologia de reviso sistemtica, utilizada
1, p. 25-32, dez. 2011.
para pesquisa documental sobre definies e conceitos
de modelagem de dados, banco de dados, sistemas geren- AKINTOLA, K.G.; ADETUNMBI, A. O; ADEOLA, O. S.
ciadores de banco de dados (SGBD) e Data Warehouse, Building data warehousing and data mining from course
management systems: a case study of FUTA course man-
permitiu avaliar todas as pesquisas relevantes a respeito agement information systems. International Journal of
desses assuntos. A reviso sistemtica til para identifi- Database Theory and Application, Australia, v. 4, n. 3, p.
car lacunas que podem direcionar novas pesquisas e no- 13-24, set. 2011.
Universitas Gesto e TI, Braslia, v. 4, n. 1, p. 25-37, jan./jun. 2014
DHIMAN, A. Importance of metadata in data warehous- OLIVEIRA, M. Sumrio. 2009. Disponvel em: <http://
ing. 2012. 52 f. Dissertao (Mestrado em Cincia da www.datawarehouse.inf.br/Academicos/A%20PUBLI-
Computao) San Diego State University, San Diego, CAR_DATA_WAREHOUSE_MARCELL_OLIVEIRA.
2012. pdf>. Acesso em: 10 jan. 2013.
DUMITRITA, B. M. Business intelligence. Disponvel RAHMAN, N.; MARZ, J.; AKHTER, S. An ETL metadata
em: <http://www.rebe.rau.ro/RePEc/rau/jisomg/SP11/ model for data warehousing. Journal of Computing and
JISOM-SP11-A20.pdf>. Acesso em: 26 jul. 2013. Information Technology, Crocia, v. 20, n. 2, p. 95-111,
Trimestral 2012.
ELMASRI R., NAVATHE, S. Sistemas de banco de dados.
So Paulo: Pearson Addison Wesley, 2005. SANTOS, J. G. dos. Conceitos de banco de dados. 2011.
Disponvel em: <http://www.pusivus.com.br/apostilas-
GOOGLE ACADMICO. Sobre o Google Acadmico. doc/ConceitosBancoDados.pdf>. Acesso em: 10 ago.
Disponvel em: <http://scholar.google.com.br/intl/pt- 2013
-BR/scholar/about.html>. Acesso em: 19 ago. 2013.
SANTOS, I. S. et al. Testes de aplicaes mveis: uma an-
HALPIN, T. Structural aspects of data modeling languages. lise das pesquisas cientficas via reviso sistemtica. Cea-
Malaysia: LogicBlox, Australia, INTI International Uni- r: Universidade Federal do Cear, 2013.
versity, 2011.
SCIENCE PUBLICATION. Home. Disponvel em:
HEUSER, C. A. Projeto de banco de dados. 5. ed. Porto <http://thescipub.com/journals/jcs>. Acesso em: 19 ago.
Alegre: Sagra Luzzato, 2004. 2013.
KIMBALL, R. and ROSS, M. The Data warehouse toolkit: SCIENTIFIC ELECTRONIC LIBRARY ONLINE (SIE-
guia completo para modelagem dimensional. 4. ed. Rio LO). Serial browsing. Disponvel em: <http://www.scielo.
de Janeiro: Campus, 2002. br/#about>. Acesso em: 19 ago. 2013.
KITCHENHAM, B. Procedures for performing systemat- SHARMA, M.; DORA, S. Efficient Approach for Com-
ic reviews. United Kingdom: Keele University Technical pression in Data Warehouse. Internacional Journal of
Report, 2004. Computing and Information Technology, USA, v. 53, n. 9,
p. 1-4, set. 2012.
MACHADO, F. Projeto de data warehouse: uma viso
multidimensional. So Paulo: Erica, 2000. SILVA, L. S. S. Metodologia de Desenvolvimento de Sis-
temas: Anlise Essencial, Estruturada e Orientada a Ob-
MACHADO, F. Banco de dados projeto de implementao. jetos. Revista Olhar Cientfico, Faculdades Associadas de
So Paulo: rica, 2004. Ariquemes, Ariquemes, RO, v. 1, n. 2, p. 257-266, ago./
dez. 2010.
MARWA, S. F.; MOHAMED E. M.; LAILA, M. Trans-
37