Você está na página 1de 12

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

Data Warehouse: uma ferramenta de tecnologia de informao para


as organizaes.

Gabriela Gis Cavalcanti (UFPE/PROPAD) gabrielagoisc@yahoo.com.br


Andr Felipe de Albuquerque Fell (UFPE/PROPAD) anfaf_05@yahoo.com.br
Jairo Simio Dornelas (UFPE/PROPAD) jairo@ufpe.br

Resumo
Em termos simples, um Data Warehouse, ou em portugus, Armazm de Dados, pode ser
definido como um banco de dados especializado, o qual integra e gerencia o fluxo de
informaes a partir dos bancos de dados corporativos e fontes de dados externas empresa.
Grande parte do trabalho na construo de um DW est na anlise dos sistemas
transacionais e dos dados que eles contm.
Um Data Warehouse permite a gerao de dados integrados e histricos auxiliando os
diretores a decidirem embasados em fatos e no em intuies ou especulaes, o que reduz a
probabilidade de erros aumentados velocidade na hora da deciso. Conhecer mais sobre
essa tecnologia permitir aos administradores descobrir novas maneiras de diferenciar sua
empresa numa economia globalizada, deixando-os mais seguros para definirem as metas e
adotarem diferentes estratgias em sua organizao, conseguindo assim visualizarem antes
de seus concorrentes novos mercados e oportunidades atuando de maneiras diferentes
conforme o perfil de seus consumidores.
O artigo contempla uma apresentao da importncia do Data Warehouse nas organizaes
e algumas definies e caractersticas dessa tecnologia. Disserta-se tambm sobre sua
implementao e alguns problemas que podem ocorrer. Para finalizar so apresentadas
algumas ferramentas de extrao de informaes e consideraes finais.
Palavras-Chave: Data Warehouse; Organizaes; Ferramentas.

1 Introduo
Uma importante questo estratgica para o sucesso de qualquer organizao nos dias de hoje
a sua capacidade de analisar, planejar e reagir, rpida e imediatamente, s mudanas nas
condies de seus negcios. Para que isso acontea, necessrio que a organizao disponha
de mais e melhores informaes, que constituem, reconhecidamente, a base destes processos.
Os avanos da tecnologia de informao vieram garantir a possibilidade das empresas
manipularem grandes volumes de dados e atingirem um alto ndice de troca de informaes,

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

com o uso das redes viabilizando operaes em nvel mundial. Com a globalizao, os
negcios no tm mais fronteiras, ter a informao correta no menor tempo possvel e utilizarse de sistemas de apoio deciso tornou-se o grande diferencial para as empresas.
Diariamente, dados sobre os mais variados aspectos dos negcios da organizao so gerados
e armazenados, e passam a fazer parte dos recursos de informao da mesma. Entretanto,
essas informaes encontram-se, em geral, espalhadas em diversos sistemas e exigem um
esforo considervel de integrao para que possam dar suporte efetivo tomada de deciso
de gerentes e executivos. Isso significa que, em que pesem os avanos da tecnologia de
armazenamento e manipulao de dados, ainda se verifica, nos dias de hoje, uma grande
deficincia na obteno gil de informaes estratgicas (datawarehouse, 2005).
Por esse motivo, um novo conjunto de conceitos e ferramentas vem ganhando enorme
destaque nos ltimos anos como a tecnologia de Data Warehouse, que oferece s
organizaes uma maneira flexvel e eficiente de obter as informaes necessrias a seus
processos decisrios. De acordo com Elmasri e Navathe (1994) o Data Warehouse (DW)
prov armazenamento, funcionalidade e responsividade s perguntas que exigem capacidade
de armazenamento alm dos bancos de dados orientados para transaes. Prov tambm
acesso a anlise de dados complexos, obteno de conhecimento e, principalmente, est
direcionada para aplicaes de suporte deciso.
2 Data Warehouse como uma Necessidade Organizacional
Com a evoluo da tecnologia de informao e o crescimento do uso de computadores
interconectados, praticamente todas as empresas de mdio e grande porte esto utilizando
sistemas informatizados para realizar seus processos mais importantes. Com o passar do
tempo esses sistemas acabam gerando uma enorme quantidade de dados relacionados ao
negcio, mas no relacionados entre si, pois normal que estes dados estejam espalhados por
diversos locais e que tenham sido gerados por sistemas desenvolvidos em diferentes
ambientes e linguagens.
Sabe-se que os bancos de dados so de vital importncia para as empresas e tambm que
sempre foi difcil analisar os dados neles existentes. Ou seja, estes dados armazenados em um
ou mais sistemas operacionais de uma empresa so um recurso, mas de modo geral, raramente
servem como recurso estratgico no seu estado original.
Os sistemas convencionais de informtica no so projetados para gerar e armazenar as
informaes estratgicas, o que torna os dados vagos e sem valor para o apoio ao processo de
tomada de decises das organizaes. Alm disso, no se consegue buscar informaes que
permitam tomada de deciso embasada num histrico dos dados. As decises normalmente
so tomadas com base na experincia dos administradores quando poderiam tambm ser
baseadas em fatos histricos, que foram armazenados pelos diversos sistemas de informao
utilizados pelas organizaes. O uso dos dados histricos poderia identificar as tendncias e
posicionar a empresa estrategicamente para ser mais competitiva e conseqentemente
maximizar os lucros diminuindo o ndice de erros na tomada de deciso. Cerca de 88% dos
diretores admitem que dedicam quase 75% do tempo s tomadas de deciso apoiadas em
anlises subjetivas (Aspect International Consulting, 1997, apud datawarehouse, 2005),
menosprezando o fato de que por volta de 100% deles tem acesso a computadores.
A necessidade de novos mtodos e tecnologias surgiu da constatao, primeiro de que existe
uma necessidade de informao no atendida pelos aplicativos comerciais convencionais, que

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

atuam a nvel operacional do negcio, e segundo, pelo fato de que a tecnologia de


armazenamento de dados utilizada nestes aplicativos no atende s necessidades detectadas.
Pensando nisso, introduziu-se um novo conceito no mercado, o Data Warehouse (DW).
Turban, Rainer e Potter (2003) corroboram com as afirmaes acima ao descrever o DW
como um transformador de dados em recursos mais til, agrupando-os de modo mais
adequado para os usurios finais, colocando-os em formatos mais teis, permitindo a sua
anlise e distribuindo-os para os grupos de trabalho pertinentes, para aumentar a
disponibilidade e acessibilidade. Esse consiste em organizar os dados corporativos da melhor
maneira, para dar subsdio de informaes aos gerentes e diretores das empresas para tomada
de deciso. Stair e Reynolds (2002) creditam que ele seja a atual evoluo dos sistemas de
suporte deciso.
3 Definies de Data Warehouse
O Data Warehouse (DW) um conjunto de tcnicas que aplicadas em conjunto geram um
sistema de dados que proporcionam informaes para tomada de decises. Ele funciona
tipicamente na arquitetura cliente/servidor. Segundo Inmon (1993), considerado um pioneiro
no tema, um data warehouse uma coleo de dados orientada por assuntos, integrado,
variante no tempo, e no voltil, que tem por objetivo dar suporte aos processos de tomada de
deciso.
O data warehouse um banco de dados contendo dados extrados do ambiente de produo da
empresa, que foram selecionados e depurados, tendo sido otimizados para processamento de
consulta e no para processamento de transaes. Em comparao com os banco de dados
transacionais, o data warehouse possui enormes quantidades de dados de mltiplas fontes, as
quais podem incluir banco de dados de diferentes modelos e algumas vezes arquivos
adquiridos de sistemas independentes e plataformas (Elmasri e Navathe, 1994).
De acordo com Richard Hackathorn (Data Warehouse, 2005), presidente e fundador da
Bolder Technology Inc. consultoria com 12 anos de mercado - o objetivo de um data
warehouse fornecer uma "imagem nica da realidade do negcio". De uma forma geral,
sistemas de data warehouse compreendem um conjunto de programas que extraem dados do
ambiente de dados operacionais da empresa, um banco de dados que os mantm, e sistemas
que fornecem estes dados aos seus usurios.
Sistemas de Data Warehouse revitalizam os sistemas da empresa, pois de acordo com WG
Systems (2005):

Permitem que sistemas mais antigos continuem em operao;

Consolidam dados inconsistentes dos sistemas mais antigos em conjuntos


coerentes;

Extraem benefcios de novas informaes oriundas das operaes correntes;

Provm ambientes para o planejamento e arquitetura de novos sistemas de


cunho operacional.

Em termos simples, um Data Warehouse, ou em portugus, Armazm de Dados, pode ser


definido como um banco de dados especializado, o qual integra e gerencia o fluxo de
informaes a partir dos bancos de dados corporativos e fontes de dados externas empresa.

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

Um Data Warehouse construdo para que tais dados possam ser armazenados e acessados de
forma que no sejam limitados por tabelas e linhas estritamente relacionais. Elmasri e
Navathe (1994) complementam ao afirmando que ele um modelo de dados
multidimensional que armazena dados de forma integrada e disponibiliza sries no tempo e
anlises de tendncias travs de banco de dados histrico e no-volatividade. interessante
salientar que o DW est separado dos bancos de dados operacionais, portanto as consultas dos
usurios no impactam nestes sistemas, que ficam resguardados de alteraes indevidas ou
perdas de dados.
Stair e Reynolds (2002) atestam que como o propsito do DW suportar requisies de
informaes, esse tem como caractersticas: fonte de dados de arquivos mltiplos, de banco de
dados internos e externos; os acessos dos usurios so para somente leitura; o modo de acesso
primrio aos dados se d por consultas simples ou complexas, com uso crescente do data
mining; utilizao de um modelo de banco de dados relacional e multidimensional; os nveis
de detalhes so freqentemente resumidos; dados histricos de mltiplos anos; h um
processo peridico de atualizao, mas esses so complexos, j que se combinam diversas
fontes; e necessrio um grande esforo de limpeza dos dados para que esses fiquem
ntegros.
4 Caractersticas do Data Warehouse
Segundo Inmon (1996), um DW deve ser orientado por assuntos, integrado, varivel no tempo
e no voltil. Essas seriam as principais caractersticas de um DW, porm existem outras
tambm importantes como a localizao, credibilidade dos dados e granularidade (Cazella,
2005).
4.1 Orientao por Assunto
A orientao por assunto uma caracterstica marcante de um DW, pois toda modelagem
voltada em torno dos principais assuntos da empresa. Enquanto todos os sistemas
transacionais esto voltados para processos e aplicaes especficas, os DWs objetivam
assuntos. Os assuntos so o conjunto de informaes relativas determinada rea estratgica
de uma empresa. Um exemplo tpico pode ser ilustrado da rea de vendas como produtos,
revendedores, contas e clientes.
4.2 Integrao
Esta caracterstica talvez seja a mais importante do DW. atravs dela que se padroniza uma
representao nica para os dados de todos os sistemas que formaro a base de dados do DW.
Por isso, grande parte do trabalho na construo de um DW est na anlise dos sistemas
transacionais e dos dados que eles contm. Esses dados geralmente encontram-se
armazenados em vrios padres de codificao, isso se deve aos inmeros sistemas existentes
nas empresas, e que eles tenham sido codificados por diferentes analistas. Isso quer dizer que
os mesmos dados podem estar em formatos diferentes.
Um exemplo clssico o que se refere aos gneros masculino e feminino. Num sistema
OLTP, o analista convencionou que o sexo seria 1 para masculino e 0 para feminino, j em
outro sistema outro analista usou para guardar a mesma informao a seguinte definio, M
para masculino e F para feminino, e por fim outro programador achou melhor colocar H para
masculino e M para feminino. Como podemos ver, so as mesmas informaes, mas esto em
formatos diferentes, e isso num DW jamais poder acontecer. Portanto por isso que dever

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

existir uma integrao de dados, convencionando-se uma maneira uniforme se armazenar os


mesmos.
4.3 Variao no Tempo
Segundo Inmon (1996), os Data Warehouses so variveis em relao ao tempo, isso nada
mais do que manter o histrico dos dados durante um perodo de tempo muito superior ao
dos sistemas transacionais. Diz respeito ao fato do dado em um data warehouse referir-se a
algum momento especfico, significando que no atualizvel, a cada ocorrncia de uma
mudana, uma nova entrada criada, para marcar esta mudana.
J que no Data Warehouse, o principal objetivo analisar o comportamento das mesmas
durante um perodo de tempo maior e fundamentados nessa variao que os gerentes tomam
as decises, ento num DW freqente manter-se um horizonte de tempo bem superior ao
dos sistemas transacionais. Deste modo vlido dizer que os dados nos sistemas transacionais
esto sendo atualizados constantemente, cuja exatido vlida somente para o momento de
acesso. J os dados existentes num DW so como fotografias que refletem os mesmos num
determinado momento do tempo. Essas fotografias so chamadas de snapshots (Cazella,
2005).
A dimenso tempo, sempre estar presente em qualquer fato de um DW, isso ocorre porque,
como citado anteriormente, sempre os dados refletiro um determinado momento de tempo, e
obrigatoriamente dever conter uma chave de tempo para expressar a data em que os dados
foram extrados. Portanto pode-se dizer que os dados armazenados corretamente no DW no
sero facilmente atualizados tendo-se assim uma imagem fiel da poca em que foram gerados.
Assim como os dados, importante frisar que os metadados, tambm possuem elementos
temporais, porque mantm um histrico das mudanas nas regras de negcio da empresa. Os
metadados so responsveis pelas informaes referentes ao caminho do dado dentro do DW.
4.4 No Volatilidade
No DW existem somente duas operaes, a carga inicial e as consultas dos front-ends aos
dados. Aps serem integrados e transformados, os dados so carregados em bloco para o data
warehouse, para que estejam disponveis aos usurios para acesso. Isso pode ser afirmado
porque a maneira como os dados so carregados e tratados completamente diferente dos
sistemas transacionais. No ambiente operacional, ao contrrio, os dados so, em geral,
atualizados registro a registro, em mltiplas transaes. Esta volatilidade requer um trabalho
considervel para assegurar integridade e consistncia. Um data warehouse no requer este
grau de controle tpico dos sistemas orientados a transaes, pois, no DW o que acontece
somente ler os dados na origem e grav-los no destino, ou seja, no banco modelado
multidimensional.
Deve-se considerar que os dados sempre passam por filtros antes de serem inseridos no DW.
Com isso muitos deles jamais saem do ambiente transacional, e outros so to resumidos que
no se encontram fora do DW. Em outras palavras, a maior parte dos dados fsica e
radicalmente alterada quando passam a fazer parte do DW. Do ponto de vista de integrao,
no so mais os mesmos dados do ambiente operacional. luz destes fatores, a redundncia
de dados entre os dois ambientes raramente ocorre, resultando em menos de 1 por cento de
duplicaes, essa definio dada por Inmon (1996), e muito vlida.

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

4.5 Localizao
Os dados podem estar fisicamente armazenados de trs formas:

Num nico local centralizado, com banco de dados em um DW integrado procura-se nessa
forma maximizar o poder de processamento e agilizando a busca dos dados. Esse tipo de
armazenagem bastante utilizada, porm h o inconveniente do investimento em
hardware para comportar a base de dados muito volumosa e o poderio de processamento
elevado para atender satisfatoriamente as consultas simultneas de muitos usurios.

Os distribudos, em forma de Data Marts, armazenados por reas de interesse. Por


exemplo, os dados da gerncia financeira num servidor, dados de marketing noutro e
dados da contabilidade num terceiro lugar. Tem por benefcio bastante performance, pois
no sobrecarrega um nico servidor e as consultas sero sempre atendidas em tempo
satisfatrio.

Armazenados por nveis de detalhes, em que as unidades de dados so mantidas no DW.


Pode-se armazenar dados altamente resumidos num servidor, dados resumidos com nvel
de detalhe intermedirio no segundo servidor e os dados mais detalhados (atmicos), num
terceiro servidor. Os servidores da primeira camada podem ser otimizados para suportar
um grande nmero de acessos e um baixo volume de dados, enquanto alguns servidores
nas outras camadas podem ser adequados para processar grandes volumes de dados, mas
baixo nmero de acesso.
4.6 Credibilidade dos Dados

A credibilidade dos dados o muito importante para o sucesso de qualquer projeto.


Discrepncias simples de todo tipo podem causar srios problemas quando se quer extrair
dados para suportar decises estratgicas para o negcio das empresas. Dados no dignos de
confiana podem resultar em relatrio inteis, que no tm importncia alguma. "Se voc tem
dados de m qualidade e os disponibiliza em um DW, o seu resultado final ser um suporte
deciso de baixo nvel com altos riscos para o seu negcio", afirma Robert Craig, analista do
Hurwitz Group (Data Warehouse, 2005).
Coisas aparentemente simples, como um CEP errado, podem no ter nenhum impacto em
uma transao de compra e venda, mas podem influir nas informaes referentes a cobertura
geogrfica, por exemplo. "No apenas a escolha da ferramenta certa que influi na qualidade
dos dados", afirma Richard Rist, vice-presidente Data Warehousing Institute (Data
Warehouse, 2005). Segundo ele, conjuntos de colees de dados, processos de entrada,
metadados e informaes sobre a origem dos dados, so importantssimos. Outras questes
como a manuteno e atualizao dos dados e as diferenas entre dados para bancos
transacionais e para uso em Data Warehousing tambm so cruciais para o sucesso dos
projetos. Alm das camadas do DW propriamente dito, tem-se a camada dos dados
operacionais, de onde os dados mais detalhados so coletados. Antes de fazer parte do DW
estes dados passam por diversos processos de transformao para fins de integrao,
consistncia e acurcia.
4.7 Granularidade
Granularidade nada mais do que o nvel de detalhe ou de resumo dos dados existentes num
DW. Quanto maior for o nvel de detalhes, menor ser o nvel de granularidade. O nvel de

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

granularidade afeta diretamente o volume de dados armazenados no DW, e ao mesmo tempo


o tipo de consulta que pode ser respondida.
Quando se tem um nvel de granularidade muito alto o espao em disco e o nmero de ndices
necessrios, tornam-se bem menores, porm h uma correspondente diminuio da
possibilidade de utilizao dos dados para atender a consultas detalhadas.
Com o nvel de granularidade muito baixo, possvel responder a praticamente qualquer
consulta, mas uma grande quantidade de recursos computacionais necessria para responder
perguntas muito especficas. No entanto, no ambiente de DW, dificilmente um evento isolado
examinado, mais provvel que ocorra a utilizao da viso de conjunto dos dados.
Os dados levemente resumidos compreendem um nvel intermedirio na estrutura do DW, so
derivados do detalhe de baixo nvel encontrado nos dados detalhados atuais. Este nvel do
DW quase sempre armazenado em disco. Na passagem para este nvel os dados sofrem
modificaes. Por exemplo, se as informaes nos dados detalhados atuais so armazenadas
por dia, nos dados levemente resumidos estas informaes podem estar armazenadas por
semanas. Neste nvel o horizonte de tempo de armazenamento normalmente fica em cinco
anos e aps este tempo os dados sofrem um processo de envelhecimento e podem passar para
um meio de armazenamento alternativo.
Os dados altamente resumidos so compactos e devem ser de fcil acesso, pois fornecem
informaes estatsticas valiosas para os Sistemas de Informaes Executivas (EIS), enquanto
que nos nveis anteriores ficam as informaes destinadas aos Sistemas de Apoio a Deciso
(SAD), que trabalham com dados mais analticos procurando analisar as informaes de
forma mais ampla.
O balanceamento do nvel de granularidade um dos aspectos mais crticos no planejamento
de um DW, pois na maior parte do tempo h uma grande demanda por eficincia no
armazenamento e no acesso aos dados, bem como pela possibilidade de analisar dados em
maior nvel de detalhes. Quando uma organizao possui grandes quantidades de dados no
DW, faz sentido pensar em dois ou mais nveis de granularidade, na parte detalhada dos
dados. Na realidade, a necessidade de existncia de mais de um nvel de granularidade to
grande, que a opo do projeto que consiste em duplos nveis de granularidade deveria ser o
padro para quase todas as empresas.
O chamado nvel duplo de granularidade se enquadra nos requisitos da maioria das empresas.
Na primeira camada de dados ficam os dados que fluem do armazenamento operacional e so
resumidos na forma de campos apropriados para a utilizao de analistas e gerentes. Na
segunda camada, ou nvel de dados histricos, ficam todos os detalhes vindos do ambiente
operacional. Como h uma verdadeira montanha de dados neste nvel, faz sentido armazenar
os dados em um meio alternativo como fitas magnticas.
Com a criao de dois nveis de granularidade no nvel detalhado do DW, possvel atender a
todos os tipos de consultas, pois a maior parte do processamento analtico dirige-se aos dados
levemente resumidos que so compactos e de fcil acesso. E para ocasies em que um maior
nvel de detalhe deve ser investigado existe o nvel de dados histricos. O acesso aos dados do
nvel histrico de granularidade caro, incmodo e complexo, mas caso haja necessidade de
alcanar esse nvel de detalhe, l estar ele.

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

5 Implantao de um Data Warehouse


O DW no como um software, que pode ser comprado e instalado em todos os
computadores da empresa em algumas horas, na realidade sua implantao exige a integrao
de vrios produtos e processos. O Data Warehouse (DW) apresenta um processo complexo
composto por vrios itens como metodologias, tcnicas, mquinas, bancos de dados,
ferramentas de front-end, extrao, metadados, refinamento de dados, replicao, e
principalmente, recursos humanos. Cada elo desta corrente est sujeito a falhas que podem
transformar um projeto de milhes de reais, que era tido pela empresa como a tbua de
salvao para seus problemas, num grande pesadelo (Flores, 2005).
O momento mais crucial de todo processo, e o causador da maior parte dos problemas, o da
escolha das ferramentas, dos bancos de dados, das consultorias, e da definio do escopo do
projeto e da seleo dos indivduos que faro parte do staff de DW. Mais do que um bancos
de dados de ltima gerao importante selecionar com extremo critrio os profissionais que
faro parte de um projeto.
Depois da escolha dos profissionais responsveis, deve-se fazer um levantamento e definir os
objetos de negcios e, por conseguinte, as questes gerenciais que os respondem. Essa etapa
de extrema importncia, pois ela quem ir determinar quais sero os dados a serem
armazenados no Data Warehouse. Exigir, tambm, uma metodologia especfica e diferente
dos sistemas transacionais. Terminada esta etapa, partiremos ento para a segunda fase da
implantao que consiste em fazer a modelagem dimensional, ou seja, partindo dos objetos
gerenciais levantados faz-se a modelagem do novo banco gerando os fatos e as dimenses.
Logo em seguida, parte-se para a criao fsica do modelo, onde as especificidades de um
SGBD e da ferramenta OLAP escolhidos so levadas em considerao para otimizar as
futuras consultas ao banco e onde se deve dar preferncia os esquemas estrela.
Feito isso, o passo seguinte a carga dos dados no DW. Para isso, necessrio que se
definam as origens dos mesmos nos sistemas legados, ou seja, identificar em quais sistemas e
onde esto armazenados. Nessa etapa imprescindvel a presena de um analista de sistemas
da empresa que conhea profundamente os sistemas transacionais, pois isso facilitar muito o
trabalho de localizao e identificao dos dados.
Seguindo o roteiro descrito por Flores (2005) a prxima etapa fazer as rotinas de extrao
dos dados. Essas rotinas podem ser desenvolvidas por programadores em qualquer linguagem
de programao. Aps a extrao resta dar a carga dos dados no banco dimensional criado no
segundo passo. Essa carga tambm pode ser feita atravs de rotinas desenvolvidas pelos
programadores. Concluda a carga deve-se fazer uma checagem profunda da consistncia dos
dados, isso muito importante, pois est se trabalhando com informaes para dar suporte a
deciso e, qualquer dado errado poder determinar o fracasso da anlise do negcio em
questo.
Outro passo importantssimo na elaborao a confeco e armazenamento dos metadados.
Os metadados so os dados de controle do Data Warehouse.
Para fazermos a anlise dos dados temos as ferramentas OLAP, que permitem a visualizao
dos dados da base dimensional e sua anlise de acordo com a imaginao do executivo. Com
esses softwares, tambm denominados ferramentas de front-end, o usurio poder analisar as
informaes que esto contidas no banco multidimensional.

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

Alm dos passos anteriores, os usurios devem ser treinados de forma a aprender como
manipular as informaes existentes seja na criao das estatsticas, seja na criao de
grficos e relatrios.
7 Problemas que podem existir na Implantao de um Data Warehouse
Existem diversos problemas que podem ocorrer durante o desenvolvimento de um sistema de
DW. Dentre estes problemas, segundo Bar (1996, apud Data Warehouse, 2005), os mais
comuns so:
a) No envolver a alta direo da empresa no projeto: O projeto de um DW s ter sucesso se
os futuros usurios se envolverem diretamente desde o incio nas atividades, pois isto
facilitar a destinao das verbas necessrias nos momentos oportunos alm de direcionar os
trabalhos para que os reais objetivos do DW para o negcio da empresa sejam alcanados no
momento da implantao.
b) Gerar falsas expectativas com promessas que no podero ser cumpridas: citar frases do
tipo "O DW mostrar aos gerentes as melhores decises" pode causar tanto desconfiana no
projeto quanto desprezo. O DW no mostrar as melhores decises, mas sim respostas s
consultas efetuadas. Cabe aos usurios elaborar consultas inteligentes e analisar as respostas
obtidas.
c) Carregar no DW informaes somente porque elas esto disponveis nos sistemas
transacionais: Nem todos os dados disponveis nos sistemas operacionais da empresa so
necessariamente teis para o DW. Cabe ao arquiteto dos dados analisar junto com os usurios
quais os dados que realmente contm informaes necessrias e desprezar aqueles que no
fazem parte dos objetivos do DW.
d) Imaginar que o projeto do banco de dados do DW o mesmo que o projeto de um sistema
transacional: num processo transacional devem ser dimensionados os recursos para que se
atinja uma alta velocidade de acesso e grandes facilidades na atualizao de registros. Nos
sistemas de apoio deciso a realidade totalmente outra. O objetivo destes sistemas
fornecer acessos agregados, ou seja, somas, mdias, tendncias, etc. Outra diferena entre os
dois tipos de sistemas pode ser detectado no tipo de usurios. Nos sistemas transacionais um
programador desenvolve uma consulta que poder ser utilizada milhares de vezes. No DW o
usurio final desenvolve suas prprias consultas que podem ser utilizadas somente uma vez.
e) Na seleo do pessoal, escolher um gerente para o DW com orientao essencialmente
tcnica: os sistemas de apoio deciso so na verdade uma prestao de servios e no um
servio de armazenamento de dados. Por isso, fundamental que o gerente do DW seja uma
pessoa voltada aos interesses dos usurios e principalmente que, saiba dos termos utilizados
diariamente pelos altos gerentes e outros tomadores de decises.
f) Dedicar-se ao tratamento de dados do tipo registros numricos e string: Muitos poderiam
imaginar que as informaes que sero utilizadas em um DW seriam oriundas
especificamente dos registros das bases de dados transacionais, e que estas informaes
seriam apenas nmeros ou palavras. Porm a incluso de textos, imagens, sons e vdeos
podem ser bastante teis no momento da anlise de determinadas situaes da empresa e do
negcio.

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

g) Projetar um sistema com base em um hardware que no poder comportar o crescimento


da demanda do DW: A capacidade dos servidores est em constante crescimento, porm pode
ser dimensionando um ou mais equipamentos para trabalharem por um ou dois anos, mas as
caractersticas destes sistemas indicam que a quantidade de informaes armazenadas pode
atingir at mesmo alguns terabytes. importante que o servidor do banco de dados do DW
seja fornecido por uma empresa confivel e que garanta a possibilidade de serem realizadas
expanses a valores e prazos compatveis com os de mercado.
h) Imaginar que aps a implantao do DW os problemas estaro terminados: Muito esforo
deve ser despendido para que um sistema de DW saia da prancheta. Porm, aps a sua
implantao os usurios comearo a criar mais e mais consultas, e estas consultas
necessitaro de novos dados que resultaro em novas consultas. Desta forma, o projeto de um
sistema de apoio deciso precisa ser revisado e atualizado constantemente, no apenas com
novos dados, mas tambm com novas tecnologias.
8 Ferramentas que Permitem Extrair Informaes do Data Warehouse
Mesmo sabendo que a informao sobre o perfil do cliente tpico ou do produto de sucesso de
uma empresa encontra-se de alguma forma entre os muitos gigabytes de dados de marketing e
de vendas armazenados nos bancos de dados da empresa, ainda pode existir um longo
caminho a ser percorrido at que esta informao esteja de fato disponvel. A sua extrao
eficaz, de modo a poder subsidiar decises, depende da existncia de ferramentas
especializadas que permitam a captura de dados relevantes mais rapidamente e a sua
visualizao atravs de vrias dimenses. O termo extrao neste contexto no deve ser
confundido com a extrao dos dados das fontes para posterior alimentao do data
warehouse.
As ferramentas no devem apenas permitir o acesso aos dados, mas tambm permitir anlises
de dados significativas, de tal maneira a transformar dados brutos em informao til para os
processos estratgicos da empresa. O sucesso de um data warehouse pode depender da
disponibilidade da ferramenta certa para as necessidades de seus usurios.
As ferramentas mais simples so os produtos para consultas e geradores de relatrios bsicos.
Estes geradores de relatrio no atendem a usurios que precisem mais do que uma viso
esttica dos dados e que no pode mais ser manipulada. Ferramentas OLAP podem oferecer a
este tipo de usurio maior capacidade de manipulao, permitindo analisar o porque dos
resultados obtidos. Estas ferramentas, muitas vezes, so baseadas em bancos de dados
multidimensionais, o que significa que os dados precisam ser extrados e carregados para as
estruturas proprietrias do sistema, j que no h padres abertos para o acesso de dados
multidimensionais - outra soluo oferecida por fornecedores nesta rea o OLAP relacional
(ROLAP) e o OLAP multidimensional (MOLAP). O OLAP no uma soluo imediata,
configurar o programa de OLAP e ter acesso aos dados requer uma clara compreenso dos
modelos de dados da empresa e das funes analticas necessrias aos executivos e outros
analistas de dados.
Comparativamente ao OLAP, Sistemas de Informaes Executivas (SIE) apresentam uma
visualizao de dados mais simplificada, altamente consolidada e, na maior parte das vezes
esttica. At porque, em geral, os executivos no dispem do tempo e da experincia para
executar uma anlise OLAP.

10

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

O data mining ou minerao de dados uma categoria de ferramentas de anlise open-end.


Ao invs de fazerem perguntas, os usurios entregam para a ferramenta grandes quantidades
de dados em busca de tendncias ou agrupamentos dos dados. A diferena entre sistemas do
tipo SIE e a tecnologia de data mining pode ser vista da seguinte forma: se voc tem
perguntas especficas e sabe os dados de que necessita, utilize um SIE; quando voc no sabe
qual a pergunta, mas mesmo assim precisa de respostas, use data mining.
9 Consideraes Finais
Um Data Warehouse permite a gerao de dados integrados e histricos auxiliando os
diretores a decidirem embasados em fatos e no em intuies ou especulaes, o que reduz a
probabilidade de erros aumentados velocidade na hora da deciso.
Esse instrumento estudado mostra o quanto ele til para os gerentes das empresas para a
obteno e anlise da informao se realizado da forma correta. Tambm interessante
ressaltar que no um mecanismo de fcil implementao, pois exige de recursos dos mais
diversos e dentre eles o recurso humano que se destaca. Umas sries de ferramentas so
necessrias para que se possa desfrutar de suas benfices e vrios aspectos relacionados aos
modelos dimensionais que permitem uma organizao dos processos envolvidos.
Conhecer mais sobre essa tecnologia permitir aos administradores descobrir novas maneiras
de diferenciar sua empresa numa economia globalizada, deixando-os mais seguros para
definirem as metas e adotarem diferentes estratgias em sua organizao, conseguindo assim
visualizarem antes de seus concorrentes novos mercados e oportunidades atuando de maneiras
diferentes conforme o perfil de seus consumidores.

Referncias
CAMPOS, Maria Luiza; ROCHA, Arnaldo V. Filho. Data Warehouse.
http://tartaruga.nce.ufrj.br/dataware/tutorial/home.html. Acesso em: 18 maio de 2005.

Disponvel

em:

CAZELLA, Slvio Csar. Slides de aula sobre sistema de apoio deciso. Disponvel em:
http://www.inf.unisinos.br/~cazella/dss/sad_aula_11.pdf. Acesso em: 18 maio de 2005. ________________.
Slides
de
aula
sobre
sistema
de
apoio

deciso.
Disponvel
em:http://www.inf.unisinos.br/~cazella/dss/sad_aula_12.pdf. Acesso em: 18 maio de 2005.
DATAWAREHOUSE. Disponvel em: www.datawarehouse.inf.br. Acesso em : 18 maio 2005.
DATA WAREHOUSE. Disponvel em: www.datawarehouse.com. Acesso em: 18 de maio de 2005.
ELMASRI, Ramez.; NAVATHE, Sham.. Fundamentals of database systems. 2nd ed. - Redwood City Calif. :
Benjamin/Cummings, c1994
FLORES, Christian Feltrin. Projeto e Desenvolvimento de Datawarehouse Hospitalar. Disponvel em:
http://www.hcaa.com.br/antiga/dw/index.htm. Acesso em: 18 de maio de 2005.
INMON, W.H. Information System Arquiteture: Development in 90s. Nova York: John Wiley & Sons Inc.,
1993. Partes do livro disponvel em: www.billinmon.com.
____________. Building the Data Warehouse. Nova York: John Wiley & Sons Inc., 1996. Partes do livro
disponvel em: http://www.billinmon.com/.

11

XII SIMPEP Bauru, SP, Brasil, 7 a 9 de Novembro de 2005

JARKE, Matthias; LENZERINI, Maurizio; VASSILIOU, Yannis; VASSILIADIS, Panos. Fundamentals of


Data Warehouse. Nova York: Springer, 2003, 2 ed.
KIMBALL, RALPH Is E-R Modeling Hazardous to DSS? DBMS, Outubro 1995.
STAIR, Ralph M.; REYNOLDS, George W. Princpios de Sistemas de Informaes. Rio de Janeiro: LTC,
2002, 4. ed.
TURBAN, Efraim; RAINER, R. Kelly Jr.; POTTER, Richard E.
Informao: Teoria e prtica. Rio de janeiro: Campus, 2003.

Administrao de Tecnologia de

WG SYSTEMS. Disponvel em: http://www.wgsystems.com.br/bi/dw.htm. Acesso em: 18 de maio de 2005.

12