Você está na página 1de 13

ndice

Resumo ......................................................................................................................... 1

Introduo ..................................................................................................................... 2

Data warehousing (armazenagem de dados)................................................................. 3

Caractersticas dos data warehouses ............................................................................. 5

Orientado por assunto ................................................................................................... 5

Integrada ....................................................................................................................... 5

No voltil..................................................................................................................... 6

Varivel com o tempo ................................................................................................... 6

Criando um data warehouse .......................................................................................... 6

Funcionalidades tpicas de um data warehouse ............................................................ 8

Arquitetura do data warehouse ..................................................................................... 8

Arquitetura Genrica ..................................................................................................... 9

Arquitetura de Duas Camadas ...................................................................................... 9

Arquitetura de Trs Camadas ....................................................................................... 9

Data warehouses versus vises ..................................................................................... 9

Concluso.................................................................................................................... 11

Referncias bibliogrficas........................................................................................... 12
Resumo

Neste trabalho, iremos apresentar o tema conhecido como data warehousing


(armazenagem de dados). O data warehousing pode ser visto pode ser visto como um
processo preliminar.

Apresentaremos os principais conceitos relacionados ao data warehousing e veremos


tambm a funcionalidade especial associada a uma viso multidimensional dos dados.
Contudo, tambm veremos como os data warehouses do aos tomadores de deciso
informaes no nvel correcto de detalhe, com base em organizao e perispectiva
apropriadas.

Palavras-chave: Data warehouse. Processamento Analtico Online (OLAP). DSS


(sistema de apoio a deciso)

1
Introduo

Este trabalho foi desenvolvido no mbito da disciplina de Base de Dados II, ou melhor,
foi-nos proposto cadeira um trabalho terico sobre data warehousing, onde com muito
esforo e nesta percepo de relao do trabalho, procurou-se trazer vrios aspectos
relacionados com o mesmo.

Sabe-se que em organizaes modernas, os usurios dos dados em geral so


completamente retirados das fontes do dado. Muitas pessoas s precisam de acesso a
leitura aos dados, mais ainda necessitam de acesso rpido a um volume maior de dados
do que pode ser convenientemente baixado para desktop. Com frequncia, esses dados
veem de vrios bancos de dados. Como muitas das anlises realizadas so recorrentes e
previsveis, os vendedores de software e o pessoal de suporte de sistemas projectam
sistemas para dar suporte a essas funes.

Actualmente, existe uma grande necessidade de oferecer aos que tomam as decises, da
gerncia intermediria para cima, informaes no nvel correcto de detalhe para dar
suporte a actividade de tomada de deciso. A data warehousing uma das ferramentas
que oferece essas funcionalidades.

O presente trabalho tem como principal objectivo, de fazer compreender, no geral e em


particular aquilo que so os data warehouses, visto que possui ferramentas que
armazena dados que sero de grande interesse aos gestores das empresas facilitando a
realizao de anlises dos dados armazenados e a procura de conhecimentos que sero
usados em reas de gesto estratgica da empresa. No s, mas como tambm facilita a
realizao de uma avaliao de grandes volumes de dados extrados dos sistemas
transacionais das empresas. Esses sistemas armazenam dados de eventos passados e
atuais das organizaes que de acordo com as anlises realizadas sobre esses dados
ajudar os gestores no processo de tomada de decises para o presente e prever novos
eventos para o futuro.

Assim sendo espera-se que com os assuntos tratados no trabalho, o leitor possa
compreender entorno do tema e para isso necessrio que o leitor leia com muita
ateno, visto que quanto maior for a ateno, maior ser a compreenso.

2
Data warehousing (armazenagem de dados)

Os data warehouses tambm uma coleo de informaes, bem como um sistema de


suporte. Contudo, existe uma distino clara com os bancos de dados tradicionais.

Os data warehouses tm a caracterstica distintiva de servir principalmente para


aplicaes de apoio deciso. Eles so otimizados para recuperao de dados, e no
para processamento de transao de rotina.

Como os data warehouses tm sido desenvolvido em diversas organizaes para atender


a necessidades particulares, no existem uma nica definio cannica desse termo.
Artigos de revista profissional e livros populares elaboram o significado de diversas
maneiras. Os vendedores aproveitaram a popularidade do termo para ajudar a
comercializar uma srie de produtos relacionados, e os consultores ofereceram uma
grande variedade de servios, todos sob a bandeira da armazenagem de dados. Contudo,
os data warehouses so muito distintos dos bancos de dados tradicionais em sua
estrutura, funcionamento, desempenho e finalidade.

[W.H. Immon reconhecido como o primeiro a usar o termo armazm ou (warehouse)]


caracterizou um data warehouse como uma coleo de dados orientada a assunto,
integrada, no voltil, varivel no tempo para o suporte s decises da gerncia. Os data
warehouses oferecem acesso a dados para anlise complexa, descoberta de
conhecimento e tomada de deciso. Eles do suporte a demandas de alto desempenho
sobre os dados e informaes de uma organizao. Vrios tipos de aplicaes OLAP,
DSS so aceites. Definimos cada uma delas a seguir:

OLAP (Online Analytical Processing ou processamento analtico on-line


(tempo real)) um termo usado para descrever a anlise de dados complexos
do data warehouses. Nas mos de trabalhadores do conhecimento habilidosos, as
ferramentas OLAP utilizam capacidades de computao distribudas para
anlises que exigem mais armazenamento e poder de processamento.
Importante salientar que, a OLAP uma das ferramentas mais populares para
explorao de um data warehouse. Vrios outros tipos de aplicaes podem ser
usadas como mineirao de dados entre outros.

3
DSS (sistema de apoio a deciso), tambm conhecido como EIS so sistemas
de informaes executivas, ajudam os principais tomadores de decises de uma
organizao com dados de nvel mais alto em decises complexas e importantes.

Por outra, podemos dizer de uma forma geral que um data warehouse uma coleo de
tecnologias de apoio decisao, visando a habilitar o trabalhador do conhecimento
(executivo, gerente, analista) a tomar decises melhores e rpidas.

O data warehouse possibilita a anlise de grandes volumes de dados, coletados dos


sistemas transacionais (OLTP). So as chamadas sries histricas que possibilitam uma
melhor anlise de eventos passados, oferecendo suporte s tomadas de decises
presentes e a previso de eventos futuros. Por definio, os dados em um data
warehouse no so volteis, ou seja, eles no mudam, salvo quando necessrio fazer
correes de dados previamente carregados. Os dados esto disponveis somente para
leitura e no podem ser alterados.

A figura abaixo oferece uma viso geral da estrutura conceitual de um data warehouse.
Ela mostra o processo inteiro de data warehousing, que inclui a possvel limpeza e
formatao dos dados antes que sejam carregados no armazm. Esse processo
conhecido como ferramentas de ETL (extrao, transformao e carga).

Figura 1. Exemplo de transaes no modelo de cesta de mercado.

4
Caractersticas dos data warehouses

Os data warehouses possuem as seguintes caractersticas (descritas na tabela) que as


diferenciam:

Viso conceitual multidimensional; Dimensionalidade genrica;

Dimenses e nveis de agregao ilimitado; Operaes irrestritas entre dimenses;

Tratamento dinmico de matriz esparsa; Arquitectura cliente-servidor;

Suporte para mltiplos usurios; Acessibilidade;

Transparncia; Manipulao de dados intuitiva;

Desempenho de relatrio consistente; Recurso de relatrio flexvel.

Chegando um pouco mais alm, a definio de W.H. Immon como frisou-se no ponto
anterior diz que, podemos caracterizar um data warehouse por ser:

Orientado por assunto

Refere-se aos sistemas transacionais organizados em uma determinada aplicao de uma


empresa. A orientao por assunto uma caracterstica importante, pois toda a
modelagem do data warehouse orientada a partir dos principais assuntos da empresa.
Por exemplo, uma empresa de arrecadao de impostos, onde os principais assuntos so
os cadastros de contribuintes, impostos a recolher.

Integrada

Essa a caracterstica mais importante do data warehouse, pois trata da integrao, que
feita do ambiente operacional para as aplicaes do data warehouse. A integrao
realizada visando padronizar os dados dos diversos sistemas em uma nica
representao, para serem transferidos para a base de dados nica do data warehouse.

5
No voltil

Nos sistemas transacionais os dados sofrem diversas alteraes como, por exemplo, a
incluso, alterao e excluso de dados. No ambiente do data warehouse os dados, antes
de serem carregados, so filtrados e limpos gerando informao. Aps esta etapa
esses dados sofrem somente operaes de consulta e excluso, sem que possam ser
alterados, e esta caracterstica representa a no-volatilidade.

Varivel com o tempo

A variao em relao ao tempo consiste na manuteno de um histrico de dados em


relao ao perodo de tempo maior que dos sistemas comuns, isto significa que as
tcnicas de minerao de dados no so aplicadas em tempo real, de forma a no
comprometer o desempenho dos bancos transacionais OLTP. Ao analisarmos um dado
de um data warehouse, o mesmo sempre estar relacionado a um perodo determinado
de tempo, pois ter uma chave de tempo que ir indicar o dia no qual esses dados foram
extrados.

Contudo, o imenso volume de dados (provavelmente em terabytes ou mesmo petabytes)


uma questo que tem sido tratada por meio de data warehouses em nvel empresarial,
data warehouses virtuais e data marts.

Data warehouses em nvel empresarial so imensos projectos que exigem


investimento macio de tempo e recursos.

Data warehouses virtuais oferecem vises de bancos de dados operacionais


que so materializadas para acesso eficiente.

Data marts em geral so voltados para um subconjunto da organizao, como


um departamento, e possuem um foco mais estreito.

Criando um data warehouse

Na construo de uma data warehouse, os responsveis devero ter uma viso ampla do
uso antecipado do armazm. No existe um meio de antecipar todas as consultas ou
anlises possveis durante a fase de projectos. Porm, o projecto deve aceitar
especificamente a consulta ocasional, ou seja, acessar dados com qualquer combinao
significativa de valores para os atributos nas tabelas de dimenses ou factos.

6
A aquisio de dados para o armazm envolve as seguintes etapas:

1. Os dados precisam ser extrados de vrias fontes heterogneas.

2. Os dados precisam ser formatados por coerncia dentro do armazm. Nomes,


significados e domnios dos dados de fontes no relacionados precisam ser
reconciliados.

3. Os dados precisam ser limpos para garantir a validade. A limpeza de dados um


processo complexo, que tem sido identificado como o componente que mais
exige trabalho na construo de um data warehouse.

4. Os dados precisam ser ajustados ao modelo de dados do armazm. Os dados de


vrias fontes podem ser usados. Eles podem ser convertidos em banco de dados
relacionais, orientados a objectos ou legados (em rede e/ou hierrquia) para um
modelo multidimensional.

5. Os dados precisam ser carregados no armazm. O grande volume de dados no


armazm torna a carga dse dados uma tarefa significativa.

Um data warehouse normalmente otimizado para acesso com base no tomador de


deciso. O armazenamento de dados em um data warehouse reflete essa especializao
e envolve os seguintes processos:

O Armazenamento dos dados de acordo com o modelo de dados do armazm.

Criao e manuteno das estruturas de dados exigidas.

Criao e manuteno dos caminhos de acesso apropriados.

Fornecimento de dados variveis no tempo medida que novos dados so


includos.

Suporte actualizao dos dados do armazm.

Actualizao dos dados.

Eliminao dos dados.

Os data warehouse tambm devem ser projectados com considerao total do ambiente
em que residiro. Consideraes de projecto importantes incluem as seguintes:

7
Projees de uso O ajuste de modelo de dados

Caractersticas das fontes disponveis Projecto de componentes de metadados

Projecto de componente modular Projecto de facilidade de gerenciamento


e mudana.

Consideraes de arquitetura distribuda e paralela.

Funcionalidades tpicas de um data warehouse

Os data warehouses existem para facilitar as consultas ocasionais complexas, com o uso
intenso de dados e frequentes, e em consequncia disto, os data warehouses precisam
oferecer suporte para a consulta muito maior e mais eficiente do que exigido dos
bancos de dados transacionais.

Os data warehouses oferecem funcionalidades pr-programadas, como as que se


seguem:

Roll-up: os dados so resumidos com generalizao cada vez maior (por


exemplo, semanal para semestral para anual).

Drill-down: nveis cada vez maiores de detalhes so revelados (o complemento


de roll-up).

Giro: a tabulao cruzada (tambm conhecida como rotao) realizada.

Skice e dice: operaes de projeo so realizadas nas instituies.

Ordenao: os dados so ordenados por valor ordinal.

Seleo: os dados esto disponveis por valor ou intervalo.

Atributo derivado (calculado): atributos so calculados por operaes sobre


valores armazenados e derivados.

Arquitetura do data warehouse

Arquitetura do data warehouse pode variar conforme o tipo de assunto abordado, isso
ocorre devido as necessidades que variam de empresa para empresa.

8
Arquitetura Genrica

A arquitetura genrica compreende a camada dos dados operacionais que sero


acessados pela camada de acesso a dados. As camadas de gerenciamento de processos,
transporte e data warehouse so responsveis por distribuir os dados e esto no centro
da arquitetura. A camada de acesso informao possibilita a extrao das informaes
do data warehouse utilizando um conjunto de ferramentas.

Arquitetura de Duas Camadas

A arquitetura de duas camadas utiliza um servidor, juntamente com aplicaes front


end, que so ferramentas que realizam operaes sobre os dados consultados e os
transformam em informaes teis para os usurios, os componentes back end so
ferramentas responsveis pela extrao, limpeza e cargas dos dados, mais conhecidas
como ETL tambm so utilizadas neste tipo de arquitetura.

Arquitetura de Trs Camadas

A arquitetura de trs camadas suporta vrios usurios e servios devido a sua


flexibilidade, as informaes ficam armazenadas em vrias camadas. Na primeira
camada esto as interfaces que trabalham com o usurio, onde geralmente so grficas.
Na segunda camada esto os servidores de banco de dados e aplicaes e, por isso, tm
a necessidade de ter um acesso eficiente e veloz aos dados compartilhados, e na ltima
ficam armazenadas as fontes de dados. A arquitetura de trs camadas a mais utilizada
pelos analista.

Data warehouses versus vises

As vises, no entanto, fornecem apenas um subjeconjunto das funes e capacidades


dos data warehouses. Vises e data warehouses so semelhantes porque ambos tm
extratos apenas de leitura de banco de dados e orientao por assunto. Contudo, os data
warehouses so diferentes das vises das seguintes maneiras:

Os data warehouses existem como armazenamento persistente, em vez de serem


materializados por demanda.

Os data warehouses normalmente no so relacionais, mas sim


multidimensionais. As vises de um banco de dados relacional so relacionais.

9
Os data warehouses podem ser indexados para otimizar o desempenho. As
vises no podem ser indexadas independentemente dos bancos de dados
subjacentes.

Os data warehouses caracteristicamente oferecem suporte especfico de


funcionalidade; as vises, no.

Os data warehouses oferecem uma ggrande quantidade de dados integrados e


normalmente temporais, enquanto as vises so uma sntese de um banco de
dados.

10
Concluso

Aps a elaborao do presente trabalho de pesquisa, resultado de muito esforo,


constatou-se que o data warehouse esta relacionado com as dificuldades dos gestores em
adquirirem informaes que possam auxili-los no processo de tomada de decises
estratgicas, mas no se resume somente nisso, mas tambm uma tcnica que faz a
coleta dos dados das organizaes sem ter passado por nenhum processo analtico e os
transforma em informaes concretas disponibilizando-as para toda a organizao.
Existe vrios tipos de aplicaes que roda a plataforma do data warehouse e a
ferramenta mais usada para a extrao de um data warehouse Online Analytical
Processing (OLAP) ou Processo Analtico em Tempo Real (online).

Observando a importncia do recurso informao, torna-se importante que todas as


empresas destinem uma ateno especial ao seu formato e a forma que ela obtida, pois
so atravs dessas informaes que sero tomadas decises importantes para o
desenvolvimento da organizao. Com o estudo dessa tcnica de negcio pde-se
concluir que utilizando essa tcnica, agiliza no processo de gerao de informaes e
auxilia os gestores nas tomadas de deciso e at mesmo para manter-se sempre afrente
no mercado.

Portanto, com a utilizao de umas das ferramentas ou aplicaes a saber, OLAP as


empresas podero ter ganhos significativos de produtividade, pois ao auxiliar na tomada
de decises, disponibiliza informaes estratgicas que poder ser visualizadas de
diversas formas. Tudo isto de forma instantnea e consistente, com respostas rpidas s
consultas e perguntas de gerentes e analistas.

No decorrer do trabalho, existiram algumas dificuldades no que diz respeito a


organizao dos contedos sobre o tema, visto que o assunto tratado muito extenso e
se usado vrios livros ou manuais as abordagens por vezes so diferentes, mas
dificuldades essas que foram ultrapassadas com maior empenho.

11
Referncias bibliogrficas

1. ELMASRI, Ramez; NAVATHE, Shamkant B; Sistema de Banco de Dados,


So Paulo, Pearson Addison Wesley, 6 edio, 2011.
2. TURBAN, Efraim; RAINER, R. Kelly Jr.; POTTER, Richard E.
Administrao de Tecnologia de Informao: Teoria e prtica. Rio de
janeiro: Campus, 2003.

ATENO:

TODA COR AMARELA BENATE

TODA COR VERDE ANBAL

TODA COR VERMELHA MIGUEL

TODA COR DE ROSA ANTNIO

TODA COR CINZENTA MODESTO

12

Você também pode gostar