Você está na página 1de 31

NOME DO ALUNO

TTULO DO PROJETO

Londrina ano

NOME DO ALUNO

TTULO DO PROJETO

Projeto da Monografia apresentado UNOPAR Universidade Norte do Paran, como requisito para a obteno de aprovao para realizao da Monografia do Curso de Ps-graduao em Banco de Dados. Orientador: Prof. MS _____________

Londrina ano

PARECER DO PROJETO

Professor Orientador (a): ________________________________________________ Parecer: _____________________________________________________________


_________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________________

Data: ____/ ____/ ____

Assinatura: _____________________________________

LISTA DE ILUSTRAES Figura 1 Modelo Rede.............................................................................................15 Figura 2 Modelo Hierrquico...................................................................................16 Figura 3 Modelo Relacional.....................................................................................17 Figura 4 Cubo de dados com dimenses...............................................................23 Figura 5 Tabela de Fatos e as tabelas de Dimenses...........................................24

LISTA DE ABREVIATURAS E SIGLAS

BD CAD CASE DW ETC OIS OLAP OLTP SGBD WWW

- Banco de Dados - Computer-Aided Design - Computer-Aided Software Engeneering - Data Warehouse - Extrao, Transformao e Carga - Office Information Systems - On-line Analytical Processing - On-line Transaction Processing - Sistemas de Gerncia de Banco de Dados - World Wide Web

PL/SQL - Procedural Language/Structured Query Language

SUMRIO LISTA DE ILUSTRAES...........................................................................................4 lista de abreviaturas e siglas........................................................................................5 sumrio.........................................................................................................................6 1 INTRODUO...........................................................................................................6 2 OBJETIVOS ..............................................................................................................7 3 METODOLOGIA.........................................................................................................8 4 REVISO DA LITERATURA......................................................................................9 5 CRONOGRAMA DAS ATIVIDADES........................................................................27 6 Concluso.................................................................................................................28 referncias..................................................................................................................29

1 INTRODUO

O trabalho a ser desenvolvido um requisito para a concluso do curso de Especializao em Banco de Dados. Trata-se de uma monografia contendo a reviso de literatura sobre o tema Data Warehouse (DW) e sua aplicao com um estudo de caso para o domnio de Telecomunicaes abordando o Modelo Dimensional.

2 OBJETIVOS

O desenvolvimento dessa pesquisa ser realizado na Sercomtel S.A. Telecomunicaes e Sercomtel Celular S.A., empresas de telefonia fixa e mvel respectivamente, situadas na cidade de Londrina Paran, que atendem as cidades de Londrina e Tamarana (telefonia fixa e mvel), Camb, Ibipor, Arapongas e Apucarana (somente telefonia fixa). Ambas empresas oferecem uma diversidade de planos pr e ps-pagos, para melhor atender a seus clientes. Este trabalho ser direcionado para o armazenamento de informaes do produto pr-pago: informaes de vendas de cartes, recargas de cartes, utilizao de crditos e concesso de bnus. Estas informaes esto armazenadas em planilhas eletrnicas e em Banco de Dados (BD) Oracle distintos. A empresa necessita que esses dados sejam armazenados por vrios anos para atender aos questionamentos sobre os planos pr-pago: performance do produto, levantamento de indicadores de telefonia, levantamento de utilizao do servio, alm de consultas para tomadas de decises mercadolgicas, tcnicas, financeiras e reas afins. O objetivo desse trabalho apresentar uma proposta de desenvolvimento de um Data Warehouse para o domnio de Telecomunicaes, contemplando o seu projeto e implementao.

3 METODOLOGIA

A pesquisa ser do tipo aplicada, quanto a seus objetivos, poder ser definida como pesquisa explicativa. Do ponto de vista da forma de abordagem do problema, a pesquisa ser classificada como qualitativa, e em relao ao delineamento, trata-se de um estudo de caso.

O trabalho de pesquisa ser iniciado com a reviso da literatura sobre introduo a banco de dados. Na seqncia ser abordada a tecnologia de Data Warehouse detalhando a sua arquitetura e modelagem. A arquitetura contemplar um estudo sobre: Data Warehouse; Data Mart; Data Mining; Extrao, Transformao e Carga (ETC) dos dados dos sistemas fontes para o banco DW; e ferramentas On-line Analytical Processing (OLAP). Para projetar o DW ser adotado o modelo Dimensional de Ralph Kimball (1998), tambm conhecido como modelo Estrela. O modelo Dimensional ser validado atravs da modelagem de um estudo de caso sobre informaes de utilizao dos planos de telefonia pr-pago. Na modelagem ser utilizada a ferramenta Oracle Designer verso 2.1, para a criao do modelo lgico e fsico. Para o processo de ETC sero desenvolvidas rotinas em Procedural Language/Structured Query Language (PL/SQL) em banco de dados Oracle verses 8 e 10g. As consultas no DW sero realizadas atravs da ferramenta OLAP Oracle Discoverer verso 3.1, ferramenta j adotada pela empresa.

4 REVISO DA LITERATURA

Neste captulo ser apresentada a introduo a Banco de Dados e tambm tecnologia Data Warehouse com abordagem ao Modelo Dimensional.

4.1 BANCO DE DADOS

Com o advento da Informtica e a conseqente informatizao das atividades nas empresas, surgiu a necessidade de armazenamento de dados em meio magntico, seja este atravs de fitas ou discos magnticos. Para Date (2003, p. 13) [...] a palavra dados vem da palavra latina datu que significar dar; sendo assim, dados so na realidade fatos dados, a partir dos quais podem ser inferidos fatos adicionais.. Ento, um fato dado corresponde ao que os matemticos chamam de proposio verdadeira. Proposies em lgica algo que pode assumir dois valores verdadeiro ou falso. Os dados so armazenado em campos, que informalmente a menor unidade de dados armazenados. O banco de dados contm vrias ocorrncias de cada um dos diversos tipos de campos armazenados. Um registro armazenado uma coleo de campos armazenados relacionados entre si. Um arquivo armazenado a coleo de todas as ocorrncias existentes de um nico tipo de registro armazenado. (DATE, 2003, p. 20). At a dcada de 70 os dados eram armazenados em arquivos separados por sistema, onde cada um destes sistemas possua programas especficos para extrair e gravar as informaes nestes arquivos. Este sistema de processamento de arquivos apresentava vrias desvantagens, tais como: inconsistncia e redundncia de dados; dificuldade de acesso aos dados; problemas de integridade; anomalias no acesso concorrente; problemas de segurana. (SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 2).

10

Com o objetivo de solucionar estes problemas, a partir do incio da dcada de 70, surgiram os Bancos de Dados e os Sistemas de Gerncia de Banco de Dados (SGBD). O banco de dados, por si s, pode ser considerado como o equivalente eletrnico de um armrio de arquivamento, ou seja, ele um repositrio ou recipiente para uma coleo de arquivos de dados computadorizados.. (DATE, 2004, p. 3). Segundo Yong (1984, p. 39), um Banco de Dados um conjunto de dados estruturado de maneira adequada de forma que pode ser utilizado em eficincia por uma diversidade de aplicaes dentro de uma organizao. Heuser (2000, p. 3) define banco de dados como sendo um [...] conjunto de arquivos integrados que atendem a um conjunto de sistemas. [...] cada informao armazenada uma nica vez, sendo acessada pelos sistemas que dela necessitam.. Os dados no banco de dados so integrados e compartilhados, ou seja, no existe redundncia de arquivos de dados, estes so unificados; e vrios usurios podem ter acessos aos mesmos dados, inclusive ao mesmo tempo. (DATE, 2004, p. 7). Num banco de dados as informaes pertinentes aos sistemas informatizados so armazenadas de forma estruturada em arquivos que se relacionam entre si. Alm dos dados essenciais e de interesse do usurio o banco de dados tambm armazena dados secundrios, tais como: informaes sobre o relacionamento entre os dados essenciais; dados de estrutura; ndices; informaes sobre controle de segurana e privacidade; dicionrio de dados. (YONG, 1984, p. 40). Vrias operaes podem ser realizadas no banco de dados. Date (1991, p. 3) descreve algumas destas operaes:

11

a) b) c) d) e)

A adio de novos (vazios) arquivos ao banco de dados; A insero de novos dados nos arquivos existentes; A recuperao de dados dos arquivos existentes; A atualizao de dados nos arquivos existentes; A eliminao de dados nos arquivos existentes; f) A renovao permanente de arquivos existentes (vazios ou outros) ao banco de dados.

De acordo com Date (2004, p. 16), o banco de dados apresenta vrias vantagens em relao ao sistema de processamento de arquivos:

a) b) c) d) e) f) g)

Os dados podem ser compartilhados; A redundncia pode ser reduzida; A inconsistncia pode ser evitada (at certo ponto); O suporte a transao pode ser fornecido; A integridade pode ser mantida; A segurana pode ser reforada; Os padres podem ser impostos.

4.1.1 Sistema de Gerncia de Banco de Dados

O sistema de gerncia de banco de dados tem como objetivo a administrao do banco de dados. Para que isto ocorra, este sistema possui vrias funcionalidades (programas) que executam diversas tarefas. O SGBD um software que incorpora as funes de definio, recuperao e alterao de dados em um banco de dados. As aplicaes desenvolvidas para atender s necessidade dos usurios, no tm acesso diretamente ao banco de dados, ou seja, toda consulta, alterao ou armazenamento de dados realizado pelo SGBD, que tem o total controle destas funes. (YONG, 1984, p. 18). Segundo os autores Silberschatz, Korth e Sudarshan (1999, p. 4) um SGBD uma coleo de arquivos e programas inter-relacionados que permitem ao usurio o acesso para consultas e alteraes desses dados.. Porm, os usurios possuem uma viso abstrata dos dados sem informaes de como estes so armazenados ou manipulados no banco de dados. (SILBERSCHATZ; KORTH;

12

SUDARSHAN, 1999, p. 4). Date (2003, p. 3) define o SGBD como sendo um programa que possibilita aos usurios criarem e manipularem uma base de dados. Um SGBD um sistema de software de fins gerais que facilita o processo de construir, manipular e definir bases de dados de diversas aplicaes. Para definir uma base de dados, Date (2003, p. 3) diz que necessrio especificar os tipos de dados a serem armazenados nesta base e que construir uma base de dados o processo de armazenar os dados em algum meio que seja controlado pelo SGBD. Manipular uma base de dados indica a utilizao de funes como a de consulta, para recuperar dados especficos, modificao da base de dados para refletir mudanas (inseres, atualizaes e remoes), e gerao de relatrios.. Alm da funo principal de manipulao e manuteno dos dados, o SGBD deve tambm proporcionar a segurana das informaes do banco de dados, conforme enfatizam os autores Silberschatz, Korth e Sudarshan (1999, p. 1):

O principal objetivo de um SGBD proporcionar um ambiente conveniente quanto eficiente para a recuperao e armazenamento das informaes de banco de dados. Sistemas de banco de dados so projetados para gerir grandes volumes de informaes. O gerenciamento de informaes implica a definio das estruturas de armazenamento das informaes e a definio dos mecanismos para a manipulao dessas informaes. Ainda, um sistema de banco de dados deve garantir a segurana das informaes armazenadas contra eventuais problemas com o sistema, alm de impedir tentativas de acesso no autorizadas.

Os SGBDs so classificados em sistemas grandes e pequenos, sendo que os sistemas grandes geralmente so multiusurios e os sistemas pequenos so monousurios. Sistemas monousurios so aqueles que apenas um usurio pode ter acesso ao banco de dados ao mesmo tempo, enquanto que num sistema multiusurio vrios usurios podem acessar o banco de dados no mesmo momento. (DATE, 2003, p. 6). Segundo Date (2003, p. 15), as vantagens de um SGBD em relao aos mtodos tradicionais baseados em papel, para manuteno dos registros so:

13

densidade, velocidade, atualidade, proteo e menor trabalho montono. Essas vantagens se sobressaem no ambiente multiusurio, onde o banco de dados maior e mais complexo que no ambiente monousurio. O sistema multiusurio conta com uma vantagem adicional predominante, referindo-se ao fato de que [...] o sistema de banco de dados proporciona empresa o controle centralizado de seus dados..

4.1.2 Modelo de Banco de Dados

Silberschatz, Korth e Sudarshan (1999, p.7) afirma que sob a estrutura do banco de dados est o modelo de dados: um conjunto de ferramentas conceituais usadas para a descrio de dados, relacionamentos entre dados, semntica de dados e regras de consistncia.. O modelo de dados descreve a estrutura de um banco de dados, ou seja, descreve as informaes sobre os dados que esto armazenados no Banco de Dados, mas no informa quais so estes dados. (HEUSER, 2000, p. 5). Conforme afirma Heuser (2000, p. 5), o nvel de abstrao do modelo de banco de dados vai de acordo com quem ir utilizar o mesmo:

Para o usurio final poder ser mais abstrato, pois no conter detalhes sobre a representao em meio fsico das informaes. Para um analista de sistemas ser menos abstrato e conter mais detalhes de como as informaes esto organizadas internamente.

Normalmente, no projeto de banco de dados, so considerados dois nveis de abstrao de modelo de dados: a) Modelo Conceitual O modelo conceitual descreve que dados podem estar armazenados no banco, porm no descreve como estes dados esto armazenados sob o ponto

14

de vista de SGBD. (HEUSER, 2000, p. 6). Yong (1984, p. 40) define o modelo conceitual como sendo o "modelo lgico de dados representativo das informaes (textuais) e, em ltima anlise, um modelo simblico do mundo fsico. . b) Modelo Fsico O modelo fsico descreve a estrutura do banco de dados de acordo com a viso do usurio de SGBD. (HEUSER, 2000, p. 7). Na viso de Yong (1984, p. 40) o modelo fsico de dados " a estrutura de dados armazenada no meio fsico que contm o Banco de Dados..

4.1.2.1 Tipos de modelos de dados

Vrios modelos de dados surgiram desde que foram criados os sistemas gerenciadores de banco de dados. Porm o modelo Relacional tem sido o mais usado at o momento. Recentemente, outros modelos esto sendo concebidos para atender as novas aplicaes que esto surgindo. Nesta seo ser apresentado o conceito bsico dos principais modelos de dados existentes e descritos alguns dos modelos que esto surgindo para as novas aplicaes. a) Modelo Rede Conforme demonstrado na figura 1, o modelo Rede uma coleo de registros relacionados uns aos outros atravs de links (ligaes). Um link associa somente dois registros. Cada registro possui vrios campos ou atributos, que contm somente um valor. Estes registros so organizados no banco de dados por um conjunto arbitrrio de grficos. (SILBERSCHATZ; KORTH; SUDARSHAN, 1999,

15

p. 9).

Figura 1 Modelo Rede Fonte: SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 10

Segundo Yong (1984, p. 105), o modelo Rede [] utiliza o conceito de associao como unidade bsica, sendo que a partir de determinado registro, as ligaes com outros registros so predefinidas, possibilitando assim a navegao entre os registros do banco de dados. b) Modelo Hierrquico A figura 2 demonstra que o modelo Hierrquico similar ao modelo Rede, pois tambm se utiliza de ligaes entre os registros e cada registro possui vrios campos ou atributos, que contm somente um valor. Porm, neste modelo a organizao na forma de rvore. (SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 751). Para Yong (1984, p. 105), o modelo Hierrquico uma rvore de registro organizada em diferentes nveis, onde a associao entre 2 registros em nveis consecutivos nica.

16

Figura 2 Modelo Hierrquico Fonte: SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 11

c) Modelo Relacional Durante as dcadas de 50 e 60 grandes empresas desenvolveram produtos de definio de dados. Com isso surgiram os sistemas gerenciadores de banco de dados Hierrquico e de Rede. Nos modelos de Rede, um tipo de registro, est envolvido em mais de um relacionamento. O modelo Hierrquico incompleto, pois s permite a um registro estar envolvido em apenas um relacionamento. Tanto o modelo Rede como o modelo Hierrquico, eram navegacionais, ou seja, o usurio poderia iniciar de um registro pai ou proprietrio, e navegar atravs do relacionamento at obter o prximo, o primeiro ou o ltimo. No modelo de Rede, o relacionamento membro-proprietrio e no modelo Hierrquico, relacionamento paifilho, eram armazenados visivelmente nos registros de banco de dados. Isso significava que esses modelos no tinham independncia fsica, e a viso do usurio refletia o modo pelo qual os dados eram armazenados, organizados e acessados pelo meio fsico de armazenamento. Buscando sanar alguns dos problemas que estes modelos apresentavam, no inicio dos anos 70 o Dr. E. F. Codd introduziu o modelo de dados Relacional. (KHOSHAFIAN, 1994, p. 4, p. 19).

17

Conforme demonstrado na figura 3, o modelo Relacional utiliza um conjunto de tabelas para armazenar os dados e tambm o relacionamento entre eles. Cada tabela contm vrias colunas, e assim como a tabela a coluna possui nome nico. (SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 9). Na definio de Yong (1984, p. 106) o modelo Relacional [] utiliza a relao matemtica como unidade bsica. Para tanto, utiliza a teoria dos conjuntos como a base formal para a descrio de modelos de dados.. Segundo Khoshafian (1994, p. 19) o modelo Relacional beseia-se na lgebra relacional que [...] consiste em somente algumas operaes: estabelecer operaes (unio, interseo, diferena, produto cartesiano) e operaes relacionais (seleo, projeo, unio).. A partir da dcada de 80 este modelo se tornou um padro internacional, e atualmente a maioria das aplicaes comerciais so desenvolvidas sobre o modelo de dados Relacional.

Figura 3 Modelo Relacional Fonte: SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 10

18

d) Modelo Orientado a Objetos O modelo Orientado a Objetos est baseado num conjunto de objetos. Um objeto pode conter informaes que so armazenadas em variveis instncias no prprio objeto. O objeto tambm possui mtodos que so funcionalidades codificadas para operar esse objeto. [...] Conceitualmente todas as interaes entre um objeto e o resto do sistema so via mensagens. Ento, a interface entre um objeto e o resto do sistema definida por um conjunto de mensagens permitidas. (SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 251). e) Modelo para Novas Aplicaes Conforme descrevem os autores Silberschatz, Korth e Sudarshan (1999, p. 250, p. 701, p. 704, p. 712, p. 714, p. 726, p.731, p. 737), atualmente novos modelos de dados esto sendo propostos para atender s novas aplicaes que esto surgindo e so limitadas por restries do modelo Relacional, pois a estrutura de dados destas novas aplicaes est fora dos modelos convencionais. A seguir so descritas algumas destas novas aplicaes, segundo estes autores: Computer-Aided armazena dados Software Engeneering para (CASE) apoiar os

necessrios

desenvolvedores de software; Banco de Dados Multimdia armazena imagens, dados espaciais, dados de udio, dados de vdeo e afins; Office Information Systems (OIS) - armazena informaes relacionadas a escritrio, tais como: calendrios de compromissos, documentos, contedos de documentos; Banco de Dados Hipertexto armazena textos com links que apontam para outros documentos; documentos estruturados de forma especfica que ajudam a index-los; Sistema de Suporte Deciso este sistema pesquisa informaes em banco de dados com grande volume de dados de diferentes fontes. Para que estas pesquisas se tornem mais eficientes so construdos Data Warehouse

19

(depsito de dados) e Data Mining (minerao ou extrao de dados). Data Warehouse contm informaes de diferentes fontes, que esto armazenadas em um nico banco de dados por um longo perodo de tempo, permitindo gerar consultas de forma consolidada para suporte deciso. Data Mining realiza a extrao de informaes, buscando descobrir automaticamente regras e modelos estatsticos a partir de um grande volume de dados; Banco de Dados Espaciais armazena informaes relacionadas a localizaes espaciais. Os dois tipos mais importantes so: Computer-Aided Design (CAD) que armazena dados referente a um projeto de engenharia (prdios, carros, avies e outros), e Banco de Dados Geogrficos que armazena informaes geogrficas, como mapas; Banco de Dados Mveis (Mobile Databases) utilizado por aplicaes destinadas a servios de entrega, servios de emergncia, servios de coleta de dados, vendedores, entre outros, e fazem uso da computao mvel, sem fio, como laptops, notebooks, etc. ; Sistema de Informaes Distribudas gerencia o acesso a informaes distribudas em vrios servidores remotos, onde os dados esto organizados em diretrios de forma hierrquica. Como exemplo tem-se a World Wide Web (www); Como demonstrado neste captulo, existem diversos modelos de banco de dados. Porm, para auxiliar as empresas na tomada de decises existem os Sistemas de Suporte Deciso, que o foco deste trabalho de pesquisa. A seguir ser apresentada uma breve explanao sobre os Sistemas de Suporte Deciso.

20

4.2 SISTEMAS DE SUPORTE DECISO

Constantemente as empresas esto tomando decises sobre seus negcios: decises sobre marketing, finanas, investimentos, objetivos estratgicos, etc. Toda deciso se apia em informaes, sejam estas, previses de comportamento do mercado, informaes sobre fatos histricos, etc. As empresas de um modo geral possuem muitos dados que ao longo do tempo foram registrando com relao s suas atividades: compras, vendas, aplicaes, informaes cadastrais de clientes, fornecedores, produtos, etc. Todos estes dados histricos constituem a matria-prima a ser transformada em informaes para auxiliar na tomada de decises. Desde o surgimento, e cada vez mais, os Sistemas de Informao, e tambm os Bancos de Dados, so utilizados e aperfeioados para suportar e processar toda esta gama de dados histricos, apoiando as decises das empresas. Os sistemas de apoio deciso so sistemas que ajudam na anlise de informaes do negcio. Sua meta ajudar a administrao a definir tendncias, apontar problemas e tomar... decises inteligentes. (DATE, 2004, p. 590). Estes sistemas utilizam dados operacionais do negcio da empresa, transformando-os em informaes que auxiliam na toma de decises. Na viso de Silberschatz, Korth e Sudarshan (1999, p. 703) grandes bancos de dados podem ser vistos como verdadeiros tesouros de informaes para tomada de deciso, como que itens estocar ou que desconto oferecer.. A partir do final dos anos 60 comeou-se a utilizar computadores para ajudar no processo de tomada de decises. Nos anos 70 vrios sistemas de apoio deciso foram desenvolvidos, porm utilizando-se arquivos de dados bastante simples, e no incio da dcada de 80 os bancos de dados comearam a ser usados para fins de apoio deciso. (DATE, 2004, p. 590-591).

21

4.2.1 Data Warehouse

Segundo Inmon (apud DwBrasil, 2007), Data Warehouse uma coleo de dados orientados por assuntos, integrados, variveis com o tempo e no volteis, para dar suporte ao processo de tomada de deciso. Kimball (apud DwBrasil, 2007) define Data Warehouse como um conjunto de ferramentas e tcnicas de projeto, que quando aplicadas s necessidades especficas dos usurios e aos bancos de dados especficos permitir que planejem e construam um data warehouse. Para os autores Silberschatz, Korth e Sudarshan (1999, p. 713) um data warehouse um repositrio (ou arquivo) de informaes coletadas em diversas fontes, armazenadas sob um esquema nico, em um s local. Uma vez coletados, os dados so armazenados por um perodo longo, permitindo o acesso a dados histricos.. Date (2004, p. 603) afirma que [...] os dados de apoio deciso normalmente precisam ser reunidos a partir de uma variedade de sistemas operacionais (freqentemente, sistemas divergentes) e mantidos em um depsito de dados prprio [...] e define que [...] esse depsito de dados separado um data warehouse.. A maioria das empresas possui diversas fontes de informaes que so utilizadas por seus profissionais para tomar decises. Estas informaes podem estar armazenadas em diferentes formatos: algumas em bancos de dados, outras em arquivos textos, planilhas eletrnicas, etc., porm para serem utilizadas com eficincia e agilidade, as mesmas necessitam ser armazenadas em um mesmo esquema de banco de dados. Desta forma possvel fornecer aos usurios uma interface nica para consultar estas informaes. Alm disto, as diversas fontes de informaes, na maioria das vezes, mantm somente dados atuais, mas para auxiliar a tomada de decises os dados histricos so essenciais. O data warehouse surgiu justamente para armazenar grandes volumes de dados (histricos e atuais).

22

(SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 703-704, p. 712-713). Normalmente as fontes de informaes esto em sistemas transacionais em tempo-real, tambm conhecido por On-line Transaction Processing (OLTP) ou Processamento de transaes em tempo-real. So sistemas que registram todas as transaes ocorridas em uma determinada operao organizacional: venda, compra, reservas, pedidos, etc. Estas informaes so extradas destes sistemas e carregadas no data warehouse, podendo ser de forma analtica ou consolidada por determinadas informaes, por exemplo: quantidade total e valor total vendido por produto, filial e ms. Uma vez carregadas estas informaes no data warehouse, as mesmas no so alteradas, salvo em caso de necessidade de correes. Portanto os dados esto disponveis somente para consultas. (WIKIPDIA, 2007). Estando as informaes em uma base de dados diferente da base utilizada pelos sistemas transacionais, estes no so afetados pelas consultas de suporte deciso, que geralmente exigem uma elevada capacidade de processamento, pois normalmente so consultas complexas que acessam um grande nmero de registros, devido ao armazenamento de dados histricos de muitos anos que podem estar detalhados ou resumidos. (DWBRASIL, 2007; SILBERSCHATZ; KORTH; SUDARSHAN, 1999, p. 713). Conforme afirma Date (2004, p. 603):

Os data warehouses surgiram por duas razes: primeiro, pela necessidade de fornecer uma origem de dados nica, limpa e consistente para fins de apoio deciso; segundo, pela necessidade de faz-lo sem causar impacto sobre os sistemas operacionais.

Uma vez armazenados os dados no data warehouse, existem vrias ferramentas que podem ser utilizadas na explorao destes dados, porm a mais popular a OLAP. OLAP uma abordagem tecnolgica para gerar respostas rpidas a consultas analticas de natureza tipicamente dimensional.. (WIKIPDIA,

23

2007). Esta ferramenta muito utilizada na gerao de relatrios de negcios, de previses, de finanas, gerenciais e reas afins.

4.2.2 Modelo Dimensional

O Modelo Dimensional tambm conhecido como Modelo Estrela ou Star Join Schema foi concebido por Ralph Kimball com o objetivo de se criar estrutura de dados mais geis e simples do que o modelo de dependncia de dados dos sistemas transacionais, que por sua vez possuem regras rgidas de normalizao, dificultando a compreenso do usurio final e as respostas s consultas realizadas. Conforme afirma Kimball (1998, p. XVIII) modelagem dimensional um nome novo para uma tcnica antiga usada para criar bancos de dados simples e compreensveis.. Segundo Kimball (1998, p. 10) Modelo Dimensional uma estrutura simples de cubos de dados que atende s necessidades de simplicidade do usurio final.. Visualizando-se o banco de dados como um cubo com vrias dimenses possvel fatiar este cubo em qualquer de suas dimenses. (KIMBALL, 1998, p. XVIII). O Modelo Dimensional permite s pessoas pensarem sobre os negcios nos termos simples de dimenses como tempo, mercado e produto.. (OLIVEIRA, 1998, p. 27). A figura 4 apresenta a viso do banco de dados como um cubo com dimenses.
Por Loja Por Perodo

Quantidade e valor total de vendas Por Produto

Figura 4 Cubo de dados com dimenses

Tanto o Modelo Dimensional como o modelo de dependncia de

24

dados armazenam os mesmos dados e so capazes de suportar a mesma anlise final do negcio, porm o Modelo Dimensional permite uma apresentao diferenciada dos dados. O Modelo Dimensional o modelo top-down (de cima para baixo) e o modelo de dependncia de dados o do tipo botton-up (de baixo para cima).. (KIMBALL, 1998, p. XX). Segundo Oliveira (1998, p. 27) o Modelo Dimensional muito mais vantajoso para o projeto de um data warehouse porque mais eficiente e econmico em termos de performance.. A modelagem dimensional tem como objetivo levantar as

necessidades de uma determinada rea de negcio e a partir dos dados existentes em diversas fontes, consolid-los por diferentes dimenses (vises) do usurio final. Conforme demonstrado na figura 5, no Modelo Dimensional existe uma tabela dominante no centro do diagrama que se relaciona com outras tabelas. Cada uma das tabelas secundrias possui apenas uma juno com a tabela central. A tabela central chamada de tabela de fatos e as outras de tabela de dimenso. Esta construo simples permite o armazenamento e pesquisa em grandes tabelas de fatos. (KIMBALL, 1998, p. 10; OLIVEIRA, 1998, p. 29).

Produto
Chave Produto Descrio Categoria

Loja
Chave Loja Nome Endereo Cidade

Tempo
Chave Tempo Data Ms Dia Ano

Fato Vendas
Chave Tempo Chave Produto Chave Loja Qtd vendas Qtd itens venda Valor vendas Valor descto Preo mdio Etc...

Figura 5 Tabela de Fatos e as tabelas de Dimenses

Na tabela de fatos devem ser armazenados as medies numricas do negcio, que foram extrados dos sistemas operacionais ou transacionais. Esta

25

tabela possui uma chave primria composta de atributos que so chave de tabela dimensional. Segundo Kimball (1998, p. 11) os melhores fatos e mais teis so numricos, continuamente valorados (diferentes a cada medida) e aditivos (podem ser adicionados s diversas dimenses).. Desta forma, melhora-se a performance do data warehouse, pois ao invs de pesquisar milhes de registros para responder a uma determinada consulta, sero pesquisados somente algumas dezenas de registros cuja informao estar sumarizada de acordo com as dimenses existentes. No caso de fatos semi-aditivos a sumarizao somente poder ocorrer ao longo de algumas dimenses, e para os fatos no-aditivos deve-se realizar contagens se for necessria a sumarizao dos registros. (KIMBALL, 1998, p. 12). Na tabela de dimenso deve conter as descries textuais das dimenses do negcio. Esta tabela se refere a uma dimenso que se queira analisar, e seus atributos servem de restrio de uma consulta ou como cabealho de linha no resultado da consulta. So tabelas denormalizadas que possuem uma chave que liga tabela de fatos. (KIMBALL, 1998, p. 13; OLIVEIRA, 1998, p. 29). De acordo com Kimball (1998, p. 162) existem nove pontos de deciso no projeto de um banco de dados completo para um data warehouse:

1. Os processos e, portanto, a identidade das tabelas de fatos; 2. A granularidade (nvel de detalhe) de cada tabela de fatos; 3. As dimenses de cada tabela de fatos; 4. Os fatos, incluindo os fatos pr-calculados; 5. Os atributos da dimenso com descries completas e terminologia apropriada; 6. Como rastrear dimenses de modificao lenta; 7. Os agregados, dimenses heterogneas, minidimenses, modos de consulta e outras decises de armazenamento fsico; 8. A amplitude de tempo do histrico de banco de dados; 9. Os intervalos em que os dados so extrados e carregados no data warehouse;

O Modelo Dimensional um dos mais utilizados para modelagem dos sistemas de suporte deciso. Atualmente, o data warehouse um grande aliado das empresas e profissionais na tomada de decises. Diante da rpida e constante mudana das regras de mercado os sistemas de suporte a deciso pea

26

fundamental para apoiar as decises, por sua capacidade de sumarizar e analisar grandes volumes de dados. Utilizando esta tecnologia as empresas podero descobrir novas formas de trabalhar seu negcio. Podero criar novas tendncias de mercado, servios e produtos, de forma gil, ajudando na disputa do mercado que est cada vez mais exigente e competitivo.

27

5 CRONOGRAMA DAS ATIVIDADES

Atividades Elaborao do Projeto da Monografia Reviso de Literatura Especificao do Projeto Desenvolvimento do Projeto Validao do Projeto (estudo de caso) Redao da Monografia

Fev/07 Semanas

Mar/07 Semanas

Abr/07 Semanas

Mai/07 Semanas

Jun/07 Semanas

Jul/07 Semanas

Ago/07 Semanas

28

6 CONCLUSO

Com o desenvolvimento deste trabalho ser possvel se aprofundar em um dos temas da rea de Banco de Dados que o Data Warehouse, tambm ter um conhecimento mais detalhado dos assuntos relacionados a este tema, como: Sistemas de Suporte a Deciso, Data Mart, Data Mining, ETC, e ferramentas OLAP. Com este projeto ser validado o Modelo Dimensional, atravs de um estudo de caso para o domnio em Telecomunicaes, reafirmando os conhecimentos tericos adquiridos na reviso de literatura. O estudo de caso tambm atender a necessidade de informaes, existente atualmente na Sercomtel, com relao a utilizao do produto pr-pago.

29

REFERNCIAS

DATE, C. J.. Introduo a Sistemas de Banco de Dados. 4. ed. Rio de Janeiro: Campus Ltda., 1991. 674 p. ______. Introduo a Sistema de Banco de Dados. 8. ed. Rio de Janeiro: Editora Campus, 2003.

______. Introduo a Sistemas de Banco de Dados. 8. ed. Rio de Janeiro: Campus Ltda., 2004. 865 p.

DWBRASIL. DwBrasil. Disponvel em: <http://www.dwbrasil.com.br/html/dw.html>. Acesso em: 19 fev. 2007.

FIERLI, Agla de Lima; REIS, Prof Marcia Cristina dos. Manual de Normas e Padres para Trabalhos Acadmicos da UNOPAR (De Acordo com a Associao Brasileira de Normas Tcnicas ABNT). Disponvel em: <http://www.unopar.br/bibli01/abnt.htm>. Acesso em 18 nov. 2006. ______. Apresentao de Referncias NBR 6023 ago. 2002, e elementos de apoio ao texto. Disponvel em: <http://www.unopar.br/bibli01/abnt.htm>. Acesso em 18 nov. 2006. HEUSER, Carlos Alberto. Projeto de Banco de Dados. 3. ed. Porto Alegre: Sagra Luzzatto, 2000. 204 p. KHOSHAFIAN, Setrag. Banco de Dados Orientado a Objetos. Rio de Janeiro: Infobook, 1994. 162 p. KIMBALL, Ralph. Data Warehouse Toolkit Tcnicas para construo de Data Warehouses Dimensionais. So Paulo: Makron Books, 1998. 388 p. OLIVEIRA, Adelize Generini de. Data Warehouse Conceitos e Solues. Florianpolis: Advanced Editora, 1998. 88 p. SILBERSCHATZ, Abraham; KORTH, Henry F.; SUDARSHAN, S. Sistema de Banco de Dados. 3. ed. So Paulo: Makron Books, 1999. 778 p.

30

WIKIPDIA. Wikipdia, a enciclopdia livre. Disponvel em: <http://pt.wikipedia.org/wiki/Armaz%C3%A9m_de_dados>. Acesso em: 19 fev. 2007. YONG, Chu Shao. Banco de Dados Organizao, Sistemas e Administrao. So Paulo: Atlas S.A., 1984. 398 p.

Você também pode gostar