Você está na página 1de 10

OLAP

Trabalho Acadmico dos Cursos de Tecnologia em Redes de Computadores e Tecnologia em Sistemas de Informao apresentado Faculdades Integradas Esprito Santense - Faesa, como parte das exigncias da disciplina Fundamentos de Sistema de informao sob orientao da professora Danielli Veiga Carneiro.

VITRIA 2008

1 INTRODUO
O uso da tecnologia da informao permitir o armazenamento de grande volume de dados em meio magntico, causando a necessidade de recuper-los e analis-los. As aplicaes On-Line Transaction Processing (OLTP) atendem, apenas a

2 manipulao de dados operacionais, o que no era suficente para apoiar o usurio na tomada de decises estratgicas. A partir dos requisitos dos usurios e de tecnologias existentes, foram elaborados conceitos e desenvolvidas solues que alavancassem o processo de Business Inteligence(BI). A primeira das solues foi a linguagem APL, base utilizada no desenvolvimento de aplicaes On-line Analytical Processing (OLAP). O armazenamento dos dados para atender s necessidades destas aplicaes, conforme atestou E.F.Codd, no seria solucionado por bancos de dados relacionais. Desta forma, novos conceitos de armazenamento de informaes foram implementados atravs de bancos de dados nomeados de Data Warehouse (DW). Hoje o usurio j tem todas estas tecnologias implementadas por vrios fornecedores. Alm do suporte para a tomada de deciso estratgica, surgiu a necessidade de aplicao de heurstica para obter informaes que direcionem o futuro dos negcios, e estas esto sendo implementadas atravs de ferramentas de Data Mining (DM).

2 ORIGEM
A base da anlise Multidimensional para OLAP no nova. De fato, ela remonta a 1962, com a publicao do livro A Programming Language, de Ken Iverson [1]. A IBM desenvolveu e implementou a primeira linguagem com anlise multidimensional, no fim da dcada de 60, chamada de APL. Definida matematicamente, baseada em smbolos gregos, utilizadas por usurios finais e grande consumidora de recursos, foi amplamente utilizada nas dcadas de 80 e 90 em aplicaes de negcio. Acompanhando a evoluo dos sistemas, na dcada de 90, introduziu-se uma nova classe de ferramentas no mercado, que foi batizada de OLAP. As ferramentas de OLAP possuem a maioria dos conceitos introduzidos pela linguagem APL, porm, com maior integrao na utilizao dos dados fontes. Existe um grupo de empresas que desenvolveru e ainda desenvolve engine de OLAP e arquiteturas nela baseada como a IBM, a Computer Associates, MicroSoft, MicroStrategy, Cognos, IRI, Oracle, entre outras.

3 O QUE OLAP?

3 OLAP (On-Line Analytical Processing) uma categoria de aplicaes e tecnologias usada para agrupar, gerenciar, processar e apresentar dados multidimensionais com o alvo para anlise e gerenciamento. A aplicao OLAP soluciona o problema de sntese, anlise e consolidao de dados, pois o processamento analtico online dos dados. Tem capacidade de vizualizaes das infomaes a partir de muitas perspectivas diferentes, enquanto matm uma estrutura de dados adequada e eficiente. A visualizao realizada em dados agregados, e no em dados operacionais porque a aplicao OLAP tem por finalidade apoiar os usurios finais a tomar decises estratgicas. Os dados so apresentados em termos de medidas e dimenso, a maior parte das dimenses hierrquica. Considerando as aplicaes bancrias utilizadas diariamente no controle de contas correntes, na qual so efetuados saques ou depsitos pelos correntistas, se tem o exemplo tpico de sistema de OLTP. O interesse destes usurios criar, atualizar e recuperar informaes sobre registros individuais. J para o Gerente de Conta Correntes os requisitos de uso de informaes dos dados das contas tem por finalidade a anlise global de contas correntes com diversas vises. Por exemplo, o Gerente de Contas pode requer uma anlise sobre o desempenho de contas correntes que tenham cheque especial e tenham utilizado o valor mximo dos mesmos em um determinado perodo de tempo em algumas regies. Obter a resposta a esta consulta mais complexa fazendo uso de ferramentas relacionais padro, no fornece soluo requerida. Analisando as limitaes do uso de ferramentas relacionais padro, E.F. Codd disse: Ter um RDBMs no significa ter a nirvana instantnea de suporte a deciso. Mesmo com tantas possibilidades que os RDBMs tm oferecido aos usurios, eles nunca pretenderam fornecer poderosas funes de sntese, anlise e consolidao de dados.(Computerworld, 1993) [2]. O termo OLAP foi descrito por E. F. Codd em 1992, atravs de 12 regras utilizadas para identificar as funcionalidades que os produtos assim apontados devem conter: 1 - Conceito de viso multidimensional; 2. Transparncia;

4 3. 4. 5. 6. 7. 8. 9. Acessibilidade; Performance consistente de relatrio; Arquitetura cliente/servidor; Dimensionamento genrico; Tratamento dinmico de matrizes esparsas; Suporte a multiusurios; Operaes de cruzamento dimensional irrestritas;

10. Manipulao de dados intuitiva; 11. Relatrios flexveis; 12. Nveis de dimenses e agregaes ilimitados. Alm destas regras o Gartner Group acrescentou mais nove: 1. 2. 3. 4. 5. 6. 7. 8. 9. Dados Arrays mltiplos; OLAP joins; Ferramentas para gerenciar as bases de dados; Armazenar objetos; Seleo de subconjuntos; Detalhe drill-down em nvel de linha Suporte a dados locais; Reflesh incremental das bases de dados; Interface SQL.

5 No OLAP as respostas no so automatizadas, trata-se de um procedimento mais interativo, onde o usurio faz perguntas, recebe informaes, verifica um dado especfico e faz comparaes.

4 BENEFCIOS DO OLAP
OLAP abastece para organizaes um procedimento de acessar, visualizar, e analisar dados corporativos com alta flexibilidade e desempenho. No mundo globalizado de hoje as empresas esto enfrentando grande concorrncia e expandindo sua atuao para novos mercados. Logo, a velocidade com que executivos obtm informaes e tomam decises determina a concorrncia de uma empresa e seu sucesso de longo prazo. OLAP apresenta informaes para usurios via um modelo de dados natural e intuitivo. Atravs de um simples estilo de navegao e pesquisa, usurios finais podem rapidamente analisar inmeros cenrios, gerar relatrios "ad-hoc", e descobrir tendncias e fatos relevantes independente do tamanho, complexidade, e fonte dos dados corporativos. De fato, colocar informao em bancos dados corporativos sempre foi mais fcil do que retir-los. Quanto maior e difcil a informao armazenada, mais complexo para retir-la. A tecnologia OLAP acaba com estas dificuldades levando a informao mais prxima ao usurio que dela necessite. Sendo assim, o OLAP freqentemente utilizado para unificar e disponibilizar informaes gerenciais contidas em bases de dados operacionais, sistemas ERP e CRM, sistemas contbeis, e Data Warehouses. Estas caractersticas tornaram-no uma tecnologia fundamental em vrios tipos de aplicaes de suporte deciso e sistemas para executivos.

5 TIPOS DE OLAP 5.1 OLAP MULTIDIMENSIONAL


MOLAP a forma clssica do OLAP e algumas vezes referida como simplesmente OLAP. MOLAP usa as estruturas de bancos de dados que so atributos genricos otimizados, como perodo de tempo, localidade, produto ou cdigo de conta. A forma como cada dimenso vai ser agregada definida a priori por uma ou mais hierarquias.

6 O termo OLAP foi citado pela primeira vez por E.F.Codd, quando ele definiu doze regras que estas aplicaes deveriam atender. A viso conceitual multidimensional dos negcios de uma empresa foi umas das regras citadas, a qual se tornou a caracterstica fundamental no desenvolvimento destas aplicaes. A viso multidimensional consiste de consultas que fornecem dados a respeito de medidas de desempenho, decompostas por uma ou mais dimenses dessas medidas. Podendo tambm serem filtradas pela dimenso e/ou pelo valor da medida. As vises multidimensionais fornecem as tcnicas bsicas para clculo e anlise requeridos pelas aplicaes de BI. Para se obter a viso multidimensional necessrio compreender outras caractersticas: Cubo uma estrutura que armazena os dados de negcio em formato multidimensional, tornando-os mais fcil de analisar. Dimenso uma unidade de anlise que agrupa dados de negcio relacionados. As dimenses se tornam cabealho de colunas e linhas, como exemplo linhas de produto, regies de venda ou perodos de tempo. Hierarquia composta por todos os nveis de uma dimenso, podendo ser balanceada ou no. Na hieraquia balanceada os nveis mais baixo so equivalentes, porm, isto no ocorre nas hierarquias no balanceadas onde a equivalncia hierrquica no existe. Por exemplo, em uma dimenso geogrfica o nvel pas no possui o subnvel Estado para um determinado membro e possui para outro. No caso especfico pode-se citar o pas Liechtenstein que no possui Estado e o Brasil, que possui uma srie de Estados. Membro um subconjunto de uma dimenso. Cada nvel hierrquico tem membros apropriados aquele nvel. Por exemplo, em uma dimenso geogrfica existe o nvel e seus membros. Medida uma dimenso especial utilizada para realizar comparaes. Ela inclue membros tais como: custos, lucros ou taxas.

5.2 OLAP RELACIONAL

7 ROLAP trabalha diretamente com bancos de dados relacionais. Os dados e as tabelas de dimenses so armazenadas como tabelas relacionais e novas tabelas so criadas para receber a informao agregada.

5.3 OLAP HIBRIDO


No h consenso claro na indstria sobre o que "OLAP Hbrido", exceto que um banco de dados vai dividir dados entre armazenamento relacional e especial. Para alguns fornecedores, por exemplo, um banco de dados HOLAP usa tabelas para manter as grandes quantidades de dados detalhados, e um armazenamento especializado para pelo menos alguns aspectos dos dados das quantidades menores, que so menos agregadas ou detalhadas.

6 BUSINESS INTELIGENCE
um mtodo de coleta, transformao, anlise e repartio de dados para melhorar a deciso de negcios. Sua infra-estrutura tecnolgica composta de data warehouses ou data marts, ferramentas OLAP, EIS, data mining, consultas e relatrios e software de visualizao dos dados, que so a infra-estrutura bsica de qualquer sistema de business intelligence. So neles que vo conter os dados que sero transformados em informaes competitivas.

7 ALGUNS CONCEITOS
Desktop OLAP - so produtos de preos pequenos ferramentas simples de OLAP que executam anlise multidimensional e apresentao de dados carregados para mquina cliente de bancos de dados relacionais ou multidimensionais. Denso - quando uma base de dados multidimensional apresenta uma percentagem relativamente alta de possveis combinaes das dimenses membros contendo dados com valores. Isto o oposto de esparsa. Drill down - mtodo de explorao de dados detalhados que foram usados na criao de um nvel sumarizado de dados. Os nveis de aprofundamento dependem da granularidade dos dados existentes no datawarehouse.

8 DSS (Sistemas de Suporte a Deciso) - so aplicaes feitas para analisar grande quantidade de dados e executar uma variedade de clculos e projees. EIS (Sistemas de Informaes para Executivos) - categoria de aplicao e tecnologia para apresentar e analisar dados corporativos e externos para propsito de gerenciamento. Neste tipo de aplicao as funcionalidades de anlise so muito limitadas. Esparsa - ocorre quando uma pequena poro (arbitrariamente, menor que 0,1%) de clula de dados potencialmente atualizados est ocupando uma estrutura multidimensional. HOLAP - um produto de OLAP hbrido que pode prover anlise multidimensional simultaneamente de dados armazenados em um banco de dados multidimensional e em um banco de dados relacional. MDDB ou MOLAP - um banco de dados multidimensional. Um produto que pode armazenar e processar dados multidimensionais, isto , proprietrio e no usa SQL, formando um ambiente muito fechado. Todo o processamento efetuado no servidor. Projetado para consultas complexas, traz mais performance, mas tem limitao de espao de armazenamento de dados. Multidimensional - uma estrutura de dados com trs ou mais dimenses independentes. Produtos OLAP - so os produtos capazes de prover anlises rpidas de parte das informaes multidimensionais. Anlises ad-hoc devem ser possveis ou com os prprios produtos ou com produtos de terceiros. Refresh - processo de extrair dados de um ambiente e de mover para outro ambiente, substituindo os dados antigos pelos novos. ROLAP - um produto relacional OLAP que permite a anlise multidimensional de dados, agrega e armazena dados em um SGBDR. O processamento multidimensional pode ser feito dentro do SGBDR, ou na camada de servidor ou no cliente. Os dados so recuperados do banco de dados quando solicitado pelo usurio e so gerados comandos SQL. Todo o processamento realizado no

9 servidor. lento para consultas difcil, mas um ambiente mais acessvel. H muita discusso para se saber qual o melhor ambiente. O ambiente multidimensional real normalmente tem uma performance excelente e necessita um servidor pequeno. O ambiente virtual tem menos duplicao de dados, possvel realizar o Data Mining no mesmo banco de dados, os dados so mais atualizados, e um banco de dados relacional pode armazenar mais do que um banco de dados multidimensional. Uma forte tendncia que est aparecendo no mercado o banco de dados multidimensional hbrido. Star Schema - um esquema de base de dados relacional para representar dados multidimensionais. O dado armazenado em uma tabela fato, com uma ou mais tabelas contendo informaes em cada dimenso. Snow Flake - uma instvel do Star Schema com tabelas dimenso normalizadas. Servidor OLAP - um engine de manipulao de dados multiusurio especialmente desenhado para suportar e operar estruturas de dados multidimensionais. Para admitir uma melhor classificao, as ferramentas OLAP esto divididas em ferramentas que utilizam um banco de dados multidimensional (MDDB) ou em ferramentas que armazenam os dados em bancos de dados relacionais. Outra diviso desta classificao seria o processamento realizado no cliente ou no servidor.

8 CONCLUSO
Recuperao e anlise de dados tm evoludo em sincronia, atravs das tecnologias de armazenamento, pois elas so integrante uma das outras. As ferramentas OLAP trabalham de modo interativo, admitindo que a partir de uma resposta o usurio faa outros questionamentos, isto , o usurio consiga analisar o porqu dos resultados que alcanar. Alm disto, uma ampla gama de fornecedores est investindo no desenvolvimento de aplicativos OLAP, pois cada vez mais se faz necessrio analisar as informaes que alavanquem os negcios das empresas com rapidez e eficincia. Com alta flexibilidade e performance, o OLAP equipar as organizaes um procedimento de acessar, visualizar e avaliar dados corporativos.

10 OLAP um conceito de interface com o usurio, no se trata de uma tecnologia de armazenamento de dados, mas de uma soluo, uma soluo de ambiente, integrao e modelagem de dados. Tanto OLAP como DM fazem partem do espectro das ferramentas de BI. Na utilizao de OLAP no existe a melhor estratgia. A melhor estratgia ser definida pelos requisitos de seu aplicativo.

9 REFERNCIAS
PENDSE, N. OLAP REPORT. OLAP Disponvel em: <http:// www.olapreport.com>. Acesso em:04 jun. 2008. Corey, M. et al. ORACLE. OLAP. Disponvel em: <http://www.pilotsw.com>. Acesso em: 04 jun. 2008. Plante, S. OLAP. Disponvel em: <http://www.pqqq.gouv.qc.ca/geoinfo/num/dec01_2.htm Acesso em:04 jun. 2008. WEB OPEDIA. OLAP. Disponvel em: <http:// www.webopedia.com>. Acesso em: 04 jun. 2008. WEB LIVRE. OLAP. Disponvel em: <http:// www.weblivre.net>. Acesso em: 04 jun. 2008. CHAUDHURI, S. OLAP, SIGMOD Record, New York, v.26, n 1, pg.65-74, Maro 1997.