Você está na página 1de 15

Oracle Database 11g para Data Warehousing e Business Intelligence

Um Artigo Tcnico da Oracle Setembro de 2008

Oracle Database 11g para Data Warehousing e Business Intelligence

Introduo .......................................................................................................... 3 Hardware ............................................................................................................ 4 HP Oracle Exadata Storage Server ............................................................ 4 HP Oracle Database Machine ..................................................................... 5 Integre ................................................................................................................. 6 Oracle Warehouse Builder ........................................................................... 6 Principais recursos de integrao do banco de dados ............................. 7 Realize ................................................................................................................. 8 Dimensione ................................................. Error! Bookmark not defined. Particionamento .......................................................................................... 10 Compresso ................................................................................................. 10 Real Application Clusters........................................................................... 11 Paralelismo ................................................................................................... 11 Analise ............................................................................................................... 11 Data Mining ................................................................................................. 12 OLAP ........................................................................................................... 13 Concluso ......................................................................................................... 14

Oracle11g for Data warehousing e Business Intelligence

Pgina 2

Oracle Database 11g para Data Warehousing e Business Intelligence

INTRODUO
A soluo de data warehousing da Oracle abrange um amplo conjunto de opes para bancos de dados e hardware, incluindo:

Oracle Warehouse Builder Oracle Partitioning Oracle Real Application Clusters Oracle OLAP Oracle Data Mining Oracle Management Packs HP Oracle Database Machine HP Oracle Exadata Storage Server

Veja informaes mais detalhadas sobre esses produtos em artigos tcnicos e folhas de dados adicionais, em www.oracle.com/database

O Oracle Database 11g uma abrangente plataforma de banco de dados para data warehousing e inteligncia de negcios que combina escalabilidade e desempenho lderes no setor, anlises profundamente integradas, integrao e qualidade de dados incorporadas, tudo na mesma plataforma, executada em uma infraestrutura de grid confivel e de baixo custo. O Oracle Database 11g proporciona a ltima gerao de recursos para data warehouses e datamarts, e uma escalabilidade comprovada at centenas de terabytes com desempenho insupervel. Ele tambm fornece uma plataforma integrada exclusiva para anlise. Ao incorporar OLAP, extrao de dados e recursos estatsticos diretamente no banco de dados, a Oracle proporciona todos os recursos de mecanismos de anlise independentes com a escalabilidade empresarial, a segurana e a confiabilidade de um banco de dados Oracle. Como a integrao dos dados um requisito bsico de qualquer data warehouse, o Oracle Database 11g inclui o Oracle Warehouse Builder, uma ferramenta lder de ETL que utiliza a transformao de dados escalveis e os recursos de acesso a dados heterogneos da Oracle. As solues de data warehouse da Oracle agora estendem-se aos componentes de hardware com o Oracle Exadata. A Oracle fornece uma soluo exclusiva de armazenamento de dados, os servidores de armazenamento HP Oracle Exadata, para data warehousing de alto desempenho e proporciona uma configurao completa de data warehouse com o HP Oracle Database Machine. Alm disso, o Oracle Optimized Warehouse Initiative oferece aos clientes a opo de configurao de referncias e sistemas otimizados de warehouse para diversos fornecedores de hardware. Este artigo tcnico proporciona uma viso geral dos recursos da Oracle para data warehousing e discute os principais recursos e tecnologias para que os sistemas de inteligncia de negcios e data warehouse baseados em Oracle iniciem com a plataforma correta, integrem as informaes, realizem pesquisas rpidas, sejam dimensionados para volumes de dados muito grandes e analisem quaisquer dados.

Oracle11g for Data warehousing e Business Intelligence

Pgina 3

HARDWARE

A fundao de uma soluo slida de data warehouse uma infraestrutura de hardware escalvel e de alto desempenho. Um dos desafios dos data warehouses tem sido fornecer a largura de banda de I/O necessria para consultas em larga escala, especialmente quando os volumes de dados e as cargas de trabalho do usurio aumentam continuamente. O Oracle Exadata proporciona uma soluo de armazenamento exclusiva e otimizada para data warehousing que fornece ganhos de desempenho em ordem de magnitude para consultas de data warehouse em larga escala. A tecnologia que permite esses ganhos de desempenho uma combinao de um grid de armazenamento paralelo massivo de grande largura de banda, com o recurso exclusivo de Smart Scan do Exadata, que realiza o processamento de SQL no servidor de armazenamento, e reduz imensamente a quantidade de trfego de I/O ao enviar somente as linhas e colunas necessrias de volta aos servidores de banco de dados. Existem dois membros da famlia de produtos Oracle Exadata. A base da famlia de produtos Exadata o HP Oracle Exadata Storage Server. Ele utilizado para criar solues de data warehousing usando servidores de banco de dados e infraestrutura fornecidos pelo cliente. O segundo membro da famlia de produtos Exadata o HP Oracle Database Machine. Essa mquina de banco de dados uma soluo completa e plenamente integrada para data warehousing que inclui todos os componentes para disponibilizar de forma rpida e fcil um data warehouse empresarial.
HP Oracle Exadata Storage Server

Um HP Oracle Exadata Storage Server um dispositivo de armazenamento de banco de dados que executa o software Exadata Storage Server fornecido pela Oracle. Os componentes de hardware do HP Oracle Exadata Storage Server foram cuidadosamente selecionados para atender s necessidade de processamento de consultas de alto desempenho, e ele baseado no servidor HP ProLiant DL180 G5. A clula j vem configurada com: dois processadores Intel quad-core de 2,66 GHz, doze discos conectados a um controlador inteligente de array de armazenamento com 512K de cache no voltil, 8 GB de memria, conectividade InfiniBand com duas portas, placa de gerenciamento para acesso remoto, todo o software j instalado e pode ser montado em um rack padro de 19 polegadas. So oferecidas duas verses do HP Oracle Exadata Storage Server. A primeira baseia-se em unidades de disco de 450GB Serial Attached SCSI (SAS). Essa verso fornece aproximadamente 1,5 TB de capacidade de dados de usurio sem compresso e 1 GB/segundo de largura de banda de dados por servidor. A segunda verso da clula do Exadata baseia-se em unidades de disco de 1 TB Serial Advanced Technology Attachment (SATA) e fornece aproximadamente 3,3 TB de capacidade de dados sem compresso e 750 MB/segundo de largura de banda de dados. Quando os dados no banco de dados so comprimidos, a largura de banda fornecida por cada clula aumenta de duas a trs vezes.

Oracle11g for Data warehousing e Business Intelligence

Pgina 4

HP Oracle Database Machine

O HP Oracle Database Machine um data warehouse de extremo desempenho construdo com hardware padro de servidores de armazenamento HP e HP Oracle Exadata. Projetado para amplos data warehouses com vrios terabytes, cargas de trabalho com uso intenso de I/O, o HP Oracle Database Machine um pacote completo, j otimizado e configurado, de software, servidores e armazenamento. Simples e rpido de implementar, cada rack do HP Oracle Database Machine construdo para comportar at 21 TB de dados de usurio sem compresso com uma configurao baseada em SAS ou 46 TB com uma configurao baseada em SATA. O Database Machine inclui o seguinte hardware.

Catorze HP Oracle Exadata Storage Servers (SAS ou SATA) Oito servidores de banco de dados Oracle Database 11g HP ProLiant DL360 G5 (processadores quad-core Intel de 2,66 GHz com soquete duplo), 32 GB de RAM, quatro unidades de disco SAS de 146 GB, InfiniBand Host Channel Adapter (HCA) de porta dupla, duas portas Ethernet de 1 Gb/segundo e fontes de alimentao redundantes Toda a infraestrutura necessria de InfiniBand (HCAs, switches e cabos) para comunicao do servidor de banco de dados com o Exadata Storage Server Switch Ethernet para comunicao do Database Machine com clientes ou outros sistemas de computao Hardware de teclado, Vdeo ou Unidade Visual, Mouse (KVM) E tudo isso ocupa 42UR em um rack padro de 19 polegadas

Utilizando uma metodologia de blocos modulares, o HP Oracle Database Machine rpido e fcil de dimensionar. Quando novos racks de HP Oracle Database Machines so adicionados a um sistema, a capacidade de armazenamento e o desempenho do sistema aumentam e um sistema de dois racks tem simplesmente o dobro da potncia de um sistema de um rack. O escalonamento externo fcil: o HP Oracle Database Machine adicional conectado interconexo InfiniBand nos racks existentes e o banco de dados Oracle redistribudo automaticamente para utilizar plenamente toda a potncia de processamento e armazenamento de todos os racks. A famlia Exadata fornece recursos escalveis de hardware para proporcionar a largura de banda necessria para aplicaes de data warehousing de alto desempenho. Esta soluo complementa o crebro do software do Oracle Database 11g, com seus sofisticados algoritmos de processamento de consultas, anlises avanadas e slidos recursos de integrao dos dados que sero apresentados a seguir.

Oracle11g for Data warehousing e Business Intelligence

Pgina 5

INTEGRE

A arquitetura de informao atual muito mais dinmica do que era poucos anos atrs. Atualmente as empresas demandam mais informaes, mais rapidamente e esto fornecendo mais anlises a um conjunto cada vez mais amplo de usurios e aplicaes.
Oracle Warehouse Builder

Para atender esses requisitos dos negcios, o Oracle Database 11g inclui uma ferramenta lder de integrao de dados, o Oracle Warehouse Builder (OWB). Os principais recursos do OWB esto includos como uma funcionalidade de banco de dados, sem custo adicional, e o OWB tem mais trs opes para requisitos especficos de integrao:

Produto base: o produto base foi criado para permitir que qualquer cliente Oracle crie com eficcia um datamart ou data warehouse, de qualquer tamanho ou complexidade. Ele inclui um repositrio de metadados multiusurios, pronto para empresas, recursos de modelagem de dados e uma grande variedade de tcnicas de transformao e extrao, junto com o desempenho e escalabilidade de uma arquitetura ELT. Opo Enterprise ETL: essa opo voltada especificamente para aumentar o desempenho e a produtividade, e inclui os seguintes recursos:

Opes avanadas de carga de dados Produtividade do desenvolvedor por meio de componentes reutilizveis Gerenciamento incorporado de dimensionamento com evoluo lenta Anlise de impacto e alinhamento de dados total Suporte para gerenciamento avanado de configurao

Opo de qualidade de dados: como parte plenamente integrada do produto, uma vantagem bem distinta sobre todas as demais ferramentas no mercado, a opo de qualidade de dados d suporte para perfis de dados, regras de dados (na essncia, so regras comerciais) e recursos de conformidade de informaes. Conectores: so fornecidos conectores para acesso otimizado aos principais aplicativos operacionais. A Oracle fornece conectores para Oracle e-Business Suite, Peoplesoft Enterprise, Siebel (CRM) e SAP R/3.

Uma vantagem importante do OWB a amplitude de recursos que fornece, integrados em uma s ferramenta. Modelagem de dados, conformidade de dados e qualidade de dados so recursos bsicos que toda ferramenta de integrao dos dados empresarial tem de incorporar. Porm, uma vantagem arquitetnica bsica do Oracle Warehouse Builder a integrao dos componentes. O Oracle Warehouse

Oracle11g for Data warehousing e Business Intelligence

Pgina 6

Builder fornece todos os seus recursos em uma interface do usurio e repositrio comuns.

Figura 1

Ao proporcionar todos esses recursos na mesma ferramenta, alm de um s repositrio, o OWB resolve um desafio antigo na integrao dos dados. Muitas solues de integrao proporcionam ferramentas separadas para esses recursos distintos. Mas extremamente ineficiente realizar a modelagem de dados em uma ferramenta, depois o mapeamento de ETL em outra ferramenta e finalmente o perfil dos dados em uma terceira ferramenta. O OWB fornece um repositrio de metadados e uma IU para todo o processo de integrao. O Oracle Warehouse Builder usa uma arquitetura de extrair-carregar-transformar (ELT). Em vez de proporcionar um mecanismo externo de transformao de dados, o OWB executa todas as suas transformaes em um banco de dados Oracle, aproveitando a escalabilidade e desempenho da plataforma do banco de dados.
Principais recursos de integrao do banco de dados

O banco de dados Oracle tem um amplo conjunto de recursos de extrao, carga e transformao. Esses recursos so aproveitados pelo OWB, mas podem ser usados em qualquer ambiente no qual os dados sejam integrados em um data warehouse da Oracle. Esses recursos incluem:

Gateways do banco de dados para acesso a sistemas no Oracle Utilitrio de carga para cargas rpidas de dados de arquivos sem formatao Extenses SQL para transformaes de dados: declarao MERGE Funes de tabela: transformaes paralelas eficientes definidas pelo usurio Captura de alteraes de dados para captura baseada em log e com baixa latncia de bancos de dados Oracle

Oracle11g for Data warehousing e Business Intelligence

Pgina 7

REALIZE

A Oracle fornece otimizaes de desempenho para todos os tipos de ambiente de data warehouse. As cargas de trabalho de data warehouses costumam ser complexas, com diferentes usurios executando operaes muito diferenciadas, com expectativas e requisitos com diferentes semelhanas, para o desempenho de consultas. A Oracle atende s demandas de desempenho do data warehouse ao fornecer:

Um amplo conjunto de tcnicas de otimizao de desempenho para todos os tipos de consulta e carga de trabalho:
Dashboards Query and reporting tools Ad hoc queries Complex model creation <.1 second < 1 seconds < 10 seconds < 1 minute < 30 minutes Dimensional Third Normal Form Aggregate Data Detail Data

OLAP Cubes Star query optimizations Bitmap indexes Materialized Views Partition Pruning (Range Partitioning) Parallelism Partition-wise Joins (Hash Partitioning)

Figura 2

Um sofisticado gerenciador de recursos para garantir um bom desempenho mesmo em bancos de dados com carga de trabalho complexas e heterogneas. O Database Resource Manager permite agrupar os usurios finais em grupos de consumidores de recursos e o DBA pode controlar exatamente como os recursos so alocados a cada grupo. Para cada grupo, o DBA pode controlar a quantidade de utilizao de CPU, alm de especificar polticas para a gesto proativa de consultas e para o enfileiramento de consultas. Um modelo exclusivo, patenteado, de consistncia de leitura para garantir que as cargas de dados nunca afetem o desempenho da consulta. A Oracle resolve os desafios de acessos simultneos utilizando uma tecnologia chamada consistncia de leitura de mltiplas verses, uma tecnologia exclusiva que forma a base do modelo de simultaneidade da Oracle h mais de 15 anos. A consistncia de leitura de mltiplas verses garante que um usurio sempre tenha uma visualizao consistente dos dados solicitados. Se outro usurio alterar os dados subjacentes durante a execuo da consulta (como uma atualizao de alimentao gradual de uma tabela de um grande data warehouse), o Oracle mantm a verso dos dados existente no momento inicial da consulta. Os dados retornados consulta sempre indicam o estado

Oracle11g for Data warehousing e Business Intelligence

Pgina 8

do banco de dados (incluindo todas as transaes comprometidas) no momento em que uma consulta foi feita, independentemente de quaisquer outras atualizaes que possam estar acontecendo durante a execuo da consulta. Com essa tecnologia, a Oracle est em uma posio exclusiva para lidar com cargas de dados quase em tempo real, em ambientes de data warehouse.

Pacotes de Gerenciamento para automatizar o ajuste contnuo de desempenho de um data warehouse.

Um dos mais interessantes novos recursos de desempenho no Oracle Database 11g so as views materializadas baseadas em OLAP. Os mtodos convencionais de ajuste de desempenho para esquemas em estrela em data warehouses, h muito tempo envolvem o uso de tabelas resumo (ou views materializadas). Com essa abordagem, o desempenho das consultas aprimorado, ao calcular previamente um ou mais resumos e armazenar tais resumos no data warehouse. Esses resumos so completamente transparentes para o aplicativo, pois o banco de dados fornece recursos de query rewrite onde uma consulta em um conjunto base de tabelas com esquema de estrela reescrita para acessar os dados de resumo. Um desafio com as views materializadas que um esquema em estrela pode apresentar milhares ou at milhes de possveis agregaes que podem ser armazenadas como tabelas resumo. No prtico criar uma view materializada para todas as agregaes possveis, pois a utilizao de espao e os custos de manuteno seriam excessivos. Porm esse cenrio foi solucionado com views materializadas baseadas em OLAP. Uma view materializada baseada em OLAP aproveita as estruturas de dados OLAP, onde todas as agregaes possveis podem ser recuperadas rapidamente. Assim, um esquema em estrela com uma view materializada baseada em OLAP proporciona o desempenho de um esquema em estrela com milhares de views materializadas relacionais, mas com um cubo OLAP fcil de administrar, que altamente comprimido e fornece eficientes recursos de atualizao. Essa aplicao da tecnologia OLAP a cargas de trabalho de uso geral em data warehouses exclusiva da Oracle. Embora solues OLAP anteriores fossem acessadas por uma API baseada em OLAP, o Oracle OLAP proporciona os benefcios de desempenho do OLAP a todos os usurios do data warehouse que utilizem qualquer ferramenta baseada em SQL.
CRESA

O tamanho dos maiores data warehouses est aumentando exponencialmente. Atualmente, mais e mais processos de negcios esto ficando mais automatizados e mais dados so coletados em nveis mais granulares, ento esse aumento do volume de dados no d sinais de desacelerao. O Oracle Database 11g oferece quatro recursos bsicos para viabilizar a escalabilidade: particionamento, compresso, clustering e paralelismo

Oracle11g for Data warehousing e Business Intelligence

Pgina 9

Particionamento

O Oracle Partitioning essencial para administrar grandes bancos de dados. Ele permite usar uma tcnica de "dividir e conquistar" para administrar as grandes tabelas no banco de dados, especialmente quando essas tabelas crescem. Embora seu banco de dados possa ter o dobro dos dados no prximo ano, seus usurios finais no iro tolerar que seu aplicativo seja executado duas vezes mais lento, seu banco de dados no ter o dobro do tempo para concluir o processamento batch e manuteno, e seus gerentes de TI no iro duplicar o oramento de hardware do data warehouse. O particionamento o recurso que permite que um banco de dados seja dimensionado para conjuntos de dados muito extensos, mantendo um desempenho consistente, sem um crescimento excessivo dos recursos administrativos ou do hardware. O particionamento divide grandes tabelas em tabelas menores, e permite manter janelas de gerenciamento de dados e muitas consultas de usurio final com um nvel constante de desempenho, mesmo com o crescimento dos dados. A Oracle vem desenvolvendo sua tecnologia de particionamento h mais de 10 anos, desde sua introduo no Oracle8. No Oracle Database 11g, a Oracle fornece nove mtodos de particionamento de tabelas, alm da capacidade dos DBAs definirem esquemas personalizados de particionamento; um amplo conjunto de comandos administrativos para tabelas particionadas e um advisor de partio para orientar os administradores sobre como melhor implementar o particionamento. O particionamento tambm ativa estratgias de ILM (Gerenciamento do Ciclo de Vida da Informao) no banco de dados Oracle. Uma s tabela, quando particionada, pode ser distribuda por vrias camadas de armazenamento. Os dados mais antigos, acessados com menor frequncia, correspondentes a parties mais antigas, podem ser armazenados em dispositivos de armazenamento mais baratos. Para grandes bancos de dados, essa abordagem pode proporcionar uma significativa economia de custos.
Compresso

Desde sua introduo no Oracle9i Database Release 2, a compresso cresceu at ser um dos recursos mais populares para clientes de data warehouses. Quando os clientes buscam maiores volumes de dados, a compresso uma soluo natural. Os algoritmos de compresso da Oracle proporcionam um mecanismo exclusivo para comprimir dados armazenados em tabelas relacionais com praticamente nenhum impacto negativo desempenho da consulta. Com taxas tpicas de compresso de 2:1 at 5:1, a popularidade desse recurso no surpreende. No Oracle Database 11g, a compresso foi aprimorada para suportar frequentes e pequenas atualizaes e inseres. Nas verses anteriores, os dados eram comprimidos quando eram inseridos em uma tabela, usando operaes de direct path (operaes de grandes volumes nas quais milhares de linhas so inseridas com uma s declarao SQL ou com o utilitrio de carga). Para atualizaes e inseres menores em uma tabela comprimida, os novos dados no eram

Oracle11g for Data warehousing e Business Intelligence

Pgina 10

comprimidos nessas verses anteriores. Esse novo aprimoramento no 11g traz os benefcios da compresso a tabelas de data warehouses que sejam alimentadas gradualmente ou atualizadas frequentemente de outra maneira.
Real Application Clusters

O Real Application Clusters permite que um banco de dados seja dividido entre vrios servidores. Para data warehousing, o RAC fornece uma soluo de escalamento que permite crescer at centenas de CPUs. A arquitetura do RAC proporciona benefcios exclusivos para data warehousing no Oracle. Alm da capacidade de adicionar poder bruto de computao a um sistema de data warehouse, o RAC tambm permitem alta disponibilidade contra falhas de servidores. O RAC tambm proporciona uma imensa flexibilidade para o gerenciamento de mltiplas cargas de trabalho em um s banco de dados. Utilizando o conceito de servios do RAC, diferentes aplicativos podem ser atribudos a servios separados, que por sua vez podem ser executados em ns separados em um cluster. Por exemplo, usurios de datamart podem ser atribudos a um conjunto de ns enquanto que operaes ETL podem ser atribudas a outro conjunto de ns. Uma vantagem principal do RAC sua capacidade de alterar e ajustar dinamicamente essas cargas de trabalho. possvel alocar de forma fcil e dinmica mais ns ao processamento de ETL durante a noite, por exemplo, e realocar esses ns para o processamento de consultas durante o da.
Paralelismo

Paralelismo a capacidade de utilizar vrios processadores na execuo de uma operao de banco de dados. A arquitetura escalvel de execuo paralela da Oracle ajusta-se dinamicamente para atender a todas as demandas de usurios. Para operaes de grande porte, a Oracle executa as operaes de banco de dados em paralelo, usando todos os ns e CPUs disponveis. Para operaes de menor porte, a Oracle ajusta dinamicamente o paralelismo para maximizar o throughput geral do sistema enquanto o Database Resource Manager garante que as operaes de alta prioridade continuem a receber os recursos apropriados.
ANALISE

Tecnologias como OLAP, estatsticas e extrao de dados no so novidade para data warehousing e inteligncia de negcios. Porm, os produtos OLAP geralmente tm seu prprio mecanismo de clculo, produtos estatsticos tm seu prprio mecanismo de dados e produtos de extrao de dados tm seus prprios mecanismos de extrao. Resumindo, um ambiente empresarial de inteligncia de negcios mantm ao menos quatro tipos diferentes de mecanismos de dados, cada um exigindo seus prprios servidores, sua prpria infraestrutura de gerenciamento, sua prpria administrao de segurana, sua prpria infraestrutura de alta disponibilidade. Cada mecanismo tem sua prpria API e seu conjunto de

Oracle11g for Data warehousing e Business Intelligence

Pgina 11

ferramentas de desenvolvedor e de usurio final. A complexidade e o custo de replicar pilhas completas de tecnologias de BI significativa. O banco de dados Oracle proporciona uma abordagem completamente diferente ao integrar OLAP, extrao de dados e estatsticas dentro do mecanismo do banco de dados. Em vez de mover os dados de um data warehouse para outros mecanismos de anlise, para anlise posterior, a Oracle incorporou os algoritmos avanados de anlise aos seus bancos de dados, onde esto os dados. Alm disso, a Oracle permite acesso SQL a todas as suas anlises, para que possam ser implementadas com qualquer ferramenta baseada em SQL ou ambiente de aplicativo. Alm das vantagens considerveis de racionalizar a arquitetura de dados do backend de um ambiente empresarial de inteligncia de negcios, a integrao das ferramentas de anlise no banco de dados Oracle proporciona uma srie de vantagens no disponveis em ambientes autnomos. Por exemplo, seu servidor OLAP autnomo pode ser escalado para centenas de CPUs ou clusters de servidores? Quo facilmente seu mecanismo de extrao de dados se integra com seu servidor de autenticao de usurios? E ele pode implementar de forma transparente todas as suas polticas de segurana de dados? Quo facilmente voc consegue integrar os resultados de suas anlises estatsticas com seus dados do data warehouse? No banco de dados Oracle, todas essas questes so resolvidas de forma simples, em funo da profunda integrao de OLAP, extrao de dados e estatsticas.
Data Mining

O Oracle Data Mining um poderoso software incorporado no banco de dados Oracle que permite a voc descobrir novas relaes ocultas em seus dados. O Oracle Data Mining auxilia as empresas a voltar-se para seus melhores clientes, descobrir e evitar fraudes, descobrir os atributos mais influentes que afetam os principais indicadores de desempenho (KPIs) e descobrir novas e valiosas informaes ocultas nos dados. O Oracle Data Mining auxilia profissionais tcnicos a descobrir padres nos dados, identificar os principais atributos, descobrir novos clusters e associaes e desvendar valiosas percepes. Para resolver esses problemas de negcios, o Oracle Data Mining permite s empresas encontrar novas informaes a partir de seus dados, usando uma ampla variedade de algoritmos de ltima gerao. Os algoritmos de extrao de dados so tcnicas de aprendizagem mecnica para analisar dados e descobrir padres e relaes. A Oracle fornece diversos algoritmos pois diferentes algoritmos so eficazes para diferentes tipos de anlise e diferentes problemas de negcios. A maioria dos algoritmos de extrao de dados podem ser divididos em tcnicas de extrao de dados de aprendizagem supervisionada e aprendizagem no supervisionada. A aprendizagem supervisionada exigem que o analista de dados identifique um atributo alvo ou uma varivel dependente (por exemplo, clientes que adquiriram determinado produto). A tcnica de aprendizagem supervisionada

Oracle11g for Data warehousing e Business Intelligence

Pgina 12

percorre os dados tentando identificar padres e relaes entre outros atributos e o atributo alvo (por exemplo, as caractersticas que indicam se um possvel cliente provavelmente ir adquirir determinado produto). Os algoritmos de aprendizagem supervisionada com o Oracle Data Mining incluem Nave Bayes, rvore de Decises, Modelos Lineares Gerais e Mquinas Vetoriais de Suporte. A outra ampla categoria de algoritmos de extrao de dados so os de aprendizagem no supervisionada. Nesses cenrios, no existe um atributo alvo, em vez disso, os algoritmos de extrao de dados buscam por associaes e clusters nos dados, independentemente de qualquer objetivo de negcios definido a priori. Esses algoritmos incluem o Enhanced k-Means Clustering, os Clusters de Particionamento ortogonal, as Regras de Associao (anlise de cesta de mercados) e a Fatorizao de Matriz No-negativa. O Oracle Data Mining inclui o Oracle Data Miner, uma interface grfica do usurio para os analistas de dados criarem, avaliarem e aplicarem modelos de extrao de dados. O Oracle Data Miner orienta o analista de dados pelo processo de extrao de dados com completa flexibilidade e apresenta os resultados em formato grfico e em tabelas. O Oracle Data Miner pode gerar o cdigo PL/SQL associado a uma Atividade de Extrao.
OLAP

O Oracle OLAP um mecanismo de processamento analtico on-line (OLAP) completo, incorporado no banco de dados Oracle. O Oracle OLAP aprimora os data warehouses ao aumentar o desempenho das consultas (como explicado na seo de desempenho) e adicionando um contedo analtico enriquecido. O principal recurso do Oracle OLAP so os cubos. Administrada dentro do banco de dados Oracle, essa estrutura de dados armazena dados em um formato multidimensional altamente otimizado. Os cubos proporcionam um armazenamento escalvel e comprimido de dados dimensionais, rpida atualizao incremental, rpido desempenho de consultas e permitem calcular ou armazenar avanados clculos analticos. A estratgia da Oracle com o Oracle OLAP trazer essas vantagens bsicas do OLAP para o data warehouse. Para isso, so expostos os principais recursos do Oracle OLAP via SQL padro, de modo que qualquer ferramenta de inteligncia de negcios ou outro aplicativo baseado em SQL possa fazer uso do OLAP. Os principais recursos de integrao com SQL incluem a capacidade de acessar cubos OLAP por meio de views SQL, que expem um cubo multidimensional como um conjunto de tabelas de dimenses e tabelas de fatos; views materializadas baseadas no cubo que permitem utilizar os cubos OLAP como views materializadas; integrao de dicionrio de dados para que ferramentas de consultas baseadas em SQL, alm dos desenvolvedores de SQL, possam identificar rapidamente todos os cubos e seus atributos; e a integrao dos caminhos de acesso ao cubo no otimizador Oracle.

Oracle11g for Data warehousing e Business Intelligence

Pgina 13

CONCLUSO

O banco de dados Oracle o lder de mercado para data warehousing, construdo sobre uma base slida de escalabilidade e desempenho, e ampliado por recursos inovadores como o modelo exclusivo da Oracle de consistncia de leitura para data warehouses quase em tempo real, um poderoso e flexvel conjunto de recursos de particionamento de tabelas, a utilizao da tecnologia OLAP para ampliar ambientes relacionais e a insupervel plataforma para arquiteturas em grid. A combinao do banco de dados Oracle e de uma grid de armazenamento Oracle Exadata proporciona os mais altos nveis de desempenho para cargas de trabalho intensas em I/O e, com o HP Oracle Database Machine, a Oracle fornece uma soluo completa de hardware e software para data warehousing.

Oracle11g for Data warehousing e Business Intelligence

Pgina 14

Oracle Database 11g for Data Warehousing e Business Intelligence Setembro de 2008 Autor: George Lumpkin Oracle do Brasil Sistemas Ltda. Sede no Brasil Av. Alfredo Egydio de Souza Aranha, 100 So Paulo, SP CEP 04726-170 Brasil Telefone: (55-11) 5189-1000 oracle.com Copyright 2008, Oracle. Todos os direitos reservados e de titularidade da Oracle Corporation. Proibida a reproduo total ou parcial. Este documento fornecido apenas para fins informativos e seu contedo est sujeito a alterao sem aviso prvio. A Oracle Corporation e a Oracle do Brasil Sistemas Ltda. (ambas conjuntamente denominadas Oracle) no garantem que este documento esteja isento de erros. A Oracle no fornece qualquer outra garantia ou condio legal, expressa ou implcita, incluindo garantias ou condies de comercializao e uso para um propsito especfico. A Oracle isenta-se de qualquer responsabilidade em relao a este documento, sendo que ele no representa qualquer obrigao contratual direta ou indireta. Este documento no pode ser reproduzido ou transmitido de qualquer forma ou atravs de qualquer meio, seja eletrnico ou mecnico, para qualquer objetivo, sem a permisso expressa por escrito da Oracle. Oracle uma marca comercial registrada da Oracle Corporation e/ou de suas empresas afiliadas. Outros nomes podem ser marcas comerciais de seus respectivos proprietrios.

Você também pode gostar