Você está na página 1de 56

BANCO DE DADOS

Tpicos Abordados: Conceito sobre Banco de Dados e SGBDs Arquiteturas Modelos de Dados Tipos de Softwares Gerenciadores de B. D.

AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

SUMRIO

Introduo.................................................................................................03 1.0 Banco de Dados...............................................................................04 2.0 Sistema Gerenciador de Banco de Dados........................................04 2.1 Modelo de Dados.................................................................05 2.2 Tipos de Arquiteturas...........................................................07 2.3 Capacidades do SGBD.........................................................08 3.0 Arquiteturas de Banco de Dados......................................................09 3.1 Aspectos Relevantes.............................................................10 3.2 Vantagens dos Bancos de Dados..........................................11 3.3 Linguagens de Base de Dados..............................................12 4.0 O que Modelo de Dados?..............................................................12 4.1 Modelo Entidade Relacionamento.......................................12 4.2 Entidades e Atributos...........................................................12 4.2.1 Tipos de Atributos..............................................13 4.3 Relacionamentos...................................................................15 4.4 Entidade Fraca......................................................................19 4.5 Modelo de Entidade Relacionamento Extendido.................20 4.5.1 Especializao e Generalizao...........................20 4.6 Operaes..............................................................................22 5.0 Tipos de Sistemas Gerenciadores de Banco de Dados......................23 5.1 dBase......................................................................................23 5.2 MySQL..................................................................................25 5.3 PostgreSQL ...........................................................................29 5.4 Oracle.....................................................................................31 5.5 - Microsoft SQL Server.............................................................31 5.6 - Microsoft Access...................................................................32 5.7 - Data Warehouse.....................................................................34 5.7.1 Metadado..............................................................37 5.7.2 - Data Mart.............................................................38 5.7.3 - Data Mining.........................................................43 6.0 Alguns Conceitos Importantes...........................................................51 7.0 - Concluso..........................................................................................55 8.0 - Bibliografia........................................................................................56

2 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

INTRODUO

Saber o significado de um Banco de Dados e que o SGBD um sistema que o gerencia no saber o bastante, pois estamos falando de um grande volume de dados, ou seja, informaes que precisam ser armazenadas, acessadas, atualizadas por um indefinido espao de tempo, dando aos seus usurios agilidade e qualidade de resposta no cruzamento das informaes. Esse armazenamento e gerenciamento surgiram para deixar de lado os primitivos sistemas de arquivos que no conseguiam controlar os inmeros processos e usurios que faziam uso de seus pequenos recursos. Atualmente os bancos de dados no impem limites de armazenamento, em alguns casos no necessita de muito hardware, nos proporciona segurana e at tem capacidade de nos disponibilizar mltiplas vises dos dados. Esses sistemas gerenciadores de arquivos seja ele free (gratuito) ou no, ambos tem capacidade de nos trazer ferramentas necessrias para o gerenciamento de qualquer tipo de informaes armazenadas, independente de sua representao ou modelo pelo qual as informaes esto estruturadas.

3 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

1.0 Banco de Dados


O que um Banco de Dados? O termo Banco de Dados foi criado para indicar colees organizadas de dados armazenados em computadores digitais; utilizando um conceito, Banco de Dados ou Bases de Dados so conjuntos de dados integrados com uma estrutura que organizam informaes. Sendo essas informaes utilizadas normalmente para um mesmo fim. Um banco de dados usualmente mantido e acessado por meio de um software conhecido como SGBD. Estritamente falado, o termo Banco de Dados deve ser aplicado apenas aos dados, enquanto o termo Sistema Gerenciador de Bancos de Dados deve ser aplicado ao software com a capacidade de manipular bancos de dados de forma geral. Porm, comum misturar os dois conceitos.

2.0 Sistema Gerenciador de Banco de Dados


O que um SGBD? Um sistema Gerenciador de Banco de Dados ou Sistema Gestor de Base de Dados (SGBD), um conjunto de programas responsveis pelo gerenciamento de uma base de dados. um sistema extremamente complexo, responsvel pela persistncia, organizao e recuperao dos dados. Historicamente, o primeiro Sistema Gerenciador de Banco de Dados comercial surgiu no final de 1960 com base nos primitivos sistemas de arquivos disponveis na poca, os quais no controlavam o acesso concorrente por vrios usurios ou processos. Os SGBDs evoluram desses sistemas de arquivos de armazenamento em disco, criando novas estruturas de dados com o objetivo de armazenar informaes. Com o tempo, os SGBDs passaram a utilizar diferentes formas de representao, ou modelos de dados, para descrever a estrutura das informaes contidas em seus bancos de dados.

4 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES 2.1 - Os modelos de dados mais utilizados pelos SGBDs so: Modelo Hierrquico

(**79)8115-7557

O modelo hierrquico foi o primeiro a ser reconhecido como um modelo de dados. Seu desenvolvimento somente foi possvel devido consolidao dos discos de armazenamento endereveis, pois esses discos possibilitaram a explorao de sua estrutura de endereamento fsico para viabilizar a representao hierrquica das informaes. Nesse modelo de dados, os dados so estruturados em hierarquias ou rvores. Os ns das hierarquias contm ocorrncias de registros, onde cada registro uma coleo de campos (atributos), cada um contendo apenas uma informao. O registro da hierarquia que precede a outros o registro-pai, os outros so chamados de registros-filhos. Modelo em Rede O modelo em rede surgiu como uma extenso ao modelo hierrquico, eliminando o conceito de hierarquia e permitindo que um mesmo registro estivesse envolvido em vrias associaes. Esse modelo permite que vrias tabelas sejam usadas simultaneamente atravs do uso de apontadores (ou referncias). Algumas colunas contm apontadores para outras tabelas ao invs de dados. Assim, as tabelas so ligadas por referncias, o que pode ser visto como uma rede. O gerenciador Data Base Task Group (DBTG) da CODASYL (Committee on Data Systems and Languages) estabeleceu uma norma para este modelo de banco de dados, com linguagem prpria para definio e manipulao de dados. Os dados tinham uma forma limitada de independncia fsica. A nica garantia era que o sistema deveria recuperar os dados para as aplicaes como se eles estivessem armazenados na maneira indicada nos esquemas. Os geradores de relatrios da CODASYL tambm definiram sintaxes para dois aspectos chaves dos sistemas gerenciadores de dados: concorrncia e segurana. O mecanismo de segurana fornecia uma facilidade na qual parte do banco de dados (ou rea) pudesse ser bloqueada para prevenir acessos simultneos, quando necessrio. A sintaxe da segurana permitia que uma senha fosse associada a cada objeto descrito no esquema. Ao contrrio do Modelo Hierrquico, em que qualquer acesso aos dados passa pela raiz, o modelo em rede possibilita acesso a qualquer n da rede sem passar pela raiz. No Modelo em Rede o sistema comercial mais divulgado o CAIDMS da Computer Associates. O diagrama para representar os conceitos do modelo em redes consiste em dois componentes bsicos: Caixas, que correspondem aos registros e Linhas, que correspondem s associaes. Modelo Relacional O modelo relacional uma teoria matemtica desenvolvida por Edgar Frank Codd que surgiu na dcada de 1970, para descrever como as bases de dados devem funcionar. Porm, a implementao do modelo exigia pesquisas e s na dcada de 1980 eles iam comear a ganhar o mercado, se estabilizando totalmente como lder do mercado a partir da dcada de 1990.

5 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Embora esta teoria seja a base para o software de bases de dados relacionais, muito poucos sistemas de gesto de bases de dados seguem o modelo de forma restrita e todos tm funcionalidades que violam a teoria, desta forma variando a complexidade e o poder. A discusso se esses bancos de dados merecem ser chamados de relacional ficou esgotada com tempo, com a evoluo dos bancos existente. De acordo com a arquitetura ANSI / SPARC em trs nveis, os bancos de dados relacionais possuem trs camadas: um conjunto de vises compondo o nvel externo; uma coleo de estruturas de dados, a saber relaes, compondo o nvel conceitual; um conjunto de ndices ou mtodos de acesso a dados armazenados, compondo o nvel interno. A teoria relacional de banco de dados define um conjunto de operaes lgicas, a saber a lgebra e o clculo relacionais. Essas operaes so a base da linguagem SQL. Um dos pontos fortes do modelo relacional de banco de dados a possibilidade de definio de um conjunto de restries de integridade. Estas definem os conjuntos de estados e mudanas de estado consistentes do banco de dados, determinando os valores que podem e os que no podem ser armazenados. Diferentemente dos bancos de dados em rede, nos bancos de dados relacionais os relacionamentos entre as tabelas no so codificados explicitamente na sua definio. Em vez disso, se fazem implicitamente pela a presena de atributos chave. Como resultado, bancos de dados relacionais podem ser reorganizados e utilizados de maneira flexvel e de formas no previstas pelos projetistas originais. Por causa dessa flexibilidade, muitos bancos de dados so baseados no modelo relacional, embora imperfeitamente. O modelo relacional apareceu devido s seguintes necessidades: aumentar a independncia de dados nos sistemas gerenciadores de banco de dados; prover um conjunto de funes apoiadas em lgebra relacional para armazenamento e recuperao de dados. Modelo que revelou-se ser o mais flexvel e adequado ao solucionar os vrios problemas que se colocam no nvel da concepo e implementao da base de dados. A estrutura fundamental do modelo relacional a relao (tabela). Uma relao constituda por um ou mais atributos (campos) que traduzem o tipo de dados a armazenar. Cada instncia do esquema (linha) chamada de tupla (registro). O modelo relacional no tem caminhos pr-definidos para se fazer acesso aos dados como nos modelos que o precederam. O modelo relacional implementa estruturas de dados organizadas em relaes. Porm, para trabalhar com essas tabelas, algumas restries precisaram ser impostas para evitar aspectos indesejveis, como: Repetio de informao, incapacidade de representar parte da informao e perda de informao. Essas restries so: integridade referencial, chaves e integridade de junes de relaes. Modelo Orientado a Objetos Os bancos de dados orientados a objeto comearam a se tornar comercialmente viveis em meados de 1980. A motivao para seu surgimento est em funo dos limites de armazenamento e representao semntica impostas no modelo relacional. Alguns exemplos so os sistemas de informaes geogrficas (SIG), os sistemas CAD e CAM, que so mais facilmente construdos usando tipos complexos de dados. A habilidade para criar os tipos de dados necessrios uma caracterstica das linguagens de programao orientadas a objetos.

6 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Contudo, estes sistemas necessitam guardar representaes das estruturas de dados que utilizam no armazenamento permanente. A estrutura padro para os bancos de dados orientados a objetos foi feita pelo Object Database Management Group (ODMG). Esse grupo formado por representantes dos principais fabricantes de banco de dados orientados a objeto disponveis comercialmente. Membros do grupo tm o compromisso de incorporar o padro em seus produtos. O termo Modelo Orientado a Objetos usado para documentar o padro que contm a descrio geral das facilidades de um conjunto de linguagens de programao orientadas a objetos e a biblioteca de classes que pode formar a base para o Sistema de Banco de Dados. Quando os bancos de dados orientados a objetos foram introduzidos, algumas das falhas perceptveis do modelo relacional pareceram ter sido solucionadas com esta tecnologia e acreditava-se que tais bancos de dados ganhariam grande parcela do mercado. Hoje, porm, acreditase que os Bancos de Dados Orientados a Objetos sero usados em aplicaes especializadas, enquanto os sistemas relacionais continuaro a sustentar os negcios tradicionais, onde as estruturas de dados baseadas em relaes so suficientes. 2.2 - Tipos de arquiteturas de SGBDs Arquitetura Centralizada Na arquitetura centralizada, existe um computador com grande capacidade de processamento, o qual o hospedeiro do SGBD e emuladores para os vrios aplicativos. Esta arquitetura tem como principal vantagem a de permitir que muitos usurios manipulem grande volume de dados. Sua principal desvantagem est no seu alto custo, pois exige ambiente especial para mainframes e solues centralizadas. Arquitetura do tipo Sistemas de Computador Pessoal PC Os computadores pessoais trabalham em sistema stand-alone, ou seja, fazem seus processamentos sozinhos. No comeo esse processamento era bastante limitado, porm, com a evoluo do hardware, tem-se hoje PCs com grande capacidade de processamento. Eles utilizam o padro Xbase e quando se trata de SGBDs, funcionam como hospedeiros e terminais. Desta maneira, possuem um nico aplicativo a ser executado na mquina. A principal vantagem desta arquitetura a simplicidade. Arquitetura Cliente-Servidor Na arquitetura Cliente-Servidor, o cliente executa as tarefas do aplicativo, ou seja, fornece a interface do usurio (tela, e processamento de entrada e sada). O servidor executa as consultas no DBMS e retorna os resultados ao cliente. Apesar de ser uma arquitetura bastante popular, so necessrias solues sofisticadas de software que possibilitem: o tratamento de transaes, as confirmaes de transaes, desfazer transaes, linguagens de consultas e gatilhos (triggers). A principal vantagem desta arquitetura a diviso do processamento entre dois sistemas, o que reduz o trfego de dados na rede.

7 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES Banco de Dados Distribudos (N camadas)

(**79)8115-7557

Nesta arquitetura, a informao est distribuda em diversos servidores. Cada servidor atua como no sistema cliente-servidor, porm as consultas oriundas dos aplicativos so feitas para qualquer servidor indistintamente. Caso a informao solicitada seja mantida por outro servidor ou servidores, o sistema encarrega-se de obter a informao necessria, de maneira transparente para o aplicativo, que passa a atuar consultando a rede, independente de conhecer seus servidores. Exemplos tpicos so as bases de dados corporativas, em que o volume de informao muito grande e, por isso, deve ser distribudo em diversos servidores. Porm, no dependente de aspectos lgicos de carga de acesso aos dados, ou base de dados fracamente acopladas, em que uma informao solicitada vai sendo coletada numa propagao da consulta numa cadeia de servidores. A caracterstica bsica a existncia de diversos programas aplicativos consultando a rede para acessar os dados necessrios, porm, sem o conhecimento explcito de quais servidores dispem desses dados. 2.3 - Capacidades do SGBD Controle de Redundncia No processamento tradicional de arquivos, muitos grupos de usurios mantm seus prprios arquivos para manipular suas aplicaes de processamento, que pode provocar o armazenamento de informaes redundantes, causando, duplicao de esforos, desperdcio de espao, inconsistncia, ou seja, alterao em alguns arquivos e em outros no, ou em todos os arquivos, porm, de maneira independente. Compartilhamento de Dados SGBDs multiusurios devem fornecer controle de concorrncia para assegurar que atualizaes simultneas resultem em modificaes corretas. Um outro mecanismo que permite a noo de compartilhamento de dados em um SGBD multiusurio a facilidade de definir vises de usurio, que usada para especificar a poro da base de dados que de interesse para um grupo particular de usurios. Restries de Acesso Multiusurio Quando mltiplos usurios compartilham uma base de dados, comum que alguns usurios no autorizados no tenham acesso a todas as informaes da base de dados. Por exemplo, os dados financeiros so freqentemente considerados confidenciais e, desse modo, somente pessoas autorizadas devem ter acesso. Alm disso, pode ser permitido a alguns usurios, apenas a recuperao dos dados. J, para outros, so permitidas a recuperao e a modificao. Assim, o tipo de operao de acesso recuperao ou modificao - pode tambm ser controlado. Tipicamente, usurios e grupos de usurios recebem uma conta protegida por palavras chaves, que usada para se obter acesso base de dados, o que significa dizer que contas diferentes possuem restries de acesso diferentes. Um SGBD deve fornecer um subsistema de autorizao e segurana, que usado pelo DBA para criar contas e especificar restries nas contas.

8 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

O SGBD deve ento obrigar estas restries automaticamente. Note que um controle similar pode ser aplicado ao software do SGBD. Fornecimento de Mltiplas Interfaces Devido aos vrios tipos de usurios, com variados nveis de conhecimento tcnico, um SGBD deve fornecer uma variedade de interfaces para atend-los. Os tipos de interfaces incluem linguagens de consulta para usurios ocasionais, interfaces de linguagem de programao para programadores de aplicaes, formulrios e interfaces dirigidas por menus para usurios comuns. Representao de Relacionamento Complexo entre Dados Uma base de dados pode possuir uma variedade de dados que esto interrelacionados de muitas maneiras. Um SGBD deve ter a capacidade de representar uma variedade de relacionamentos complexos entre dados, bem como recuperar e modificar dados relacionados de maneira fcil e eficiente. Reforar Restries de Integridade Muitas aplicaes de base de dados tero certas restries de integridade de dados. A forma mais elementar de restrio de integridade a especificao do tipo de dado de cada item. Existem tipos de restries mais complexas. Um tipo de restrio que ocorre freqentemente a especificao de que um registro de um arquivo deve estar relacionado a registros de outros arquivos. Um outro tipo de restrio especifica a unicidade sobre itens de dados. Estas restries so derivadas da semntica dos dados e do mini-mundo que eles representam. Algumas restries podem ser especificadas ao SGBD e automaticamente executadas. Outras restries podem ser verificadas pelos programas de atualizao ou no tempo da entrada de dados. Note que um item de dados pode ser inserido erroneamente, mas ainda atender as restries de integridade. Fornecer Backup e Restaurao Um SGBD deve fornecer recursos para restaurao caso ocorram falhas de hardware ou software. O subsistema de backup e restaurao do SGBD o responsvel pela restaurao. Por exemplo, se o sistema de computador falhar no meio da execuo de um programa que esteja realizando uma alterao complexa na base de dados, o subsistema de restaurao responsvel por assegurar que a base de dados seja restaurada ao estado anterior ao incio da execuo do programa. Alternativamente, o subsistema de restaurao poderia assegurar que o programa seja reexecutado a partir do ponto em que havia sido interrompido.

3.0 - Arquiteturas de Banco de Dados


As primeiras arquiteturas usavam mainframes para executar o processamento principal e de todas as funes do sistema, incluindo os programas aplicativos, programas de interface com o usurio, bem como a funcionalidade dos SGBDs. Esta a razo pela qual a maioria dos usurios fazia acesso aos sistemas via terminais que no

9 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

possuam poder de processamento, apenas a capacidade de visualizao. Todos os processamentos eram feitos remotamente, apenas as informaes a serem visualizadas e os controles eram enviados do mainframe para os terminais de visualizao, conectados a ele por redes de comunicao. Como os preos do hardware foram decrescendo, muitos usurios trocaram seus terminais por computadores pessoais (PC) e estaes de trabalho. No comeo os SGBDs usavam esses computadores da mesma maneira que usavam os terminais, ou seja, o SGBD era centralizado e toda sua funcionalidade, execuo de programas aplicativos e processamento da interface do usurio eram executados em apenas uma mquina. Gradualmente, os SGBDs comearam a explorar a disponibilidade do poder de processamento no lado do usurio, o que levou arquitetura cliente-servidor. A arquitetura cliente-servidor foi desenvolvida para dividir ambientes de computao onde um grande nmero de PCs, estaes de trabalho, servidores de arquivos, impressoras, servidores de banco de dados e outros equipamentos so conectados juntos por uma rede. A idia definir servidores especializados, tais como servidor de arquivos, que mantm os arquivos de mquinas clientes, ou servidores de impresso que podem estar conectados a vrias impressoras; assim, quando se desejar imprimir algo, todas as requisies de impresso so enviadas a este servidor. As mquinas clientes disponibilizam para o usurio as interfaces apropriadas para utilizar esses servidores, bem como poder de processamento para executar aplicaes locais. Esta arquitetura se tornou muito popular por algumas razes. Primeiro, a facilidade de implementao dada a clara separao das funcionalidades e dos servidores. Segundo, um servidor inteligentemente utilizado porque as tarefas mais simples so delegadas s mquinas clientes mais baratas. Terceiro, o usurio pode executar uma interface grfica que lhe familiar, ao invs de usar a interface do servidor. Desta maneira, a arquitetura cliente-servidor foi incorporada aos SGBDs comerciais. Diferentes tcnicas foram propostas para se implementar essa arquitetura, sendo que a mais adotada pelos Sistemas Gerenciadores de Banco de Dados Relacionais (SGBDRs) comerciais a incluso da funcionalidade de um SGBD centralizado no lado do servidor. As consultas e a funcionalidade transacional permanecem no servidor, sendo que este chamado de servidor de consulta ou servidor de transao. assim que um servidor SQL fornecido aos clientes. Cada cliente tem que formular suas consultas SQL, prover a interface do usurio e as funes de interface usando uma linguagem de programao. O cliente pode tambm se referir a um dicionrio de dados o qual inclui informaes sobre a distribuio dos dados em vrios servidores SQL, bem como os mdulos para a decomposio de uma consulta global em um nmero de consultas locais que podem ser executadas em vrios stios. Comumente o servidor SQL tambm chamado de backend machine e o cliente de front-end machine. Como SQL prov uma linguagem padro para o SGBDRs, esta criou o ponto de diviso lgica entre o cliente e o servidor. 3.1 - Aspectos relevantes necessrio considerar alguns aspectos relevantes para atingir a eficincia e a eficcia dos sistemas informatizados desenvolvidos, a fim de atender seus usurios nos mais variados domnios de aplicao: automao de escritrios, sistemas de apoio a decises, controle de reserva de recursos, controle e planejamento de produo, alocao e estoque de recursos, entre outros. Tais aspectos so:

10 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

o Os projetos Lgico e Funcional do Banco de Dados devem ser capazes de prever o volume de informaes armazenadas a curto, mdio e longo prazo. Os projetos devem ter uma grande capacidade de adaptao para os trs casos mencionados; o Deve-se ter generalidade e alto grau de abstrao de dados, possibilitando confiabilidade e eficincia no armazenamento dos dados e permitindo a utilizao de diferentes tipos de gerenciadores de dados atravs de linguagens de consultas padronizadas; o Projeto de uma interface gil e com uma "rampa ascendente" para propiciar aprendizado suave ao usurio, no intuito de minimizar o esforo cognitvo; o Implementao de um projeto de interface compatvel com mltiplas plataformas (UNIX, Windows NT, Windows Workgroup, etc); o Independncia de Implementao da Interface em relao aos SGBDs que daro condies s operaes de armazenamento de informaes (ORACLE, SYSBASE, INFORMIX, PADRO XBASE, etc). o Converso e mapeamento da diferena semntica entre os paradigmas utilizados no desenvolvimento de interfaces (Imperativo (ou procedural), Orientado a Objeto, Orientado a evento), servidores de dados (Relacional) e programao dos aplicativos (Imperativo, Orientado a Objetos). 3.2 - Vantagens dos Bancos de Dados o Potencial para obrigar a Padronizao A abordagem de base de dados permite que o DBA defina e obrigue a padronizao entre os usurios da base de dados em grandes organizaes. Isso facilita a comunicao e a cooperao entre vrios departamentos, projetos e usurios. Padres podem ser definidos para formatos de nomes, elementos de dados, telas, relatrios, terminologias, etc. O DBA pode obrigar a padronizao em um ambiente de base de dados centralizado, muito mais facilmente que em um ambiente onde cada usurio ou grupo tem o controle de seus prprios arquivos e programas de aplicao. o Flexibilidade Mudanas na estrutura de uma base de dados podem ser necessrias devido a mudanas nos requisitos. Por exemplo, um novo grupo de usurios pode surgir com necessidade de informaes adicionais, ainda no disponveis na base de dados. Alguns SGBDs permitem que tais mudanas na estrutura da base de dados sejam realizadas sem afetar a maioria dos programas de aplicaes existentes. o Reduo do Tempo de Desenvolvimento de Aplicaes Uma das principais caractersticas de venda da abordagem de base de dados o tempo reduzido para o desenvolvimento de novas aplicaes, como a recuperao de certos dados da base de dados para a impresso de novos relatrios. Projetar e

11 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

implementar uma nova base de dados pode tomar mais tempo do que escrever uma simples aplicao de arquivos especializada. Porm, uma vez que a base de dados esteja em uso, geralmente o tempo para se criar novas aplicaes, usando-se os recursos de um SGBD, bastante reduzido. O tempo para se desenvolver uma nova aplicao em um SGBD estimado em 1/4 a 1/6 do que o tempo de desenvolvimento, usando-se apenas o sistema de arquivos tradicional, devido s facilidades de interfaces disponveis em um SGBD. o Disponibilidade de Informaes Atualizadas To logo um usurio modifique uma base de dados, todos os outros usurios sentem imediatamente esta modificao. Esta disponibilidade de informaes atualizadas essencial para muitas aplicaes, tais como sistemas de reservas de passagens areas ou bases de dados bancrias. Isso somente possvel devido ao subsistema de controle de concorrncia e restaurao do SGBD. o Economia de Escala A abordagem de SGBDs permite a consolidao de dados e de aplicaes reduzindo-se, desse modo, o desperdcio em atividades redundantes de processamento em diferentes projetos ou departamentos. Isto possibilita organizao como um todo investir em processadores mais poderosos, e perifricos de armazenamento e de comunicao mais eficientes. 3.3 - Linguagens de Base de Dados o Linguagem de Definio de Dados (Data Definition Language - DDL): utilizada pelo DBA e projetistas de base de dados para definir seus esquemas. O SGBD tem um compilador para processar descries em DDL e construir a descrio do esquema armazenado no catlogo; o Linguagem de Manipulao de Dados (Data Manipulation Language - DML): uma vez que o esquema compilado e a base de dados preenchida com dados, os usurios tm que ter algum modo de manipular os dados. Manipulaes comuns como recuperao, insero, remoo e modificao de dados so realizadas pela DML.

4.0 - O que Modelo de Dados?


uma imagem grfica de toda a base de informaes necessrias para um determinado empreendimento. 4.1 - Modelo Entidade Relacionamento O Modelo Entidade-Relacionamento um modelo de dados conceitual de alto-nvel, ou seja, seus conceitos foram projetados para serem compreensveis a usurios, descartando detalhes de como os dados so armazenados; modelo proposto por Peter Chain em 1976. Sua principal finalidade identificar entidades de dados e seus relacionamentos.

12 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES 4.2 - Entidades e atributos

(**79)8115-7557

Uma entidade representa um objeto do mundo real que possui existncia prpria e cujas caractersticas ou propriedades desejamos armazenar. O objeto representado pode ser um objeto concreto (uma pessoa, um carro, um livro, etc) ou abstrato (um departamento, um projeto, um curso). As caractersticas do objeto que desejamos armazenar damos o nome de atributos. Cada atributo de uma entidade possui um nome e um valor especifico. EMPREGADO Representao de uma entidade.

Um conjunto de entidades inclui um nmero qualquer de entidades similares, ou entidades do mesmo tipo. Por entidades do mesmo tipo entenda-se entidades que possuem os mesmos atributos, cada um deles com um valor prprio. Conjuntos de entidades so representados em um diagrama entidade-relacionamento por meio de retngulos contendo o nome do tipo de entidade no seu interior e arestas ligando esses retngulos aos atributos das entidades. Os atributos aparecem, normalmente, dentro de ovais. ENDEREO NOME TELEFONE

FUNCIONRIO Na representao acima temos um conjunto de Entidades e seus atributos.

4.2.1 - Tipos de Atributos Os atributos no Modelo Entidade-Relacionamento podem ser: o Atributos Simples ou Atmicos So os atributos que no so divisveis. o Atributos compostos Podem ser divididos em vrias partes (sub-atributos) com significados independentes. O atributo Endereo de um funcionrio, por exemplo, pode ser dividido em Rua, Nmero e Bairro. NMERO RUA ENDEREO NOME BAIRRO

TELEFONE

13 FUNCIONRIO AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Representao dos atributos compostos do endereo de um funcionrio.

o Atributos Monovalorados So aqueles que possuem apenas um valor para aquela entidade. o Atributos multivalorados Podem assumir diversos valores. Como por exemplo o atributo Telefone de um funcionrio j que pode assumir diversos valores. NMERO RUA ENDEREO NOME BAIRRO

TELEFONE

FUNCIONRIO Atributos multivalorados so representados graficamente por uma oval de bordas duplas.

o Atributos derivados: Em alguns casos, dois ou mais atributos esto relacionados, por exemplo, a idade e data de nascimento de um funcionrio. Para um determinado funcionrio, podemos determinar a sua idade por meio da data de nascimento e da data atual. Atributos como a idade so chamados de atributos derivados, ao contrrio dos atributos que chamamos de armazenados. NMERO RUA ENDEREO NOME TELEFONE IDADE FUNCIONRIO BAIRRO

D. NASCIMENTO

14 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Atributos derivados so representados graficamente por uma oval de bordas pontilhadas.

Os valores correspondentes dos atributos de duas entidades no podem ser todos iguais. A lista de atributos de um conjunto de entidades deve ser suficiente para caracterizar completamente qualquer entidade do conjunto. Essas consideraes nos levam ao conceito de atributo-chave: o Atributo-chave Tipo de atributo cujos valores so distintos para cada entidade em um conjunto de entidades. O RG de um funcionrio, por exemplo, constitui um atributo-chave para o tipo de entidades FUNCIONRIO. Algumas vezes, um conjunto de atributos pode formar uma chave. Mais do que isso, alguns tipos de entidades podem ter mais que um atributo-chave. NMERO RUA ENDEREO NOME N DO RG CPF RG RGO EXP. O nome do atributo chave de um tipo de entidade geralmente aparece sublinhado. No grfico temos a representao de dois atributos-chave para o conjunto de entidade funcionrio; sendo um composto(RG) e outro simples(CPF). BAIRRO

TELEFONE

FUNCIONRIO

4.3 Relacionamentos Ao definir as entidades componentes de um diagrama entidade relacionamento, nota-se vrios relacionamentos implcitos entre elas. Sempre que um atributo de um tipo de entidade refere-se a um outro tipo de entidade, temos um relacionamento entre as entidades. Um conjunto de relacionamentos inclui um nmero qualquer de relacionamentos similares, ou relacionamentos do mesmo tipo. Por relacionamentos do mesmo tipo entende-se relacionamentos que associam os mesmos tipos de entidades.

15 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

ENDEREO

TELEFONE

NOME

FUNCIONRIO

TRABALHA NO

DEPARTAMENTO

NOME

NMERO

Na representao acima temos o relacionamento entre o funcionrio e o departamento no qual ele trabalha. Conjunto de relacionamentos so representados por meio de losangos, contendo o nome do tipo de relacionamento, conectados aos conjuntos de entidades cujos elementos ele associa.

Os relacionamentos esto associados s definies de grau, atributos e papis em um relacionamento. o Grau de um relacionamento O grau de um relacionamento corresponde ao nmero de diferentes tipos de entidades que dele participam. Os relacionamentos mais comuns so aqueles de grau dois (relacionamentos binrios). O tipo de relacionamento Trabalha NO, por exemplo, possui grau dois.

FORNECEDOR

FORNECE

PROJETO

PEA Um exemplo de tipo de relacionamento ternrio FORNECE, que associa os tipos de entidades FORNECEDOR, PEA e PROJETO.

16 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

o Atributos de um relacionamento Assim como no caso das entidades, relacionamentos tambm podem possuir certos atributos. O nmero de horas que um funcionrio trabalha em um projeto, por exemplo, pode ser visto como um atributo do relacionamento DESENVOLVE.

FUNCIONRIO

DESENVOLVE

PROJETO

HORAS

o Papis em um relacionamento Um relacionamento pode associar entidades do mesmo tipo (relacionamentos recursivos ou auto-relacionamentos). Nesse caso, necessrio o conceito de papel da entidade no relacionamento. Ele corresponde a funo que uma entidade cumpre dentro de um relacionamento. O relacionamento SUPERVISIONA, corresponde a um relacionamento recursivo que associa duas entidades de funcionrios, uma no papel de supervisor e outra no papel de supervisionado. ENDEREO

TELEFONE

SUPERVISOR

FUNCIONRIO

SUPERVISIONADO

NOME

SUPERVISIONADO

Graficamente, o papel das entidades encontra-se representado nas arestas ligando o relacionamento ao conjunto de entidades.

Relacionamentos normalmente obedecem algumas restries determinadas pela aplicao sendo projetada. So elas:

17 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

o Cardinalidade de um relacionamento(Binrio) Determina o nmero de relacionamentos dos quais uma entidade pode participar. O relacionamento do tipo TRABALHA NO, por exemplo, possui cardinalidade N:1. Ou seja, 1 departamento est associado com (ou emprega) vrios funcionrios, mas um funcionrio pode trabalhar em um nico departamento. Alm da N:1, relacionamentos podem possuir cardinalidades 1:1, 1:N e N:M. Um exemplo de relacionamento 1:1 o GERENCIA, o qual relaciona um (nico) departamento com o (nico) funcionrio que o gerencia. Um exemplo de relacionamento M:N o DESENVOLVE, que associa vrios funcionrios a vrios projetos.

ENDEREO

TELEFONE

NOME

FUNCIONRIO

GERENCIA

DEPARTAMENTO

NOME

NMERO

Cardinalidades so representadas graficamente pelos nmero 1, M e N junto as arestas que relacionam os conjuntos de entidades. Representao grfica de um relacionamento de cardinalidade 1:1.

o Restrio de Participao Determina se a existncia de uma entidade est condicionada ou no ao seu relacionamento com outra entidade. Existem dois tipos de restries de participao: total e parcial. Na primeira, uma entidade existe somente quando ela se relaciona com outra entidade via um relacionamento. Se a poltica da empresa determina, por exemplo, que todo funcionrio deve trabalhar em um departamento, ento a participao de FUNCIONRIO em TRABALHA NO total. Caso contrrio se a existncia de uma entidade independe do fato dela estar relacionada com outra, tem-se uma restrio de participao parcial. A participao de FUNCIONRIO em DESENVOLVE, por exemplo, parcial. Ou seja, nem todo funcionrio precisa desenvolver um projeto dentro da empresa.

18 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES TELEFONE NOME

(**79)8115-7557

ENDEREO

FUNCIONRIO

TRABALHA NO

DEPARTAMENTO

NOME

NMERO

A restrio de participao total representada graficamente por meio de linhas duplas ligando o conjunto de entidades ao conjunto de relacionamentos. J a participao parcial representada por meio de linhas simples.

4.4 - Entidade Fraca Tipo de entidade que depende de outra entidade para existir. Tipos de entidades que no possuem atributos chaves so denominados de fracas, diferente dos tipos de entidades que possuem (ao menos um) atributo-chave, denominadas entidades fortes (ou regulares). Entidades pertencentes a um tipo de entidade fraca so identificadas por seus atributos e suas relaes com entidades especificas de um outro tipo de entidade. Esse ltimo tipo de entidade dito proprietrio ou identificante. Um tipo de entidade fraca sempre atende a restrio de participao total no seu relacionamento com o tipo de entidade identificante. Isso porque uma entidade fraca no pode ser identificada unicamente sem uma entidade forte correspondente. Considere como exemplo o tipo de entidade DEPENDENTE que se relaciona com FUNCIONRIO. Ela utilizada na modelagem dos dependentes de cada funcionrio via um relacionamento 1:N. Os atributos de DEPENDENTE so Nome e Parentesco (com o funcionrio). Dois dependentes de dois funcionrios distintos podem ter o mesmo nome e relacionamento, mas ainda ser entidades distintas. Eles so identificados como tal apos a determinao da entidade funcionrio em particular com o qual cada dependente esta relacionado. Um tipo de entidade fraca tem, normalmente, uma chave parcial. Ela corresponde ao conjunto de atributos que pode identificar unicamente as entidades fracas relacionadas a mesma entidade proprietria. No exemplo acima, o atributo Nome do dependente chave parcial. Entidades fracas so representadas por meio de retngulos com bordas duplas. Relacionamentos envolvendo entidades fracas so representadas por meio de losangos com bordas duplas. E, normalmente, chaves parciais so sublinhadas com linhas pontilhadas.

19 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

ENDEREO

TELEFONE

NOME

FUNCIONRIO

POSSUI

DEPENDENTES

NOME

PARENTESCO

4.5 - Modelo Entidade Relacionamento Extendido O modelo ER extendido inclui todos os conceitos do modelo Entidade Relacionamento mais os de subclasse / superclasse e especializao / generalizao relacionados. Em muitos casos, um conjunto de entidades inclui vrios subconjuntos que necessitam ser representados explicitamente dada a significncia de cada um deles na aplicao sendo desenvolvida. As entidades do tipo FUNCIONRIO, por exemplo, podem ser agrupadas em SECRETRIO, ENGENHEIRO, TCNICO, etc. O conjunto de entidades em cada um desses grupos corresponde a um subconjunto das entidades em FUNCIONRIO. Em outras palavras, toda entidade em um desses grupos tambm um funcionrio. Cada um desses grupos chamado de subclasse do tipo de entidade FUNCIONRIO. O tipo de entidade FUNCIONRIO, por sua vez, dito superclasse de cada uma das subclasses. Uma entidade da subclasse e da superclasse representam a mesma entidade do mundo real. Uma entidade Joo Fernando" do tipo SECRETRIO, por exemplo, tambm o funcionrio Joo Fernando". Uma entidade no pode existir na base de dados como sendo membro apenas de uma subclasse. Entretanto, no necessrio que toda entidade em uma superclasse seja membro de alguma subclasse. Vale observar que uma entidade membro de uma subclasse herda todos os atributos da entidade membro correspondente da superclasse. 4.5.1 - Especializao e Generalizao Especializao o processo de definir um conjunto de subclasses de um tipo de entidade. O conjunto de subclasses que formam uma especializao definida com base em alguma(s) caracterstica(s) que distingue as entidades da superclasse. O conjunto de subclasses SECRETRIO, ENGENHEIRO e TCNICO, por exemplo, uma especializao da superclasse FUNCIONRIO onde a diferenciao entre os funcionrios faz-se por meio do tipo de emprego de cada entidade.

20 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Uma especializao representada diagramaticamente por meio de linhas ligando as subclasses que definem a especializao a um circulo que, por sua vez, esta ligado por uma linha superclasse. Alm disso, tem-se o smbolo de contido em cada uma das linhas que conecta as subclasses superclasse indicando a "direo" da especializao. Atributos que se aplicam somente a entidades de uma subclasse em particular encontram-se associados aos retngulos representando aquela subclasse. Esses atributos so chamados de atributos especficos da classe. Similarmente, uma subclasse pode participar de relacionamentos especficos. o caso, por exemplo, de tcnicos que ministram cursos. O processo inverso ao da especializao, ou seja, o processo onde suprimimos as diferenas entre vrios tipos de entidades, identificamos suas caractersticas em comum e as generalizamos em uma nica superclasse chamado de generalizao. Por exemplo, os tipos de entidades CARRO DE PASSEIO e CAMINHO podem ser generalizados no tipo de entidade VECULOS. NMERO RUA ENDEREO NOME TELEFONE BAIRRO

CPF

FUNCIONRIO

GRAU ESCOLAR

TCNICO

SECRETRIA

ENGENHEIRO

DATA NASC. MINISTRA

TIPO

CURSO Representao de uma especializao de Funcionrio.

21 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

4.6 Operaes: Exemplos de algumas operaes para atualizao de bases de dados relacionais: o Insert A operao Insert prove uma lista de valores de atributos de uma nova tupla a ser inserida em uma relao. Exemplo: Insert <Jos, 68760317502, 09/09/1979, 2> em FUNCIONRIO. o Delete A operao Delete executa a remoo de uma ou mais tuplas especificadas por meio de condies associadas a determinados atributos da relao. Exemplo: Delete a tupla de FUNCIONRIO com CPF = '68760317502. o Update A operao Update modifica os valores de um ou mais atributos de uma tupla de uma certa relao. Aqui tambm a tupla especificada por meio de condies associadas a determinados atributos da relao. Exemplo: Update o CPF da tupla de FUNCIONRIO com CPF = '68760317502' para '79871428613'. Cada uma das trs operaes acima pode violar uma ou mais restries de integridade. A operao Insert, por exemplo, pode violar quatro restries integridade (de domnio, de chave, de integridade e de integridade referencial). Quando isso ocorre, comum rejeitar a insero da nova tupla. Com relao a operao Delete, ela pode violar a restrio de integridade referencial. Quando isso ocorre, ou a operao de remoo rejeitada ou propagada por meio da remoo das tuplas que referenciam a tupla inicialmente removida. Assim como a Insert, a operao Update tambm pode violar as quatro restries de integridade citadas.

5.0 - Tipos de Sistemas Gerenciadores de Banco de Dados


5.1 - dBASE dBASE foi o primeiro SGBD largamente utilizado industrialmente, pelo Apple II, Apple Macintosh e PC's IBM para DOS, onde se tornou um dos softwares mais vendidos durante alguns anos. O dBASE nunca conseguiu migrar com sucesso para a plataforma Microsoft Windows, e foi, em alguns casos, substitudo por novos produtos, como Paradox, Clipper, FoxPro e Microsoft Access. dBase foi vendido para a Borland em 1991, que vendeu os direitos da linha de produtos, em 1999, para a recm-formada dBASE Inc.

22 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

A partir de meados dos anos oitenta, muitas outras companhias produziram seus prprios "dialetos" ou variaes do produto e da linguagem. Entre esses, esto: FoxPro (atual Visual FoxPro), Arago, Force, Recital, dbFast, dbXL, QuickSilver, Clipper, xBase++, FlagShip e Harbour. Todos foram chamados de xBase. O formato de arquivo do dBase, o DBF, muito usado por diversos aplicativos que precisam somente de um formato para armazenar seus dados estruturadamente. A licena do dBase foi entregue aos usurios com a validade de 50 anos, prevenindo-se contra a improvvel chance de um usurio utilizar sua cpia do dBase por um extenso perodo de tempo. Origens O desenvolvedor original do dBase foi Wayne Ratliff. Em 1978, enquanto trabalhava no Jet Propulsion Laboratory, Ratliff escreveu um programa de banco de dados em linguagem assembly para microcomputadores rodando CP/M para ajud-lo a ganhar uma aposta realizada no escritrio sobre quem seria o ganhador de um campeonato de futebol. O programa foi baseado no JPLDIS (Jet Propulsion Laboratory Display Information System) de Jeb Long e intitulado "Vulcan", em homenagem ao Sr. Spock de Jornada nas Estrelas. De acordo com Ratliff, a linguagem utilizada no JPLDIS era uma linguagem simples, orientada a comandos, que objetivava o uso interativo em terminais de impresso. Existem alguns indcios de que JPLDIS foi influenciado por um produto de banco de dados de mainframe chamado RETRIEVE. No final dos anos 1980, George Tate, da Ashton-Tate, firmou um contrato de marketing com Ratliff. Vulcan foi renomeado para dBase, e o software rapidamente se tornou um grande sucesso. A linguagem de programao dBASE Depois deportar o Vulcan para o IMSAI 8080 e depois para o CP/M e MS-DOS (como dBase), Ratliff adicionou comandos para acomodar a interface de vdeo, bem como comandos mais avanados para controle de fluxo (tais como DO WHILE / ENDDO) e lgica condicional (tais como IF / ENDIF). Para manipulao de dados, dBase oferecia comandos e funes procedurais sofisticados para abrir e pesquisar arquivos (p.ex: USE, SKIP, GO TOP, GO BOTTOM, e GO recno), manipular o valor de campos (REPLACE e STORE), e manipular strings (p.ex.: STR() e SUBSTR()), nmeros e datas. Sua capacidade de abrir e manipular simultaneamente diversos arquivos contendo dados relacionados levou a Ashton-Tate a rotular o dBase como uma "base de dados relacional", muito embora o produto no atendesse os critrios definidos pelo modelo relacional do Dr. Edgar F. Codd. O dBase era uma linguagem interpretada, que permitia ao usurio executar comandos digitando-se em uma linha de comando. Digitando um comando e pressionando a tecla Entra, o interpretador imediatamente iria execut-lo. De maneira similar, programas (arquivos texto com extenso PRG) rodavam em um interpretador (com o comando DO), onde cada comando e varivel eram processados em tempo de execuo. Isso fazia com que os programas dBase fossem simples e rpidos de escrever e testar porque os programadores no tinham que primeiro compil-los antes de execut-los. (Em outras linguagens, esses passos eram tediosos nos tempos das CPUs com apenas algumas dezenas de megahertz). O interpretador tambm gerenciava automaticamente e dinamicamente a memria (no havia pr-alocao de memria nem

23 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

notao hexadecimal), o que, mais do que outras funcionalidades, tornava possvel para um usurio sem experincia de programao desenvolver aplicaes. Por outro lado, a facilidade de uso e a simplicidade apresentada pelo dBase comeou a se tornar uma limitao medida que seus usurios tornavam-se mais especializados e programadores profissionais eram chamados para utiliz-lo. Aplicaes mais complexas e mais crticas demandaram funcionalidades de programao profissional para maior robustez e desempenho, bem como maior produtividade do programador. Com o tempo, os competidores da Ashton-Tate introduziram os chamados produtos e compiladores "clones", que introduziam funcionalidades de programao mais robustas, tais como funes definidas pelo usurio (UDFs) para complementar as funes bsicas contidas no produto, variveis com escopo definido, com menor possibilidade de serem afetadas por processos externos, arrays para manuseio de dados complexos, funcionalidades de empacotamento para a entrega de aplicaes na forma de arquivos executveis sem interpretadores em tempo de execuo, sintaxe orientada a objeto, e interfaces para o acesso aos dados de gerenciadores de bancos de dados externos. A Ashton-Tate tambm implementou diversas dessas funcionalidades, com graus variveis de sucesso. A Ashton-Tate e seus competidores tambm comearam a incorporar SQL, a linguagem padro ANSI/ISO para criao, alterao e recuperao de dados armazenados em SGBDs. No final dos anos 1980, grupos de desenvolvedores criaram um padro para a linguagem dBase (IEEE 1192). Foi ento que a linguagem passou a ser chamada de "Xbase" para distingu-la do produto da Ashton-Tate. Centenas de livros foram escritos sobre programao dBase e Xbase. Atualmente, implementaes da linguagem dBase incluem muitas funcionalidades direcionadas para aplicaes de negcios, incluindo a manipulao de interface de usurio grfica (GUI), manipulao de dados remotos e distribudos, uso da Internet e interao com dispositivos modernos. A despeito de sua funcionalidade e facilidade de uso, o legado da linguagem dBase de ter sido "embutida" dentro de um produto comercial popular uma das razes pela qual ela no um padro dominante hoje em dia. Formato de arquivo .dbf Um dos maiores legados do dBase seu formato de arquivo .dbf, que foi amplamente adotado. O sistema de banco de dados dBase foi um dos primeiro a prover uma seo de cabealho (header) para descrever a estrutura dos dados dentro do arquivo. Isso significa que o programa no mais necessitava conhecimento avanado da estrutura de dados, mas poderia perguntar diretamente ao arquivo de dados como este estava estruturado.

24 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

5.2 - MySQL Histria do MySQL O MySQL surgiu a partir da necessidade da equipe que criou o SGBD, de utilizar algum mecanismo que permitisse a conexo de tabelas criadas na linguagem SQL para um determinado fim. A princpio, o grupo iria utilizar o mSQL, mas logo perceberam que esta ferramenta no era rpida o suficiente para atender s necessidades do projeto. O jeito foi criar uma soluo prpria. Nascia o MySQL. O MySQL foi criado por Michael Widenius na companhia sua TcX. Por volta de 1979 Michael desenvolveu um banco de dados chamado UNIREG, sendo rescritos em vrias linguagens desde ento" . Em 1994, a empresa TcX comeou o desenvolvimento de aplicaes baseadas na Web, tendo como base o banco UNIREG, porm esse banco possua muito "overhead" para obter sucesso em uma aplicao para gerao de pginas dinmicas na Web. Ento a empresa TcX comeou a procurar por outro banco o mSQL, uma ferramenta baseada em SQL mas com caractersticas pobres no possuindo por exemplo suporte a ndices, e com desempenho inferior ao UNIREG. Foi ento que o desenvolvedor do banco UNIREG contatou o David Hughes criador do mSQL, para saber do interesse dele em unir os dois bancos. Sendo positivo o interesse de David , a empresa TcX resolveu desenvolver um novo banco, mas mantendo ao mximo a compatibilidade com mSQL. TcX foi esperta o suficiente para no reinventar o que j estava bem feito, ela construiu seu servidor baseado na estrutura que j estava montada do UNIREG e utilizou grande nmero de utilitrios escritas para mSQL e fez API's para o novo servidor praticamente iguais ao mSQL. Como resultado usurios do mSQL que decidissem mudar para o novo servidor da TcX, teriam apenas que fazer pequenas e simples mudanas nos cdigos existentes. Ento foi em maio de 1995 que, definitivamente, a primeira verso do MySQL foi lanada. Um dos parceiros da TcX sugeriu a distribuio do servidor na Internet, o objetivo disso era a utilizao de um modelo pioneiro desenvolvido por Aladdin Peter Deutsch. O resultado foi um maior flexibilidade em sem "copyright", que fez do MySQL mais difundido gratuitamente do que mSQL.

25 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

O Banco de Dados MySQL Desenvolvido pela TCX em 1996. Atualmente a MySQL AB desenvolve o programa. MySQL AB a companhia dos fundadores e principais desenvolvedores do MySQL. Eles criaram-no porque precisavam de um banco de dados relacional que pudesse tratar grandes quantidades de dados em mquinas de custo relativamente barato. O MYSQL um dos bancos de dados relacionais mais rpidos do mercado, apresenta quase todas as funcionalidades dos grandes bancos de dados . MySQL uma linguagem simples, em que voc facilmente pode gravar, alterar e recuperar informaes num web site com segurana e rapidez O MYSQL executado, principalmente, em sistemas que participam da filosofia UNIX, embora outros sistemas S.O tambm fornecem suporte, como Windows, por exemplo. O MYSQL um sistema de gerenciamento de banco de dados relacional multiencadeado, de cdigo fonte aberto e nvel corporativo. O MySQL no apenas um banco de dados, mas sim um gerenciador de banco de dados. Com este SGBD (Sistema Gerenciador de Banco de Dados), tambm pode ser utilizado para aplicaes corporativas, o qual, necessitam de varias conexes simultneas, que possibilita 101 conexes simultneas. Uma conexo o tempo que leva para o usurio receber o dado solicitado. MySQL a soluo robusta para quase todo tipo de aplicao, combine a estabilidade do MySQL com seu baixo custo de propriedade e rapidamente voc ir consider-lo indispensvel. O MySQL oferece o melhor cenrio de todos SGBD, executa em muitas plataformas, oferece um baixo TCO (custo total de propriedade) e muito estvel . O MySQL um sistema de gerenciamento de bancos de dados relacional. Um banco de dados relacional armazena dados em tabelas separadas em vez de colocar todos os dados um s local. Isso proporciona velocidade e flexibilidade. O Servidor MySQL foi desenvolvido originalmente para lidar com bancos de dados muito grandes de maneira muito mais rpida que as solues existentes e tem sido usado em ambientes de produo de alta demanda por diversos anos de maneira bem sucedida. Apesar de estar em constante desenvolvimento, o Servidor MySQL oferece hoje um rico e proveitoso conjunto de funes. A conectividade, velocidade, e segurana fazem com que o MySQL seja altamente adaptvel para acessar bancos de dados na Internet. O Programa de Banco de Dados MySQL um sistema cliente/servidor que consiste de um servidor SQL multitarefa que suporta acessos diferentes, diversos programas clientes e bibliotecas, ferramentas administrativas e diversas interfaces de programao (API's). Tambm concedemos o Servidor MySQL como uma biblioteca multitarefa que voc pode ligar sua aplicao para chegar a um produto mais rpido, menor e mais facilmente gerencivel.

26 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Caractersticas do MySQL o Multi-plataforma, portanto suporta diferentes plataformas: Win32, Linux, FreeBSD, Unix, etc... o Suporte a mltiplos processadores o Um sofisticado sistema de senhas criptografadas flexvel e Seguro. o Suporta at 16 ndices por tabela o Cdigo fonte escrito em C e C++ e testado com uma variedade de diferentes compiladores o As tabelas criadas podem ter tamanho de at 4 GB o Banco de dados de cdigo aberto e gratuito o Suporte s APIs das Seguintes linguagens: PHP, Perl, C,C++,Java, Pynthon, etc... o Suporte ODBC, voc pode facilmente conectar o Access a um banco de dados do MySQL o O Cliente conecta no MySQL atravs de conexes TCP/IP. o Nenhum problema com o Y2K, visto que o MySQL usa o relgio do Unix que no apresentar problemas at 2069 o Capacidade para manipular bancos com at 50 milhes de registros o Reduz a administrao, engenharia e a sustentao custa por at 50%. Segurana no MySQL

O MySQL possu componentes de segurana contra ameaas externas como crackers e outros, e tambm proteger os dados dos prprios usurios. O mysql apresenta vrios nveis de segurana em relao ao acesso. Todas as informaes de segurana esto armazenadas no banco mysql, A filosofia de segurana em banco de dados refere-se a fornecer ao usurio apenas o que essencial para o seu trabalho. O MySQL gratuito? Pessoas confundem "free" com "grtis" o que comum aqui no Brasil. Mas em se tratando de software este "free" de open source e no gratuito. Para poder utilizar o MySQL sob a licena GPL e no precisar pagar, o produto desenvolvido precisa ser GPL tambm, seno, orientamos a compra da licena comercial, com baixo custo, sendo comercializada por servidor, sem limites de usurios e processadores e ainda com garantia perptua de atualizao de verso para o resto da vida.

27 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES O MySQL um banco de dados departamental?

(**79)8115-7557

O MySQL regido pela licena GPL, portanto open source. Muitas e analisarmos o investimento necessrio para aquisio do mesmo, podemos dizer que cabe como uma soluo departamental. Entretanto o que muitos assustam que empresas como Nasa, Cisco, Telefnica da Sucia, Yahoo Finance, Nokia e outras mais tem utilizado o MySQL em aplicaes de misso crtica. COMANDOS Todo comando SQL termina com um ' ; '. o CREATE DATABASE Cria um banco de dados. Este comando cria uma rea lgica, diretrio, onde estaro armazenadas todas as tabelas do banco de dados. Ex: mysql>CREATE DATABASE funcionrios; o DROP DATABASE Apaga um banco de dados. Ex: mysql>DROP DATABASE funcionrios; o CREATE TABLE Comando utilizado para criar tabelas. Ex: mysql>CREATE TABLE alunos (matricula UNSIGNED INT(10) NOT NULL, nome CHAR(40) NOT NULL,turma CHAR(20) NOT NULL, PRIMARY KEY (matricula)); o ALTER TABLE Altera Tabela Ex: mysql>ALTER TABLE alunos ADD COLUMN turno char(10) NOT NULL o DROP TABLE Apaga uma tabela. Ex: mysql>DROP TABLE alunos; o INSERT Comando utilizado para inserir valores numa tabela. Ex: mysql>INSERT INTO alunos(matricula,nome,turma,turno)values (127423,'Fred Cox Junior','Eng. Eletrnica','Manh');

28 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES o SELECT

(**79)8115-7557

Comando usado para recuperar valores de uma tabela. Este poderoso comando, em conjunto com funes, possibilita a recuperao de qualquer valor de uma tabela. Ex: mysql>SELECT * FROM alunos where nome='Fred Cox Junior'; mysql>SELECT matricula,turno FROM alunos ORDER BY matricula asc; o DELETE Apaga registros em uma tabela. Se no for especificada a condio where, todos os dados sero apagados. Ex: Mysql>DELETE FROM alunos WHERE turno='Manh'; o UPDATE Altera dados numa tabela. Ex: mysql>DROP TABLE alunos;

5.3 - PostgreSQL O PostgreSQL um banco de dados relacional e orientado a objetos. Seu grande triunfo possuir recursos comuns banco de dados de grande porte, o que o deixa apto a trabalhar, inclusive, com operaes de misso crtica. Alm disso, trata-se de um banco de dados verstil, seguro e gratuito. possvel utilizar o PostgreSQL em vrios sistemas operacionais, dentre os quais o Windows, Linux, BSDs ou em qualquer sistema compatvel com as especificaes POSIX (Portable Operating System Interface). Segundo informaes do site oficial, o PostgreSQL permite a criao de uma base de dados de tamanho infinito. Cada tabela pode ter at 16 TB, sendo que cada linha pode ter at 1,6 TB e cada campo 1 GB. O banco de dados ainda conta com conexes SSL, MVCC, triggers, integridade referencial, entre outros recursos, alm de ser compatvel com uma srie de linguagens, tais como PHP, Python, Java, Perl, etc. O uso do PostgreSQL muito amplo, pois vrias empresas perceberam que com ele podem criar bases de dados complexas sem a necessidade de gastar altos valores na

29 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

aquisio de licenas. Outra vantagem, que o PostGreSQL possui uma documentao muito abrangente, o que permite suporte adequado s necessidades. Uma das empresas que so citadas como exemplo do uso deste banco de dados a Afilias, entidade responsvel por manter e registrar domnios .org na Internet. Breve histria do PostgreSQL O PostgreSQL teve seu incio na University of California at Berkeley, no ano de 1986, onde Michael Stonebraker liderou um projeto para a criao de um servidor de banco de dados relacionais, chamado de Postgres. Essa tecnologia foi ento comprada pela Illustra, empresa posteriormente adquirida pela Informix. Porm, mesmo diante disso, dois estudantes de Berkeley (Jolly Chen e Andrew Yu) compatibilizaram o Postgres linguagem SQL (Structured Query Language). Este projeto recebeu o nome de Postgres95. Em 1996, quando o projeto estava estvel, o banco de dados recebeu o nome de PostgreSQL. No entanto, enquanto ainda possuia o nome Postgres95, o banco de dados teve vrias mudanas. O seu cdigo foi totalmente revisado e a linguagem SQL foi definida como padro. O banco de dados PostgreSQL mantido por vrias pessoas do mundo, principalmente por colaboradores dos Estados Unidos, Canad, Rssia e Japo. Neste grupo, esto empresas que patrocinam o projeto, pesquisadores de universidades e companhias de computao. PostgreSQL x MySQL Ambos os bancos de dados so eficientes e gratuitos. A grande dvida que surge, saber qual desses SGBDs utilizar para certas aplicaes. Como o PostgreSQL foi criado para ter vrios recursos e assim proporcionar suporte a tarefas complexas, seu uso mais indicado em aplicaes com grande volume de dados ou que tratam de informaes crticas, onde o banco de dados grande, ou seja, possui uma quantidade alta de tabelas e campos. Assim, para uma loja de comrcio eletrnico, por exemplo, cujo volume de pedidos alto, o PostgreSQL muito eficiente para tratar dos dados. O MySQL, por sua vez, tem como foco a agilidade. Assim, se sua aplicao necessita de respostas rpidas e no complexa, o MySQL uma escolha muito interessante, pois sua otimizao permite velocidade alta de processamento e tempo curto de resposta. Se voc precisa de um banco de dados para trabalhar com o contedo do seu site, frum, cadastro de usurios, entre outros, o MySQL uma escolha adequada. Isso porque aplicaes como estas no necessitam dos recursos sofisticados que o PostgreSQL oferece, por exemplo. Para escolher entre um destes dois SGBDs, primeiro procure o foco de cada um. Como j dito, o PostGreSQL busca oferecer recursos avanados. O foco principal do MySQL a agilidade. Assim, analise primeiro os recursos de que vai precisar. Se baseie no seguinte exemplo: voc no precisa comprar um nibus se sua famlia pode muito bem ser transportada num carro de 5 lugares. A grande resposta da questo verificar quais os recursos necessrios e escolher o SGBD que melhor se adapta a eles. Se voc escolher o PostgreSQL para operaes simples, poder perder tempo e desperdiar recursos. Da mesma forma, se escolher o MySQL para aplicaes de porte maior, poder ter problemas com o gerenciamento dos dados.

30 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

5.4 - Oracle O sistema gerenciador de banco de dados Oracle surgiu no final dos anos 70, quando Larry Ellison vislumbrou uma oportunidade que outras companhias no haviam percebido, quando encontrou uma descrio de um prottipo funcional de um banco de dados relacional e descobriu que nenhuma empresa tinha se empenhado em comercializar essa tecnologia. Ellison e os co-fundadores da Oracle Corporation, Bob Miner e Ed Oates, perceberam que havia um tremendo potencial de negcios no modelo de banco de dados relacional tornando assim a maior empresa de software empresarial do mundo. O SGBD da Oracle lder de mercado. O Oracle 9i foi pioneiro no suporte ao modelo web. O Oracel 10g, mais recente, se baseia na tecnologia de grid. Alm do base de dados, a Oracle desenvolve uma sute de desevolvimento chamada de Oracle Developer Suite, utilizada na construo de programas de computador que interagem com a sua base de dados. A Oracle tambm criou a linguagem de programao PL/SQL, utilizada no processamento de transaes. 5.5 - Microsoft SQL Server Criado pela Microsoft, o MS SQL Server um gerenciador de Banco de dados relacional. um Banco de dados, muito robusto e usado muito em empresas e por grandes sistemas corporativos. Atualmente encontra-se na verso 2005. Entre os novos recursos est a integrao com o Framework .Net, que possibilita construir rotinas utilizando as linguagens do .Net como VB.Net e C#. O MS SQL Server tem verses unicamente para as diversas verses do sistema operacional Windows, da Microsoft, ao contrrio do seu grande concorrente, Oracle, que funciona em diversas plataformas e sistemas operacionais diferentes. Suas ferramentas de gerenciamento so nativas, no necessitando que sejam adquiridas separadamente. So elas : MS SQL Enterprise Manager (Console Central que integra num nico painel, a maioria das funes que um DBA poder utilizar-se para configurar e gerenciar esse RDBMS, o Query Analyzer que permite executar querys e auxilia o gerenciamento, inclusive em Tunning, o Profile que uma espcie de Trace, descortinando os comandos que o gerenciador est executando, alm de outras ferramentas.

31 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES 5.6 - Microsoft Access

(**79)8115-7557

O Microsoft Access (Microsoft Office Access), tambm conhecido por MSAccess, um sistema relacional de administrao de banco de dados da Microsoft, includo no pacote do Microsoft Office Professional, que combina o Microsoft Jet Database Engine com uma interface de usurio grfica. Ele permite o desenvolvimento rpido de aplicaes que envolvem tanto a modelagem e estrutura de dados como tambm a interface a ser utilizada pelos usurios. Microsoft Access capaz de usar dados guardados em Access/Jet, Microsoft SQL Server, Oracle, ou qualquer recipiente de dados compatvel com ODBC. Desenvolvedores de software e arquitetos de dados experientes costumam us-lo para desenvolver complexos e potentes programas de aplicao. O desenvolvimento da estrutura de dados se d de forma muito intuitiva, bastando que o desenvolvedor possua conhecimetos bsicos em modelagem de dados e lgica de programao. Programadores relativamente inexperientes e usurios determinados podem us-lo para construir aplicaes simples, sem a necessidade de utilizar ferramentas desconhecidas. O programa oferece suporte substancial para tcnicas de orientaoobjeto (OO), porm no chega a ser uma ferramenta completa de desenvolvimento OO. Utilizao Geralmente uma aplicao desenvolvida com o Access atravs da linguagem de programao VBA (Visual Basic for Applications) consiste em dois arquivos, um que se denomina BackEnd, onde ficam armazenadas todas as tabelas com seus respectivos relacionamentos, e outro denominado FrontEnd, onde ficam armazenados os cdigos fontes, formulrios, mdulos, consultas, macros, etc. O cdigo fonte pode ser compilado, mas no possvel gerar um executvel. Para rodar os aplicativos desenvolvidos necessrio que o usurio possua em sua estao de trabalho o MSAccess instalado ou pelo menos o seu Runtime que vem a ser uma verso enxuta do MSAccess que servir apenas para rodar os aplicativos sem a possibilidade de desenvolvimento. Com o Microsoft Access possvel desenvolver desde aplicaes simples como por exemplo, um cadastro de clientes, controle de pedidos at aplicaes mais complexas, como por exemplo, todo o controle operacional, administrativo e financeiro de uma pequena ou at mesmo de uma mdia ou grande empresa, pois os aplicativos desenvolvidos podem rodar perfeitamente em uma rede de computadores e os dados armazenados pelo sistema podem ser publicados na Intranet ou at mesmo na Internet. Access pouco escalvel se o acesso aos dados for feito via uma rede, portanto qualquer aplicao que seja usado por mais de um punhado de pessoas tende depender em solues com base no Cliente-Servidor. Porm, um Access do tipo "front end" (as formas, os relatrios, pedidos de busca e cdigos VB) pode ser usado paralelamente diversos tipos de "back ends", incluindo o prprio Access, o Microsoft SQL Server, o Oracle ou qualquer outro produto compatvel com ODBC. Esse mtodo permite ao desenvolvedor a mudana dos dados de uma aplicao madura para um servidor mais avanado sem sacrificar o projeto em andamento.

32 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES Caractersticas

(**79)8115-7557

Um dos benefcios do Access sua relativa compatibilidade com o SQL buscas podem ser visualizadas e editadas como sendo indicaes de SQL, e estes por sua parte podem ser usados diretamente em Macros e Mdulos VBA para manipular tabelas do prprio Access. Usurios podem misturar e usar ao mesmo tempo VBA e Macros para formulrios de programao e lgica, alm de serem oferecidos possibilidades com tcnicas de orientao-objeto. A funo "cortar e colar"(cut and paste) do Access pode torn-lo uma ferramenta til para a conexo entre diversos bancos de dados (por exemplo, entre o Oracle e o Microsoft SQL Server durante converses de dados ou bancos de dados). Access disponibiliza vrias funes de exportao e importao (import and export), que permitem a integrao entre o Windows e outras aplicaes de plataforma, muitas das quais podem ser executadas dentro das prprias aplicaes ou manualmente pelo usurio. A partir do MS Access 2000, h uma sintaxe que permite a criao de pedidos de busca com parmetros, semelhante criao de procedimentos armazenados, porm tais procedimentos so limitados uma declarao por procedimento. O Microsoft Access permite que formulrios contenham cdigos que so ativados medida que mudanas so feitas uma tabela subjacente (contanto que as modificaes so feitas apenas com aquele formulrio), e comum usar buscas "pass-through" e outras tcnicas no Access para ativar procedimentos armazenados em RDBMSs que suportam este tipo de sistema. Em arquivos de projeto de banco de dados do Access ADP (suportado em MS Access 2000 e adiante), as ferramentas relacionadas aos bancos de dados so completamente diferentes, uma vez que este tipo de arquivo conectado ao MSDE ou ao Microsoft SQL Server, ao invs de usar o motor Jet. Deste modo, ele suporta a criao de quase qualquer objeto no servidor subjacente (tabelas com restries e gatilhos, visualizaes, procedimentos armazenados e UDF's). Contudo apenas formulrios, relatrios, macros e mdulos so armazenados no arquivo ADP (outros objetos so armazenados no banco de dados "back end"). Desenvolvimento A linguagem de programao disponvel no access a Microsoft Visual Basic for Applications, igualmente outros produtos da srie Microsoft Office. Duas bibliotecas de componentes COM de acesso de banco de dados so providenciadas: a legacy Data Access Objects (DAO), apenas disponvel com o Access, e o novo ActiveX Data Objects (ADO). Microsoft Access facilmente aplicado projetos pequenos porm sofre problemas de escala com projetos maiores se as aplicaes forem mal desenvolvidas. Todas as buscas no banco de dados, formulrios e relatrios so armazenados no banco de dados, e visando os ideais de um modelo relacional, no h possibilidade de montar uma hierarquia estruturada fisicamente a partir deles. Uma tcnica de desenvolvimento dividir uma aplicao Access entre dados e programas. Um banco de dados deve conter apenas tabelas e relaes, enquanto outro contm todos os programas, formulrios, relatrios e pedidos de busca, assim como as conexes para as tabelas do primeiro banco de dados.

33 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Infelizmente, o Access no permite trilhas quando so feitas as conexes, e o ambiente de desenvolvimento deve ter a mesma trilha do ambiente de produo, embora seja possvel escrever sua prpria rotina de "conexo dinmica" em VBA, que pode procurar um arquivo "back end" especfico atravs de uma pesquisa dentro da rvore do diretrio, se no puder encontr-lo no caminho atual.Esta tcnica tambm permite que o desenvolvedor divida a aplicao entre arquivos diferentes, sendo ento possvel uma certa estrutura. 5.7 - Data Warehouse O que um Data Warehouse? Um data warehouse (ou armazm de dados, ou depsito de dados) um sistema de computao utilizado para armazenar informaes relativas s atividades de uma organizao em bancos de dados, de forma consolidada. Caracteriza-se de um ambiente estruturado, extensvel, projetado para a anlise de dados no volteis, lgica e fisicamente transformados, provenientes de diversas aplicaes, alinhados com a estrutura da empresa, atualizados e mantidos por um longo perodo de tempo. Antes da popularizao dos data warehouse e das ferramentas ERP (Enterprise Resource Planning), uma verdadeira integrao dos dados no existia, pois os antigos sistemas integrados trocavam dados na forma que atendesse s necessidades de cada um deles, mas essa pequena integrao sequer se aproxima do que se v hoje nos ERP. Cada aplicativo tinha uma viso do que era um cliente, um produto ou uma operao, uma viso corporativa das informaes disponiveis era praticamente fico. A ERP e o data warehouse podem suprir estas deficiencias, integrando dados, provendo dados histricos, e permitindo a recuperao de informaes de forma sinttica ou analtica. O data warehouse possibilita a anlise de grandes volumes de dados, coletados dos sistemas transacionais . So as chamadas sries histricas que possibilitam uma melhor anlise de eventos passados, oferecendo suporte s tomadas de decises presentes e a previso de eventos futuros. Por definio, os dados em um data warehouse no so volteis, ou seja, eles no mudam, salvo quando necessrio fazer correes de dados previamente carregados. Os dados esto disponveis somente para leitura e no podem ser alterados. Caractersticas Um sistema de Data Warehouse possui quatro caractersticas bsicas: o Organizado por Temas Um DW orientado por temas armazena informaes sob a forma de assuntos diferentes entre si e que so considerados importantes para o negcio da empresa. Alguns exemplos de temas utilizados em projetos deste tipo so: produtos, atividades, contas, clientes, etc. Nos projetos de sistemas tipicamente transacionais h uma organizao norteada por aplicaes funcionais. Num hospital, por exemplo, temos os sistemas de admisso de pacientes (internao), o sistema de faturamento, o sistema de controle de estoque, controle de infeco hospitalar, entre muitos outros. Estes sistemas esto organizados

34 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

pela funo desempenhada por cada setor a fim de suprir as necessidades de controle das informaes do dia a dia da entidade. o Integrado A integrao do DW diz respeito consistncia de denominaes, das unidades dos valores contidos nas tabelas e outras padronizaes aplicadas aos dados no sentido de que estes sejam transformados at estarem num estado uniforme. Um exemplo clssico refere-se varivel sexo do paciente. Em uma determinada aplicao transacional podemos ter codificado o sexo do indivduo com "M" para masculino e "F" para feminino, j em outra aplicao podemos representar este item com "1" para masculino e "0" para feminino, chegando at mesmo a uma terceira configurao com "H" para homens e "M" para mulheres. Este ltimo caso poderia acarretar em uma duplicidade de dados que no podem ser considerados iguais, que o caso do "M" que tanto pode representar Mulheres como o sexo Masculino. medida que os dados so carregados no DW, necessrio convert-los para um estado uniforme, ou seja, codificar a varivel sexo com apenas um formato, por exemplo, "M" para masculino e "F" para feminino. A padronizao ou integrao serve para fornecer uma maior confiabilidade nas comparaes que sero feitas durante as anlises solicitadas pelos usurios do sistema de DW. o Variante no Tempo Os dados contidos num DW so temporais, ou seja, referem-se a perodos de tempo bem definidos, e isto auxilia na anlise e na confirmao de acontecimentos sazonais dentro de uma determinada atividade ou ramo de negcio. As sries temporais empregam caractersticas especficas ao ambiente do DW que deve ser programado para permitir o gerenciamento dos dados representativos da coexistncia de intervalos de tempo com informaes que sero analisadas e comparadas constantemente. Muitas vezes possvel verificar a presena em sistemas de processamento analtico os dados representativos de dias e meses, sendo necessrio controlar por exemplo o nmero de dias contidos em um ms ou em um ano, em que dia da semana est o primeiro dia do ms ou ainda quantas semanas tem o ms ou o ano. o No Voltil Um sistema de DW deve permitir apenas uma carga inicial dos dados e posteriormente oferecer estes mesmos dados para consultas dos usurios. Este ambiente conhecido por "load-and-access" (carga e acesso). Os dados integrados e transformados so carregados para o DW na forma de blocos de informaes, ficando disposio dos usurios para consultas e comparaes. J no ambiente operacional temos uma situao diferente: os dados so atualizados de forma atmica, registro a registro, em vrias transaes durante todo o tempo de uso das aplicaes. Para assegurar a integridade e confiabilidade dos dados so necessrias diversas operaes como rollback, recuperao de falhas, commits e bloqueios. Os controles tradicionais dos sistemas orientados a transaes no so necessrios em DWs uma vez que os dados carregados so quase sempre oriundos daqueles sistemas e, conseqentemente, j passaram pelo crivo de controle.

35 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Arquitetura de armazenamento Um Data Warehouse pode armazenar grandes quantidades de informao, s vezes divididas em unidades lgicas menores que so chamadas de Data Marts. O esquema de dados mais utilizado o Star Schema (Esquema Estrela), tambm conhecido como Modelagem Multidimensional. Apesar de bastante utilizado, no existe um padro na indstria de software para o armazenamento de dados. Existem, na verdade, algumas controvrsias sobre qual a melhor maneira para estruturar os dados em um Data Warehouse. Geralmente, o Data Warehouse no armazena informaes sobre os processos correntes de uma nica atividade de negcio, mas sim cruzamentos e consolidaes de vrias unidades de negcios de uma empresa. Modelagem Os sistemas de base de dados tradicionais utilizam a padronizao no formato de dados para garantir consistncia dos dados e uma minimizao do espao de armazenamento necessrio. Entretanto, frequentemente as transaes e consultas em bases de dados normalizadas so lentas. Um Data Warehouse utiliza dados em formato mais de-normalizados (formato livre). Isto aumenta a performance das consultas e, como benefcio adicional, o processo torna-se mais intuitivo para os utilizadores usurios comuns. 5.7.1 Metadado O conceito Metadado considerado como sendo os "dados sobre dados", isto , os dados sobre os sistemas que operam com estes dados. Um repositrio de metadados uma ferramenta essencial para o gerenciamento de um Data Warehouse no momento de converter dados em informaes para o negcio. Entre outras coisas, um repositrio de metadados bem construdo deve conter informaes sobre a origem dos dados, regras de transformao, nomes e alias, formatos de dados, etc. Ou seja, esse "dicionrio" deve conter muito mais do que as descries de colunas e tabelas: deve conter informaes que adicionem valor aos dados. Tipo de Informao considerada Metadado Os metadados so utilizados normalmente como um dicionrio de informaes e, sendo assim, devem incluir: o Origem dos dados Todo elemento de dado precisa ser identificado, sua origem ou o processo que o gera. Esta identificao muito importante no caso de se necessitar saber informaes sobre a fonte geradora do dado. Esta informao deve ser nica, ou seja, cada dado deve ter uma e somente uma fonte de origem.

36 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES o Fluxo do dado

(**79)8115-7557

Todo elemento de dado precisa ter identificado os fluxos nos quais sofre transformaes. importante saber que dados servem de base para que processos. o Formato dos dados Todo elemento de dados deve ter identificado seu tamanho e tipo de dado. o Nomes e alias Todo elemento de dados deve ser identificado por um nome. Este nome pode ser da rea de negcios ou um nome tcnico. No caso de serem usados alias para os nomes, pode-se ter os dois. Devem existir padres para criao de nomes e alias (ex.: convenes para abreviaes), evitando assim ambigidades. o Definies de negcio Estas definies so as informaes mais importantes contidas nos metadados. Cada elemento de dado deve ser suportado por uma definio do mesmo no contexto da rea de negcio. O mtodo de manuteno destas informaes tambm deve ser muito consistente, de forma que o usurio possa obter facilmente definies para as informaes desejadas. Nestas definies devem ser evitadas referncias a outros metadados que necessitem de uma segunda pesquisa para melhor entendimento. o Regras de transformao So consideradas como sendo as Regras de Negcio codificadas. Estas regras so geradas no momento da extrao, limpeza e agrupamento dos dados dos Sistemas Operacionais. Cada regra de transformao codificada, deve estar associada a um elemento de Metadado. Se mais de uma aplicao contiver a mesma regra de transformao, dever ser garantido que estas sejam idnticas. o Atualizao dos dados O histrico das atualizaes normalmente mantido pelo prprio banco de dados, mas ter definido um elemento de metadado indicando as datas de atualizao dos dados, pode facilitar o usurio no momento de verificar a atualidade dos dados e a consistncia da dimenso tempo do Data Warehouse. o Requisitos de teste Identifica os critrios de julgamento de cada elemento de dado. Valores possveis e intervalos de atuao. Deve conter tambm padres para procedimentos de teste destes dados.

37 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES o Indicadores de qualidade de dados

(**79)8115-7557

Podem ser criados ndices de qualidade, baseados na origem do dado, nmero de processamentos feito sobre este dado, valores atmicos X valores sumariados, nvel de utilizao do dado etc. o Triggers automticos Podem existir processos automticos associados aos metadados definidos. Estes processos ou triggers devem estar definidos de forma que possam ser consultados por usurio e desenvolvedores, para que os mesmos no venham a criar situaes conflitantes entre as regras definidas nestes processos. o Responsabilidade sobre informaes Deve ser identificado o responsvel por cada elemento de dados do Data Warehouse e tambm o responsvel pela entrada de metadados. o Acesso e segurana Os metadados devem conter informao suficiente para que sejam determinados perfis de acesso aos dados. Deve-se poder identificar que usurios podem ler, atualizar, excluir ou inserir dados na base. Deve haver tambm informaes sobre quem gerencia estes perfis de acesso e como se fazer contato com o Administrador da Base de Dados. 5.7.2 - Data Mart Data mart (entreposto ou bazar de dados) sub-conjunto de dados de um Data warehouse (armazm de dados). Geralmente so dados referentes a um assunto em especial (ex: Vendas, Estoque, Controladoria) ou diferentes nveis de sumarizao (ex: Vendas Anual, Vendas Mensal, Vendas 5 anos), que focalizam uma ou mais reas especficas. Seus dados so obtidos do DW, desnormalizados e indexados para suportar intensa pesquisa. Data marts extraem e ajustam pores de DWs aos requisitos especficos de grupos/departamentos. As questes de planejamento, projeto e implementao so as mesmas encontradas em qualquer fase da implementao de um DW, pois uma parte dos especialistas argumenta que o DW uma evoluo natural de um Data Mart que comeou localizado e cresceu para atender um escopo maior. Essa viso tem defesa menos tcnica e mais intuitiva do que sua contra-parte: o Data Mart criado a posteriori do DW, pois ele seria montado com dados extrados do DW para atender especificamente um setor da organizao. Numa viso comparativa dos dados, onde consideramos os quesitos escopo, integrao, tempo, agregao, anlise e dados volteis, percebemos que a diferena est no escopo, pois enquanto o DW feito para atender uma empresa como um todo, o data mart criado para atender um sub-conjunto da empresa. Repare que atender um subconjunto da empresa pode significar reunir dados de outros setores, j que, na prtica, raramente um nico setor possui ou gera toda informao que precisa. Vem dessa observao a defesa da tese de que o Data Mart construdo aps o DW.

38 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

No se pode dizer que um Data warehouse um conjunto de Data Marts. Seria o mesmo que dizer que o armazm geral de um supermercado, onde todos os itens vo antes de seguir para as lojas, o agrupamento de supermercados. Extrao de Dados Os dados introduzidos num Data Warehouse geralmente passam por uma rea conhecida como rea de stage. O stage de dados ocorre quando existem processos peridicos de leitura de dados de fontes como sistemas OLTP. Os dados podem passar ento por um processo de qualidade, denormalizao e gravao dos dados no Data Warehouse. Esse processo geralmente realizado por ferramentas ETL. OLAP OLAP um acrnimo em ingls para Online Analytical Processing, ou processamento analtico on-line. uma abordagem tecnolgica para gerar respostas rpidas a consultas analticas de natureza tipicamente dimensional. A tecnologia OLAP parte de uma categoria mais abrangente, Business intelligence, que tambm inclui Data warehouse, ETC (Extrao transformao e carga) e Data mining. Aplicaes tpicas de OLAP so relatrios de negcios, marketing, relatrios gerenciais, business performance management (BPM), budgeting e previso, relatrios financeiros e reas similares. O termo OLAP foi criado como uma ligeira variao de um termo tradicional em bancos de dados, OLTP (On Line Transaction Processing, ou processamento de transaes on-line). Bases de dados mais adequadas para OLAP empregam um modelo de base de dados dimensional, que permite consultas analticas complexas ou ad-hoc, com um tempo de execuo pequeno. Nigel Pendse sugeriu que um termo alternativo e talvez mais descritivo para o conceito de OLAP seja Fast Analysis of Shared Multidimensional Information, (Anlises Rpidas de Informao Multidimensional Compartilhada). A FASMI empresta aspectos de bancos de dados navegacionais e de bancos de dados hierrquicos, que so mais rpidos que seu semelhante relacional. Funcionamento Um software OLAP trabalha tomando uma "foto" da fonte de dados e reestruturando-a em um cubo OLAP. As consultas so ento feitas sobre esse cubo. J foi afirmado que, para consultas complexas, um software OLAP pode dar uma resposta em cerca de 0,1% do tempo gasto pela mesma consulta feita em bases de dados relacionais usadas em sistemas OLTP. O cubo criado a partir de um esquema estrela (star schema) de tabelas. No centro est a tabela de fatos (fact table) que lista os fatos principais de que consiste a pesquisa. Vrias tabelas dimensionais esto ligadas s tabelas de fatos. Estas tabelas indicam como as agregaes de dados relacionais podem ser analisadas. O nmero de agregaes possveis determinado por todas as maneiras possveis em que os dados originais podem ser conectados hierarquicamente. Por exemplo, um conjunto de clientes pode ser agrupado por cidade, por distrito ou por pas; com 50 cidades, 8 distritos e 2 pases, h trs nveis hierrquicos com 60 membros. Esses clientes podem ser estudados em relao a produtos; se h 250 produtos com 20 categorias, trs famlias e trs departamentos, ento h 276 membros de produto. Com apenas duas dimenses, localizao geogrfica e produto, h 16.560

39 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

agregaes possveis. medida que os dados considerados aumentam, o nmero de agregaes pode facilmente chegar s dezenas de milhes ou mais. O clculo de agregaes e a base de dados combinada fazem um cubo OLAP, que pode potencialmente conter todas as respostas para cada consulta que pode ser respondida com os dados. Devido ao potencial nmero de agregaes para ser calculado, freqentemente apenas um nmero predeterminado completamente calculado enquanto o restante resolvido sob demanda. Tipos de OLAP H trs tipos de OLAP: o OLAP Multidimensional MOLAP a forma clssica do OLAP e algumas vezes referida como simplesmente OLAP. MOLAP usa estruturas de bancos de dados que so atributos genricos otimizados, como perodo de tempo, localidade, produto ou cdigo de conta. A forma como cada dimenso vai ser agregada definida a priori por uma ou mais hierarquias. o OLAP Relacional ROLAP trabalha diretamente com bancos de dados relacionais. Os dados e as tabelas de dimenses so armazenadas como tabelas relacionais e novas tabelas so criadas para receber a informao agregada. o OLAP Hbrido No h consenso claro na indstria sobre o que "OLAP Hbrido", exceto que um banco de dados vai dividir dados entre armazenamento relacional e especial. Para alguns fornecedores, por exemplo, um banco de dados HOLAP usa tabelas para manter as grandes quantidades de dados detalhados, e um armazenamento especializado para pelo menos alguns aspectos dos dados das quantidades menores, que so menos agregadas ou detalhadas. Comparao entra os tipos: Cada tipo tem suas caractersticas, apesar de no haver consenso sobre os detalhes dos benefcios entre os fornecedores. MOLAP melhor com pequenas bases de dados, calcula rapidamente as agregaes e repostas e precisa de menos espao de armazenamento. ROLAP considerado mais escalvel. Entretanto, difcil implementar eficientemente um pr-processamento para grandes volumes e por isso frequentemente deixado de lado. A performance das consultas ROLAP pode, portanto, sofrer com grandes volumes. HOLAP est entre os dois em todas as reas, mas tem um pr-processo rpido e escalona bem. Todos os tipos esto sujeitos exploso de bases de dados. Esse fenmeno causa a alocao de grandes volumes de memria pelas bases OLAP, quando certas (e frequentes) condies so satisfeitas: grande nmero de dimenses, resultados pr-calculados e dados multidimensionais esparsos. A dificuldade em implementar

40 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

OLAP vem da formao das consultas, da escolha dos dados de base e do desenvolvimento do esquema(-estrela). Como resultado disso, muitos dos modernos produtos OLAP vm com vastas bibliotecas de consultas pr-configuradas. Outro problema a qualidade do conjunto dos dados de base: ele deve ser completo e consistente. OLTP versus OLAP Os termos OLTP (on-line transaction processing processamento on-line de transaes) e OLAP (on-line analytical processing processamento analtico on-line) descrevem o modo de processamento de cada uma das componentes da diviso proposta para os sistemas de Bancos de Dados. Bancos de dados operacionais atingem propores de centenas de megabytes e at mesmo gigabytes. Consistncia e capacidade de recuperao de dados so crticas, e a maximizao do poder de processar transaes requerida para minimizar os problemas que podem ser causados pela concorrncia de processos. Analisando sistemas OLAP, sistemas que do apoio deciso, pode-se notar o contraste com OLTP. No caso do processamento analtico deve-se dar maior importncia aos dados histricos, totalizados e consolidados em detrimento dos dados detalhados ou individualizados. Uma vez que os DW contm dados referentes a longos perodos de tempo, estes podem atingir dimenses muito maiores do que os bancos de dados operacionais, chegando a conter centenas de gigabytes e at mesmo terabytes de informaes. A tabela ilustra as diversidades apresentadas pelos dois tipos de sistemas, DW e Bancos de Dados Operacionais: Diferenas entre os tipos de sistemas. Caractersticas Objetivo Uso Tipo de processamento Unidade de trabalho Nmero de usurios Tipo de usurio Interao do usurio Condies dos dados Volume Histrico Granularidade Redundncia BDs Operacionais Operaes dirias do negcio Operacional OLTP Incluso, alterao, excluso Milhares Operadores Somente pr-definida Dados operacionais Megabytes gigabytes 60 a 90 dias Detalhados No ocorre DW Analisar o negcio Informativo OLAP Carga e consulta Centenas Comunidade gerencial Pr-definida e ad-hoc Dados Analticos Gigabytes terabytes 5 a 10 anos Detalhados e resumidos Ocorre

41 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES Caractersticas Estrutura Manuteno desejada Acesso a registros Atualizao Integridade Nmero de ndices Inteno dos ndices BDs operacionais Esttica Mnima Dezenas Contnua (tempo real) Transao Poucos/simples Localizar um registro DW Varivel Constante Milhares

(**79)8115-7557

Peridica (em batch) A cada atualizao Muitos/complexos Aperfeioar consultas

Business intelligence O termo "Business Inteligence (BI)", pode ser traduzido como "Inteligncia de negcios", refere-se ao processo de coleta, organizao, anlise, compartilhamento e monitorao de informaes que oferecem suporte a gesto de negcios. o Processo Empresarial As organizaes tipicamente recolhem informaes com a finalidade de avaliar o ambiente empresarial, completando estas informaes com pesquisas de marketing, industriais e de mercado, alm de anlises competitivas. Organizaes competitivas acumulam "inteligncia" medida que ganham sustentao na sua vantagem competitiva, podendo considerar tal inteligncia como o aspecto central para competir em alguns mercados. Geralmente, os coletores de BI obtm as primeiras fontes de informao dentro das suas empresas. Cada fonte ajuda quem tem que decidir a entender como o poder fazer da forma mais correta possvel. As segundas fontes de informao incluem as necessidades do consumidor, processo de deciso do cliente, presses competitivas, condies industriais relevantes, aspectos econmicos e tecnolgicos e tendncias culturais. Cada sistema de BI determina uma meta especfica, tendo por base o objetivo organizacional ou a viso da empresa, existindo em ambos objetivos, sejam eles de longo ou curto prazo. o Tecnologia de BI Alguns observadores consideram que o processo de BI reala os dados dentro da informao e tambm dentro do conhecimento. Pessoas envolvidas em processos de BI podem usar softwares ou outras tecnologias para obter, guardar, analisar, provendo acesso aos dados, seja ele simples ou de muito uso. O software "cura" a performance de gerenciamento do negcio e ajuda no alvo das pessoas tomarem as melhores decises pela exatido, atuais e relevantes com as informaes viveis a quem quiser quando for necessrio. Algumas pessoas utilizam o termo "BI" intercmbiando ele com "livros de reunio" ou "sistemas de informaes executivas", de acordo com a informao que

42 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

cada um contm. nesse sentido, que cada pode considerar um sistema de BI como um sistema de suporte para tomada de deciso (decision-support system). o Tipos de software As pessoas que trabalham com o BI tem que desenvolver ferramentas em cada caso, especificadamente quando a inteligncia envolve recolhimento e anlise de largas quantidades de dados desestruturados. Existem inmeros softwares para gerenciamentos destas informaes, em diversas categorias. Uma pesquisa nas ferramentas de busca da internet podem trazer diversas informaes sobre cada um destes programas. 5.7.3 - O que o Data Mining? o processo de descoberta de novas correlaes, padres e tendncias entre as informaes de um empresa, atravs da anlise de grandes quantidades de dados armazenados em um banco de dados usando tcnicasde reconhecimento de padres, estatsticas e matemticas. As duas ultimas dcadas acompanharam um aumento dramtico na quantia de informaes ou dados que so armazenados em formato eletrnico. Esta acumulao de dados aconteceu a uma taxa explosiva. Esses dados crus raramente tem benefcios diretos. Seu valor verdadeiro verificado na habilidade de extrair informaes teis para suporte de deciso ou explorao e atender o fenmeno do gerenciamento de fonte de dados. O armazenamento de dadosficou mais fcil com a grande capacidade computacional a baixo custo, isto , o custo da capacidade de processamento e armazenamento sofreu sensvel queda. Houve tambm a introduo de novos mtodos de aprendizado de mquina para representao do conhecimento baseado em programao lgica, alm da tradicional anlise estatstica dos dados. Tendo concentrado muita ateno no armazenamento de dados o problema passou a ser o que fazer com esse recurso valioso? Foi reconhecido que a informao esta no corao de operaes empresariais e que empresrios poderiam fazer uso dos dados armazenados e assim obter sucesso no ramo dos negcios. Sistemas de administrao de banco de dados deram acesso aos dados armazenados, mas essa era s uma pequena parte do que poderia ser obtido dos dados. Sistemas tradicionais de processamento de transaes on-line, OLTPs, so ferramentas boas no que se refere a repor dados rapidamente, seguramente e eficazmente em banco de dados mas no so boas para retornar uma anlisesignificativa relativa aos dados. Dados analisados podem prover conhecimento adicional sobre um negcio, indo explicitamente alm dos dados armazenados, para derivar conhecimento sobre o negcio. Isto onde o Data Mining tem benefcios obvios para qualquer empreendimento. O Data Mining se preocupa com a anlise dos dados e com o uso de tecnicas de software responsveis por achar padres e regularidades no conjunto de dados. o computador que o responsvel por achar os padres identificando as regras subjacentes e as caractersticas nos dados. A idia que possvel achar ouro em lugares inesperados, tal como os softwares de data mining extraem padres no previamente encontrados ou to obvios que nenhum os notou antes. Anlise de data mining tende a trabalhar nos dados e as melhores tecnicas so essas desenvolvidas com uma orientao para volumes grandes de dados e fazem uso de

43 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

muito dos dados colecionados como possveis a chegar concluso fidedignas e decises.O processo de anlise comea com um conjunto de dados, usa-se uma metodologia para desenvolver uma otima representao da estrutura dos dados durante o tempo em que o conhecimento adquirido. Uma vez que o conhecimento foi adquirido, isto pode ser estendido a conjuntos maiores de dados que trabalham na suposio de que o conjunto de dados maior tem uma estrutura semelhante aos dados da amostra. Os seguintes requisitos resumem alguns dos processos do Data Mining. As fases descritas a seguir comeam com os dados crus e terminam com o conhecimento extrado que era adquirido como resultado das fases seguintes: o Seleo Selecionando ou segmentando os dados de acordo com algum critrio, por exemplo todas as pessoas que possuem um carro, deste modo subconjuntos dos dados podem ser determinados. o Pr-processamento Esta a fase de limpesa dos dados onde sertas informaes so removidas desde que sejam julgadas desnecessrias. Estas informaes no pertinentes podem reduzir a velocidade de queries como por exemplo desnecessrio notar o sexo de um paciente quando est estudando gravidez. Tambm os dados so reconfigurados para assegurar um formato consistente pois h uma possibilidade de formatos incompatveis. Isto porque os dados so tirados de vrias fontes, como exemplo, sexo pode ser registrado como F ou M e tambm como como 1 ou 0. o Transformao Os dados no so somente transferidos mas transformados em dados teis, tais como dados demogrficos comumente usados em pesquisas de mercado. Ento os dados tornam-se utilizveis e navegveis. o Data Mining Esta fase se preocupa com a extrao de padres de dados. Um padro pode ser definido como determinado conjunto de fatos(dados) F, uma linguagem L, e alguma medida de certeza C. Um padro uma declarao S em L que descreve relaes entre conjuntos Fs de F com uma certeza C tal aquele S mais simples em um sensao que a enumerao de todos os fatos em Fs. o Interpretao e avaliao Os padres identificados pelo sistema so interpretados em conhecimento que pode ento ser usado para apoiar decises humanas como por exemplo classificar tarefas, resumir os contedos de um banco de dados ou explicar fenmenos observados.

Os principais motivos que tem levado as empresas a investir nessa tecnologia


tem sido a obteno de uma melhor viso sobre a extenso base de dados e a revelao

44 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

de relaes implictas e padres entre os dados que nam sempre so visveis atravs da simples observao. H trs razes principais para se desenvolver um projeto em Data Mining. o Visualizao dos dados As empresas precisam da significado a uma quantidade cada vez maior de informaes em seus bancos de dados. Antes de realisar qualquer anlise, o objetivo qualificar e armazenar os dados a serem trabalhados e encontrar novas formas de visualiza-los de forma mais natural e transparente para os usurios. o Descoberta de novos conhecimentos A maior parte das aplicaes atuais de DM se enquadram nesta tecnologia cujo o objetivo explicitar relacionamentos ocultos, padres e correlaes entre os diferentes dados existentes no BD da empresa. o Acuracidade dos dados Muitas vezes as empresas descobrem que seus dados so imcompletos, errados ou contraditrios. Decorre disso a necessidade de obter dados cada vez mais consistentes para processamento e anlise futura. Exemplos prticos do Data Mining:

Um caso bem conhecido que identificou um hbito crioso dos consumidores ao procurar eventuais relaes entre o volume de vendas e dos dias da semana, o software data mining apontou que s sextas-feira, as vendas de cervejas cresciam na mesma proporo que as de fraldas. Uma relao mais detalhada apontou que, ao comprar fraldas para seus bebs, os pais aproveitavam para abastecer o estoque de cerveja para o final de semana. Para conseguir detectar fraudes, cortar gastos ou aumentar a receita da empresa. O Bank of Americana usou essas tcnicas para selecionar entre seus 36 milhes de clientes aqueles com o menor risco de dar calote num emprestimo. A partir desses relatrios, enviou cartas oferecendo linhas de crdito para os correntistas cujos filhos tivessem entre 18 e 21 anos e, portando, precisassem de dinheiro para ajudar os filhos a comprar o prprio carro, uma casa ou arcar com os gastos da faculdade. Resultado: em trs anos, o banco lucrou 30 milhes de dlares.

45 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Arquiteturas do Data Warehouse Pode-se definir duas formas de apresentao da arquitetura de Data Warehouse, uma conceitual e outra fsica do modelo relacional que representa o sistema. o Viso Conceitual Arquitetura do sistema de DW.

Alm do DW podem existir vrios Data Marts (DMs), que departamentalizam os dados separando-os por setor dentro da organizao. Os dados contidos no DW e nos DMs so gerenciados por um ou mais servidores de warehouse, os quais apresentam vises multidimensionais dos dados para uma variedade de ferramentas front end. A viso multidimensional em forma de cubo de dados indica que as informaes so visualizadas em linhas e colunas como o formato tradicional das planilhas, porm existem mais dimenses, sendo que o cubo teria apenas mais uma dimenso. Esta caracterstica organiza e facilita a consulta aos dados de maneira que se pode ter, por exemplo, numa dimenso do cubo os meses do ano, na segunda dimenso estariam as cidades de origem dos clientes e na terceira dimenso o mdico que encaminhou o cliente para o hospital. o Viso em Camadas Camada de Bancos de Dados Operacionais e Fontes Externas: contm as bases de dados operacionais e pode ser composta tambm de informaes de fontes externas, estes dados recebem um tratamento especial para poderem ser incorporados ao DW;

46 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Arquitetura em camadas. o Camada de Acesso aos Dados Compe o elo de ligao entre as ferramentas de acesso informao e os bancos de dados operacionais, comunicando-se com diversos Sistemas de Gerenciamento de Banco de Dados (SGBDs) e sistemas de arquivos, sendo que a este conjunto de caractersticas d-se o nome de acesso universal de dados; o Camada de Transporte ou Middleware Tem a funo de gerenciar a transmisso das informaes pelo ambiente de rede que serve de suporte para o sistema como um todo, separando as aplicaes operacionais do formato real dos dados, realiza ainda a coleta de mensagens e transaes e se encarrega de entreg-las nos locais e nos tempos determinados; o Camada do Data Warehouse Constitui-se do armazenamento fsico dos dados oriundos dos sistemas operacionais da empresa e externos, permitindo um acesso mais rpido e seguro aos dados do DW, alm de prover maior flexibilidade de tratamento e facilidade manipulao;

47 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

o Camada de Acesso Informao Proporciona a interao com os usurios finais atravs de ferramentas visuais tradicionais, tais como sistemas de planilhas de clculo, browsers, entre outras; o Camada de Metadados (Dicionrio de Dados) Os metadados descrevem os dados e a organizao do sistema, podem ser ainda frmulas utilizadas para clculo, descries das tabelas disponveis aos usurios, descries dos campos das tabelas, permisses de acesso, informaes sobre os administradores do sistema, entre outras; o Camada de Gerenciamento de Processos Faz o controle destas tarefas que mantm o sistema atualizado e consistente, gerenciando as diversas tarefas que so realizadas durante a construo e a manuteno dos componentes de um sistema de DW; o Camada de Gerenciamento de Replicao Serve para selecionar, editar, resumir, combinar e carregar no DW as informaes a partir das bases operacionais e das fontes externas, envolvendo programao bastante complexa, sendo que existem ferramentas poderosas que permitem que estes processos sejam gerenciados de forma mais amigvel, alm do controle da qualidade dos dados que sero carregados. o Estrutura Fsica dos Dados do D. W. A respeito da disposio fsica dos dados, o DW pode ter uma estrutura centralizada em um nico local ou ento ser implementado de forma distribuda. Se optarmos pelo modelo centralizado, teremos um warehouse consolidado e o Banco de Dados formar um DW integrado. Definindo o projeto desta forma pode-se maximizar o poder de processamento e acelerar os processos de busca por informaes analticas. Definindo-se uma arquitetura federativa, pode-se distribuir a informao por funo, separando os dados do setor financeiro em um servidor, os dados de marketing em outro local, e dados de manufatura em um terceiro lugar. Existe ainda uma terceira metodologia, na qual considera-se uma arquitetura de DW separada por camadas, armazenando os dados mais resumidos em um servidor, dispondo os dados um pouco mais detalhados, em nvel de detalhe intermedirio, em um segundo servidor, e por fim colocamos os dados mais detalhados (atmicos) em um terceiro servidor.

48 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Granularidade em camadas O primeiro servidor geralmente atende maior parte das consultas, sendo que teremos um menor nmero de pedidos de acesso solicitados para a camada 2 e camada 3. O dimensionamento dos servidores o seguinte: na primeira camada podemos ter uma configurao para suportar um grande nmero de usurios que faro diversas consultas, as quais trabalharo com um volume relativamente pequeno de dados. J os servidores das outras duas camadas devem ser configurados para permitir processar grandes volumes de dados, porm no necessria uma preocupao em configurar o sistema para suportar o acesso de um nmero maior de usurios. Isto explica-se pelo fato de que a maioria dos usurios ter suas perguntas respondidas pelas consultas iniciais da camada 1. Se algum usurio no se satisfizer com o nvel de detalhe das respostas da camada 1, pode buscar maiores informaes na camada 2 e at mesmo na camada 3. Conclumos ento que poucos usurios faro acessos regulares ltima camada, sendo que alguns nunca o faro alm do nvel inicial. o Arquitetura em duas camadas Existe uma arquitetura de implantao de sistemas de DW que consiste em utilizar um computador de alta capacidade como servidor. Este mtodo disponibiliza aplicaes aos usurios finais na forma de ferramentas front end, que servem para realizar as consultas, em conjunto com os componentes do servidor com ferramentas back end, que servem para municiar o DW com informaes. Organizaes que podem crescer com a incorporao de outras empresas do mesmo ramo ou ainda de outro ramo de negcio, gradualmente acumulam diversos sistemas de computao legados, cada um com suas incompatibilidades de definies dos dados. Esta redundncia e falta de consistncia dos dados dificulta a administrao das bases de dados, resultando numa dificuldade tambm para desenvolver-se novas aplicaes front end.

49 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Esta arquitetura pode ser chamada de "sistema guarda-chuva", a qual possui um formato em que o cabo do guarda-chuva representa o servidor principal e as hastes representam os sistemas de consulta a este servidor.

A arquitetura ilustrada pode ser usada para construir um sistema de DW em duas camadas, o qual possui os componentes dos clientes (front end) e os componentes do servidor (back end). Esta arquitetura bastante conveniente, uma vez que utiliza os sistemas j existentes na empresa bem como os servidores de bancos de dados e requer um pequeno investimento em hardware e software. Um dos grandes problemas que existe neste tipo de arquitetura o fato de no ser permitido o seu escalonamento, o que resulta, com o aumento do nmero de usurios, numa performance ruim pelo gargalo existente entre os clientes e o servidor. Estas anomalias podem ocorrer pelo uso de estaes clientes muito lentas e com muitos processos rodando simultaneamente. o Arquitetura de Trs Camadas Para tentar solucionar os problemas de performance resultantes do gargalo da arquitetura de duas camadas, existe uma arquitetura de informao em mltiplas camadas. Esta arquitetura bastante flexvel e suporta um grande nmero de servios integrados, onde a interface do usurio (ferramentas front end), as funes de processamento do negcio e as funes de gerenciamento do BD so separadas em processos, os quais podem ser distribudos atravs da arquitetura de informao. Este tipo de arquitetura em trs camadas bastante utilizado. Na primeira camada ficam as aplicaes de interface com os usurios, que devem ser grficas e baseadas em rede. Dados e regras de negcio podem ser compartilhados pela organizao, assim como o BD para o DW, ficam armazenados em servidores de alta velocidade na segunda camada, a camada central. Na terceira e ltima camada esto localizadas as fontes de dados.

50 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

Analisando o ambiente do DW, os servidores de BD e os servidores de aplicaes da camada central provem um acesso eficiente e rpido aos dados compartilhados. Com a separao dos servidores em transacional e analtico pode-se obter uma boa performance nas consultas e no processamento, sendo que deve haver disponibilidade de equipamentos e recursos satisfatrios de conexo entre os diversos componentes do sistema.

6.0 - Alguns Conceitos Importantes


A Linguagem SQL Structured Query Language, ou Linguagem de Consulta Estruturada ou SQL, uma linguagem de pesquisa declarativa para banco de dados relacional (bases de dados relacionais). Muitas das caractersticas originais do SQL foram inspiradas na lgebra relacional. SQL normalmente pronunciado em portugus como "esse-qu-ele", porm sua proncia correta deveria se "squel", do ingls "sequel", ou "alguma coisa que segue outra coisa". SQL uma brincadeira com o nome da primeira linguagem de consulta QUEL. Embora o SQL tenha sido originalmente criado pela IBM, rapidamente surgiram vrios "dialectos" desenvolvidos por outros produtores. Essa expanso levou necessidade de ser criado e adaptado um padro para a linguagem. Esta tarefa foi realizada pela American National Standards Institute (ANSI) em 1986 e ISO em 1987.

51 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

O SQL foi revisto em 1992 e a esta verso foi dado o nome de SQL-92. Foi revisto novamente em 1999 e 2003 para se tornar SQL:1999 (SQL3) e SQL:2003, respectivamente. O SQL:1999 usa expresses regulares de emparelhamento, queries recursivas e gatilhos (triggers). Tambm foi feita uma adio controversa de tipos noescalados e algumas caractersticas de orientao a objeto. O SQL:2003 introduz caractersticas relacionadas ao XML, sequncias padronizadas e colunas com valores de auto-generalizao (inclusive colunas-identidade). Tal como dito anteriormente, o SQL, embora padronizado pela ANSI e ISO, possui muitas variaes e extenses produzidos pelos diferentes fabricantes de sistemas gerenciadores de bases de dados. Tipicamente a linguagem pode ser migrada de plataforma para plataforma sem mudanas estruturais principais. Outra aproximao permitir para cdigo de idioma processual ser embutido e interagir com o banco de dados. Por exemplo, o Oracle e outros incluem Java na base de dados, enquanto o PostgreSQL permite que funes sejam escritas em Perl, Tcl, ou C, entre outras linguagens. Palavras-chaves em SQL DML - Linguagem de Manipulao de Dados Primeiro h os elementos da DML (Data Manipulation Language - Linguagem de Manipulao de Dados). A DML um subconjunto da linguagem usada para selecionar, inserir, atualizar e apagar dados. o SELECT o comumente mais usado do DML, comanda e permite ao usurio especificar uma query como uma descrio do resultado desejado. A questo no especifica como os resultados deveriam ser localizados. o INSERT usada para somar uma fila (formalmente uma tupla) a uma tabela existente. o UPDATE Para mudar os valores de dados em uma fila de tabela existente. o DELETE Permite remover filas existentes de uma tabela. o BEGIN WORK (ou START TRANSACTION, dependendo do dialeto SQL) Pode ser usado para marcar o comeo de uma transao de banco de dados que pode ser completada ou no.

52 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES o COMMIT Envia todos os dados das mudanas permanentemente. o ROLLBACK

(**79)8115-7557

Faz com que as mudanas nos dados existentes desde que o ltimo COMMIT ou ROLLBACK sejam descartadas. o COMMIT e ROLLBACK Interagem com reas de controle como transao e locao. Ambos terminam qualquer transao aberta e liberam qualquer cadeado ligado a dados. Na ausncia de um BEGIN WORK ou uma declarao semelhante, a semntica de SQL dependente da implementao. DDL - Linguagem de Definio de Dados O segundo grupo a DDL (Data Definition Language - Linguagem de Definio de Dados). Uma DDL permite ao usurio definir tabelas novas e elementos associados. A maioria dos bancos de dados de SQL comerciais tem extenses proprietrias no DDL. Os comandos bsicos da DDL so: o CREATE cria um objeto (uma Tabela, por exemplo) dentro do base de dados. o DROP apaga um objeto do banco de dados. DCL - Linguagem de Controle de Dados O terceiro grupo o DCL (Data Control Language - Linguagem de Controle de Dados). DCL controla os aspectos de autorizao de dados e licenas de usurios para controlar quem tem acesso para ver ou manipular dados dentro do banco de dados.

Duas palavras-chaves da DCL: o GRANT - autoriza ao usurio executar ou setar operaes. o REVOKE - remove ou restringe a capacidade de um usurio de executar operaes. DQL - Linguagem de Consulta de Dados Embora tenha apenas um comando a DQL a parte da SQL mais utilizada. O comando SELECT composta de vrias clusulas e opes, possibilitando elaborar consultas das mais simples as mais elaboradas.

53 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

ndices Todos os tipos de bancos de dados podem ter seu desempenho melhorado pelo uso de ndices. O tipo mais comum de ndice uma lista ordenada dos valores de uma coluna de uma tabela, contendo ponteiros para as linhas associadas a cada valor. Um ndice permite que o conjunto das linhas de uma tabela que satisfazem determinado critrio sejam localizadas rapidamente. H vrios mtodos de indexao utilizados comumente, como rvores B, hashes e listas encadeadas. Gatilho Gatilho ou trigger um recurso de programao presente na maioria dos sistemas de gerenciamento de banco de dados, utilizado para associar um procedimento armazenado a um evento do banco de dados (incluso, excluso, atualizao de registro, por exemplo) de modo que o procedimento armazenado seja executado automaticamente sempre que o evento associado ocorrer.

54 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

CONCLUSO

O papel de um Banco de Dados dentro de uma empresa ou qualquer outro tipo de organizao muito importante e fundamental para o andamento da mesma; pois nele esta contido desde os dados dos seus clientes at a vida documental da prpria empresa. Para o gerenciamento de todas essas informaes, temos no mercado diversos softwares com grande capacidade para gerenciar com rapidez e grande performace todos esses dados independente de sua plataforma de sistema operacional. Dentre os sistemas gerenciadores podemos citar desde os mais robustos como o ORACLE, SQL e at mesmo o MySQL que apesar de ser um SGBD gratuito tem uma performace comparativa as outras. Com todas essas ferramentas e o grande poder de gerenciamento das informaes e cruzamento das mesmas, precisamos apenas conhec-las melhor para poder desfrutar de todas as vantagens que elas podem nos proporcionar, utilizando-as no sentido lucrativo, comercial ou para simples consultas como o caso dos gerenciadores de banco de dados que disponibilizam informaes para a Internet.

55 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

WBSOFTWARES

(**79)8115-7557

BIBLIOGRAFIA

www.wikipedia.org www.apostilando.com www.maxarte.com.br/eduardocustodiohp/DataWareHouse.htm Apostilas; Material da Prof Luana Vachelli.

56 AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

Você também pode gostar