Você está na página 1de 56

BANCO DE DADOS

Tpicos Abordados:
Conceito sobre Banco de Dados e SGBDs
Arquiteturas
Modelos de Dados
Tipos de Softwares Gerenciadores de B. D.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
2
SUMRI O
Introduo.................................................................................................03
1.0 Banco de Dados...............................................................................04
2.0 Sistema Gerenciador de Banco de Dados........................................04
2.1 Modelo de Dados.................................................................05
2.2 Tipos de Arquiteturas...........................................................07
2.3 Capacidades do SGBD.........................................................08
3.0 Arquiteturas de Banco de Dados......................................................09
3.1 Aspectos Relevantes.............................................................10
3.2 Vantagens dos Bancos de Dados..........................................11
3.3 Linguagens de Base de Dados..............................................12
4.0 O que Modelo de Dados?..............................................................12
4.1 Modelo Entidade Relacionamento.......................................12
4.2 Entidades e Atributos...........................................................12
4.2.1 Tipos de Atributos..............................................13
4.3 Relacionamentos...................................................................15
4.4 Entidade Fraca......................................................................19
4.5 Modelo de Entidade Relacionamento Extendido.................20
4.5.1 Especializao e Generalizao...........................20
4.6 Operaes..............................................................................22
5.0 Tipos de Sistemas Gerenciadores de Banco de Dados......................23
5.1 dBase......................................................................................23
5.2 MySQL..................................................................................25
5.3 PostgreSQL ...........................................................................29
5.4 Oracle.....................................................................................31
5.5 - Microsoft SQL Server.............................................................31
5.6 - Microsoft Access...................................................................32
5.7 - Data Warehouse.....................................................................34
5.7.1 Metadado..............................................................37
5.7.2 - Data Mart.............................................................38
5.7.3 - Data Mining.........................................................43
6.0 Alguns Conceitos Importantes...........................................................51
7.0 - Concluso..........................................................................................55
8.0 - Bibliografia........................................................................................56
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
3
I NTRODUO
Saber o significado de um Banco de Dados e que o SGBD um sistema que o
gerencia no saber o bastante, pois estamos falando de um grande volume de dados,
ou seja, informaes que precisam ser armazenadas, acessadas, atualizadas por um
indefinido espao de tempo, dando aos seus usurios agilidade e qualidade de resposta
no cruzamento das informaes.
Esse armazenamento e gerenciamento surgiram para deixar de lado os primitivos
sistemas de arquivos que no conseguiam controlar os inmeros processos e usurios
que faziam uso de seus pequenos recursos.
Atualmente os bancos de dados no impem limites de armazenamento, em alguns
casos no necessita de muito hardware, nos proporciona segurana e at tem capacidade
de nos disponibilizar mltiplas vises dos dados.
Esses sistemas gerenciadores de arquivos seja ele free (gratuito) ou no, ambos
tem capacidade de nos trazer ferramentas necessrias para o gerenciamento de qualquer
tipo de informaes armazenadas, independente de sua representao ou modelo pelo
qual as informaes esto estruturadas.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
4
1.0 BancodeDados
O queumBancodeDados?
O termo Banco de Dados foi criado para indicar colees organizadas de dados
armazenados em computadores digitais; utilizando um conceito, Banco de Dados ou
Bases de Dados so conjuntos de dados integrados com uma estrutura que organizam
informaes. Sendo essas informaes utilizadas normalmente para um mesmo fim. Um
banco de dados usualmente mantido e acessado por meio de um software conhecido
como SGBD.
Estritamente falado, o termo Banco deDados deve ser aplicado apenas aos dados,
enquanto o termo Sistema Gerenciador de Bancos de Dados deve ser aplicado ao
software com a capacidade de manipular bancos de dados de forma geral. Porm,
comum misturar os dois conceitos.
2.0 SistemaGerenciador deBancodeDados
O queumSGBD?
Um sistema Gerenciador de Banco de Dados ou Sistema Gestor de Base de Dados
(SGBD), um conjunto de programas responsveis pelo gerenciamento de uma base de
dados. um sistema extremamente complexo, responsvel pela persistncia,
organizao e recuperao dos dados.
Historicamente, o primeiro Sistema Gerenciador de Banco de Dados comercial
surgiu no final de 1960 com base nos primitivos sistemas de arquivos disponveis na
poca, os quais no controlavam o acesso concorrente por vrios usurios ou processos.
Os SGBDs evoluram desses sistemas de arquivos de armazenamento em disco, criando
novas estruturas de dados com o objetivo de armazenar informaes.
Com o tempo, os SGBDs passaram a utilizar diferentes formas de representao, ou
modelos de dados, para descrever a estrutura das informaes contidas em seus bancos
de dados.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
5
2.1- OsmodelosdedadosmaisutilizadospelosSGBDsso:
ModeloHierrquico
O modelo hierrquico foi o primeiro a ser reconhecido como um modelo de dados.
Seu desenvolvimento somente foi possvel devido consolidao dos discos de
armazenamento endereveis, pois esses discos possibilitaram a explorao de sua
estrutura de endereamento fsico para viabilizar a representao hierrquica das
informaes. Nesse modelo de dados, os dados so estruturados em hierarquias ou
rvores. Os ns das hierarquias contm ocorrncias de registros, onde cada registro
uma coleo de campos (atributos), cada um contendo apenas uma informao. O
registro da hierarquia que precede a outros o registro-pai, os outros so chamados de
registros-filhos.
ModeloemRede
O modelo em rede surgiu como uma extenso ao modelo hierrquico, eliminando o
conceito de hierarquia e permitindo que um mesmo registro estivesse envolvido em
vrias associaes.
Esse modelo permite que vrias tabelas sejam usadas simultaneamente atravs do
uso de apontadores (ou referncias). Algumas colunas contm apontadores para outras
tabelas ao invs de dados. Assim, as tabelas so ligadas por referncias, o que pode ser
visto como uma rede.
O gerenciador Data Base Task Group (DBTG) da CODASYL (Committee on Data
Systems and Languages) estabeleceu uma norma para este modelo de banco de dados,
com linguagem prpria para definio e manipulao de dados. Os dados tinham uma
forma limitada de independncia fsica. A nica garantia era que o sistema deveria
recuperar os dados para as aplicaes como se eles estivessem armazenados na maneira
indicada nos esquemas. Os geradores de relatrios da CODASYL tambm definiram
sintaxes para dois aspectos chaves dos sistemas gerenciadores de dados: concorrncia e
segurana. O mecanismo de segurana fornecia uma facilidade na qual parte do banco
de dados (ou rea) pudesse ser bloqueada para prevenir acessos simultneos, quando
necessrio. A sintaxe da segurana permitia que uma senha fosse associada a cada
objeto descrito no esquema. Ao contrrio do Modelo Hierrquico, em que qualquer
acesso aos dados passa pela raiz, o modelo em rede possibilita acesso a qualquer n da
rede sem passar pela raiz. No Modelo em Rede o sistema comercial mais divulgado o
CAIDMS da Computer Associates. O diagrama para representar os conceitos do modelo
em redes consiste em dois componentes bsicos: Caixas, que correspondem aos
registros e Linhas, que correspondem s associaes.
ModeloRelacional
O modelo relacional uma teoria matemtica desenvolvida por Edgar Frank Codd
que surgiu na dcada de 1970, para descrever como as bases de dados devem funcionar.
Porm, a implementao do modelo exigia pesquisas e s na dcada de 1980 eles iam
comear a ganhar o mercado, se estabilizando totalmente como lder do mercado a partir
da dcada de 1990.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
6
Embora esta teoria seja a base para o software de bases de dados relacionais, muito
poucos sistemas de gesto de bases de dados seguem o modelo de forma restrita e todos
tm funcionalidades que violam a teoria, desta forma variando a complexidade e o
poder. A discusso se esses bancos de dados merecem ser chamados de relacional ficou
esgotada com tempo, com a evoluo dos bancos existente.
De acordo com a arquitetura ANSI / SPARC em trs nveis, os bancos de dados
relacionais possuem trs camadas: um conjunto de vises compondo o nvel externo;
uma coleo de estruturas de dados, a saber relaes, compondo o nvel conceitual; um
conjunto de ndices ou mtodos de acesso a dados armazenados, compondo o nvel
interno.
A teoria relacional de banco de dados define um conjunto de operaes lgicas, a
saber a lgebra e o clculo relacionais. Essas operaes so a base da linguagem SQL.
Um dos pontos fortes do modelo relacional de banco de dados a possibilidade de
definio de um conjunto de restries de integridade. Estas definem os conjuntos de
estados e mudanas de estado consistentes do banco de dados, determinando os valores
que podem e os que no podem ser armazenados.
Diferentemente dos bancos de dados em rede, nos bancos de dados relacionais os
relacionamentos entre as tabelas no so codificados explicitamente na sua definio.
Em vez disso, se fazem implicitamente pela a presena de atributos chave. Como
resultado, bancos de dados relacionais podem ser reorganizados e utilizados de maneira
flexvel e de formas no previstas pelos projetistas originais. Por causa dessa
flexibilidade, muitos bancos de dados so baseados no modelo relacional, embora
imperfeitamente.
O modelo relacional apareceu devido s seguintes necessidades: aumentar a
independncia de dados nos sistemas gerenciadores de banco de dados; prover um
conjunto de funes apoiadas em lgebra relacional para armazenamento e recuperao
de dados. Modelo que revelou-se ser o mais flexvel e adequado ao solucionar os vrios
problemas que se colocam no nvel da concepo e implementao da base de dados. A
estrutura fundamental do modelo relacional a relao (tabela). Uma relao
constituda por um ou mais atributos (campos) que traduzem o tipo de dados a
armazenar. Cada instncia do esquema (linha) chamada de tupla (registro). O modelo
relacional no tem caminhos pr-definidos para se fazer acesso aos dados como nos
modelos que o precederam. O modelo relacional implementa estruturas de dados
organizadas em relaes. Porm, para trabalhar com essas tabelas, algumas restries
precisaram ser impostas para evitar aspectos indesejveis, como: Repetio de
informao, incapacidade de representar parte da informao e perda de informao.
Essas restries so: integridade referencial, chaves e integridade de junes de
relaes.
ModeloOrientadoaObjetos
Os bancos de dados orientados a objeto comearam a se tornar comercialmente
viveis em meados de 1980. A motivao para seu surgimento est em funo dos
limites de armazenamento e representao semntica impostas no modelo relacional.
Alguns exemplos so os sistemas de informaes geogrficas (SIG), os sistemas CAD e
CAM, que so mais facilmente construdos usando tipos complexos de dados. A
habilidade para criar os tipos de dados necessrios uma caracterstica das linguagens
de programao orientadas a objetos.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
7
Contudo, estes sistemas necessitam guardar representaes das estruturas de dados
que utilizam no armazenamento permanente. A estrutura padro para os bancos de
dados orientados a objetos foi feita pelo Object Database Management Group (ODMG).
Esse grupo formado por representantes dos principais fabricantes de banco de
dados orientados a objeto disponveis comercialmente. Membros do grupo tm o
compromisso de incorporar o padro em seus produtos. O termo Modelo Orientado a
Objetos usado para documentar o padro que contm a descrio geral das facilidades
de um conjunto de linguagens de programao orientadas a objetos e a biblioteca de
classes que pode formar a base para o Sistema de Banco de Dados. Quando os bancos
de dados orientados a objetos foram introduzidos, algumas das falhas perceptveis do
modelo relacional pareceram ter sido solucionadas com esta tecnologia e acreditava-se
que tais bancos de dados ganhariam grande parcela do mercado. Hoje, porm, acredita-
se que os Bancos de Dados Orientados a Objetos sero usados em aplicaes
especializadas, enquanto os sistemas relacionais continuaro a sustentar os negcios
tradicionais, onde as estruturas de dados baseadas em relaes so suficientes.
2.2- TiposdearquiteturasdeSGBDs
ArquiteturaCentralizada
Na arquitetura centralizada, existe um computador com grande capacidade de
processamento, o qual o hospedeiro do SGBD e emuladores para os vrios aplicativos.
Esta arquitetura tem como principal vantagem a de permitir que muitos usurios
manipulem grande volume de dados. Sua principal desvantagem est no seu alto custo,
pois exige ambiente especial para mainframes e solues centralizadas.
ArquiteturadotipoSistemasdeComputador Pessoal PC
Os computadores pessoais trabalham em sistema stand-alone, ou seja, fazem seus
processamentos sozinhos. No comeo esse processamento era bastante limitado, porm,
com a evoluo do hardware, tem-se hoje PCs com grande capacidade de
processamento. Eles utilizam o padro Xbase e quando se trata de SGBDs, funcionam
como hospedeiros e terminais. Desta maneira, possuem um nico aplicativo a ser
executado na mquina. A principal vantagem desta arquitetura a simplicidade.
ArquiteturaCliente-Servidor
Na arquitetura Cliente-Servidor, o cliente executa as tarefas do aplicativo, ou seja,
fornece a interface do usurio (tela, e processamento de entrada e sada). O servidor
executa as consultas no DBMS e retorna os resultados ao cliente. Apesar de ser uma
arquitetura bastante popular, so necessrias solues sofisticadas de software que
possibilitem: o tratamento de transaes, as confirmaes de transaes, desfazer
transaes, linguagens de consultas e gatilhos (triggers). A principal vantagem desta
arquitetura a diviso do processamento entre dois sistemas, o que reduz o trfego de
dados na rede.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
8
BancodeDadosDistribudos(N camadas)
Nesta arquitetura, a informao est distribuda em diversos servidores. Cada
servidor atua como no sistema cliente-servidor, porm as consultas oriundas dos
aplicativos so feitas para qualquer servidor indistintamente. Caso a informao
solicitada seja mantida por outro servidor ou servidores, o sistema encarrega-se de obter
a informao necessria, de maneira transparente para o aplicativo, que passa a atuar
consultando a rede, independente de conhecer seus servidores. Exemplos tpicos so as
bases de dados corporativas, em que o volume de informao muito grande e, por isso,
deve ser distribudo em diversos servidores. Porm, no dependente de aspectos
lgicos de carga de acesso aos dados, ou base de dados fracamente acopladas, em que
uma informao solicitada vai sendo coletada numa propagao da consulta numa
cadeia de servidores. A caracterstica bsica a existncia de diversos programas
aplicativos consultando a rede para acessar os dados necessrios, porm, sem o
conhecimento explcito de quais servidores dispem desses dados.
2.3- CapacidadesdoSGBD
ControledeRedundncia
No processamento tradicional de arquivos, muitos grupos de usurios mantm seus
prprios arquivos para manipular suas aplicaes de processamento, que pode provocar
o armazenamento de informaes redundantes, causando, duplicao de esforos,
desperdcio de espao, inconsistncia, ou seja, alterao em alguns arquivos e em outros
no, ou em todos os arquivos, porm, de maneira independente.
CompartilhamentodeDados
SGBDs multiusurios devem fornecer controle de concorrncia para assegurar que
atualizaes simultneas resultem em modificaes corretas. Um outro mecanismo que
permite a noo de compartilhamento de dados em um SGBD multiusurio a
facilidade de definir vises de usurio, que usada para especificar a poro da base de
dados que de interesse para um grupo particular de usurios.
RestriesdeAcessoMultiusurio
Quando mltiplos usurios compartilham uma base de dados, comum que alguns
usurios no autorizados no tenham acesso a todas as informaes da base de dados.
Por exemplo, os dados financeiros so freqentemente considerados confidenciais e,
desse modo, somente pessoas autorizadas devem ter acesso. Alm disso, pode ser
permitido a alguns usurios, apenas a recuperao dos dados. J, para outros, so
permitidas a recuperao e a modificao. Assim, o tipo de operao de acesso -
recuperao ou modificao - pode tambm ser controlado. Tipicamente, usurios e
grupos de usurios recebem uma conta protegida por palavras chaves, que usada para
se obter acesso base de dados, o que significa dizer que contas diferentes possuem
restries de acesso diferentes. Um SGBD deve fornecer um subsistema de autorizao
e segurana, que usado pelo DBA para criar contas e especificar restries nas contas.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
9
O SGBD deve ento obrigar estas restries automaticamente. Note que um controle
similar pode ser aplicado ao software do SGBD.
FornecimentodeMltiplasInterfaces
Devido aos vrios tipos de usurios, com variados nveis de conhecimento tcnico,
um SGBD deve fornecer uma variedade de interfaces para atend-los. Os tipos de
interfaces incluem linguagens de consulta para usurios ocasionais, interfaces de
linguagem de programao para programadores de aplicaes, formulrios e interfaces
dirigidas por menus para usurios comuns.
RepresentaodeRelacionamentoComplexoentreDados
Uma base de dados pode possuir uma variedade de dados que esto inter-
relacionados de muitas maneiras. Um SGBD deve ter a capacidade de representar uma
variedade de relacionamentos complexos entre dados, bem como recuperar e modificar
dados relacionados de maneira fcil e eficiente.
Reforar RestriesdeIntegridade
Muitas aplicaes de base de dados tero certas restries de integridade de dados.
A forma mais elementar de restrio de integridade a especificao do tipo de dado de
cada item. Existem tipos de restries mais complexas.
Um tipo de restrio que ocorre freqentemente a especificao de que um registro
de um arquivo deve estar relacionado a registros de outros arquivos. Um outro tipo de
restrio especifica a unicidade sobre itens de dados. Estas restries so derivadas da
semntica dos dados e do mini-mundo que eles representam. Algumas restries podem
ser especificadas ao SGBD e automaticamente executadas. Outras restries podem ser
verificadas pelos programas de atualizao ou no tempo da entrada de dados. Note que
um item de dados pode ser inserido erroneamente, mas ainda atender as restries de
integridade.
Fornecer BackupeRestaurao
Um SGBD deve fornecer recursos para restaurao caso ocorram falhas de hardware
ou software. O subsistema de backup e restaurao do SGBD o responsvel pela
restaurao. Por exemplo, se o sistema de computador falhar no meio da execuo de
um programa que esteja realizando uma alterao complexa na base de dados, o
subsistema de restaurao responsvel por assegurar que a base de dados seja
restaurada ao estado anterior ao incio da execuo do programa. Alternativamente, o
subsistema de restaurao poderia assegurar que o programa seja reexecutado a partir do
ponto em que havia sido interrompido.
3.0- ArquiteturasdeBancodeDados
As primeiras arquiteturas usavam mainframes para executar o processamento
principal e de todas as funes do sistema, incluindo os programas aplicativos,
programas de interface com o usurio, bem como a funcionalidade dos SGBDs. Esta a
razo pela qual a maioria dos usurios fazia acesso aos sistemas via terminais que no
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
10
possuam poder de processamento, apenas a capacidade de visualizao. Todos os
processamentos eram feitos remotamente, apenas as informaes a serem visualizadas e
os controles eram enviados do mainframe para os terminais de visualizao, conectados
a ele por redes de comunicao. Como os preos do hardware foram decrescendo,
muitos usurios trocaram seus terminais por computadores pessoais (PC) e estaes de
trabalho. No comeo os SGBDs usavam esses computadores da mesma maneira que
usavam os terminais, ou seja, o SGBD era centralizado e toda sua funcionalidade,
execuo de programas aplicativos e processamento da interface do usurio eram
executados em apenas uma mquina. Gradualmente, os SGBDs comearam a explorar a
disponibilidade do poder de processamento no lado do usurio, o que levou
arquitetura cliente-servidor.
A arquitetura cliente-servidor foi desenvolvida para dividir ambientes de
computao onde um grande nmero de PCs, estaes de trabalho, servidores de
arquivos, impressoras, servidores de banco de dados e outros equipamentos so
conectados juntos por uma rede. A idia definir servidores especializados, tais como
servidor de arquivos, que mantm os arquivos de mquinas clientes, ou servidores de
impresso que podem estar conectados a vrias impressoras; assim, quando se desejar
imprimir algo, todas as requisies de impresso so enviadas a este servidor. As
mquinas clientes disponibilizam para o usurio as interfaces apropriadas para utilizar
esses servidores, bem como poder de processamento para executar aplicaes locais.
Esta arquitetura se tornou muito popular por algumas razes. Primeiro, a facilidade de
implementao dada a clara separao das funcionalidades e dos servidores.
Segundo, um servidor inteligentemente utilizado porque as tarefas mais simples
so delegadas s mquinas clientes mais baratas. Terceiro, o usurio pode executar uma
interface grfica que lhe familiar, ao invs de usar a interface do servidor. Desta
maneira, a arquitetura cliente-servidor foi incorporada aos SGBDs comerciais.
Diferentes tcnicas foram propostas para se implementar essa arquitetura, sendo que a
mais adotada pelos Sistemas
Gerenciadores de Banco de Dados Relacionais (SGBDRs) comerciais a incluso
da funcionalidade de um SGBD centralizado no lado do servidor. As consultas e a
funcionalidade transacional permanecem no servidor, sendo que este chamado de
servidor de consulta ou servidor de transao. assim que um servidor SQL fornecido
aos clientes. Cada cliente tem que formular suas consultas SQL, prover a interface do
usurio e as funes de interface usando uma linguagem de programao. O cliente
pode tambm se referir a um dicionrio de dados o qual inclui informaes sobre a
distribuio dos dados em vrios servidores SQL, bem como os mdulos para a
decomposio de uma consulta global em um nmero de consultas locais que podem ser
executadas em vrios stios. Comumente o servidor SQL tambm chamado de back-
end machine e o cliente de front-end machine. Como SQL prov uma linguagem padro
para o SGBDRs, esta criou o ponto de diviso lgica entre o cliente e o servidor.
3.1- Aspectosrelevantes
necessrio considerar alguns aspectos relevantes para atingir a eficincia e a
eficcia dos sistemas informatizados desenvolvidos, a fim de atender seus usurios nos
mais variados domnios de aplicao: automao de escritrios, sistemas de apoio a
decises, controle de reserva de recursos, controle e planejamento de produo,
alocao e estoque de recursos, entre outros. Tais aspectos so:
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
11
o Os projetos Lgico e Funcional do Banco de Dados devem ser capazes de prever
o volume de informaes armazenadas a curto, mdio e longo prazo. Os projetos devem
ter uma grande capacidade de adaptao para os trs casos mencionados;
o Deve-se ter generalidade e alto grau de abstrao de dados, possibilitando
confiabilidade e eficincia no armazenamento dos dados e permitindo a utilizao de
diferentes tipos de gerenciadores de dados atravs de linguagens de consultas
padronizadas;
o Projeto de uma interface gil e com uma "rampa ascendente" para propiciar
aprendizado suave ao usurio, no intuito de minimizar o esforo cognitvo;
o Implementao de um projeto de interface compatvel com mltiplas
plataformas (UNIX, Windows NT, Windows Workgroup, etc);
o Independncia de Implementao da Interface em relao aos SGBDs que daro
condies s operaes de armazenamento de informaes (ORACLE, SYSBASE,
INFORMIX, PADRO XBASE, etc).
o Converso e mapeamento da diferena semntica entre os paradigmas utilizados
no desenvolvimento de interfaces (Imperativo (ou procedural), Orientado a Objeto,
Orientado a evento), servidores de dados (Relacional) e programao dos aplicativos
(Imperativo, Orientado a Objetos).
3.2- VantagensdosBancosdeDados
o Potencial para obrigar a Padronizao
A abordagem de base de dados permite que o DBA defina e obrigue a padronizao
entre os usurios da base de dados em grandes organizaes. Isso facilita a comunicao
e a cooperao entre vrios departamentos, projetos e usurios. Padres podem ser
definidos para formatos de nomes, elementos de dados, telas, relatrios, terminologias,
etc. O DBA pode obrigar a padronizao em um ambiente de base de dados
centralizado, muito mais facilmente que em um ambiente onde cada usurio ou grupo
tem o controle de seus prprios arquivos e programas de aplicao.
o Flexibilidade
Mudanas na estrutura de uma base de dados podem ser necessrias devido a
mudanas nos requisitos. Por exemplo, um novo grupo de usurios pode surgir com
necessidade de informaes adicionais, ainda no disponveis na base de dados. Alguns
SGBDs permitem que tais mudanas na estrutura da base de dados sejam realizadas
sem afetar a maioria dos programas de aplicaes existentes.
o Reduo do Tempo de Desenvolvimento de Aplicaes
Uma das principais caractersticas de venda da abordagem de base de dados o
tempo reduzido para o desenvolvimento de novas aplicaes, como a recuperao de
certos dados da base de dados para a impresso de novos relatrios. Projetar e
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
12
implementar uma nova base de dados pode tomar mais tempo do que escrever uma
simples aplicao de arquivos especializada. Porm, uma vez que a base de dados esteja
em uso, geralmente o tempo para se criar novas aplicaes, usando-se os recursos de um
SGBD, bastante reduzido. O tempo para se desenvolver uma nova aplicao em um
SGBD estimado em 1/4 a 1/6 do que o tempo de desenvolvimento, usando-se apenas o
sistema de arquivos tradicional, devido s facilidades de interfaces disponveis em um
SGBD.
o Disponibilidade de Informaes Atualizadas
To logo um usurio modifique uma base de dados, todos os outros usurios
sentem imediatamente esta modificao. Esta disponibilidade de informaes
atualizadas essencial para muitas aplicaes, tais como sistemas de reservas de
passagens areas ou bases de dados bancrias. Isso somente possvel devido ao
subsistema de controle de concorrncia e restaurao do SGBD.
o Economia de Escala
A abordagem de SGBDs permite a consolidao de dados e de aplicaes
reduzindo-se, desse modo, o desperdcio em atividades redundantes de processamento
em diferentes projetos ou departamentos. Isto possibilita organizao como um todo
investir em processadores mais poderosos, e perifricos de armazenamento e de
comunicao mais eficientes.
3.3- LinguagensdeBasedeDados
o Linguagem de Definio de Dados (Data Definition Language - DDL):
utilizada pelo DBA e projetistas de base de dados para definir seus esquemas. O SGBD
tem um compilador para processar descries em DDL e construir a descrio do
esquema armazenado no catlogo;
o Linguagem de Manipulao de Dados (Data Manipulation Language - DML):
uma vez que o esquema compilado e a base de dados preenchida com dados, os
usurios tm que ter algum modo de manipular os dados. Manipulaes comuns como
recuperao, insero, remoo e modificao de dados so realizadas pela DML.
4.0- O queModelodeDados?
uma imagem grfica de toda a base de informaes necessrias para um
determinado empreendimento.
4.1- ModeloEntidadeRelacionamento
O Modelo Entidade-Relacionamento um modelo de dados conceitual de alto-nvel,
ou seja, seus conceitos foram projetados para serem compreensveis a usurios,
descartando detalhes de como os dados so armazenados; modelo proposto por Peter
Chain em 1976. Sua principal finalidade identificar entidades de dados e seus
relacionamentos.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
13
4.2- Entidadeseatributos
Uma entidade representa um objeto do mundo real que possui existncia prpria e
cujas caractersticas ou propriedades desejamos armazenar. O objeto representado pode
ser um objeto concreto (uma pessoa, um carro, um livro, etc) ou abstrato (um
departamento, um projeto, um curso). As caractersticas do objeto que desejamos
armazenar damos o nome de atributos. Cada atributo de uma entidade possui um nome e
um valor especifico.
Representao de uma entidade.
Um conjunto de entidades inclui um nmero qualquer de entidades similares, ou
entidades do mesmo tipo. Por entidades do mesmo tipo entenda-se entidades que
possuem os mesmos atributos, cada um deles com um valor prprio. Conjuntos de
entidades so representados em um diagrama entidade-relacionamento por meio de
retngulos contendo o nome do tipo de entidade no seu interior e arestas ligando esses
retngulos aos atributos das entidades. Os atributos aparecem, normalmente, dentro de
ovais.
Na representao acima temos um conjunto de Entidades e seus atributos.
4.2.1- TiposdeAtributos
Os atributos no Modelo Entidade-Relacionamento podem ser:
o Atributos Simples ou Atmicos
So os atributos que no so divisveis.
o Atributos compostos
Podem ser divididos em vrias partes (sub-atributos) com significados
independentes. O atributo Endereo de um funcionrio, por exemplo, pode ser dividido
em Rua, Nmero e Bairro.
NOME
FUNCIONRIO
TELEFONE
ENDEREO
NOME
FUNCIONRIO
TELEFONE
ENDEREO
NMERO
BAIRRO
RUA
EMPREGADO
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
14
Representao dos atributos compostos do endereo de um funcionrio.
o Atributos Monovalorados
So aqueles que possuem apenas um valor para aquela entidade.
o Atributos multivalorados
Podem assumir diversos valores. Como por exemplo o atributo Telefone de um
funcionrio j que pode assumir diversos valores.
Atributos multivalorados so representados graficamente por uma oval de
bordas duplas.
o Atributos derivados:
Em alguns casos, dois ou mais atributos esto relacionados, por exemplo, a idade e
data de nascimento de um funcionrio. Para um determinado funcionrio, podemos
determinar a sua idade por meio da data de nascimento e da data atual. Atributos como a
idade so chamados de atributos derivados, ao contrrio dos atributos que chamamos de
armazenados.
NOME
FUNCIONRIO
TELEFONE
ENDEREO
NMERO
BAIRRO
RUA
NOME
FUNCIONRIO
TELEFONE
ENDEREO
NMERO
BAIRRO
RUA
D. NASCIMENTO
IDADE
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
15
Atributos derivados so representados graficamente por uma oval de bordas
pontilhadas.
Os valores correspondentes dos atributos de duas entidades no podem ser todos
iguais. A lista de atributos de um conjunto de entidades deve ser suficiente para
caracterizar completamente qualquer entidade do conjunto. Essas consideraes nos
levam ao conceito de atributo-chave:
o Atributo-chave
Tipo de atributo cujos valores so distintos para cada entidade em um conjunto de
entidades. O RG de um funcionrio, por exemplo, constitui um atributo-chave para o
tipo de entidades FUNCIONRIO. Algumas vezes, um conjunto de atributos pode
formar uma chave. Mais do que isso, alguns tipos de entidades podem ter mais que um
atributo-chave.
O nome do atributo chave de um tipo de entidade geralmente aparece
sublinhado.
No grfico temos a representao de dois atributos-chave para o conjunto de
entidade funcionrio; sendo um composto(RG) e outro simples(CPF).
4.3 Relacionamentos
Ao definir as entidades componentes de um diagrama entidade relacionamento,
nota-se vrios relacionamentos implcitos entre elas. Sempre que um atributo de um tipo
de entidade refere-se a um outro tipo de entidade, temos um relacionamento entre as
entidades.
Um conjunto de relacionamentos inclui um nmero qualquer de relacionamentos
similares, ou relacionamentos do mesmo tipo. Por relacionamentos do mesmo tipo
entende-se relacionamentos que associam os mesmos tipos de entidades.
NOME
FUNCIONRIO
TELEFONE
ENDEREO
NMERO
BAIRRO
RUA
RG
NDO RG
RGO EXP.
CPF
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
16
Na representao acima temos o relacionamento entre o funcionrio e o
departamento no qual ele trabalha.
Conjunto de relacionamentos so representados por meio de losangos, contendo
o nome do tipo de relacionamento, conectados aos conjuntos de entidades cujos
elementos ele associa.
Os relacionamentos esto associados s definies de grau, atributos e papis em
um relacionamento.
o Grau de um relacionamento
O grau de um relacionamento corresponde ao nmero de diferentes tipos de
entidades que dele participam. Os relacionamentos mais comuns so aqueles de grau
dois (relacionamentos binrios). O tipo de relacionamento Trabalha NO, por exemplo,
possui grau dois.
Um exemplo de tipo de relacionamento ternrio FORNECE, que associa os
tipos de entidades FORNECEDOR, PEA e PROJETO.
PEA
FORNECEDOR FORNECE PROJ ETO
FUNCIONRIO TRABALHA NO DEPARTAMENTO
ENDEREO
NMERO
NOME TELEFONE
NOME
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
17
o Atributos de um relacionamento
Assim como no caso das entidades, relacionamentos tambm podem possuir certos
atributos. O nmero de horas que um funcionrio trabalha em um projeto, por exemplo,
pode ser visto como um atributo do relacionamento DESENVOLVE.
o Papis em um relacionamento
Um relacionamento pode associar entidades do mesmo tipo (relacionamentos
recursivos ou auto-relacionamentos). Nesse caso, necessrio o conceito de papel da
entidade no relacionamento. Ele corresponde a funo que uma entidade cumpre dentro
de um relacionamento. O relacionamento SUPERVISIONA, corresponde a um
relacionamento recursivo que associa duas entidades de funcionrios, uma no papel de
supervisor e outra no papel de supervisionado.
Graficamente, o papel das entidades encontra-se representado nas arestas
ligando o relacionamento ao conjunto de entidades.
Relacionamentos normalmente obedecem algumas restries determinadas pela
aplicao sendo projetada. So elas:
FUNCIONRIO DESENVOLVE PROJ ETO
HORAS
FUNCIONRIO SUPERVISIONADO
SUPERVISOR
SUPERVISIONADO
ENDEREO
TELEFONE
NOME
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
18
o Cardinalidade de um relacionamento(Binrio)
Determina o nmero de relacionamentos dos quais uma entidade pode participar. O
relacionamento do tipo TRABALHA NO, por exemplo, possui cardinalidade N:1. Ou
seja, 1 departamento est associado com (ou emprega) vrios funcionrios, mas um
funcionrio pode trabalhar em um nico departamento. Alm da N:1, relacionamentos
podem possuir cardinalidades 1:1, 1:N e N:M. Um exemplo de relacionamento 1:1 o
GERENCIA, o qual relaciona um (nico) departamento com o (nico) funcionrio que
o gerencia. Um exemplo de relacionamento M:N o DESENVOLVE, que associa
vrios funcionrios a vrios projetos.
Cardinalidades so representadas graficamente pelos nmero 1, M e N junto as
arestas que relacionam os conjuntos de entidades.
Representao grfica de um relacionamento de cardinalidade 1:1.
o Restrio de Participao
Determina se a existncia de uma entidade est condicionada ou no ao seu
relacionamento com outra entidade. Existem dois tipos de restries de participao:
total e parcial. Na primeira, uma entidade existe somente quando ela se relaciona com
outra entidade via um relacionamento. Se a poltica da empresa determina, por exemplo,
que todo funcionrio deve trabalhar em um departamento, ento a participao de
FUNCIONRIO em TRABALHA NO total. Caso contrrio se a existncia de uma
entidade independe do fato dela estar relacionada com outra, tem-se uma restrio de
participao parcial. A participao de FUNCIONRIO em DESENVOLVE, por
exemplo, parcial. Ou seja, nem todo funcionrio precisa desenvolver um projeto
dentro da empresa.
FUNCIONRIO GERENCIA DEPARTAMENTO
ENDEREO
NMERO
NOME TELEFONE
NOME
1 1
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
19
A restrio de participao total representada graficamente por meio de linhas
duplas ligando o conjunto de entidades ao conjunto de relacionamentos. J a
participao parcial representada por meio de linhas simples.
4.4- EntidadeFraca
Tipo de entidade que depende de outra entidade para existir.
Tipos de entidades que no possuem atributos chaves so denominados de fracas,
diferente dos tipos de entidades que possuem (ao menos um) atributo-chave,
denominadas entidades fortes (ou regulares). Entidades pertencentes a um tipo de
entidade fraca so identificadas por seus atributos e suas relaes com entidades
especificas de um outro tipo de entidade.
Esse ltimo tipo de entidade dito proprietrio ou identificante. Um tipo de
entidade fraca sempre atende a restrio de participao total no seu relacionamento
com o tipo de entidade identificante. Isso porque uma entidade fraca no pode ser
identificada unicamente sem uma entidade forte correspondente.
Considere como exemplo o tipo de entidade DEPENDENTE que se relaciona com
FUNCIONRIO. Ela utilizada na modelagem dos dependentes de cada funcionrio
via um relacionamento 1:N. Os atributos de DEPENDENTE so Nome e Parentesco
(com o funcionrio). Dois dependentes de dois funcionrios distintos podem ter o
mesmo nome e relacionamento, mas ainda ser entidades distintas. Eles so identificados
como tal apos a determinao da entidade funcionrio em particular com o qual cada
dependente esta relacionado.
Um tipo de entidade fraca tem, normalmente, uma chave parcial. Ela corresponde ao
conjunto de atributos que pode identificar unicamente as entidades fracas relacionadas a
mesma entidade proprietria. No exemplo acima, o atributo Nome do dependente
chave parcial.
Entidades fracas so representadas por meio de retngulos com bordas duplas.
Relacionamentos envolvendo entidades fracas so representadas por meio de losangos
com bordas duplas. E, normalmente, chaves parciais so sublinhadas com linhas
pontilhadas.
FUNCIONRIO TRABALHA
NO
DEPARTAMENTO
ENDEREO
NMERO
NOME TELEFONE
NOME
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
20
4.5- ModeloEntidadeRelacionamentoExtendido
O modelo ER extendido inclui todos os conceitos do modelo Entidade
Relacionamento mais os de subclasse / superclasse e especializao / generalizao
relacionados.
Em muitos casos, um conjunto de entidades inclui vrios subconjuntos que
necessitam ser representados explicitamente dada a significncia de cada um deles na
aplicao sendo desenvolvida. As entidades do tipo FUNCIONRIO, por exemplo,
podem ser agrupadas em SECRETRIO, ENGENHEIRO, TCNICO, etc.
O conjunto de entidades em cada um desses grupos corresponde a um subconjunto
das entidades em FUNCIONRIO. Em outras palavras, toda entidade em um desses
grupos tambm um funcionrio. Cada um desses grupos chamado de subclasse do
tipo de entidade FUNCIONRIO. O tipo de entidade FUNCIONRIO, por sua vez,
dito superclasse de cada uma das subclasses. Uma entidade da subclasse e da
superclasse representam a mesma entidade do mundo real. Uma entidade Joo
Fernando" do tipo SECRETRIO, por exemplo, tambm o funcionrio Joo
Fernando". Uma entidade no pode existir na base de dados como sendo membro
apenas de uma subclasse. Entretanto, no necessrio que toda entidade em uma
superclasse seja membro de alguma subclasse. Vale observar que uma entidade membro
de uma subclasse herda todos os atributos da entidade membro correspondente da
superclasse.
4.5.1- EspecializaoeGeneralizao
Especializao o processo de definir um conjunto de subclasses de um tipo de
entidade. O conjunto de subclasses que formam uma especializao definida com base
em alguma(s) caracterstica(s) que distingue as entidades da superclasse. O conjunto de
subclasses SECRETRIO, ENGENHEIRO e TCNICO, por exemplo, uma
especializao da superclasse FUNCIONRIO onde a diferenciao entre os
funcionrios faz-se por meio do tipo de emprego de cada entidade.
FUNCIONRIO POSSUI DEPENDENTES
ENDEREO
PARENTESCO
TELEFONE
NOME
NOME
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
21
Uma especializao representada diagramaticamente por meio de linhas ligando as
subclasses que definem a especializao a um circulo que, por sua vez, esta ligado por
uma linha superclasse. Alm disso, tem-se o smbolo de contido em cada uma das
linhas que conecta as subclasses superclasse indicando a "direo" da especializao.
Atributos que se aplicam somente a entidades de uma subclasse em particular
encontram-se associados aos retngulos representando aquela subclasse. Esses atributos
so chamados de atributos especficos da classe. Similarmente, uma subclasse pode
participar de relacionamentos especficos. o caso, por exemplo, de tcnicos que
ministram cursos.
O processo inverso ao da especializao, ou seja, o processo onde suprimimos as
diferenas entre vrios tipos de entidades, identificamos suas caractersticas em comum
e as generalizamos em uma nica superclasse chamado de generalizao. Por
exemplo, os tipos de entidades CARRO DE PASSEIO e CAMINHO podem ser
generalizados no tipo de entidade VECULOS.
Representao de uma especializao de Funcionrio.
NOME
FUNCIONRIO
TELEFONE
ENDEREO
NMERO
BAIRRO
RUA
CPF
SECRETRIA ENGENHEI RO TCNICO
DATA NASC. TIPO
GRAU ESCOLAR
MINISTRA
CURSO
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
22
4.6 Operaes:
Exemplos de algumas operaes para atualizao de bases de dados relacionais:
o Insert
A operao Insert prove uma lista de valores de atributos de uma nova tupla a ser
inserida em uma relao.
Exemplo: Insert <Jos, 68760317502, 09/09/1979, 2> em FUNCIONRIO.
o Delete
A operao Delete executa a remoo de uma ou mais tuplas especificadas por meio
de condies associadas a determinados atributos da relao.
Exemplo: Delete a tupla de FUNCIONRIO com CPF = '68760317502.
o Update
A operao Update modifica os valores de um ou mais atributos de uma tupla de
uma certa relao. Aqui tambm a tupla especificada por meio de condies
associadas a determinados atributos da relao.
Exemplo: Update o CPF da tupla de FUNCIONRIO com CPF = '68760317502'
para '79871428613'.
Cada uma das trs operaes acima pode violar uma ou mais restries de
integridade. A operao Insert, por exemplo, pode violar quatro restries integridade
(de domnio, de chave, de integridade e de integridade referencial). Quando isso
ocorre, comum rejeitar a insero da nova tupla. Com relao a operao Delete, ela
pode violar a restrio de integridade referencial. Quando isso ocorre, ou a operao de
remoo rejeitada ou propagada por meio da remoo das tuplas que referenciam a
tupla inicialmente removida.
Assim como a Insert, a operao Update tambm pode violar as quatro restries de
integridade citadas.
5.0- TiposdeSistemasGerenciadoresdeBancodeDados
5.1- dBASE
dBASE foi o primeiro SGBD largamente utilizado industrialmente, pelo Apple II,
Apple Macintosh e PC's IBM para DOS, onde se tornou um dos softwares mais
vendidos durante alguns anos. O dBASE nunca conseguiu migrar com sucesso para a
plataforma Microsoft Windows, e foi, em alguns casos, substitudo por novos produtos,
como Paradox, Clipper, FoxPro e Microsoft Access. dBase foi vendido para a Borland
em 1991, que vendeu os direitos da linha de produtos, em 1999, para a recm-formada
dBASE Inc.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
23
A partir de meados dos anos oitenta, muitas outras companhias produziram seus
prprios "dialetos" ou variaes do produto e da linguagem. Entre esses, esto: FoxPro
(atual Visual FoxPro), Arago, Force, Recital, dbFast, dbXL, QuickSilver, Clipper,
xBase++, FlagShip e Harbour. Todos foram chamados de xBase.
O formato de arquivo do dBase, o DBF, muito usado por diversos aplicativos que
precisam somente de um formato para armazenar seus dados estruturadamente.
A licena do dBase foi entregue aos usurios com a validade de 50 anos,
prevenindo-se contra a improvvel chance de um usurio utilizar sua cpia do dBase
por um extenso perodo de tempo.
Origens
O desenvolvedor original do dBase foi Wayne Ratliff. Em 1978, enquanto
trabalhava no Jet Propulsion Laboratory, Ratliff escreveu um programa de banco de
dados em linguagem assembly para microcomputadores rodando CP/M para ajud-lo a
ganhar uma aposta realizada no escritrio sobre quem seria o ganhador de um
campeonato de futebol. O programa foi baseado no JPLDIS (Jet Propulsion Laboratory
Display Information System) de Jeb Long e intitulado "Vulcan", em homenagem ao Sr.
Spock de Jornada nas Estrelas. De acordo com Ratliff, a linguagem utilizada no JPLDIS
era uma linguagem simples, orientada a comandos, que objetivava o uso interativo em
terminais de impresso. Existem alguns indcios de que JPLDIS foi influenciado por um
produto de banco de dados de mainframe chamado RETRIEVE.
No final dos anos 1980, George Tate, da Ashton-Tate, firmou um contrato de
marketing com Ratliff. Vulcan foi renomeado para dBase, e o software rapidamente se
tornou um grande sucesso.
A linguagemdeprogramaodBASE
Depois deportar o Vulcan para o IMSAI 8080 e depois para o CP/M e MS-DOS
(como dBase), Ratliff adicionou comandos para acomodar a interface de vdeo, bem
como comandos mais avanados para controle de fluxo (tais como DO WHILE /
ENDDO) e lgica condicional (tais como IF / ENDIF).
Para manipulao de dados, dBase oferecia comandos e funes procedurais
sofisticados para abrir e pesquisar arquivos (p.ex: USE, SKIP, GO TOP, GO BOTTOM,
e GO recno), manipular o valor de campos (REPLACE e STORE), e manipular strings
(p.ex.: STR() e SUBSTR()), nmeros e datas. Sua capacidade de abrir e manipular
simultaneamente diversos arquivos contendo dados relacionados levou a Ashton-Tate a
rotular o dBase como uma "base de dados relacional", muito embora o produto no
atendesse os critrios definidos pelo modelo relacional do Dr. Edgar F. Codd.
O dBase era uma linguagem interpretada, que permitia ao usurio executar
comandos digitando-se em uma linha de comando. Digitando um comando e
pressionando a tecla Entra, o interpretador imediatamente iria execut-lo. De maneira
similar, programas (arquivos texto com extenso PRG) rodavam em um interpretador
(com o comando DO), onde cada comando e varivel eram processados em tempo de
execuo. Isso fazia com que os programas dBase fossem simples e rpidos de escrever
e testar porque os programadores no tinham que primeiro compil-los antes de
execut-los. (Em outras linguagens, esses passos eram tediosos nos tempos das CPUs
com apenas algumas dezenas de megahertz). O interpretador tambm gerenciava
automaticamente e dinamicamente a memria (no havia pr-alocao de memria nem
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
24
notao hexadecimal), o que, mais do que outras funcionalidades, tornava possvel para
um usurio sem experincia de programao desenvolver aplicaes.
Por outro lado, a facilidade de uso e a simplicidade apresentada pelo dBase comeou
a se tornar uma limitao medida que seus usurios tornavam-se mais especializados e
programadores profissionais eram chamados para utiliz-lo. Aplicaes mais complexas
e mais crticas demandaram funcionalidades de programao profissional para maior
robustez e desempenho, bem como maior produtividade do programador.
Com o tempo, os competidores da Ashton-Tate introduziram os chamados produtos
e compiladores "clones", que introduziam funcionalidades de programao mais
robustas, tais como funes definidas pelo usurio (UDFs) para complementar as
funes bsicas contidas no produto, variveis com escopo definido, com menor
possibilidade de serem afetadas por processos externos, arrays para manuseio de dados
complexos, funcionalidades de empacotamento para a entrega de aplicaes na forma de
arquivos executveis sem interpretadores em tempo de execuo, sintaxe orientada a
objeto, e interfaces para o acesso aos dados de gerenciadores de bancos de dados
externos. A Ashton-Tate tambm implementou diversas dessas funcionalidades, com
graus variveis de sucesso. A Ashton-Tate e seus competidores tambm comearam a
incorporar SQL, a linguagem padro ANSI/ISO para criao, alterao e recuperao de
dados armazenados em SGBDs.
No final dos anos 1980, grupos de desenvolvedores criaram um padro para a
linguagem dBase (IEEE 1192). Foi ento que a linguagem passou a ser chamada de
"Xbase" para distingu-la do produto da Ashton-Tate. Centenas de livros foram escritos
sobre programao dBase e Xbase.
Atualmente, implementaes da linguagem dBase incluem muitas funcionalidades
direcionadas para aplicaes de negcios, incluindo a manipulao de interface de
usurio grfica (GUI), manipulao de dados remotos e distribudos, uso da Internet e
interao com dispositivos modernos. A despeito de sua funcionalidade e facilidade de
uso, o legado da linguagem dBase de ter sido "embutida" dentro de um produto
comercial popular uma das razes pela qual ela no um padro dominante hoje em
dia.
Formatodearquivo.dbf
Um dos maiores legados do dBase seu formato de arquivo .dbf, que foi
amplamente adotado.
O sistema de banco de dados dBase foi um dos primeiro a prover uma seo de
cabealho (header) para descrever a estrutura dos dados dentro do arquivo. Isso
significa que o programa no mais necessitava conhecimento avanado da estrutura de
dados, mas poderia perguntar diretamente ao arquivo de dados como este estava
estruturado.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
25
5.2- MySQL
HistriadoMySQL
O MySQL surgiu a partir da necessidade da equipe que criou o SGBD, de utilizar
algum mecanismo que permitisse a conexo de tabelas criadas na linguagem SQL para
um determinado fim. A princpio, o grupo iria utilizar o mSQL, mas logo perceberam
que esta ferramenta no era rpida o suficiente para atender s necessidades do projeto.
O jeito foi criar uma soluo prpria. Nascia o MySQL.
O MySQL foi criado por Michael Widenius na companhia sua TcX. Por volta de
1979 Michael desenvolveu um banco de dados chamado UNIREG, sendo rescritos em
vrias linguagens desde ento" . Em 1994, a empresa TcX comeou o desenvolvimento
de aplicaes baseadas na Web, tendo como base o banco UNIREG, porm esse banco
possua muito "overhead" para obter sucesso em uma aplicao para gerao de pginas
dinmicas na Web. Ento a empresa TcX comeou a procurar por outro banco o mSQL,
uma ferramenta baseada em SQL mas com caractersticas pobres no possuindo por
exemplo suporte a ndices, e com desempenho inferior ao UNIREG.
Foi ento que o desenvolvedor do banco UNIREG contatou o David Hughes criador
do mSQL, para saber do interesse dele em unir os dois bancos. Sendo positivo o
interesse de David , a empresa TcX resolveu desenvolver um novo banco, mas
mantendo ao mximo a compatibilidade com mSQL. TcX foi esperta o suficiente para
no reinventar o que j estava bem feito, ela construiu seu servidor baseado na estrutura
que j estava montada do UNIREG e utilizou grande nmero de utilitrios escritas para
mSQL e fez API's para o novo servidor praticamente iguais ao mSQL. Como resultado
usurios do mSQL que decidissem mudar para o novo servidor da TcX, teriam apenas
que fazer pequenas e simples mudanas nos cdigos existentes.
Ento foi em maio de 1995 que, definitivamente, a primeira verso do MySQL foi
lanada. Um dos parceiros da TcX sugeriu a distribuio do servidor na Internet, o
objetivo disso era a utilizao de um modelo pioneiro desenvolvido por Aladdin Peter
Deutsch. O resultado foi um maior flexibilidade em sem "copyright", que fez do
MySQL mais difundido gratuitamente do que mSQL.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
26
O BancodeDadosMySQL
Desenvolvido pela TCX em 1996. Atualmente a MySQL AB desenvolve o
programa. MySQL AB a companhia dos fundadores e principais desenvolvedores do
MySQL. Eles criaram-no porque precisavam de um banco de dados relacional que
pudesse tratar grandes quantidades de dados em mquinas de custo relativamente
barato. O MYSQL um dos bancos de dados relacionais mais rpidos do mercado,
apresenta quase todas as funcionalidades dos grandes bancos de dados . MySQL uma
linguagem simples, em que voc facilmente pode gravar, alterar e recuperar
informaes num web site com segurana e rapidez O MYSQL executado,
principalmente, em sistemas que participam da filosofia UNIX, embora outros sistemas
S.O tambm fornecem suporte, como Windows, por exemplo.
O MYSQL um sistema de gerenciamento de banco de dados relacional
multiencadeado, de cdigo fonte aberto e nvel corporativo. O MySQL no apenas um
banco de dados, mas sim um gerenciador de banco de dados. Com este SGBD (Sistema
Gerenciador de Banco de Dados), tambm pode ser utilizado para aplicaes
corporativas, o qual, necessitam de varias conexes simultneas, que possibilita 101
conexes simultneas. Uma conexo o tempo que leva para o usurio receber o dado
solicitado.
MySQL a soluo robusta para quase todo tipo de aplicao, combine a
estabilidade do MySQL com seu baixo custo de propriedade e rapidamente voc ir
consider-lo indispensvel. O MySQL oferece o melhor cenrio de todos SGBD,
executa em muitas plataformas, oferece um baixo TCO (custo total de propriedade) e
muito estvel .
O MySQL um sistema de gerenciamento de bancos de dados relacional.
Um banco de dados relacional armazena dados em tabelas separadas em vez de
colocar todos os dados um s local. Isso proporciona velocidade e flexibilidade.
O Servidor MySQL foi desenvolvido originalmente para lidar com bancos de dados
muito grandes de maneira muito mais rpida que as solues existentes e tem sido
usado em ambientes de produo de alta demanda por diversos anos de maneira bem
sucedida. Apesar de estar em constante desenvolvimento, o Servidor MySQL oferece
hoje um rico e proveitoso conjunto de funes. A conectividade, velocidade, e
segurana fazem com que o MySQL seja altamente adaptvel para acessar bancos de
dados na Internet.
O Programa de Banco de Dados MySQL um sistema cliente/servidor que consiste
de um servidor SQL multitarefa que suporta acessos diferentes, diversos programas
clientes e bibliotecas, ferramentas administrativas e diversas interfaces de programao
(API's). Tambm concedemos o Servidor MySQL como uma biblioteca multitarefa que
voc pode ligar sua aplicao para chegar a um produto mais rpido, menor e mais
facilmente gerencivel.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
27
CaractersticasdoMySQL
o Multi-plataforma, portanto suporta diferentes plataformas: Win32, Linux,
FreeBSD, Unix, etc...
o Suporte a mltiplos processadores
o Um sofisticado sistema de senhas criptografadas flexvel e Seguro.
o Suporta at 16 ndices por tabela
o Cdigo fonte escrito em C e C++ e testado com uma variedade de diferentes
compiladores
o As tabelas criadas podem ter tamanho de at 4 GB
o Banco de dados de cdigo aberto e gratuito
o Suporte s APIs das Seguintes linguagens: PHP, Perl, C,C++,Java, Pynthon,
etc...
o Suporte ODBC, voc pode facilmente conectar o Access a um banco de dados
do MySQL
o O Cliente conecta no MySQL atravs de conexes TCP/IP.
o Nenhum problema com o Y2K, visto que o MySQL usa o relgio do Unix que
no apresentar problemas at 2069
o Capacidade para manipular bancos com at 50 milhes de registros
o Reduz a administrao, engenharia e a sustentao custa por at 50%.
SegurananoMySQL
O MySQL possu componentes de segurana contra ameaas externas como
crackers e outros, e tambm proteger os dados dos prprios usurios. O mysql apresenta
vrios nveis de segurana em relao ao acesso. Todas as informaes de segurana
esto armazenadas no banco mysql,
A filosofia de segurana em banco de dados refere-se a fornecer ao usurio apenas o
que essencial para o seu trabalho.
O MySQL gratuito?
Pessoas confundem "free" com "grtis" o que comum aqui no Brasil. Mas em se
tratando de software este "free" de open source e no gratuito. Para poder utilizar o
MySQL sob a licena GPL e no precisar pagar, o produto desenvolvido precisa ser
GPL tambm, seno, orientamos a compra da licena comercial, com baixo custo, sendo
comercializada por servidor, sem limites de usurios e processadores e ainda com
garantia perptua de atualizao de verso para o resto da vida.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
28
O MySQL umbancodedadosdepartamental?
O MySQL regido pela licena GPL, portanto open source. Muitas e analisarmos o
investimento necessrio para aquisio do mesmo, podemos dizer que cabe como uma
soluo departamental. Entretanto o que muitos assustam que empresas como Nasa,
Cisco, Telefnica da Sucia, Yahoo Finance, Nokia e outras mais tem utilizado o
MySQL em aplicaes de misso crtica.
COMANDOS
Todo comando SQL termina com um ' ; '.
o CREATE DATABASE
Cria um banco de dados. Este comando cria uma rea lgica, diretrio, onde estaro
armazenadas todas as tabelas do banco de dados.
Ex: mysql>CREATE DATABASE funcionrios;
o DROP DATABASE
Apaga um banco de dados.
Ex: mysql>DROP DATABASE funcionrios;
o CREATE TABLE
Comando utilizado para criar tabelas.
Ex: mysql>CREATE TABLE alunos (matricula UNSIGNED INT(10) NOT NULL,
nome CHAR(40) NOT NULL,turma CHAR(20) NOT NULL,
PRIMARY KEY (matricula));
o ALTER TABLE
Altera Tabela
Ex: mysql>ALTER TABLE alunos ADD COLUMN turno char(10) NOT NULL
o DROP TABLE
Apaga uma tabela.
Ex: mysql>DROP TABLE alunos;
o INSERT
Comando utilizado para inserir valores numa tabela.
Ex: mysql>INSERT INTO alunos(matricula,nome,turma,turno)values
(127423,'Fred Cox Junior','Eng. Eletrnica','Manh');
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
29
o SELECT
Comando usado para recuperar valores de uma tabela. Este poderoso comando, em
conjunto com funes, possibilita a recuperao de qualquer valor de uma tabela.
Ex: mysql>SELECT * FROM alunos where nome='Fred Cox Junior';
mysql>SELECT matricula,turno FROM alunos ORDER BY matricula asc;
o DELETE
Apaga registros em uma tabela. Se no for especificada a condiowhere, todos os
dados sero apagados.
Ex: Mysql>DELETE FROM alunos WHERE turno='Manh';
o UPDATE
Altera dados numa tabela.
Ex: mysql>DROP TABLE alunos;
5.3- PostgreSQL
O PostgreSQL um banco de dados relacional e orientado a objetos. Seu grande
triunfo possuir recursos comuns banco de dados de grande porte, o que o deixa apto
a trabalhar, inclusive, com operaes de misso crtica. Alm disso, trata-se de um
banco de dados verstil, seguro e gratuito.
possvel utilizar o PostgreSQL em vrios sistemas operacionais, dentre os quais o
Windows, Linux, BSDs ou em qualquer sistema compatvel com as especificaes
POSIX (Portable Operating System Interface). Segundo informaes do site oficial, o
PostgreSQL permite a criao de uma base de dados de tamanho infinito. Cada tabela
pode ter at 16 TB, sendo que cada linha pode ter at 1,6 TB e cada campo 1 GB. O
banco de dados ainda conta com conexes SSL, MVCC, triggers, integridade
referencial, entre outros recursos, alm de ser compatvel com uma srie de linguagens,
tais como PHP, Python, Java, Perl, etc.
O uso do PostgreSQL muito amplo, pois vrias empresas perceberam que com ele
podem criar bases de dados complexas sem a necessidade de gastar altos valores na
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
30
aquisio de licenas. Outra vantagem, que o PostGreSQL possui uma documentao
muito abrangente, o que permite suporte adequado s necessidades. Uma das empresas
que so citadas como exemplo do uso deste banco de dados a Afilias, entidade
responsvel por manter e registrar domnios .org na Internet.
Breve histria do PostgreSQL
O PostgreSQL teve seu incio na University of California at Berkeley, no ano de
1986, onde Michael Stonebraker liderou um projeto para a criao de um servidor de
banco de dados relacionais, chamado de Postgres. Essa tecnologia foi ento comprada
pela Illustra, empresa posteriormente adquirida pela Informix. Porm, mesmo diante
disso, dois estudantes de Berkeley (Jolly Chen e Andrew Yu) compatibilizaram o
Postgres linguagem SQL (Structured Query Language). Este projeto recebeu o nome
de Postgres95. Em 1996, quando o projeto estava estvel, o banco de dados recebeu o
nome de PostgreSQL. No entanto, enquanto ainda possuia o nome Postgres95, o banco
de dados teve vrias mudanas. O seu cdigo foi totalmente revisado e a linguagem
SQL foi definida como padro.
O banco de dados PostgreSQL mantido por vrias pessoas do mundo,
principalmente por colaboradores dos Estados Unidos, Canad, Rssia e Japo. Neste
grupo, esto empresas que patrocinam o projeto, pesquisadores de universidades e
companhias de computao.
PostgreSQL x MySQL
Ambos os bancos de dados so eficientes e gratuitos. A grande dvida que surge,
saber qual desses SGBDs utilizar para certas aplicaes. Como o PostgreSQL foi criado
para ter vrios recursos e assim proporcionar suporte a tarefas complexas, seu uso
mais indicado em aplicaes com grande volume de dados ou que tratam de
informaes crticas, onde o banco de dados grande, ou seja, possui uma quantidade
alta de tabelas e campos. Assim, para uma loja de comrcio eletrnico, por exemplo,
cujo volume de pedidos alto, o PostgreSQL muito eficiente para tratar dos dados.
O MySQL, por sua vez, tem como foco a agilidade. Assim, se sua aplicao
necessita de respostas rpidas e no complexa, o MySQL uma escolha muito
interessante, pois sua otimizao permite velocidade alta de processamento e tempo
curto de resposta. Se voc precisa de um banco de dados para trabalhar com o contedo
do seu site, frum, cadastro de usurios, entre outros, o MySQL uma escolha
adequada. Isso porque aplicaes como estas no necessitam dos recursos sofisticados
que o PostgreSQL oferece, por exemplo.
Para escolher entre um destes dois SGBDs, primeiro procure o foco de cada um.
Como j dito, o PostGreSQL busca oferecer recursos avanados. O foco principal do
MySQL a agilidade. Assim, analise primeiro os recursos de que vai precisar. Se baseie
no seguinte exemplo: voc no precisa comprar um nibus se sua famlia pode muito
bem ser transportada num carro de 5 lugares. A grande resposta da questo verificar
quais os recursos necessrios e escolher o SGBD que melhor se adapta a eles. Se voc
escolher o PostgreSQL para operaes simples, poder perder tempo e desperdiar
recursos. Da mesma forma, se escolher o MySQL para aplicaes de porte maior,
poder ter problemas com o gerenciamento dos dados.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
31
5.4- Oracle
O sistema gerenciador de banco de dados Oracle surgiu no final dos anos 70,
quando Larry Ellison vislumbrou uma oportunidade que outras companhias no haviam
percebido, quando encontrou uma descrio de um prottipo funcional de um banco de
dados relacional e descobriu que nenhuma empresa tinha se empenhado em
comercializar essa tecnologia.
Ellison e os co-fundadores da Oracle Corporation, Bob Miner e Ed Oates,
perceberam que havia um tremendo potencial de negcios no modelo de banco de dados
relacional tornando assim a maior empresa de software empresarial do mundo.
O SGBD da Oracle lder de mercado. O Oracle 9i foi pioneiro no suporte ao
modelo web. O Oracel 10g, mais recente, se baseia na tecnologia de grid.
Alm do base de dados, a Oracle desenvolve uma sute de desevolvimento chamada
de Oracle Developer Suite, utilizada na construo de programas de computador que
interagem com a sua base de dados.
A Oracle tambm criou a linguagem de programao PL/SQL, utilizada no
processamento de transaes.
5.5- Microsoft SQL Server
Criado pela Microsoft, o MS SQL Server um gerenciador de Banco de dados
relacional. um Banco de dados, muito robusto e usado muito em empresas e por
grandes sistemas corporativos. Atualmente encontra-se na verso 2005. Entre os novos
recursos est a integrao com o Framework .Net, que possibilita construir rotinas
utilizando as linguagens do .Net como VB.Net e C#.
O MS SQL Server tem verses unicamente para as diversas verses do sistema
operacional Windows, da Microsoft, ao contrrio do seu grande concorrente, Oracle,
que funciona em diversas plataformas e sistemas operacionais diferentes.
Suas ferramentas de gerenciamento so nativas, no necessitando que sejam
adquiridas separadamente. So elas : MS SQL Enterprise Manager (Console Central
que integra num nico painel, a maioria das funes que um DBA poder utilizar-se
para configurar e gerenciar esse RDBMS, o Query Analyzer que permite executar
querys e auxilia o gerenciamento, inclusive em Tunning, o Profile que uma espcie de
Trace, descortinando os comandos que o gerenciador est executando, alm de outras
ferramentas.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
32
5.6- Microsoft Access
O Microsoft Access (Microsoft Office Access), tambm conhecido por MSAccess,
um sistema relacional de administrao de banco de dados da Microsoft, includo no
pacote do Microsoft Office Professional, que combina o Microsoft Jet Database Engine
com uma interface de usurio grfica. Ele permite o desenvolvimento rpido de
aplicaes que envolvem tanto a modelagem e estrutura de dados como tambm a
interface a ser utilizada pelos usurios.
Microsoft Access capaz de usar dados guardados em Access/Jet, Microsoft SQL
Server, Oracle, ou qualquer recipiente de dados compatvel com ODBC.
Desenvolvedores de software e arquitetos de dados experientes costumam us-lo para
desenvolver complexos e potentes programas de aplicao.
O desenvolvimento da estrutura de dados se d de forma muito intuitiva, bastando
que o desenvolvedor possua conhecimetos bsicos em modelagem de dados e lgica de
programao.
Programadores relativamente inexperientes e usurios determinados podem us-lo
para construir aplicaes simples, sem a necessidade de utilizar ferramentas
desconhecidas. O programa oferece suporte substancial para tcnicas de orientao-
objeto (OO), porm no chega a ser uma ferramenta completa de desenvolvimento OO.
Utilizao
Geralmente uma aplicao desenvolvida com o Access atravs da linguagem de
programao VBA (Visual Basic for Applications) consiste em dois arquivos, um que
se denomina BackEnd, onde ficam armazenadas todas as tabelas com seus respectivos
relacionamentos, e outro denominado FrontEnd, onde ficam armazenados os cdigos
fontes, formulrios, mdulos, consultas, macros, etc.
O cdigo fonte pode ser compilado, mas no possvel gerar um executvel. Para
rodar os aplicativos desenvolvidos necessrio que o usurio possua em sua estao de
trabalho o MSAccess instalado ou pelo menos o seu Runtime que vem a ser uma verso
enxuta do MSAccess que servir apenas para rodar os aplicativos sem a possibilidade de
desenvolvimento.
Com o Microsoft Access possvel desenvolver desde aplicaes simples como por
exemplo, um cadastro de clientes, controle de pedidos at aplicaes mais complexas,
como por exemplo, todo o controle operacional, administrativo e financeiro de uma
pequena ou at mesmo de uma mdia ou grande empresa, pois os aplicativos
desenvolvidos podem rodar perfeitamente em uma rede de computadores e os dados
armazenados pelo sistema podem ser publicados na Intranet ou at mesmo na Internet.
Access pouco escalvel se o acesso aos dados for feito via uma rede, portanto
qualquer aplicao que seja usado por mais de um punhado de pessoas tende depender
em solues com base no Cliente-Servidor. Porm, um Access do tipo "front end" (as
formas, os relatrios, pedidos de busca e cdigos VB) pode ser usado paralelamente
diversos tipos de "back ends", incluindo o prprio Access, o Microsoft SQL Server, o
Oracle ou qualquer outro produto compatvel com ODBC. Esse mtodo permite ao
desenvolvedor a mudana dos dados de uma aplicao madura para um servidor mais
avanado sem sacrificar o projeto em andamento.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
33
Caractersticas
Um dos benefcios do Access sua relativa compatibilidade com o SQL buscas
podem ser visualizadas e editadas como sendo indicaes de SQL, e estes por sua parte
podem ser usados diretamente em Macros e Mdulos VBA para manipular tabelas do
prprio Access. Usurios podem misturar e usar ao mesmo tempo VBA e Macros para
formulrios de programao e lgica, alm de serem oferecidos possibilidades com
tcnicas de orientao-objeto.
A funo "cortar e colar"(cut and paste) do Access pode torn-lo uma ferramenta
til para a conexo entre diversos bancos de dados (por exemplo, entre o Oracle e o
Microsoft SQL Server durante converses de dados ou bancos de dados).
Access disponibiliza vrias funes de exportao e importao (import and export),
que permitem a integrao entre o Windows e outras aplicaes de plataforma, muitas
das quais podem ser executadas dentro das prprias aplicaes ou manualmente pelo
usurio.
A partir do MS Access 2000, h uma sintaxe que permite a criao de pedidos de
busca com parmetros, semelhante criao de procedimentos armazenados, porm tais
procedimentos so limitados uma declarao por procedimento.
O Microsoft Access permite que formulrios contenham cdigos que so ativados
medida que mudanas so feitas uma tabela subjacente (contanto que as modificaes
so feitas apenas com aquele formulrio), e comum usar buscas "pass-through" e
outras tcnicas no Access para ativar procedimentos armazenados em RDBMSs que
suportam este tipo de sistema.
Em arquivos de projeto de banco de dados do Access ADP (suportado em MS
Access 2000 e adiante), as ferramentas relacionadas aos bancos de dados so
completamente diferentes, uma vez que este tipo de arquivo conectado ao MSDE ou
ao Microsoft SQL Server, ao invs de usar o motor Jet. Deste modo, ele suporta a
criao de quase qualquer objeto no servidor subjacente (tabelas com restries e
gatilhos, visualizaes, procedimentos armazenados e UDF's).
Contudo apenas formulrios, relatrios, macros e mdulos so armazenados no
arquivo ADP (outros objetos so armazenados no banco de dados "back end").
Desenvolvimento
A linguagem de programao disponvel no access a Microsoft Visual Basic for
Applications, igualmente outros produtos da srie Microsoft Office.
Duas bibliotecas de componentes COM de acesso de banco de dados so
providenciadas: a legacy Data Access Objects (DAO), apenas disponvel com o Access,
e o novo ActiveX Data Objects (ADO).
Microsoft Access facilmente aplicado projetos pequenos porm sofre problemas
de escala com projetos maiores se as aplicaes forem mal desenvolvidas.
Todas as buscas no banco de dados, formulrios e relatrios so armazenados no
banco de dados, e visando os ideais de um modelo relacional, no h possibilidade de
montar uma hierarquia estruturada fisicamente a partir deles.
Uma tcnica de desenvolvimento dividir uma aplicao Access entre dados e
programas. Um banco de dados deve conter apenas tabelas e relaes, enquanto outro
contm todos os programas, formulrios, relatrios e pedidos de busca, assim como as
conexes para as tabelas do primeiro banco de dados.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
34
Infelizmente, o Access no permite trilhas quando so feitas as conexes, e o
ambiente de desenvolvimento deve ter a mesma trilha do ambiente de produo, embora
seja possvel escrever sua prpria rotina de "conexo dinmica" em VBA, que pode
procurar um arquivo "back end" especfico atravs de uma pesquisa dentro da rvore do
diretrio, se no puder encontr-lo no caminho atual.Esta tcnica tambm permite que o
desenvolvedor divida a aplicao entre arquivos diferentes, sendo ento possvel uma
certa estrutura.
5.7- DataWarehouse
O queumDataWarehouse?
Um data warehouse (ou armazm de dados, ou depsito de dados) um sistema de
computao utilizado para armazenar informaes relativas s atividades de uma
organizao em bancos de dados, de forma consolidada. Caracteriza-se de um ambiente
estruturado, extensvel, projetado para a anlise de dados no volteis, lgica e
fisicamente transformados, provenientes de diversas aplicaes, alinhados com a
estrutura da empresa, atualizados e mantidos por um longo perodo de tempo.
Antes da popularizao dos data warehouse e das ferramentas ERP (Enterprise
Resource Planning), uma verdadeira integrao dos dados no existia, pois os antigos
sistemas integrados trocavam dados na forma que atendesse s necessidades de cada
um deles, mas essa pequena integrao sequer se aproxima do que se v hoje nos ERP.
Cada aplicativo tinha uma viso do que era um cliente, um produto ou uma operao,
uma viso corporativa das informaes disponiveis era praticamente fico.
A ERP e o data warehouse podem suprir estas deficiencias, integrando dados,
provendo dados histricos, e permitindo a recuperao de informaes de forma
sinttica ou analtica.
O data warehouse possibilita a anlise de grandes volumes de dados, coletados dos
sistemas transacionais . So as chamadas sries histricas que possibilitam uma melhor
anlise de eventos passados, oferecendo suporte s tomadas de decises presentes e a
previso de eventos futuros. Por definio, os dados em um data warehouse no so
volteis, ou seja, eles no mudam, salvo quando necessrio fazer correes de dados
previamente carregados. Os dados esto disponveis somente para leitura e no podem
ser alterados.
Caractersticas
Um sistema de Data Warehouse possui quatro caractersticas bsicas:
o Organizado por Temas
Um DW orientado por temas armazena informaes sob a forma de assuntos
diferentes entre si e que so considerados importantes para o negcio da empresa.
Alguns exemplos de temas utilizados em projetos deste tipo so: produtos, atividades,
contas, clientes, etc.
Nos projetos de sistemas tipicamente transacionais h uma organizao norteada por
aplicaes funcionais. Num hospital, por exemplo, temos os sistemas de admisso de
pacientes (internao), o sistema de faturamento, o sistema de controle de estoque,
controle de infeco hospitalar, entre muitos outros. Estes sistemas esto organizados
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
35
pela funo desempenhada por cada setor a fim de suprir as necessidades de controle
das informaes do dia a dia da entidade.
o Integrado
A integrao do DW diz respeito consistncia de denominaes, das unidades dos
valores contidos nas tabelas e outras padronizaes aplicadas aos dados no sentido de
que estes sejam transformados at estarem num estado uniforme.
Um exemplo clssico refere-se varivel sexo do paciente. Em uma determinada
aplicao transacional podemos ter codificado o sexo do indivduo com "M" para
masculino e "F" para feminino, j em outra aplicao podemos representar este item
com "1" para masculino e "0" para feminino, chegando at mesmo a uma terceira
configurao com "H" para homens e "M" para mulheres. Este ltimo caso poderia
acarretar em uma duplicidade de dados que no podem ser considerados iguais, que o
caso do "M" que tanto pode representar Mulheres como o sexo Masculino.
medida que os dados so carregados no DW, necessrio convert-los para um
estado uniforme, ou seja, codificar a varivel sexo com apenas um formato, por
exemplo, "M" para masculino e "F" para feminino.
A padronizao ou integrao serve para fornecer uma maior confiabilidade nas
comparaes que sero feitas durante as anlises solicitadas pelos usurios do sistema
de DW.
o Variante no Tempo
Os dados contidos num DW so temporais, ou seja, referem-se a perodos de tempo
bem definidos, e isto auxilia na anlise e na confirmao de acontecimentos sazonais
dentro de uma determinada atividade ou ramo de negcio.
As sries temporais empregam caractersticas especficas ao ambiente do DW que
deve ser programado para permitir o gerenciamento dos dados representativos da
coexistncia de intervalos de tempo com informaes que sero analisadas e
comparadas constantemente. Muitas vezes possvel verificar a presena em sistemas
de processamento analtico os dados representativos de dias e meses, sendo necessrio
controlar por exemplo o nmero de dias contidos em um ms ou em um ano, em que dia
da semana est o primeiro dia do ms ou ainda quantas semanas tem o ms ou o ano.
o No Voltil
Um sistema de DW deve permitir apenas uma carga inicial dos dados e
posteriormente oferecer estes mesmos dados para consultas dos usurios. Este ambiente
conhecido por "load-and-access" (carga e acesso). Os dados integrados e
transformados so carregados para o DW na forma de blocos de informaes, ficando
disposio dos usurios para consultas e comparaes. J no ambiente operacional
temos uma situao diferente: os dados so atualizados de forma atmica, registro a
registro, em vrias transaes durante todo o tempo de uso das aplicaes.
Para assegurar a integridade e confiabilidade dos dados so necessrias diversas
operaes como rollback, recuperao de falhas, commits e bloqueios. Os controles
tradicionais dos sistemas orientados a transaes no so necessrios em DWs uma vez
que os dados carregados so quase sempre oriundos daqueles sistemas e,
conseqentemente, j passaram pelo crivo de controle.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
36
Arquiteturadearmazenamento
Um Data Warehouse pode armazenar grandes quantidades de informao, s vezes
divididas em unidades lgicas menores que so chamadas de Data Marts. O esquema de
dados mais utilizado o Star Schema (Esquema Estrela), tambm conhecido como
Modelagem Multidimensional. Apesar de bastante utilizado, no existe um padro na
indstria de software para o armazenamento de dados. Existem, na verdade, algumas
controvrsias sobre qual a melhor maneira para estruturar os dados em um Data
Warehouse.
Geralmente, o Data Warehouse no armazena informaes sobre os processos
correntes de uma nica atividade de negcio, mas sim cruzamentos e consolidaes de
vrias unidades de negcios de uma empresa.
Modelagem
Os sistemas de base de dados tradicionais utilizam a padronizao no formato de
dados para garantir consistncia dos dados e uma minimizao do espao de
armazenamento necessrio. Entretanto, frequentemente as transaes e consultas em
bases de dados normalizadas so lentas. Um Data Warehouse utiliza dados em formato
mais de-normalizados (formato livre). Isto aumenta a performance das consultas e,
como benefcio adicional, o processo torna-se mais intuitivo para os utilizadores
usurios comuns.
5.7.1 Metadado
O conceito Metadado considerado como sendo os "dados sobre dados", isto , os
dados sobre os sistemas que operam com estes dados. Um repositrio de metadados
uma ferramenta essencial para o gerenciamento de um Data Warehouse no momento de
converter dados em informaes para o negcio. Entre outras coisas, um repositrio de
metadados bem construdo deve conter informaes sobre a origem dos dados, regras de
transformao, nomes e alias, formatos de dados, etc. Ou seja, esse "dicionrio" deve
conter muito mais do que as descries de colunas e tabelas: deve conter informaes
que adicionem valor aos dados.
TipodeInformaoconsideradaMetadado
Os metadados so utilizados normalmente como um dicionrio de informaes e,
sendo assim, devem incluir:
o Origem dos dados
Todo elemento de dado precisa ser identificado, sua origem ou o processo que o
gera. Esta identificao muito importante no caso de se necessitar saber informaes
sobre a fonte geradora do dado. Esta informao deve ser nica, ou seja, cada dado deve
ter uma e somente uma fonte de origem.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
37
o Fluxo do dado
Todo elemento de dado precisa ter identificado os fluxos nos quais sofre
transformaes. importante saber que dados servem de base para que processos.
o Formato dos dados
Todo elemento de dados deve ter identificado seu tamanho e tipo de dado.
o Nomes e alias
Todo elemento de dados deve ser identificado por um nome. Este nome pode ser da
rea de negcios ou um nome tcnico. No caso de serem usados alias para os nomes,
pode-se ter os dois. Devem existir padres para criao de nomes e alias (ex.:
convenes para abreviaes), evitando assim ambigidades.
o Definies de negcio
Estas definies so as informaes mais importantes contidas nos metadados. Cada
elemento de dado deve ser suportado por uma definio do mesmo no contexto da rea
de negcio. O mtodo de manuteno destas informaes tambm deve ser muito
consistente, de forma que o usurio possa obter facilmente definies para as
informaes desejadas. Nestas definies devem ser evitadas referncias a outros
metadados que necessitem de uma segunda pesquisa para melhor entendimento.
o Regras de transformao
So consideradas como sendo as Regras de Negcio codificadas. Estas regras so
geradas no momento da extrao, limpeza e agrupamento dos dados dos Sistemas
Operacionais. Cada regra de transformao codificada, deve estar associada a um
elemento de Metadado. Se mais de uma aplicao contiver a mesma regra de
transformao, dever ser garantido que estas sejam idnticas.
o Atualizao dos dados
O histrico das atualizaes normalmente mantido pelo prprio banco de dados,
mas ter definido um elemento de metadado indicando as datas de atualizao dos dados,
pode facilitar o usurio no momento de verificar a atualidade dos dados e a consistncia
da dimenso tempo do Data Warehouse.
o Requisitos de teste
Identifica os critrios de julgamento de cada elemento de dado. Valores possveis e
intervalos de atuao. Deve conter tambm padres para procedimentos de teste destes
dados.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
38
o Indicadores de qualidade de dados
Podem ser criados ndices de qualidade, baseados na origem do dado, nmero de
processamentos feito sobre este dado, valores atmicos X valores sumariados, nvel de
utilizao do dado etc.
o Triggers automticos
Podem existir processos automticos associados aos metadados definidos. Estes
processos ou triggers devem estar definidos de forma que possam ser consultados por
usurio e desenvolvedores, para que os mesmos no venham a criar situaes
conflitantes entre as regras definidas nestes processos.
o Responsabilidade sobre informaes
Deve ser identificado o responsvel por cada elemento de dados do Data Warehouse
e tambm o responsvel pela entrada de metadados.
o Acesso e segurana
Os metadados devem conter informao suficiente para que sejam determinados
perfis de acesso aos dados. Deve-se poder identificar que usurios podem ler, atualizar,
excluir ou inserir dados na base. Deve haver tambm informaes sobre quem gerencia
estes perfis de acesso e como se fazer contato com o Administrador da Base de Dados.
5.7.2- DataMart
Data mart (entreposto ou bazar de dados) sub-conjunto de dados de um Data
warehouse (armazm de dados). Geralmente so dados referentes a um assunto em
especial (ex: Vendas, Estoque, Controladoria) ou diferentes nveis de sumarizao (ex:
Vendas Anual, Vendas Mensal, Vendas 5 anos), que focalizam uma ou mais reas
especficas. Seus dados so obtidos do DW, desnormalizados e indexados para suportar
intensa pesquisa. Data marts extraem e ajustam pores de DWs aos requisitos
especficos de grupos/departamentos.
As questes de planejamento, projeto e implementao so as mesmas encontradas
em qualquer fase da implementao de um DW, pois uma parte dos especialistas
argumenta que o DW uma evoluo natural de um Data Mart que comeou localizado
e cresceu para atender um escopo maior. Essa viso tem defesa menos tcnica e mais
intuitiva do que sua contra-parte: o Data Mart criado a posteriori do DW, pois ele seria
montado com dados extrados do DW para atender especificamente um setor da
organizao.
Numa viso comparativa dos dados, onde consideramos os quesitos escopo,
integrao, tempo, agregao, anlise e dados volteis, percebemos que a diferena est
no escopo, pois enquanto o DW feito para atender uma empresa como um todo, o data
mart criado para atender um sub-conjunto da empresa. Repare que atender um sub-
conjunto da empresa pode significar reunir dados de outros setores, j que, na prtica,
raramente um nico setor possui ou gera toda informao que precisa. Vem dessa
observao a defesa da tese de que o Data Mart construdo aps o DW.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
39
No se pode dizer que um Data warehouse um conjunto de Data Marts. Seria o
mesmo que dizer que o armazm geral de um supermercado, onde todos os itens vo
antes de seguir para as lojas, o agrupamento de supermercados.
ExtraodeDados
Os dados introduzidos num Data Warehouse geralmente passam por uma rea
conhecida como rea de stage. O stage de dados ocorre quando existem processos
peridicos de leitura de dados de fontes como sistemas OLTP. Os dados podem passar
ento por um processo de qualidade, denormalizao e gravao dos dados no Data
Warehouse. Esse processo geralmente realizado por ferramentas ETL.
OLAP
OLAP um acrnimo em ingls para Online Analytical Processing, ou
processamento analtico on-line. uma abordagem tecnolgica para gerar respostas
rpidas a consultas analticas de natureza tipicamente dimensional. A tecnologia OLAP
parte de uma categoria mais abrangente, Business intelligence, que tambm inclui
Data warehouse, ETC (Extrao transformao e carga) e Data mining. Aplicaes
tpicas de OLAP so relatrios de negcios, marketing, relatrios gerenciais, business
performance management (BPM), budgeting e previso, relatrios financeiros e reas
similares. O termo OLAP foi criado como uma ligeira variao de um termo tradicional
em bancos de dados, OLTP (On Line Transaction Processing, ou processamento de
transaes on-line).
Bases de dados mais adequadas para OLAP empregam um modelo de base de dados
dimensional, que permite consultas analticas complexas ou ad-hoc, com um tempo de
execuo pequeno. Nigel Pendse sugeriu que um termo alternativo e talvez mais
descritivo para o conceito de OLAP seja Fast Analysis of Shared Multidimensional
Information, (Anlises Rpidas de Informao Multidimensional Compartilhada). A
FASMI empresta aspectos de bancos de dados navegacionais e de bancos de dados
hierrquicos, que so mais rpidos que seu semelhante relacional.
Funcionamento
Um software OLAP trabalha tomando uma "foto" da fonte de dados e
reestruturando-a em um cubo OLAP. As consultas so ento feitas sobre esse cubo. J
foi afirmado que, para consultas complexas, um software OLAP pode dar uma resposta
em cerca de 0,1% do tempo gasto pela mesma consulta feita em bases de dados
relacionais usadas em sistemas OLTP.
O cubo criado a partir de um esquema estrela (star schema) de tabelas. No centro
est a tabela de fatos (fact table) que lista os fatos principais de que consiste a pesquisa.
Vrias tabelas dimensionais esto ligadas s tabelas de fatos. Estas tabelas indicam
como as agregaes de dados relacionais podem ser analisadas. O nmero de
agregaes possveis determinado por todas as maneiras possveis em que os dados
originais podem ser conectados hierarquicamente.
Por exemplo, um conjunto de clientes pode ser agrupado por cidade, por distrito ou
por pas; com 50 cidades, 8 distritos e 2 pases, h trs nveis hierrquicos com 60
membros. Esses clientes podem ser estudados em relao a produtos; se h 250
produtos com 20 categorias, trs famlias e trs departamentos, ento h 276 membros
de produto. Com apenas duas dimenses, localizao geogrfica e produto, h 16.560
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
40
agregaes possveis. medida que os dados considerados aumentam, o nmero de
agregaes pode facilmente chegar s dezenas de milhes ou mais.
O clculo de agregaes e a base de dados combinada fazem um cubo OLAP, que
pode potencialmente conter todas as respostas para cada consulta que pode ser
respondida com os dados. Devido ao potencial nmero de agregaes para ser
calculado, freqentemente apenas um nmero predeterminado completamente
calculado enquanto o restante resolvido sob demanda.
TiposdeOLAP
H trs tipos de OLAP:
o OLAP Multidimensional
MOLAP a forma clssica do OLAP e algumas vezes referida como
simplesmente OLAP. MOLAP usa estruturas de bancos de dados que so atributos
genricos otimizados, como perodo de tempo, localidade, produto ou cdigo de conta.
A forma como cada dimenso vai ser agregada definida a priori por uma ou mais
hierarquias.
o OLAP Relacional
ROLAP trabalha diretamente com bancos de dados relacionais. Os dados e as
tabelas de dimenses so armazenadas como tabelas relacionais e novas tabelas so
criadas para receber a informao agregada.
o OLAP Hbrido
No h consenso claro na indstria sobre o que "OLAP Hbrido", exceto que um
banco de dados vai dividir dados entre armazenamento relacional e especial. Para
alguns fornecedores, por exemplo, um banco de dados HOLAP usa tabelas para manter
as grandes quantidades de dados detalhados, e um armazenamento especializado para
pelo menos alguns aspectos dos dados das quantidades menores, que so menos
agregadas ou detalhadas.
Comparaoentraostipos:
Cada tipo tem suas caractersticas, apesar de no haver consenso sobre os detalhes
dos benefcios entre os fornecedores. MOLAP melhor com pequenas bases de dados,
calcula rapidamente as agregaes e repostas e precisa de menos espao de
armazenamento.
ROLAP considerado mais escalvel. Entretanto, difcil implementar
eficientemente um pr-processamento para grandes volumes e por isso frequentemente
deixado de lado. A performance das consultas ROLAP pode, portanto, sofrer com
grandes volumes.
HOLAP est entre os dois em todas as reas, mas tem um pr-processo rpido e
escalona bem. Todos os tipos esto sujeitos exploso de bases de dados. Esse
fenmeno causa a alocao de grandes volumes de memria pelas bases OLAP, quando
certas (e frequentes) condies so satisfeitas: grande nmero de dimenses, resultados
pr-calculados e dados multidimensionais esparsos. A dificuldade em implementar
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
41
OLAP vem da formao das consultas, da escolha dos dados de base e do
desenvolvimento do esquema(-estrela). Como resultado disso, muitos dos modernos
produtos OLAP vm com vastas bibliotecas de consultas pr-configuradas. Outro
problema a qualidade do conjunto dos dados de base: ele deve ser completo e
consistente.
OLTP versusOLAP
Os termos OLTP (on-line transaction processing processamento on-line de
transaes) e OLAP (on-line analytical processing processamento analtico on-line)
descrevem o modo de processamento de cada uma das componentes da diviso proposta
para os sistemas de Bancos de Dados.
Bancos de dados operacionais atingem propores de centenas de megabytes e at
mesmo gigabytes. Consistncia e capacidade de recuperao de dados so crticas, e a
maximizao do poder de processar transaes requerida para minimizar os problemas
que podem ser causados pela concorrncia de processos.
Analisando sistemas OLAP, sistemas que do apoio deciso, pode-se notar o
contraste com OLTP. No caso do processamento analtico deve-se dar maior
importncia aos dados histricos, totalizados e consolidados em detrimento dos dados
detalhados ou individualizados.
Uma vez que os DW contm dados referentes a longos perodos de tempo, estes
podem atingir dimenses muito maiores do que os bancos de dados operacionais,
chegando a conter centenas de gigabytes e at mesmo terabytes de informaes.
A tabela ilustra as diversidades apresentadas pelos dois tipos de sistemas, DW e
Bancos de Dados Operacionais:
Diferenas entre os tipos de sistemas.
Caractersticas BDs Operacionais DW
Objetivo Operaes dirias do negcio Analisar o negcio
Uso Operacional Informativo
Tipodeprocessamento OLTP OLAP
Unidadedetrabalho Incluso, alterao, excluso Carga e consulta
Nmerodeusurios Milhares Centenas
Tipodeusurio Operadores Comunidade gerencial
Interaodousurio Somente pr-definida Pr-definida e ad-hoc
Condiesdosdados Dados operacionais Dados Analticos
Volume Megabytes gigabytes Gigabytes terabytes
Histrico 60 a 90 dias 5 a 10 anos
Granularidade Detalhados Detalhados e resumidos
Redundncia No ocorre Ocorre
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
42
Caractersticas BDs operacionais DW
Estrutura Esttica Varivel
Manutenodesejada Mnima Constante
Acessoaregistros Dezenas Milhares
Atualizao Contnua (tempo real) Peridica (embatch)
Integridade Transao A cada atualizao
Nmerodendices Poucos/simples Muitos/complexos
Intenodosndices Localizar um registro Aperfeioar consultas
Businessintelligence
O termo "Business Inteligence (BI)", pode ser traduzido como "Inteligncia de
negcios", refere-se ao processo de coleta, organizao, anlise, compartilhamento e
monitorao de informaes que oferecem suporte a gesto de negcios.
o Processo Empresarial
As organizaes tipicamente recolhem informaes com a finalidade de avaliar o
ambiente empresarial, completando estas informaes com pesquisas de marketing,
industriais e de mercado, alm de anlises competitivas. Organizaes competitivas
acumulam "inteligncia" medida que ganham sustentao na sua vantagem
competitiva, podendo considerar tal inteligncia como o aspecto central para competir
em alguns mercados.
Geralmente, os coletores de BI obtm as primeiras fontes de informao dentro das
suas empresas. Cada fonte ajuda quem tem que decidir a entender como o poder fazer
da forma mais correta possvel. As segundas fontes de informao incluem as
necessidades do consumidor, processo de deciso do cliente, presses competitivas,
condies industriais relevantes, aspectos econmicos e tecnolgicos e tendncias
culturais. Cada sistema de BI determina uma meta especfica, tendo por base o objetivo
organizacional ou a viso da empresa, existindo em ambos objetivos, sejam eles de
longo ou curto prazo.
o Tecnologia de BI
Alguns observadores consideram que o processo de BI reala os dados dentro da
informao e tambm dentro do conhecimento. Pessoas envolvidas em processos de BI
podem usar softwares ou outras tecnologias para obter, guardar, analisar, provendo
acesso aos dados, seja ele simples ou de muito uso. O software "cura" a performance de
gerenciamento do negcio e ajuda no alvo das pessoas tomarem as melhores decises
pela exatido, atuais e relevantes com as informaes viveis a quem quiser quando for
necessrio. Algumas pessoas utilizam o termo "BI" intercmbiando ele com "livros de
reunio" ou "sistemas de informaes executivas", de acordo com a informao que
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
43
cada um contm. nesse sentido, que cada pode considerar um sistema de BI como um
sistema de suporte para tomada de deciso (decision-support system).
o Tipos de software
As pessoas que trabalham com o BI tem que desenvolver ferramentas em cada caso,
especificadamente quando a inteligncia envolve recolhimento e anlise de largas
quantidades de dados desestruturados. Existem inmeros softwares para gerenciamentos
destas informaes, em diversas categorias. Uma pesquisa nas ferramentas de busca da
internet podem trazer diversas informaes sobre cada um destes programas.
5.7.3- OqueoDataMining?
o processo de descoberta de novas correlaes, padres e tendncias entre as
informaes de um empresa, atravs da anlise de grandes quantidades de dados
armazenados em um banco de dados usando tcnicasde reconhecimento de padres,
estatsticas e matemticas.
As duas ultimas dcadas acompanharam um aumento dramtico na quantia de
informaes ou dados que so armazenados em formato eletrnico. Esta acumulao de
dados aconteceu a uma taxa explosiva. Esses dados crus raramente tem benefcios
diretos. Seu valor verdadeiro verificado na habilidade de extrair informaes teis
para suporte de deciso ou explorao e atender o fenmeno do gerenciamento de fonte
de dados.
O armazenamento de dadosficou mais fcil com a grande capacidade computacional
a baixo custo, isto , o custo da capacidade de processamento e armazenamento sofreu
sensvel queda. Houve tambm a introduo de novos mtodos de aprendizado de
mquina para representao do conhecimento baseado em programao lgica, alm da
tradicional anlise estatstica dos dados.
Tendo concentrado muita ateno no armazenamento de dados o problema passou a
ser o que fazer com esse recurso valioso? Foi reconhecido que a informao esta no
corao de operaes empresariais e que empresrios poderiam fazer uso dos dados
armazenados e assim obter sucesso no ramo dos negcios. Sistemas de administrao de
banco de dados deram acesso aos dados armazenados, mas essa era s uma pequena
parte do que poderia ser obtido dos dados. Sistemas tradicionais de processamento de
transaes on-line, OLTPs, so ferramentas boas no que se refere a repor dados
rapidamente, seguramente e eficazmente em banco de dados mas no so boas para
retornar uma anlisesignificativa relativa aos dados.
Dados analisados podem prover conhecimento adicional sobre um negcio, indo
explicitamente alm dos dados armazenados, para derivar conhecimento sobre o
negcio. Isto onde o Data Mining tem benefcios obvios para qualquer
empreendimento.
O Data Mining se preocupa com a anlise dos dados e com o uso de tecnicas de
software responsveis por achar padres e regularidades no conjunto de dados. o
computador que o responsvel por achar os padres identificando as regras
subjacentes e as caractersticas nos dados. A idia que possvel achar ouro em
lugares inesperados, tal como os softwares de data mining extraem padres no
previamente encontrados ou to obvios que nenhum os notou antes.
Anlise de data mining tende a trabalhar nos dados e as melhores tecnicas so essas
desenvolvidas com uma orientao para volumes grandes de dados e fazem uso de
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
44
muito dos dados colecionados como possveis a chegar concluso fidedignas e
decises.O processo de anlise comea com um conjunto de dados, usa-se uma
metodologia para desenvolver uma otima representao da estrutura dos dados durante
o tempo em que o conhecimento adquirido. Uma vez que o conhecimento foi
adquirido, isto pode ser estendido a conjuntos maiores de dados que trabalham na
suposio de que o conjunto de dados maior tem uma estrutura semelhante aos dados da
amostra.
Os seguintes requisitos resumem alguns dos processos do Data Mining. As fases
descritas a seguir comeam com os dados crus e terminam com o conhecimento
extrado que era adquirido como resultado das fases seguintes:
o Seleo
Selecionando ou segmentando os dados de acordo com algum critrio, por exemplo
todas as pessoas que possuem um carro, deste modo subconjuntos dos dados podem ser
determinados.
o Pr-processamento
Esta a fase de limpesa dos dados onde sertas informaes so removidas desde que
sejam julgadas desnecessrias. Estas informaes no pertinentes podem reduzir a
velocidade de queries como por exemplo desnecessrio notar o sexo de um paciente
quando est estudando gravidez. Tambm os dados so reconfigurados para assegurar
um formato consistente pois h uma possibilidade de formatos incompatveis. Isto
porque os dados so tirados de vrias fontes, como exemplo, sexo pode ser registrado
como F ou M e tambm como como 1 ou 0.
o Transformao
Os dados no so somente transferidos mas transformados em dados teis, tais como
dados demogrficos comumente usados em pesquisas de mercado. Ento os dados
tornam-se utilizveis e navegveis.
o Data Mining
Esta fase se preocupa com a extrao de padres de dados. Um padro pode ser
definido como determinado conjunto de fatos(dados) F, uma linguagem L, e alguma
medida de certeza C. Um padro uma declarao S em L que descreve relaes entre
conjuntos Fs de F com uma certeza C tal aquele S mais simples em um sensao que
a enumerao de todos os fatos em Fs.
o Interpretao e avaliao
Os padres identificados pelo sistema so interpretados em conhecimento que pode
ento ser usado para apoiar decises humanas como por exemplo classificar tarefas,
resumir os contedos de um banco de dados ou explicar fenmenos observados.
Os principais motivos que tem levado as empresas a investir nessa tecnologia
tem sido a obteno de uma melhor viso sobre a extenso base de dados e a revelao
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
45
de relaes implictas e padres entre os dados que nam sempre so visveis atravs da
simples observao. H trs razes principais para se desenvolver um projeto em Data
Mining.
o Visualizao dos dados
As empresas precisam da significado a uma quantidade cada vez maior de
informaes em seus bancos de dados. Antes de realisar qualquer anlise, o objetivo
qualificar e armazenar os dados a serem trabalhados e encontrar novas formas de
visualiza-los de forma mais natural e transparente para os usurios.
o Descoberta de novos conhecimentos
A maior parte das aplicaes atuais de DM se enquadram nesta tecnologia cujo o
objetivo explicitar relacionamentos ocultos, padres e correlaes entre os diferentes
dados existentes no BD da empresa.
o Acuracidade dos dados
Muitas vezes as empresas descobrem que seus dados so imcompletos, errados ou
contraditrios. Decorre disso a necessidade de obter dados cada vez mais consistentes
para processamento e anlise futura.
Exemplos prticos do Data Mining:
Um caso bem conhecido que identificou um hbito crioso dos consumidores ao
procurar eventuais relaes entre o volume de vendas e dos dias da semana, o software
data mining apontou que s sextas-feira, as vendas de cervejas cresciam na mesma
proporo que as de fraldas. Uma relao mais detalhada apontou que, ao comprar
fraldas para seus bebs, os pais aproveitavam para abastecer o estoque de cerveja para o
final de semana.
Para conseguir detectar fraudes, cortar gastos ou aumentar a receita da empresa.
O Bank of Americana usou essas tcnicas para selecionar entre seus 36 milhes de
clientes aqueles com o menor risco de dar calote num emprestimo. A partir desses
relatrios, enviou cartas oferecendo linhas de crdito para os correntistas cujos filhos
tivessem entre 18 e 21 anos e, portando, precisassem de dinheiro para ajudar os filhos a
comprar o prprio carro, uma casa ou arcar com os gastos da faculdade. Resultado: em
trs anos, o banco lucrou 30 milhes de dlares.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
46
ArquiteturasdoDataWarehouse
Pode-se definir duas formas de apresentao da arquitetura de Data Warehouse, uma
conceitual e outra fsica do modelo relacional que representa o sistema.
o Viso Conceitual
Arquitetura do sistema de DW.
Alm do DW podem existir vrios Data Marts (DMs), que departamentalizam os
dados separando-os por setor dentro da organizao.
Os dados contidos no DW e nos DMs so gerenciados por um ou mais servidores de
warehouse, os quais apresentam vises multidimensionais dos dados para uma
variedade de ferramentas front end.
A viso multidimensional em forma de cubo de dados indica que as informaes so
visualizadas em linhas e colunas como o formato tradicional das planilhas, porm
existem mais dimenses, sendo que o cubo teria apenas mais uma dimenso. Esta
caracterstica organiza e facilita a consulta aos dados de maneira que se pode ter, por
exemplo, numa dimenso do cubo os meses do ano, na segunda dimenso estariam as
cidades de origem dos clientes e na terceira dimenso o mdico que encaminhou o
cliente para o hospital.
o Viso em Camadas
Camada de Bancos de Dados Operacionais e Fontes Externas: contm as bases de
dados operacionais e pode ser composta tambm de informaes de fontes externas,
estes dados recebem um tratamento especial para poderem ser incorporados ao DW;
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
47
Arquitetura em camadas.
o Camada de Acesso aos Dados
Compe o elo de ligao entre as ferramentas de acesso informao e os bancos de
dados operacionais, comunicando-se com diversos Sistemas de Gerenciamento de
Banco de Dados (SGBDs) e sistemas de arquivos, sendo que a este conjunto de
caractersticas d-se o nome de acesso universal de dados;
o Camada de Transporte ou Middleware
Tem a funo de gerenciar a transmisso das informaes pelo ambiente de rede que
serve de suporte para o sistema como um todo, separando as aplicaes operacionais do
formato real dos dados, realiza ainda a coleta de mensagens e transaes e se encarrega
de entreg-las nos locais e nos tempos determinados;
o Camada do Data Warehouse
Constitui-se do armazenamento fsico dos dados oriundos dos sistemas operacionais
da empresa e externos, permitindo um acesso mais rpido e seguro aos dados do DW,
alm de prover maior flexibilidade de tratamento e facilidade manipulao;
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
48
o Camada de Acesso Informao
Proporciona a interao com os usurios finais atravs de ferramentas visuais
tradicionais, tais como sistemas de planilhas de clculo, browsers, entre outras;
o Camada de Metadados (Dicionrio de Dados)
Os metadados descrevem os dados e a organizao do sistema, podem ser ainda
frmulas utilizadas para clculo, descries das tabelas disponveis aos usurios,
descries dos campos das tabelas, permisses de acesso, informaes sobre os
administradores do sistema, entre outras;
o Camada de Gerenciamento de Processos
Faz o controle destas tarefas que mantm o sistema atualizado e consistente,
gerenciando as diversas tarefas que so realizadas durante a construo e a manuteno
dos componentes de um sistema de DW;
o Camada de Gerenciamento de Replicao
Serve para selecionar, editar, resumir, combinar e carregar no DW as informaes a
partir das bases operacionais e das fontes externas, envolvendo programao bastante
complexa, sendo que existem ferramentas poderosas que permitem que estes processos
sejam gerenciados de forma mais amigvel, alm do controle da qualidade dos dados
que sero carregados.
o Estrutura Fsica dos Dados do D. W.
A respeito da disposio fsica dos dados, o DW pode ter uma estrutura centralizada
em um nico local ou ento ser implementado de forma distribuda. Se optarmos pelo
modelo centralizado, teremos um warehouse consolidado e o Banco de Dados formar
um DW integrado. Definindo o projeto desta forma pode-se maximizar o poder de
processamento e acelerar os processos de busca por informaes analticas.
Definindo-se uma arquitetura federativa, pode-se distribuir a informao por funo,
separando os dados do setor financeiro em um servidor, os dados de marketing em outro
local, e dados de manufatura em um terceiro lugar.
Existe ainda uma terceira metodologia, na qual considera-se uma arquitetura de DW
separada por camadas, armazenando os dados mais resumidos em um servidor,
dispondo os dados um pouco mais detalhados, em nvel de detalhe intermedirio, em
um segundo servidor, e por fim colocamos os dados mais detalhados (atmicos) em um
terceiro servidor.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
49
Granularidade em camadas
O primeiro servidor geralmente atende maior parte das consultas, sendo que
teremos um menor nmero de pedidos de acesso solicitados para a camada 2 e camada
3.
O dimensionamento dos servidores o seguinte: na primeira camada podemos ter
uma configurao para suportar um grande nmero de usurios que faro diversas
consultas, as quais trabalharo com um volume relativamente pequeno de dados. J os
servidores das outras duas camadas devem ser configurados para permitir processar
grandes volumes de dados, porm no necessria uma preocupao em configurar o
sistema para suportar o acesso de um nmero maior de usurios. Isto explica-se pelo
fato de que a maioria dos usurios ter suas perguntas respondidas pelas consultas
iniciais da camada 1. Se algum usurio no se satisfizer com o nvel de detalhe das
respostas da camada 1, pode buscar maiores informaes na camada 2 e at mesmo na
camada 3. Conclumos ento que poucos usurios faro acessos regulares ltima
camada, sendo que alguns nunca o faro alm do nvel inicial.
o Arquitetura em duas camadas
Existe uma arquitetura de implantao de sistemas de DW que consiste em utilizar
um computador de alta capacidade como servidor. Este mtodo disponibiliza aplicaes
aos usurios finais na forma de ferramentas front end, que servem para realizar as
consultas, em conjunto com os componentes do servidor com ferramentas back end, que
servem para municiar o DW com informaes.
Organizaes que podem crescer com a incorporao de outras empresas do mesmo
ramo ou ainda de outro ramo de negcio, gradualmente acumulam diversos sistemas de
computao legados, cada um com suas incompatibilidades de definies dos dados.
Esta redundncia e falta de consistncia dos dados dificulta a administrao das bases
de dados, resultando numa dificuldade tambm para desenvolver-se novas aplicaes
front end.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
50
Esta arquitetura pode ser chamada de "sistema guarda-chuva", a qual possui um
formato em que o cabo do guarda-chuva representa o servidor principal e as hastes
representam os sistemas de consulta a este servidor.
A arquitetura ilustrada pode ser usada para construir um sistema de DW em duas
camadas, o qual possui os componentes dos clientes (front end) e os componentes do
servidor (back end).
Esta arquitetura bastante conveniente, uma vez que utiliza os sistemas j existentes
na empresa bem como os servidores de bancos de dados e requer um pequeno
investimento em hardware e software.
Um dos grandes problemas que existe neste tipo de arquitetura o fato de no ser
permitido o seu escalonamento, o que resulta, com o aumento do nmero de usurios,
numa performance ruim pelo gargalo existente entre os clientes e o servidor. Estas
anomalias podem ocorrer pelo uso de estaes clientes muito lentas e com muitos
processos rodando simultaneamente.
o Arquitetura de Trs Camadas
Para tentar solucionar os problemas de performance resultantes do gargalo da
arquitetura de duas camadas, existe uma arquitetura de informao em mltiplas
camadas. Esta arquitetura bastante flexvel e suporta um grande nmero de servios
integrados, onde a interface do usurio (ferramentas front end), as funes de
processamento do negcio e as funes de gerenciamento do BD so separadas em
processos, os quais podem ser distribudos atravs da arquitetura de informao.
Este tipo de arquitetura em trs camadas bastante utilizado. Na primeira camada
ficam as aplicaes de interface com os usurios, que devem ser grficas e baseadas em
rede. Dados e regras de negcio podem ser compartilhados pela organizao, assim
como o BD para o DW, ficam armazenados em servidores de alta velocidade na
segunda camada, a camada central. Na terceira e ltima camada esto localizadas as
fontes de dados.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
51
Analisando o ambiente do DW, os servidores de BD e os servidores de aplicaes
da camada central provem um acesso eficiente e rpido aos dados compartilhados.
Com a separao dos servidores em transacional e analtico pode-se obter uma boa
performance nas consultas e no processamento, sendo que deve haver disponibilidade
de equipamentos e recursos satisfatrios de conexo entre os diversos componentes do
sistema.
6.0- AlgunsConceitosI mportantes
A LinguagemSQL
Structured Query Language, ou Linguagem de Consulta Estruturada ou SQL, uma
linguagem de pesquisa declarativa para banco de dados relacional (bases de dados
relacionais). Muitas das caractersticas originais do SQL foram inspiradas na lgebra
relacional.
SQL normalmente pronunciado em portugus como "esse-qu-ele", porm sua
proncia correta deveria se "squel", do ingls "sequel", ou "alguma coisa que segue
outra coisa". SQL uma brincadeira com o nome da primeira linguagem de consulta
QUEL.
Embora o SQL tenha sido originalmente criado pela IBM, rapidamente surgiram
vrios "dialectos" desenvolvidos por outros produtores. Essa expanso levou
necessidade de ser criado e adaptado um padro para a linguagem. Esta tarefa foi
realizada pela American National Standards Institute (ANSI) em 1986 e ISO em 1987.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
52
O SQL foi revisto em 1992 e a esta verso foi dado o nome de SQL-92. Foi revisto
novamente em 1999 e 2003 para se tornar SQL:1999 (SQL3) e SQL:2003,
respectivamente. O SQL:1999 usa expresses regulares de emparelhamento, queries
recursivas e gatilhos (triggers). Tambm foi feita uma adio controversa de tipos no-
escalados e algumas caractersticas de orientao a objeto. O SQL:2003 introduz
caractersticas relacionadas ao XML, sequncias padronizadas e colunas com valores de
auto-generalizao (inclusive colunas-identidade).
Tal como dito anteriormente, o SQL, embora padronizado pela ANSI e ISO, possui
muitas variaes e extenses produzidos pelos diferentes fabricantes de sistemas
gerenciadores de bases de dados. Tipicamente a linguagem pode ser migrada de
plataforma para plataforma sem mudanas estruturais principais.
Outra aproximao permitir para cdigo de idioma processual ser embutido e
interagir com o banco de dados. Por exemplo, o Oracle e outros incluem Java na base de
dados, enquanto o PostgreSQL permite que funes sejam escritas em Perl, Tcl, ou C,
entre outras linguagens.
Palavras-chavesemSQL
DML - LinguagemdeManipulaodeDados
Primeiro h os elementos da DML (Data Manipulation Language - Linguagem de
Manipulao de Dados). A DML um subconjunto da linguagem usada para selecionar,
inserir, atualizar e apagar dados.
o SELECT
o comumente mais usado do DML, comanda e permite ao usurio especificar uma
query como uma descrio do resultado desejado. A questo no especifica como os
resultados deveriam ser localizados.
o INSERT
usada para somar uma fila (formalmente uma tupla) a uma tabela existente.
o UPDATE
Para mudar os valores de dados em uma fila de tabela existente.
o DELETE
Permite remover filas existentes de uma tabela.
o BEGIN WORK (ou START TRANSACTION, dependendo do dialeto SQL)
Pode ser usado para marcar o comeo de uma transao de banco de dados que pode
ser completada ou no.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
53
o COMMIT
Envia todos os dados das mudanas permanentemente.
o ROLLBACK
Faz com que as mudanas nos dados existentes desde que o ltimo COMMIT ou
ROLLBACK sejam descartadas.
o COMMIT e ROLLBACK
Interagem com reas de controle como transao e locao. Ambos terminam
qualquer transao aberta e liberam qualquer cadeado ligado a dados. Na ausncia de
um BEGIN WORK ou uma declarao semelhante, a semntica de SQL dependente
da implementao.
DDL - LinguagemdeDefiniodeDados
O segundo grupo a DDL (Data Definition Language - Linguagem de Definio de
Dados). Uma DDL permite ao usurio definir tabelas novas e elementos associados. A
maioria dos bancos de dados de SQL comerciais tem extenses proprietrias no DDL.
Os comandos bsicos da DDL so:
o CREATE cria um objeto (uma Tabela, por exemplo) dentro do base de dados.
o DROP apaga um objeto do banco de dados.
DCL - LinguagemdeControledeDados
O terceiro grupo o DCL (Data Control Language - Linguagem de Controle de
Dados). DCL controla os aspectos de autorizao de dados e licenas de usurios para
controlar quem tem acesso para ver ou manipular dados dentro do banco de dados.
Duas palavras-chaves da DCL:
o GRANT - autoriza ao usurio executar ou setar operaes.
o REVOKE - remove ou restringe a capacidade de um usurio de executar
operaes.
DQL - LinguagemdeConsultadeDados
Embora tenha apenas um comando a DQL a parte da SQL mais utilizada. O comando
SELECT composta de vrias clusulas e opes, possibilitando elaborar consultas das
mais simples as mais elaboradas.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
54
ndices
Todos os tipos de bancos de dados podem ter seu desempenho melhorado pelo uso
de ndices. O tipo mais comum de ndice uma lista ordenada dos valores de uma
coluna de uma tabela, contendo ponteiros para as linhas associadas a cada valor. Um
ndice permite que o conjunto das linhas de uma tabela que satisfazem determinado
critrio sejam localizadas rapidamente. H vrios mtodos de indexao utilizados
comumente, como rvores B, hashes e listas encadeadas.
Gatilho
Gatilho ou trigger um recurso de programao presente na maioria dos sistemas de
gerenciamento de banco de dados, utilizado para associar um procedimento armazenado
a um evento do banco de dados (incluso, excluso, atualizao de registro, por
exemplo) de modo que o procedimento armazenado seja executado automaticamente
sempre que o evento associado ocorrer.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
55
CONCLUSO
O papel de um Banco de Dados dentro de uma empresa ou qualquer outro tipo de
organizao muito importante e fundamental para o andamento da mesma; pois nele
esta contido desde os dados dos seus clientes at a vida documental da prpria empresa.
Para o gerenciamento de todas essas informaes, temos no mercado diversos
softwares com grande capacidade para gerenciar com rapidez e grande performace
todos esses dados independente de sua plataforma de sistema operacional.
Dentre os sistemas gerenciadores podemos citar desde os mais robustos como o
ORACLE, SQL e at mesmo o MySQL que apesar de ser um SGBD gratuito tem uma
performace comparativa as outras.
Com todas essas ferramentas e o grande poder de gerenciamento das informaes e
cruzamento das mesmas, precisamos apenas conhec-las melhor para poder desfrutar de
todas as vantagens que elas podem nos proporcionar, utilizando-as no sentido lucrativo,
comercial ou para simples consultas como o caso dos gerenciadores de banco de dados
que disponibilizam informaes para a Internet.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.
WBSOFTWARES (**79)8115-7557
56
BI BLI OGRAFI A
www.wikipedia.org
www.apostilando.com
www.maxarte.com.br/eduardocustodiohp/DataWareHouse.htm
Apostilas;
Material da Prof Luana Vachelli.
AcroPDF - A Quality PDF Writer and PDF Converter to create PDF files. To remove the line, buy a license.

Você também pode gostar