Você está na página 1de 11

Projeto de Uma Biblioteca Digital Multimdia Usando Sistemas Gerenciadores de Banco de Dados Distribudos

II Workshop de Engenharia de Software e Bases de Dados Cristiano Roberto Cervi1, Jaqson Dalbosco1, Juliano Tonezer da Silva1, Willingthon Pavan1, Lidinei Domeneghini1
1

Instituto de Cincias Exatas e Geocincias Universidade de Passo Fundo (UPF) Caixa Postal 611 99.001-970 Passo Fundo RS Brasil {cervi, jaqson, tonezer, pavan}@upf.br, lidinei@compasso.com.br

Abstract. In this work some characteristics of the distributed database, its forms of distribution, some advantages and disadvantages of the use of this technology are presented, as well as concepts and characteristics of the digital libraries. The form of storage and recovery of archives multimedia also are presented. Finally, the development of a multimedia digital library is described using distributed database. Key Words: Distributed Database, Digital Libraries, Multimedia Data. Resumo. Neste trabalho so apresentadas algumas caractersticas de banco de dados distribudos, suas formas de distribuio, algumas vantagens e desvantagens da utilizao dessa tecnologia, bem como conceitos e caractersticas das bibliotecas digitais. A forma de armazenagem de arquivos multimdia e como os mesmos podem ser recuperados, tambm so apresentados. Por fim, o desenvolvimento de uma biblioteca digital multimdia descrito utilizando banco de dados distribudos. Palavras Chave: Banco de Dados Distribudos, Bibliotecas Digitais, Dados Multimdia.

1. Introduo
O crescente avano tecnolgico e o grande aumento do volume de informaes armazenadas, no mais de forma centralizada, possibilitam, atualmente, uma maior utilizao de bancos de dados distribudos (BDD). Um BDD nada mais do que a unio de duas grandes reas da computao: a tecnologia de banco de dados em conjunto com as redes de computadores. A utilizao de BDD pode proporcionar, em relao aos bancos de dados centralizados, maior autonomia, maior disponibilidade, aumento de performance e ainda permitir o compartilhamento dos dados por diferentes ns de uma rede, seja ela uma rede local ou no. O armazenamento de dados multimdia, quer seja em um banco de dados centralizado ou em um BDD, tem aumentado significativamente nos ltimos anos. Tal aumento est ligado com a grande utilizao de arquivos multimdia por parte da populao mundial, quer seja no meio acadmico, empresarial ou at mesmo nas residncias das pessoas. A utilizao cada vez mais acelerada de tais tipos de arquivos, como imagens, sons e vdeos, necessita a implementao de sistemas mais complexos, que tem como princpio a manipulao de dados que exigem uma grande capacidade de armazenamento e recuperao.

Como grandes fontes de informao, as bibliotecas digitais esto sendo cada vez mais utilizadas para armazenagem, busca e recuperao de informaes. Uma biblioteca digital pode ser considerada como uma coleo de informaes processveis pelo computador ou um repositrio para tais informaes. Quando uma biblioteca digital armazena dados multimdia, ela pode ser chamada de biblioteca digital multimdia. Pensando na unio das tecnologias de banco de dados distribudos, bibliotecas digitais e dados multimdia, o presente trabalho apresenta o desenvolvimento de uma biblioteca digital multimdia utilizando banco de dados distribudos.

2. Banco de Dados Distribudos


Vrios conceitos tm sido apresentados para definir banco de dados distribudos, mas de forma geral todos eles tentam representar como feito o armazenamento e o acesso a esses dados. Couceiro e Barrenecha (1984), definem que um sistema de banco de dados distribudos (BDD) existe quando um banco de dados integrado logicamente (integrao lgica significa que qualquer n tem acesso potencial a todo o banco de dados) fisicamente distribudo sobre diferentes ns de computao interligados por uma rede. Segundo zsu e Valdureiez (2001), pode-se definir um banco de dados distribudo como uma coleo de vrios bancos de dados logicamente inter-relacionados, distribudos por uma rede de computadores. Visualizando de outra maneira esses conceitos, um banco de dados distribudo pode ser definido como o somatrio de um conjunto de bancos de dados que foi preparado para poder comunicar-se com diferentes ns de uma rede, separados fisicamente, que possuem autonomia local e que juntos formam um nico banco de dados.

Figura 1. Um sistema de banco de dados distribudos tpico.

O exemplo da Figura 1 retrata um tpico sistema de banco de dados distribudo, onde cada localidade possui seu prprio banco de dados e seu prprio sistema de gerncia do banco

de dados. Cada banco de dados est inter-relacionado pela rede de comunicao com os demais bancos de dados. Para se compreender BDD preciso entender como os dados so distribudos atravs da rede. A distribuio dos dados feita atravs do processo de fragmentao, que a diviso dos dados que se encontram dispostos em uma tabela e a distribuio desta diviso em diferentes ns da rede. Essa fragmentao pode ser feita de maneira horizontal, vertical ou mista. Na fragmentao horizontal particiona-se uma relao em suas linhas, ou seja, cada fragmento ser portador de um conjunto de registros de uma determinada relao ou de uma simples tabela. Para Silberschatz, Korth e Sudarshan (1999), a relao r particionada em um nmero de subconjuntos r1, r2,...rn. E cada linha da relao r deve pertencer a pelo menos um fragmento, de modo que a relao original possa ser reconstruda, se necessrio. A fragmentao vertical constri seus fragmentos com base nos atributos de uma tabela. Para que seja possvel fragmentar verticalmente uma tabela necessrio um atributo identificador, que caso no seja informado, este se valer da chave primria da tabela. Na fragmentao vertical tem-se como objetivo particionar uma relao em conjuntos de relaes menores, para que deste modo seja possvel um aplicativo usurio atuar apenas sobre um fragmento. Segundo zsu e Valdureiez (2001), o particionamento vertical inerentemente mais complicado que o particionamento horizontal. Isso se deve ao nmero total de alternativas que se encontram disponveis, que muito maior do que o encontrado na fragmentao horizontal. Existem casos em que somente a utilizao da fragmentao vertical ou a fragmentao horizontal no so suficientes para satisfazer as necessidades de um aplicativo. Nesses casos utiliza-se a fragmentao vertical e horizontal em conjunto, sempre uma aps a outra. Esta alternativa conhecida como fragmentao mista ou hbrida.

3. Armazenamento de Dados Multimdia


O termo multimdia refere-se aos mltiplos meios atravs dos quais a informao armazenada, transmitida, apresentada ou percebida. Sistemas de banco de dados multimdia so sistemas utilizados para armazenar e gerenciar dados multimdia. Tais sistemas tm as mesmas funcionalidades gerais de qualquer sistema de banco de dados com a diferena de terem que gerenciar dados multimdia. Um tipo de dado representado atravs de uma estrutura de dados e as operaes que podem ser executadas sobre ele. Para que um sistema de gerncia de banco de dados multimdia reconhea um tipo de dado, este banco deve permitir que um usurio possa executar operaes de leitura e gravao sobre este tipo. Em um banco de dados multimdia, os tipos suportados podem ser textos, imagens, objetos grficos, vdeo e udio. De acordo com Griffioen (1996), dados multimdia necessitam de novas tcnicas para indexao e busca. Para simplificar o mecanismo de busca e aumentar a interatividade, muitos sistemas empregam um mecanismo de metadados, pois a caracterstica principal dos dados multimdia que eles consistem de dois componentes: os dados e a informao semntica contida nesses dados. Como exemplo pode-se citar a pesquisa pela cadeia de caracteres alfanumrica aeiou onde a busca direta. Porm, a pesquisa por uma imagem ou por um som requer a habilidade de acessar o contedo semntico. Esse contedo semntico denominado metadado.

Muitos dados multimdia contm dois tipos de metadados que podem ser indexados. No primeiro, a informao multimdia armazenada como informao de registro, como por exemplo: quando a imagem foi criada, onde o vdeo foi filmado, quem gravou o udio, etc. No segundo, as informaes multimdia contm informaes semnticas que devem ser extradas manual ou automaticamente. A vantagem de se utilizar metadados que essa abordagem permite ao usurio examinar o contedo da base de dados sem ter que recuperar dados muito grandes. Existem vrios requisitos que um esquema de gerenciamento de metadados deve atender para suportar aplicaes multimdia. So necessrios servios bsicos para suportar identificao, localizao, nomeao e distribuio de objetos e ainda, modelos de aplicaes especficas so necessrios para suportar funcionalidade nas aplicaes (Little, 1994). 3.1. Armazenamento Segundo Frana (2002), o armazenamento de dados multimdia em dispositivos sem qualquer padronizao apresentam algumas dificuldades, como por exemplo: o problema de representao, mapeamento utilizados para disponibilizar hierarquias, compresso, arquivamento e buffering ocorridos durante a operao de entrada/sada. O armazenamento de arquivos multimdia pode ser feito atravs de campos especiais capazes de armazenar arquivos binrios, como os campos do tipo BLOB (Binary Large Object). 3.2. Consultas e Recuperao De acordo com Grosky (1997), as informaes so recuperadas pelos SGBDs atravs de consultas estruturadas por ndices. As informaes so recuperadas atravs de palavras-chaves ou por ndices pr-definidos. O modo como as imagens, dados de vdeo e dados de udio so recuperados, so motivos de discusso, pois isso envolve muitas questes, entre elas a formulao eficiente de consultas e a execuo e otimizao de consultas. As tcnicas padronizadas de otimizao precisam ser modificadas para operar com tipos de dados multimdia. 3.3. Desempenho Para Newman (2003), as restries de desempenho so subjetivamente determinadas pelo usurio em aplicaes que envolvem texto. Para aplicaes que envolvem vdeo ou sincronizao de udio-vdeo, limitaes fsicas exercem o domnio. Tcnicas e algoritmos para a otimizao de consultas podem calcular o tempo de resposta esperado antes mesmo de se iniciar a consulta.

4. Bibliotecas Digitais
O conceito de biblioteca digital representa um processo gradual e evolutivo resultante da utilizao do computador nas ltimas dcadas. Elas surgem como uma resposta ocasionada pela exploso da quantidade de informao, disponveis na Internet, sendo este um dos maiores fenmenos em termos de processamento da informao dos ltimos anos. Bibliotecas Digitais, para Rosetto (2002), aquela que contempla documentos gerados ou transpostos para o ambiente digital (eletrnico), um servio de informao (em todo tipo de formato), no qual todos os recursos so disponveis na forma de processamento eletrnico (aquisio, armazenagem, preservao, recuperao e acesso atravs de tecnologias digitais).

Por sua vez Lesk (1997), apud Pinheiro (2002), afirma que bibliotecas digitais so colees organizadas de informao digital. Combinam estrutura e conjunto de informao de bibliotecas e arquivos, com a representao digital que computadores tornaram possvel. 4.1. Vantagens do Armazenamento Digital O armazenamento digital amplia as possibilidades de pontos de acesso a um determinado documento. Nos sistemas manuais tradicionais e mesmo nos catlogos automatizados produzidos at o final dos anos 80, as descries restringiam-se a dados sobre o autor, ttulo e alguns cabealhos de assunto. Atualmente, dezenas de termos de indexao podem ser includos e tambm diversos nveis de representao do documento. Tais caractersticas agregam um alto grau de flexibilidade e qualidade na busca e recuperao da informao (Cardoso, 2000). Como vantagens do armazenamento digital pode-se destacar a economia de espao fsico, a conservao do material de consulta (uma vez que no h desgaste devido ao manuseio dos livros e vandalismos das colees em papel), melhor interao e autonomia do usurio com a estrutura do texto (possibilitando diversos cortes, junes, e diversos tipo de reformatao, ligaes com hipertexto, etc.) e a facilidade de acesso, que pode ocorrer em qualquer que seja o local de acesso informao para a convenincia do prprio usurio (Cardoso, 2000). Tambm em adio ao texto impresso, novos tipos de artefatos informacionais integraro o sistema digital: bibliotecas de fotografias, desenhos, ilustraes, peas de arte, sons e imagens, dentre outros. A capacidade de integrar informao (nos mais diversos formatos), bem como em recuper-la e proporcionar, por meio de programas especficos, assistncia ao usurio na sua localizao mais rpida, ser benefcio muito grande para os estudiosos do futuro (Cardoso, 2000).

5. Biblioteca Digital Multimdia Utilizando Banco de Dados Distribudos


A aplicao da tecnologia de BDD com armazenamento multimdia deste estudo foi demonstrada atravs do desenvolvimento de uma biblioteca digital multimdia. Pretendeu-se abordar a implementao com dois ns nos quais foram armazenados dados multimdia de forma distribuda. 5.1. O Projeto da Biblioteca Digital Multimdia Para a distribuio dos dados se levou em considerao o poder computacional dos computadores. Dessa forma foram armazenados os arquivos multimdia de udio e vdeo em um servidor com maior poder computacional e arquivos multimdia de imagem em outro servidor com menor poder computacional. O servidor http foi instalado no servidor com maior poder computacional, pois nesse, estaro sendo armazenados os arquivos multimdia de udio e vdeo que possuem tamanho relativamente maior que os arquivos de imagem, evitando assim, a utilizao da rede de comunicao de maneira desnecessria. O banco de dados utilizado na aplicao foi o Oracle 10g. Para o desenvolvimento da aplicao foi utilizado o Framework Jakarta Struts, desenvolvido pelo grupo Apache, baseado na tecnologia J2EE da Sun MicroSystems. O servidor de aplicao foi o OC4J da Oracle e como sistema operacional foi utilizado o Conectiva Linux 10.

O projeto prope a implementao da aplicao utilizando-se dois tipos de arquitetura. A primeira foi implementada com a transparncia do BDD, com o intuito de utiliz-lo como se fosse um banco de dados centralizado, onde o usurio no iria se preocupar se os objetos utilizados estariam sendo acessados remotamente ou localmente. A segunda implementao prope que o acesso a qualquer objeto seja feito diretamente ao n do BDD a qual ele pertence, onde a transparncia somente seria utilizada quando necessria. O modelo relacional da biblioteca digital mostrado na Figura 2. Na cor laranja, so mostradas as tabelas que sofrem fragmentao horizontal e que tem sua estrutura comum nos dois ns do banco de dados. J em azul, esto apresentadas as tabelas que fazem parte do n do banco de dados que armazena infamaes e arquivos de Imagens. Por fim, na cor verde, so apresentadas as tabelas que servem para o armazenamento das informaes sobre os arquivos multimdia de udio e vdeo.

Figura 2. Modelo relacional.

5.2. Arquitetura do Projeto A distribuio dos dados multimdia nos ns do banco de dados, em ambas as arquiteturas, foram feitas da seguinte maneira: o n servidor (Servidor 1), alm de ser servidor de aplicao, possui uma instncia Oracle rodando, chamada de BD1. Essa instncia responsvel pela maior carga dos dados multimdia, pois envolver dados de udio e vdeo. O outro n (Servidor 2) possura, por sua vez, outra instncia do Oracle rodando, chamada de BD2. Essa ser responsvel pelo armazenamento de dados multimdia do tipo imagem. Para o armazenamento dos dados multimdia foi utilizado o campo do tipo BLOB. A transparncia entre os dois bancos de dados dos servidores foi implementada atravs de um DBLINK (canal de comunicao entre bases de dados). Aps termos os bancos de

dados comunicveis entre si, para implementar a transparncia entre os bancos de dados, foram utilizados sinnimos pblicos e/ou vises para as tabelas. 5.3. Fragmentao Em relao a forma de distribuio optou-se pela fragmentao horizontal. Essa fragmentao ocorre em duas tabelas do BDD, sendo elas Acervo e Gnero. A tabela Acervo, do BD1, armazena dados de arquivos de udio e vdeo, enquanto a tabela Acervo, do BD2, armazena dados de arquivos de Imagens. A tabela, gnero do BD1, armazena os gneros referentes a udio e vdeo e a tabela Gnero, do BD2, armazena os gneros referentes a Imagem. 5.4. Interface web A manipulao da biblioteca digital se d atravs de pginas web. Existe uma rea pblica onde est disponibilizada, para qualquer usurio, a pesquisa ao Acervo e, a rea administrativa, onde feita toda a manuteno do acervo da biblioteca. A separao entre rea pblica e rea restrita, bem como a pgina inicial da aplicao pode ser visualizada na figura 3.

Figura 3. Pgina inicial da biblioteca digital multimdia.

5.7. rea Pblica A busca no acervo funciona selecionando o tipo de mdia desejado (udio, imagem, vdeo). A seleo do tipo de contedo multimdia est sendo demonstrada na figura 4.

Figura 4. Seleo do tipo de Contedo.

Aps esse procedimento, so listados os respectivos filtros para cada tipo de mdia. Se for udio, o filtro composto por nome (nome de exibio do udio), autor (autor do udio), gnero (gnero do udio) e tipo (tipo de udio definido pela extenso do arquivo). Se o tipo de mdia for imagem, o filtro composto por nome (nome de exibio da imagem), composio (refere-se a composio da imagem ordenada pelo maior grau de composio que ela representa), gnero (gnero da imagem) e tipo (tipo de imagem definido pela extenso do arquivo). J se o tipo de mdia for vdeo, o filtro composto por nome (nome de exibio do vdeo), gnero (gnero do vdeo) e tipo (tipo de vdeo definido pela extenso do arquivo). Os filtros no so de preenchimento obrigatrio e para no sobrecarregar a aplicao os resultados so divididos em pginas, que sero mostradas atravs de um paginador desenvolvido especificamente para este trabalho. No resultado so mostradas as informaes do arquivo alm de disponibiliz-lo para download. Os filtros da pesquisa e seus resultados esto demonstrados na figura 5.

Figura 5. Filtro de pesquisa e resultados paginados.

5.8. rea Administrativa A rea administrativa permite a manuteno dos itens do acervo e nela pode-se incluir, alterar, excluir e pesquisar itens que esto no acervo da biblioteca. A figura 6 ilustra os itens de menu da rea administrativa com suas funcionalidades.

Figura 6. rea administrativa.

O procedimento para incluir, alterar e excluir o mesmo utilizado na pesquisa, onde deve-se primeiro escolher o tipo de mdia que se deseja fazer a operao.

No caso da incluso aps selecionar o tipo de mdia, aparecer o formulrio respectivo para cada tipo de mdia. O formulrio de Incluso de item no acervo ilustrado pela figura 7.

Figura 7. Formulrio de incluso (udio).

6. Consideraes Finais
A partir do desenvolvimento da biblioteca digital multimdia foi possvel demonstrar que vivel a utilizao da tecnologia de banco de dados distribudos com ou sem armazenamento de dados multimdia. Durante a pesquisa algumas limitaes foram encontradas relacionadas forma de armazenamento e a capacidade suportada pelo campo BLOB, visto que o banco de dados Oracle no suporta manipulao de arquivos binrios por ns remotos do banco de dados distribudo e existe limitao de capacidade de armazenamento de 4 GB para cada campo. A biblioteca digital multimdia proporciona um layout amigvel e de fcil utilizao por parte do usurio onde as informaes so encontradas com facilidade e com grande nvel de detalhamento. Para maior auxlio ao usurio foi desenvolvido um paginador para os resultados, disponibilizando de forma mais eficaz os resultados das solicitaes, assim, evitando que os mesmos sobrecarregassem a aplicao. Contudo, ao trmino deste estudo, constatou-se que a tecnologia de banco de dados distribudos algo que veio para ficar, principalmente quando se trata da implantao em empresas de mdio e grande porte. Porm, por ser algo ainda novo quando se trata da sua implantao dentro das empresas, deve-se analisar a fundo quais sero as implicaes que isso pode causar.

Por sua vez, o armazenamento de dados multimdia representa hoje uma rea tecnolgica ampla e que apresenta crescimento nas mais diversas aplicaes, pois capaz de oferecer caractersticas que permitem aos usurios armazenarem e pesquisarem diferentes tipos de informaes multimdia. Percebe-se que a Biblioteca Digital Multimdia Distribuda implementada neste estudo representa um bom exemplo dessas aplicaes.

Referncias
Cardoso, J. C. (2000) iLIB,Uma Proposta de Interface de Consulta Personalizvel para Bibliotecas Digitais. Dissertao de Mestrado. Programa de Ps-Graduao em Cincia da Computao. Pontifcia Universidade Catlica do Rio Grande do Sul. Couceiro, L. A. C. C. and Barrenecha, H. F. S. (1984) Sistema de Gerncia de Banco de Dados Distribudos. Livros Tcnicos e Cientficos. Frana, M. B. (2002) Bancos de Dados Multimdia. Universidade Federal do Rio Grande do Sul.. Griffioen, J., Yavatkar, R. and Adams, R. (1996) Automatic and Dynamic Identification of Metadata in Multimedia. Disponvel em: <http://www.computer.org/conferen/meta96/adams/paper.html>. Acesso em junho de 2004. Grosky, W. I. (1997) Managing Multimedia Information in Database Systems, Communications of the ACM, Vol 40 No 27, p. 73-80. Little, T.D.C. and Venkatesh, D. (1994) Client Server Metadata Management for the Delevery of Movies in a Video-on-Demand System. Anais do 1st Intl. Workshop on Services in Distributed and Netwoked Enviroments, p. 11-18. Newman, J. L. (2004) Multimedia Database Systems. Disponvel <http://www.newi.ac.uk/newmanj/MDBS.html>. Acesso em junho de 2004. em:

zsu, M. T. and Valduriez, P. (2001) Princpios de Sistemas de Bancos de Dados Distribudos. Campus, 2 edio. Pinheiro, L. V. R. (2002) O desafio da formao profissional: da biblioteca s bibliotecas digitais. In: Integrar Congresso Internacional de Arquivos, Bibliotecas, Centros de Documentao e Museus, 1. p. 387-418. Rosetto, M. and Nogueira, A. H. (2002) Aplicao de elementos metadados Dublin Core para a descrio de dados bibliogrficos on-line da biblioteca digital de teses da USP. In: Seminrio Nacional de Bibliotecas Universitrias, 12. Universidade Federal de Pernambuco. Silberschatz, A., Korth, H. F. and Sudarshan, S. (1999) Sistema de Banco de Dados. Makron Books, 3 edio.

Você também pode gostar