Escolar Documentos
Profissional Documentos
Cultura Documentos
CURITIBA 2006
de
Ps-Graduao
em
CURITIBA 2006
AGRADECIMENTOS
Agradeo a Deus, por sempre me dar foras para o alcance de
todos os meus objetivos, inclusive a realizao deste trabalho.
Agradeo tambm minha orientadora e amiga Professora Dra.
Maria Salete Marcon Gomes Vaz, a qual sempre esteve disponvel para
a orientao de toda a minha formao e em especial neste trabalho.
Agradecimento especial minha noiva Yamara Gardingo pela
compreenso da minha ausncia e falta de dedicao durante o
desenvolvimento desse trabalho.
Agradeo tambm a todas as pessoas que contriburam direta e
indiretamente para a realizao deste trabalho.
Meus amigos do mestrado um abrao especial a todos vocs que
sempre estiveram juntos nessa grande etapa de nossa vida.
ii
SUMRIO
LISTA DE FIGURAS.................................................................................................................... iii
LISTA DE QUADROS.................................................................................................................. iv
LISTA DE SIGLAS........................................................................................................................ v
RESUMO...................................................................................................................................... vi
ABSTRACT................................................................................................................................. vii
1. INTRODUO .......................................................................................................................... 1
2. SISTEMAS DE BANCO DE DADOS PARA APLICAES MULTIMDIA ............................. 4
2.1. MULTIMDIA E OS TIPOS DE OBJETOS ......................................................................... 4
2.2. GERENCIAMENTO DE OBJETOS MULTIMDIA ............................................................. 8
2.3. INDEXAO DE OBJETOS MULTIMDIA ATRAVS DE METADADOS ...................... 10
2.4. PESQUISA E RECUPERAO DE OBJETOS MULTIMDIA......................................... 14
2.5. ARMAZENAMENTO DE OBJETOS MULTIMDIA .......................................................... 18
3. BENCHMARK - AVALIAO DE DESEMPENHO EM BANCO DE DADOS ...................... 22
3.1. DEFINIO...................................................................................................................... 22
3.2. METODOLOGIA .............................................................................................................. 24
4. ANLISE DE DESEMPENHO EM RECUPERAO DE OBJETOS MULTIMDIA NO
POSTGRESQL............................................................................................................................ 30
4.1. AMBIENTE EXPERIMENTAL.......................................................................................... 30
4.2. ANLISE DE DESEMPENHO EM RECUPERAO DE IMAGENS .............................. 36
4.2.1. ARMAZENAMENTO POR REFERNCIA EXTERNA ............................................. 36
4.2.2. ARMAZENAMENTO DE DADOS MULTIMDIA NO INTERPRETADOS - CAMPO
BLOB .................................................................................................................................. 39
4.2.3. ARMAZENAMENTO ATRAVS DE OBJETOS....................................................... 43
4.3. ANLISE COMPARATIVA............................................................................................... 45
5. CONCLUSES E TRABALHOS FUTUROS ......................................................................... 50
REFERNCIAS........................................................................................................................... 53
ii
LISTA DE FIGURAS
Figura 1: Distino entre contedo dos objetos...................................................................... 9
Figura 2: Metadados de Objeto Multimdia............................................................................. 11
Figura 3: Recuperao atravs de um identificador. ............................................................ 15
Figura 4: Recuperao atravs de sentenas condicionais................................................. 16
Figura 5: Recuperao por similaridade................................................................................. 16
Figura 6: Arquitetura de recuperao semntica (LOH, WIVES e FRAINER, 1999). ......... 17
Figura 7: Utilizao de check-point. (DEMURJIAN et. al, 1985)............................................ 25
Figura 8: Esquema de dados do TPC-App. ............................................................................ 28
Figura 9: Ambiente da anlise. ................................................................................................ 31
Figura 10: Estrutura check-point em php. .............................................................................. 32
Figura 11: Conexo entre PHP e PostgreSQL........................................................................ 32
Figura 12: Resultados das consultas do Conjunto A com armazenamento de referncia
externa em ambiente mono-usurio ....................................................................................... 37
Figura 13: Resultados das consultas do Conjunto B com armazenamento de referncia
externa em ambiente mono-usurio ....................................................................................... 38
Figura 14: Resultados da consulta 4A e 4B com armazenamento atravs de referncia
externa em ambiente multi-usurio......................................................................................... 38
Figura 15: Insero de imagem no campo bytea escrito em PHP. ...................................... 40
Figura 16: Resultados das consultas do Conjunto A com armazenamento atravs do
campo bytea em ambiente mono-usurio .............................................................................. 40
Figura 17: Resultados das consultas do Conjunto B com armazenamento atravs do
campo bytea em ambiente mono-usurio .............................................................................. 41
Figura 18: Resultados da consulta 4A com armazenamento atravs do campo bytea em
ambiente multi-usurio............................................................................................................. 42
Figura 19: Resultados da consulta 4B com armazenamento atravs do campo bytea em
ambiente multi-usurio............................................................................................................. 42
Figura 20: Armazenamento e recuperao de objeto utilizando o campo oid. .................. 43
Figura 21: Resultados das consultas do Conjunto A com armazenamento atravs do
campo oid em ambiente mono-usurio .................................................................................. 44
Figura 22: Resultados das consultas do Conjunto B com armazenamento atravs do
campo oid em ambiente mono-usurio .................................................................................. 45
iii
LISTA DE QUADROS
Quadro 1: Comparativo entre as formas de armazenamento............................................... 20
Quadro 2: Grupos de consultas definidos por BORAL e DEWITT, (1984). ......................... 26
Quadro 3: Consultas representativas de cada grupo ........................................................... 26
Quadro 4: Grau de povoamento das tabelas.......................................................................... 33
Quadro 5: Consultas para anlise ........................................................................................... 35
Quadro 6: Comparao entre os mtodos de armazenamento no Conjunto A de
consultas em ambiente mono-usurio ................................................................................... 46
Quadro 7: Comparao entre os mtodos de armazenamento no Conjunto B de
consultas em ambiente mono-usurio ................................................................................... 47
Quadro 8: Comparao entre os mtodos de armazenamento com a Consulta 4A em
ambiente multi-usurio............................................................................................................. 48
Quadro 9: Comparao entre os mtodos de armazenamento com a Consulta 4B em
ambiente multi-usurio............................................................................................................. 48
Quadro 10: Proposta de uso dos mtodos de armazenamento em PostgreSQL............... 51
iv
LISTA DE SIGLAS
BLOB
BMP
Bitmap
CDROM
DDL
FGDC
GIF
JPG
MPEG
OLTP
RAM
SGBDM
SGBD
SOAP
SQL
SUB
TPC
XML
RESUMO
As aplicaes multimdia, que necessitam de gerenciamento de objetos,
fizeram com que o desempenho, nos Sistemas Gerenciadores de Banco de
Dados - SGBDs, assumisse um papel importante para o funcionamento correto
dessas aplicaes. Assim esse trabalho apresenta uma avaliao no
desempenho dos mtodos de recuperao dos objetos multimdia, em uma
base de dados com dez mil objetos cadastrados, onde cada um dos objetos
possui 600 kilobytes de tamanho. Para essa avaliao foram utilizados trs
mtodos possveis no SGBD PostgreSQL, o mtodo de referncia externa,
armazenamento por dados no interpretados (bytea) e por objetos (oid). A
avaliao foi realizada com quatro consultas distintas e em dois ambientes
diferentes, mono-usurio e multi-usurio. Os resultados dessa avaliao
mostraram que o desempenho nos mtodos de armazenamento, os quais
guardam os objetos dentro da base de dados, no foram satisfatrios. O tempo
de resposta de um dos mtodos foi de 3,5 minutos, em um ambiente monousurio. Alm desse resultado, concluiu-se tambm que o armazenamento
atravs de objeto, com campo de identificao de objeto, possui o pior tempo
de recuperao para vrios objetos, entre os mtodos comparados.
vi
ABSTRACT
The multimedia applications, which require object management, made the
performance in the Databases Management Systems (DMS) take a relevant
role for the correct functioning of such applications. Thus, this work presents an
evaluation of the retrieval methods for multimedia objects performance, in a
databases comprising 10,000 objects, in which each object is 600kb. Three
possible methods were used in SGBD PostgreSQL for this evaluation, the
external reference method, non-interpreted data storage (bytea) and objects
(oid). Four distinct queries were carried out in two different environments, mono
and multi-user. The results of this evaluation showed that the performance of
storage methods that keep objects within the databases was not satisfactory.
One of these methods response time was 3,5 minutes, in a mono-user
environment. Besides this result, it was also concluded that the storage through
object, with object identification field, presents the worst retrieval time for
several objects, considered the methods compared.
vii
1. INTRODUO
formas
de
armazenamento
so
classificadas
como,
crescente
informatizados,
fez
utilizao
com
que
de
objetos
surgisse
multimdia,
em
sistemas
necessidade
dos
Sistemas
mdia, tais como texto, imagens, vdeo, animao e som, dentro de uma
aplicao que resultar em uma forma de comunicao. Como, por exemplo,
um comercial de televiso, onde esto presentes os mais diversos tipos de
mdias.
MA, W. citado por JAIMES et al (2005) define texto, imagem e udio
como sendo tipos de mdia e as animaes e vdeos como sendo objetos
multimdia, pois esses renem mais de um tipo de mdia. Com isso, considera
pginas na internet como sendo objetos multimdia, j que apresentam textos,
imagens, sons e animaes.
O termo mdia possui alguns significados, os quais so descritos a
seguir:
(VAZ
apud,
STEINMETZ,
2000)
(ZDEN,
RASTOGI
SILBERSCHATZ, 1997)
como
contnuas.
As
mdias
no
contnuas
rgidos
CDROM
so
algumas
das
mdias
de
armazenamento.
de
matemticos
compactao.
que
procuram
Esses
reduzir
mtodos
o
so
nmero
clculos
de
pixels
Animao:
So
seqncias
de
imagens
e/ou
desenhos
10
11
metadados
tambm
podem
descrever
caractersticas
no
Os
metadados
observados
na
Figura
so
considerados descritivos.
12
Metadados
para
representao
de
tipos
de
mdia:
So
da
digitalizao.
Esses
metadados
fornecem
das
mdias,
so
exemplos
de
metadados
para
13
14
diversos
sistemas
comerciais
promovem
de
forma
15
Dentre os diversos tipos de pesquisas de objetos multimdias destacamse quatro mtodos: (VAZ, 2000)
1. Recuperao atravs de um identificador
2. Recuperao por sentenas condicionais
3. Recuperao por similaridade
4. Recuperao semntica
No primeiro tipo o objeto recuperado atravs de um identificador que
geralmente o ndice da tabela a qual o objeto pertence. Nessa recuperao, o
usurio ou o sistema j conhece o valor do identificador do objeto, como mostra
a Figura 3.
16
17
18
19
em
tempo
real
nesse
tipo
de
campo,
20
Campos BLOB
Funes Externas
Orientao a
Objetos
Consistncia e
integridade
no
sim
sim
sim
Armazenamento
interno
no
sim
sim
sim
Acesso em
tempo real
sim
no
no
no
Pesquisa
atravs da
semntica
sim
no
no
sim
aumenta
grau
de
vulnerabilidade
dos
objetos
21
armazenamentos
por
BLOB
funes
externas
possuem
proporcionando
assim,
comparativos
de
validam
benchmarks
de
confiabilidade
em
sistemas
23
identificados,
devido
diversidade
de
elementos
24
3.2. METODOLOGIA
DEMURJIAN et al, (1985) apresentam uma metodologia para avaliar
sistemas gerenciadores de banco de dados, na qual enfatizada uma maneira
de obter o tempo gasto entre a requisio de uma consulta e o retorno da sua
resposta.
Nessa metodologia, o autor utiliza o conceito de check-point, que
consiste em criar pontos de coletas de tempo nas requisies de consultas ao
25
26
Utilizao do Disco
Grupo 1
Baixo
Baixo
Grupo 2
Baixo
Alto
Grupo 3
Alto
Baixo
Grupo 4
Alto
Alto
Grupo 2
Grupo 3
Grupo 4
27
28
A Figura 8 apresenta o esquema de dados utilizado no benchmark TCPApp. A modelagem utilizada na construo desse esquema a IDEF1X,
29
31
32
diferena entre a
33
Nmero de linhas
customer
1.920
country
92
adress
2.688
orders
19.200
order_line
105.600
author
Item
nmero de itens
Stock
nmero de itens
34
35
CONJUNTO B
36
37
1
0,9
0,8
segundos
0,7
0,6
0,5
0,4
0,3
0,17473
0,2
0,1
0,00396
0,00709
1A
2A
0,00442
0
3A
4A
consultas
38
1,00000
0,90000
0,80000
segundos
0,70000
0,60000
0,50000
0,40000
0,30000
0,20000
0,14260
0,10000
0,00390
0,00171
1B
2B
0,00729
0,00000
3B
4B
consultas
segundos
0,70000
0,60000
0,50000
0,40000
0,30000
0,20000
0,10000
0,00320
0,01539
melhor tempo
tempo mdio
0,04520
0,00000
pior tempo
39
40
7,00000
6,00000
segundos
5,00000
4,00000
3,00000
2,61470
2,00000
0,9721
1,00000
0,39830
0,00000
1A
2A
3A
4A
consultas
41
segundos
5,00000
4,00000
3,00000
2,00000
1,00000
0,00468
0,08122
1B
2B
0,11410
0,03818
3B
4B
0,00000
consultas
42
250
240,1517
244,8726
249,6796
melhor tempo
tempo mdio
pior tempo
segundos
200
150
100
50
segundos
200
150
100
50
0,0133209
0,05487
0,219
melhor tempo
tempo mdio
pior tempo
43
44
segundos
150,00000
117,4099
100,00000
50,00000
0,84388
0,15294
0,00000
1A
2A
3A
4A
consultas
possui
grande
influncia
no
desempenho
desse
tipo
de
armazenamento.
Na Figura 22 apresentado o grfico de desempenho das consultas do
Conjunto B.
45
200,00000
segundos
150,00000
100,00000
50,00000
0,00410
0,01058
0,20831
0,00727
1B
2B
3B
4B
0,00000
consulta s
encontrados
anteriormente.
nos
mtodos
de
armazenamento
expostos
46
Consulta 1A
Consulta 2A
Consulta 3A
Consulta 4A
0,00396
0,00709
0,17473
0,00442
0,39830
6,85390
2,61470
0,97210
0,15294
214,95100
0,84388
117,4099
referncia
externa,
segunda
linha
mostra
os
resultados
por
47
por
objetos.
Foi
constatado
nessa
consulta,
que
Consulta 1B
Consulta 2B
Consulta 3B
Consulta 4B
0,00390
0,00171
0,14260
0,00729
0,00468
0,08122
0,11410
0,03818
0,00410
0,01058
0,20831
0,00727
48
0,01539
244,87260
0,01539
Dados no interpretados
0,05487
A comparao dos mtodos com a Consulta 4B no ambiente multiusurio, mostrada no Quadro 9, confirmou mais uma vez que a consulta de
49
dados
convencionais,
em
tabelas
que
possuem
objetos
multimdia
trabalho
foram
apresentadas
as
principais
formas
de
51
Mono-usurio
mais de vinte
objetos
Multi-usurio
mais de vinte
objetos
Referncia externa
ACONSELHADO
ACONSELHADO
ACONSELHADO
Dados no interpretados
ACONSELHADO
Objetos
ACONSELHADO
NO
ACONSELHADO
NO
ACONSELHADO
NO
ACONSELHADO
NO
ACONSELHADO
52
REFERNCIAS
APACHE.
The
Apache
Software
Foundation.
Disponvel
em:
DCMI.
The
Dublin
Core
Metadata
Initiative.
Disponvel
em:
FGDC.
The
Federal
Geographic
Data
Committee.
Disponvel
em:
Disponvel
em:
FRANA,
B.
M.
Banco
de
Dados
Multimdia.
<http://www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/artigo_montgomery.pdf>
Acesso em: 11 set. 2005.
54
GHAFOOR,
A.
Multimedia
Database
Management
Systems.
ACM
55
1.1.1.
Disponvel
em:
<
http://www.tpc.org/tpc_app/spec/TPC-