Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução
Os SGBDs gratuitos têm despontado como uma solução para projetos de sistemas
computacionais que precisam utilizar Banco de Dados (BD), mas não dispõem de verba
para compra do software e respectivas licenças. Um dos setores nos quais essa
necessidade é observada é o desenvolvimento de projetos de pesquisa que têm a
utilização de bancos de dados como atividade auxiliar.
As bases de imagens médicas constituem um importante objeto de pesquisa,
visto que são imprescindíveis para o desenvolvimento de pesquisas com foco em
desenvolvimento de sistemas computacionais para apoio ao diagnóstico (computer
aided diagnosis - CAD) e ferramentas de treinamento, entre outros. Entre os principais
aspectos de imagens médicas estão as exigências de alta resolução nas suas aquisições e
as necessidades de armazenamento sem perda de informação. Esses aspectos
contribuem para a existência de grande quantidade de informação a ser armazenada,
resultando em arquivos de tamanhos gigantescos. A formação dessas bases de imagens
exige, além de tempo e estabelecimento de convênios com hospitais e clínicas, a
utilização de tecnologia adequada que possa proporcionar armazenamento e
recuperação de forma rápida e segura.
IV SBQS - V Workshop de Informática Médica
2. Materiais e Métodos
A Figura 1 mostra o modelo de dados utilizado neste trabalho, que teve como base o
sistema anteriormente desenvolvido (Nunes et al., 2004). O motivo para escolher as
tabelas mostradas foi a presença de características interessantes de serem analisadas,
como a quantidade de relacionamentos e os tipos de dados envolvidos no
armazenamento: a tabela PACIENTE é pai das outras duas tabelas (EXAME e
IMAGEM) e a tabela EXAME é pai apenas da tabela IMAGEM e, portanto, a tabela
IMAGEM é altamente dependente das outras. Além disso, a tabela IMAGEM é quem
armazenará as imagens do sistema proposto, sendo essa tabela uma das mais
interessantes de ser testada com relação a aspectos de performance, integridade e
consistência de dados.
Após ter redefinido o modelo de dados, estes foram implementados nos SGBDs
gratuitos citados. Foram instalados os dois gerenciadores no modo cliente-servidor e
também foram compostos os programas para a criação da base de dados necessária para
a efetuação dos testes desejados.
Como o foco principal do trabalho é a construção de bases de imagens médicas,
estas foram armazenadas considerando dois paradigmas: o armazenamento através de
atributos textuais e o armazenamento do seu conteúdo propriamente dito. Os tipos de
IV SBQS - V Workshop de Informática Médica
dados utilizados para representar imagens nos SGBDs testados foram: Blob no MySQL
e Oid no PostgreSQL. Ambos os tipos guardam a representação binária da imagem.
Nesse teste variou-se a quantidade de imagens inseridas e o tamanho delas. Assim, foi
possível demonstrar a performance dos SGBDs quando variamos o volume de registros
e o tamanho das imagens.
O teste consistiu em três etapas: (a) testar imagens no formato JPEG com
tamanho aproximado de um megabyte; (b) usar imagens no formato BMP com tamanho
médio de cinco megabytes e (c) incluir imagens no formato TIFF com tamanho médio
de dez megabytes. A escolha do formato JPEG deu-se pelo motivo de ser o formato
mais utilizado na construção de sites. O formato BMP foi escolhido devido a ser o
método mais clássico de representação de imagens, a partir do qual todos os outros são
melhorias em relação a ele. O formato TIFF é o que oferece a melhor qualidade,
consistindo também num formato sem compressão de bits e perda de qualidade. O
formato particular usado neste trabalho armazena as imagens com 12 bits de resolução
de contraste. Esta característica é muito importante porque possibilita a representação
de 4096 níveis de cinza, permitindo melhorar a performance de sistemas de auxílio ao
diagnóstico (Nunes et al, 2001). As imagens utilizadas foram provenientes de exames
mamográficos, sendo digitalizadas em um equipamento Lumiscan, da Lumisys Inc.
O esquema geral de execução dos testes consistiu em estabelecer a conexão,
marcando o tempo de início, executar as inserções ou consultas, liberar a conexão e
marcar o tempo final.
Foram executados os seguintes testes:
1. Integridade de dados: verificação do quanto o SGBD controla
automaticamente a integridade dos diversos tipos de dados necessários ao
modelo de dados definido. O presente teste consistiu em definir os tipos de
dados de cada atributo de cada tabela e verificar a garantia de integridade
dados;
2. Integridade referencial: verificação do controle de integridade em relação à
inclusão, alteração e remoção de dados de tabelas que estão relacionadas
com outras tabelas;
3. Integridade de chave primária: verificação de integridade em relação à
unicidade de chaves primárias nas tabelas;
4. Consistência de dados: verificação do controle que o SGBD tem sobre os
tipos de dados que fornece. O presente teste é uma decorrência do primeiro,
visto que a garantia de integridade dos dados afeta profundamente a garantia
de consistência dos dados;
5. Performance com a utilização de tabelas comuns solitárias: verificação do
tempo de armazenamento e recuperação de informações utilizando somente
dados do tipo texto e/ou numéricos em tabelas sem relacionamentos;
6. Performance com a utilização de tabelas comuns relacionadas: verificação do
tempo de armazenamento e recuperação de informações utilizando somente
dados do tipo texto e/ou numéricos em tabelas que têm um ou mais
relacionamentos;
7. Performance com a utilização de tabelas com objetos diferenciados:
verificação do tempo de armazenamento e recuperação de informações em
tabelas que possuem objetos diferenciados (imagens especificamente), com e
sem relacionamentos;
IV SBQS - V Workshop de Informática Médica
3. Resultados e Discussões
6000
5000
4000
3000
2000
1000
0
1 5 10 50 100 500
Qua nt i da de de i m a g e n s no f or m a t o TI FF
T e m po de r e c up e r a ç ã o m é d i o e m t a b e l a s c om ob j e t os d i f e r e n c i a d os d e 1 0 m e g a b y t e s
500
450
400
350
300
250
200
150
100
50
0
1 5 10 50 100 500
Qua nt i da de de i m a g e n s no f or m a t o TI FF
4. Conclusões
De acordo com os resultados obtidos pode-se concluir que o MySQL é um SGBD veloz
ideal para aplicações onde velocidade seja algo mais crucial do que segurança. Apesar
de fornecer garantia de integridade e consistência dos dados, ele deixa a desejar em
vários aspectos, como, por exemplo, integridade referencial. O MySQL foi muito mais
rápido que o PostgreSQL em todos os testes de performance executados, mostrando-se
ideal para o armazenamento e recuperação tanto de dados comuns, como números e
textos, quanto dados binários (imagens médicas), independente da quantidade de dados,
do número de tabelas envolvidas e do número de clientes.
Já o PostgreSQL mostrou-se a todo tempo mais lento do que o MySQL quando o
quesito em questão foi a velocidade observada durante o armazenamento e recuperação
de informações. Por esses motivos esse SGBD é recomendado em aplicações nas quais
a segurança dos dados é algo crucial, mas a performance não é prioritária.
Em relação à recuperação de informação a linguagem PHP apresentou tempos
de resposta inferiores ao Java em todos os instantes, tanto para dados comuns quanto
IV SBQS - V Workshop de Informática Médica
Agradecimentos
Referências Bibliográficas
Java (2004), Disponível em: http://www.java.sun.com, Acesso em: 09 mar. 2005.
MySQL (2004), Disponível em: http://www.mysql.com, Acesso em: 09 mar. 2005.
Nishikawa, R. M., Giger, M. L., Doi, K.; Metz, C. E., Yin, F-F., Vyborny, C. L.,
Schmidt, R. A. (1994) “Effect of case selection on the performance of computer-
aided detection schemes”, Medical Physics, v. 21, p. 265-269.
Nunes, F.L.S., Schiabel, H., Escarpinati, M.C., Benatti, R. (2001) “Comparisons of
different contrast resolutions effects on a computer-aided detection system
intended to clustered microcalcifications detection in dense breasts images”,
Journal of Digital Imaging, vol. 14 (2), suppl. 1, p.217-219.
Nunes, F.L.S., Schiabel, H., Oliveira Jr., J.A., Tuccilli, C., Benatti, R. H. (2003a) “Um
sistema computacional para registrar e recuperar imagens mamográficas via
Internet”, III Workshop de Informática Médica, Fortaleza (CE).
Nunes, F.L.S., Schiabel, H., Benatti, R. H. (2003b) “A computer system to record and
retrieve information from a mammographic images database by Internet”, World
Congress on Medical Physics and Biomedical Engineering, Sidney, Australia.
Nunes, F.L.S., Schiabel, H., Goes, C.E., Oliveira Jr., J.A., Benatti, R. H. (2004) “Using
free technology to store and retrieve mammographic images by internet”, 5th
International Workshop on Image Analysisfor Multimedia Interactive Services,
Instituto Superior Técnico, Lisboa, Portugal.
PHP (2004), Disponível em: http://www.php.net, Acesso em: 09 mar. 2005.
PostgreSQL (2004), Disponível em: http://www.postgresql.org, Acesso em : 09mar.
2005.