2002 Avaliação Da Taxa de Compressão Sem Perdas CT

VALDIR MARTINS
AVALIAO DA TAXA DE COMPRESSO

SEM PERDAS EM PROJEES DE
TOMOGRAFIA COMPUTADORIZADA
Dissertao apresentada como requisito parcial

obteno do grau de Mestre em Informtica,
Curso de Ps-Graduao em Informtica, Setor
de Cincias Exatas, Universidade Federal do
Paran.
Orientador: Prof. Eduardo Parente Ribeiro
CURITIBA
2002
Ministrio da Educao
Universidade Federal do P a r a n
Mestrado em Informtica
PARECER
Ns, abaixo assinados, membros da Banca Examinadora da defesa de

Dissertao de Mestrado em Informtica, do aluno Valdir Martins, avaliamos o trabalho
intitulado. "Avaliao da taxa de compresso sem perdas em projees de tomografia
computadorizada", cuja defesa foi realizada no dia 30 de agosto de 2002, s dez horas, no
anfiteatro B do Setor de Cincias Exatas da Universidade Federal do Paran. Aps a avaliao,
decidimos pela aprovao do candidato.
Curitiba, 30 de agosto de 2002.
'rof. Dr. Eduardo Parente Ribeiro

DELT/UFPR - Orientador
Prof.ODrl Humberto Gamba

CEFET7PR - Membro Externo
Prof. Dr. Hlio Pedrini

DINF/UFPR
AGRADECIMENTOS
Agradeo primeiramente a Deus pela oportunidade concedida e por nos ajudar a
vencer as dificuldades e obstculos.
Agradeo a minha esposa e filhos pelo amor, incentivo, pacincia e compreenso
pelas horas ausentes.
Ao meu orientador, professor Eduardo Parente Ribeiro, pela segurana como
orientou e grande contribuio dada na realizao deste trabalho.
Ao colegas mestres, Ionildo e Luciano, pelas contribuies e disponibilizao de
informaes como programas e imagens, utilizadas em suas teses, as quais possibilitaram a
realizao dos experimentos e finalizao deste trabalho.
Agradeo ainda aos demais colegas do curso de ps-graduao em informtica, aos
professores, amigos e todos aqueles que de alguma forma deram a sua contribuio.
SUMRIO
LISTA DE FIGURAS V
LISTA DE TABELAS VU
RESUMO vm
ABSTRACT IX
1. INTRODUO 1
1.1 MOTIVAO 2
1.2 HISTRICO 3
1.3 TRABALHOS RELACIONADOS 6
1.4 ESTRUTURADA DISSERTAO 7
2. TOMOGRAFIA COMPUTADORIZADA (CT) 9
2.1 TOMOGRAFIA DE RAIO-X 9
2.2 PADRO D I C O M 10
2.3 NECESSIDADE DE ARMAZENAGEM 11
3. COMPRESSO DE IMAGENS 14
3.1 MODELO GENRICO DE COMPRESSO DE IMAGENS 16
3.2 CLASSIFICAO DA COMPRESSO DE IMAGENS 17
3.3 TAXA DE COMPRESSO 18
3.4 COMPRESSO COM PERDAS E COMPRESSO SEM PERDAS 19
3.5 TIPOS DE CODIFICAO 20
3.5.1 Codificao de Lempel-Ziv (LZ) 21
3.5.2 Codificao de Huffman 25
3.5.3 Codificao Aritmtica 26
3.5.4 Codificao Preditiva 30
3.5.5 Codificao por Transformada 31
3.5.6 Codificao Lossless JPEG com Huffman 33
4. METODOLOGIA 38
4.1 INTRODUO 38
4.2 IMAGENS ESENOGRAMAS UTILIZADOS 40
4.3 MTODOS DE COMPRESSO 43
5. RESULTADOS 45
5.1 COMPRESSO DE SENOGRAMAS 45
5.2 COMPRESSO DE SENOGRAMA COM ESCALAS DE RUDOS 49
5.3 COMPRESSO DOS SENOGRAMAS COM RUDO PADRO 50
5.4 COMPRESSO DE IMAGENS 52
5.5 COMPARATIVO DE COMPRESSO IMAGENS X SENOGRAMAS 54
6. CONCLUSO 58
APNDICE 1 - PADRES DE COMPRESSO DE IMAGEM 61

l.l PADROGZIP 61
1.2 PADRO J P E G 62
1.3 TRANSFORMADA WAVELET REVERSVEL 65
APNDICE 2 - FORMATOS DE IMAGEM 70
2.1 FORMATO B M P 70
2.2 FORMATO P B M 74
2.3 FORMATO R A W 77
APNDICE 3 - CODIFICAO RUN LENGTH (RLE) 78
APNDICE 4 - IMAGENS E SENOGRAMAS UTILIZADOS 82
REFERNCIAS BIBLIOGRFICAS 94
LISTA DE FIGURAS
Figura 2.1 - Geometria da obteno das projees em CT 9

Figura 3.1 - Modelo genrico de compresso de imagens [MEL94] 16
Figura 3.2 - Taxionomia dos mtodos de compresso 18
Figura 3.3 - Representao do processo de codificao aritmtica 29
Figura 3.4 - Esquema de compresso usado nos experimentos 33
Figura 4.1 - Esquema de gerao de senogramas pelo programa simulador de projees 39
Figura 4.2 - Mtodos de compresso utilizados para as imagens e senogramas 39
Figura 4.3 - Imagem "Phantom" gerada por software 41
Figura 4.4 - Senograma do "Phantom" gerada por software 41
Figura 5.1 - Grfico comparativo da compresso dos senogramas reais, separados em 8 bits.46
Figura 5.2 - Grfico comparativo da compresso dos senogramas reais com 16 bpp 47
Figura 5.3 - Grfico comparativo dos senogramas comprimidos 48
Figura 5.4 - Grfico comparativo do senograma "Abdom" com escala percentual de rudo. ..50
Figura 5.5 - Grfico comparativo dos senogramas com rudo padro 51
Figura 5.6 - Grfico comparativo das imagens de TC comprimidas 52
Figura 5.7 - Grfico comparativo da imagem "Abdom" com escalas de rudo 53
Figura 5.8 - Grfico da taxa de compresso comparado ao tamanho original da imagem 55
Figura 5.9 - Grfico das mdias das compresses com e sem rudo 56
Figura A2.1 - Formato BMP na verso inicial 70
Figura A2.2 - Formato BMP a partir da segunda verso 70
Figura A3.1 - Codificao RLE (a) em ziguezague, (b) por linha e (c) por coluna 80
Figura A3.2 - Diferentes formas de codificao do RLE 81
Imagem A4.1 - Senograma "DenteOl" e imagem reconstruda de um dente 83
Imagem A4.2 - Senograma "Dente02" e imagem reconstruda de um dente 84
Imagem A4.3 - Senograma "Dente03" e imagem reconstruda de um dente 84
Imagem A4.4 - Senograma "Abdom" e imagem reconstruda de um abdomem 85
Imagem A4.5 - Senograma "Brain" e imagem reconstruda de um crebro 85
Imagem A4.6 - Senograma "Head" e imagem reconstruda de uma cabea 86
Imagem A4.7 - Senograma "Hernia" e imagem reconstruda de vrtebra com hrnia 86
Imagem A4.8 - Senograma "Phantom" e imagem de testes representando uma cabea 87
Imagem A4.9 - Senograma "Trax" e imagem reconstruda de um trax 87
Imagem A4.10 - Senograma "Abdom" e imagem com percentual de 0,1% de rudo 88
Imagem A4.11 - Senograma "Abdom" e imagem com percentual de 0,2% de rudo 88
Imagem A4.12 - Senograma "Abdom" e imagem com percentual de 1% de rudo 89
Imagem A4.20 - Senogramas com insero de percentual padro de 1% de rudo 93
LISTA DE TABELAS
Tabela 3.1 - Contedo da janela LZ77 e da Entrada durante a compresso 23
Tabela 3.2 - Contedo da sada a cada passo da compresso 24
Tabela 3.3 - Descompresso dos dados do exemplo por LZ77 25
Tabela 3.4 - Representao dos smbolos e seus respectivos intervalos iniciais 28
Tabela 3.5-Processo de codificao do exemplo de codificao aritmtica 29
Tabela 3.6 - Processo de decodificao do exemplo de codificao aritmtica 30
Tabela 3 .7 - Proditores para o Lossless JPEG 34
Tabela 3.8 - Tabela de categorias e valores de diferena 35
Tabela 5.1 - Taxa de compresso de senogramas reais, separados parte alta e parte baixa 45
Tabela 5.2 - Compresso de senogramas reais, com 16 bpp, entre diferentes mtodos 47
Tabela 5.3 - Compresso dos senogramas simulados 48
Tabela 5.4 - Compresso para o senograma "Abdom" com insero de rudo 49
Tabela 5.5 - Compresso do senogramas com rudo padro 51
Tabela 5.6 - Compresso das imagens de TC 52
Tabela 5.7 - Compresso para a imagem "Abdom" com insero de rudo 53
Tabela 5.8 - Taxa de compresso considerando o tamanho original da imagem 54
Tabela 5.9 - comparao entre as mdias das compresses 56
Tabela A2.1 - Cabealho de arquivo do formato BMP 71
Tabela A2.2 - Cabealho de imagem do formato BMP 72
Tabela A2.3 - Continuao do cabealho de imagem do formato BMP 72
Tabela A2.4 - Identificador de tipo para os formatos PBM, PGM e PPM 75

RESUMO
Este trabalho apresenta um estudo de caso na rea de compresso sem perdas de projees de
tomografia computadorizada, chamadas senogramas. A principal vantagem em se comprimir
o senograma ao invs da imagem reconstruda consiste em se preservar os dados originais, o
que possibilita sua reutilizao futura com outros algoritmos de reconstruo. Os mtodos que
apresentam perdas geralmente possuem melhores taxas de compresso, mas podem prejudicar
o processo de reconstruo. So avaliados trs mtodos de compresso sem perda:
transformada wavelet de inteiros reversvel, LJPG (Lossless JPG - Joint Photographic Experts
Group), e GZIP (Gnu ZIP), que o padro de compresso utilizado pelo projeto GNU.
ABSTRACT
This work presents a case study of lossless compression of computerized tomography
projections, called sinograms. The main advantage of compressing sinogram in the place of
reconstructed imaged lies in the preservation of the original data that allows its future
reutilization with others reconstruction algorithms. Lossy image compression methods usually
have better compression ratios, but they may alter the reconstrution of the original image.
Three methods are considered: the reversible integer wavelet transform which allow lossless
image compression; LJPG (Lossless JPG - Joint Photographic Experts Group), for lossless
compression of still images; and GZIP (Gnu ZIP), that is the compression standard used by
GNU project.
1
1. Introduo
A tomografia computadorizada (Computed Tomography - CT) hoje largamente
utilizada e tornou-se uma ferramenta indispensvel em hospitais, clnicas e empresas de todo
o mundo. As projees de tomografia computadorizada so obtidas com medidas realizadas
externamente, a partir de diferentes ngulos de um corpo. A partir destas projees, os dados
originais devem ser reconstrudos utilizando-se tcnicas apropriadas. Vrias tcnicas e
algoritmos esto disponveis nos dias de hoje, permitindo a reconstruo da imagem a partir
das projees obtidas.
Dado ao grande volume de dados gerados nas imagens digitais, torna-se
imprescindvel a necessidade de se aplicar alguma tcnica de compresso de dados, visando
facilitar o armazenamento e a transmisso, mas garantindo a expanso e permitindo o
processamento desses dados.
Atravs do processo de compresso de dados podemos reduzir a quantidade de bits
necessrios para representar uma determinada quantidade de informao. Vrios mtodos de
compresso de dados sem perdas (reversveis) e com perdas (irreversveis) tm sido
propostos na literatura. Cada um desses mtodos procura explorar determinadas
caractersticas da imagem. A escolha do mtodo apropriado depende do conhecimento da
teoria do mtodo, bem como, um prvio conhecimento das caractersticas presentes na
imagem. Desta maneira possvel alcanar maiores taxas de compresso.
O objetivo deste trabalho consiste, ento, em estudar e avaliar alguns dos mtodos
de compresso de dados que devero ser aplicados nas imagens e nas projees de
tomografia computadorizada, investigando o comportamento de cada um deles sobre estes
tipos de imagens, assinalando suas vantagens e desvantagens.

2
Usaremos, portanto, nesta investigao, alguns dos mtodos mais conhecidos em
compresso de dados: GZIP (Gnu ZIP), LJPG (Lossless JPEG) e outros mtodos
recentemente implantados: Transformada S (Wavelet de Haar) e Transformada S+P (Said e
Pearlman) [SANOl].
1.1 Motivao
A motivao para este trabalho veio da necessidade de pesquisas sobre
investigao, implementao e avaliao de algoritmos para compresso sem perdas, de
projees de tomografia computadorizada e suas respectivas imagens, usando a transformada
discreta wavelet {discrete wavelet transform - DWT). Como trata-se de um mtodo
relativamente novo, ser realizada uma comparao com mtodos j conhecidos e
consagrados pelo uso, objetivando o estudo do comportamento destes mtodos.
Alguns trabalhos foram desenvolvidos na rea de compresso de imagens
utilizando mtodos baseados em wavelets. Entretanto, foram desenvolvidos poucos trabalhos
utilizando a transformada wavelet sem perdas. Os trabalhos envolvendo compresso de
imagens de tomografia computadorizada geralmente so realizados utilizando imagens j
reconstrudas.
Neste trabalho, alm da utilizao de imagens j reconstrudas, sero utilizadas as
projees de tomografia computadorizada com objetivo de reduzir a quantidade de
informao necessria e mantendo a integridade dos dados. Os dados originais tambm sero
preservados, o que permitir a aplicao de outras tcnicas de reconstruo, as quais tambm
so tpicos de constante pesquisa. Como estas informaes no podem sofrer perdas no
processo de compresso e descompresso, devero ser adotados mtodos de compresso que
permitam que os dados possam ser reconstrudos para a sua forma original. Para tal, sero
utilizadas a transformada wavelet de inteiros (transformada S e transformada S+P) , o mtodo

3
GZIP e o Lossless JPEG. Mtodos que resultam em perdas de informaes no so aceitos
para este tipo de dados, pois a perda de informaes pode prejudicar a reconstruo e
consequentemente a anlise e o diagnstico a partir da imagem final.
O interesse nesta investigao abordar apenas as tcnicas de compresso de
imagens mdicas e seus respectivos senogramas.
1.2 Histrico
O processamento de imagens uma rea de interesse j faz algumas dcadas,
sendo ainda de interesse crescente, includo aqui a rea de compresso de dados. Conforme
descrito em [MAR99], uma das primeiras aplicaes em processamento de imagens remonta
do comeo do sculo, onde buscava-se formas de aprimorar a qualidade de impresso de
imagens digitalizadas transmitidas atravs do sistema Bartlane de transmisso de imagens por
cabo submarino entre Londres e Nova Iorque. Os primeiros sistemas Bartlane, no incio da
dcada de 20, codificavam uma imagem em cinco nveis de intensidade distintos. Esta
capacidade seria expandida, j em 1929, para 15 nveis ao mesmo tempo em que era
desenvolvido um mtodo aprimorado de revelao de filmes atravs de feixes de luz
modulados por uma fita que continha informaes codificadas sobre a imagem.
Porm, o grande impulso para esta rea viria cerca de trs dcadas mais tarde, com
o advento dos primeiros computadores digitais de grande porte. J o interesse pelas tcnicas
de compresso de imagens remonta a quase meio sculo atrs, na poca, utilizando tcnicas
analgicas.
Em 1986, a necessidade de um padro internacional para compresso de imagens
estticas resultou na formao do JPEG, hoje, formalmente conhecido como ISO/IEC
JTC1/SC29/WG1.
4
Em relao s transformadas wavelets, [SANOl] descreve um histrico o qual
reproduzimos a seguir.
A primeira meno de wavelets aparece no apndice da tese de Alfred Haar em
1909 [GRA95], Uma propriedade da wavelet de Haar que ela possui um suporte compacto,
ou seja, ela se anula fora de um intervalo finito. As wavelets de Haar no so diferenciveis
continuamente, o que limita de certa forma sua aplicao. A transformada wavelet o
resultado do trabalho de um grande nmero de pesquisadores. Um breve histrico sobre as
wavelets apresentado por JAWERTH e SWELDENS [JAW94] e GRAPS [GRA95], da qual
segue um breve resumo.
Nos anos 30, vrios grupos pesquisavam independentemente a representao de
funes usando funes de base de escala varivel, chamadas funes de base de Haar. O
fsico Paul Levy pesquisou movimentos Brownianos, um tipo de sinal randmico.
Littlewood, Paley e Stein descobriram uma funo que pode variar em escala e conservar
energia quando computando a energia da funo.
Ainda nos anos 30, a comunidade matemtica percebeu que as tcnicas
desenvolvidas por Fourier no eram muito adequadas para a soluo de muitos problemas e
recorreram para s chamadas tcnicas de Littlewood-Paley, freqentemente substitutas
eficientes.
Durante os anos 50 e 60, desenvolveram poderosas ferramentas para solucionarem
equaes diferenciais parciais e equaes integrais, e perceberam que elas combinavam com
a teoria de Caldern-Zygmund, uma rea de anlise harmnica.
No incio dos anos 80, Strmberg descobriu as primeiras wavelets ortogonais.
Independente dos desenvolvimentos em anlise harmnica, o fsico Alex Grossmann e o
engenheiro Jean Morlet [GR084], juntamente com seus colegas de trabalho estudaram a
5
transformada wavelet em sua forma contnua. Eles definiram wavelets em um contexto de
fsica quntica. Surgia a teoria de "frames".
Em seguida, Yves Meyer, matemtico Francs, e seus colaboradores perceberam
que as ferramentas da teoria de Caldern-Zygmund, em particular as representaes de
Littlewood-Paley, poderiam levar a uma concepo unificada de muitos dos resultados em
anlise harmnica. Comearam tambm a compreender que aquelas tcnicas poderiam
substituir as sries de Fourier em aplicaes numricas.
Alex Grossmann e Jean Morlet sugeriram a palavra wavelet para os blocos
construtivos, e o que antes se chamava teoria de Littlewood-Paley, passou a ser chamado
teoria wavelet.
Pierre-Gilles Lemari e Yves Meyer, independente de Strmberg, construram
novas expanses de wavelet ortogonal. Em 1985, Stephane G. Mallat [MAL89] introduziu o
conceito de anlise em multiresoluo, dando um novo impulso a essa teoria. Ele descobriu
algumas relaes entre filtros de quadrature espelhada (quadrature mirror filters - QMF),
algoritmos piramidais e bases de wavelets ortonormais. Inspirado em parte desses resultados,
Yves Meyer construiu a primeira wavelet no trivial. Ao contrrio da wavelet de Haar, as
wavelets de Meyer so diferenciveis continuamente; todavia elas no tm suporte compacto.
A introduo da anlise em multiresoluo e a transformada wavelet rpida por Mallat e
Meyer forneceu a conexo entre filtros sub-bandas e wavelets. Alguns anos depois, em 1988,
usando o trabalho de Mallat, Ingrid Daubechies [DAU88] construiu uma famlia de wavelets
com suporte compacto.
Desde ento, muitos trabalhos tm sido desenvolvidos em diferentes reas, sendo
uma delas, as aplicaes em compresso de imagens digitais.

6
1.3 Trabalhos Relacionados

Neste item, sero apresentados alguns dos trabalhos mais recentes na rea de
compresso de imagens baseados em diversos padres. Os algoritmos de compresso de
imagens propostos nestes trabalhos so com perdas e sem perdas.
No trabalho de [AGOOO], Estudo de padres de Compresso de Imagens para
Aplicaes VLSI (Very Large Scale Integration), realiza estudo entre vrios mtodos de
compresso de imagens, tanto para abordagens sem perdas como abordagens com perdas. O
objetivo, porm, no est no aspecto comparativo entre estes vrios mtodos, mas servir de
introduo aos algoritmos discutidos no trabalho, assim como discusso de algumas
arquiteturas possveis para a implementao em hardware de alguns dos algoritmos
apresentados.
Em [MEL94] realiza-se uma avaliao da utilizao da transformada wavelet na
compresso de imagens. Traz tambm uma comparao dos resultados obtidos no trabalho
com o mtodo de compresso JPEG para algumas imagens. Nos experimentos realizados,
verifica uma disparidade grande entre as taxas de compresso do mtodo JPEG,
comercialmente disponvel e o mtodo da Transformada Wavelet. Conclui que preciso
avaliar cuidadosamente o processo proposto em seu trabalho.
No trabalho de [SAN01] est descrito que, recentemente, o algoritmo chamado
SPIHT (Set Partitioning in Hierarchical Trees) foi proposto por Said e Pearlman [SAI96], o
qual uma implementao mais eficiente do esquema de codificao zerotree do Shapiro
[SHA93]. Este algoritmo permite codificar uma imagem com perdas ou sem perdas. Eles
usam um esquema de multiresoluo em pirmide o qual melhorado via codificao
preditiva atravs da transformada S+P (transformada Seqencial + Predio). O algoritmo
SPIHT difere de outros mtodos no fato de que a predio usada durante (em vez de
7
depois) a seqncia de transformaes recursivas e, consequentemente, pode usar
informaes que no esto disponveis depois que a imagem transformada. O algoritmo
SPIHT baseado em trs estgios: (/') aplicao da tranformada S+P para decompor a
imagem, (ii) uma tcnica de codificao baseada em zerotree e (iii) codificao aritmtica
adaptativa dos dados residuais.
Esta tcnica produz significativamente melhor compresso do que os mtodos de
compresso wavelet tradicional com similar complexidade computacional, e representa o
estado da arte em compresso de imagens de propsito geral.
A transformada S (Seqencial) utilizada nesta tcnica uma adaptao da
transformada de Haar para mapear os valores de inteiros para inteiros, permitindo assim a
reconstruo exata das informaes.
Calderbank [CAL97] apresenta duas abordagens para construir transformadas
wavelet de inteiros para inteiros os quais podem ser usadas para compresso sem perdas. Na
primeira parte do trabalho apresentado uma adaptao do pr codificador desenvolvido por
Laroia, Tretter e Farvardin. Na segunda abordagem apresentado como conseguir uma
implementao reversvel usando o lifting scheme proposto por Sweldens [SWE97],
1.4 Estrutura da Dissertao

Este trabalho est estruturado em seis captulos. No primeiro captulo esto
descritos a motivao, um histrico sobre compresses e transformadas wavelets e os
trabalhos relacionados.
No segundo captulo, inicialmente apresentada uma teoria sobre tomografia
computadorizada. Em seguida, comenta-se o padro DICOM, utilizado para identificao,
arquivamento e recuperao de imagens mdicas, entre elas, as de tomografia

8
computadorizada e, finalizando o captulo, as necessidades advindas da armazenagem dessas
imagens.
O captulo terceiro comenta a necessidade de compresso de imagens, dada ao
grande volume existente nos dias atuais. Esto includos tambm comentrios sobre o modelo
genrico de compresso, formas de classificao e medidas de compresso. Finalizando o
captulo, esto descritos alguns mtodos e algoritmos de compresso de dados: Codificao
de Lempel-Ziv (LZ), Codificao de Huffinann, Codificao Aritimtica, Codificao
Preditiva, Codificao por Transformada e Lossless JPEG.
O quarto captulo descreve a metodologia utilizada para a realizao dos
experimentos deste trabalho, dentro do objetivo, que a realizao de testes de compresso
sobre imagens de tomografia computadorizada e imagens reconstrudas, utilizando vrios
mtodos de compresso.
No captulo cinco esto descritos os resultados obtidos com os experimentos,
dentro das seguintes abordagens: taxas de compresso para senogramas reais; taxas de
compresso para imagens e senogramas sem insero de rudos; taxas de compresso para
senogramas reais com insero de rudos em escalas percentuais; taxas de compresso em
uma imagem e um senograma, com insero de rudos em escalas percentuais; comparativo
de compresso entre imagens e senogramas com e sem insero de rudos.
Por fim, no sexto captulo, esto a concluso e apresentao de propostas para
trabalhos futuros.
Visando complementar as vrias teorias estudadas, so apresentados nos apndices,
teorias sobre padres de compresso de imagens, onde esto comentados os mtodos GZIP,
LJPG, transformadas wavelets e formatos de imagens utilizadas neste trabalho.

9
2. Tomografia Computadorizada (CT)
2.1 Tomografia de Raio-X

Em de [RIB96] foi descrito que a tomografia computadorizada um mtodo de
radiografia que foi introduzido em 1972 para aplicaes neurolgicas, mas rapidamente com
o avano da tecnologia, permitiu examinar outras partes do corpo tambm. O primeiro
tomgrafo computadorizado foi construdo por Godfrey N. Hounsfield, feito que lhe
conferiu, junto com Allan McLeod Comarck, o Prmio Nobel de Fisiologa e Medicina em
1979. A tomografia de raio-X tem desde ento se estendido tambm em aplicaes
industriais.
O termo tomografia usado para se referir a qualquer mtodo de obteno de
imagem do interior de um corpo ou objeto a partir de medidas realizadas externamente. O
termo "computerized tomography", ou somente CT, caiu no uso comum e at hoje se refere
ao tomgrafo de raio-X. Existem outras tcnicas de tomografia baseadas em outros princpios
fsicos como: tomografia de ressonncia magntica, Magnetic Ressonance Imaging (MRI), a
tomografia de emisso de positrons, Positron Emission Tomography (PET), a tomografia
com ultra-som e tomografia de impedncia eltrica, Electrical Impedance Tomography (EIT).
Figura 2.1 - Geometria da obteno das projees em CT.

10
A seguir apresenta-se um modelo simplificado para CT de raio-x [JAI89], Seja
fix,y) o coeficiente de absoro do objeto no ponto numa faixa para algum valor fixo de
z. Assumindo que os raios-x consistem de um feixe infinitamente fino e paralelo, a
intensidade do feixe detectado do outro lado do objeto dado por
(2.1)
onde I0 a intensidade do feixe incidente, Lo caminho do raio eu a distncia ao longo de
L, conforme mostrado na figura 2.1.
Considerando projees em muitas direes diferentes, possvel reconstruir as
caractersticas de densidade do corpo para cada ponto ou pequena regio no interior do corpo.
A imagem obtida com a transformada de Radon de uma distribuio, que a
imagem que se obtm ao empilhar as linhas correspondentes s projees obtidas para os
vrios ngulos, muitas vezes chamada de senograma.
A partir das projees, obtidas com as medidas realizadas externamente ao corpo,
deve-se reconstruir esses dados originais utilizando alguma tcnica de reconstruo. Existem
vrios algoritmos e tcnicas que permitem a reconstruo da imagem a partir das projees
obtidas. As tcnicas que permitem a reconstruo da imagem tambm tm sido tpicos de
constantes pesquisas [SANO 1 ].
2.2 Padro DICOM

Em 1985, duas organizaes norte-americanas, uma da rea mdica (American
College of Radiology) e outra da rea de equipamentos mdicos (National Electrical
Manufacturers Association) desenvolveram conjuntamente um padro para o intercmbio
eletrnico de imagens que no dependesse do tipo de computador onde residem os dados.
Esse padro recebeu o nome de ACR-NEMA e foi o primeiro a ser adotado pelos fabricantes
11
de aparelhos geradores de imagens radiolgicas, permitindo assim uma conexo mais fcil a
computadores de uso geral. Posteriormente, foi criado, a partir dele, o padro DICOM
{Digital and Communications in Medicine) [DIC01], o qual foi adotado muito mais
amplamente e que governa tambm as informaes de texto (nome, nmero de registro do
paciente, laudo radiolgico, etc.). Usando-se um nico comando, o DICOM permite que o
mdico recupere o registro completo de imagem mdica de um determinado paciente. O
DICOM define no somente como a imagem representada digitalmente dentro do
computador (formato de imagem), bem como ele deve ser arquivado. So enormes os
benefcios trazidos por sistemas desse tipo, pois os programadores podem simplesmente
incorporar o padro em seus programas, ao invs de ter que desenvolver um novo programa a
partir do zero. Alm disso, eles no precisam se preocupar com as diferenas entre os vrios
modelos de aparelhos de raios-X, tomografia, ultra-som, medicina nuclear, etc., ou com os
computadores onde rodam os seus programas. Vrias organizaes, como o American
College of Cardiology e o American College of Pathology esto adotando o DICOM como
padro, fazendo com que um largo espectro de imagens mdicas seja padronizado e
disponveis atravs de alguns comandos simples [HOG98],
2.3 Necessidade de Armazenagem

No manejo de informao dentro de um hospital, por meio de uma rede de
computadores, surgiu inicialmente o conceito de Sistemas de Informao Radiolgica - RIS
(Radiology Irrformation Systems) demonstrando que possvel utilizar sistemas
computadorizados para melhorar o gerenciamento dos pacientes, gerao e distribuio de
relatrios, facilidades de utilizao dos recursos disponveis, localizao dos filmes, e rotinas
de funcionamento do setor de radiologia. Freqentemente, estes sistemas so integrados ao
Sistema de Informao Hospitalar - HIS (Hospital Information Systems). Embora o RIS

12
resolva a parte de gerenciamento de dado, porm no trabalha com as prprias imagens, na
dcada de 80, este conceito foi ampliado para incluir o que se chama de PAC S (Picture
Archiving and Communication System), ou Sistemas de Arquivamento e Comunicao de
Imagens. E um sistema que permite, como o nome diz, armazenagem e recuperao das
imagens em uma rede de computadores.
Atualmente, a maior parte das imagens so registradas e armazenadas em filme.
Igualmente imagens como CT e MRI, as quais so inerentemente digitais, so transferidas
para o filme depois que os tcnicos a tenham otimizado para a visualizao. Ocasionalmente
como no caso de estudos ultrasonogrficos, as imagens so transferidas para fitas de vdeo
para posterior reviso e interpretao.
O armazenamento de filmes requer um grande espao fsico em departamentos de
radiologia. Em geral os departamentos de radiologia tm a capacidade de armazenar filmes
somente para pacientes que tenham sido estudados nos ltimos 6 a 12 meses. Estudos antigos
so retidos por no mnimo 7 anos e estocados em um poro por exemplo. Alm do espao
fsico, as imagens sofrem deteriorao ao longo dos anos, uma vez que o filme qumico perde
a qualidade. Outro problema o perigo do armazenamento, pois trata-se de material
altamente imflamvel. A aquisio digital de todas as imagens dentro de um hospital, alm de
resolver os problemas de deteriorao de imagens e guarda de material inflamvel, oferece
um excitante panorama de reduo do espao fsico requerido, custo de material, reduo do
trabalho manual tradicional de manuseio de filmes, rpida recuperao de imagens via pedido
de informao base de dados e alta velocidade de transmisso de imagens atravs de redes.
O desenvolvimento dos sistemas PACS uma rea ativa de pesquisa em
informtica mdica. Um nmero de complexos problemas tiveram que ser resolvidos antes de
por em prtica, incluindo padronizao de transmisso de imagens e formatos de

13
armazenagem. Armazenar todos os dados de imagens mdicas digitais pode criar um grande
problema de gerenciamento, que difcilmente pode ser resolvido por mtodos que no
envolvam computao [ALM98].
Com a expanso da imagem digital em termos de qualidade, tamanho e
aplicabilidade, surge a necessidade de desenvolver mecanismos de compresso de forma a
tornar vivel a troca deste tipo de informao.
Todo o esforo para reduzir o espao ocupado pela imagem tem de levar em
considerao a sua qualidade. Dessa forma, a interoperacionalidade de sistemas relacionados
com a transferncia de imagem digital (tal como o DICOM) conseguida atravs da melhor
relao do binmio nvel de compresso/qualidade.

14
3. Compresso de Imagens
Grandes hospitais e clnicas de diagnstico por imagem realizam milhares de
procedimentos de imagens mdicas, podendo gerar centenas ou at milhares de gigabytes de
dados de imagens por ano. Existem tcnicas de computao que podem comprimir
informaes como a compresso de dados, que geralmente aproveita a redundncia na
informao. A compresso tpica para dados geralmente na faixa de 2 ou 3 para 1. Algumas
tcnicas de alta compresso de imagens, conhecidas como "com perda", conseguem
propores de at 50 para 1, mas podem distorcer e alterar a imagem e prejudicar o
diagnstico em caso de estruturas muito pequenas na imagem (bordas, microcalcificaes)
[ALM98],
A compresso de uma imagem possvel porque as imagens, em geral, apresentam
um alto grau de coerncia, que se traduz em uma redundncia de informao quando
codificada. Considere, por exemplo, um elemento qualquer de uma imagem no formato
matricial. Provavelmente, a cor desse elemento ser igual a dos elementos vizinhos, porque
h uma grande probabilidade de todos eles pertencerem a um mesmo objeto da imagem. Caso
isso no ocorra, certamente uma relao mais complexa existir na imagem. Baseado neste
fato, os mtodos de compresso visam produzir, atravs da reduo ou eliminao de
redundncia, um cdigo mais compacto que preserve as informaes contidas na imagem
[SAN01],
Em uma imagem digital existem, basicamente, trs tipos de redundncias de dados
que podem ser identificadas e exploradas: redundncia de cdigo, redundncia interpixel e
redundncia psicovisual, j estudadas e relatadas em alguns trabalhos [SAN01, AGOOO],

15
Na redundncia de cdigo, o processo de codificao determina um cdigo binario
com tamanho varivel. Aos valores que ocorrem mais freqentemente na imagem, atribudo
um cdigo menor (em nmero de bits), enquanto que os valores que so menos freqentes,
um cdigo maior atribudo.
A redundncia interpixel permite prever razoavelmente o valor de um pixel a partir
do valor do pixel de seus vizinhos, com isso a informao dos pixels relativamente
pequena. Esta correlao espacial resulta da relao estrutural ou geomtrica entre os objetos
na imagem.
A redundncia psicovisual ocorre pelo fato de algumas informaes terem menos
importncia do que outras informaes em um processamento visual normal. Essas
redundncias podem ser eliminadas sem comprometer a qualidade da imagem. Todavia, a
eliminao de redundncia psicovisual resultar numa perda de informao, o que leva a um
processo de compresso com perdas.
Dependendo da rea de aplicao, as informaes que se deseja preservar podem
ser de natureza objetiva ou subjetiva. No primeiro caso o mtodo de compresso deve
permitir a recuperao exata dos dados da imagem original. Diz-se, nesse caso, que o
processo reversvel, ou que se tem uma compresso sem perda (lossless). Caso contrrio,
ele chamado irreversvel, ento se tem uma compresso com perda (lossy), isto , ele no
permite a reconstruo exata dos dados originais.
Os recentes avanos das tcnicas de compresso com perdas incluem diferentes
mtodos tais como a transformada discreta cosseno (Discrete Cosine Transform-DCT),
quantizao vetorial, codificao wavelet, redes neurais e codificao fractal. Apesar desses
mtodos poderem realizar altas taxas de compresso (tipicamente 50:1 ou maior), eles no
permitem a reconstruo exata da verso original dos dados de entrada. Portanto, mtodos
16
com perdas no so aceitos para certas aplicaes como: imagens mdicas digitais, imagens
de satlite, dados ssmicos, imagens de alta fidelidade, arquivos executveis e assim por
diante. Tcnicas de compresso sem perdas, todavia, permitem a reconstruo perfeita dos
dados originais, mas as taxas de compresso so comparativamente baixas (de 2:1 a 4:1)
[SAN01].
3.1 Modelo Genrico de Compresso de Imagens

A idia geral utilizada para a compresso de imagens reorganizar os pixels de
maneira que a redundncia possa ser mais eficientemente descartada. A figura 3.1 apresenta
um modelo genrico de compresso de imagens. Nesta figura, a operao de mapeamento
converte os dados de entrada para uma outra forma organizada, removendo as redundncias.
Isso significa que os pixels so mapeados em outro domnio, no qual menos bits so
necessrios para codificar o dado mapeado em comparao com o nmero de bits necessrios
para codificar o dado de entrada original.
DADOS DA COEFICIENTES REPRESENTAO DADOS

IMAGEM DA IMAGEM BINARIA CODIFICADOS
x(i,k) y(jk) z(j) c(j)
1 1 1 1r
w MAPEADOR w QUANTIZADOR w CODIFICADOR w
Figura 3.1- Modelo genrico de compresso de imagens [MEL94],
A operao de quantizao converte os coeficientes em um nmero menor de
valores mais convenientes para a operao de codificao. O quantizador arredonda cada
valor mapeado para dentro de um pequeno conjunto de possveis valores. A operao de

17
codificao representa os dados fornecidos pelo quantizador em um conjunto mais conciso de
smbolos.
O modelo representado na figura 3.1 genrico e em muitos esquemas de
compresso o mapeador e/ou o quantizador so suprimidos. Em algumas tcnicas de
compresso, a efetiva reduo de informao se encontra no mapeador, porm, na maioria
dos casos, a compresso obtida nos processos de quantificao e/ou codificao.
A operao de mapeamento pode ou no ser reversvel, isto , permitir retornar aos
dados originais. J o quantizador sempre introduz erro, e aps a quantizao, os dados
originais no podem mais ser recuperados. O codificador sempre implementa uma operao
reversvel [MEL94],
3.2 Classificao da Compresso de Imagens

Uma classificao rgida dos vrios mtodos de compresso de imagens muito
difcil, uma vez que existe uma grande variedade de algoritmos e tcnicas de compresso que
utilizam princpios diferentes e que muitas vezes so utilizados simultaneamente. Vrias
classificaes j foram propostas, porm nenhuma delas pode ser considerada definitiva.
De um modo geral, til distinguir entre as tcnicas de compresso que so
reversveis, isto , permitem recuperar a imagem original sem perda de informao, e aquelas
que so irreversveis, onde a imagem recuperada possui menos informao que a imagem
original. Esta separao encontrada em quase todas as classificaes propostas na literatura,
porm as semelhanas terminam por a.
As tcnicas ditas reversveis so tambm chamadas de reduo de redundncia,
compresso sem perda ou sem rudo. As tcnicas irreversveis so conhecidas tambm por
reduo de entropia, compresso com perda ou com rudo [MEL94],

18
A Figura 3.2 apresenta uma taxionomia dos diversos mtodos e algoritmos de
compresso existentes [AGOOO], Destes mtodos, so abordados neste trabalho os
algoritmos Aritmtico, em conjunto com a transformada wavelet, Lempel-Ziv (GZIP) e
Huffman (LJPG), descritos mais adiante no item 3.5.
Mtodos de Compresso de Imagem, Vdeo e udio
Baseada em Modelos Baseada en >rmas de Onda
Domnio Domnio
Espaci Freqncia
Codificao
Aritmtica Modulao Baseado em Ftro
Delta
Codificao Fano
Lempd-Ziv (LZ) -PCM
Huffman
Codificao Run Quanti zao
Lenght(RLE) Outros
Vetorial
Outros
Outros -Baseado em
Transform ias
-Codificao
Predftiva Linear Fourier
-Modelagem AR, Karhunen-Loeve
ARMA <KL)
-Ajuste Hadamard
Pcrfinomiai
DCT
-Fractal
1Outros
-Baseado
em Objetol
-Outros
Figura 3.2 - Taxionomia dos mtodos de compresso.
3.3 Taxa de Compresso

A taxa de compresso a razo entre os tamanhos da imagem comprimida e da
imagem original. Esta taxa fornece uma medida de quanto menor ficou o arquivo aps a
aplicao da compresso.
Em geral, comum fornecer a taxa de compresso ou na forma de um vetor
absoluto ou em percentual. Por exemplo, a taxa de compresso para uma imagem de 200
19
Kbytes que aps ser comprimida ficou com 100 Kbytes de tamanho, de 0,5 ou 50%
[MEL94].
Diferentes formulas so utilizadas para o clculo das taxas de compresso. Alguns
clculos so feitos em bits/bytes. Esta medida de compresso fornece o nmero de bits
necessrios por pixel depois da compresso. O valor bits por pixel (bpp) permite comparar os
mtodos de compresso, permite calcular o tamanho da imagem comprimida e a taxa de
transmisso necessria para qualquer tamanho de imagem. Outros preferem utilizar razes,
por exemplo, 2:1. Isto significa que a quantidade de dados foi reduzida pela metade. Ser
utilizada neste trabalho a frmula (em porcentagem) definida por:
^ dados comprimidos^ !
100 (3.1)
dados originais
Isto significa que um arquivo que no muda de tamanho aps a compresso ter
uma taxa de compresso de 0% (zero por cento). Um arquivo comprimido pela metade do seu
tamanho original ter uma taxa de compresso de 50%. Na teoria, a taxa de compresso
mxima 100%. Isto s ocorrer se o tamanho do arquivo comprimido for igual a zero, o
qual somente ocorrer se o tamanho dos dados originais tambm for zero. Se o tamanho do
arquivo comprimido for maior do que o arquivo original teremos uma taxa de compresso
negativa.
3.4 Compresso com Perdas e Compresso sem Perdas

O processo de compresso de dados pode ser separado em dois tipos: os que levam
a perda de informao e os que mantm a informao intacta. O primeiro conduz s melhores
taxas de compresso, mas com o nus de perder parte da informao contida na imagem
original.
20
Muitas aplicaes exigem imagens com a melhor qualidade possvel (como em
reas mdicas, por exemplo) e, portanto, no podem existir perdas de informaes no
processo de compresso. Nestas aplicaes pode-se obter uma taxa de compresso tpica
variando de 2:1 at 10:1.
Todos os formatos de compresso que buscam eliminar apenas as redundncias de
codificao e interpixel so considerados sem perdas, uma vez que ambos os processos so
reversveis e, portanto, possvel se obter na sada do decodificador uma imagem idntica,
pixel a pixel, quando comparada com a imagem colocada na entrada do codificador. Desta
forma, pode-se perceber que o processo de compresso efetuado apenas pelos estgios de
mapeamento e codificao de smbolo, apresentados na Figura 3.1.
A compresso com perdas utilizada em aplicaes nas quais o menor tamanho
possvel da imagem requerido (como na internet, por exemplo). Nestes casos, o efeito da
perda de informao, que nem sempre visual, aceitvel. Com isso, pode-se obter taxas de
compresso maiores que 30:1, chegando a taxas de 10:1 at 20:1 com imagens virtualmente
indistinguveis das originais.
A perda de informao na compresso com perdas gerada pelo estgio de
quantizao na Figura 3.1, que busca a reduo da redundncia psicovisual. Como este
estgio irreversvel, a informao descartada no mais poder ser recuperada. [AGOOO],
3.5 Tipos de Codificao

Vrios mtodos e algoritmos de compresso de dados tm sido estudados e
propostos, mas alguns deles mereceram notvel destaque, uma vez que so usados em vrios
formatos de arquivos de imagem com compresso, alm de outros usos na compresso de
dados. Como os formatos de arquivo com compresso que sero abordados neste trabalho
21
compartilham o uso de alguns mtodos de compresso, optou-se por tratar destes mtodos
antes de entrar no escopo dos formatos de arquivos propriamente ditos.
E importante no confundir os algoritmos de compresso de imagem com os
formatos de arquivos que utilizam estes algoritmos [MUR96], O formato do arquivo descreve
apenas a organizao dos dados, indicando cabealhos, tabelas, etc., enquanto que os
algoritmos de compresso so os responsveis pela reduo na quantidade de dados
necessria para representar a informao. Cada formato de arquivo define onde e como a
informao comprimida ser colocada no arquivo a ser gerado.
Existe uma grande variedade de mtodos de compresso, mas apenas alguns mais
usados para a compresso de imagem e os que so de uso livre fazem parte do escopo deste
trabalho.
A seguir, comenta-se os mtodos de codificao utilizados pelos padres estudados
neste trabalho.
3.5.1 Codificao de Lempel-Ziv (LZ)
O LZ um dos algoritmos mais comuns usados para a compresso de imagens e
dados em geral. Ele foi criado em 1977 por Abram Lempel e Jakob Ziv e, desde ento,
muitas variantes deste algoritmo tm sido utilizadas em vrios formatos de arquivos. Este
mtodo de compresso visa reduzir a redundncia de codificao a partir do uso de
dicionrios de dados e no gera perdas.
Uma das verses mais conhecidas do LZ o chamado LZW, criado em 1984 por
Terry Welch. O LZW utilizado no formato de arquivo GIF. A verso do LZ abordada neste
item chamada de LZ77. Esta verso utiliza uma janela de dados mvel que ser chamada de
janela LZ77 para efetuar a compresso e a descompresso.

22
A seqncia dos dados comprimidos pode conter valores literais ou comandos para
expanso. Os comandos para expanso so pares comprimento/distncia que informam a
localizao, na janela LZ77, do primeiro dado de uma seqncia a ser expandida e quantos
dados contm esta seqncia.
No caso de compresso de textos, a cada passo um novo caracter comparado com
os caracteres que esto na janela LZ77. Se no existe nenhum caracter igual a este novo
caracter, ento a janela se desloca para incluir o novo caracter e este caracter colocado para
a sada.
Se o caracter j existe na janela LZ77, um novo caracter pego dos dados no
comprimidos. Ento feita uma nova comparao, mas agora para verificar se existem na
janela os dois caracteres. Este procedimento repetido at que a seqncia de caracteres
obtidos no exista na janela LZ77. Ento o ltimo caracter lido desconsiderado e um par
distncia/comprimento escrito na sada, informando a distncia que a seqncia de
caracteres est do incio da janela LZ77 e, por quantos caracteres composta esta seqncia.
Ento a janela deslocada pelo nmero de caracteres da seqncia para inclu-los e o
processo reiniciado com o prximo caracter.
Como pode ser percebido, para a compresso, so necessrias duas estruturas, uma
para varrer a janela LZ77 e outra para varrer os dados da entrada. Estas duas estruturas so
complementares e os seus dados so deslocados em conjunto.
No algoritmo LZ77, quanto maior o tamanho da janela LZ77 maior ser a taxa de
compresso obtida, mas tambm maior ser a complexidade do algoritmo, principalmente no
que diz respeito s operaes de procura nas janelas. Por isso, existe um compromisso entre
estes dois fatores que deve ser levado em considerao. Uma alternativa para o uso de
23
tamanhos maiores de janelas utilizar tabelas hash, que aumentam a velocidade da procura
[MIA99],
Para uma melhor compreenso do mtodo, apresenta-se a seguir um exemplo
ilustrativo, extrado do trabalho de [AGOOO]. O tamanho da janela LZ77 foi definida em 16
caracteres (aplicaes normais usam at 32K bytes). A seguinte frase ser comprimida no
exemplo: "A BANCA DA BIANCA BRANCA.". A tabela 3.1 apresenta todos os passos
do algoritmo LZ77 para a frase e seu contedo a cada passo. Na tabela 3.2 apresenta-se o
vetor sada para o mesmo exemplo.
Passo J a n e l a LZ77 Entrada

0 15
0 A BANCA DA BIANCA BRANCA.
4 A BAN CA DA BIANCA BRANCA.
7 A BANCA D A BIANCA BRANCA.
9 A BANCA DA B IANCA BRANCA.
10 A BANCA DA B I A N C A BRANCA.
11 BANCA DA BIANCA BRANCA.
12 ANCA DA BIANCA BRANCA.
13 CA DA BIANCA B RANA.
14 A DA BIANCA BRANCA.
15 BIANCA BRANCA .
16 BIANCA BRANCA.
Tabela 3 .1- Contedo da janela LZ77 e da Entrada durante a compresso.

24
Passo Salda
0 A
1 A
2 A B
3 A BA
4 A BAN
5 A BANC
6 A BANCX10: 2 >
7 A BANCClO:2>D
8 A BANCClO:2>D<13:2>
9 A BANCClO:2>D<13:2>B
10 A BANCClO:2>DC13:2>BI
11 A BANCClO:2>DC13:2>BIC6:5>
12 A BANCClO:2>DC13:2>BIC6:5>
13 A BANCClO:2>DC13:2>BIC6:5>C7:2>
14 A BANCClO:2>DC13:2>BIC6:5>C7:2>R
15 A BANCClO:2>DC13:2>BIC6:5>C7:2>RC7:4>
16 A BANCClO:2>DC13:2>BIC6:5>c7:2>RC7:4>.
Tabela 3.2 - Contedo da sada a cada passo da compresso.
O processo de descompresso substancialmente mais simples, porque apenas
com a janela LZ77 e com os dados comprimidos possvel efetuar a descompresso dos
dados. Caso o dado lido seja um valor literal, ele simplesmente escrito na janela LZ77 e na
sada. Caso o dado seja um par distncia/comprimento, o algoritmo de descompresso copia
da janela LZ77 o nmero de caracteres definido pelo campo comprimento, onde o primeiro
caracter da seqncia est na distncia do incio da janela definida pelo campo distncia.
Ento a janela deslocada para agregar os caracteres copiados e estes dados so colocados na
sada. Caso a janela tenha excedido a sua capacidade, os dados do incio da janela so
removidos. A tabela 3.3 apresenta o processo de descompresso para o exemplo [AGOOO],

25
Passo Saida Entrada
0 15
0 A BANC<10:2>D<13:2>BI<6:5>E<7:2>R<7:4>.
1 A BANC<10:2>D<13:2>BI<6:5><7:2>R<7:4>.
A BMJC<10:2>D<13:2>BI<6:5>E<7:2>R<7:4>.
A BANC<10:2>D<13:2>BI<6:5><7:2>R<7:4>.
A BAN C < 1 0 : 2 > D < 1 3 : 2 > B I < 6 : 5 > E < 7 : 2 > R < 7 : 4 > .
5 A BANC < 1 0 : 2 > D < 1 3 : 2 > B I < 6 : 5 > < 7 : 2 > R < 7 : 4 > .
6 A BANCA D < 1 3 : 2 > B I < 6 : 5 > < 7 : 2 > R < 7 : 4 > .
7 A BANCA D<13:2>BI<6:5><7:2>R<7:4>.
8 A BANCA DA B I < 6 : 5 > < 7 : 2 > R < 7 : 4 > .
9 A BANCA DA B I < 6 : 5 > E < 7 : 2 > R < 7 : 4 > .
10 A BANCA DA BI<<6 : 5 > < 7 : 2 > R < 7 : 4 > .
11 A BANCA DA BIANCA < 7 : 2 > R < 7 : 4 > .
12 A B ANCA DA BIANCA <7 : 2 > R < 7 : 4 > .
13 A BAN CA DA BIANCA B R < 7 : 4 > .
14 A BANC A DA BIANCA E BP <7 : 4 > .
15 A BANCA DA BIANCA BRANCA
Tabela 3.3 - Descompresso dos dados do exemplo por LZ77.
3.5.2 Codificao de Huffman
A codificao de Huffman a tcnica de compresso de dados mais popular para a
remoo de redundncia de codificao e o mais eficiente mtodo para a codificao de
comprimento fixo para comprimento varivel [JAI89],
A idia atribuir cdigos de comprimentos variveis para cada smbolo. O menor
cdigo atribudo ao smbolo de maior probabilidade de ocorrncia na imagem e assim
sucessivamente, at que o maior cdigo seja atribudo ao smbolo de menor probabilidade de
ocorrncia. O problema que, para tomar possvel a decodificao sem a insero de tabelas
de identificao de smbolos, as seqncias de bits j atribudas no podem ser repetidas no

26
incio das novas seqncias. Com isso, o comprimento dos cdigos tende a crescer
rapidamente.
A codificao de Huffman torna-se interessante para aplicaes onde existe um
desequilbrio grande entre as probabilidades de ocorrncia dos smbolos. Para aplicaes com
probabilidades aproximadamente iguais, o tamanho do arquivo tende a ser maior que o
original. Na prtica, a maioria das aplicaes se encaixa no primeiro grupo, com
probabilidades de ocorrncia bem diferentes.
O primeiro passo para implementar a codificao de Huffman a criao de uma
tabela com os smbolos presentes no cdigo e suas probabilidades de ocorrncia. A partir
desta tabela gera-se uma estrutura de rvore, construda a partir de uma seqncia de
operaes onde as duas menores probabilidades so unidas em um n para formar dois ramos
da rvore. Cada n j construdo tratado como um simples smbolo, com a probabilidade
sendo a soma de todas as probabilidades dos smbolos combinados neste n. Ento,
arbitrariamente, atribui-se 0 para um dos ramos e 1 para o outro [PEN92], Considerando esta
probabilidade combinada, novamente as duas menores probabilidades so unidas, formando
um novo n e uma nova probabilidade combinada. Este processo se repete at que todos os
smbolos estejam contidos na rvore [AGOOO], Um exemplo de codificao utilizando
Huffman pode ser visto no item 3.5.6 (Codificao Lossless JPEG com Huffman).
3.5.3 Codificao Aritmtica
Conforme explanado em [SAN01], os mtodos de codificao de tamanho varivel
(Variable Length Coding - VLC) mais utilizados na codificao dos coeficientes wavelets
so a codificao de Huffman e a codificao aritmtica. A codificao de Huffman mais
rpida enquanto que a codificao aritmtica permite maior compresso. A primeira
prefervel quando os recursos de hardware so limitados e o tempo de

27
codificao/decodificao o objetivo principal. A codificao aritmtica um pouco mais
lenta do que a codificao de Huffman, mas muito mais verstil e eficiente.
No cdigo de Huffman, o nmero de bits necessrios para codificar uma
informao tem que ser um nmero inteiro e isso algumas vezes pode ser um problema. Por
exemplo, se a probabilidade de ocorrncia de um caracter - , o melhor nmero de bits para
codificar este caracter de aproximadamente 1,58 bits. Com isso, o cdigo de Huffman
precisaria atribuir dois bits para o cdigo, conduzindo para uma mensagem comprimida
maior do que teoricamente possvel de acordo com o clculo da entropia. Este problema
aumenta quando a probabilidade de um caracter muito alta.
Como o cdigo de Huffman usa um nmero inteiro (k) de bits para cada smbolo,
isto implica que nunca k ser menor que 1. Numa imagem com duas cores (1 bit por pixel),
como as usadas em fax, a compresso se torna impossvel. A soluo seria agrupar os bits em
pacotes e ento aplicar Huffman, porm isso impede o cdigo de Huffman de ser um
compressor universal.
A codificao aritmtica substitui os smbolos de entrada com um cdigo
especfico. Um fluxo de bits de smbolos de entrada codificado em um nico nmero de
ponto flutuante maior ou igual a zero e menor do que 1. Este nmero pode ser unicamente
decodificado para extrair os smbolos originais.
Existem dois pontos fundamentais na codificao aritmtica: a probabilidade de
um smbolo e o limite de seu intervalo na codificao. As probabilidades dos smbolos de
origem determinam a eficincia da compresso. Eles tambm determinam o limite do
intervalo dos smbolos de origem para o processo de codificao. Estes limites de intervalo
esto contidos dentro de um intervalo de 0 a 1. O limite do intervalo para o processo de
codificao determina a sada comprimida.

28
Em [SANOl], o processo de codificao de um codificador aritmtico foi
explicado atravs do seguinte exemplo: supondo que os smbolos de entrada so {a, b,c,d}e
a probabilidade destes smbolos so (0.1, 0.4, 0.2, 0.3 }, respectivamente. Ento baseado em
suas probabilidades, o intervalo [0, 1) pode ser dividido como 4 subintervalos: [0, 0.1), [0.1,
0.5), [0.5, 0.7) e [0.7, 1), onde [x, y) denota um intervalo fechado a esquerda e aberto a
direita, os quais inclui x mas exclui y. A informao acima pode ser resumida na tabela 3.4,
abaixo:
Smbolos a b c d
Probabilidades 0.1 0.4 0.2 0.3
Intervalo Inicial [0, 0.1) [0.1,0.5) [0.5,0.7) [0.7,1)
Tabela 3.4 - Representao dos smbolos e seus respectivos intervalos iniciais.
Imagine transmitindo a mensagem "cadacdb". Inicialmente, tanto o codificador
quanto o decodificador conhecem que o intervalo [0, 1). Aps 1er o primeiro smbolo, c, da
mensagem sabemos que o seu intervalo de codificao [0.5, 0.7). Aps este smbolo ter
sido processado, o tamanho do modelo modificado para o intervalo [0.5, 0.7), como
mostrado na figura 3.3, j que o limite do segundo smbolo, a, da mensagem [0, 0.1), ele
codificado tomando o primeiro dcimo do novo tamanho do modelo [0.5, 0.7) como um novo
intervalo [0.5, 0.52). Similarmente, codificando o terceiro smbolo, d, ns temos um novo
intervalo [0.514, 0.52). Depois codificando o quarto smbolo, a, o novo intervalo [0.514,
0.5146). E assim por diante at que aps a codificao do ltimo smbolo, b, tem-se o
intervalo [0.5143876, 0.514402). A sada desta mensagem pode ser qualquer nmero que
esteja dentro deste ltimo intervalo. Para um melhor entendimento, o processo descrito acima
est resumido na tabela 3.5.

29
Novo caracter Limite inferior Limite superior

0.0 1.0
c 0.5 0.7
a 0.5 0.52
d 0.514 0.52
a 0.514 0.5146
c 0.5143 0.51442
d 0.514384 0.51442
b 0.5143876 0.514402
Tabela 3.5- Processo de codificao do exemplo de codificao aritmtica.
Visualmente, pode-se representar o processo acima atravs da figura abaixo:

0.7 0.52 /051442-] - 0.51442 0.514402
Sada
oJ 0.5 J
0.514 J 0.514 -I 0.5143 0.5143876
Entrada c
Figura 3 .3 - Representao do processo de codificao aritmtica.
Dado este esquema de codificao, relativamente fcil ver como o processo de
decodificao funciona. Inicialmente, o decodificador verifica em qual intervalo o primeiro
smbolo da mensagem se encontra. Como 0.5143876 est dentro do intervalo [0.5, 0.7) o
primeiro caracter da mensagem dever ser o c. Como o limite inferior e superior de c
conhecido, que [0.5, 0.7), reverte-se o processo que o gerou. Primeiro, subtrai-se pelo limite
inferior de c que implicar em 0.0143876. Ento se faz a diviso pelo tamanho da largura do
intervalo de c, ou seja, 0.2. Isto resulta em 0,071938. Pode-se verificar que o prximo
smbolo ser o a, pois 0,071938 se encontra no intervalo [0, 0.1). Em seguida tem-se o valor
30
0,71938, que se encontra no intervalo [0.7, 1) resultando no smbolo d. E assim por diante,
todos os smbolos da mensagem inicial sero recuperados a partir da sada 0,5143876 (tabela
3.6).
Nmero Codificado Smbolo de Sada Menor Maior Tam. Intervalo

0.5143876 c 0.5 0.7 0.2
0,071938 a 0.0 0.1 0.1
0,71938 d 0.7 1.0 0.3
0,0646 a 0.0 0.1 0.1
0,646 c 0.5 0.7 0.2
0,73 d 0.7 1.0 0.3
0,1 b 0.1 0.5 0.4
0.0
Tabela 3.6 - Processo de decodificao do exemplo de codificao aritmtica.
A ordem do modelo, refere-se ao nmero de smbolos anteriores que so usados
para calcular a probabilidade de cada smbolo de entrada. Neste exemplo, foi utilizado o
modelo de ordem-0 que calcula a probabilidade de cada smbolo independentemente de
qualquer smbolo anterior.
3.5.4 Codificao Preditiva
As tcnicas de compresso preditiva operam baseadas sobre um modelo estatstico
da imagem. O modelo est embutido em algo conhecido como preditor. O preditor estima o
prximo valor do pixel em uma determinada ordem, baseada nos pixels que antecederam
aquele. O preditor pode tambm ser bidimensional para obter vantagem da correlao
bidimensional inerente s imagens.
Por exemplo, um modelo muito simples prediz que o prximo pixel ter o mesmo
valor do pixel prvio. Este modelo no uma m suposio, uma vez que os valores dos
pixels variam lentamente atravs de imagens em tom contnuo. A cada predio gerada, a
diferena entre o pixel atual e o pixel predito calculada. O desvio padro do histograma das
31
diferenas , em geral, menor que o da imagem original, refletindo que a correlao foi
removida.
Assim, pode-se utilizar menos bits para codificar as diferenas do que o nmero de
bits utilizado para representar um pixel. Quanto menor o nmero de bits utilizados nesta
quantizao, maior o grau de perda de fidelidade da imagem, porm maior a taxa de
compresso.
Os compressores preditivos podem ser adaptveis, fazendo o quantizador e/ou o
preditor adaptveis. Esta capacidade de adaptao pode ser utilizada para conseguir maior
compresso ou maior fidelidade [MEL94],
3.5.5 Codificao por Transformada
De acordo com [SAN01], a codificao por transformada envolve uma
transformao linear do sinal de entrada e a quantizao dos coeficientes, isto , do resultado
da transformao. O propsito da transformao mudar a organizao dos pixels.
Na codificao por transformada, geralmente divide-se uma dada imagem de
tamanho NxN em um nmero de sub-imagens de tamanho nxn, n<N, que so codificadas
independentemente. A transformao dita unidimensional quando a sub-imagem de
tamanho Ixn e bidimensional quando a imagem possui tamanho nxn.
importante ressaltar que a transformao em si no realiza a compresso. A
compresso conseguida pela quantizao e pela posterior compresso sem perda (ver
modelo genrico de compresso de imagens no item 3.1). A funo da operao de
transformao a de obter coeficientes mais independentes e orden-los (em termos de suas
varincias) de maneira que eles possam ser mais eficientemente quantizados.
A escolha da transformada no determinada apenas pela correlao entre os
coeficientes obtidos. Como a operao de transformao requer memria e tempo

32
computacional para sua implementao, esses parmetros tambm so importantes para tal
escolha.
Do ponto de vista da correlao entre os coeficientes, o problema determinar a
matriz de transformao descorrelacional tima A, a matriz de transformao inversa (ou de
reconstruo) B e o quantizador timo, de modo que a distoro media quadrtica total seja
minimizada. A soluo do problema tal que a matriz A a transformada Karhunen-Love
(KL) da entrada, a matriz B funo da matriz inversa de A e o quantizador o quantizador
Lloyd-Max. Com tal quantizador, B=A* T . A transformada KL, tambm chamada de
Hotteling ou componente principal, apesar de ser tima, difcil de computar e no possui
um algoritmo rpido para sua resoluo. Ela utilizada freqentemente como parmetro de
referncia para avaliar o desempenho de outras transformadas. Diversas transformadas so
utilizadas na compresso de imagens e entre elas podemos ressaltar a transformada de
Fourier, cosseno, seno, Walsh-Hadamard, Haar e Slant. As trs primeiras so baseadas em
senoides e as outras em ondas quadradas, que, em termos computacionais, so mais rpidas.
Outros quantizadores mais simples, que no Lloyd-Max, tambm so utilizados na prtica
[JAI89, MEL94].
O processo de compresso para transformadas wavelet est ilustrado na figura 3 .4.
Nesta figura, foram acrescentadas duas novas etapas que no esto sendo consideradas neste
trabalho e que tm a funo de reconstruir as imagens de tomografia a partir dos senogramas,
permitindo assim a sua anlise.
As informaes fornecidas pelo tomgrafo ao computador constitui de valores
inteiros no formato binrio. Estes valores variam de 0 a 65.535, ou seja, 16 bits no
sinalizados. Dessa maneira, um senograma de 768 linhas por 90 colunas armazenado no
computador usando 138.240 bytes.

33
Figura 3.4 - Esquema de compresso usado nos experimentos.
Neste trabalho sero considerados apenas as transformadas wavelet de inteiros, isto
, a transformada S e S+P, as quais possuem a propriedade de preservao de preciso (PPP),
comentada com maiores detalhes no item 1.3 do apndice 1. Neste trabalho foram utilizadas
as transformadas wavelet bidimensionais implementadas por [SAN01],
As imagens foram decompostas em 5 nveis de resoluo, tanto nas linhas quanto
nas colunas. Em cada nvel de decomposio, o nmero de coeficientes so reduzidos pela
metade, pelo fato de que apenas os coeficientes passa baixa sero usados na aplicao da
transformada no prximo nvel de resoluo. Como as imagens possuem 90 linhas, 5 nveis
de decomposio so suficientes para reduzir para apenas 3 pixels, quando a transformada
bidimensional aplicada nas colunas da imagem. Na fase de codificao, foi utilizada a
codificao aritmtica.
3.5.6 Codificao Lossless JPEG com Huffman
Alguns trabalhos descrevem a codificao Lossless JPEG [HUA94, NET98], O
padro de compresso para imagens paradas ISO JPEG popularmente conhecido como uma
tcnica de compresso baseada em transformada discreta cosseno (DCT - Discrete Cosine
Transform). Entretanto, o modo de operao sem perdas no utiliza a DCT, mas sim uma
codificao por predio. A tcnica de compresso Lossless JPEG utiliza a forma de

34
modulao de cdigo de pulso discreto (DPCM - Discrete Pulse Code Modulation) [PEN93],
Considere uma imagem fonte com duas dimenses. Cada amostra um pixel contendo ou
trs bytes representando os nveis vermelho, verde ou azul (RGB) para uma imagem colorida,
ou um nico byte de uma imagem em escalas de cinza. Na tcnica Lossless JPEG cada pixel
especificado como um inteiro variando de 2 a 16 bits de preciso. O parmetro ponto de
preciso, Pt, pode ser usado para reduzir o nvel de quantizao da imagem fonte. Se Pt no
for zero, cada amostra de entrada deslocada direita por Pt bits.
O padro JPEG define oito valores de seleo de predio (PSV - Prediction
Selection Values), os quais so especificados na tabela 3.7. O PSV 0 (zero) reservado para
codificao diferencial no modo progressivo hierrquico (no utilizado neste codificador
lossless). Para cada pixel, P^ y , uma combinao linear dos pixels vizinhos esquerdo (Px,y-i),
superior (Px-i,y) e superior esquerdo (Px-i,y-i), so utilizados para calcular o preditor de P^y.
Os PSVs 1, 2 e 3 so preditores de uma dimenso, ou seja, usam somente um pixel vizinho.
Os PSVs 4, 5, 6 e 7 so bidimensionais, por utilizarem dois ou mais pixels vizinhos.
PSVs Preditores
0 sem predio (codificao diferencial)
1 Px,y-1
2 Px-l,y
3 Px-l,y-l
4 Px,y-1 + Px-l,y ~ Px-l,y-l
5 Px,y-l+(Px-l,y-Px-l,y-l)/2
6 Px-l,y + (Px,y-l-Px-l,y-l)/2
7 (Px,y-l+Px-l,y)/2
Tabela 3.7 - Preditores para o Lossless JPEG

35
A primeira linha e coluna da imagem so tratadas de forma especial. O PSV 1
utilizado para a primeira linha de amostras e o PSV 2 utilizado para a primeira coluna. Para
P-Pt-i
o pixel no canto superior esquerdo da imagem, o preditor 2 utilizado, onde P e o
nmero de bits da amostra. O preditor calculado subtrado do valor do pixel e a diferena
codificada por Huffman ou Codificao de entropia Aritmtica. No caso deste codificador,
utilizado a codificao de Huffman. O modelo de entropia de Huffman particiona as
diferenas em 16 diferentes categorias. A cada uma destas categorias atribudo um cdigo
de Huffman usando ou a tabela padro de Huffman definida na norma ISO/IEC DIS 10918-1,
ou uma tabela customizada para a imagem. As diferentes categorias so mostradas na tabela
3.8, abaixo:
Categoria Valores
0 0
1 -1,1
2 -3,-2, 2-, 3
3 -7...-4,4...7
4 -15...-8, 8...15
5 -31...-16,16...31
6 -63...-32, 32...63
7 -127...-64, 64... 127
8 -255...-128, 128...255
9 -511...-256, 256...511
10 -1023...-512, 512...1023
11 -2047...-1024,1024...2047
12 -4095...2048, 2048...4095
13 -8191...-4096, 4096...8191
14 -16383...-8192, 8192...16383
15 -32767...-16384, 16384...32767
Tabela 3.8 - Tabela de categorias e valores de diferena

36
Para qualquer valor de diferena, uma seqncia de bits adicionais so anexados no
cdigo de Huffman para identificar unicamente qual a diferena naquela categoria atualmente
ocorrida. A quantidade de bits dada pela prpria categoria, com zero sendo um valor
permitido. As regras de como os bits adicionais so especificados esto a seguir. Se a
diferena positiva, anexa-se a quantidade de bits, representada pela categoria, de mais baixa
ordem da diferena. Se a diferena negativa, subtrai-se um da diferena e anexa-se a
quantidade de bits, representada pela categoria, de mais baixa ordem do valor resultante.
O exemplo a seguir ilustra o processo de codificao. A imagem possui 2 linhas
por 3 colunas em escalas de cinza (8 bits). Foi utilizado o PSV 7 ((Px,y-i + Px-i,y) / 2) como
preditor e a tabela de codificao Huffman, definida no padro JPEG, para as diferentes
categorias. Pt foi configurado como zero. O preditor para o pixel do canto superior esquerdo
P-Pt i
igual a 128 (aplicando-se 2 ).
Valores dos pixels da imagem

120 100 100
80 90 100
Diferena calculada (pixel - preditor)

-8 -20 0
-40 0 5
Categoria e respectivos bits de Huffman

4 (101) 5 (110) 0
6 (1110) 0 3 (100)
Bits adicionais
0111 01011 0
010111 0 101
37
Seqncia de bits de sada (espaos no fazem parte)

101 0111 110 01011 0 1110 010111 0 100 101
Para a decodificar a seqncia de bits acima, primeiramente extrado o cdigo de
Huffman 101, onde a decodificao de Huffman traz o smbolo de categoria 4. A seguir, os 4
bits adicionais, Olli, so extrados da seqncia. O bit inicial 0 significa que a diferena
entre o pixel e o preditor um nmero negativo, portanto o valor da diferena 1 somado ao

P-Pt i
binrio 0111. Adicionando ao valor reconstrudo, -8, o preditor 128 (2 ), o valor do pixel
120 recuperado. Este processo inverso de codificao repetido at que a seqncia inteira
dos bits seja decodificada.

38
4. Metodologia
4.1 Introduo
Neste captulo, ser descrita a metodologia utilizada na execuo das simulaes
realizadas neste trabalho. Foram estudados e avaliados os mtodos de compresso de dados
propostos, sendo aplicados em imagens e projees de tomografia computadorizada por
raios-X (chamados senogramas). O objetivo investigar o comportamento de cada um desses
mtodos sobre estas imagens e senogramas, assinalando suas vantagens e desvantagens, em
termos de taxa de compresso.
Foram comparados alguns dos mtodos mais conhecidos em compresso: GZIP
(Gnu ZIP), utilizado largamente para compresso de dados e LJPG (Lossless JPEG),
utilizado especificamente para compresso de imagens; e dois outros mtodos de recente
utilizao em compresso de imagens: Transformada S (Wavelet de Haar) e Transformada
S+P (Said e Pearlman), abordados em [SANOl],
Alm da utilizao de senogramas reais, gerados por tomgrafo industrial, foram
utilizados tambm senogramas construdos por um programa simulador de projees,
conforme ilustra a figura 4.1. Este programa simulador de projees foi implementado por
Medeiros [MED01], Os senogramas foram gerados a partir de imagens mdicas, com 256
colunas por 256 linhas e 8 bpp. O programa simulador de projees efetua uma varredura de
180 graus na imagem com um passo de 2 graus, gerando, desta forma, senogramas
compostos de 256 linhas por 90 colunas e 16 bpp. Tanto as informaes fornecidas pelo
tomgrafo quanto as gerados pelo programa simulador de projees so constitudas de
valores inteiros no formato binrio. Estes valores variam de 0 a 65.535, ou seja, 16 bits no
sinalizados.
39
Programa
Simulador
de Projees
Figura 4 . 1 - Esquema de gerao de senogramas pelo programa simulador de projees.
As imagens e senogramas foram submetidos aos mtodos de compresso,
conforme ilustra a figura 4.2.
Transform ada
Codifica dor Senogf2ffiajmag.eaa
Wavelet
Direta
Aritmtico > comptiffido
Transformadas W (S / S+P)
Codificador
LZ77
>
Gzn?
Codificador
Huffman
i JPG
> comprim o
Figura 4.2 - Mtodos de compresso utilizados para as imagens e senogramas.
Durante a realizao dos experimentos, verificou-se que os senogramas reais
apresentavam um elevado grau de variao nos valores dos pixels, quando comparados aos
senogramas gerados pelo programa simulador. Atravs da anlise destes valores, constatou-se
que esta variao comporta-se como rudos distribudos de forma aleatria entre os pixels.
Face a estas constataes, optou-se pela continuidade dos estudos considerando estas
caractersticas dos senogramas reais. Foi utilizada a funo randQ, em linguagem C, para
gerar o rudo uniforme de mdia nula, a ser somado a cada pixel das imagens e senogramas,
com o objetivo de se estudar o comportamento dos diversos mtodos de compresso

40
utilizados nos experimentos. Os rudos foram inseridos de forma percentual, conforme a
frmula a seguir:
%rudo = "P^toido (41)

AmplitudeSinal
No clculo do %rudo, o valor do ruido, que pode resultar num valor positivo ou
negativo, somado ao pixel. Caso o valor resultante (valor do pixel + valor do rudo) seja
maior que 65.535 ou menor que 0, o valor do rudo ser rebatido, ou seja, ter o sinal
invertido para ser somado ao pixel.
Alm do percentual de rudo, foi includa uma outra medida relacionada a rudo,
que a relao sinal / rudo (SR), calculada pela seguinte frmula:
SR = O"
fruido)'
Para comparao entre os mtodos de compresso, foi utilizada a taxa de
compresso, que a razo entre o tamanho da imagem comprimida e o tamanho da imagem
original. Est comentada em mais detalhes no item 3 .3, sendo a frmula utilizada a seguinte:
r
TamanhoOriginal - TamanhoFinal ^
= 100 (4.3)
TamanhoOriginal
4.2 Imagens e Senogramas Utilizados

Foram utilizados 3 senogramas reais, gerados no tomgrafo industrial do
laboratrio da UFPR. Os senogramas so compostos de 768 colunas por 90 linhas e 16 bpp,
totalizando 138.240 bytes. Estes senogramas foram designados por "denteOl", dente02" e
"dente03" sendo todos eles tomografia computadorizada de um dente humano. A partir
desses senogramas, foram reconstrudas as imagens "denteOl", composta de 256 colunas por
41
256 linhas e 8bpp; "dente02", composta de 176 colunas por 176 linhas e 8bpp e "dente03"
composta de 112 colunas por 112 linhas e 8bpp. Os senogramas e suas respectivas imagens
so apresentados no apndice 4.
Utilizou-se uma imagem gerada artificialmente, denominada "Phantom", mostrada
na figura 4.3. Essa imagem semelhante a tomografia de uma cabea [JAI89]. Esta imagem
foi gerada por um programa, utilizado em [MED01], Este programa tambm produz o
respectivo senograma, mostrada na figura 4.4. Este programa tambm permite produzir
senogramas de qualquer outra imagem, os quais sero produzidos e utilizados neste trabalho.
Figura 4.3 - Imagem "Phantom" gerada por software.
Figura 4.4 - Senograma do "Phantom" gerada por software.
Selecionadas ainda outras 5 imagens para realizao dos testes, as quais foram
obtidas de repositrios de dados de universidades, j no formato utilizado neste trabalho, ou

42
seja, com 256 colunas por 256 linhas e 8 bpp, regeradas a partir de uma projeo de TC
(Tomografia Computadorizada), conforme relacionadas a seguir:
1. Imagem "Abdom", tomografia de um abdome;
2. Imagem "Brain", tomografia de um crebro;
3. Imagem "Hernia", tomografia de uma hrnia da coluna;
4. Imagem "Head", tomografia da cabea;
5. Imagem "Trax", tomografia de um trax.
Utilizando o programa gerador de projees, foi gerado um senograma para cada
uma destas imagens, os quais tambm foram utilizados nos experimentos.
Foram geradas outras dezessete imagens da seguinte forma: sete imagens a partir
da imagem "Abdom" com os percentuais de rudo (%rudo) 2%, 10%, 20%, 25%, 33%, 50%
e 100%; e outras dez imagens a partir do senograma "Abdom" com os percentuais de rudo
0,1%, 0,2%, 1%, 2%, 10%, 20%, 25%, 33%, 50% e 100%. Portanto, foram utilizadas nos
experimentos deste trabalho um total de trinta e duas imagens e/ou senogramas. Estas
imagens e senogramas estavam inicialmente no formato BMP sem o uso da compactao
RLE, padro deste formato.
Para a utilizao na compresso com os mtodos transformada S, transformada
S+P e GZIP foi necessrio que as imagens e senogramas estivessem no formato binrio
(RAW), portanto, tiveram os cabealhos do formato BMP removidos, permanecendo
somente os bytes de dados. As imagens permaneceram com 256 colunas (largura) por 256
linhas (altura) e 8 bits por pixel, totalizando 65.536 bytes e os senogramas com 256 colunas
(largura) por 90 linhas (altura) e 16 bits por pixel, totalizando 46.080 bytes.
O mtodo de compresso LJPG, utilizado nestes experimentos, trabalha somente
com imagens no formato PGM. Portanto, para possibilitar a utilizao do mtodo, as imagens
43
do formato binrio foram transformadas para este formato com a incluso de um cabealho
prprio com tamanho de 14 bytes.
As imagens e senogramas foram submetidos aos mtodos de compresso propostos
neste trabalho, sendo os resultados, em forma de tabelas, grficos e comentrios,
apresentados no prximo captulo. Todas as imagens e senogramas utilizados neste trabalho
esto relacionadas no apndice 4.
4.3 Mtodos de Compresso

Foram utilizadas as transformadas wavelet bidimensionais [SAN01], escritas em
linguagem C (Borland C++ verso 3.1) no sistema operacional DOS e, com pequenas
modificaes, tambm implementadas no sistema operacional LINUX COREL / OS.
Constatou-se que os resultados obtidos com a compactao nos dois sistemas foram
idnticos. O programa permite a entrada de diferentes tamanhos de imagens. Permite tambm
optar pelo nmero de nveis de decomposio desejado. Foram desenvolvidos dois programas
para serem utilizados conforme a organizao da imagem ou senograma, ou seja, um
programa para a unidade de informao de 1 byte (8 bpp) e outro para 2 bytes (16 bpp).
Para o clculo da transformada S e transformada S+P, primeiramente a
transformada aplicada levando-se em considerao cada informao na sua forma original,
ou seja, 8 bits para as imagens e 16 bits para os senogramas. Aps a aplicao da
transformada, o nmero de bits da informao se mantm o mesmo, em virtude da PPP,
comentada no item 1.3 do apndice 1. Aps a aplicao da transformada, foi utilizada a
codificao Aritmtica, ao invs da codificao de Hufman, por ter apresentado melhor
resultado em todas as imagens e senogramas utilizados, conforme constatado em [SAN01],
Os testes de compresso com o GZIP foram realizados no sistema operacional
LINUX COREL/OS. As imagens e senogramas submetidos compresso possuam somente

os bytes de dados, ou seja, sem nenhum tipo de cabealho especfico. O GZIP trabalha com o
codificador LZ77, considerando a unidade de informao o byte, no importando se a
imagem ou senograma sejam organizados em 8 ou 16 bpp.
Os testes de compresso com o LJPG foram realizadas no sistema operacional
LINUX COREL / OS. O software utilizado foi o LJPG [HUA94], desenvolvido para uso
experimental e de distribuio livre. Neste caso, as imagens e senogramas submetidos
compresso, por exigncia do software, necessitavam possuir um cabealho no formato PGM
(Portable GrayMap), tendo um acrscimo de 14 bytes. O software foi desenvolvido para
comprimir arquivos com 8 bpp. Nos testes deste trabalho, utiliza-se senogramas com 256
colunas por 90 linhas e 16 bpp, totalizando 46.080 bytes. Para possibilitar a compresso
destes senogramas com o mtodo LJPG, foi utilizado o artifcio de gerar o cabealho do
senograma com as informaes de 512 colunas por 90 linhas e 8 bpp, totalizando os mesmos
46.080 bytes, portanto, sem alterar o tamanho do senograma.
Ressalta-se que este fato do programa codificador interpretar um pixel de 16 bits
como sendo 2 pixels de 8 bits deve afetar o desempenho deste mtodo de compresso.
45
5. Resultados
5.1 Compresso de Senogramas

Os 3 senogramas relativos aos dentes, obtidos no tomgrafo industrial do
LACTEC na UFPR, foram comprimidos com os mtodos de compresso Transformada S,
Transformada S+P, GZIP e LJPG. Os resultados, com as taxas de compresso, esto
representadas na tabela 5.1. Estes resultados esto de acordo com os resultados apresentados
no trabalho de [SAN01], porm tem-se que destacar a abordagem utilizada no levantamento
destes dados. Os senogramas possuem 16 bits por pixel (bpp). Foi utilizada a tcnica de
separao do senograma em dois outros arquivos, o primeiro contendo a informao da parte
alta do pixel original, ficando com 8 bits por pixel e o segundo contendo a informao da
parte baixa, tambm ficando com 8 bits por pixel. Desta forma, melhores resultados foram
obtidos com a transformada wavelet de inteiros nos casos com a transformada S+P
computando com 16 bits e S computando com 8 bits, assim como os resultados obtidos com
o LJPG (lossless JPG) e o GZIP.
A coluna Entropia, a qual faz parte da tabela 5.1, corresponde ao tamanho do
arquivo comprimido que pode ser obtido levando em considerao apenas a redundncia de
cdigo baseado no clculo da entropia de primeira ordem [SAN01], A coluna Aritmtica
corresponde somente a aplicao da codificao aritmtica.
Senograma Entropia Aritmtica Transf. S Transf. S+P GZIP UPG

DenteOI 8% 8% 31% 27% 9% 32%
Dente02 8% 8% 33% 29% 9% 33%
Dente03 7% 8% 33% 28% 9% 33%
Mdia 8% 8% 32% 28% 9% 33%
D. Padro 1% 0% 1% 1% 0% 1%
Tabela 5.1 - Taxa de compresso de senogramas reais, separados parte alta e parte baixa.
46
35%
:; i!J- ' """\,:;!1
'n'F~-_ ..
r - o, !~tl: . r-
30;' - 0 """
25 ~'o .
illr.} :'m::-'" .
i~
r- i!f;f] -
. ' ,' c;
o

[ 20% .
~!r1~~
"--'" i~ -"' =
[J Denl cO I
,~
Denl c02
8
E
15%
;h::.,,,,,. c- ~
O Denl c03
." :c. '::::,,,, ": O Mdia
-
... IO ~.
r
'
_r-
,
rr
"'-
r- -
50/. t- '- ..
,~ ~
I-'-
0%
Entropia Aritmtica T ransf. S Transf. S+P GZIP LJPG
Mtodos de Compresslo
Figura 5.1 - Grfico comparativo da compresso dos senogramas reais, separados em 8 bits.
Pode-se observar, no grfico da Figura 5.1, que as taxas de compresso das
transformadas S so superiores s taxas geradas pelo mtodo GZIP. O mtodo LJPG, mesmo
operando sobre um conjunto de 8 bits, neste caso, apresentou taxas compatveis com as
apresentadas pela transformada S.
Um novo levantamento foi realizado considerando outra abordagem, que a
utilizada neste trabalho. Os senogramas foram utilizados considerando o pixel com 16 bits,
Portanto, os 3 senogramas relativos aos dentes, obtidos no tomgrafo industrial, foram
comprimidos com os mtodos de compresso Transformada S, Transformada S+P, GZIP e
LJPG, sem a separao em arquivos com parte alta e parte baixa, A transformada foi aplicada
levando em considerao cada informao na sua forma original, ou seja, com 16 bits,
Os resultados, com as taxas de compresso, esto representadas na tabela 5,2. A
taxa de compresso relativa a entropia de I a ordem dos senogramas tambm foram calculadas
para efeito de comparao,

47
Senograma Tamanho Entropia Aritmtica Transr. S Transr. S+P GZIP LJPG
DenteOl 138240 SO/O 7% 25% 27% 9% -1 %
Dente02 138240 SO/O 7% 27% 29% 9% -1%
Dente03 138240 7% 7% 27% 28% 9% 0%
Mdia 138240 SO/O 7% 27% 28% 9% -1%
D. Padro O 0% 00/. 1% 1% 0% 1%
Tabela 5.2 - Compresso de senogramas reais, com 16 bpp, entre diferentes mtodos.
35% ,
30% . ..
, , 'i': ..,..
,
,. "
C-
25%
-,.,- ,oi
-
r .",r.;; ;
, ,)~~ I:'
, =,I~~'
.,c ,,'
o
~ 200/ . - .'.;;~, [] Dente() I
...E~ "1, ~~;;;: '... ..,;,"- ',:;;;" Dente()2
o 15%
<.i
...
~
" ",
-'-
I'" 1W" :" ",!li:: o Dente()3
o M di.
...a
10% - ;,
r - Fr r
"
I-- - I-
5%
I:'"
O ~O . II . .
EntrOpJ8
"
ArJtm tJCa
,
Transf. S Transf. S<P GZIP ~G'-'
,
-5%
Senogramas
Figura 5.2 .. Grfico comparativo da compresso dos senogramas reais com 16 bpp.
Pode-se verificar que as taxas de compresso, nesta segunda abordagem, esto um
pouco menores para as transformadas wavelets e bem inferiores para o mtodo LJPG. Isto se
explica pelo fato desta implementao do LJPG no ter trabalhado com os pixels de 16 bits,
mas sim com os bytes altos e baixos alternadamente, o que compromete o bom desempenho
do preditor usado nesta tcnica.
Os experimentos com os demais senogramas foram realizados considerando a
segunda abordagem, ou seja, os mtodos de compresso foram aplicados levando em

48
considerao o tamanho original do pixel, com 16 bits, exceto para o LJPG que operou
sempre em 8 bits sobre os bytes alto e baixo alternadamente.
Na Tabela 5.3, so apresentados os resultados entre os mtodos para seIS
senogramas gerados pelo programa simulador de projees. Os pontos do grfico, entre os
senogramas, foram ligados por retas para as comparaes entre os mtodos.
Senoarama Entropia Aritmtica Transf. S Transt S+P GZIP LJPG

Abdom 37% 37% 46% 24% 89% 6 1%
Braim 47% 47% 46% 30% 87% 57%
Remia 34% 34% 42% 20010 87% 58%
Read 47% 47% 51 % 33% 88% 67%
Phanton 42% 42% 51 % 28% 9 1% 72%
Torax 38% 38% 45% 23% 88% 59%
Mdia 41% 41 % 47% 26% 88% 62%
D. Padro 5% 5% 3% 5% 2% 6%
Tabela 5.3 - Compresso dos senogramas simulados.
100%
90%
80%
..
~
----.-. Entropia
____ Aritm tica
t
Co
60%
. '" .. , ..
E 50% Transf. S
U ~ T ran sf. s+P
.., 40% .
~ GZ n)
...="=
.~.
30%
-+- LJPG
20%
10%
0%
Abdom Braim Hem ia Head Phan ton Torax Mdia
Scnogramas
Figura 5.3 - Grfico comparativo dos senogramas comprimidos
Pode-se observar que a compresso realizada pela codificao aritmtica pura
obteve um resultado diferente das compresses pelas transformadas wavelels, embora estas
tambm utilizem a codificao aritmtica. Pode-se observar tambm que as taxas de

49
compresso das transformadas S e S+P esto inferiores s taxas conseguidas pelos mtodos
de uso geral GZIP e LJPG. Esta caracterstica explicada pela organizao dos pixels dos
senogramas, onde possuem uma baixa variao de rudos nas imagens.
Isto pode ser devido ao fato destes senogramas terem sido obtidos (simulados) a
partir de imagens de 8 bits, ao contrrio dos senogramas dos dentes, que foram obtidos
diretamente de um tomgrafo industrial. Isto mostra que os senogramas simulados, da forma
como esto, no representam bem a situao real. Numa situao real, o objeto tem uma
variao contnua da radiopacidade e pode existir ainda um rudo presente durante a medida.
5.2 Compresso de Senograma com Escalas de Rudos

Para que os senogramas simulados representassem mais fielmente a situao real,
foi introduzida uma quantidade de rudo controlado em cada um de seus pixels. A tabela a
seguir apresenta o senograma "Abdom" comprimido com insero de rudos. O percentual
de rudo (%rudo) representa a relao entre o maior valor de pixel e o maior valor de rudo.
A tabela 5.3 apresenta as taxas de compresso para o senograma "Abdom", com rudos
aleatrios somados aos pixels nos percentuais indicados. O item 4.1 mostra maiores detalhes
sobre o processo de insero aleatria de rudos. O senograma "Abdom" possui 256 colunas
por 90 linhas, com 16 bpp, totalizando 46.080 bytes.
% rudo SR Entropia Aritmtica Transf. S Transf. S+P GZIP LJPG

0% - 37% 37% 46% 24% 89% 61%
0,1% 826,96 13% 12% 25% 21% 23% 29%
0,2% 406,58 12% 11% 21% 21% 17% 21%
1% 80,39 7% 6% 18% 19% 7% 12%
2% 40,31 5% 4% 17% 17% 5% 10%
10% 8,02 3% 3% 9% 8% 3% 2%
20% 4,02 3% 2% 5% 5% 2% -2%
25% 3,23 3% 2% 4% 4% 2% -3%
33% 2,43 3% 2% 3% 3% 2% -4%
50% 1,61 2% 2% 2% 1% 2% -6%
100% 0,80 1% 0% 0% 0% 0% -7%
Tabela 5.4 - Compresso para o senograma "Abdom" com insero de rudo

50
100,-..--------------------,.,
+--r---'---~ 1f :.',~ ',.
80%70% t- \ .
90".
t~
~
0'
i \-- - - - - - : : - - - - - - - -";;;-' - ----1

'oi" . ,--- - - --,
_ \ _ .. --+-- Entropia
~ 60%~~~---~------------~
-Se 40%50% +--\1---
c.
~
\
\ - - - -- - - - -- - - - -- -j
\\. ,_
~~-~
____ Aritmtica
Transf. S
<5 .... . , . . . ---w-- Tran,f. S+P
~ 30%+-~7 \~------~----~~~--j
~ ~ ;. _ _ GZIP
= 20% . ~~~~~~~~~------~----1
. . 10% t~=~'i~~
O ~.
-1 0% . 0%
~~~=~
~~~!~~~~.,~;~ --+-LJPG
0,1% 0,2% 1% 2%, 10" 20% 25% 3.
-20% - ' - - - - - - - - - - - - - - - - - - - - - '

Percencu.1 de Ru'do
Figura 5.4 - Grfico comparativo do senograma "Abdom" com escala percentual de rudo.
Ao se analisar os resultados, pode-se verificar que a partir do percentual de 0,2%
de rudo, os mtodos que utilizam a transformada wavelet passam a ter taxa de compresso
superior em relao aos mtodos de uso geral GZIP e LJPG. Isto mostra a importncia de se
considerar o rudo presente no senograma no desempenho da codificao.
5.3 Compresso dos Senogramas com Rudo Padro

Nesta seo esto os resultados da compresso de senogramas com um percentual
padro de 1% de rudo, para se ter uma idia do comportamento dos mtodos de compresso
com os outros senogramas. Estima-se que um senograma real possa ter um percentual de
rudo proveniente do processo de deteco numa faixa de 0,01% a 10%, dependendo da
qualidade do equipamento.
A tabela 5.5 mostra as taxas de compresso para os 6 senogramas simulados, com
rudos inseridos e os 3 senogramas reais. Para os senogramas reais no se tm os valores da

51
relao sinal/rudo (SR) porque no sofreram insero de rudo controlado, visto que esto no
estado original, j com rudos inseridos pelo prprio processo de gerao.
Senograma SR Entropi a Arit:rmtica Transf. S Transf. S+P GZIP LJPG

Abdom 80,39 7% 6/. 18% 190/0 7% 12.4
Brain 88,85 11 % 11% 17% 18". 11 '1. 11%
Hem ia 89,65 SY. 4% 17% 18". 5% 11%
Head 83,81 11 % ll o/. 190.4 200/0 11 0/. 13%
Phantoo 88,55 9% 8% 19% 20% 9% 14%
Torax 81 ,57 7% 6% 18% 190/0 70/. 11 %
Dente01 - 8% 7% 25% 27% 9"1. 1 %
Dente02 - 8% 7% 27-1. 29"/0 9"/0 1%
Dente03 - 7% 7% 27",. 28% 9% 0'/0
Mdia 85,47 8% 8% 21 % 22% 80/. 8%
D. Padro 4,05 2% 2% 4% 4% 20/. 70/.
Tabela 5.5 - Compresso do senogramas com rudo padro.
35% ' ..
-
." \c
30% .
y
o 25%
..... ---+- Entropia
20% . / ___ Aritmtica
!
Q. - ~
Transf. S
... ......
E 15%
o _ _ Transf. S+P
~
O
.., ~
..
OI
10% . -lIf-GZ P
....".. ~
.\.
'J 'c
/ -
___ UPG
~\
5% .

0%
-5~ ~ Jif' ","f> .# ..' ~ J)" .J9- .JS' .d
-~ 'O. ~~ '(' q""'" <;
Q./i' Q./i' Q./i'
~-
Senogramas
Figura 5.5 - Grfico comparativo dos senogramas com rudo padro.
Neste caso, pode-se notar que os mtodos que utilizam a transformada wavelet
apresentam uma taxa de compresso superior aos demais mtodos. Os resultados so
semelhantes para todas os senogramas aqui utilizados.

52
5.4 Compresso de Imagens

A Tabela 5.6 apresenta os resultados da compresso entre os mtodos aqUI
utilizados, para seis imagens de TC, todas com 256 colunas por 256 linhas e com 8 bits por
pixel, totalizando 65.536 bytes.
Imagem Entropia Aritmtica Trsmf. S T ....... f.S+P GZIP LJPG

Abdom 63% 6 1% 55% 51 % 80"/0 70%
Brain 74% 71 % 66% 6 1% 87% 77%
Hemia 46% 45% 40% 38% 6 1% 500/0
~ead 75% 7 1% 66% 60% 86% 74%
Phanton 79% 78% 79% 65% 98% 86%
Torax 57% 55% 53% 49% 75% 66%
DenteO l 36% 34% 33% 34% 34% 34%
Dente02 33% 32% 47% 48% 38% 500/0
Dente03 28% 26% 400/0 400/0 28% 44%
Mdia 54% 53% 53% 50% 65% 6 1%
D. Padrllo 19% 19% 15% 11 % 26% 17%
Tabela 5.6 - Compresso das imagens de Te.
100%
90%
80%
-+- Entropia
~
70%
~ Aritmtica
~ 60~o
T ran sf. S
E
o 50%
u ~ T ransf. S+P
~
40%
" - l f - GZIl'
....~ 300/. _ _ LJPG
20%
10%
0%
.#'~ 0-~~ xl'. . ~..~ q~.f"~ ....d-." c!'~' t/~~ <:/'"~ ~..,
Imagens
Figura 5.6 - Grfico comparativo das imagens de TC comprimidas.
Neste caso, pode-se observar que as taxas de compresso das transformadas S e
S+P esto inferiores s taxas conseguidas pelos mtodos de uso geral.

53
A tabela 5.7, a seguir, mostra as imagens comprimidas com rudos, adicionados
antes da compresso. O item 4.1 mostra maiores detalhes sobre o processo de insero
aleatria de rudos. A imagem "Abdom" possui 256 colunas por 256 linhas, com 8 bpp,
totalizando 65 .536 bytes.
v. ruido SR Entropia Arl_dca TransE S Trans[ S+P GZIP WPG

0% - 630/. 6 1% 55% 51% 80% 70%
2% 85,87 49% 47% 49% 48% 59% 57%
10% 9,3 1 27% 26% 35% 34% 28% 3 6~.
20"10 4,40 19'10 18% 25% 23% 190.4 25%
25% 3,47 16% 16% 22-;. 20"10 16% 21 %
33% 2,63 13% 13% 18% 15% 13/. 17%
50% 1,7 1 11 % 11% 11-;0 8% 100/. 9%
100"/. 0,85 4% 4% 1% 1% 3% -2/.
Tabela 5.7 - Compresso para a imagem "Abdom" com insero de rudo
90%
80%
c.
:L
70% :\.. te,_ .. "
-.""
o 60% t...~ .. -+- En fropia
~
..
e 50 %
~'" ,. .. ____ Aritmtica
"'''
Transf. S
eo 40% .
.~
U _ _ Tronsf. s+P
...
~
30% .
,~
_____ GZ IP
....= 20 ~o
. .
- - . LJPG
10% .
0% ~
-10 0/.
0% 2% 100/. 20% 25% 33;' 50,4 I~%
Pe rcentual de Ruldo
Figura 5.7 - Grfico comparativo da imagem "Abdom" com escalas de rudo.
Neste caso, pode-se verificar que para um percentual de rudo em torno de I 0%, os
mtodos que utilizam a transformada wavelet passam ter taxas de compresso maiores do que
as dos mtodos de uso geral GZIP e LJPG.

54
5.5 Comparativo de Compresso Imagens x Senogramas

Com o objetivo de avaliar o que mais eficiente comprimir, apresenta-se um
comparativo entre a compresso das imagens e senogramas. Vale lembrar que so dois
domnios distintos, com dimenses e resoluo de cores diferentes (8bpp e 16bpp), portanto
um cenrio de difcil comparao quantitativa. Comparando-se o tamanho original, os
senogramas possuem a vantagem de, em geral, serem menores, porm tambm podem ter
tamanhos maiores. Neste trabalho, sero utilizados somente senogramas gerados com um
passo de 2 graus, o que j fornece uma imagem adequada. Uma melhor qualidade pode ser
conseguida diminuindo-se o passo. Se fosse utilizado um passo de 1 grau, seria gerado um
senograma com 180 linhas, totalizando 92.160 bytes, portanto maior que os 65.536 bytes da
imagem.
A tabela 5.8 mostra a taxa de compresso, com insero de rudos (1%) em
senogramas. O clculo desta taxa considera os tamanhos finais das imagens e senogramas,
comparado com o tamanho original da imagem de 65.536 bytes. As imagens utilizadas esto
sem rudos inseridos e possuem 8 bits por pixel de informao. Os senogramas possuem 16
bits por pixel de informao.
Normal Entr Aritm S SfP GZIP LJPG Entr Aritm S SfP GZIP LJPG
Imagem Sen Sen Sen Sen Sen Sen Sen Img Img Img Img Img Img
Abdom 30% 34% 34% 42% 43% 34% 38% 63% 61% 55% 51% 80% 70%
Braim 30% 38% 37% 42% 43% 37% 38% 74% 71% 66% 61% 87% 77%
Hernia 30% 33% 33% 42% 43% 33% 37% 46% 45% 40% 38% 61% 50%
Head 30% 38% 37% 43% 44% 37% 39% 75% 71% 66% 60% 85% 74%
Phanton 30% 36% 35% 43% 44% 36% 40% 79% 78% 79% 65% 98% 86%
Trax 30% 34% 34% 42% 43% 35% 38% 57% 55% 53% 49% 75% 66%
Mdia 30% 35% 35% 42% 43% 35% 38% 65% 64% 60% 54% 81% 71%
D. Padro 0% 2% 2% 1% 0% 2% 1% 13% 12% 14% 10% 12% 12%
Tabela 5.8 - Taxa de compresso considerando o tamanho original da imagem.

55
100%
90%
-
. ,i
E 80-/0
!'. 70% -- ,;' ,,;;;;; ,: .. [] Abdorn
] ~ '. .Braim
60% -
~I[
o " o Hem ia
'!; 50%
OHead
-!l
~ 40%
E Phant on
= 3 0%
...= 20 %
c Torax
C 10%
0%
Nonn Enlr Arilm S S+P GZIP LJPG Enlr Aritm S S+P GZIP UPG
(Sco) ( Sen ) (Sco) (Sco) (Sen) (Sco) ( Sco) (Irng) (irng) (lmg) ( Img) (Irn g) ( Irng)
Imagens e Sen ogramas
Figura 5.8 - Grfico da taxa de compresso comparado ao tamanho original da imagem.
Pode-se notar que h uma tendncia de maiores taxas de compresso nos mtodos
GZIP, em primeiro lugar e em segundo para o LJPG, considerando-se as imagens. O ganho
destes mtodos pode ser explicado pela organizao das informaes dos pixels, onde existe
um desequilbrio grande entre as probabilidades de ocorrncia dos smbolos nessas imagens.
Como pode ver verificado, com a insero de rudos, a taxa de compresso destes mtodos
decresce, portanto, pode-se concluir que a variao nos valores das informaes exerce
influncia nos diversos mtodos de compresso.
Ao se analisar os dados desta comparao, considerando os senogramas com rudo
padro de 1%, pode-se notar que a taxa de compresso para os senogramas so mais baixas
quando comparadas com as taxas de compresso das imagens. Lembra-se novamente que so
dois domnios diferentes e sua comparao direta deve ser apenas uma avaliao subjetiva.
De qualquer maneira, este resultado refora a importncia do nmero de bits por
pixel no tamanho final do arquivo. Uma maneira de se melhorar a taxa de compresso dos
senogramas seria reduzir o nmero de bits por pixel, porm esta reduo no passo da
56
quantizao poderia resultar em perda de informao, ou equivalente, na adio de um rudo
de quantizao mais elevado.
Na tabela 5.9 mostra-se as mdias dos tamanhos resultantes, em bytes, das imagens
comprimidas sem rudo e senogramas comprimidos sem rudo e com rudo padro de 1%.
S. Aribn<tI.. Tnnsf.S T......tS+P GZIP WPG

Imagem 30% 65% 64% 60% S4% 81% 71%
Smograma .... rudo 30% 59% 'SOlo 63% 48"/0 92% 73%
Saloo:rama com rujdo 30% 35% 35% 42% 43% 35% 38%
Tabela 5.9 - comparao entre as mdias das compresses.
100%
90%
e 80%
'li Scnograma
~
... 70%
O En tropia
u 60% O Aritmtica
...
~
M
50% Transf. S
~
-
II
...
=
M
40%
30%
[J Transf. StP
. GZIP
[JLJPG
~
:;
20%
10%
0%
Imagem Senograma sem ruioo Senograma com rudo
lm.geRs e Senograms
Figura 5.9 - Grfico das mdias das compresses com e sem rudo.
Foi verificado que a presena de rudos determina maior ou menor ganho entre os
mtodos de compresso. Nos testes realizados com insero de rudos, fo constatado que
rudos em tomo de I% no alteram os resultados dos mtodos de compresso para as
imagens. Portanto, fica evidente que existem vantagens em se comprimir imagens, mesmo
aquelas que possuem pequenos percentuais de rudo . No entanto, esta vantagem va
diminuindo medida que o percentual de rudo aumenta, conforme verificado na figura 5.7.
57
As imagens aqui utilizadas na realizao dos testes, com rudos, no representam a
imagem reconstruda a partir do seu senograma com rudo. Elas tambm tiveram rudos
inseridos, a partir da imagem original, nas mesmas propores, a fim de se verificar a
influncia tanto no senograma quanto na imagem. A influncia no senograma muito maior
devido a amplitude do seu sinal, que representado por 2 bytes, podendo assumir valores
entre 0 e 65.535. Na imagem, a influncia do rudo menor porque a amplitude do sinal
representado por 1 byte, podendo assumir valores entre 0 e 255.

58
6. Concluso
As imagens digitais necessitam de grande espao para armazenamento, a exemplo
dos sistemas mdicos que trabalham com diagnstico por imagem. Alm de gerar um grande
volume de dados, podem ocasionar lentido nos sistemas que utilizam catalogao,
recuperao e transmisso destas imagens, o que torna evidente a necessidade de aplicar
alguma tcnica de compresso. No caso de imagens mdicas, deve-se levar em conta que, em
geral, no deve haver perda de informaes, quando for aplicada alguma tcnica de
compresso. Existindo perdas, poder haver alteraes na imagem a ser analisada, podendo
ocorrer erros no diagnstico mdico. Assim como as imagens, as projees de tomografia
computadorizada (senogramas) tambm no devem sofrer perdas na compresso, para
permitir a reconstruo exata da imagem, aps sua descompresso. A principal motivao
para compresso e armazenamento de senogramas permitir que os dados originais sejam
preservados e as imagens possam ser regeradas com diferentes algoritmos de reconstruo.
Nos testes realizados neste trabalho, foram comparadas as taxas de compresso de
alguns dos mtodos de compresso sem perdas: GZIP (baseado no Lempel-Ziv e largamente
utilizado para compresso de dados), LJPG (baseado na DPCM e utilizado especificamente
para imagens) e wavelets de inteiros com codificao aritmtica (mtodo menos difundido).
Os testes foram aplicados tanto sobre as projees de tomografia computadorizada
(senogramas) quanto para suas imagens reconstrudas.
No pequeno conjunto de senogramas utilizados (3 reais e 6 simulados com 1% de
rudo adicionado), pode-se verificar que as transformadas wavelets apresentaram os maiores
ganhos com cerca de 22% de taxa de compresso. Os mtodos GZIP e LJPG ficaram abaixo
com 8%. Ressalta-se que o LJPG operou sobre palavra de 8 bits e no 16 bits, o que pode ter
59
prejudicado sua capacidade de interpretao fiel da imagem. Porm esta uma dificuldade
presente na prtica visto que a maioria das implementaes no permite a configurao de
lbpp, embora pela definio do algoritmo no exista nenhuma restrio.
Pode ser observado o ganho introduzido pelo uso das transformadas wavelets. As
transformadas S e S+P foram utilizadas neste trabalho em conjunto com a codificao
aritmtica, que aps a reorganizao dos pixels da imagem, utilizam esta codificao para
efetuar a compresso propriamente dita. Os resultados obtidos pela compresso da
codificao aritmtica ficou muito prxima da entropia de I a ordem. J a compresso pelas
transformadas wavelets apresentaram as melhores taxas de compresso, comprovando a
eficcia do mtodo.
Foi realizada uma comparao entre a compresso dos senogramas e a imagens
com o objetivo de avaliar a eficincia na compresso. O resultado obtido no indica ganho
significativo em termos do tamanho final do arquivo.
Finalizando a anlise entre os mtodos aqui utilizados, podemos confirmar o
potencial oferecido pela tcnica da transformada wavelet, a qual capacita trabalhar com
imagens de forma adequada na rea de compresso de imagens.
A seguir, apresentamos algumas sugestes para trabalhos futuros, relacionadas
rea de compresso de imagens e utilizao das transformadas wavelet.
realizao de testes com os mtodos de compresso, utilizando-se imagens
reais, obtidas a partir de tomgrafos mdicos;
Realizar testes em imagens e senogramas com profundidade de bits diferente
de 16. Utilizar imagens com 15, 14, 13 e 12 bits, utilizando o menor nmero
60
necessrio de bits em funo do rudo do equipamento, objetivando descobrir a
eficincia dos mtodos de compresso;
Aplicao de outros filtros wavelet que se adaptem melhor s caractersticas
presentes nas projees, usando o lifting scheme ou o mtodo de correo;

61
Apndice 1 - Padres de Compresso de Imagem
1.1 Padro GZIP

O padro GZIP (Gnu ZIP) de compresso um software desenvolvido sob a
licena GNU e distribudo gratuitamente para compresso de dados de propsito geral. O
algoritmo de compresso utilizado pelo gzip o LZ77 (Lempel-Ziv 1977), comentado no
item 3.5.1 [ZIV77],
O mtodo encontra strings duplicadas nos dados de entrada. A segunda ocorrncia
da string substituda por ponteiros para a string anterior, na forma de pares (distncia,
comprimento), onde o primeiro representa a distncia para trs que a seqncia inicia e o
segundo representa o nmero de caracteres na qual a seqncia idntica. Distncias so
limitadas por 32Kb e comprimentos so limitados por 258 bytes. Quando uma string no
ocorre em nenhum lugar nos 32Kb anteriores, ela emitida como uma seqncia literal de
bytes (A string pode ser uma seqncia arbitrria de bytes e no restrita a caracteres
imprimveis).
Literais ou comprimentos iguais so comprimidos com uma rvore de Huffman, e
distncias iguais so comprimidas com outra rvore. As rvores so armazenadas numa
forma compacta no inicio de cada bloco. Os blocos podem ser de qualquer tamanho (exceto
que os dados comprimidos para um bloco tem que encaixar dentro da memria disponvel).
Um bloco terminado quando o algoritmo deflateO determina que deve ser conveniente
comear outro bloco com rvores novas. (Isso um tanto parecido com o comportamento do
algoritmo de compresso LZW).

62
Strings duplicadas so encontradas utilizando uma tabela de hash. Todas as strings
de entrada de tamanho 3 so inseridas na tabela de hash. O ndice hash calculado para os
prximos 3 bytes. Se o encadeamento de hash (hash chain) para esse ndice no vazio,
todas as strings nesse encadeamento (chain) so comparados com a string de entrada atual, e
a maior combinao selecionada.
Os encadeamentos de hash so procurados iniciando pelas strings mais recentes,
para favorecer as distncias menores e assim tirar vantagem da codificao de Huffman. Os
encadeamentos de hash so unidos um por um. No h remoes nos encadeamentos de
hash, o algoritmo simplesmente descarta combinaes que so velhas demais.
Para evitar uma situao de pior caso, encadeamentos de hash muito extensas so
truncadas arbitrariamente num certo comprimento, determinado por um parmetro do
deflatelnit (opo em tempo de execuo). Assim, o algoritmo deflateQ nem sempre acha a
maior combinao possvel, mas geralmente encontra uma que comprida o bastante
[AGOOO],
1.2 Padro JPEG

A necessidade de um padro internacional para compresso de imagens estticas
resultou, em 1986, na formao do JPEG. Formalmente conhecido como ISO/IEC
JTC1/SC29/WG1. O objetivo deste grupo foi desenvolver um mtodo para compresso de
imagens de tons contnuos que atendesse aos seguintes requisitos:
1. A qualidade da imagem reconstruda deve ser a mais perfeita possvel quando
comparada com a original. O codificador deve ser parametrizado permitindo a
escolha da taxa de compresso e qualidade da imagem desejvel.

63
2. Ser aplicvel para praticamente qualquer tipo imagem digital de tons contnuos
e no devem haver restries com relao ao contedo da cena, tais como
complexidade, nmero de cores ou propriedades estatsticas.
3. Ter uma complexidade computacional razovel, permitindo sua implementao
tanto em software quanto em hardware.
4. Ter os seguintes modos de operao: (1) Codificao seqencial, onde cada
componente da imagem codificado com uma simples varredura da esquerda
para a direita e de cima para baixo; (2) Codificao progressiva, onde a
imagem codificada em mltiplas varreduras para aplicaes no qual o tempo
de transmisso longo; (3) codificao sem perdas, onde a imagem
codificada garantindo a reconstruo exata da imagem original e (4)
Codificao hierrquica, onde a imagem codificada em mltiplas resolues.
Uma expectativa comum com relao ao uso da transformada wavelet que ela
produz uma melhor qualidade subjetiva da imagem do que o codificador JPEG padro. Em
vista disso, o JPEG est propondo um novo padro para compresso de imagens chamado
JPEG-2000. Esse novo paradigma de compresso de imagens utilizar a transformada
wavelet ao invs da DCT.
Em [SAN01] comentado sobre o projeto JPEG 2000, onde foi motivado com a
submisso do algoritmo CREW para a padronizao de compresso sem perdas (lossless) e
quase sem perdas (near-lossless) para imagens de tons contnuos, conhecido agora como
JPEG-LS. Embora o LOCO-I tenha sido selecionado como a base para o JPEG-LS. Todavia,
foi reconhecido que o CREW possui muitas caractersticas que merecia o desenvolvimento
de um novo padro. Em 1996, o JPEG-2000 foi aprovado como um novo item de trabalho.
64
JPEG 2000 refere-se para todas as partes do padro. A proposta atual constituda
de 6 partes. As partes so:
Parte 1, Sistema de codificao de imagens JPEG 2000 (o ncleo)
Parte 2, Extenses (adicionar mais caractersticas e sofisticao para o ncleo)
Parte 3, Motion JPEG 2000
Parte 4, Adaptao
Parte 5, Software de referncia (atualmente implementaes em Java e C)
Parte 6, Formato de arquivo para imagens compostas.
O padro JPEG-2000 ter como caracterstica a eficincia da compresso
melhorada (estimada em 30% dependendo do tamanho e da taxa de bits da imagem),
permitir compresso tanto com perdas quanto sem perdas, mltiplas resolues,
decodificao progressiva, codificao de regio de interesse (Region Of Interest - ROI), o
qual permite selecionar partes de uma imagem para ser codificada com mais alta qualidade, e
ainda, tudo em um nico fluxo de bits comprimido. Permitindo as aplicaes manipularem ou
transmitirem somente as informaes essenciais para um dispositivo a partir da imagem fonte
comprimida.
O JPEG 2000 tem muitas caractersticas novas em relao ao JPEG padro,
algumas delas so:
A sua performance em compresso constitui o estado da arte para baixa taxa de
bits;
Transmisso progressiva por qualidade, resoluo, componentes ou localidade
espacial;
Compresso com perdas e sem perdas unificado;
Acesso aleatrio para fluxo de bits (bitstream);

65
Processamento no domnio comprimido (por exemplo, rotao e corte);
Codificao da regio de interesse por progresso (permite transmitir a regio
de interesse primeiro durante a transmisso progressiva).
A complexidade da transformada wavelet no JPEG 2000, depende do tamanho do
filtro e dos filtros de ponto flutuante ((9,7), (10,18)) versus filtros inteiros ((13, 7), (3, 5), (5,
3), (2,10), etc.) utilizados. A Parte I exigir uma wavelet de ponto flutuante (9, 7) e uma
inteira (3, 5), enquanto a Parte II permitir wavelets mltiplas incluindo as definidas pelo
usurio.
Um anexo do padro JPEG 2000 contm um formato de arquivo opcional para
incluir informaes tais como o espao das cores dos pixels e informaes de propriedade
intelectual (direitos autorais) para a imagem. Este formato opcional de arquivo extensvel e
a parte II definir armazenamento de muitos tipos adicionais de metadados. A extenso
utilizada para representar o formato do arquivo "JP2" [SAN01].
1.3 Transformada Wavelet Reversvel

Um excelente estudo sobre transformada wavelet foi realizada por [SAN01], de
onde, uma parte dela, ser descrita nesta seo. A transformada wavelet tem sido amplamente
utilizada como uma ferramenta poderosa para compresso de imagens. Todavia, at
recentemente, seu uso era limitado para aplicaes de compresso de imagens com perdas.
Transformadas wavelets de inteiros reversveis so filtros lineares com
arredondamento no linear os quais implementa sistemas de reconstruo exata utilizando
aritmtica de inteiros. As transformadas reversveis, em geral, no so lineares. Por este
motivo, a ordem na qual a transformada aplicada torna-se significativa, ou seja, se a

66
decomposio foi aplicada primeiro nas linhas e em seguida nas colunas da imagem, a
transformada inversa deve primeiro ser aplicada nas colunas e ento nas linhas da imagem.
As transformadas wavelet de inteiros utilizadas na compresso dos senogramas e
imagens so baseadas nas transformadas que possuem a propriedade de preservao de
preciso (property of precision preservation - PPP) e permitem a compresso sem perdas de
imagens com tamanho arbitrrio. Estas transformadas so baseadas em tcnicas de
atualizao e correo, tais como o lifting scheme e a transformada S+P. O mtodo permite
gerar uma srie de transformaes inteiras reversveis que so muito prximas das
transformadas wavelet biortogonais correspondentes e algumas transformadas wavelet no
ortogonais, porm podem ser calculadas com somas de inteiros e operaes de deslocamento
de bits.
Aps a aplicao da transformada direta, os coeficientes detalhe podem assumir
valores negativos e o nmero de bits usados para representar a imagem podem no ser mais
suficientes, havendo a necessidade de se usar um bit adicional para representar o sinal do
nmero. A PPP permite manter o nmero de bits usados para representar cada pixel da
imagem inalterado. No algoritmo de reconstruo o computador recuperar o sinal original
atravs da mesma propriedade.
Alguns dos coeficientes obtidos da transformada PPP tero valores de sada
diferentes dos obtidos com a transformada sem a aplicao desta propriedade. Os resultados
obtidos com o uso desta propriedade possuem aproximadamente a mesma eficincia na
compresso sem perdas, que significa que a entropia da imagem transformada dessas duas
transformadas so quase a mesma. A transformada PPP no aplicvel para compresso com
perdas.
67
Uma outra caracterstica da PPP est na forma como o computador realiza
aritmtica com nmeros inteiros. Se for considerado a computao da diferena de dois
nmeros inteiros dado como c = - a e a computao inversa de a = b - c. A computao
ser efetuado da seguinte maneira pelo computador:
b-a se -29-1 <b-a<29-1

c' i b-a-2q se b-a> 2q~x (Al.l)
b-a + 2q se b-a<-2q~x
e a inversa sera
b-c' se -2^ <b-c'<2q~1

d- b-c'-2q se b-c'>2<t~1 (Al.2)
b-c'+2q se b-c'<-2q~x
onde c' e a' indicam a representao interna no computador e o intervalo dos inteiros a, b ec
[-2q-1, 2?_1-1]. A representao interna de c' quando ocorrer um overflow ou underflow ser
um nmero com complemento de dois, ento a representao interna pode no ser a mesma
da representao externa de c. Porm, o mesmo cdigo complementar para a' permitir que a
representao interna seja igual a representao externa de a.
A transformada wavelet de Haar na sua verso no normalizada envolve
simplesmente pares de mdias e diferenas:
5W= * [ 2 ] + X[2k + 1] ( a u )
d[ri\ = JC[2+1] - x[2n] (Al .4)
Para o caso de uma imagem, deve-se aplicar a transformada acima nas linhas e nas
colunas da imagem. A transformada inversa de Haar dada por
x[2ri\ = s[ri\-^ (Al.5)

68
x[2+l ] = +^ (Al .6)
Por causa da diviso por dois, as equaes acima no so transformadas inteiras.
Para evitar isso, poderamos omitir a diviso por dois calculando a soma em vez da mdia.
Porm, prefervel usar uma construo mais eficiente conhecida como transformada S
(Seqencial) que uma verso da transformada de Haar modificada para inteiros. A
transformada S a mais antiga transformada wavelet de inteiro para inteiro. Existe na
literatura diferentes definies da transformada S, mas muitas diferem apenas na forma em
que so implementadas. A transformada S ser definida aqui como segue:
x[2ri\ + x[2n +1]

s[n] (A1.7)
d\ri\ = x[2+l] - x[2n] (Al .8)
onde |_ J corresponde a operao de truncamente para baixo. A primeira vista, o truncamento
em s[] parece descartar alguma informao. Todavia, a soma e a diferena de dois nmeros
inteiros so tambm ambos pares ou ambos impares. Com base nessa informao, pode-se
omitir o bit menos significativo da soma, pois ele igual ao bit menos significativo da
diferena (d{ri\). A diferena poder ento ser usada para determinar se ocorreu o
truncamento. Se este valor for impar indicar o truncamento para o menor inteiro.
Note que o ndice de fator dois ([2]), nos coeficientes da transformada, o
resultado da subamostragem por um fator de 2, enquanto que a operao de truncamento |_-J
a fonte da no linearidade.
Como os pixels adjacentes em uma imagem so altamente correlacionados, a
aplicao da transformada acima permite reduzir significativamente a entropia de primeira

69
ordem da imagem, que pode ser reduzida ainda mais se for usado um mtodo de codificao
preditiva.
A transformada S inversivel e sua inversa dada por
d[n]
x[2n] = s[w] - (Al.9)
4] + l
x[2+l] = s[] + (A1.10)
Said e Pearlman propuseram a transformada S+P (Transformada S + Predio) na
qual a predio linear realizada nos coeficientes passa baixa para gerar um novo conjunto
de coeficientes passa alta depois da aplicao da transformada S. A forma geral da
transformada S+P :
dm\ri\ = x[2n +1] - x[2n] (Al. 11)
dm[ri\
5[W]=X[2W] + (Al. 12)
gl, (s[ - 2] - s[w -1]) + a0(s[w -1] - s[w])

d{n] = dm[n] + (Al. 13)
+ ai(s[n]-s[n + l])-1dm[n + l]
Said e Pearlman examinaram vrias escolhas para an e \ e sugerem a.\ 0, ao =
2 3 _ 2 . 1 4 8 .= 6
,a\ = e\~ para imagens naturais e a i = , ao - , ai = e i para
8 8 8 16 16 16 16
imagens mdicas muito suave.

70
Apndice 2 - Formatos de Imagem
2.1 Formato BMP

No trabalho de [AGOOO] tem-se um resumo sobre o padro BMP. o formato de
imagem nativo do sistema operacional Microsoft Windows. Este padro suporta
imagens com 1, 4, 8, 16, 24 e 32 bits por pixel. Este formato pode se apresentar com
compresso, utilizando o algoritmo RLE [MUR96], ou ainda sem nenhuma compresso.
A verso inicial do formato BMP era formada apenas por um cabealho do
arquivo e pelos dados dos pixels, conforme a Figura A2.1.
Cabealho do Arquivo
Dados dos pixels

Figura A2.1 - Formato BMP na verso inicial.
A partir da segunda verso, o formato do arquivo BMP evoluiu, permanecendo
desta forma at as verses atuais. Neste novo formato, alm do cabealho do arquivo e dos
dados de pixels, foi includo um cabealho da imagem e uma paleta de cores na ordem
apresentada na Figura A2.2. A paleta de cores s existe se o nmero de bits por pixel for 1, 4
ou 8.
Cabealho do Arquivo
Cabealho da Imagem
Paleta de Cores
Dados dos pixels
Figura A2.2 - Formato BMP a partir da segunda verso.

71
0 cabealho do arquivo serve para identificar o formato do arquivo e est
apresentado na Tabela A2.1.
Nome do Campo Tamanho (bytes) Descrio
Tipo 2 Contm os caracteres "BM".

Tamanho 4 Tamanho do arquivo em bytes.
Reservado 2 No utilizado (deve valer zero).
Reservado 2 No utilizado (deve valer zero).
Deslocamento 4 Deslocamento para o incio dos dados.
Tabela A2.1 - Cabealho de arquivo do formato BMP
Imediatamente depois do cabealho do arquivo localiza-se o cabealho da imagem,
podendo seguir duas estruturas diferentes, uma para Windows e outra para OS/2. Apenas o
cabealho para Windows ser detalhado neste trabalho. Na Tabela A2.2 est apresentado o
formato de cabealho para Windows 3.x.
Na verso para Windows 95 mais campos foram adicionados a este cabealho,
como forma de dar suporte, principalmente, aos novos nmeros de bits por pixel suportados
(16, 24 ou 32). Estes novos campos esto apresentados na Tabela A2.2 e so colocados
exatamente depois dos campos da Tabela A2.1. Caso o nmero de bits por pixel seja 1, 4 ou
8, este complemento ao cabealho da imagem no existe, sendo substitudo pela paleta de
cores.
Na Tabela A2.2, o campo Planos deve ser 1 porque o padro BMP usa apenas um
plano de cores. O tipo de compresso, definido pelo campo Compresso, pode ser sem
compresso (Compresso=0), comprimido por RLE8 (Compresso^ 1 ), comprimido por
RLE4 (Compresso^2), ou utilizar mscaras de campo 0Compresso=3), para significar que
os dados no esto comprimidos e que no existe paleta de cores.

72
Nome do Campo Tamanho (bytes) Descrio
Tamanho 4 Tamanho do cabealho (40 a 108 bytes).

Largura 4 Largura da imagem.
Comprimento 4 Comprimento da imagem.
Planos 2 Nmero de plano de cores (deve ser um).
Bits por pixel 2 Bits por pixel (1,4,8,16,24 ou 32).
Compresso 4 Tipo de compresso.
Tamanho da Imagem 4 Tamanho da imagem.
Pixels por metro X 4 Resoluo horizontal em pixels por metro.
Pixels por metro Y 4 Resoluo vertical em pixels por metro.
Cores Usadas 4 Entradas na paleta de cores usadas.
Cores Importantes 4 Nmero de cores significativas.
Tabela A2.2 - Cabealho de imagem do formato BMP
Tamanho (bytes) Descrio
Mscara Vermelha Identifica bits do componente Vermelho.

Mscara Verde Identifica bits do componente Verde.
Mscara Azul Identifica bits do componente azul.
Mscara Alpha Identifica bits do componente alpha.
Tipo de cor Tipo do espaa de cores.
Vermelho X Coordenada X do ponto fim .
Vermelho Y Coordenada Y do ponto fim .
Vermelho Z Coordenada Z do ponto fim .
Verde X Coordenada X do ponto fim .
Verde Y Coordenada Y do ponto fim .
Verde Z Coordenada Z do ponto fim .
Azul X Coordenada X do ponto fim .
Azul Y Coordenada Y do ponto fim .
Azul Z Coordenada Z do ponto fim .
Gamma Coord, do valor de escala do gamma.
Gamma Verde Coord, do valor de escala do gamma verde.
Gamma Azul Coord, do valor de escala do gamma azul.
Tabela A2.3 - Continuao do cabealho de imagem do formato BMP
Na Tabela A2.3, os campos Mscara Vermelha, Mscara Verde, Mscara Azul e
Mscara Alpha especificam, para BMPs de 16 ou 32 bits, quais bits em um valor de pixel
correspondem a uma cor especfica ou ao canal alpha, que armazena os dados de
transparncia do pixel, sendo que este valor pode variar de 0 (pixel completamente
73
transparente) at 255 (pixel completamente opaco) [MUR96], O campo Tipo de Cor define o
tipo de espao de cores usado. As opes so: RGB calibrado (Tipo de Cor=0), RGB
dependente de dispositivo (Tipo de Cor=l) e CMYK dependente de dispositivo (Tipo de
Cor=2). Os campos Vermelho X, Vermelho Y, Vermelho Z, Verde X, Verde Y, Verde Z,
Azul X, Azul Y e Azul Z so usados apenas para o espao de cores RGB calibrado.
Aps o cabealho de imagem, localiza-se a paleta de cores. Esta paleta um vetor de
estruturas que especificam os valores de intensidade das cores vermelho, verde e azul de cada
cor em uma imagem. Cada pixel, nos dados de pixels, armazena um valor simples, que
usado como ndice na paleta de cores. A paleta de cores s existe em arquivos BMP com 1, 4
ou 8 bits por pixel. Nos arquivos com 16, 24 ou 32 bits por pixel, existem mscaras para cada
cor no lugar da paleta de cores. O valor da mscara usado para fazer um AND com o valor
do pixel e, com isso, capturar a intensidade de uma cor especfica no pixel.
Aps a paleta de cores, se ela existir, vm os dados de pixel. Dependendo do
nmero de bits por pixel, a interpretao dos dados diferente. Se forem 1, 4 ou 8 bits por
pixel, o dado armazenado o ndice do pixel na paleta de cores. Se forem 16, 24 ou 32 bits,
os dados armazenados contm toda a informao de cores do pixel, onde se usa as mscaras
para interpret-las separadamente.
A nica compresso possvel no formato BMP a RLE, abordada no Apndice 3
deste trabalho, portanto a compresso no BMP sem perdas. Existem dois tipos diferentes de
RLE utilizadas no formato bitmap. A primeira usa 4 bits como elemento atmico e a segunda
usa 8 bits. Por isso, os pixels representados com 1, 16, 24 ou 32 bits no podem ser
comprimidos no formato BMP [MUR96],

74
2.2 Formato PBM

A designao de formato de imagem PBM (Portable Bitmap) engloba trs
formatos de imagem para imagens a preto e branco, em escala de tons cinzentos e a cores,
todos eles sem compresso e que apresentam uma estrutura comum. Os trs tipos de formato
de imagens so:
PBM (Portable BitMap): para imagens de dois nveis (preto e branco)
PGM (Portable GrayMap): para imagens em tons de cinza
PPM (Portable PixMap): para imagens coloridas
A definio original destes formatos teve em vista permitir a transmisso de
imagens por meio de correio eletrnico que, data da definio, ainda no permitia a
transmisso de arquivos anexados, binrios ou no. Os formatos PBM, PGM e PPM
representavam ento os contedos das respectivas imagens por meio de caracteres ASCII
representveis. Esta caracterstica permitia a insero de uma imagem numa mensagem de
correio eletrnico como se tratasse de texto, mas tinha como conseqncia que o tamanho
dos arquivos fossem demasiadamente grande. A definio do formato mais tarde foi
modificada para permitir a representao binria dos contedos das imagens.
Os formatos de imagem PBM so constitudos pelos seguintes campos:
Identificador do tipo de formato (designado por "magic value"), de acordo com
o tipo, definido para imagens gravadas no formato ASCII e formato binrio,
conforme tabela abaixo:

75
Imagem em Imagem em
Tipo ASCn Binrio
PBM PI P4
PGM P2 P5
PPM P3 P6
Tabela A2.4 - Identificador de tipo para os formatos PBM, PGM e PPM.
Espao em branco, podendo ser constitudo por um qualquer nmero de
caracteres em branco, TABs, CRs e LFs;
Largura da imagem, em pixels e em valor decimal, formatada em caracteres
ASCH,
Espao em branco;
Altura da imagem, em pixels e em valor decimal, formatada em caracteres
ASCII;
Espao em branco.
Se a imagem for dos tipos PGM ou PPM:
Valor mximo em notao decimal dos tons de cinzento (PGM) ou das
componentes de cor (PPM), formatado em caracteres ASCII;
Espao em branco.
Para os trs tipos de formato:
Valores dos pixels da imagem, em nmero igual altura da imagem vezes a sua
largura para os tipos PBM e PGM, e trs vezes este nmero para o tipo PPM,
uma vez que cada pixel representado pelas trs componentes RGB da
respectiva cor.
76
A ordenao dos valores dos pixels corresponde a varredura das imagens linha a
linha, de cima para baixo, e da esquerda para a direita em cada uma das linhas.
Quando o contedo da imagem for representado em ASCII, os valores
correspondentes aos pixels sero apresentados em notao decimal e separados por espaos
em branco, marcas de tabulao ou marcas de fim de linha.
As variantes binrias dos tipos PBM, PGM e PPM armazenam os valores
correspondentes aos pixels das imagens em caracteres (bytes) contguos, sem qualquer
separador entre valores consecutivos. O tipo PBM combina os valores de cada 8 pixels
consecutivos num nico caracter (byte). Os tipos PGM e PPM, fazem corresponder a cada
pixel um caracter para PGM e trs caracteres para PPM.
Para as variantes ASCII dos trs tipos de formato, aplicam-se ainda as seguintes
regras:
permitida a insero de comentrios em qualquer parte do arquivo. O incio
de um comentrio assinalado por um caracter "#" e todo o texto desde este
caracter at ao fim da respectiva linha interpretado como texto do comentrio.
comprimento mximo de cada linha est limitado a 70 caracteres. Esta limitao
deriva da especificao inicial visando a transmisso de imagens por correio
eletrnico.
77
2.3 Formato RAW

O formato RAW o mais simples dos formatos. Os valores dos pixels so salvos
em duas ordenaes, da esquerda para direita e de cima para baixo, um valor de cada vez.
Para imagens em nveis de cinza com valores na faixa 0 a 255, 8 bits (ou 1 byte) por pixel
suficiente. Consequentemente, uma imagem NxM ocupa NxM bytes, com cada byte
correspondendo ao valor de um pixel.
A desvantagem deste formato que o tamanho original da imagem no pode ser
detectado diretamente pela inspeo do arquivo. Por exemplo, uma imagem 256x512 no
pode ser diferenciada de uma imagem 512x256, a no ser que a imagem seja visualizada na
tela.
Todos os outros formatos so criados de forma que o arquivo contenha
informaes teis sobre a imagem, em um cabealho, incluindo tamanho, mapeamento das
cores (para imagens pseudo coloridas, ou seja, aquelas que usam uma tabela de cores), entre
outras informaes.
78
Apndice 3 - Codificao Run Length (RLE)
Conforme abordado e descrito em [AGOOO], o mtodo Run-Length Encoding
(RLE), tambm conhecido como RLC (Run-Length Coding), busca reduzir a redundncia de
codificao e, quando usada em conjunto com outros mtodos, como a codificao de
Huffman, torna a redundncia de codificao aproximadamente igual a zero. A idia bsica
substituir uma seqncia de smbolos iguais pelo nmero de ocorrncias do smbolo e o
prprio smbolo [EGG99],
Por exemplo, a seguinte seqncia de smbolos:
0AAAAA7CCCCCCCCC5555
seria codificada por RLE como:
105A179C45
No exemplo, obteve-se uma taxa de compresso de 2:1, mas pode-se perceber que
para seqncias de smbolos com elevado grau de variao, pode-se chegar num resultado
extremamente indesejvel, que a compresso negativa [MIA99]. Em imagens,
normalmente existem muitas repeties de pixels, por isso, a codificao RLE pode ser
muito interessante.
Na representao em duas dimenses, que a forma como as imagens so
armazenadas em computador, o processo a codificao RLE pode ser feito e vrias
formas. A seqncia de dados analisados pode determinar maiores ou menores taxas de
compresso, por isso, o objetivo determinar a seqncia com maior nmero e repeties
possveis. A seqncia mais natural e simples e implementar a apresentada na Figura
A3.1(b), onde feita uma varredura que inicia no canto superior esquerdo da imagem,
79
vai at o final da linha, volta para o inicio da prxima linha e assim sucessivamente,
at que a varredura chegue no canto inferior direito da imagem. A Figura A3.1(c)
apresenta o mesmo processo seqencial anterior, mas com as colunas sendo varridas ao
invs das linhas. Uma soluo muito interessante a codificao em ziguezague, onde
a varredura feita em diagonal, comeando no canto superior esquerdo e indo at o
canto inferior direito a imagem. A codificao em ziguezague muito utilizada em
conjunto com a tcnica DCT. A codificao RLE em ziguezague apresenta na Figura
A3.1(a)
(a) Codificao em ziguezague.
*
*
(b) Codificao ao longo do eixo X.
(c)
80
(c) Codificao ao longo do eixo Y.
Figura A3.1 - Codificao RLE (a) em ziguezague, (b) por linha e (c) por coluna.
Existem trs diferentes formas bsicas de se efetuar a codificao RLE no que diz
respeito a qual o elemento atmico a ser codificado. A Figura A3.2(a) mostra a codificao
em nvel de bit, o que significa que o bit a unidade bsica a ser codificada, onde utiliza um
byte para armazenar as informaes sobre os bits. Utiliza um contador com 7 bits para
armazenar o nmero de ocorrncias e 1 bit para armazenar o bit que foi encontrado. A
codificao tambm pode ser a nvel de byte, mostrado na Figura A3.2(b), onde o byte o
elemento atmico e so necessrios dois bytes para cada pacote, o primeiro para armazenar o
nmero de ocorrncias em seqncia do smbolo e o segundo o prprio smbolo a ser
codificado. Por fim, a Figura A3.2(c) mostra a codificao a nvel de pixel, onde a unidade
bsica um pixel, que ocupa trs bytes.
Contada
7 6
(a) Pacote RLE a nvel de bit.
Contador Valor
7 07 0
(b) Pacote RLE a nvel de byte.

- Valor-
Canal 1 Canal 2 Canal 3
Contad do pixel do pbtel dopccel
. . T - ; --v.^. ' *-
1*255 3-255 0-255 0-255

-u t
(a) Pacote RLE a nvel de pixel.
Figura A3.2 - Diferentes formas de codificao do RLE.

82
Apndice 4 - Imagens e Senogramas Utilizados
As seguintes figuras correspondem as imagens reconstrudas e respectivos
senogramas que foram utilizadas na realizao dos testes neste trabalho. O termo
reconstruo usado aqui no se trata da aplicao do processo inverso utilizado para
comprimir os dados, mas sim o processo que permite reconstruir a imagem de tomografia a
partir das projees.
Nos senogramas, com 16 bits por pixel, o preto corresponde ao pixel de valor 0 e o
branco corresponde ao pixel de valor 65.535. Nas imagens reconstrudas, com 8 bits por
pixel, o preto corresponde ao pixel de valor 0 e o branco corresponde ao pixel de valor 255.
As figuras A4.1, A4.2 e A4.3, so senogramas reais gerados por um tomgrafo
industrial e suas respectivas imagens reconstrudas. Embora as dimenses dos senogramas
sejam 768 colunas por 90 linhas e 16 bits por pixel, totalizando um tamanho de 138.240
bytes, as imagens originais possuem tamanhos diferenciados, definidos pelo processo de
reconstruo, conforme segue: imagem "DenteOl" com 256 colunas por 256 linhas e 8 bpp,
totalizando 65.536 bytes, imagem "Dente02" com 176 colunas por 176 linhas e 8 bpp,
totalizando 30.976 bytes, e imagem "Dente03" com 112 colunas por 112 linhas e 8 bpp,
totalizando 12.544 bytes.
A seguir so apresentadas as figuras A4.4 at A4.9, constituindo as demais
imagens e com seus respectivos senogramas, tambm utilizados nos testes deste trabalho. Os
Senogramas possuem 256 colunas por 90 linhas com 16 bits por pixel, totalizando 43.080
bytes. As imagens possuem 256 colunas por 256 linhas com 8 bits por pixel, totalizando
65.536 bytes.
83
Na seqncia, as figuras A4.10 at A4.19, so os senogramas resultantes e
respectivas imagens com a insero de percentuais de rudos, a partir do senograma "Abdom"
e sua imagem.
Conforme comentado no item 5.5, as imagens aqui mostradas, com rudos, no
representam a imagem reconstruda a partir do seu senograma com rudo. Elas tambm
tiveram rudos inseridos, a partir da imagem original, nas mesmas porcentagens, a fim de se
verificar a influncia tanto no senograma quanto na imagem. A influncia no senograma
muito maior devido a amplitude do seu sinal, que representado por 2 bytes, podendo
assumir valores entre 0 e 65.535. Na imagem, a influncia do rudo menor porque a
amplitude do sinal representado por 1 byte, podendo assumir valores entre 0 e 255.
Imagem A4.1 - Senograma "DenteOl" e imagem reconstruda de um dente.

Imagem A4.2 - Senograma "Dente02" e imagem reconstruda de um dente.
Imagem A4.3 - Senograma "Dente03" e imagem reconstruda de um dente.

Imagem A4.4 - Senograma "Abdom" e imagem reconstruda de um abdomem.
Imagem A4.5 - Senograma "Brain" e imagem reconstruda de um crebro.

86
Imagem A4.7 - Senograma "Hernia" e imagem reconstruda de vrtebra com hrnia.

Imagem A4.8 - Senograma "Phantom" e imagem de testes representando uma cabea.
Imagem A4.9 - Senograma "Trax" e imagem reconstruda de um trax.

Imagem A4.10 - Senograma "Abdom" e imagem com percentual de 0,1% de rudo.
Imagem A4.11 - Senograma "Abdom" e imagem com percentual de 0,2% de rudo.

89
-Vvv -
Imagem A4.12 - Senograma "Abdom" e imagem com percentual de 1% de ruido.
Imagem A4.13 - Senograma "Abdom" e imagem com percentual de 2% de rudo.

90
p : , ; .. <i.
<V

-;<Vi
Imagem A4.11 - Senograma "Abdom" e imagem com percentual de0,2%de rudo.

93
(d) "Phantom" (f) "Trax"
Imagem A4.20 - Senogramas com insero de percentual padro de 1% de rudo.

94
Referncias Bibliogrficas
[AGOOO] AGOSTINI, L.V., "Estudo de Padres de Compresso de Imagens para

Aplicaes VLSI", Trabalho Individual de Pos-Graduao, UFRGS, Porto
Alegre, 2000.
[ALM98] ALMEIDA, AB., "Usando o Computador para Processamento de Imagens

Mdicas", Revista Informtica Mdica, Vol. 1, N.6, Dezembro, 1998.
[CAL97] CALDERBANK, R. C., DAUBECHIES, I., SWELDENS, W., e YEO, B.,

"Lossless Image Compression using Integer to Integer Wavelet Transforms",
International Conference on Image Processing (ICIP), v. 1, p. 596-599, 1997.
[DAU88] DAUBECHIES, I., "Orthonormal Bases of Compactly Supported Wavelets",

Communications on Pure and Applied Mathematics, v. 41, pp. 909-996,
November, 1988.
[DIC01] DICOM-Digital Imaging and Communications in Medicine, "The DICOM

Standard", Published by National Electrical Manufacturers Association,
Copyritht 2001. "http://medical.nema.org".
[EGG99] EGGER O., FLEURY P., EBRAHIMI T., KUNT M., . "High-Performance
Compression of Visual Information - A Tutorial Review - Part I: Still Pictures"
Proceedings off the IEEE, v.87, n.6, pp. 976-1011, June, 1999.
[GRA95] GRAPS, A., "An Introduction to Wavelets", IEEE Computational Science and
Engineering, v. 2, n. 2, 1995.
[GR084] GROSSMAN, A , MORLET, J., "Decomposition of Hardy Functions into

Square-Integrable Wavelets of Constant Shape", SIAM Journal of Math. Anal., v.
15, n. 4, pp. 723-736, July, 1984.
[HOG98] HOGARTH, M.E., S ABBATINI, R.M.E., "Informtica e a Medicina do Sculo

21", Revista Informtica Mdica, Vol. 1, N.2, Abril, 1998.
[HUA94] HUANG, K., SMITH, B., "Experiments with a Lossless JPEG Codec", June,
1994. "http://www.cs.a>mell.edi^nfo/Projects/zeno/Projects/LJPG.html".
[JAI89] JAIN, A. K., "Fundamentals of Digital Image Processing", Prentice Hall, 1989.
[JAW94] JAWERTH, B., SWELDENS, W., "An Overview of Wavelet Based

Multiresolution Analyses", SIAM Rev., v. 36, n. 3, pp. 377-412,1994.
[MAL89] MALL AT, S. G., "A Theory for Multiresolution Signal Decomposition: The
Wavelet Representation", IEEE Transactions on Pattern Analysis and Machine
Intelligence, v. 11, n. 7, July, pp. 674-693, 1989.
95
[MAROO] MARCELLIN, M. W., GORMISH, M. J., BILGIN, A , BOLIEK, M. P., "An
Overview of JPEG-2000", Proceedings of 2000 Data Compression Conference,
Snowbird, March, 2000.
[MAR99] MARQUES, F. O., NETO, H. V., "Processamento Digital de Imagens", Rio de

Janeiro, Brasport, ISBN 85-7452-009-8, 1999.
[MED01] MEDEIROS, L. F., "Reconstruo de Imagens Tomogrficas com Redes Neurais

Parcialmente Conectadas", Dissertao de Mestrado, DINF/UFPR, Curitiba,
2001.
[MEL94] MELO, A. C. W. P., "Compresso de Imagens em Escala de Cinza Utilizando a

Transformada Wavelet", Dissertao de Mestrado, CEFET-PR, Curitiba, 1994.
[MLA99] MIAO, J., "Compressed Image File Formats - JPEG, PNG, GIF, XBM, BMP",
Addison Wesley Longman Inc., USA, 1999.
[NET98] NETO, J.F., ALCOCER, P.R.C., "Compresso de Imagens Mdicas Utilizando a

Tcnica JPEG-DPCM", IV Frum Nacional de Cincia e Tecnologia em Sade,
p. 411-412, Curitiba, 1998.
[MUR96] MURRAY J. D., VANRYPER W., "Encyclopedia of Graphics File Formats,

Second Edition", O'Reilly & Associais Inc, USA, 1996.
[PEN93] PENNEBAKER, W. B., MITCHELL, J. L.: "JPEG Still Image Data Compression
Standard", Ed. Van Nostrand Reinhold, 1993.
[RIB96] RIBEIRO, E. P., 'Tomografia de Susceptibilidade Magntica com Magnetmetro

Supercondutor SQUID", Tese de Doutorado, PUC-RJ, Rio de Janeiro, dezembro,
1996.
[SAI96] SAID, A., PEARLMAN, W. A., "A New Fast and Efficient Image Codec Based
on Set Partitioning in Hierarchical Trees", IEEE Transactions on Circuits and
Systems for Video Technology, v. 6, n. 3, pp. 243-249, June, 1996.
[SAN01] SANCHES, I., "Compresso sem Perdas de Projees de Tomografia

Computadorizada usando a Transformada Wavelet", Dissertao de Mestrado,
Departamento de Informtica, UFPR, Curitiba, 2001.
[SHA93] SHAPIRO, J. M., "Embedded Image Coding using Zerotrees of Wavelet

Coefficients", IEEE Transactions on Signal Processing, v. 41, n. 12, pp. 3445-
3462, December, 1993.
[SWE97] SWELDENS, W., "The Lifting Scheme: A Construction of Second Generation

Wavelets", SIAM J. Math. Anal, v. 29, n. 2, pp. 511-546, 1997.
[ZIV77] ZIV, J., LEMPEL, A., "A Universal Algorithm for Sequential Data
Compression", IEEE Transactions on Information Theory, v. IT-23, n. 3, p. 337-
343, May, 1977.

2002 Avaliação Da Taxa de Compressão Sem Perdas CT

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2002 Avaliação Da Taxa de Compressão Sem Perdas CT

Enviado por

Direitos autorais:

Formatos disponíveis

VALDIR MARTINS

AVALIAO DA TAXA DE COMPRESSO

Dissertao apresentada como requisito parcial

Orientador: Prof. Eduardo Parente Ribeiro

Ns, abaixo assinados, membros da Banca Examinadora da defesa de

Curitiba, 30 de agosto de 2002.

'rof. Dr. Eduardo Parente Ribeiro

Prof.ODrl Humberto Gamba

Prof. Dr. Hlio Pedrini

Agradeo primeiramente a Deus pela oportunidade concedida e por nos ajudar a

vencer as dificuldades e obstculos.

Agradeo a minha esposa e filhos pelo amor, incentivo, pacincia e compreenso

pelas horas ausentes.

Ao meu orientador, professor Eduardo Parente Ribeiro, pela segurana como

orientou e grande contribuio dada na realizao deste trabalho.

Ao colegas mestres, Ionildo e Luciano, pelas contribuies e disponibilizao de

informaes como programas e imagens, utilizadas em suas teses, as quais possibilitaram a

realizao dos experimentos e finalizao deste trabalho.

Agradeo ainda aos demais colegas do curso de ps-graduao em informtica, aos

APNDICE 1 - PADRES DE COMPRESSO DE IMAGEM 61

APNDICE 3 - CODIFICAO RUN LENGTH (RLE) 78

APNDICE 4 - IMAGENS E SENOGRAMAS UTILIZADOS 82

Figura 2.1 - Geometria da obteno das projees em CT 9

Tabela 3.1 - Contedo da janela LZ77 e da Entrada durante a compresso 23

Tabela 3.2 - Contedo da sada a cada passo da compresso 24

Tabela 3.3 - Descompresso dos dados do exemplo por LZ77 25

Tabela 3.4 - Representao dos smbolos e seus respectivos intervalos iniciais 28

Tabela 3.5-Processo de codificao do exemplo de codificao aritmtica 29

Tabela 3.6 - Processo de decodificao do exemplo de codificao aritmtica 30

Tabela 3 .7 - Proditores para o Lossless JPEG 34

Tabela 3.8 - Tabela de categorias e valores de diferena 35

Tabela 5.3 - Compresso dos senogramas simulados 48

Tabela 5.4 - Compresso para o senograma "Abdom" com insero de rudo 49

Tabela 5.5 - Compresso do senogramas com rudo padro 51

Tabela 5.6 - Compresso das imagens de TC 52

Tabela 5.7 - Compresso para a imagem "Abdom" com insero de rudo 53

Tabela 5.8 - Taxa de compresso considerando o tamanho original da imagem 54

Tabela 5.9 - comparao entre as mdias das compresses 56

Tabela A2.1 - Cabealho de arquivo do formato BMP 71

Tabela A2.2 - Cabealho de imagem do formato BMP 72

Tabela A2.3 - Continuao do cabealho de imagem do formato BMP 72

Tabela A2.4 - Identificador de tipo para os formatos PBM, PGM e PPM 75

tomografia computadorizada, chamadas senogramas. A principal vantagem em se comprimir

o senograma ao invs da imagem reconstruda consiste em se preservar os dados originais, o

o processo de reconstruo. So avaliados trs mtodos de compresso sem perda:

This work presents a case study of lossless compression of computerized tomography

utilizada e tornou-se uma ferramenta indispensvel em hospitais, clnicas e empresas de todo

o mundo. As projees de tomografia computadorizada so obtidas com medidas realizadas

externamente, a partir de diferentes ngulos de um corpo. A partir destas projees, os dados

originais devem ser reconstrudos utilizando-se tcnicas apropriadas. Vrias tcnicas e

das projees obtidas.

Dado ao grande volume de dados gerados nas imagens digitais, torna-se

imprescindvel a necessidade de se aplicar alguma tcnica de compresso de dados, visando

facilitar o armazenamento e a transmisso, mas garantindo a expanso e permitindo o

processamento desses dados.

Atravs do processo de compresso de dados podemos reduzir a quantidade de bits

necessrios para representar uma determinada quantidade de informao. Vrios mtodos de

compresso de dados sem perdas (reversveis) e com perdas (irreversveis) tm sido

propostos na literatura. Cada um desses mtodos procura explorar determinadas

caractersticas da imagem. A escolha do mtodo apropriado depende do conhecimento da

teoria do mtodo, bem como, um prvio conhecimento das caractersticas presentes na

imagem. Desta maneira possvel alcanar maiores taxas de compresso.

tomografia computadorizada, investigando o comportamento de cada um deles sobre estes