Escolar Documentos
Profissional Documentos
Cultura Documentos
Huffman
Huffman
Huffman
PROJETO DE PESQUISA
1. TTULO DO PROJETO:
Estudo sobre cdigo de Huffman para compactao de arquivos gerados por sistema de
cadastro de informaes pessoais.
2. JUSTIFICATIVA e REVISO BIBLIOGRFICA:
Atualmente comum deparar-se com pessoas ou organizaes que
necessitam armazenar ou transferir em seus computadores ou redes arquivos de
grande porte. Entretanto, mesmo que a capacidade de armazenamento e o
processamento dos computadores sejam suficientes para os recursos j
disponveis, o tempo de transferncia e o espao fsico requerido para o
armazenamento so elevados, surgindo assim a necessidade de compactao
desses arquivos para obter maior agilidade de transferncias e exigindo menos
espao em memria para armazen-los. Existem vrios algoritmos de
compactao, contudo nesse projeto o algoritmo a ser estudado o algoritmo de
Huffman cuja escolha ocorreu por conta de que um algoritmo de amplo uso na rea da
computao para compactao de dados como: imagens, vdeos e principalmente arquivos
de textos.
Segundo Gonzalez (2009) uma das tcnicas mais populares para resolver a
redundncia de codificao foi elaborada por Huffman em 1952. Por codificar individualmente
os smbolos de uma fonte de informao, tendo como resultado o menor nmero possvel de
smbolos-cdigo por smbolo-fonte. O cdigo de Huffman um mtodo de compactao que
usa as probabilidades de ocorrncia dos smbolos no conjunto de dados a ser compactado
para determinar cdigos de tamanho varivel para cada smbolo. Tem por objetivo a
construo de uma rvore Binria baseada na frequncia de uso das letras do alfabeto de
modo que as mais frequentemente utilizadas apaream mais perto da raiz. Esta arvore
binria construda de baixo para cima (das folhas para raiz), comeando a partir das letras
menos usadas at atingir a raiz. No inicio do algoritmo, cada uma das letras forma uma
arvore que e composta apenas pela raiz e cujo contedo e a frequncia com que esta letra
ocorre no arquivo em questo. Em seguida, so escolhidas as duas arvores com a menor
frequncia associadas e elas so unidas em uma s arvore cujo valor da raiz a soma do
valor destas duas. Este processo repetido at a existncia de uma nica arvore.
No padro de codificao de carcteres American Standard Code for Information
Interchange (ASCII), cada caractere codificado com o mesmo nmero de bits por caractere,
ou seja, 8 bits. Desta maneira, h 256 (28) possveis combinaes para representar os
caracteres em ASCII. Os caracteres mais comuns, como os alfanumricos, pontuao e
caracteres de controle usam apenas 7 bits. 128 (27) caracteres diferentes podem ser
codificados com 7 bits. A codificao de Huffman compacta os dados usando um nmero
menor de bits para codificar os caracteres que ocorrem com mais frequncia de maneira que
nem todos os caracteres precisem ser codificados com 8 bits. Considerando a string: bom
esse bombom. Usando a codificao ASCII (8 bits por caractere), os 16 caracteres dessa
string usam 128 bits. O quadro a seguir ilustra como a codificao funciona.
Fonte: http://www.inf.ufes.br/~pdcosta/ensino/2009-1-estruturas-de-dados/material/CodificacaoHuffman.pdf
A string bom esse bombom seria escrita numericamente assim: 98 111 109 32 101 115 115
101 32 98 111 109 98 111 109. Em binrio, seria assim: 0110 0010 0110 1111 0110 1101 0010
0000 0110 0101 0111 0011 0111 0011 0110 0101 0010 0000 0110 0010 0110 1111 0110 1101
0110 0010 0110 1111 0110 1101.
Considerando a utilizao de uma codificao baseada em 3-bits por caractere:
Quadro 2 codificao com 3 bits
6. REFERNCIAS (ABNT)
SZWARCFITER, Jayme Luiz; MARKENZON, Lilian. Estruturas de Dados e seus
Algoritmos. Editora LTC - Livros Tcnicos e Cientficos. Rio de Janeiro - RJ. 1994.
GONZALEZ, Rafael C. WOODS, Richard E. Processamento Digital de Imagens. Edio 3.
ed. So Paulo SP: Pearson Prentice Hall. 2009
AGUILAR, Luis Joyanes. Programao em C++ Algoritmos, Estrutura de Dados e
Objetos. 2. ed. So Paulo: Mcgraw-hill, 2008.
JASCONE, Fbio Luis Tavares. Prottipo de Software para Ocultar Texto Criptografado
em Imagens Digitais. 2003. 64 f. TCC (Graduao) - Curso de Cincia da Computao,
Universidade
Regional
de
Blumenau,
Blumenau,
2003.
Disponvel
em:
<http://www.bc.furb.br/docs/MO/2003/278719_1_1.pdf>. Acesso em: 26 jun. 2014
LINHARES, Gilmara; DINIZ, Janderson; CORREIA, Suzete. Estudo de Algoritmos para a
Compresso de Imagens. 2007. 10 f. Artigo (Mestrado) - Curso de Cincia da Computao,
Centro Federal de Educao Tecnolgica da Paraba, Joo Pessoa, 2007. Disponvel em:
<http://www.redenet.edu.br/publicacoes/arquivos/20080127_130921_INFO-021.pdf>. Acesso
em: 26 maio 2014.
BRAGA, gor Assis; LADEIRA, Marcelo. Um Modelo Adaptativo para a Filtragem de
Spam. 2013. 10 f. Artigo (Mestrado) - Curso de Cincia da Computao, Departamento de
Departamento de Cincia da Computao, Universidade de Braslia (unb), Braslia, 2013.
Disponvel em: <http://www.cos.ufrj.br/~ines/enia07_html/pdf/27985.pdf>. Acesso em: 26 maio
2014.
UNIVERSIDADE FEDERAL DO ESPRITO SANTO (Espirito Santo). A Codificao de
Huffman. 2009. Disponvel em: <http://www.inf.ufes.br/~pdcosta/ensino/2009-1-estruturas-dedados/material/CodificacaoHuffman.pdf>. Acesso em: 26 maio 2014.
6. GRUPO
Willian Jefferson Meurer, Luan Alano Formentin, Bruno Goulart
7. PROFESSORES
PRISCYLA WALESKA TARGINO DE AZEVEDO SIMES, CHRISTINE VIEIRA, GILBERTO
VIEIRA DA SILVA, PAULO JOO MARTINS