GRR20062344
Curitiba
2009
ii
RESUMO
ABSTRACT
This monograph includes two processes: to understand the main existent digital
audio formats and detail the differences among them. It includes an explanation about
how analog audio is converted to digital using PCM. The digital formats are categorized
in three types: No compression, lossless compression and lossy compression. At last,
are presented four methods to determine a comparison among the standards and are
included examples of the comparisons. Some results of the methods are included in the
attached CD-ROM.
iii
SUMÁRIO
1. INTRODUÇÃO .................................................................................................................... 1
2. NOÇÕES DE SISTEMAS DIGITAIS ................................................................................. 6
2.1 Modulação por código de pulsos .............................................................................. 7
2.2 Quantização ............................................................................................................. 7
2.3 Taxa de amostragem ................................................................................................ 8
2.3.1 Teorema de Nyquist ..................................................................................... 9
2.3.2 Anti-aliasing ................................................................................................. 9
2.3.3 Jitter ............................................................................................................ 10
2.4 Conversores Analógico/Digital e Digital/Analógico ............................................. 11
2.5 Compactação de dados .......................................................................................... 12
2.5.1 Compactação de áudio com auxílio de codificação perceptiva.................. 14
3. FORMATOS DE ÁUDIO ................................................................................................. 17
3.1 Sem compactação ................................................................................................... 17
3.2 Compactação com perdas ...................................................................................... 18
3.3 Compactação sem perdas ...................................................................................... 20
4. CODIFICADORES E DECODIFICADORES .................................................................. 22
5. METODOLOGIA .............................................................................................................. 24
5.1 Processos de comparação ....................................................................................... 24
5.1.1 Verificação de bits ...................................................................................... 24
5.1.2 Verificação de artefatos .............................................................................. 25
5.1.3 Teste ABX .................................................................................................. 26
5.1.4 Análise de espectrogramas ......................................................................... 27
5.2 Fatores de influência............................................................................................... 30
5.2.1 Taxa de compactação.................................................................................. 30
5.2.2 Consumo de recursos do sistema................................................................ 30
5.3 Métodos de comparação ......................................................................................... 30
6. CONCLUSÃO ................................................................................................................... 33
7. REFERÊNCIAS ................................................................................................................. 45
7.1 Livros ..................................................................................................................... 45
7.2 Internet ................................................................................................................... 45
7.3 Periódicos .............................................................................................................. 45
8. ANEXOS ............................................................................................................................ 47
1. INTRODUÇÃO
1
Adaptado, forma abstrata para comparar as diferentes naturezas físicas entre bits e átomos
(NEGROPONTE, 1995, Cap. 1)
2
Acrônimos de Compact Disc e Digital Video Disc. (HOLMES, 2006, p. 55 – 56)
3
Memória de computador não volátil (não perde informações quando desligada) que pode ser apagada e
reprogramada.
4
Chip termo informal para circuito integrado, pen-drive é o termo popular para dispositivo flash com
barramento serial universal (USB) e SSD é acrônimo de Solid Stage Drive, dispositivo que possivelmente
substituirá os discos rígidos em equipamentos portáteis devido a sua melhor eficiência energética e
ausência de partes mecânicas móveis.
2
5
A dificuldade de controle de distribuição de arquivos digitais facilitou a prática de cópias e distribuição
ilegal de material de propriedade autoral em redes como a Internet.
6
O fato de não haver uma forma confiável de verificar a autenticidade das informações digitais sem
consulta ao autor é um dos motivos pelos quais as informações digitais ainda não são consideradas
seguras como única forma de divulgação.
7
A referência ao início da década de 1980 também é realizada como “revolução de música digital” no
período em que a distribuição de músicas em CD superou a de vinis. (FRIES, 2000, Cap. 1. HOLMES,
2006, p. 53)
3
8
Existem filtros específicos para manipular imagens digitais e causar efeitos como ocultar imperfeições
indesejadas. Nesse caso o processo é intencional e dirigido, e não um artefato causado por compressão de
imagens.
9
No capítulo 2.3 estão categorizados os tipos de compactação de dados e no capítulo 3 são tratados os
formatos de compactação de áudio.
10
O termo artefato designa ao resultado de imperfeição artificial.
11
O uso dos termos “compressão”, “compactação de áudio” está adaptado conforme o guia de tecnologia.
(HOLMES, 2006, p. 55 – 56)
4
12
MPEG Layer III. Desenvolvido por Instituto Fraunhofer. (ISO/IEC 11172-3, ISO/IEC 13818-3)
5
13
iPod é um reprodutor portátil de mídias de autoria da empresa Apple Inc.
14
A influência causada por reprodutores de música portáteis e disseminação de música pela Internet na
maneira como as pessoas adquirem e ouvem música é também referenciada por vários autores.
(KAHNEY, 2005, p. 5. MOSTERT; APOLZON, 2007 p. 144. FRIES, 2000, p. 9 - 40)
6
15
Acrônimo em inglês Pulse Code Modulation. (HOLMES, 2006, p. 231)
7
2.2 Quantização
16
Compact Disc (red book) e Digital Audio Tape.(HOLMES, 2006, p. 53 – 55 e p. 67 – 68)
17
São exemplos de quantizadores que utilizam memória: DPCM, DM e ADPCM. (SPANIAS, PAINTER,
ATTI. 2007, p.51)
8
esses valores são convertidos para o código binário. Os números decimais estão
representados em binários agrupados em 4 bits. Verifica-se que mesmo que o valor
possa ser representado com apenas 1 bit (como os valores 0 ou 1) todos são
representados sempre com 4 bits. No entanto, 16 valores são insuficientes para desenhar
formas de ondas que se assemelhem com o sinal acústico.
Sistemas de 4 bits apenas são usados para produzir sinais sonoros tipicamente
eletrônicos como beeps. Sistemas de 8 bits possibilitam desenhar ondas mais
complexas, sintetizadores de 8 bits foram muito utilizados nos primeiros jogos
eletrônicos e em campainhas sofisticadas. Num sistema 16 bits são possíveis 65.536
valores, isso possibilita desenhar formas de onda bastante complexas e com isso
registrar satisfatoriamente material musical. Existem sistemas de 24 e 32 bits18 usados
utilizados no processo de digitalização do áudio para garantir melhor representação das
formas de ondas. Quanto maior a taxa de bits, maiores são as possibilidades de
representação dos sons e mais aproximada é a representação do sinal analógico em
digital.
O sinal quantizado juntamente com o sinal discreto formam o sinal digital que
representa o áudio.19
18
Sistemas 24 e 36 bits são capazes de representar respectivamente 16 milhões e 4,3 bilhões de valores.
19
WATKINSON, 1994b, p. 199
9
2.3.2 Anti-aliasing22
No CD o sinal contínuo de áudio (analógico) passa por um circuito-filtro (low-
pass filter) que corta frequências mais altas que 20 kHz (frequência de Nyquist mais
10% de margem23) antes de ser codificado em digital. Essa é a maneira mais simples de
evitar que a energia dessas frequências interfira no processo de conversão do sinal
analógico para digital gerando falsas frequências. Essa técnica se chama anti-aliasing.
20
Unidade de medida em homenagem ao físico alemão Heinrich Rudolf Hertz (unidade também
representada por Hz).
21
Explicação do teorema está suficientemente reduzida apenas para adequar as propostas desse trabalho.
O teorema de Nyquist é composto por inúmeras operações algébricas aqui não mencionadas.
22
Conceituração conforme os autores. (WATKINSON, 1994b, p. 198-202. HOLMES, 2006, p. 5)
23
Atualmente a margem de corte de frequências em reprodutores de CD varia de acordo com o fabricante
e tecnologia empregada.
10
2.3.3 Jitter25
Jitter é uma distorção causada pela instabilidade de um sinal sincronizador, ou
seja, os conversores de sinais digital para analógico e analógico para digital não
capturam amostras com exatamente a mesmo tempo como deveriam, então é gerada
uma distorção no sinal. Quanto mais instáveis são os conversores de sinal maior a
quantidade de Jitter do sistema.
Em vídeo podem ser percebidos pequenas flutuações e vibrações na imagem
causando irregularidades na exibição, normalmente são linhas horizontais tão finas
quanto as próprias linhas do monitor de vídeo ou da televisão.
24
Método utilizado para aumentar a amostragem acima da amostragem do teorema de Nyquist, isso
permite que o sinal seja filtrado digitalmente ao invés de usar filtros como o low-pass analógico. O
resultado é uma maneira mais efetiva de eliminar as frequências acima da faixa audível. (HOLMES,
2006, p. 220)
25
Representação resumida de Jitter conforme a conceituação dos autores. (WATKINSON, 1994b, p. 211-
215. ZÖLZER, 2008, p. 80)
11
26
Acrônimo de Random Acess Memory, memória volátil (perde informações ao ser desligada) de
computador capaz de armazenar informações.
27
Componente eletrônico composto por uma lâmina de cristal comprimida com características
piezoelétricas que tende a ressonar em determinada frequência. A frequência depende do material,
dimensões e temperatura.
12
(nível 255) representará 5 volts, logo 2,5 volts será representado por 10000000 (nível
128) e assim por diante.
Os conversores podem ser calibrados para trabalhar com uma infinidade de
equipamentos. Os conversores são fundamentais para que as pessoas possam usar
computadores de uma forma mais intuitiva. Os computadores têm uma grande
quantidade de conversores A/D que conhecemos como câmera de vídeo, escâner, leitor
de impressão digital, sensores de temperatura e movimentos, entrada da placa de áudio,
entre outros. Conversores D/A também são conhecidos como monitores de vídeo,
impressoras, LEDs no painel e no teclado, bipes emitidos pela placa-mãe, saída da placa
de áudio, movimentos de um robô entre outros. Sem esses conversores o uso de
computadores só seria possível através de cartões perfurados, talvez o conversor mais
rústico existente.
Em áudio os conversores intermediam informações digitais (da maioria das
vezes codificada em PCM) para áudio analógico. A eficácia dos conversores interfere
diretamente na qualidade de gravação e reprodução do sinal de áudio.
28
O termo discoteca aqui se refere ao acervo de gravações em discos .
29
Desenvolvimento do MP3 a partir da década de 1980. Lançamento do IPOD em Setembro de 2001.
MP3 como padrão para músicas na Internet e datas de desenvolvimento e comercialização de novas
tecnologias conforme as referências. (SPANIAS, PAINTER, ATTI. 2007)
30
ATRAC (Adaptive Transform Acoustic Coding) e MD (MiniDisc) são marcas em desenvolvimento e de
propriedade de Sony Corporation. ATRAC é um formato de compactação de áudio com perdas.
14
31
No que se refere a uma informação particular, mensagem ou linguagem.
15
32
SOLARI, 1997
16
At each layer, MPEG Audio coding allows input sampling rates of 32, 44.1 and
48 kHz and supports output bit rates of 32, 48, 56, 64, 96, 112, 128, 192, 256
and 384 kbits/s. The transmission can be mono, dual-channel (e.g. bilingual),
or stereo. Another possibility is the use of joint stereo mode in which the audio
becomes mono above a certain frequency. This allows a lower bit rate with the
obvious penalty of reduced stereo fidelity.
(WATKINSON, 1994b, p. 303)
3. FORMATOS DE ÁUDIO
33
Sound Design 2, autoria de Digidesign
34
Audio Unit, autoria de Sun Microsystems
35
Resource Interchange File Format, autoria de Microsoft e IBM
36
Audio Interchange File Format, autoria de Apple e Electronic Arts
37
Existem formatos AIFF e WAVE compactados (normalmente mencionados como AIFC e
WAVPACK)
18
38
Os metadados podem conter nome da música, do compositor, dos músicos participantes, número da
faixa, título do álbum, letra da música, informações sobre direito de cópia e até foto ou arte do álbum.
39
A criação do primeiro chip decodificador de MP3 foi liderada pelo engenheiro alemão Otto Witte.
(Fraunhofer Magazine 2.2000 p. 22 - 25 e 39)
19
40
KAHNEY, 2005
41
FhG é o acrônimo registrado do codificador de propriedade do Instituto Fraunhofer.
20
42
AAC é acrônimo de Advanced Audio Coding. Um formato compactado com perdas de áudio parte do
família de padrões MPEG-2 (ISO/IEC 13818-7 e HOLMES, 2006, p. 4).
43
Mais informações sobre os processos de codificação e decodificação são encontrados no capítulo 4.
44
Sistema de transmissão de áudio multicanal via Internet para gravação disponível pelo software Source-
connect (http://www.sourceelements.com)
21
Em 1965, Gordon Moore, que mais tarde fundou a Intel45 ao lado de Bob
Noyce, previu que a capacidade de um chip de computador dobraria
anualmente. (...) Até hoje46 as previsões para os chips se mantiveram e a média
– uma duplicação a cada dois dezoito meses – é chamada, entre os engenheiros,
de Lei de Moore.
(GATES, 1995, p. 48)
45
Empresa fabricante de circuitos integrados e processadores mais presentes nos computadores até hoje.
46
A “lei de Moore” não é mais verdadeira a partir de meados da década de 2000, pois a capacidade dos
chips de computador alcançou um nível complicado de ser aumentado devido a limitações diversas. Hoje
os chips continuam a ser melhorados, mas não seguem as previsões de Moore.
47
Wiki (ou Wikiweb) é um modelo de página da Internet que possui um sistema capaz de ser atualizado
coletivamente pelos usuários, assim como a enciclopédia Wikipédia. No entanto, o modelo wiki passou a
ser adotada por vários outros sites especializados (principalmente por programadores de software) com
fim de tornar mais fácil o uso da Internet desse sistema para desenvolver um banco de informações
dinâmico sobre pesquisas em andamento principalmente na área da informática e tecnologia.
(http://wiki.hydrogenaudio.org/)
22
4. CODIFICADORES E DECODIFICADORES
48
De acordo com vários fóruns (http://wiki.hydrogenaudio.org/index.php?title=Xing)
24
5. METODOLOGIA
49
O uso do termo “melhores formatos” considera os que possuem maior redução de tamanho, menor uso
de recursos do sistema e menor perda de informações (aplicável a formatos com perdas).
25
técnica é útil para provar cientificamente que o formato de compactação sem perdas é
realmente eficaz.
A verificação mais simples é observar se o áudio apresenta exatamente o mesmo
tamanho inicial ao ser compactado e descompactado pelo formato em questão. Caso
apresente alguma diferença de tamanho em bits o formato necessariamente o modificou
e isso o tira da categoria de formato de sem perdas.
Mesmo apresentando o mesmo tamanho em bits os processos de codificação e
decodificação podem ter alterado alguma informação. Pode-se verificar se o arquivo
final é idêntico ao original usando software de comparação binária50, esse método
compara os arquivos bit por bit e mostra se há diferenças. Caso sejam encontradas
diferenças o processo de codificação e decodificação alterou o conteúdo do arquivo.
Existem programas que comparam especificamente o conteúdo PCM de vários
formatos de áudio como o software gratuito “libsndfile”51.
Esse software é capaz de comparar o conteúdo PCM dos seguintes formatos:
AIF, AIFC, CAF, FLAC, HTK, MAT4, MAT5, PAF, PVF, RAW, SD2, SF, SND,
SVX, VOC, W64 e WAV. A comparação do conteúdo PCM é útil e bastante direta, pois
permite comparar diretamente o formato original e compactado. “libsndfile” não possui
interface gráfica e opera somente em modo de comando.
50
Há comandos que realizam comparação binária que são partes de sistemas operacionais como o “fc”
que é parte dos sistemas Microsoft Windows NT, os comandos “diff” e “cmp” são parte dos sistemas
operacionais UNIX/Linux. Para sistemas Apple MacOS não há comandos de comparação incluídos, mas
podem ser utilizados softwares compiláveis em OSX como o “KDiff”, software livre (GNU/GPL) de
autoria de Joachim Eibl. (http://kdiff3.sourceforge.net/)
51
libsndfile é software livre registrado sob GNU/LGPL pelo programador Australiano Erik de Castro
Lopo. (http://www.mega-nerd.com/libsndfile/)
26
artificial. Quanto maior o nível desse resíduo mais diferentes são os sinais de áudio
entre os dois arquivos.
52
Também conhecido como “teste cego”.
53
A Estatística usa níveis de significância para garantir que o resultado não aconteça por acaso, a
significância de um teste é a probabilidade máxima de rejeitar acidentalmente uma hipótese nula.
27
54
Exemplos de softwares para aplicação do teste ABX: ABX comparator (foobar plug-in), LinABX,
MacABX, PCABX e WinABX.
55
Os espectrogramas fazem uso de mais cores (e também de legenda) para detalhar melhor as variações
de intensidade de energia, as cores estão mantidas nos espectrogramas contidos no CD-ROM em anexo a
esse trabalho.
28
56
foobar2000 é gratuito e compatível com sistemas NT. É possível gerar espectrogramas de qualquer
formato de áudio compatível com foobar2000. (http://www.foobar2000.org/)
57
Spectro é compatível com sistemas NT. Na versão 1.0.93 é possível gerar espectrogramas de resolução
limitada a partir dos formatos: APE, FLAC, MP3 e WAV. (http://spectro.enpts.com/)
58
sndfile-tools é software livre registrado sob GNU LGPL pelo programador Australiano Erik de Castro
Lopo Esse pacote de softwares é de fácil compilação na maioria dos sistemas UNIX e LINUX (bem como
Mac OSX) e pode ser portado para sistemas NT. (http://www.mega-nerd.com/libsndfile/tools/)
29
59
Figura 8: Gráfico do limiar absoluto de audição de um jovem no silêncio
59
Gráfico adaptado (SPANIAS; PAINTER; ATTI, figura 5.1 p. 114)
30
Para comparar entre o formato original e de compactação sem perdas pode ser
usado o método de verificação de bits apenas para constatar que a compactação
realmente é capaz de decodificar exatamente o sinal de áudio original.
Para comparar entre o formato original e de compactação com perdas podem ser
usados os métodos de verificação de artefatos, teste ABX e análise de espectrogramas.
Para essa pesquisa foi utilizado o software gratuito Spectro. Esse software foi
escolhido por ser capaz de ler diretamente formatos APE, FLAC, MP3 e WAV,
evitando a necessidade de um software intermediador para recodificar os formatos ou
visualizar o gráfico, Spectro também foi escolhido por sua facilidade de uso. Spectro
ainda foi capaz de identificar o codificador nos arquivos gerados por LAME, mas não
nos arquivos gerados pelo FhG usado no teste, felizmente isso não altera a eficácia dos
gráficos.
gerado um som com forma de senóide que varia de 0.1 Hz até 20 kHz durante 20
segundos em função gráfica linear com ajuda do software livre sndfile-generate-chirp60.
O som gerado foi compactado nos padrões 320, 256, 128 e 96 kbps. A configuração de
geração do som foi realizada de modo que o som aumente em 1 kHz a cada segundo,
facilitando a identificação da frequência de corte auditivamente.61 Também foram
realizados gráficos com o software Spectro.
60
O software sndfile-generate-chirp faz parte do pacote de softwares sndfile-tools já mencionado no
capítulo 5.1.4.
61
Existem várias outras experiências realizadas para verificar corte de frequências entre codificadores.
(http://sombrasil.ig.com.br/centralmp3/teste_frequencias.htm)
33
6. CONCLUSÃO
62
“High-end”: Termo usado comercialmente para designar equipamentos de áudio doméstico com
componentes de alta performance usados para audiófilos. A qualidade dos componentes pode interferir no
resultado sonoro. (também referido como “Hi-end”)
34
Um cabo de fibra ótica de longa distância que transmite 1,7 bilhão de bits de
informação de uma estação repetidora (algo como um amplificador) para outra
tem largura de banda suficiente para fazer 25 mil ligações telefônicas
simultâneas. O número de ligações possíveis cresce significativamente se elas
forem comprimidas63, pela remoção de informação redundante, tais como as
pausas entre palavras e frases, de forma que cada ligação consuma menos bits.
(GATES, 1995, p. 128)
Para Gates, em seu livro que tratou da adoção de comunicação intermediada por
computador, o uso de tecnologia de compactação de dados aumenta a capacidade de
ligações simultâneas numa mesma infra-estrutura. E, de fato, grande parte das
comunicações telefônicas digitais já utilizam compactação de dados de áudio em tempo
real em suas centrais.
Vários softwares de vídeo-conferência via Internet utilizam compactadores de
áudio e vídeo que adequam a transmissão de dados de acordo com a largura de banda do
dinamicamente a fim de possibilitar intercomunicar usuários com diferentes condições
63
Aqui o termo compression foi traduzido como compressão, o uso do termo não se refere ao controle
dinâmico de nível (compressor de áudio), mas sim à compactação de áudio como utilizado nessa
monografia.
35
de acesso à Internet. O primeiro software de grande repercussão mundial que deu acesso
ao serviço de vídeo-conferência e a VOIP64 foi o Skype65.
64
Acrônimo de “voz sobre protocolo de Internet”. Sistema que possibilita intercomunicar computadores
com o sistemas telefônicos externos à Internet.
65
Skype é propriedade de Skype Limited
66
Acrônimo de Digital Compact Cassette gravador e reprodutor digital de fita com direitos registrados
por Philips e Matsushita (HOLMES, 2006, p. 75)
67
Amplificador de classe H corresponde a uma categoria de projeto eletrônico de baixo consumo elétrico,
leve e possível de ser miniaturizado.
36
68
WATKINSON, 1994b, p. 21
37
70
Figura 9: Gráfico mostrando a falha repentina em compactação com perdas
69
Identificação humana refere-se ao processo de identificar as perdas do processo de compactação de
áudio por comparação das percepções acústica entre o material original e o de compressão com perdas.
70
Gráfico adaptado (WATKINSON, 1994b, figura 5.7, p. 286)
39
Até certo ponto a compactação com perdas pode diminuir o tamanho do arquivo
removendo sons adicionais fora da entropia perceptiva, ou seja, sem que a qualidade do
som seja afetada de forma sensível a audição humana. Após esse ponto a qualidade é
cada vez mais degradada e cada vez mais audível.
Em alguns algoritmos, principalmente usados por codificadores configurados no
modo rápido, a queda de qualidade é repentina e bastante acentuada como mostrada no
gráfico da Figura 9. Compactadores com perdas mais eficientes são capazes de realizar
maiores taxas de compactação causando menos distorções perceptíveis, dessa forma o
gráfico resultante possui uma curva menos intensa. Compactadores sem perdas realizam
compactação sem afetar a qualidade perceptível, dessa forma a resultante do gráfico
será uma linha reta paralela ao eixo horizontal.
Existe um limite para compactação sem perdas, esse limite é diferente para cada
algoritmo específico. Na maioria dos casos quanto maior a compactação sem perdas,
mais uso de recursos de sistema faz e mais lento é o processo. Há diversas tabelas no
CD-ROM anexo a esse trabalho. Dentre as tabelas há uma com uma grande quantidade
de resultados comparando diferentes gêneros musicais, é possível verificar que músicas
que contém elementos constantes (como a constante batida comum em músicas
eletrônicas) foram mais eficazmente compactadas que outras com menos constâncias.
71
Resposta ao comando exibida pelo codificador LAME 3.98.2 em terminal de comando em sistema
Microsoft Windows NT.
41
72
A quantidade de amostras adicionadas varia conforme o codificador e decodificador, foram verificados
valores entre 528 (LAME) e 1160 (FhG).
73
Foi utilizada a música “Communication” do grupo “Bela Fleck & The Flecktones” extraída do álbum
“Greatest Hits of the 20th Century” de 1999.
42
74
Nível de dB Full Scale. Escala usada para mensurar o nível em áudio digital, varia de 0 (valor máximo)
até menos infinito (valor mínimo)
43
através do software Exact Audio Copy75, programa capaz de extrair áudio de CDs com
verificação de precisão exata. Durante o processo de extração de áudio de CDs podem
ocorrer perdas de informações devido à erros normalmente não reportados pela maioria
dos programas que efetuam esse procedimento.
Estão armazenados também diversos pacotes de softwares gratuitos como
foobar2000, KDiff3, libsndfile, sndfile-tools, Spectro e os codificadores FLAC e
LAME.
75
Exact Audio Copy (EAC) é um software alemão gratuito sob a licença Postcartware e está disponível
em: http://www.exactaudiocopy.de/
45
7. REFERÊNCIAS
7.1 Livros
ALDRICH, Nika. Digital audio explained: For the audio engineering. 2ª ed. –
BookSurge. 2004 - 403 p. ISBN: 141960001X
FRIES, Bruce. The mp3 and internet audio handbook: your guide to the digital music
revolution, 1.ª ed., Burtonsville: Teamcom books, 2000 - 268 p. ISBN 1-928791-
10-7
GATES, Bill. A Estrada para do futuro. Tradução de Beth Vieira. São Paulo:
Companhia das Letras. 1995 – 347 p. ISBN: 85-7164-509-4
HOLMES, Thom. The routledge guide to music technology. 1.ª ed. New York: Taylor
and Francis Group. 2006 – 373 p. ISBN: 0-415-97324-4
KAHNEY, Leander. The cult of ipod. 1.ª ed. San Francisco: No starch press. 2005 – 151
p. ISBN: 1-59327-066-6
MOSTERT, Frederick W.; APOLZON, Lawrence E. From Edison to iPod. New York:
DK Publishing. 2007 – 288 p. ISBN: 978-0-7566-2602-0
NICHOLAS, Negroponte. Being digital. 1.ª ed. New York: Vintage Books. 1996 – 255
p. ISBN: 0-679-76290-6
RATTON, Miguel. Dicionário de áudio e tecnologia musical. 2.ª ed. Rio de Janeiro:
Música & Tecnologia. 2009 – 190 p. ISBN: 978-85-89402-13-2
_____. Midi total: Fundamentos e aplicações. 1.ª ed. Rio de Janeiro: Música &
Tecnologia 2005 - 369 p. ISBN: 85-89402-05-3
SOLARI, Stephen J. Digital vídeo and áudio compression. 1.ª ed. New York:McGram-
Hill Professional. 1997 – p. 187 – 211 ISBN: 0-07-059538-0
SPANIAS, Andréas; PAINTER, Ted; ATTI, Venkatraman. Audio signal processing and
coding. 1.ª ed. New Jersey: John Wiley & Sons, Inc. 2007 – 464 p. ISBN: 978-0-
471-79147-8
_____. The art of digital audio. 3.ª ed. Woburn: Focal Press. 1994b – 753 p. ISBN: 0-
240-51587-0
46
_____. The mpeg handbook. 1.ª ed. Woburn: Focal Press. 2001 – p.130-131 ISBN: 0-
240-51656-7
ZÖLZER, Udo. Digital audio signal processing. 2.ª ed. Hamburg: Helmut Schmidt
University. 2008 – 334 p. ISBN: 978-0-470-99785-7
7.2 Internet
7.3 Periódicos
8. ANEXOS
o FLAC
o Foobar2000
o KDiff3
o LAME
o libsndfile
o sndfile-tools
o Spectro