Você está na página 1de 10

UNIVERSIDADE DE SO PAULO

INSTITUTO DE CINCIAS MATEMTICAS E DE


COMPUTAO - SO CARLOS

SCC0661 - Multimdia e Hipermdia


Prof. Marcelo Manzato

Listas de exerccio - 1 a 4

Aluno:
Jonas Dourado
6445442

So Carlos,
27 de setembro de 2011

Lista 1
1. D a sua prpria definio de multimdia para a rea computacional, com base no que foi discutido em
aula.
Multimdia a utilizao de mais de um tipo de mdia com o intuito de transmitir uma mensagem.
2. Voc classificaria um dispositivo tal como o iPod Classic como um sistema multimdia? Se sim, liste
os diferentes tipos de mdia que ele suporta. Para cada mdia listada, classifique- a de acordo com a
finalidade (percepo, representao, apresentao, armazenamento e transmisso) e dependncia do
tempo (discreta ou contnua). Sim, o iPod suporta vdeos, fotos, msicas, texto. As tabelas seguintes
classificam a mdia de acordo com a finalidade
Persepo
Visual
Auditiva

Mdia
vdeo, foto, texto
vdeo, msica

Representao
ASCII
MPEG
MP3
JPEG
Apresentao
LCD
Headphone
Armazenamento
Memria flash interna
Transmisso
USB

Mdia
texto
vdeo
msica
foto

Mdia
vdeo,foto, texto
vdeo,msica
Mdia
vdeo, msica, foto, texto

Mdia
vdeo, msica, foto, texto

Granularidade
Contnua
Discreta

Mdia
vdeo, msica
foto, texto

3. Aponte qual a motivao em comprimir dados digitais.


O principal motivo de se comprimir dados contornar a capacidade de armazenamento e transmisso,
ou seja, trabalhar com um contedo de maior qualidade utilizando a mesma capacidade de armazenamento e transmisso(No esquecer que h necessidade de maior processamento).

4. aconselhvel realizar compresso lossy em textos? Por qu?


No, pois texto uma mdia onde h a necessidade de ser apresentada em sua forma original, caso
contrrio, pode no ser entendida.
5. Seja um determinado tipo de informao que usualmente codificado por longas strings que alternam
zeros e uns, como, por exemplo, 010110101010010101010101110101. possvel adaptar o algoritmo de
codificao por carreira (run-length) para obter boas taxas de compresso para esse tipo de informao?
Explique e mostre como seria o resultado da compresso para a string dada como exemplo. (Dica: pense
em substrings de tamanho maior que 1)
Uma boa forma de se realizar a compresso ao ter dois pares de numeros binarios iguais seguidos, o prximo par identificaria o nmero de cpias seguidas. Utilizando essa codificao ficaria
0101001010100101110111010100.
6. D exemplo de uma situao em que a codificao por diferenas pode ocasionar perdas.
A perda pode ocorrer quando a variao entre aplitudes sucessivas maior do que a maior delta
possvel de acordo com o nmero de bits escolhidos para o delta. Um bom exemplo quando uma som
gravado em WAV com muitos instrumentos de frequncias e alturas bem distintas, ao ser codificado
por diferenas, ocorre distores.
7. O que significa dizer que a rvore de Huffman tem a propriedade do prefixo? Qual a vantagem dessa
propriedade?
A propriedade do prefixo na rvore de Huffman significa que nenhum cdigo prefixo de outro. A
vantagem que ao decodificar, como nenhum cdigo prefixo de outro cdigo, o cdigo que se encontra
no incio do arquivo comprimido no apresenta ambiguidade. Pode-se simplesmente identificar este
cdigo inicial, traduzi-lo de volta ao caracter original e repetir o processo no restante do arquivo
comprimido.
8. Sabe-se que uma das vantagens da codificao aritmtica que ela sempre atinge o valor da entropia.
Cite uma de suas principais desvantagens, intrinsicamente relacionada com o hardware em que ela
executada.
A desvantagem intrinsicamente relacionada ao hardware que o tamanho do cdigo determinado
pela preciso de ponto flutuante da mquina.
9. Decodifique a string representada pelo cdigo 0,44220. Dado o alfabeto formado por A, C, O e S cujas
probabilidades so: P(A) = 0,4 P(C) = 0,3 P(O) = 0,1 P(S) = 0,1 P(.) = 0,1
0,44220 est entre 0,4 e 0,7 C 0,44220 est entre 0,4 e 0,52 A 0,44220 est entre 0,4 e 0,448 A 0,44220
est entre 0,4384 e 0,4432 S 0,44220 est entre 0,44176 e 0,44224 O 0,44220 est entre 0,442192 e
0,44224 .
10. Explique como uma palavra decodificada utilizando o algoritmo LZW.
A palavra decodificada utilizando o dicionrio criado dinamicamente.

Lista 2
1. A digitalizao de udio se baseia em transformar um sinal de udio analgico, com valores expressos
em Volts, para um sinal de udio digital, com valores expressos em bits. Isto necessrio para que o
computador possa operar sobre o sinal de udio. A digitalizao pode ser dividida em duas etapas: a
amostragem e a quantizao. Explique o que ocorre com o sinal de udio em cada um delas.
A amostragem realiza aferies em tempo predeterminado, convertendo a onda mecnica do som em
sinal eltrico. A quantizao atribui um nvel (dentre os pr determinados) equivalente a tenso do
sinal eltrico.
2. Para que fosse possvel fazer o processo inverso da digitalizao, isto , atravs do sinal digital reconstruir o analgico, seriam necessrias amostras infinitas do sinal de modo que no houvesse distores
que causassem perda da qualidade. Felizmente, h um teorema que dita qual a taxa de amostragem
mnima para que um sinal no sofra distores ao ser reconstrudo.
a. Qual este teorema e qual a taxa de amostragem mnima a ser adotada?
o teorema de Nyquist que diz: Para obter uma representao precisa de um sinal analgico, sua
amplitude deve ser amostrada a uma taxa mnima igual ou superior ao dobro da componente de mais
alta freqncia presente no sinal. Ou seja, a taxa mnima pelo menos o dobro da maior frequncia
amostrada.
b. Qual o fenmeno que ocorre caso no seja obedecido o teorema? Explique.
Ocorre o aliasing, que quando um sinal de maior frequncia interpretado como um sinal de menor
frequncia devido a baixa amostragem do sinal.
3. Diferente do que acontece na amostragem, a quantizao do sinal de udio no possui nenhum teorema.
a. Neste caso, qual a abordagem a ser seguida para obter um bom nmero de bits a ser usado por
amostra?
Tem que ser de tamanho suficiente para que seja semelhante com o sinal amostrado e pequeno o
suficiente de forma que no fique muito grande.
b. Explique o que acontece quando se utilizam poucos bits por amostra.
Acontece distores, pois sinais de nveis visivelmentes diferentes acabam sendo quantizados na mesma
faixa de valor.
4. Podemos considerar o PCM (Pulse Code Modulation) como um padro para codificao de udio. Uma
verso melhorada desse padro, o ADPCM (Adaptive Differential Pulse Code Modulation), possibilita
a codificao do udio com boa compresso utilizando-se a codificao por diferenas modificada para
fazer lookahead. Explique como essa codificao feita e o porqu da utilizao de um lookahead.
O algoritmo faz lookahead durante a compresso para adaptar a escala de diferenas de acordo com o
tamanho da mudana. O lookahead necessrio para verificar se h a necessidade de mudar a escala
de diferenas.

5. O MP3 (MPEG-1 Audio Layer 3) um dos padres mais conhecido e utilizado para codificao de
udio. A boa taxa de compresso atingida envolve a mistura de diferentes tcnicas de compresso
lossy e lossless, bem como explora caractersticas do modelo psico-acstico humano, sendo elas: a
sensibilidade do ouvido, o mascaramento de frequncias e o mascaramento temporal.
a. Explique cada uma das caractersticas do modelo psico-acstico humano.
Sensibilidade de audio A resposta psicolgica a cada frequncia de som.
Mascaramento de frequncia Uma frequncia em conjunto com outra prxima pode no ser percebida
Mascaramento temporal Aps ouvir um som alto, por um pequeno instante, o ouvido humano no
consegue perceber sons mais baixos.
b. Como o algoritmo do MP3 explora cada uma dessas caractersticas para obter a compresso
do udio?
O algoritmo do MP3 explora sensibilidade de audio, mascaramento de frequncia e mascaramento
temporal obter uma boa compresso de udio.

Lista 3
1. Cones e bastonetes so fotorreceptores importantes para o sistema visual humano. Cada um est
presente em diferentes regies e sensvel a caractersticas diferentes. Por ns possuirmos quantidades
bem diferentes de cada um, somos mais sensveis a uma caracterstica do que a outra, o que explorado
na compresso de vdeos e imagens. Defina a funo dos cones e dos bastonetes e a qual caracterstica
o olho humano mais sensvel.
Os cones so responsveis pela captao de cores e os bastonetes so responsveis pela captao de
intensidade luminosa. O olho humano mais sensvel a intensidade luminosa.
2. O CCD o dispositivo responsvel pela captura de imagens.
a. Explique seu funcionamento.
O sensor CCD um dispositivo que tem uma malha de clulas e cada clula captura a intensidade da
luz.
b. No que difere a captura pelo CCD de imagens em tons de cinza em relao a imagens coloridas?
O sensor o mesmo, a diferena que ao capturar cor, um filtro separa cada cor(RGB) e direciona
para um CCD diferente(h a necessidade de ter 3 sensores CCD).
3. Quanto tempo seria necessrio para transmitir uma imagem truecolor sem compresso com resoluo
1024x768 em uma rede a 1.5 Mbps? (Dica: pesquisa quantos bits por canal existem para uma imagem
truecolor)
X x Y x Bits/pixel
1024x768x24 = 18.874.368 bits = 18 Mbps
18/1.5 = 12 segundos
So necessrios 12 segundos para transmitir essa imagem sem compresso.
Ao realizar os clculos do exerccio 3, voc consegue perceber a real necessidade de compresso em imagens (e qualquer outro tipo de mdia digital). Felizmente, imagens possuem muitos dados redundantes
que podem ser explorados visando compresso. Os prximos exerccios so relacionados s tcnicas
que permitem explorar os trs tipos de redundncia encontrados em imagens: redundncia estatstica,
redundncia espacial e redundncia psicovisual.
4. Explique o que a redundncia estatstica e quais tcnicas j estudadas anteriormente podem ser
utilizadas para explor-la?
Redundncia estatstica a transmisso da mesma informao utilizando simbolos mais frequentes,
representaes menores. Podemos aplicar codificao Huffman e aritmtica.
5. Qual a diferena entre redundncia estatstica e redundncia espacial? D uma tcnica sem perdas e
uma tcnica com perdas que pode ser utilizada para remoo da redundncia espacial.
A redundncia espacial leva em conta a interdependncia entres pixels vizinhos, enquanto a estatstica,
leva em conta a probabilidade de cada smbolo. Um tcnica lossless a codificao delta(por diferenas)
e uma com perdas a codificao por transformadas.
5

6. A utilizao de transformadas DCT um passo importante na remoo de redundncias psicovisuais.


Apenas sua utilizao, porm, no comprime os dados. Explique ento o porqu de ela ser importante.
A transformada DCT importante pois ela diminui a redundncia psicovisual dos smbolos.
7. Explique o processo de compresso JPEG, destacando em que momentos ocorrem as remoes de
redundncias espacial, estatstica e psicovisual.
A compresso JPEG comea dividindo a imagem em blocos de 8x8 pixels. Em seguida ocorre a transformada DCT, que auxilia no processo de remoo de redundncia psicovisual. Aps a transformada
DCT, ocorre a quantizao, que de fato remove a redundncia psicovisual. Logo depois, ocorre a
codificao da imagem, que realiza uma codificao por diferena e uma codificao runlength que eliminam a redundncia espacial e ento realiza uma codificao por Huffman que elimina a redundncia
estatstica. Por fim, ocorre a construo do quadro, onde grava os headers e os blocos.
(Exerccio extra - opcional)
8. Faa uma pesquisa sobre o funcionamento do padro GIF. Aps entender como ele funciona, responda:
Para a compresso de uma foto de paisagem qual mtodo ir obter a melhor taxa de compresso, JPEG
ou GIF? Por qu?

Lista 4
1. Um sinal de vdeo nada mais do que uma sequncia de imagens (ou quadros) que, quando amostrada
e reproduzida a certa frequncia, provoca a sensao de movimento.
a. Qual a frequncia (Hz ou fps frames per second) utilizada pelo padro de TV?
As frequncias dos sinais de cores mais difundidos so aproximadamente 30Hz para o padro NTSC e
25Hz para o padro PAL.
b. Qual a vantagem e desvantagem da amostragem progressiva e da entrelaada? ] A vantagem
da amostra progressiva a menor largura de banda necessria, e a desvantagem a
2. Em relao compresso, qual a vantagem de se transformar o espao de cores de um quadro de RGB
para YCbCr?
A vantagem que o espao de cores YCbCr separa a luminncia e crominncia, o que facilita a
manipulaes de vdoes (ex. reduo da redundncia psicovisual), j que o olho humano tem maior
sensibilidade a luminncia
3. Explique as diferenas e consequncias de utilizao dos formatos de amostragem Y Cb Cr 4:4:4, 4:2:2 e
4:2:0.
4:4:4 - Um componente Y, Cb e Cr para cada pixels - Mantm a qualidade de crominncia da imagem,
entretanto ocupa espao maior. 4:2:2 - A cada 4 Y na horizontal, existem 2 Cb e Cr - Balano entre
qualidade de crominncia com economia de espao. 4:2:0 - A cada 4 Y, existem um Cb e um Cr Economiza espao, entretanto diminui a qualidade de crominncia da imagem.
4. Pelo fato de o vdeo se tratar de uma sequncia de quadros, podemos aplicar a cada um as tcnicas de
compresso relacionadas a imagens, para remoo de redundncias estatsticas, espaciais e psicovisuais.
Alm disso, o vdeo traz um novo tipo de redundncia que pode ser explorado. Explique qual este
tipo e como ele pode ser explorado para aumentar a compresso.
O vdeo alm das compresses aplicveis a imagens podem tambm ser comprimido reduzindo-se a
redundncia temporal. Essa redundncia temporal pode ser explorada usando predio entre as cenas.
5. Explique o porqu de os mtodos de previso de movimento serem classificados como no perfeitos. O
que se pode fazer para melhorar a estimativa?
O vdeo pode apresentar movimentos que so maiores que a predio pode prever, para melhorar
necessrio incluir mecanismos de compensao de movimento.
6. Durante a codificao, cada quadro recebe um nome especial, dependendo de como ser codificado.
a. Defina o que so quadros I, P e B.
Quadros I - So quadros codificados independentemente, usando JPEG.
Quadros P - So quadros que armazenam estimativa e compensao de movimentos a partir do quadro
anterior. Propagam erros.

Quadros BI - So quadros que armazenam estimativa e compensao de movimentos a partir do quadro


anterior e posterior. No propagam erros.
b. Defina GOP span e Prediction span.
GOP span: o nmero de quadros entre dois quadros I.
Prediction span: o nmero de quadros entre um quadro P e outro quadro I ou P imediatamente
anterior.
c. Qual a limitao encontrada nos quadros P?
A limitao dos quadros P que eles propagam erros.
d. Qual a vantagem e desvantagem da utilizao de quadros B?
A vantagem de utilizao de quadros B o aumento da compresso, e a desvantagem que aumenta o
tempo de codificao e descodificao, pois h a necessidade de esperar por um prximo quadro I ou
P.
7. A evoluo das tcnicas de codificao, bem como das tecnologias de transmisso e reproduo multimdia, resultou na criao dos padres MPEG-4 e H.264.
a. Cite duas caractersticas do padro MPEG-4 que o diferenciam de seus antecessores.
As duas caractersticas que diferencia o padro MPEG-4 dos seus antecessores a incluso do conceito
de objetos e a incluso da possibilidade de interagir com a cena.
b. Cite vantagens da utilizao do padro H.264.
As vantagens so observadas no armazenamento e na transmisso dos dados, pois o H.264 permite uma
maior compresso de vdeo.
8. Muitas pessoas erroneamente entendem que a extenso de arquivo de vdeo (.AVI, por exemplo) representa a compresso que est sendo utilizada, sendo que na verdade, ela somente um formato de
representao. Explique a diferena entre formatos de representao e formatos de codificao.
Um fomato de representao pode conter diversos formatos de codificao desde que suportados pelo
formato de representao.

Referncia
1. http://www.ic.unicamp.br/ rezende/ensino/mo417/2010s2/Slides/Aula17.pdf

Você também pode gostar