Escolar Documentos
Profissional Documentos
Cultura Documentos
Anais Aesbr2004
Anais Aesbr2004
de Engenharia de udio
da AES-Brasil, apresentado na
VIII Conveno Nacional da AES-Brasil
Apresentao
Crditos
Trabalhos
Autores
apresentao
Sejam todos bem vindos VIII Conveno Nacional da Sociedade de Enge-
nharia de udio AES Brasil. A AES uma sociedade mundial, sem fins lucrati-
vos, cujo objetivo estimular o estudo e o desenvolvimento da engenharia de
udio. A AES est dividida em regies e essas regies esto subdivididas em
sees. A Seo Brasil da AES foi criada em 1996 e pertencem a essa seo todos
os membros da AES residentes no Brasil. Com mais de 50 anos desde sua funda-
o, a AES a nica sociedade profissional dedicada exclusivamente tecnologia
de udio.
A AES serve aos seus membros, indstria e ao pblico em geral, estimu-
lando e facilitando os avanos no campo dinmico da engenharia de udio. Ela
apia e dissemina novos desenvolvimentos atravs de reunies tcnicas, de
exposies de equipamentos profissionais e do seu conceituado peridico Journal
of the Audio Engineering Society.
As Convenes da AES Brasil consistem de exposies e palestras convida-
das e, desde o ano de 2003, incluem um Congresso Cientfico. Este ano, estamos
realizando o II Congresso Brasileiro de Engenharia de udio. Esse Congresso
visa a dar Conveno tambm um carter cientfico/acadmico, apresentando
trabalhos tcnicos relacionados aos avanos da rea de engenharia de udio. A
organizao tcnica do Congresso contou com a participao ativa de trs im-
portantes universidades brasileiras (UFRJ, UFSC e USP). Os trabalhos foram
selecionados por um corpo de revisores formado basicamente por professores/
pesquisadores atuantes na rea de engenharia de udio e suas reas correlatas.
Esperamos que esta Conveno seja um marco memorvel na histria da
Sociedade de Engenharia de udio AES Brasil. Todos ns, Comisso
Organizadora, Comisso Tcnica, revisores e ainda os autores dos artigos tcni-
cos submetidos ao Congresso, fizemos o mximo para alcanar essa meta.
Coordenao Geral:
Joel Brito (AES-Brasil)
Coordenao Tcnica:
Luiz Wagner Pereira Biscainho (UFRJ)
Comisso Tcnica:
Marcelo Knrich Zuffo (USP)
Regis Rossi Alves Faria (USP)
Rosalfonso Bortoni (Studio R)
Rui Seara (UFSC)
Sergio Lima Netto (UFRJ)
Sidnei Noceti Filho (UFSC)
Relao de Revisores:
crditos
Andr Lus Dalcastagn
Barbedo, Jayme G. A.
autores
Estado da Arte da Classificao de Sinais de udio.
Biscainho, Luiz W. P.
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.
Bortoni, Constncio
Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.
Bortoni, Rosalfonso
Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.
Carvalho, Delmar B.
Sistema Adaptativo para Caracterizao de Alto-Falantes.
Costa, Mrcio H.
Sistema Adaptativo para Caracterizao de Alto-Falantes.
Diniz, Paulo S. R.
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.
Autores
Esquef, Paulo A. A.
autores
Interpolao de Sinais de udio Usando Polinmios do Par de Linhas
Espectrais.
Freeland, Fbio P.
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.
Haical, Rafael C.
Sistema Adaptativo para Caracterizao de Alto-Falantes.
Herrera, Chistian G.
Uma Reviso sobre Metodologia para Avaliao Subjetiva de
Componentes de udio.
Itturri, Fbio P.
Sistema Adaptativo para Caracterizao de Alto-Falantes.
Lopes, Amauri
autores
Estado da Arte da Classificao de Sinais de udio.
Seara, Rui
Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.
Ullmann, Walter
Anlise de Viabilidade da Aplicao de Filme Fino Metlico em Cones
e Domos de Alto-Falantes.
Yamamoto, Roberto K.
Anlise de Viabilidade da Aplicao de Filme Fino Metlico em Cones
e Domos de Alto-Falantes.
Impermeabilizao de Cones de Papel de Alto-Falantes com Plasma
de CF4/H2.
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
nd
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42 Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.
___________________________________
Uma Reviso Sobre Metodologias Para Avaliao Subjetiva de
Componentes de udio
1HVWH WUDEDOKR p GLVFXWLGD D QHFHVVLGDGH GD H[HFXomR GH WHVWHV DXGLWLYRV VXEMHWLYRV SDUD D DYDOLDomR GH
RESUMO
1
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 2
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
LPSOHPHQWDGD TXDQGR R FRPSRQHQWH D VHU DYDOLDGR p JUDYDomR SRU UHPHWHU R RXYLQWH D XPD UHIHUrQFLD
XPD FDL[D DF~VWLFD RX TXDQGR VH GHVHMD DYDOLDU R LQH[LVWHQWHQRPXQGRUHDO
FRPSRQHQWH VLPXODQGR FRQGLo}HV QRUPDLV GH *UDYDo}HV GH VRQV IDPLOLDUHV FRPR D YR] KXPDQD
RSHUDomR RX LQVWUXPHQWRV PXVLFDLV SRSXODUHV GHYHP VHU
6HQGR DVVLP DOJXQV UHTXLVLWRV D UHVSHLWR GDV SUHIHULGRV 2 FRQWH~GR GR HVSHFWUR GH IUHTrQFLDV GR
FRQGLo}HVDF~VWLFDVGRDPELHQWHRQGHDFRQWHFHRWHVWH FRQMXQWRGHJUDYDo}HVGHYHFREULUWRGDDIDL[DDXGtYHO
GHYHPVHUOHYDGDVHPFRQVLGHUDomR>@ KXPDQD
D WDPDQKR H JHRPHWULD GHYHP VHU XVDGDV VDODV $OJXQV WLSRV GH VLQDLV FRPR VHQyLGHV H UXtGRV
FRP iUHD VXSHULRU D P FRP Sp GLUHLWR EUDQFR RX URVD SRGHP VHU XWLOL]DGRV HP DYDOLDo}HV
VXSHULRU D P $ JHRPHWULD GHYH DSUHVHQWDU DXGLWLYDV 3RUpP FHUWR FXLGDGR GHYH VHU WRPDGR QD
FHUWD VLPHWULD ORQJLWXGLQDO SRUpP GHYHP VHU LQWHUSUHWDomR GRV UHVXOWDGRV SRLV HVWHV VLQDLV SRGHP
HYLWDGDV SDUHGHV SDUDOHODV SRLV SURSLFLDP R UHYHODU FDUDFWHUtVWLFDV GR VLVWHPD HP TXHVWmR TXH QmR
DSDUHFLPHQWRGHRQGDVHVWDFLRQiULDV SRGHULDPVHUSHUFHELGDVQRFDVRGDDXGLomRGHP~VLFD
E UHIOH[}HV R WHPSR GH UHYHUEHUDomR WtSLFR 8P H[HPSOR WtSLFR p R IHQ{PHQR GR VLVWHPD DXGLWLYR
57 FRPSDWtYHO FRP VDODV GH DXGLomR FRQKHFLGR FRPR PDVFDUDPHQWR RQGH XP WRP FRP
GRPpVWLFDVRX VDODVGHFRQWUROHHPHVW~GLRVGH DPSOLWXGH UHODWLYDPHQWH DOWD HQFREUH WRQV GH
JUDYDomR p GH r V 5HIOH[}HV TXH IUHTrQFLDV SUy[LPDV DGMDFHQWHV >@ 1HVWH FDVR
FDUDFWHUL]HPHFRVGHYHPVHUHOLPLQDGDV GLVWRUo}HV KDUP{QLFDV GH EDL[D RUGHP SRGHP SDVVDU
F UXtGR GH IXQGR R UXtGR GH IXQGR QD VDOD QmR GHVDSHUFHELGDV TXDQGR SURJUDPDV GH FRQWH~GR
GHYH H[FHGHU G%$ RX G%& QHP HVSHFWUDOFRPSOH[RFRPRP~VLFDVmRRXYLGRV
WDPSRXFR GHYH FRQWHU WRQV SHULyGLFRV 'HWHUPLQDGRV HVWLORV PXVLFDLV VmR HVWUDWpJLFRV SDUD
GRPLQDQWHVHJUXtGRVGH+]GHUHDWRUHVGH LGHQWLILFDomR GH SDUkPHWURV VXEMHWLYRV 6RQV
OkPSDGDVIOXRUHVFHQWHV SHUFXVVLYRVVmRLGHDLVSDUDDYDOLDomRGDFDSDFLGDGHGH
G SRVLFLRQDPHQWR GDV FDL[DV DF~VWLFDV D UHVSRVWD D WUDQVLHQWHV URFNQUROO VHUYH EHP QD
SUR[LPLGDGH D UHJL}HV OLPLWHV GD VDOD SDUHGHV DYDOLDomRGDUHVSRVWDHPIUHTrQFLDGRVLVWHPDP~VLFD
WHWR SLVR DOWHUD D FDUJD DF~VWLFD YLVWD SHOD VLQI{QLFD SRGH VHU LQWHUHVVDQWH GHYLGR jV JUDQGHV
FDL[DOHYDQGRDYDULDo}HVQDUDGLDomRGHEDL[DV YDULDo}HVGHGLQkPLFDQRUPDOPHQWHH[SORUDGDV
IUHTrQFLDV SULQFLSDOPHQWH 7DPEpP DV 2 QtYHO GH SUHVVmR VRQRUD 63/ GR SURJUDPD
UHIOH[}HV SULPiULDV GH DPSOLWXGH VLJQLILFDWLYD H[HFXWDGR GHYH VHU FRPSDWtYHO DR 63/ GDV IRQWHV
QRSHUtRGRGHDWpPVDSyVRVRPGLUHWRDWLQJLU VRQRUDV RULJLQDLV 8PD RUTXHVWUD VLQI{QLFD SRU
R RXYLQWH SRGHP HQIDWL]DU DV IUHTrQFLDV H[HPSOR SRGH FKHJDU DRV G%$ 7RGRV RV
PpGLDV WUD]HQGR XPD FRORUDomR LQGHYLGD DR FRPSRQHQWHV DYDOLDGRV GHYHP VHU SUHYLDPHQWH
SURJUDPDH[HFXWDGR(PDYDOLDo}HVGHLPDJHP FDOLEUDGRVGHPDQHLUDDQmRDSUHVHQWDUHPGLIHUHQoDVGH
VRQRUDGHVLVWHPDVPXOWLFDQDLVDVFDL[DVGHYHP LQWHQVLGDGHPDLRUHVTXHr G%HQWUHVL
ID]HU XP kQJXOR GH QR PtQLPR FRP R
RXYLQWHQRYpUWLFHGRkQJXOR
H SRVLFLRQDPHQWRGRVRXYLQWHVXPDGLVWkQFLDGH
CONDIES DOS OUVINTES
$ H[SHULrQFLD PRVWUD TXH DV KDELOLGDGHV GRV
QRPtQLPRPHWURGHTXDOTXHUSDUHGHGHYHVHU
RXYLQWHV HP SHUFHEHU GLIHUHQoDV V{QLFDV HP VH
PDQWLGD SDUD HYLWDU FRORUDo}HV HRX GLVWRUo}HV
FRQFHQWUDU GHYLGDPHQWH QR WHVWH RX GH UHDJLU GH
GH LPDJHP VRQRUD $ GLVWkQFLD GR RXYLQWH j
PDQHLUDFRQVLVWHQWHDGLYHUVDVUHSHWLo}HVGHXPPHVPR
FDL[DDF~VWLFDGHYHVHUFRHUHQWHDRWLSRGDFDL[D
HVWtPXOR VRQRUR YDULD FRQVLGHUDYHOPHQWH >@ 2V
FDPSRSUy[LPRFDPSRPpGLRHWF
SULQFLSDLV IDWRUHV TXH OHYDP D HVWD YDULDomR GH
FRPSRUWDPHQWR VmR DV FRQGLo}HV SVLFRILVLROyJLFDV GR
RXYLQWHEHPFRPRDVXDH[SHULrQFLDSUpYLD
CARACTERSTICAS DOS PROGRAMAS
$FRUUHWDVHOHomRHWUHLQDPHQWRGHLQGLYtGXRVSDUDD
EXECUTADOS
'HYHVHUGDGDSUHIHUrQFLDDSURJUDPDVDUPD]HQDGRV UHDOL]DomRGHDYDOLDo}HVVXEMHWLYDVHPFRPSRQHQWHVGH
HP PtGLDV GLJLWDLV GDGD D VXD PDLRU FDSDFLGDGH GH iXGLR SURSRUFLRQD PDLRU FRQILDELOLGDGH DR WHVWH XPD
PDQWHUDLQWHJULGDGHGRVGDGRVGXUDQWHDVXDYLGD~WLO YH]TXHIDWRUHVFRPRDUHSHWLWLELOLGDGHHDVLJQLILFkQFLD
DOpP GD SRVVLELOLGDGH GH VHUHP IHLWDV FySLDV SUHFLVDV GRVUHVXOWDGRVVmRPDQWLGRVVREPDLRUFRQWUROH2JUDX
GRPDWHULDOJUDYDGR GH FRQVLVWrQFLD GDV UHSRVWDV p PHQVXUDGR D SDUWLU GR
2EYLDPHQWH DV JUDYDo}HV XWLOL]DGDV GHYHP WHU VXD GHVYLR SDGUmR GD WD[D GH DFHUWRV SDUD XP FRQMXQWR GH
SURFHGrQFLD JDUDQWLGD QR TXH GL] UHVSHLWR jV WpFQLFDV DYDOLDo}HV
GH PLFURIRQDomR H FRQGLFLRQDPHQWR GRV VLQDLV
FDSWDGRV 4XDOTXHU WLSR GH SURFHVVDPHQWR HJ
HTXDOL]DomR FRPSUHVVmR GLQkPLFD GHVDELOLWD XPD
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 3
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
)LJXUD'LDJUDPDHVTXHPiWLFRGRGLVSRVLWLYRSDUDUHDOL]DomRGRWHVWH$%;
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 4
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 5
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
>@ $(6 $(6 5HFRPPHQGHG 3UDFWLFH 3HUIRUPDQFH - $XGLR (QJ 6RF YRO SS
IRU 3URIHVVLRQDO $XGLR 6XEMHFWLYH (YDOXDWLRQ RI -DQ)HE
/RXGVSHDNHUV$XGLR(QJLQHHULQJ6RFLHW\ >@ 9+DQVHQ(VWDEOLVKLQJD3DQHORI/LVWHQHUV
>@ 6UHQ %HFK 6HOHFWLRQ DQG 7UDLQLQJ RI DW %DQJ DQG 2OXIVHQ D 5HSRUW LQ 6 %HFK DQG 2 -
6XEMHFWV IRU /LVWHQLQJ 7HVWV RI 6RXQG5HSURGXFLQJ 3HGHUVHQ (GV 6\PS 2Q 3HUFHSWLRQ RI 5HSURGXFHG
(TXLSPHQW - $XGLR (QJ 6RF YRO SS 6RXQG *DPPHO $YHUQV 'HQPDUN
-XO\$XJ ,QJHQLUKMVNROHQcUKXV7HNQLNXPcUKXV'HQPDUN
>@ ,62 7KUHVKROG RI +HDULQJ $LU >@ 'DYLG &ODUN +LJK5HVROXWLRQ 6XEMHFWLYH
&RQGXFWLRQ DV D )XQFWLRQ RI 6H[ DQG $JH IRU 7HVWLQJ 8VLQJ D 'RXEOH%OLQG &RPSDUDWRU - $XGLR
2WRORJLFDOO\ 1RUPDO 3HUVRQV ,QWHUQDFWLRQDO (QJ6RFYROSS0D\
2UJDQL]DWLRQ IRU6WDQGDUGL]DWLRQ*HQHYD6ZLW]HUODQG >@ 3DQ 'DYLV 0XOWLPHGLD ,((( 9ROXPH
,VVXH6XPPHU3DJHV
>@ ) 7RROH 6XEMHFWLYH 0HDVXUHPHQWV RI
/RXGVSHDNHUV 6RXQG 4XDOLW\ DQG /LVWHQHU
7DEHOD5HVXOWDGRGDV$YDOLDo}HV6XEMHWLYDV
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 6
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 7
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA
ANEXO A
Horrio: 12:00h
Nome:
Idade:
B Voz MP3 128 kbps B Voz MP3 92 kbps B Msica MP3 128 kbps B Msica MP3 92kbps
X1 - X1 - X1 - X1 -
X2 - X2 - X2 - X2 -
X3 - X3 - X3 - X3 -
Instrues:
1) Voc est participando de uma avaliao subjetiva comparativa entre duas fontes sonoras.
2) O objetivo NO avaliar qual das duas fontes soa melhor.
3) O objetivo identificar DIFERENAS audveis entre as duas fontes A e B.
4) Oua com ateno a execuo do programa A.
5) Oua com ateno a execuo do programa B.
6) Oua as trs execues seguintes X1, X2 e X3 e marque a qual voc julga se referir (A ou B).
7) Sero feitos ao todo quatro testes ABX.
8) A durao prevista de oito minutos para todos os quatro testes.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 8
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
Junho de 2004, So Paulo, SP
Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.
___________________________________
Sistema Adaptativo para Caracterizao de Alto-Falantes
Rafael C. Haical, Fbio P. Itturriet, Mrcio H. Costa, Delmar B. Carvalho
Universidade Catlica de Pelotas
Pelotas, 96010-000, Rio Grande do Sul, Brasil
m.costa@ieee.org , delmar@phoenix.ucpel.tche.br
RESUMO
Sistemas para a avaliao e controle de qualidade de equipamentos de reproduo de som so de grande interesse
para a indstria eletro-eletrnica, em especial na rea de produo de alto-falantes. Neste trabalho apresentado
um sistema adaptativo, baseado no algoritmo Normalized Least Mean Square, para a avaliao de alto-falantes,
que se caracteriza pela velocidade, confiabilidade e robustez interferncias externas.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 9
7-9 de Junho de 2004, So Paulo, SP, Brasil
c ( n + 1) = c ( n ) + e ( n ) x ( n ) xT ( n ) x ( n ) + (02) Pr-amplif. 2
Amplificador
de potncia
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 10
7-9 de Junho de 2004, So Paulo, SP, Brasil
0.2
Pr-amplif. Amplificador 0
1 de potncia
-0.2
-0.4
-0.6
adaptativo
NLMS
0
-1
Fig. 3. Diagrama em blocos detalhado do sistema. 5
3 150
100
2
50
1 0
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 11
em altas freqncias demonstra a adequada escolha da
freqncia de amostragem para este tipo de alto-falante de
forma a evitar a ocorrncia de aliasing.
5. DISCUSSO E CONCLUSES
Nesse trabalho foram apresentadas as caractersticas
principais da implementao de um sistema adaptativo real
para aplicaes de identificao. Atravs da determinao da
resposta ao impulso do sistema analisado obtida a sua
resposta em freqncia.
O sistema caracteriza-se por um baixo custo e herda as
propriedades de velocidade, confiabilidade e robustez
x 10
8 Erro mdio quadrtico - mdia de 50 realizaes interferncias externas pertinentes ao algoritmo adaptativo
9
Normalized Least Mean Square. Embora possa ser utilizado
8 em uma ampla gama de aplicaes, encontra especial uso em
sistemas de reproduo de som, mais especificamente na
7
caracterizao de alto-falantes.
6 Em trabalhos futuros pretende-se quantificar os erros nas
estimativas obtidas em decorrncia do rudo acstico de
5
fundo e do hardware associado.
4
6. REFERNCIAS BIBLIOGRFICAS
3
0
[5] Scott, J. e Kelly, J., New Method of Characterizing
Driver Linearity, J. Audio Eng. Soc., volume 44,
-10
nmero 4, pginas 258-265, abril, 1996.
[6] Pereira, L.F.A., Fernandes, D., Manzoni, A., Lima,
-20 J.C.M. e Reis, F.S., Sistema Automtico para Teste de
Auto-Falantes, XIII Congresso Chileno de Ingenieria
-30
Electrica, pginas 667-672, Santiago, Chile, novembro,
1999.
-40
2 3 4
10 10 10 [7] Haykin, S. Adaptive Filter Theory, quarta edio,
Hz
Prentice-Hall, 2002.
Fig. 8. Resposta em freqncia do sistema analisado.
[8] ADSP 2106x Sharc Users Manual, second edition,
A figura 7 apresenta o erro mdio quadrtico (avaliado Analog Devices, 1996.
como a mdia do sinal de erro e(n) ao quadrado) para as 50 [9] Ez-Kit Lite, ADSP 2106x Sharc, Reference Manual,
realizaes. Este sinal foi processado por um filtro mdia Analog Devices, 1997.
mvel de norma unitria e 20 coeficientes para facilitar a
visualizao. Como resultado pode-se notar a consistente
convergncia do processo de adaptao atravs da diminuio
da potncia do erro em funo do nmero de iteraes.
A partir da resposta ao impulso obtida pode-se, atravs da
utilizao da transformada rpida de Fourier, obter a resposta
em freqncia do alto-falante, apresentada na figura 8.
Verifica-se o comportamento passa-faixa caracterstico do
alto-falante do tipo woofer analisado. O elevado decaimento
12
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.
___________________________________
Anlise de viabilidade da aplicao de filme fino metlico em cones
e domos de alto-falantes
Hugo D Alessandro Jucoskya, Roberto Katsuhiro Yamamotoa,b, Walter Ullmannc
a
FATEC-SP, bLSI-USP, cdBW LTDA.
So Paulo, SP, Brasil
hugo_j@pop.com.br, katsu@fatecsp.br, walter_ullmann@hotmail.com
RESUMO
Realizou-se um experimento com um tweeter com domo de tecido com o objetivo de alterar sua aparncia sem
que suas propriedades sonoras fossem modificadas. Para isto, foi aplicado um filme fino de alumnio depositado por
mtodo de evaporao, para tornar o domo de tecido com aparncia de metal. Demonstrou-se a viabilidade de
melhorar a aparncia visual de alto-falantes por meio da deposio de filmes finos sem comprometimento da
qualidade de reproduo.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 13
JUCOSKY ET AL. ANLISE DE VIAB. DA APLIC. DE FILME FINO METLICO EM CONES E DOMOS DE ALTO-FALANTES
trabalho. A utilizao deste tweeter se deve s suas Devido s limitaes de construo do alto-falante, haver
caractersticas de construo e funcionamento, ou seja, utiliza perdas de intensidade para determinadas freqncias.
uma bobina mvel e possui o domo totalmente exposto, Idealmente, a curva de intensidade (dB SPL) versus
caracterstica muito importante para a deposio de filmes freqncia (Hz) deve ser plana, ou seja, as respostas do
finos. falante devem ser de igual intensidade, independente da
O tweeter utilizado possui um domo de tecido impregnado freqncia aplicada, garantindo assim uma boa fidelidade de
com resina, dimetro de 25,4 mm, potncia mxima de 30W reproduo do sinal aplicado. Porm, muitas vezes no
e impedncia de 8. A Fig. 1 mostra a foto do tweeter possvel obter uma curva totalmente plana. Isto est
utilizado. relacionado qualidade dos materiais utilizados na
construo do alto falante, simetrias (de construo e campo
magntico fixo), posicionamento correto da bobina e
uniformidade do peso do conjunto bobina mvel e domo.
Para verificar a influncia do filme fino de alumnio
depositado na resposta do tweeter, foi realizada a medio
antes e depois do processo, obtendo-se as curvas mostradas
na Fig. 3.
Verifica-se que as curvas no so planas e restringem a
operao de trabalho do tweeter de 2 a 8kHz (regio mais
plana do grfico), embora esta regio possa ser estendida at
20kHz. Pode-se verificar tambm que a deposio de
alumnio no influenciou de forma significativa na resposta
do tweeter, porm houve uma ligeira queda em seu
desempenho, provavelmente devido a alguma deformao
provocada durante o processo de deposio.
Fig. 1 Foto do tweeter utilizado com domo de tecido. Anlise da curva de impedncia versus freqncia.
Em um alto-falante, a bobina vibra na mesma freqncia
Evaporao de alumnio. da corrente alternada que aplicada em seus terminais. Isso
O tweeter foi posicionado na evaporadora sobre um indica que haver diferentes valores de resistncia eltrica da
suporte a uma distncia aproximada de 8 cm do filamento de bobina de acordo com a variao da freqncia2. Logo, o
tungstnio, sobre o qual filetes de alumnio foram carregadas. termo resistncia no pode ser aplicado neste caso, sendo
No houve preocupao quanto espessura (estimada em substitudo pelo termo impedncia que considera o
500 nm) de alumnio a ser depositada sobre o domo, pois a impedimento da passagem da corrente eltrica alternada [1].
uniformidade seria prejudicada devido a sua esfericidade. A No alto-falante no existe apenas a impedncia eltrica da
nica preocupao foi de obter deposio sobre todo o domo bobina, mas tambm outras impedncias que variam com a
sem que houvesse danos provocados pelo calor. A presso freqncia:
obtida foi de aproximadamente 6x10-4 Pa. No foram Impedncia mecnica: envolve a dificuldade de
utilizadas mscaras durante o processo. Logo, todo o domo movimento do cone devido fora restauradora
foi recoberto com alumnio, inclusive as bordas plsticas, (complincia) da aranha e da suspenso (borda);
como pode ser visto na Fig. 2. Impedncia acstica: dificuldade de movimento devido
ao ar.
A impedncia total do alto-falante considera todos os itens
mencionados acima. Por meio da curva Impedncia versus
Freqncia mostrada na Fig. 4, pode-se verificar se a bobina
sofreu alterao aps a deposio de alumnio. Esta curva
indica que houve alteraes nas propriedades eltricas e
fsicas do tweeter, justificando a diferena entre as curvas da
Fig. 3.
Assim, atravs das curvas da Fig. 4, conclui-se que houve
perda de ganho do tweeter devido s alteraes mecnicas
que ocorreram no momento da evaporao.
Teste de aderncia.
Realizou-se um teste de aderncia do filme fino de
alumnio depositado sobre o domo, colocando-se o tweeter
Fig. 2 Foto do tweeter mostrando a aparncia prateada aps a metalizao. em funcionamento durante um certo perodo. Com a vibrao
do domo, o filme fino metlico tambm vibra, tendendo a
descolar de sua superfcie.
RESULTADOS E DISCUSSES
A curva de resposta em freqncia do tweeter foi realizada
da seguinte maneira: aplicou-se um sinal senoidal no alto-
falante com tenso eficaz de 2V (correspondente a 0,5W 2
Existem duas componentes da bobina que variam com a
RMS). Com um microfone1 a 3 cm do domo, captou-se o
freqncia: 1 componente resistiva que representa as perdas
som reproduzido pelo tweeter para cada freqncia aplicada.
originadas pelas correntes induzidas na ferragem; e 2
componente indutiva que representa a reatncia indutiva da
1
Marca: LinearX, modelo M31, Dimetro: 1/4 de polegada. bobina (parte imaginria de sua impedncia) [2].
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 14
JUCOSKY ET AL. ANLISE DE VIAB. DA APLIC. DE FILME FINO METLICO EM CONES E DOMOS DE ALTO-FALANTES
Fig. 3 Curvas de resposta em freqncia do tweeter antes e depois da deposio do filme fino de alumnio.
Fig. 4 - Curvas de impedncia versus freqncia do tweeter antes e depois da deposio do filme fino de alumnio.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 15
JUCOSKY ET AL. ANLISE DE VIAB. DA APLIC. DE FILME FINO METLICO EM CONES E DOMOS DE ALTO-FALANTES
CONCLUSO
Foi possvel verificar a viabilidade da deposio de filmes
finos de alumnio para aplicao em alto-falantes, com o
objetivo de proteo e melhoria esttica.
Aplicaes de filmes finos de qualquer espcie, desde que
apresentem massa desprezvel, sobre domos de tweeters no
influenciam de maneira significativa o som reproduzido.
O teste de aderncia mostrou que o filme fino de alumnio
depositado por evaporao possui aderncia necessria para
trabalhar mesmo em altas freqncias.
Trata-se de um excelente resultado principalmente para
mercados de alta fidelidade de reproduo sonora.
Um estudo mais detalhado, envolvendo-se variaes de
espessura, rugosidade e materiais utilizados, pode fornecer
dados mais precisos. Variando-se o tipo de material, pode-se
obter cores prateadas (ex.: alumnio) ou douradas (ex.: nitreto
de titnio).
AGRADECIMENTOS
Ao Prof. Dr. Luis da Silva Zambom da FATEC-SP / LSI-
USP pelo auxlio prestado no processo de evaporao.
REFERNCIAS BIBLIOGRFICAS
[1] Selenium Alto-falantes; Para que serve o Alto-Falante?
O que som, intensidade, tom, timbre?,
www.selenium.com.br.
[2] V. Dickason; H. Sette, Caixas acsticas e alto-
falantes Quinta edio Ed. H. Sheldon Captulo 0
pgs.: 1-8.
[3] J. C. Fernandes: Acstica e Rudos; 2002; Unesp
Bauru.
[4] S. Wolf and R.N. Tauber, Silicon Fabrication for the
VLSI Era, Volume 1 - Silicon Processing, Lattice Press,
1986 p. 161-195.
[5] Antologia hi-fi estreo - Edies Monitor - 1. edio
1960 pgs.: 99-108.
[6] Nova Eletrnica - Editora Tcnica Eletrnica LTDA.
Edies: 2, 3, 4, 5, 6, 7, 10, 11 (maro de 1977 a janeiro
de 1978). Matria: "Curso de udio".
[7] G. C. Johnston; Measurement of the lowest resonance
frequency of loudspeaker cones; AES19-1992 (1998);
(ALMA TM-100).
[8] V. E. P. Lazzarini: Elementos de Acstica;
Universidade Estadual de Londrina; julho de 1998.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 16
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.
___________________________________
Impermeabilizao de cones de papel de alto-falantes com plasma de
CF4/H2
RESUMO
Visando obter proteo hidrofbica e, conseqentemente, um aumento da vida til de cones de papel de alto-
falantes, realizou-se experimentos com polimerizao com plasma de CF4/H2. A maior vantagem do uso desta
tcnica a possibilidade de fornecer a proteo impermeabilizante sem que o peso final do cone seja alterado de
maneira significativa, no comprometendo o desempenho do alto-falante.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 17
JUCOSKY E YAMAMOTO IMPERMEABILIZAO DE CONES DE PAPEL DE ALTO-FALANTES COM PLASMA DE CF4/H2
Janela
Eletrodo (porta-amostras)
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 18
JUCOSKY E YAMAMOTO IMPERMEABILIZAO DE CONES DE PAPEL DE ALTO-FALANTES COM PLASMA DE CF4/H2
100
80
Variao de massa.
60
80
relacionando, futuramente, diferentes materiais, texturas e
75 espessuras para estudos sonoros (variao na resposta de
70 freqncia do cone antes e depois do tratamento, por
65 exemplo). A polimerizao ocorre em todos os pontos do
60 papel, apresentando a possibilidade de se realizar o processo
em vrios cones ao mesmo tempo com alterao no
55
significativa da massa do cone. Isto importante pois
50
minimiza os agentes externos no momento da qualificao
25 30 35 40 45
sonora, pois praticamente no haver alteraes no peso ou
H2 (% Vol)
inrcia do cone. Alm disso, apresenta sua importncia para
Fig. 4 ngulo de contato em funo da porcentagem em volume de H2 em uma possvel realizao deste processo em um ambiente
CF4 no processo de polimerizao (100mTorr, 20sccm, 50W, 10 min.). industrial. Para pesquisas futuras, envolvendo qualificao
sonora, recomenda-se utilizar domos de tweeters, pois so
mais sensveis variaes em sua construo fsica. Assim,
Efeito da presso. garante-se maior confiabilidade nos estudos envolvendo
Fixando a proporo de 35% de H2 e 65% de CF4, a filmes finos com udio.
potncia em 50W, o fluxo total em 20sccm e o tempo de O melhor processo foi obtido nas condies de 35% de H2,
processo em 10 min., foram realizados experimentos 65% de CF4, 100W de potncia, 100mTorr de presso e
variando-se a presso. A Fig. 5 mostra os resultados obtidos. 20sccm de fluxo total.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 19
JUCOSKY E YAMAMOTO IMPERMEABILIZAO DE CONES DE PAPEL DE ALTO-FALANTES COM PLASMA DE CF4/H2
REFERNCIAS BIBLIOGRFICAS
[1] S. Wolf and R.N. Tauber, Silicon Fabrication for the
VLSI Era, Volume 1 - Silicon Processing, Lattice Press,
1986 p. 161-195.
[2] A. Bogaerts, E. Neyts , R. Gijbels , J. Mullen; "Gas
discharge plasmas and their applications";
Spectrochimica Acta Part B 57 (2002) 609658.
[3] E. J. Winder, K. K. Gleason; Growth and
characterization of fluorocarbon thin films grown from
trifluoromethane (CHF3) using pulsed-plasma enhanced
CVD; Insulating Biomaterials NO1-NS-62350,
Quarterly Progress Report 11; April-June 1999.
[4] E. Horanyi, Engineering Physics, University of Colorado,
Boulder; P. Griffin, A. Agah, Electrical Engineering,
Stanford University; Teflon coatings for Biochips.
[5] P. M. Nogueira; Estudo da viabilidade da utilizao de
filmes de carbono tipo diamante como camada de
revestimento interno em dutos de transporte de petrleo;
Bol. tc. PETROBRS, Rio de Janeiro, 45 (2): abr./jun.,
2002.
[6] A. Sklodowska, M. Wozniak, R. Matakowska; The
method of contact angle measurements and estimation of
work of adhesion in bioleaching of metals Biol. Proc.
Online 1(3), 114-121; Vol. 1 No. 3 April 29, 1999
www.biologicalprocedures.com.
[7] J. H. Choi, E. S. Lee , H. K. Baik, S. Lee, K. M. Song, M.
K. Hwang , C. S. Huh; Surface modification of natural
leather using low-pressure parallel plate plasma; Surface
and Coatings Technology 171 (2003) 257263.
[8] R. K. Yamamoto, F. R. de Almeida, H. S. Maciel;
Caracterizao de filmes de polmero formado sobre o
silcio exposto ao plasma de CF4/H2; Anais do 9
CBECIMAT Laboratrio de Sistemas Integrveis,
Escola Politcnica da Universidade de So Paulo.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 20
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7 - 9 de Junho de 2004, So Paulo, SP
Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.
___________________________________
Estado da Arte da Classificao de Sinais de udio
RESUMO
Este artigo apresenta uma compilao dos principais trabalhos desenvolvidos na rea de classificao de sinais
de udio. So apresentadas algumas das tcnicas mais conhecidas, bem como suas vantagens e pontos fracos.
So sugeridas alternativas com potencial para superar alguns dos problemas enfrentados, visando fornecer
subsdios para futuros projetos de pesquisa.
21
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO
Msica de Msica Quarteto Outros Msica Orquestra Orquestra Rock Rock Tecno/ Rap/ Pop
Cmara com Solo de Cordas Sinfnica com Coro com Pesado Leve Dance Hip-Hop
Piano Solista
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 22
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO
3. EXTRAO DE PARMETROS todo o espectro. A largura de faixa usada em [1, 12, 15, 17,
A primeira etapa em qualquer tcnica de classificao de 30].
sinais a extrao de parmetros capazes de fornecer o
mximo de informao a respeito dos sinais que se deseja 3.6. Fluxo Espectral
classificar. As pesquisas na rea tm gerado uma grande O fluxo espectral definido como a diferena quadrtica
quantidade de parmetros descritores dos sinais, dentre os entre os espectros de potncia de quadros consecutivos do
quais selecionou-se os mais utilizados para uma descrio sinal, de modo a caracterizar as mudanas no formato do
resumida, como ser visto a seguir. No sero fornecidos espectro. Em geral, sinais de voz apresentam mudanas mais
detalhes matemticos devido s limitaes de espao. Todos drsticas que sinais de msica, devido alternncia entre
os parmetros descritos a seguir so instantneos, o que fonemas surdos e sonoros. Assim, o fluxo espectral
significa que so extrados aps a diviso dos sinais em normalmente assume valores mais elevados para voz. Este
quadros, a fim de se observar o comportamento dessas parmetro foi adotado em [3, 9, 10, 14].
grandezas ao longo do tempo. O tamanho dos quadros varia
de acordo com a pesquisa, mas raramente ultrapassa 100 ms. 3.7. Proporo de Quadros com Baixa Energia
Este parmetro mede a proporo de quadros cuja potncia
3.1. Centride Espectral RMS menor que metade da potncia RMS mdia ao longo
O centride espectral vem sendo usado com sucesso em um de um quadro de 1 segundo. Normalmente, sinais de voz
grande nmero de trabalhos [1, 3, 12, 14, 15, 17, 30]. Ele possuem uma maior proporo de quadros de baixa energia
representa o centro de gravidade da distribuio espectral de que sinais de msica, situao em que esta varivel assume
potncia dos sinais. Altos valores para o centride indicam valores mais elevados. Este parmetro foi adotado em [3, 9,
texturas mais brilhantes, com uma maior amplitude dos 10].
componentes de alta freqncia. Sinais de msica, por serem
espectralmente ricos, normalmente tm um valor de centride 3.8. Sonoridade
mais elevado que voz. Este parmetro busca modelar a percepo humana em
relao sonoridade do sinal a ser classificado. Normalmente
3.2. Taxa de Cruzamentos por Zero as formulaes utilizadas nos mtodos de classificao de
Este parmetro foi adotado em [2, 3, 6, 9, 10, 11, 14, 15, udio so muito simples, consistindo basicamente no clculo
24]. Um cruzamento por zero ocorre quando as amplitudes de do nvel RMS de cada quadro do sinal. Obviamente, estas
amostras temporais sucessivas tm sinais opostos. Em formulaes no so suficientes para modelar de maneira
essncia, a taxa de cruzamentos por zero fornece uma precisa a percepo humana, mas fornecem estimativas
estimativa das propriedades espectrais dos sinais de udio. Na suficientemente confiveis para o propsito de classificao.
diferenciao entre sinais de voz e msica, comum a Esta uma grandeza muito til na identificao do gnero
utilizao da varincia desta grandeza como parmetro. musical, e usada em [1, 14, 15].
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 23
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO
gerado um grande nmero de diferentes tcnicas de Este no um classificador simples de ser implementado,
classificao. A seguir so apresentadas as tcnicas mais mas possui diversas caractersticas desejveis, como a
usadas. Novamente, os detalhes matemticos sero omitidos capacidade de controlar a complexidade da aprendizagem,
devido s limitaes de espao. independente da dimenso do problema. Esse mtodo foi
analisado em [13, 17, 22].
4.1. K Vizinhos mais Prximos
O primeiro passo na implementao deste tipo de 4.5. Discriminador Binrio Simples
classificador a construo de um dicionrio de vetores Este tipo de classificao realizado atravs da diviso
contendo valores paramtricos que representem as categorias sucessiva dos sinais em dois grupos. A deciso entre um ou
nas quais se deseja classificar os sinais. Assim, cada classe outro grupo tomada de acordo com os parmetros
ser representada por um determinado nmero de vetores, os considerados em cada diviso. Por exemplo, os sinais de
quais contm valores de parmetros tipicamente encontrados udio podem, numa primeira diviso, ser classificados em
para a classe em questo. Quanto ao processo de voz e silncio, tendo como base os valores das varincias do
classificao, o vetor de parmetros extrado do sinal centride espectral e do nmero de cruzamentos por zero.
comparado com os vetores presentes no dicionrio. Nessa Numa segunda diviso, os sinais de voz podem ser
comparao, utiliza-se uma medida de distncia (geralmente classificados em masculinos ou femininos, de acordo com os
euclidiana) para determinar os k vetores do dicionrio mais valores de pitch, e os de msica em populares ou clssicos, de
prximos do vetor de parmetros do sinal a ser classificado. acordo com a harmonicidade. As msicas populares, por sua
Por fim, o sinal classificado de acordo com a classe que vez, podem ser classificadas em agitadas ou calmas, e assim
mais vezes est representada entre os k vetores determinados sucessivamente. Este tipo de classificador muito simples,
na etapa anterior. Este um classificador muito usado [6, 9, ideal para ser implementado em tempo real. Contudo, ele no
10, 13, 17, 18], principalmente devido facilidade de apropriado para a realizao de classificaes muito
implementao. Por outro lado, ele possui a desvantagem de sofisticadas. Seu desempenho foi testado em [7, 8, 24].
exigir que se armazene um grande nmero de vetores de
treinamento, resultando em um grande nmero de 4.6. Outros
computaes. Tal fato torna seu uso desaconselhvel em Existem muitos outros sistemas de classificao alm dos
aplicaes que precisem operar em tempo real. acima descritos. Dentre eles, pode-se citar o classificador
Gaussiano Quadrtico [6, 15], classificao nebulosa [4, 5],
4.2. Modelos de Mistura Gaussiana distncia euclidiana simples [1], etc. A escolha do
Os modelos de mistura Gaussiana (MMG) tm sido usados classificador a ser utilizado depende da aplicao pretendida,
com sucesso em muitos problemas de classificao de udio bem como das preferncias pessoais do projetista.
[3,10,11,16,18]. A tcnica usada para modelar as diferentes
classes e gneros de udio como uma funo densidade de 5. ESTGIO DE DESENVOLVIMENTO DA CSA
probabilidade (FDP), usando uma combinao ponderada de Ao se fazer uma anlise da qualidade dos resultados
FDPs Gaussianas (misturas). Os parmetros dos MMG so alcanados na rea de CSA, deve-se tomar o cuidado de
ajustados de acordo com um conjunto de treinamento. Esse dividir os trabalhos de acordo com o grau de dificuldade da
um processo iterativo, e a tcnica utilizada para esse fim
problemtica abordada. Obviamente, pesquisas abordando
conhecida como mtodo de Maximizao de Expectativa
simplesmente a distino entre sinais de voz e msica tm
[31]. Aps o treinamento, os MMGs resultantes so usados
muito mais facilidade de alcanar resultados satisfatrios que
para determinar as probabilidades de um vetor de parmetros
pertencer a cada uma das classes. O maior valor de aquelas que se propem a fazer classificaes mais
probabilidade identifica a classe qual pertence o sinal. complexas. Alm disso, algumas pesquisas trabalham com a
limitao de desenvolver estratgias que possam ser
4.3. Modelos Ocultos de Markov implementadas em tempo real, o que reduz
Os modelos ocultos de Markov so muito usados na significativamente a flexibilidade do projeto. Assim, a
segmentao de sinais de udio em diferentes eventos complexidade dos desafios enfrentados em cada pesquisa
acsticos. Esses modelos so autmatos probabilsticos de varia significativamente, tornando praticamente impossvel
estado finito com uma sada, e consistem de trs uma comparao direta entre elas. O que se pretende nesta
componentes bsicos: um estado inicial de distribuio, uma seo fornecer uma viso geral do estgio de
matriz de transio de estado e uma funo densidade de desenvolvimento das pesquisas na rea, revelando assim
observao. A sada do modelo constituda por uma quais desafios j foram vencidos e quais ainda esto por ser
seqncia de estados e um valor de verossimilhana que resolvidos.
mede a probabilidade que cada observao (vetor de Como comentado anteriormente, os resultados alcanados
parmetros) tem de pertencer a cada modelo. Como no caso na distino entre voz e msica tm sido bastante
do MMG, o modelo que resulta na maior probabilidade satisfatrios. A taxa de acertos mdia neste tipo de aplicao
revela a classe qual pertence o sinal. Esta abordagem freqentemente alcana valores superiores a 95% [3, 7].
adotada em [19, 21, 25]. Excees ocorrem para casos em que h uma preocupao
maior com a execuo em tempo real, onde a taxa de acertos
4.4. Mquinas de Vetores Suporte (Support Vector pode cair para valores prximos a 80% [12]. O grande
Machines) desafio neste nvel de classificao identificar corretamente
Este tipo de classificador foi desenvolvido recentemente sinais cuja estrutura mescla caractersticas tanto de voz como
como uma abordagem alternativa para o problema da de msica, como o caso de gneros musicais como o rap e a
aprendizagem. Seu objetivo encontrar o hiperplano que declamao de textos poticos. Alguns trabalhos propem
melhor separa observaes pertencentes a diferentes classes que se criem classificaes intermedirias entre msica e voz.
num espao multidimensional. A teoria no garante que o Esse o caso de [4, 5], onde o autor usa tcnicas de lgica
melhor hiperplano possa ser sempre encontrado mas, na nebulosa (fuzzy) para realizar uma classificao relativa, do
prtica, uma soluo heurstica pode sempre ser alcanada. tipo 30% voz e 70% msica. Contudo, este tipo de
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 24
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 25
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO
on Acoustics, Speech, and Signal Processing, vol. 2, [18] G. Peeters and X. Rodet, Automatically selecting
1996, pp 993-996. signal descriptors for Sound Classification, ICMC
[3] G. Tzanetakis and P. Cook, Musical Genre 2002, Goteborg, Sweden, September 2002.
Classification of Audio Signals, IEEE Transactions on [19] M. Casey, General sound classification and similarity
Speech and Audio Processing, vol. 10, no. 5, July 2002. in MPEG-7, Organized Sound, vol. 6, no. 2, pp. 153-
[4] D. B. Gerhard, A human vocal utterance corpus for 164, Aug. 2001.
perceptual and acoustic analysis of speech, singing and [20] Y.-C. Cho, S. Choi and S.-Y. Bang, Non-negative
intermediate vocalizations, Journal of the Acoustical component parts of sound for classification, Proc.
Society of America, vol. 112, no. 5, p. 2246, November IEEE Int. Symp. Signal Processing and Information
2002. Technology, Darmstadt, Germany, December 14-17,
[5] D. B. Gerhard, Computationally measurable differences 2003.
between speech and song, PhD Thesis, Computing [21] H.-G. Kim, E. Berdahl and T. Sikora, Study of
Science, Simon Fraser University, Burnaby, Canada, MPEG-7 Sound Classification and Retrieval, 5th
April 2003. International ITG Conference on Source and Channel
[6] K. El-Maleh, M. Klein, G. Petrucci and P. Kabal, Coding, Erlangen, Germany, January 2004.
"Speech/Music Discrimination for Multimedia [22] D. Guo and S.Z. Li, Content-based Audio
Applications", Proc. IEEE Int. Conf. Acoustics, Speech, Classification and Retrieval by Support Vector
Signal Processing (Istanbul), pp. 2445-2448, June Machines. IEEE Trans. on Neural Networks. Vol.14,
2000. No.1, pp.209-215. January 2003.
[7] R. Jarina, N. O'Connor, and S. Marlow, Rhythm [23] J. Foote, Content-Based Retrieval of Music and
Detection for Speech-Music Discrimination in MPEG Audio, in C.-C. J. Kuo et al., editor, Multimedia
Compressed Domain, Proc. of the IEEE 14th Storage and Archiving Systems II, Proc. of SPIE, Vol.
International Conference on Digital Signal Processing 3229, pp. 138-147, 1997.
2002, Santorini, Greece, July 2002, pp. 129-132 [24] T. Zhang and C.-C. J. Kuo, Audio content analysis for
[8] J. Pinquier, J.-L. Rouas and R. Andr-Obrecht, Robust online audiovisual data segmentation and
speech / music classification in audio documents, classification, IEEE Transactions on Speech and
Proceedings of the International Conference on Spoken Audio Processing, vol. 3, no. 4, pp. 441-457, 2001.
Language Processing (ICSLP'2002), Denver, USA, [25] A. A. Alatan, A. N. Akansu and W. Wolf, Multi-
September 2002. modal Dialogue Scene Detection Using Hidden Markov
[9] L. Lu, H.-J. Zhang and Hao Jiang Content Analysis Models for Content-based Multimedia Indexing,
for Audio Classification and Segmentation, IEEE Kluwer Acad., Int. Journal on Multimedia Tools and
Transactions on Speech and Audio Processing, vol. 10, Applications, vol. 14, pp. 137151, 2001.
no. 7, pp. 504-516, October 2002. [26] N. Dimitrova, Multimedia Content Analysis and
[10] E. Scheirer and M. Slaney: Construction and Indexing for Filtering and Retrieval Applications,
Evaluation of a Robust Multifeature Speech/Music Special Issue on Multimedia Technologies and
Discriminator, Proceedings of ICASSP97, pp. 1331- Informing Systems, Part I, vol. 2, no. 4, pp. 87-100,
1334, April 1997, Munich, Germany. 1999.
[11] M. J. Carey, E. S. Parris and H. Lloyd-Thomas, A [27] K. Minami, A. Akutsu, H. Hamada and Y. Tonomura,
comparison of features for speech, music Video Handling with Music and Speech Detection,
discrimination, Proceedings of IEEE International IEEE MultiMedia, vol. 5, no. 3, pp.17-25, July 1998.
Conference on Acoustics, Speech, and Signal [28] V. Peltonen, J. Tuomi, A. Klapuri, J. Huopaniemi and
Processing, pp. 149152, April 1999. T. Sorsa, Computational auditory scene recognition,
[12] Lu, G.J. and T. Hankinson, A Technique Towards Proceedings of ICASSP '02, Florida, USA, May 2002.
Automatic Audio Classification and Retrieval, Proc. [29] M. C. Bchler, Algorithms for Sound Classification in
IEEE Intl. Conf. on Signal Processing, vol. 2, pp. 1142- Hearing Instruments, Ph.D. Thesis, Zurich,
-1145, 1998. Switzerland, 2002.
[13] H. Deshpande, R. Singh, and U. Nam. Classification [30] S. Z. Li, Content-based classification and retrieval of
of music signals in the visual domain, Proceedings of audio using the nearest feature line method, IEEE
the COST-G6 Conference on Digital Audio Effects, Transactions on Speech and Audio Processing, vol. 8,
Limerick, Ireland, December 2001. pp. 619625, 2000.
[14] J. J. Burred and A. Lerch, Hierarchical Approach to [31] L. R. Rabiner, Fundamentals of Speech Recognition,
Automatic Musical Genre Classification, Proceedings PTR Prentice-Hall Inc., New Jersey, 1993.
of the 6th International Conference on Digital Audio [32] J.-J. Aucouturier and F. Pachet, Representing Musical
Effects DAFX03, London, UK, September 2003. Genre: A State of the Art, Journal of New Music
[15] M. F. McKinney, Features for Audio and Music Research, vol. 32, no. 1, pp. 8393, 2003.
Classification, Proceedings of ISMIR, Baltimore, [33] J. G. A. Barbedo, A. Lopes, A New Cognitive Model
USA, 2003. for Objective Assessment of Audio Quality, submitted
[16] D. Pye, Content-based methods for the management of to the Journal of Audio Engineering Society, March
digital music, In ICASSP, vol. IV, pages 2437-2440, 2004.
2000. [34] J. G. A. Barbedo, A. Lopes, Strategies to Increase the
[17] G. Agostini, M. Longari and E. Pollastri, Musical Applicability of Methods for Objective Assessment of
Instrument Timbres Classification with Spectral Audio Quality, to be presented at 116th AES
Features, EURASIP Journal on Applied Signal Convention, Berlin, May 2004.
Processing, no. 1, pp. 1-11, 2003.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 26
Sociedade de Engenharia de Audio
Artigo de Convenc
ao
Apresentado na VIII Convenc
ao Nacional
7 - 9 de Junho de 2004, S
ao Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edicoes, correco
es e consideraco
es feitas pelo comit
e t
ecnico
deste evento. Outros artigos podem ser adquiridos atrav es da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaco es sobre a seca
o brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. N
ao e permitida a reproduca
o total ou parcial deste artigo sem autorizaca
o expressa da AES Brasil.
Interpolac
ao de Sinais de Audio Usando Polin
omios do Par de Linhas
Espectrais
Paulo A. A. Esquef1
1
Helsinki Univ. of Technology, Lab. of Acoustics and Audio Signal Processing, P.O.Box 3000,
FIN-02015 HUT, Espoo, Finland
paulo.esquef@hut.fi
RESUMO
Esse artigo aborda a interpolacao de falhas longas em sinais de audio atraves de tecnicas basedas em
modelos autorregressivos (AR). Demonstra-se que a utilizacao de modelos AR modificados, baseados
na soma ponderada dos polin omios do par de linhas espectrais (PPLE), produz melhores resultados
perceptivos do que o emprego de modelos convencionais de mesma ordem.
1 INTRODUC
AO to a ser reconstrudo. Isso se deve, principalmente, a `
minimizaca o do erro de modelagem, empregada na es-
A reconstruca o de amostras perdidas em sinais de timacao das amostras perdidas. Considerando uma si-
a
udio e uma tarefa comumente necess aria em aplicaco
es tuacao limite em que o erro e nulo, o sinal interpolado
de a udio. Exemplos de perda de sinal s ao encontra- depender a basicamente da resposta impulsiva do modelo
dos em situaco es como erros em uma transmiss ao digi- AR. Assim, para que a interpolaca o funcione, e preciso
tal [1] e reproducao de matrizes degradadas de gravacoes que o decaimento da resposta impulsiva do modelo seja
historicas [2]. lenta o suficiente para preencher a falha. Para mode-
A modelagem autorregressiva (AR) encontra utilidade los cujos p olos se situem afastados da borda do crculo
em v arias aplicacoes no processamento de sinais de fala unit ario e, logo, possuam respostas impulsivas de decai-
e m usica. Exemplos tpicos s ao a codificaca
o por pre- mento r apido, o efeito de atenuacao energetica se torna
dica
o linear [3], a deteca
o de erros [4] e a reconstruca
o crtico.
de sinais de a udio [5, 6]. No u ltimo caso, interpolado- Uma opca o simples para se contornar esse problema
res AR s ao adequados para reconstruir fragmentos muito consiste em aumentar a ordem do modelo AR, visto que
curtos de sinais. Isso se deve, basicamente, ao fato de isso tende a produzir modelos com p olos mais proximos
a suposicao de estacionariedade ser valida somente para da circunferencia unit aria. Outras soluco
es incluem a
trechos curtos, i.e., aproximadamente 20 ms, de sinal. imposica o de um limite inferior para a minimizaca o do
Na interpolaca o de falhas longas, o desempenho de erro de modelagem [7, 8].
interpoladores AR e fraco, uma vez que a energia do Para fragmentos t ao longos quanto o limite de estaci-
sinal interpolado decai em direca o ao meio do segmen- onariedade de tempo curto e recomend avel a utilizaca
o
27
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE
Figura 1: Equivalencia entre A(z) e os PPLEs. Um esquema de predica o linear baseado na soma pon-
derada dos PPLEs foi proposto em [13]. O filtro de
an
alise e definido como
de dois modelos AR: um estimado a partir do segmento
que imediatamente precede a falha e outro a partir do D(z, ) = P (z) + (1 )Q(z), (1)
segmento que imediatamente a sucede [9]. Abordagem
similar foi tambem proposta em [10, 11, 12]. onde, como antes, P (z) e Q(z) s ao, respectivamente, os
O interpolador investigado nesse trabalho e baseado PPLEs simetrico e assimetrico associados a A(z). O peso
na proposicao descrita em [10, 11, 12]. Aqui, entretanto, e um ganho de valor real. Como visto na Seca o 2 e na
ao inves de se utilizarem modelos AR convencionais, mo- Fig. 1, para = 0,5 a equivalencia D(z, = 0,5) = A(z)
delos AR modificados s ao empregados. A modificaca o e verdadeira. Deve-se notar que, para 6= 0,5, D(z, )
consiste em computar os PPLEs associados ao modelo tem ordem p + 1, enquanto A(z) tem ordem p.
AR convencionalmente estimado e obter um modelo AR Para = 1 e = 0, o preditor modificado D(z, )
modificado atraves da soma ponderada daqueles [13]. O se reduz a P (z) e Q(z), respectivamente. Logo, os p olos
modelo modificado e, ent ao, usado diretamente no algo- de 1/D(z, ) est ao localizados na circunferencia unitaria.
ritmo de interpolaca o. Alem disso, mostra-se em [13] que 1/D(z, ) e est avel se
A vantagem dessa proposta reside na possibilidade de, ] 0, 1 [ . Por simplicidade, o modelo AR 1/D(z, )
atraves do ajuste de um u nico parametro, se realocar sera chamado, daqui em diante, de modelo modificado.
os polos do modelo modificado mais proximamente da A figura 2 mostra o lugar-das-razes de 1/D(z, ) em
circunferencia unit aria. Isso resulta num benefcio cla- funca
o do peso , para um modelo AR sintetico de quar-
ro ao problema de interpolaca o. Um efeito colateral da ta ordem. Uma inspeca o visual da Fig. 2 revela que
modificacao proposta e que as freq uencias dos polos re- escolher perto de 1 faz com que os a ngulos dos polos
alocados se tornam polarizadas em relaca o aos valores de 1/D(z, ) permanecam (em baixas freq uencias) mais
originais. Conseq uentemente, distorco es podem ser per- proximos dos a ngulos do modelo AR original do que no
cebidas nas porco es de sinal reconstrudas (ver mais de- caso de se adotar pr oximo de 0. Ademais, adotar = 0
talhes na Secao 5). Apesar disso, o emprego dos modelos implica um p olo em DC, o que pode ser problem atico em
AR modificados produz resultados superiores aos obtidos aplicacoes de sntese, enquanto que = 1 implica um
com o uso de modelos convencionais de mesma ordem. polo em z = 1.
Este artigo e organizado como se segue. A Seca o 2 Dado o arrazoado anterior, e plausvel esperar-se que
define os polin omios do par de linhas espectrais e reve a adoca o de tendendo a 1 seja mais vantajosa que es-
suas propriedades. A Seca o 3 ilustra as propriedades dos colher perto de 0, como recurso para mover os p olos
modelos modificados. O metodo de interpolaca o utiliza- do modelo modificado mais para perto da circunferencia
do e descrito na Seca o 4. Os resultados experimentais unitaria. Alternativamente, pode-se pensar em compu-
s
ao apresentados na Seca o 5 e avaliados subjetivamente tar as razes de A(z) e artificialmente aumentar seus
na Secao 6. As conclus oes s
ao apresentadas na Seca o 7. m odulos (raios). Entretanto, o c alculo das razes de po-
linomios de alta ordem, alem de ser computacionalmente
custoso, e sujeito a erros numericos. Ao contr ario, o cus-
2 POLINOMIOS DO PAR DE LINHAS ESPECTRAIS
to computacional para se computar o modelo modificado
e de apenas p multiplicaco es e p adico
es por modelo, ou
Suponha a resposta de um filtroP de predica o linear de
seja, e negligvel se comparado ao custo da estimaca o do
p-esima ordem como A(z) = 1 pk=1 a(k)z k , onde a()
modelo convencional.
representam os coeficientes do filtro na sua forma direta.
A funca o de transferencia do filtro de sntese 1/A(z) e
garantidamente est avel se A(z) possuir fase mnima. 4
METODO DE INTERPOLAC MODIFICADO
AO
A ideia por tr
as dos PPLEs e representar o polin omio
A(z) por meio de dois outros polin omios cujos zeros se Os modelos AR modificados podem ser utilizados em
encontram exatamente sobre a circunferencia unit aria. qualquer interpolador baseado em modelagem AR, e.g.,
O mapeamento envolvido e dado por P (z) = A(z) + o interpolador AR por criterio de mnimos quadrados
z (p+1) A(z 1 ) e Q(z) = A(z) z (p+1) A(z 1 ), onde descrito em [6]. Como o presente trabalho lida com a in-
P (z) e Q(z) s ao as asssim chamados polin omios do par terpolaca
o de falhas t
ao longas quanto o m
aximo tempo
de linhas espectrais [14]. Ademais, A(z) pode ser re- de estacionariedade que se pode assumir em fragmentos
28
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE
p = 50
Amplitude
1 1
0
1
0,5 0 1000 2000 3000 4000 5000 6000
Parte Imaginria Tempo (amostras)
p = 500
Amplitude
1
0 0
1
0 1000 2000 3000 4000 5000 6000
0,5 Tempo (amostras)
p = 1000
Amplitude
1
0
1
1
1 0,5 0 0,5 1 0 1000 2000 3000 4000 5000 6000
Parte Real Tempo (amostras)
29
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE
1
Por exemplo, a resson ancia proeminente que ocorre no
0
sinal original em torno de 1500 Hz aparece um pouco aci-
1
0 1000 2000 3000 4000 5000 6000 ma no sinal interpolado. H a que se considerar, tambem,
Tempo (amostras) que os desvios nas freq uencias de resson ancia sao mais
acentuados em altas freq uencias. Logo, e plausvel espe-
Figura 4: Desempenho do metodo de interpolacao cular que a qualidade dos sinais interpolados possa ser
proposto para ordem de modelo p = 150 e varios aceit
avel perceptualmente, apesar de possveis distorco es
valores de . A falha e localizada entre as amostras espurias.
2001 e 4000. O sinal original e mostrado em linha
pontilhada.
Magnitude (dB)
Original
50
100
Os resultados anteriores contam a favor da utilizaca o 0 500 1000 1500 2000 2500 3000
Freqncia (Hz)
3500 4000 4500 5000
vestigado, uma vez que, com as mesmas ordens de mo- p = 150 = 0,5
50
delo, o uso dos modelos modificados produz melhores
resultados, pelo menos visualmente. Ademais, o custo 100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
computacional extra necess ario ao c alculo dos modelos Freqncia (Hz)
modificados e mnimo, se comparado a `queles relaciona-
Magnitude (dB)
p = 1000 = 0,5
Apesar disso, freq uencias de resson ancia ligeiramente 50
desviadas ser ao provavelmente excitadas com um nvel
de energia similar ao das freq uencias originais. Essa e a 100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
razao pela qual o metodo de interpolaca o ainda funcio- Freqncia (Hz)
na. Freq uencias de ressonancias fortemente polarizadas
ser
ao provavelmente excitadas a baixos nveis de ener- Figura 5: Detalhe (ate 5 kHz) do espectro do sinal
gia. Logo a contribuica o destas na forma de distorco es original e de sinais reconstrudos.
audveis no sinal reconstrudo pode ser menos crtica do
que aquela causada por freq uencias de ressonancia ligei-
ramente desviadas.
A Fig. 5 confronta os espectros do sinal original na
Magnitude (dB)
30
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE
6 DESEMPENHO QUALITATIVO
Tabela 1: Parametros usados nas simulacoes.
Essa seca
o e dedicada a
` avalica
o subjetiva do metodo
de interpolaca
o usando modelos modificados. Os sinais Parametro Valor
de teste utilizados, assim como as configuracoes de pro- Extensao da falha G = 2000 amostras
cessamento empregadas, s ao descritos a seguir. Periodicidade das falhas 50000 amostras
Ordem (AR convencional) p {150, 300, 500, 1000}
6.1 Sinais de teste Estimaca
o AR Burg, N = 2000 amostras
Nesse trabalho, por questoes de praticidade, decidiu- Ordem (AR modificado) p = 150
se avaliar o desempenho do metodo de interpolaca o em Pesos nos PPLEs [0,5, 1,0]
quatro sinais de teste. Segue-se uma breve descrica
o des-
ses sinais.
31
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE
onais por seus correspondentes polin omios simetricos [5] A. J. E. M. Janssen, R. N. J. Veldhuis, and L. B. Vri-
de linhas espectrais, dentro do procedimento de in- es, Adaptive Interpolation of Discrete-Time Sig-
terpolaca
o investigado, oferece um melhor balanco en- nals That Can Be Modeled as Autoregressive Pro-
tre o custo computacional do metodo de interpo- cesses, IEEE Trans. Signal Processing, vol. ASSP-
laca
o e seu desempenho qualitativo. Exemplos dos 34, pp. 317330, Apr. 1986.
sinais processados podem ser encontrados no URL: [6] S. J. Godsill and P. J. W. Rayner, Digital Audio
http://www.acoustics.hut.fi/esquef/aesbrasil/. Restoration A Statistical Model Based Approach,
ch. 5. London, UK: Springer-Verlag, 1998.
7 CONCLUSOES
[7] P. J. W. Rayner and S. J. Godsill, The Detection
Esse artigo apresentou uma aplicaca o dos polin omios and Correction of Artefacts in Degraded Gramopho-
do par de linhas espectrais associado a um modelo au- ne Recordings, in Proc. IEEE ASSP Workshop
torregressivo ao problema de reconstruca o de sinais de Applications Signal Processing Audio Acoustics,
a
udio em falhas de longa duraca o. A modificacao pro- pp. 151152, Oct. 1991.
posta no metodo de interpolaca o investigado consistiu na [8] M. Niedzwiecki, Statistical Reconstruction of Mul-
substituicao de modelos AR estimados convencionalmen- tivariate Time Series, IEEE Trans. Signal Proces-
te por uma soma ponderada de seus polin omios do par sing, vol. 41, pp. 451457, Jan. 1993.
de linhas espectrais associados. A localizaca o dos p
olos
[9] W. Etter, Restoration of a Discrete-Time Signal
desses modelos modificados pode ser controlada atraves
Segment by Interpolation Based on the Left-Sided
de um u nico parametro de peso.
and Right-Sided Autoregressive Parameters, IEEE
Foram realizados experimentos em um conjunto de
Trans. Signal Processing, vol. 44, pp. 11241135,
quatro sinais de teste, degradados artificialmente e re-
May 1996.
construdos atraves do metodo proposto, sob diversas
configuracoes dos parametros de processamento. A ava- [10] I. Kauppinen, J. Kauppinen, and P. Saarinen, A
liaca
o dos resultados obtidos, tanto visual como auditiva, Method for Long Extrapolation of Audio Signals,
revelou que adotar o par ametro de peso igual a 1 favore- J. Audio Eng. Soc., vol. 49, pp. 11671180, Dec.
ce o desempenho qualitativo do metodo de interpolaca o. 2001.
Essa escolha equivale a ` utilizaca
o do polin
omio simetrico [11] I. Kauppinen and J. Kauppinen, Reconstruction
de linhas espectrais, cujos p olos se encontram exatamen- Method for Missing or Damaged Long Portions in
te na circunferencia unitaria. Audio Signal, J. Audio Eng. Soc., vol. 50, pp. 594
Avaliaco
es subjetivas atraves de testes de audica o 602, July/Aug. 2002.
mostraram que, apesar de introduzir algumas distorco es
audveis no sinais reconstrudos, a modificaca o proposta [12] I. Kauppinen and K. Roth, Audio Sig-
implica sinais restaurados com qualidade subjetiva supe- nal Extrapolation Theory and Applicati-
rior aos obtidos atraves do metodo original, com mesma ons, in Proc. 5th Int. Conf. on Digital Au-
ordem (baixa) de modelo. Como a modificaca o propos- dio Effects, (Hamburg, Germany), pp. 105
ta requer um custo computacional desprezvel, e possvel 110, Sept. 2002. URL: http://www.unibw-
argumentar que a mesma melhora o metodo de interpo- hamburg.de/EWEB/ANT/dafx2002/papers.html.
laca
o, em termos de um melhor balanco entre complexi- [13] P. Alku and T. B ackstr
om, All-pole Modeling Te-
dade computacional e desempenho qualitativo. chnique based on the Weighted Sum of the LSP
Polynomials, in Proc. IEEE Int. Conf. on Acous-
REFERENCIAS tics, Speech and Signal Processing (ICASSP 2002),
[1] N. S. Jayant and S. Christensen, Effects of vol. 1, (Orlando, Florida, USA), pp. 665668, May
Packet Losses in Waveform Coded Speech and 2002.
Improvements Due to an Odd-Even Sample- [14] F. K. Soong and B. W. Juang, Line Spectrum Pair
Interpolation Procedure, IEEE Trans. Communi- (LSP) and Speech Data Compression, in Proc. Int.
cations, vol. CAM-29, pp. 101109, Feb. 1981. Conf. Acoust., Speech, Audio Signal Procesing, (San
[2] P. Wilson, Record Contamination: Causes and Cu- Diego, CA), pp. 1.10.11.10.4, 1984.
re, J. Audio Eng. Soc., vol. 13, pp. 166176, Apr. [15] M. H. Hayes, Statistical Signal Processing and Mo-
1965. deling, ch. 6. John Wiley & Sons, Inc., 1996.
[3] J. Makhoul, Linear Prediction: A Tutorial Revi-
ew, Proc. IEEE, vol. 63, no. 4, pp. 561580, 1975.
[4] S. V. Vaseghi and P. J. W. Rayner, Detection and
Suppression of Impulsive Noise in Speech Communi-
cation Systems, IEE Proceedings, vol. 137, pp. 38
46, Feb. 1990.
32
Sociedade de Engenharia de Audio
Artigo de Convenc
ao
Apresentado na VIII Convenc
ao Nacional
7 - 9 de Junho de 2004, S
ao Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edicoes, correco
es e consideraco
es feitas pelo comit
e t
ecnico
deste evento. Outros artigos podem ser adquiridos atrav es da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaco es sobre a seca
o brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. N
ao e permitida a reproduca
o total ou parcial deste artigo sem autorizaca
o expressa da AES Brasil.
Interpolac
ao Bilinear Generalizada de HRTFs para Gerac
ao de Som
Tridimensional
Fabio P. Freeland1 , Luiz W. P. Biscainho1 , Paulo S. R. Diniz1
1
LPS PEE/COPPE & DEL/Poli, UFRJ
freeland@lps.ufrj.br
RESUMO
A geracao de som tridimensional em fones de ouvido pode ser feita por interpolacao de Funcoes de Trans-
ferencia Relativas a` Cabeca (HRTFs). Nesse trabalho, explicita-se a forma de calculo dos ponderadores
usados nessa interpolacao por analogia com um metodo multicanal conhecido como Variacao Gradual
da Amplitude Baseada em Vetores (VBAP). Por fim, algumas simplificacoes sao realizadas, obtendo-se
expressoes praticas para casos particulares usuais.
INTRODUC
AO o grau de fidelidade desejado na representaca o digital
Ja faz algum tempo que se comecou a pensar em uma para um sinal anal ogico e determinado pelo n umero de
forma de se recriar de maneira controlada a sensaca o de bits nela utilizados. Portanto, a qualidade fica depen-
imers ao em um ambiente virtual. J a na epoca da criaca
o dente apenas do quanto se est a disposto a gastar na
do estereo o que se pretendia era tornar o som mais en- representacao do sinal antes, durante e depois do pro-
volvente. O cinema tambem foi um grande impulsion- cessamento.
ador do aparecimento de novas tecnicas de atribuica o de Uma das aplicaco es que mais se beneficiaram desse
ambiencia ao som, j a que uma de suas caractersticas salto tecnologico foi a recriaca
o de ambiente virtual por
mais importantes para o p ublico e a diferenca entre o simuladores e ate jogos eletronicos, onde se quer o maior
ambiente da sala de cinema e o domestico; e isso se liga grau possvel de realismo. As mesmas tecnicas de pro-
nao so a
` diferenca no tamanho da tela, mas tambem a ` cessamento digital neles empregadas podem servir para
imers ao sonora no ambiente do filme. gerar efeitos especiais nas trilhas sonoras de filmes.
As tecnicas de geraca o de som tridimensional A criaca
o de um ambiente sonoro virtual tenta pro-
evoluram desde o estereo ate o som surround (que do- duzir o som que se ouviria no ambiente em quest ao, isto
mesticamente j a conta com sete canais mais o canal de e, dar noca
o de tridimensionalidade ao som. Isso corre-
graves) passando pelo som quadraf onico. A grande rev- sponde a simular as alteraco es sofridas pelo som desde
oluca
o ocorrida nessa area se deu com a possibilidade de sua emissao pela fonte ate chegar a cada um dos ouvidos.
se fazer o processamento digital dos sinais, viabilizado Deve-se notar que a mera utilizaca o de uma configuraca o
pela velocidade elevada dos processadores atuais. E com com diversos alto-falantes ao redor do ouvinte, embora
isso, surgiu um novo conceito: a qualidade controlada; produza uma sensaca o de ambientaca o, n
ao e suficiente
33
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO
3D. Deve-se ressaltar que o objetivo deste trabalho n ao onde Si () e o espectro do sinal emitido pela caixa Li,
e a comparaca o entre metodos de interpolaca o, mas sim e HiE () e HiD () s ao as funco
es de transferencia da
o detalhamento da formulaca o de um metodo particular. caixa Li aos ouvidos esquerdo e direito, respectivamente.
Inicialmente, discute-se o princpio do posicionamento Potencialmente, esta configuraca o posiciona uma fonte
de uma fonte virtual por variaca o de amplitude. A virtual em qualquer ponto P sobre o tri angulo esferico
seguir, mostra-se que a interpolaca o de HRTFs pode determinado pelas tres caixas. Um sistema de som 3D
ser descrita da mesma forma. Na seq uencia, revisa-se eficaz deve garantir que
o metodo multicanal VBAP. Ent ao, derivam-se as ex-
SE () SE ()
pressoes que realizam a interpolaca
o de HRTFs com base (3)
no VBAP. Por fim, apresentam-se as conclus oes. SD () SD ().
Uma solucao intuitiva consiste em aplicar o sinal que
POSICIONAMENTO POR VARIAC
AO DE AMPLI- se deseja ouvir vindo do ponto P a cada uma das caixas
CANAIS
TUDE, COM TRES Li ponderado por uma constante gi [5], ou seja, Si () =
gi SP (). Nesse caso, a aproximaca
o (3) se resume a fazer
Todos os metodos de geraca o de som tridimensional
X3
tem como objetivo b asico reproduzir, fsica ou virtual-
HP E () gi HiE ()
mente, as funco
es de transferencia HP E () e HP D () i=1
(4)
que descrevem os caminhos desde uma posica o P ate
X
3
os ouvidos esquerdo e direito, respectivamente. Assim, HP D () gi HiD ().
i=1
tenta-se reproduzir o som de uma fonte virtual localizada
em P filtrando-se o som SP () por ela emitido de forma
INTERPOLAC BASEADA EM TRES
AO HRTFS
que no domnio da frequencia se tenham
Um sistema tpico de geraca
o binaural de som tridi-
SE () = SP ()HP E () mensional se baseia em um conjunto de HRTFs (Head-
(1) Related Transfer Function) medidas para um n umero
SD () = SP ()HP D ().
34
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO
3 L2
1 P
HP D L1 L3
P v2
vP
H1D 2
H3D v1 v3
r r
r H2D r r
35
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO
didas s ao quaisquer. Entretanto, na pr atica, as medi-
P
3
das sao realizadas com pelo menos o passo de elevaca o
fixo. Nesse caso particular, pode-se fazer 2 = 0 nas
Eqs. (18), o que as torna
3
g3 =
3
3 3 (19)
g2 = g3
2 2
Figura 4: Geometria para interpolacao triangular de g1 = 1 g 2 g 3 .
HRTFs. Uma simplificacao adicional ainda pode ser feita no
caso de as HRTFs serem medidas com ambos os passos,
x2 r cos(1 + 2 ) cos(1 + 2 ) de azimute e de elevaca
o, constantes, o que permite fazer
y2 = r cos(1 + 2 ) sen(1 + 2 ) (12) 3 = 0 nas Eqs. (19), o que resulta em
z2 r sen(1 + 2 )
x3 r cos(1 + 3 ) cos(1 + 3 )
g3 =
3
y3 = r cos(1 + 3 ) sen(1 + 3 ) (13)
(20)
z3 r sen(1 + 3 )
g2 =
2
xP r cos(1 + ) cos(1 + )
g1 = 1 g 2 g 3 .
yP = r cos(1 + ) sen(1 + ) . (14)
zP r sen(1 + ) Assim, quando a geometria da grade de pontos o per-
Agora, considerando que as HRTFs medidas formam mite, a complexidade do calculo dos ponderadores gi e
um conjunto denso (i.e., foram medidas para pontos consideravelmente reduzida.
bastante proximos1 ), pode-se considerar que 2 , 3 ,
CONCLUSOES
2 , 3 , e sao pequenos. Sendo sen() e
cos() 1 para 0, podem-se obter as aproximaco es Neste artigo, deduziu-se uma formulaca o para o
para as coordenadas calculo dos ponderadores usados para geraca o de som
tridimensional utilizando-se HRTFs. Chegou-se a `s equa-
x2 r(cos 1 2 sen 1 )(cos 1 2 sen 1 ) coes dos ponderadores atraves da analogia com um
y2 r(cos 1 2 sen 1 )(sen 1 + 2 cos 1 )(15) sistema multicanal baseado em tres caixas ac usticas,
z2 r(sen 1 + 2 cos 1 ) chamado de Posicionamento por Variaca o de Amplitude
Baseado em Vetores (VBAP). Os resultados bem suce-
x3 r(cos 1 3 sen 1 )(cos 1 3 sen 1 ) didos do VBAP s ao conhecidos da literatura. Como a
y3 r(cos 1 3 sen 1 )(sen 1 + 3 cos 1 )(16)
interpolaca
o de HRTFs e simplesmente uma combinaca o
z3 r(sen 1 + 3 cos 1 ) linear de funcoes de transferencia medidas para pon-
xP r(cos 1 sen 1 )(cos 1 sen 1 ) tos sobre uma esfera, a formulaca o do VBAP pode ser
yP r(cos 1 sen 1 )(sen 1 + cos 1 ) . (17) reutilizada. Ja que ambos os metodos atuam sobre o
zP r(sen 1 + cos 1 ) mesmo tipo de funca o, a expectativa e de que os resul-
tados dos dois metodos sejam equivalentes. Alem da
Por fim, substituindo-se as Eqs. (11) e (15)(17) na
formulacao para o caso geral, citaram-se dois casos par-
Eq. (6), podem-se calcular os ponderadores gi em funca
o
ticulares de menor complexidade, aplic aveis na pr
atica.
das dist
ancias angulares:
Um dos casos particulares fora anteriormente aplicado,
2 2
sem demonstraca o, pelos autores em [6] a um metodo de
g3 =
2 3 3 2 interpolaca
o eficiente de HRTFs, com sucesso.
3 3 (18)
g2 =
2 3 3 2
REFERENCIAS
g1 = 1 g 2 g 3 . [1] D. R. Begault, 3D Sound for Virtual Reality and Mul-
1 Em [4], por exemplo, tem-se algo em torno de 700 posi
timedia. Cambridge, MA: Academic Press, 1994.
coes
distribudas de forma aproximadamente uniforme sobre a es- [2] J.-M. Jot, V. Larcher, and O. Warusfel, Digital sig-
fera de refer
encia. nal processing issues in the context of binaural and
36
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO
37
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil
___________________________________
Controle em Tempo Real da Temperatura da Bobina
e do Deslocamento do Cone de Alto-falantes
para Operao em Alta Potncia
Constncio Bortoni, Sidnei Noceti Filho, Rosalfonso Bortoni, Rui Seara
LINSE Laboratrio de Circuitos e Processamento de Sinais
Depto. de Engenharia Eltrica, Universidade Federal de Santa Catarina
88040-900, Florianpolis, Santa Catarina, Brasil
cbortoni@linse.ufsc.br
RESUMO
Este trabalho apresenta um procedimento de medida e controle digital de temperatura da bobina e deslocamento
do cone de alto-falantes para operao em alta potncia. O controle realizado em tempo real, usando para tal
um processador de sinal digital (DSP). As informaes de temperatura da bobina e de deslocamento do cone so
obtidas pela variao da resistncia para corrente contnua (DC) da bobina e atravs da medida de acelerao do
cone, respectivamente.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004
38
BORTONI, ET.AL. CTRTBDCAOAP
proposto um mtodo de controle de tal temperatura. Uma vez determinada a resistncia DC da bobina,
Em [9], [10] apresentado um sistema de medio e pode-se ento calcular a temperatura fazendo uso da
controle da temperatura e do deslocamento do cone. relao entre a variao da resistncia DC da bobina e
Tal sistema relativamente complexo e de alto custo a sua temperatura [11], atravs da expresso (1).
comercial. Nessa abordagem, o sistema de controle Assim,
estima os parmetros livres do modelo eletroacstico
estendido do alto-falante, considerando a escala de R (n) 1
T ( n ) = T ( n 1)+ 1 T ( n 1) 25 + (1)
operao segura, protegendo o alto-falante de R ( n 1)
superaquecimento da bobina e de deslocamento 25
excessivo do cone.
Este trabalho prope um sistema de controle em onde T (n) caracteriza a temperatura da bobina do
tempo real no qual a potncia fornecida ao alto-falante alto-falante no instante atual; T (n 1) a temperatura
limitada tanto pela temperatura da bobina quanto pelo no instante anterior ao atual; R (n) a resistncia DC
deslocamento do cone. Dessa forma, garantido o
rendimento mximo do sistema de sonorizao sem a da bobina do alto-falante no instante atual; R(n 1) a
necessidade de uso de grandes margens de segurana, resistncia DC no instante anterior ao atual; 25 o
que um procedimento muito empregado atualmente. coeficiente de temperatura do material do fio da bobina
A principal diferena entre as abordagens discutidas a 25 C.
em [9], [10] e a proposta, neste trabalho, reside A Fig. 2 mostra a curva de variao da resistncia
principalmente na simplicidade de concepo e no DC da bobina em funo da temperatura.
custo final de implementao.
11
2. DESCRIO DO MTODO
A abordagem em questo pode ser divida em duas
10
etapas, tais como:
Resistncia DC da Bobina ()
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004
39
BORTONI, ET.AL. CTRTBDCAOAP
140
Modelo da Impedncia ( )
Conversor 120
res
DSP
Em (2)-(5), Re representa a resistncia DC da Sinal de
udio AD G L
bobina; Red caracteriza as perdas devido s correntes DA
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004
40
BORTONI, ET.AL. CTRTBDCAOAP
250
T2 temperatura em instantes sucessivos de tempo, entre T1
e T2 , so armazenados. Tais valores so interpolados,
200
Temperatura da Bobina ( C)
T1
150
limiares T1 e T2 . Com auxlio dessa caracterstica,
uma curva de ganho versus tempo para o controle de
100
temperatura pode ser obtida. Tal curva deve ter uma
caracterstica inversa da curva de aumento de
50
temperatura com o tempo. Ela deve ser ajustada em
0 dB para os instantes de tempo em que a temperatura
0
t1 t2 t3 est situada entre T1 e T2 , e segue a expresso (6), que
0 50 100 150 200 250 300 350 400
Tempo (s) modela a caracterstica inversa da curva de temperatura
Fig. 6 - Exemplo de curva de variao da temperatura da bobina com a funo do tempo, para os instantes referentes ao
atuao do controle de temperatura. intervalo de temperatura entre T2 e T1 .
Ta(n)
0 G (n) = 20 log , (6)
Ta(n 1)
-0,5
onde G (n) representa o ganho entre T2 e T1 , e Ta(n)
-1,0
e Ta(n 1) denotam a temperatura armazenada no
Ganho (dB)
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004
41
BORTONI, ET.AL. CTRTBDCAOAP
Potncia (W)
Aps a simulao dos sistemas de controle em 100
120 0.02
100
0.01
80
0.005
60 0
200
150 200
40 100 150
Te 100
mp
o( 50 50 (Hz)
s) ncia
0 0 Freq
20
0 100 200 300 400 500 600
Tempo (s) (b)
(a) Fig. 9 Desconsiderando o sistema de controle para o deslocamento
90 do cone. (a) Curva da potncia entregue ao alto-falante; (b) curva do
deslocamento do cone.
85
80
75
Potncia (W)
200
70
150
65
Potncia (W)
100
60
55 50
50 0
200
45 150 200
0 100 200 300 400 500 600 100 150
Te 100
Tempo (s) mp
o( 50 (Hz)
s) 50 ncia
0 0 Freq
(b)
0 (a)
0,5
0.02
Deslocamento do cone (m)
1,0
Ganho (dB)
0.015
1,5 0.01
2,0 0.005
0
2,5 200
150 200
100 150
Te 100
3,0 mp
o( 50 50 (Hz)
0 100 200 300 400 500 600 s) ncia
0 0 Freq
Tempo (s)
(c) (b)
Fig. 8 - Atuao do sistema de controle de temperatura. (a) Curva da Fig. 10 Atuao do sistema de controle para o deslocamento do
temperatura; (b) curva da potncia entregue ao alto-falante; (c) curva cone. (a) Curva da potncia entregue ao alto-falante; (b) curva do
do ganho para o controle de temperatura. deslocamento do cone.
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004
42
BORTONI, ET.AL. CTRTBDCAOAP
5. AGRADECIMENTOS
Agradecemos ao Eng. Walter Antnio Gontijo pela
0.012
ajuda referente a parte digital deste trabalho e ao
Eng. Homero Sette Silva pelas muitas discusses
Deslocamento do Cone (m)
0.01
70
Analysis, Measurement, and Design, J Audio Eng.
60
Soc., vol. 35, no. 10, pp. 778-791, Outubro 1987.
50
[6] H. S. Silva, O Alto-falante em Regime de Grandes
40
Sinais, 1 SEMEA - Seminrio de Engenharia de
600 udio, Belo Horizonte, MG, CD-ROM, Junho 2002.
200
400
150 [7] G. Penkov e P. Valtchev, Overheat Protection Circuits
Te
mp
o(
200
50
100
(Hz) for Moving-Coil Loudspeakers, 90th AES Convention,
s) ncia
Freq
0 0 AES Preprint no. 3036, 1991.
(b)
[8] I. G. Behler, Measuring the Loudspeakers Impedance
During Operation for the Derivation of the Voice Coil
Temperature, 98th AES Convention, AES Preprint no.
4001, 1995.
150
[9] W. Klippel, Measurement of Large-Signal Parameters
of Electrodynamic Transducer, 107th AES Convention,
Temperatura da bobina( C)
VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004
43
Projeto e produo do CD
fo n e / f a x : ( 4 8 ) 2 3 2 . 1 3 5 7
44
clicdata@clicdata.com.br
w w w. c l i c d a t a . c o m . b r