Você está na página 1de 54

Anais do II Congresso Brasileiro

de Engenharia de udio
da AES-Brasil, apresentado na
VIII Conveno Nacional da AES-Brasil

Centro de Convenes Blue Tree Towers


So Paulo, SP
7 a 9 de junho de 2004
X
sumrio

Apresentao

Crditos

Trabalhos

Autores
apresentao
Sejam todos bem vindos VIII Conveno Nacional da Sociedade de Enge-
nharia de udio AES Brasil. A AES uma sociedade mundial, sem fins lucrati-
vos, cujo objetivo estimular o estudo e o desenvolvimento da engenharia de
udio. A AES est dividida em regies e essas regies esto subdivididas em
sees. A Seo Brasil da AES foi criada em 1996 e pertencem a essa seo todos
os membros da AES residentes no Brasil. Com mais de 50 anos desde sua funda-
o, a AES a nica sociedade profissional dedicada exclusivamente tecnologia
de udio.
A AES serve aos seus membros, indstria e ao pblico em geral, estimu-
lando e facilitando os avanos no campo dinmico da engenharia de udio. Ela
apia e dissemina novos desenvolvimentos atravs de reunies tcnicas, de
exposies de equipamentos profissionais e do seu conceituado peridico Journal
of the Audio Engineering Society.
As Convenes da AES Brasil consistem de exposies e palestras convida-
das e, desde o ano de 2003, incluem um Congresso Cientfico. Este ano, estamos
realizando o II Congresso Brasileiro de Engenharia de udio. Esse Congresso
visa a dar Conveno tambm um carter cientfico/acadmico, apresentando
trabalhos tcnicos relacionados aos avanos da rea de engenharia de udio. A
organizao tcnica do Congresso contou com a participao ativa de trs im-
portantes universidades brasileiras (UFRJ, UFSC e USP). Os trabalhos foram
selecionados por um corpo de revisores formado basicamente por professores/
pesquisadores atuantes na rea de engenharia de udio e suas reas correlatas.
Esperamos que esta Conveno seja um marco memorvel na histria da
Sociedade de Engenharia de udio AES Brasil. Todos ns, Comisso
Organizadora, Comisso Tcnica, revisores e ainda os autores dos artigos tcni-
cos submetidos ao Congresso, fizemos o mximo para alcanar essa meta.

Eng. Joel Brito - Coordenador Geral


Prof. Luiz Wagner Pereira Biscainho - Coordenador Tcnico
II Congresso Brasileiro de Engenharia de udio da
crditos
AES Brasil
So Paulo, 5 a 7 de junho de 2004

Coordenao Geral:
Joel Brito (AES-Brasil)

Coordenao Tcnica:
Luiz Wagner Pereira Biscainho (UFRJ)

Comisso Tcnica:
Marcelo Knrich Zuffo (USP)
Regis Rossi Alves Faria (USP)
Rosalfonso Bortoni (Studio R)
Rui Seara (UFSC)
Sergio Lima Netto (UFRJ)
Sidnei Noceti Filho (UFSC)
Relao de Revisores:
crditos
Andr Lus Dalcastagn

Antonio Carlos Moreiro de Queiroz

Fernando Antnio Pinto Barqui

Fernando Santana Pacheco

Filipe Castello da Costa Beltro Diniz

Joarez Bastos Monteiro

Leandro Ferrari Thomaz

Marcelo Knrich Zuffo

Phabio Junckes Setubal

Regis Rossi Alves Faria

Sergio Gilberto Rodrguez Soria

Sergio Lima Netto

Sidnei Noceti Filho

Solimar de Souza Silva


Trabalhos
trabalhos
Uma Reviso sobre Metodologia para Avaliao Subjetiva de
Componentes de udio.
Chistian G. Herrera

Sistema Adaptativo para Caracterizao de Alto-Falantes.


Rafael C. Haical; Fbio P. Itturrie; Mrcio H. Costa; Delmar B.
Carvalho

Anlise de Viabilidade da Aplicao de Filme Fino Metlico em


Cones e Domos de Alto-Falantes.
Hugo DA. Jucosky; Roberto K. Yamamoto; Walter Ullmann

Impermeabilizao de Cones de Papel de Alto-Falantes com


Plasma de CF4/H2.
Hugo DA. Jucosky; Roberto K. Yamamoto

Estado da Arte da Classificao de Sinais de udio.


Jayme G. A. Barbedo; Amauri Lopes

Interpolao de Sinais de udio Usando Polinmios do Par de


Linhas Espectrais
Paulo A. A. Esquef
Trabalhos
trabalhos
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.
Fbio P. Freeland; Luiz W. P. Biscainho; Paulo S. R. Diniz

Controle em Tempo Real da Temperatura da Bobina e do


Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.
Constncio Bortoni; Sidnei Noceti Filho; Rosalfonso Bortoni; Rui
Seara
Autores

Barbedo, Jayme G. A.
autores
Estado da Arte da Classificao de Sinais de udio.

Biscainho, Luiz W. P.
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.

Bortoni, Constncio
Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.

Bortoni, Rosalfonso
Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.

Carvalho, Delmar B.
Sistema Adaptativo para Caracterizao de Alto-Falantes.

Costa, Mrcio H.
Sistema Adaptativo para Caracterizao de Alto-Falantes.

Diniz, Paulo S. R.
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.
Autores

Esquef, Paulo A. A.
autores
Interpolao de Sinais de udio Usando Polinmios do Par de Linhas
Espectrais.

Freeland, Fbio P.
Interpolao Bilinear Generalizada de HRTFs para Gerao de Som
Tridimensional.

Haical, Rafael C.
Sistema Adaptativo para Caracterizao de Alto-Falantes.

Herrera, Chistian G.
Uma Reviso sobre Metodologia para Avaliao Subjetiva de
Componentes de udio.

Itturri, Fbio P.
Sistema Adaptativo para Caracterizao de Alto-Falantes.

Jucosky, Hugo DA.


Anlise de Viabilidade da Aplicao de Filme Fino Metlico em Cones
e Domos de Alto-Falantes.
Impermeabilizao de Cones de Papel de Alto-Falantes com Plasma
de CF4/H2.
Autores

Lopes, Amauri
autores
Estado da Arte da Classificao de Sinais de udio.

Noceti Filho, Sidnei


Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.

Seara, Rui
Controle em Tempo Real da Temperatura da Bobina e do
Deslocamento do Cone de Alto-falantes para Operao em Alta
Potncia.

Ullmann, Walter
Anlise de Viabilidade da Aplicao de Filme Fino Metlico em Cones
e Domos de Alto-Falantes.

Yamamoto, Roberto K.
Anlise de Viabilidade da Aplicao de Filme Fino Metlico em Cones
e Domos de Alto-Falantes.
Impermeabilizao de Cones de Papel de Alto-Falantes com Plasma
de CF4/H2.
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil

Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
nd
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42 Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.

___________________________________
Uma Reviso Sobre Metodologias Para Avaliao Subjetiva de
Componentes de udio

Christian Gonalves Herrera


UFMG Programa de Ps Graduao em Engenharia Eltrica
Belo Horizonte, Minas Gerais, Brasil
herrera@cpdee.ufmg.br

1HVWH WUDEDOKR p GLVFXWLGD D QHFHVVLGDGH GD H[HFXomR GH WHVWHV DXGLWLYRV VXEMHWLYRV SDUD D DYDOLDomR GH
RESUMO

FRPSRQHQWHVGHiXGLR$DERUGDJHPGRWHPDVREXPSRQWR GH YLVWD FLHQWtILFR p GHIHQGLGD H FRQVLGHUDGD GH YLWDO


LPSRUWkQFLD QD REWHQomR GH UHVXOWDGRV FRQILiYHLV H VLJQLILFDQWHV $R ILQDO XP H[HPSOR LOXVWUD R FDVR WtSLFR RQGH
H[LVWHPGLVFUHSkQFLDVHQWUHDDYDOLDomRREMHWLYDHDDYDOLDomRVXEMHWLYD

HYHQWXDLV FRPSRQHQWHV XWLOL]DGRV FRPR UHIHUrQFLD $


$DSOLFDomRILQDOGDPDLRULDGRVVLVWHPDVGHiXGLRp OHJLWLPLGDGHGRWHVWHVypJDUDQWLGDTXDQGRVHH[HUFHR
INTRODUO

D DXGLomR GH XP SURJUDPD HJ YR] P~VLFD  R TXH Pi[LPRFRQWUROHVREUHHVWHVIDWRUHV


FRQVLVWH QXPD H[SHULrQFLD DOWDPHQWH VXEMHWLYD 0XLWR 2 QtYHO GH LQWHUHVVH GD FRPXQLGDGH GR iXGLR QHVWH
HPERUDRSURMHWRGHVWHVVLVWHPDVODQFHPmRGHWpFQLFDV WLSR GH DYDOLDomR H FRQVHTXHQWHPHQWH D DERUGDJHP
GH HQJHQKDULD HVVHQFLDOPHQWH REMHWLYDV SDUD D VHJXLGDDSUHVHQWDWUrVSHUILVWtSLFRVD RVUHYLVRUHVGH
DYDOLDomRGRSURGXWRILQDOVHPSUHVHID]QHFHVViULRXP SURGXWRV H DOJXPDV UHYLVWDV HVSHFLDOL]DGDV TXH
SURFHGLPHQWR TXH OHYH HP FRQVLGHUDomR RV DVSHFWRV IUHTHQWHPHQWH VH PXQHP GH PHWRGRORJLDV
VXEMHWLYRVHQYROYLGRVQDDXGLomR TXHVWLRQiYHLV GR SRQWR GH YLVWD FLHQWtILFR H VmR DVVLP
$ YDOLGDGH GRV UHVXOWDGRV REWLGRV QXPD DYDOLDomR OHYDGRVDWHFHUFUtWLFDVSRXFDIXQGDPHQWDGDVVREUHXP
VXEMHWLYD GH FRPSRQHQWHV GH iXGLR GHSHQGH GH TXDWUR GHWHUPLQDGR SURGXWR E  R PHUFDGR FRQVXPLGRU TXH
IDWRUHVD DVFRQGLo}HVGRDPELHQWHRQGHRVWHVWHVVmR EXVFD SRU PpWRGRV SDGURQL]DGRV GH DYDOLDomR SDUD
UHDOL]DGRVE RWLSRGRSURJUDPDDVHUH[HFXWDGRSHORV RULHQWDU VXD GHFLVmR QD FRPSUD GH HTXLSDPHQWRV TXH
HTXLSDPHQWRV HP DQiOLVH F  DV FRQGLo}HV LQGLYLGXDLV FRQIRUPDP VXDV QHFHVVLGDGHV F  D FRPXQLGDGH
GRVRXYLQWHV SDUWLFLSDQWHV GR WHVWH G  D TXDOLGDGH GRV FLHQWtILFD TXH DFUHGLWD QD FRUUHODomR HQWUH DV

1
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

FDUDFWHUtVWLFDV DXGtYHLV H RV SDUkPHWURV REMHWLYRV H TXHSRVVtYHODHQWUDGDGRHTXLSDPHQWRHPWHVWH


WUDEDOKD QD EXVFD GH PHWRGRORJLDV TXH FRQVLGHUHP RV ((7 GHYHVHUH[FLWDGDSRUXPDIRQWHGHEDL[D
OLPLWHV GD DXGLomR KXPDQD H R HVWDGR GD DUWH QDV LPSHGkQFLDGHVDtGD EXIIHU 
WpFQLFDVGHPHGLomR E GLIHUHQoDV OLQHDUHV PHQVXUiYHLV GHYHP VHU
2 REMHWLYR GHVWH DUWLJR p GLVFXWLU DV PHWRGRORJLDV HOLPLQDGDV DQWHV TXH TXDOTXHU FRQFOXVmR VHMD
FLHQWtILFDV GHVHQYROYLGDV QRV ~OWLPRV YLQWH DQRV SDUD WRPDGD D UHVSHLWR GH GLVWRUo}HV RULJLQDGDV SRU
DYDOLDomR VXEMHWLYD GH FRPSRQHQWHV GH iXGLR 6mR QmR OLQHDULGDGHV (VWDV GLIHUHQoDV UHIHUHPVH
DERUGDGRV SURFHGLPHQWRV D VHUHP WRPDGRV SDUD SULQFLSDOPHQWH j DQRPDOLDV QD UHVSRVWD HP
PD[LPL]DU R FRQWUROH VREUH RV GLYHUVRV IDWRUHV TXH IUHTrQFLD GR ((7 H TXH SRGHP VHU
YrP D LQIOXHQFLDU D SHUFHSomR GRV RXYLQWHV $R ILQDO SURQWDPHQWH FRUULJLGDV DWUDYpV GH ILOWUDJHQV
XP H[HPSOR GH WHVWH p DSUHVHQWDGR RQGH p DYDOLDGR R DGHTXDGDV HTXDOL]DomR 7DPEpPVmRIRQWHVGH
FRGLILFDGRU GH iXGLR GLJLWDO SDUD FRPSUHVVmR FRP GLIHUHQoDV OLQHDUHV D UHVSRVWD GH IDVH D
SHUGDVGHQRPLQDGR03(*/D\HU 03  SRODULGDGH H ILQDOPHQWH R JDQKR GR ((7
([SHULPHQWRV GHVFULWRV HP >@ UHYHODP TXH
GLIHUHQoDV GH DSHQDV  G% HQWUH RLWDYDV
DGMDFHQWHV SRGHP VHU SHUFHELGDV SHOR DSDUHOKR
AVALIAES SUBJETIVAS
([LVWHP PXLWDVUD]}HVTXHMXVWLILFDP D QHFHVVLGDGH
DXGLWLYR KXPDQR 3RURXWUR ODGR GLIHUHQoDV GH
H D XWLOLGDGH GRV WHVWHV VXEMHWLYRV SDUD DYDOLDomR GH
PDLVGHG% SRGHP VHU IDFLOPHQWH SURGX]LGDV
FRPSRQHQWHV GH iXGLR $ SULQFLSDO GHODV UHIHUHVH DR
QDVDtGDGHDPSOLILFDGRUHVGHSRWrQFLDGHYLGRj
IDWR GH TXH QHP WRGDV DV FDUDFWHUtVWLFDV DXGtYHLV
JUDQGHYDULDomRGDLPSHGkQFLDGRVDOWRIDODQWHV
SRGHP VHU REMHWLYDPHQWH PHGLGDV H FRUUHODFLRQDGDV
FRP D IUHTrQFLD (PERUD HVWDV GLIHUHQoDV
FRP R TXH p RXYLGR FRP DV DWXDLV IHUUDPHQWDV
VHMDP HIHWLYDPHQWH DXGtYHLV HODV QmR VH
GLVSRQtYHLV(VWHIDWRQmRLPSOLFDGHIRUPDDOJXPDTXH
UHIHUHP D DUWHIDWRV JHUDGRV D SDUWLU GH
RVUHVXOWDGRV GH PHGLo}HV REMHWLYDV VHMDP LUUHOHYDQWHV
FRPSRUWDPHQWRQmROLQHDUGR((7
DRFDUDFWHUL]DUXPFRPSRQHQWH$RFRQWUiULRKiPXLWD
F IRFDOL]DURWHVWHQDGHWHFomRGHVLPLODULGDGHRX
LQIRUPDomR D VHU H[WUDtGD GHVWDV PHGLo}HV
GLIHUHQoD HQWUH GRLV HTXLSDPHQWRV (VWH
SULQFLSDOPHQWH VH IRUHP UHDOL]DGDV GH PDQHLUD PDLV
SURFHGLPHQWR GHYH VHU VHJXLGR QRV FDVRV HP
FRPSOHWDHDGHTXDGDGRTXHYHPVHQGRIHLWR
TXH XPD UHIHUrQFLD DEVROXWD QmR HVWHMD
'H IDWR SRGHP VHU TXHVWLRQiYHLV RV PRWLYRV TXH
GLVSRQtYHO RX YLiYHO GH VHU XWLOL]DGD QR WHVWH
OHYDP XPSHVTXLVDGRUDLQYHVWLJDUGLIHUHQoDVDXGtYHLV
4XDQWR PHOKRU R WHVWH PDLV VLPSOHV p D
WmR DSDUHQWHPHQWH LQVLJQLILFDQWHV HQWUH FRPSRQHQWHV
QDWXUH]D GR MXOJDPHQWR TXH R RXYLQWH WHUi TXH
TXH IDWDOPHQWH QmR VHULDP SHUFHELGDV HP VLWXDo}HV
ID]HU8PH[HPSORWtSLFRGHXPWHVWHFRPXPD
UHDLV&RQWXGRH[LVWHRDUJXPHQWRGHTXH D FDGHLD GH
UHIHUrQFLDDEVROXWDSUHVHQWHpRFDVRGRWHVWHGH
HTXLSDPHQWRVSHORVTXDLVWUDIHJDRVLQDOGHiXGLRSRGH
FDL[DV DF~VWLFDV D FRPSDUDomR p IHLWD HQWUH D
VHU WmR FRPSOH[D TXH R DF~PXOR GH LPSHUIHLo}HV DR
YR] GR ORFXWRU DR YLYR QD VDOD GH WHVWH H D
ORQJR GRV GLYHUVRV HTXLSDPHQWRV GHJUDGD R VLQDO D
UHSURGXomR GD PHVPD YR] JUDYDGD QXPD
SRQWR GH WRUQDU LQDFHLWiYHO R UHVXOWDGR ILQDO 7DPEpP
FkPDUDDQHFyLFD
H[LVWH D WHRULD TXH R KRPHP p FDSD] GH GHWHFWDU
G H[HFXomR GH WHVWH FHJRV RX SUHIHUHQFLDOPHQWH
TXDOTXHU GLIHUHQoDDXGtYHOHQWUHGRLVVLQDLVVHOKH IRU
GXSOR FHJRV 8P WHVWH FHJR p DTXHOH RQGH R
GDGRRWHPSRVXILFLHQWH>@
RXYLQWH QmR VDEH TXDO FRPSRQHQWH HVWi VHQGR
(PERUDFDGDLQGLYtGXRSRVVXDVXDSUySULDRSLQLmRH
DYDOLDGRQRPRPHQWRGDDXGLomRHQTXDQWRTXH
SUHIHUrQFLDHVWDRSLQLmRVyWHUiVHQWLGRSDUDDOJXpPVH
XPWHVWHGXSORFHJRpDTXHOHTXHQHPRRXYLQWH
FRQWLYHUHOHPHQWRVFODURVGHREMHWLYLGDGHFRQVLVWrQFLD
QHP D SHVVRD TXH HVWi FRQGX]LQGR R WHVWH WHP
H UHSHWLWLELOLGDGH 7DLV HOHPHQWRV Vy SRGHP VHU
DFHVVRjLGHQWLGDGHGRFRPSRQHQWH1HVWHFDVR
FRQVHJXLGRV DWUDYpV GD SUHYHQomR GH YDULDo}HV
XP JDEDULWR FRP DV UHVSRVWDV GHYH VHU JHUDGR
LQGHVHMDGDV GH SDUkPHWURV TXH YHQKDP D LQIOXHQFLDU R
SRUXPDJHQWHLQH[SUHVVLYRFRPRSRUH[HPSOR
UHVXOWDGR H GD XWLOL]DomR GH UHIHUrQFLDV DEVROXWDV
XPPLFURFRPSXWDGRU
VHPSUHTXHSRVVtYHOGHPRGRTXHDH[DWLGmRSRVVDVHU
YHULILFDGDREMHWLYDPHQWHHQmRDSHQDVDGLYLQKDGD
$OJXQV UHTXLVLWRV SDUD JDUDQWLU D YDOLGDGH GRV
CONDIES ACSTICAS DO AMBIENTE
UHVXOWDGRVGHDYDOLDo}HVVXEMHWLYDVGHYHPVHUVHJXLGRV 6HRREMHWLYRpHOLPLQDUDRPi[LPRTXDLVTXHUIRQWHV
>@ GHLQWHUIHUrQFLDQXPWHVWHDXGLWLYRpEDVWDQWHLQWXLWLYR
D DWHQomRQDLQWHUIDFHHQWUHGRLVHTXLSDPHQWRV2 VHSHQVDUHPUHDOL]DURVWHVWHVXVDQGRIRQHVGHRXYLGR
DGHTXDGR FDVDPHQWR GH LPSHGkQFLD HYLWD 'HVWD PDQHLUD DV FRQGLo}HV DF~VWLFDV HJ WHPSR GH
VREUHFDUJDV H FRQVHTXHQWHPHQWH DOWHUDo}HV QD UHYHUEHUDomR RQGDV HVWDFLRQiULDV  GH XPD VDOD GH
UHVSRVWD HP IUHTrQFLD GH XP VLVWHPD 6HPSUH DXGLomR VmR HYLWDGDV (VWD IDFLOLGDGH QmR SRGH VHU

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 2
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

LPSOHPHQWDGD TXDQGR R FRPSRQHQWH D VHU DYDOLDGR p JUDYDomR SRU UHPHWHU R RXYLQWH D XPD UHIHUrQFLD
XPD FDL[D DF~VWLFD RX TXDQGR VH GHVHMD DYDOLDU R LQH[LVWHQWHQRPXQGRUHDO
FRPSRQHQWH VLPXODQGR FRQGLo}HV QRUPDLV GH *UDYDo}HV GH VRQV IDPLOLDUHV FRPR D YR] KXPDQD
RSHUDomR RX LQVWUXPHQWRV PXVLFDLV SRSXODUHV GHYHP VHU
6HQGR DVVLP DOJXQV UHTXLVLWRV D UHVSHLWR GDV SUHIHULGRV 2 FRQWH~GR GR HVSHFWUR GH IUHTrQFLDV GR
FRQGLo}HVDF~VWLFDVGRDPELHQWHRQGHDFRQWHFHRWHVWH FRQMXQWRGHJUDYDo}HVGHYHFREULUWRGDDIDL[DDXGtYHO
GHYHPVHUOHYDGDVHPFRQVLGHUDomR>@ KXPDQD
D WDPDQKR H JHRPHWULD GHYHP VHU XVDGDV VDODV $OJXQV WLSRV GH VLQDLV FRPR VHQyLGHV H UXtGRV
FRP iUHD VXSHULRU D  P FRP Sp GLUHLWR EUDQFR RX URVD SRGHP VHU XWLOL]DGRV HP DYDOLDo}HV
VXSHULRU D  P $ JHRPHWULD GHYH DSUHVHQWDU DXGLWLYDV 3RUpP FHUWR FXLGDGR GHYH VHU WRPDGR QD
FHUWD VLPHWULD ORQJLWXGLQDO SRUpP GHYHP VHU LQWHUSUHWDomR GRV UHVXOWDGRV SRLV HVWHV VLQDLV SRGHP
HYLWDGDV SDUHGHV SDUDOHODV SRLV SURSLFLDP R UHYHODU FDUDFWHUtVWLFDV GR VLVWHPD HP TXHVWmR TXH QmR
DSDUHFLPHQWRGHRQGDVHVWDFLRQiULDV SRGHULDPVHUSHUFHELGDVQRFDVRGDDXGLomRGHP~VLFD
E UHIOH[}HV R WHPSR GH UHYHUEHUDomR WtSLFR 8P H[HPSOR WtSLFR p R IHQ{PHQR GR VLVWHPD DXGLWLYR
57  FRPSDWtYHO FRP VDODV GH DXGLomR FRQKHFLGR FRPR PDVFDUDPHQWR RQGH XP WRP FRP
GRPpVWLFDVRX VDODVGHFRQWUROHHPHVW~GLRVGH DPSOLWXGH UHODWLYDPHQWH DOWD HQFREUH WRQV GH
JUDYDomR p GH  r  V 5HIOH[}HV TXH IUHTrQFLDV SUy[LPDV DGMDFHQWHV >@ 1HVWH FDVR
FDUDFWHUL]HPHFRVGHYHPVHUHOLPLQDGDV GLVWRUo}HV KDUP{QLFDV GH EDL[D RUGHP SRGHP SDVVDU
F UXtGR GH IXQGR R UXtGR GH IXQGR QD VDOD QmR GHVDSHUFHELGDV TXDQGR SURJUDPDV GH FRQWH~GR
GHYH H[FHGHU  G%$ RX  G%& QHP HVSHFWUDOFRPSOH[RFRPRP~VLFDVmRRXYLGRV
WDPSRXFR GHYH FRQWHU WRQV SHULyGLFRV 'HWHUPLQDGRV HVWLORV PXVLFDLV VmR HVWUDWpJLFRV SDUD
GRPLQDQWHV HJUXtGRVGH+]GHUHDWRUHVGH LGHQWLILFDomR GH SDUkPHWURV VXEMHWLYRV 6RQV
OkPSDGDVIOXRUHVFHQWHV  SHUFXVVLYRVVmRLGHDLVSDUDDYDOLDomRGDFDSDFLGDGHGH
G SRVLFLRQDPHQWR GDV FDL[DV DF~VWLFDV D UHVSRVWD D WUDQVLHQWHV URFNQUROO VHUYH EHP QD
SUR[LPLGDGH D UHJL}HV OLPLWHV GD VDOD SDUHGHV DYDOLDomRGDUHVSRVWDHPIUHTrQFLDGRVLVWHPDP~VLFD
WHWR SLVR  DOWHUD D FDUJD DF~VWLFD YLVWD SHOD VLQI{QLFD SRGH VHU LQWHUHVVDQWH GHYLGR jV JUDQGHV
FDL[DOHYDQGRDYDULDo}HVQDUDGLDomRGHEDL[DV YDULDo}HVGHGLQkPLFDQRUPDOPHQWHH[SORUDGDV
IUHTrQFLDV SULQFLSDOPHQWH 7DPEpP DV 2 QtYHO GH SUHVVmR VRQRUD 63/  GR SURJUDPD
UHIOH[}HV SULPiULDV GH DPSOLWXGH VLJQLILFDWLYD H[HFXWDGR GHYH VHU FRPSDWtYHO DR 63/ GDV IRQWHV
QRSHUtRGRGHDWpPVDSyVRVRPGLUHWRDWLQJLU VRQRUDV RULJLQDLV 8PD RUTXHVWUD VLQI{QLFD SRU
R RXYLQWH SRGHP HQIDWL]DU DV IUHTrQFLDV H[HPSOR SRGH FKHJDU DRV  G%$ 7RGRV RV
PpGLDV WUD]HQGR XPD FRORUDomR LQGHYLGD DR FRPSRQHQWHV DYDOLDGRV GHYHP VHU SUHYLDPHQWH
SURJUDPDH[HFXWDGR(PDYDOLDo}HVGHLPDJHP FDOLEUDGRVGHPDQHLUDDQmRDSUHVHQWDUHPGLIHUHQoDVGH
VRQRUDGHVLVWHPDVPXOWLFDQDLVDVFDL[DVGHYHP LQWHQVLGDGHPDLRUHVTXHr G%HQWUHVL
ID]HU XP kQJXOR GH QR PtQLPR  FRP R
RXYLQWHQRYpUWLFHGRkQJXOR
H SRVLFLRQDPHQWRGRVRXYLQWHVXPDGLVWkQFLDGH
CONDIES DOS OUVINTES
$ H[SHULrQFLD PRVWUD TXH DV KDELOLGDGHV GRV
QRPtQLPRPHWURGHTXDOTXHUSDUHGHGHYHVHU
RXYLQWHV HP SHUFHEHU GLIHUHQoDV V{QLFDV HP VH
PDQWLGD SDUD HYLWDU FRORUDo}HV HRX GLVWRUo}HV
FRQFHQWUDU GHYLGDPHQWH QR WHVWH RX GH UHDJLU GH
GH LPDJHP VRQRUD $ GLVWkQFLD GR RXYLQWH j
PDQHLUDFRQVLVWHQWHDGLYHUVDVUHSHWLo}HVGHXPPHVPR
FDL[DDF~VWLFDGHYHVHUFRHUHQWHDRWLSRGDFDL[D
HVWtPXOR VRQRUR YDULD FRQVLGHUDYHOPHQWH >@ 2V
FDPSRSUy[LPRFDPSRPpGLRHWF
SULQFLSDLV IDWRUHV TXH OHYDP D HVWD YDULDomR GH
FRPSRUWDPHQWR VmR DV FRQGLo}HV SVLFRILVLROyJLFDV GR
RXYLQWHEHPFRPRDVXDH[SHULrQFLDSUpYLD
CARACTERSTICAS DOS PROGRAMAS
$FRUUHWDVHOHomRHWUHLQDPHQWRGHLQGLYtGXRVSDUDD
EXECUTADOS
'HYHVHUGDGDSUHIHUrQFLDDSURJUDPDVDUPD]HQDGRV UHDOL]DomRGHDYDOLDo}HVVXEMHWLYDVHPFRPSRQHQWHVGH
HP PtGLDV GLJLWDLV GDGD D VXD PDLRU FDSDFLGDGH GH iXGLR SURSRUFLRQD PDLRU FRQILDELOLGDGH DR WHVWH XPD
PDQWHUDLQWHJULGDGHGRVGDGRVGXUDQWHDVXDYLGD~WLO YH]TXHIDWRUHVFRPRDUHSHWLWLELOLGDGHHDVLJQLILFkQFLD
DOpP GD SRVVLELOLGDGH GH VHUHP IHLWDV FySLDV SUHFLVDV GRVUHVXOWDGRVVmRPDQWLGRVVREPDLRUFRQWUROH2JUDX
GRPDWHULDOJUDYDGR GH FRQVLVWrQFLD GDV UHSRVWDV p PHQVXUDGR D SDUWLU GR
2EYLDPHQWH DV JUDYDo}HV XWLOL]DGDV GHYHP WHU VXD GHVYLR SDGUmR GD WD[D GH DFHUWRV SDUD XP FRQMXQWR GH
SURFHGrQFLD JDUDQWLGD QR TXH GL] UHVSHLWR jV WpFQLFDV DYDOLDo}HV
GH PLFURIRQDomR H FRQGLFLRQDPHQWR GRV VLQDLV
FDSWDGRV 4XDOTXHU WLSR GH SURFHVVDPHQWR HJ
HTXDOL]DomR FRPSUHVVmR GLQkPLFD  GHVDELOLWD XPD

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 3
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

(VWD H[SHULrQFLD LQFOXL IDPLOLDULGDGH FRP


LQVWUXPHQWRV PXVLFDLV H SUHVHQoD HP FRQFHUWRV
Limiar da Audio
'H DFRUGR FRP D ,62  >@ XPD SHVVRD
H[SHULrQFLD FRP DQiOLVH FUtWLFD GH VRQV UHSURGX]LGRV
RWRORJLFDPHQWH QRUPDO p DTXHOD HP FRQGLo}HV
DUWLILFLDOPHQWHRXH[HFXWDGRVDRYLYRHDDSWLGmRJHUDO
QRUPDLV GH VD~GH TXH QR PRPHQWR GR WHVWH QmR
HPGHWHFWDUGLIHUHQoDVDXGtYHLVHPVRQVJUDYDGRV
DSUHVHQWD H[FHVVR GH FHUD QR FDQDO DXGLWLYR VHP
+DQVHQ >@ SXEOLFRX UHVXOWDGRV RQGH HVWD WHQGrQFLD
QHQKXPD SDWRORJLD DXGLWLYD GLDJQRVWLFDGD H TXH QmR
VH IH] PRVWUDU H GLVFXWH R HVIRUoR QHFHVViULR HP
DSUHVHQWD KLVWyULFR GH H[SRVLomR LQGHYLGD D UXtGRV
VHOHFLRQDU SDUWLFLSDQWHV FRP JUDXV GH H[SHULrQFLD
(VWD QRUPD SUHJD DLQGD TXH FDVR VHMD FRQVLGHUDGR
DXGLWLYDFRQKHFLGRV
DFHLWiYHOXPGHVYLRQROLPLDUGHDXGLomRGHDWpG%
$ GLIHUHQoD QR GHVYLR SDGUmR GD WD[D GH DFHUWRV
HQWUH  H  +] PHQRV GH  GD SRSXODomR
HQWUH GRLV RX PDLV JUXSRV FRP GLIHUHQWHV SHUILV GH
PDVFXOLQD RWRORJLFDPHQWH QRUPDO FRP LGDGH GH 
H[SHULrQFLD UHYHOD TXH GDGD XPD PDJQLWXGH GH
DQRVVHUiH[FOXtGD
LQWHUYDORGHFRQILDQoDHVSHUDGDRQ~PHURGHRXYLQWHV
7RROH >@ UHDOL]RX H[SHULPHQWRV SDUD DQDOLVDU D
QHFHVViULRV SDUD XP GHWHUPLQDGR JUXSR GHYH VHU
LQIOXrQFLDFDXVDGDSHODPDJQLWXGHGRGHVYLRGROLPLDU
DMXVWDGR
GH DXGLomR QD YDULDomR GD WD[D GH DFHUWRV GH GLYHUVRV
2WUHLQDPHQWRGHRXYLQWHVpXPSURFHGLPHQWRFXMRV
RXYLQWHV SDUD H[SHULPHQWRV UHSHWLGRV )RL GHWHFWDGR
UHVXOWDGRV SVLFRDF~VWLFRV VmR EHP FRQKHFLGRV $SyV
TXHSDUDIUHTrQFLDVDFLPDGHN+]DFRUUHODomRHQWUH
YiULDV UHSHWLo}HV GH XP PHVPR HVWtPXOR FHUWDV
RGHVYLRSDGUmRGDWD[DGHDFHUWRVHRGHVYLRGROLPLDU
FDSDFLGDGHV DXGLWLYDV GH XP RXYLQWH SRGHP VHU
GH DXGLomR p SHTXHQD HQTXDQWR TXH SDUD IUHTrQFLDV
DOWHUDGDV FRPR SRU H[HPSOR R OLPLDU DEVROXWR GD
DEDL[R GH  N+] D FRUUHODomR p DOWD (P RXWUDV
DXGLomR 2 REMHWLYR GH XP SURJUDPD GH WUHLQDPHQWR
SDODYUDVLVWRPRVWUDTXHXPRXYLQWHHPPiVFRQGLo}HV
QXP JUXSR GH RXYLQWHV p JDUDQWLU TXH RV GLIHUHQWHV
RWROyJLFDV WHP PHQRU FDSDFLGDGH GH PDQWHU FRHUrQFLD
DVSHFWRV GR GHVHPSHQKR DXGLWLYR GHVWHV DOFDQFH XP
HQWUH UHSHWLGDV DYDOLDo}HV VXEMHWLYDV (QWUHWDQWR R
QtYHO DVVLQWyWLFR UHVXOWDQGR QD Pi[LPD HILFLrQFLD GH
JUXSR GH RXYLQWHV TXH 7RROH XWLOL]RX FRPR DPRVWUD
WHPSRSUHFLVmRHFXVWRVSDUDXPDDYDOLDomR
DSUHVHQWDYD FDUDFWHUtVWLFDV FRPR LGDGH H KLVWyULFR GH
H[SRVLomR D UXtGRV TXH RV LPSHGLDP GH VHUHP
FODVVLILFDGRVFRPRRWRORJLFDPHQWHQRUPDLVVHJXQGRD
MTODO A/B/X
,62 2 WLSR GH WHVWH PDLV UHFRPHQGDGR QD OLWHUDWXUD p R
-i QR H[SHULPHQWR FRQGX]LGR SRU %HFK >@ XP WHVWH GXSOR FHJR $%; >@ (VWH WHVWH )LJXUD   WHP
JUXSR GH  RXYLQWHV RWRORJLFDPHQWH QRUPDLV QmR FRPR REMHWLYR SURPRYHU D FRPSDUDomR GLUHWD HQWUH
DSUHVHQWRX FRUUHODomR VLJQLILFDQWH HQWUH RV GRLV GRLVFRPSRQHQWHVGHiXGLR $H% (PFHUWRVFDVRVR
SDUkPHWURVFLWDGRVRTXHOHYDDFRQFOXLUTXHDHVFROKD ((7pOLJDGRDRFDQDO%HRFDQDO$pFXUWRFLUFXLWDGR
GH RXYLQWHV FRP FRQGLo}HV DGHTXDGDV GH VD~GH VHUYLQGRFRPRUHIHUrQFLD$VVLPTXDOTXHUGLIHUHQoDp
RWROyJLFD JDUDQWH D KDELOLGDGH GHVWHV HP UHSHWLU GH DWULEXtGD jV GLVWRUo}HV JHUDGDV SHOR ((7 2 RXYLQWH
PDQHLUD FRQVLVWHQWH DV WD[DV GH DFHUWR QDV DYDOLDo}HV WHPjVXDGLVSRVLomRXPFRQWUROHGHFRPDQGRVPXQLGR
VXEMHWLYDV GHXPDFKDYHVHOHWRUDGHWUrVSRVLo}HV$VSRVLo}HV$
H % FRQHFWDP ORJLFDPHQWH R FRPSRQHQWH $ RX % j
FDGHLD GR iXGLR $ SRVLomR ; GLVSDUD XP FLUFXLWR
JHUDGRU GH VLQDLV DOHDWyULRV UHVSRQViYHO SRU HVFROKHU
Experincia Prvia
eEDVWDQWHLQWXLWLYRHOyJLFRDFUHGLWDUTXHXPJUXSR
HQWUHFRQHFWDURFDQDO $ RX % 1LQJXpP WHP DFHVVR j
GHRXYLQWHVFRPFRPSURYDGDH[SHULrQFLDHPWDUHIDVGH
HVFROKD HIHWXDGD SHOR GLVSRVLWLYR XP UHODWyULR RX
DYDOLDomR DXGLWLYD DSUHVHQWH WD[DV GH DFHUWR PDLV
JDEDULWRGRWHVWHpJHUDGRSDUDDYHULJXDomRSRVWHULRUH
KRPRJrQHDVTXHXPJUXSRGHRXYLQWHVLQH[SHULHQWHV
GHWHUPLQDomRGDWD[DGHDFHUWRV

)LJXUD'LDJUDPDHVTXHPiWLFRGRGLVSRVLWLYRSDUDUHDOL]DomRGRWHVWH$%;

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 4
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

$OJXQV SURFHGLPHQWRV RSHUDFLRQDLV VmR GRWLSR;RQGHIRLTXHVWLRQDGRDSURFHGrQFLDGRVLQDO


UHFRPHQGDGRV >@ SDUD D PD[LPL]DomR GD UHVROXomR RXYLGR $RX% 
DOFDQoDGDFRPRWHVWH 2JUXSRGHRXYLQWHVIRLFRPSRVWRSRUWUH]HDOXQRVH
D MXVWDSRVLomRLQVWDQWkQHDGRVVLQDLVFRPSDUDGRV SURIHVVRUHVGHSyVJUDGXDomRFRPLGDGHVHQWUHH
YiULRV DVSHFWRV TXDOLWDWLYRV GR VRP DQRV 1HQKXPD DYDOLDomR ItVLFD IRL UHDOL]DGD QHVWHV
SHUPDQHFHPQD PHPyULDGRRXYLQWHSRUFXUWRV RXYLQWHVSDUDGHWHUPLQDUVXDVFRQGLo}HVRWROyJLFDV
LQWHUYDORVGHWHPSR 8P IRUPXOiULR SDUD D DQRWDomR GDV UHVSRVWDV IRL
E TXHVW}HV GH QDWXUH]D FRPSDUDWLYD GHVFULo}HV GLVWULEXtGR FRQWHQGR WRGDV DV LQVWUXo}HV SDUD D
TXDOLWDWLYDV GHYHP VHU FRQVLGHUDGDV GH DFRUGR UHDOL]DomRGRWHVWH $QH[R$ 3RUVHWUDWDUGHXPWHVWH
FRPDH[SHULrQFLDGRRXYLQWH FRPSDUDWLYR HQWUH GRLV SURJUDPDV JUDYDGRV D
F WHPSR LOLPLWDGR VLWXDo}HV GH SUHVVmR SRU LQIOXrQFLD GRV HTXLSDPHQWRV GH UHSURGXomR XWLOL]DGRV
SUD]RVSRGHPLQLELUDVHQVLELOLGDGHGRRXYLQWHD S{GHVHUGHVFRQVLGHUDGD$UHODomRVLQDOUXtGR PHGLGD
FHUWRVSDUkPHWURVDXGtYHLV FRPSRQGHUDomR$ILFRXDFLPDGHG%63/
G GHFLVmR IRUoDGD R RXYLQWH VDEH TXH VHPSUH 2 UHVXOWDGR FRP DV WD[DV GH DFHUWR SDUD RV TXDWUR
H[LVWH XPD UHVSRVWD FHUWD $ RX % R TXH R WHVWHV p DSUHVHQWDGD QD 7DEHOD  2V UHVXOWDGRV
HQFRUDMD D H[SORUDU WRGD D VXD FDSDFLGDGH VXJHUHPTXHDFRGLILFDomR03FRPWD[DGHNESV
DXGLWLYDHPUHVSRQGHUFRUUHWDPHQWH p HVWDWLVWLFDPHQWH LPSURYiYHO GH VHU GLIHUHQFLDGD GD
H WHVWH FRQWURODGR SHOR RXYLQWH VH GHVHMDGR R FRGLILFDomR 3&0 SDUD RXYLQWHV FRP FRQGLo}HV
WHVWH SRGH VHU UHDOL]DGR LQGLYLGXDOPHQWH R TXH RWROyJLFDVDGYHUVDV
SRVVLELOLWD D DGHTXDomR GRV SURFHGLPHQWRV 1DV )LJXUDV  D  VmR DSUHVHQWDGDV DQiOLVHV QR
WHPSR GH H[SRVLomR RX FKDYHDPHQWR  jV GRPtQLR GD IUHTrQFLD ))7  SDUD XP GRV SURJUDPDV
SUHIHUrQFLDVGRRXYLQWH PXVLFDLV H[HFXWDGRV H SDUD XP WRP VHQRLGDO R TXH
SHUPLWH FRQVWDWDU TXH D FRGLILFDomR 03 DOpP GH
LQWURGX]LUGLVWRUo}HVQRVLQDODLQGDOLPLWDDVXDEDQGD
GH IUHTrQFLDV 1R HQWDQWR FRPR IRL DSRQWDGR SHOR
EXEMPLO PRTICO
3DUD LOXVWUDU D DSOLFDomR GH DOJXPDV GDV
WHVWH VXEMHWLYR HP GHWHUPLQDGDV FRQGLo}HV HVWHV
PHWRGRORJLDV GLVFXWLGDV XP WHVWH VXEMHWLYR IRL
IHQ{PHQRVVmRSRXFRSHUFHELGRVSHODDXGLomRKXPDQD
UHDOL]DGRFRPRREMHWLYRGHGHWHFWDUGLIHUHQoDVHQWUHDV
eLPSRUWDQWHGHL[DUFODURTXHDH[HFXomRGHVWHWHVWH
FRGLILFDo}HVGLJLWDLVGHVLQDLVGHiXGLR3&0H03$
QmRWHYHGHILQLWLYDPHQWHDLQWHQomRGHJHUDUUHVXOWDGRV
3&0 3XOVH&RGH0RGXODWLRQ pXPDFRGLILFDomRVHP
FLHQWLILFDPHQWHFRPSURYDGRVVREUHDTXDOLGDGHVRQRUD
SHUGDV XWLOL]DGD QDV WUDGLFLRQDLV PtGLDV GLJLWDLV GH
GHTXDOTXHUXPD GDV FRGLILFDo}HV 2 REMHWLYR DTXL IRL
iXGLRSULQFLSDOPHQWHQRV &'V &RPSDFW 'LVF  1HVWD
LOXVWUDUDOJXQVGRVSURFHGLPHQWRVGHIHQGLGRVDRORQJR
DSOLFDomRHVSHFtILFDDWD[DGHDPRVWUDJHPpGH
GHVWH WH[WR FRP IRFR SULQFLSDO QD WpFQLFD $%; DOpP
DPRVWUDV SRU VHJXQGR H D UHVROXomR p GH  ELWV
GHFRQIURQWDUUHVXOWDGRVREMHWLYRVFRPVXEMHWLYRV
TXDQWL]DGRVXQLIRUPHPHQWH203pXPDFRGLILFDomR
FRP SHUGDV TXH IRL SURSRVWD SDUD SRVVLELOLWDU XPD
FRPSUHVVmR QR WDPDQKR GR DUTXLYR GH iXGLR GLJLWDO
CONCLUSO
SDUD D WUDQVPLVVmR HP PHLRV FRP ODUJXUD GH EDQGD e SRVVtYHO UHDOL]DU WHVWHV VXEMHWLYRV SDUD DYDOLDomR
OLPLWDGD ,17(51(7  (QWUHWDQWR RV DOJRULWPRV TXH GH FRPSRQHQWHV GH iXGLR GH PDQHLUD FLHQWtILFD $V
UHDOL]DP D FRPSUHVVmR GR VLQDO GH iXGLR QR IRUPDWR PHWRGRORJLDV DTXL DSUHVHQWDGDV WrP FRPR REMHWLYR
03 GHVFDUWDP FHUWDV LQIRUPDo}HV TXH VmR SRXFR FRQIRUPDU SURFHGLPHQWRV FRP DOWR JUDX GH FRQWUROH
VLJQLILFDWLYDVSDUDDSHUFHSomRDXGLWLYDKXPDQD>@ SDUD TXH UHVXOWDGRV FRQILiYHLV H VLJQLILFDQWHV VHMDP
2 REMHWLYR GD DYDOLDomR p HQWmR FRQFOXLU VH D JHUDGRV
FRGLILFDomR 03 FRP VXDV SHUGDV LQHUHQWHV SRGH VHU $ REVHUYkQFLD D IDWRUHV FRPR FRQGLo}HV GR
GLIHUHQFLDGD DXGLWLYDPHQWH GD FRGLILFDomR 3&0  DPELHQWH FRQGLo}HV GRV RXYLQWHV SDUWLFLSDQWHV H R
ELWV N+] HPSUHJDGD QRV &'V $VVLP DPEDV PpWRGR GH DYDOLDomR VmR GHFLVLYRV 6LWXDo}HV GH WHVWH
FRGLILFDo}HV IRUDP FRPSDUDGDV XWLOL]DQGRVH GRLV FRP ERDV FRQGLo}HV EDVHDGDV QHVWHV TXHVLWRV VmR
SURJUDPDV R SULPHLUR FRQWHQGR XPD JUDYDomR GH YR] YLiYHLVGHVHULPSOHPHQWDGDVjEDL[RFXVWR
PDVFXOLQD H R VHJXQGR FRQWHQGR XP WUHFKR GH XPD
SHoD PXVLFDO H[HFXWDGD SRU XP FRQMXQWR GH
LQVWUXPHQWRV GH FRUGD $PERV RV SURJUDPDV WrP
REFERNCIAS
>@ '0*UHHQDQG-$6ZHWV6LJQDO'HWHFWLRQ
GXUDomRGHTXLQ]HVHJXQGRV'XDVWD[DVGHFRPSUHVVmR
7KHRU\DQG3V\FKRSK\VLFV :LOH\1HZ<RUN 
GLIHUHQWHV  H  NESV  SDUD D FRGLILFDomR 03
>@ 63/LSVKLW]DQG-9DQGHUNRR\ 7KH*UHDW
IRUDP WHVWDGDV R TXH UHVXOWRX QXP WRWDO GH TXDWUR
'HEDWH6XEMHFWLYH(YDOXDWLRQ-$XGLR(QJ6RFYRO
WHVWHV FRPSDUDWLYRV 3DUD FDGD WHVWH RV RXYLQWHV HUDP
SS -XO\$XJ 
H[SRVWRV DRV VLQDLV RULJLQDLV VHJXLGR GH WUrV DXGLo}HV

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 5
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

>@ $(6  $(6 5HFRPPHQGHG 3UDFWLFH 3HUIRUPDQFH - $XGLR (QJ 6RF YRO  SS 
IRU 3URIHVVLRQDO $XGLR  6XEMHFWLYH (YDOXDWLRQ RI -DQ)HE 
/RXGVSHDNHUV$XGLR(QJLQHHULQJ6RFLHW\ >@ 9+DQVHQ(VWDEOLVKLQJD3DQHORI/LVWHQHUV
>@ 6UHQ %HFK 6HOHFWLRQ DQG 7UDLQLQJ RI DW %DQJ DQG 2OXIVHQ D 5HSRUW LQ 6 %HFK DQG 2 -
6XEMHFWV IRU /LVWHQLQJ 7HVWV RI 6RXQG5HSURGXFLQJ 3HGHUVHQ (GV  6\PS 2Q 3HUFHSWLRQ RI 5HSURGXFHG
(TXLSPHQW - $XGLR (QJ 6RF YRO  SS  6RXQG *DPPHO $YHUQV 'HQPDUN  
-XO\$XJ  ,QJHQLUKMVNROHQcUKXV7HNQLNXPcUKXV'HQPDUN
>@ ,62  7KUHVKROG RI +HDULQJ $LU >@ 'DYLG &ODUN +LJK5HVROXWLRQ 6XEMHFWLYH
&RQGXFWLRQ DV D )XQFWLRQ RI 6H[ DQG $JH IRU 7HVWLQJ 8VLQJ D 'RXEOH%OLQG &RPSDUDWRU - $XGLR
2WRORJLFDOO\ 1RUPDO 3HUVRQV ,QWHUQDFWLRQDO (QJ6RFYROSS 0D\ 
2UJDQL]DWLRQ IRU6WDQGDUGL]DWLRQ*HQHYD6ZLW]HUODQG >@ 3DQ 'DYLV 0XOWLPHGLD ,(((  9ROXPH 
  ,VVXH6XPPHU3DJH V 
>@ ) 7RROH 6XEMHFWLYH 0HDVXUHPHQWV RI
/RXGVSHDNHUV 6RXQG 4XDOLW\ DQG /LVWHQHU
7DEHOD5HVXOWDGRGDV$YDOLDo}HV6XEMHWLYDV

7(67( 7(67( 7(67( 7(67(


9R]3&0[ 9R]3&0[ 0~VLFD3&0[ 0~VLFD3&0[
9R]03NESV 9R]03NESV 0~VLFD03NESV 0~VLFD03NESV

WD[DGHDFHUWR    

)LJXUD$QiOLVH))7 NSRQWRV GHXPVLQDOVHQRLGDOGHN+]FRGLILFDomR3&0ELWVN+]

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 6
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

)LJXUD$QiOLVH))7 NSRQWRV GHXPVLQDOVHQRLGDOGHN+]FRGLILFDomR03DNESV2EVHUYDUDUHGXomRQDUHODomR


VLQDOUXtGR 615 HRDXPHQWRQDWD[DGHGLVWRUomRKDUP{QLFDUXtGR 7+'1 

)LJXUD'HWDOKHGDDQiOLVH))7 NSRQWRV GHXPWUHFKRGRSURJUDPDPXVLFDOXWLOL]DGR LQVWUXPHQWRVGHFRUGD 2VLQDOFRP


ODUJXUDGHEDQGDPDLVOLPLWDGD HPYHUGH UHIHUHVHjFRPSUHVVmR03jWD[DGHNESVHQTXDQWRTXHRVLQDOHPD]XOUHIHUHVH
jFRPSUHVVmR03FRPWD[DGHNESV2VLQDOHPYHUPHOKRUHIHUHVHjFRGLILFDomR3&0

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 7
HERRERA METODOLOGIA PARA AVALIAO SUBJETIVA

ANEXO A

FORMULRIO PARA AVALIAO SUBJETIVA DE COMPONENTES DE UDIO


TESTE ABX

Localidade: CPDEE UFMG Belo Horizonte

Data: 20 de agosto de 2003

Horrio: 12:00h

Nome:

Idade:

TESTE 1 TESTE 2 TESTE 3 TESTE 4

A Voz PCM A Voz PCM A Msica PCM A Msica PCM

B Voz MP3 128 kbps B Voz MP3 92 kbps B Msica MP3 128 kbps B Msica MP3 92kbps

X1 - X1 - X1 - X1 -

X2 - X2 - X2 - X2 -

X3 - X3 - X3 - X3 -

Instrues:

1) Voc est participando de uma avaliao subjetiva comparativa entre duas fontes sonoras.
2) O objetivo NO avaliar qual das duas fontes soa melhor.
3) O objetivo identificar DIFERENAS audveis entre as duas fontes A e B.
4) Oua com ateno a execuo do programa A.
5) Oua com ateno a execuo do programa B.
6) Oua as trs execues seguintes X1, X2 e X3 e marque a qual voc julga se referir (A ou B).
7) Sero feitos ao todo quatro testes ABX.
8) A durao prevista de oito minutos para todos os quatro testes.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 8
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
Junho de 2004, So Paulo, SP

Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.

___________________________________
Sistema Adaptativo para Caracterizao de Alto-Falantes
Rafael C. Haical, Fbio P. Itturriet, Mrcio H. Costa, Delmar B. Carvalho
Universidade Catlica de Pelotas
Pelotas, 96010-000, Rio Grande do Sul, Brasil
m.costa@ieee.org , delmar@phoenix.ucpel.tche.br

RESUMO
Sistemas para a avaliao e controle de qualidade de equipamentos de reproduo de som so de grande interesse
para a indstria eletro-eletrnica, em especial na rea de produo de alto-falantes. Neste trabalho apresentado
um sistema adaptativo, baseado no algoritmo Normalized Least Mean Square, para a avaliao de alto-falantes,
que se caracteriza pela velocidade, confiabilidade e robustez interferncias externas.

1. INTRODUO resultados interessantes, este sistema requer o isolamento


Nos tempos atuais de livre mercado, o controle de acstico do conjunto alto-falante microfone de recepo de
qualidade um assunto de grande importncia para as forma a diminuir a influncia do rudo sonoro externo sobre
indstrias e em especial para as da rea eletro-eletrnica. A os parmetros obtidos. Em decorrncia disto, aumenta o
partir disto, vrios estudos vm sendo realizados para tempo necessrio para a caracterizao do produto.
desenvolver novas tcnicas para a avaliao de produtos Uma interessante alternativa para possibilitar a avaliao
visando rapidez e confiabilidade. rpida e confivel in loco, ou seja, na linha de produo, a
De uma forma geral nem todos os dispositivos eletrnicos utilizao de filtros adaptativos, em decorrncia de sua
podem ser testados ao longo de uma linha de produo, intrnseca robustez interferncias externas.
portanto o procedimento de avaliao por amostragem A famlia de algoritmos adaptativos baseada no mtodo do
utilizado como forma de caracterizao de cada lote gradiente estocstico uma interessante possibilidade para a
produzido. Um exemplo desta prtica encontrado na identificao de sistemas. Dentre seu inmeros membros, o
produo de alto-falantes, importante setor tecnolgico do algoritmo Normalized Least Mean Square (NLMS)
pas. O processo de controle de qualidade por amostragem amplamente utilizado em sistemas reais, possuindo como
em linhas de fabricao de alto-falantes decorre da caractersticas um baixo custo computacional, simplicidade
necessidade de retirada do produto da linha de montagem de implementao e robustez variaes da potncia do sinal
para sua avaliao, devido ao elevado nvel de rudo acstico de excitao [7].
encontrado no local. Como conseqncia, a avaliao em Este trabalho apresenta um sistema para a caracterizao
larga escala prejudicada. de sistemas de reproduo de som, em especial de alto-
Diversas tcnicas podem ser utilizadas para a identificao falantes, baseado em tcnicas de filtragem adaptativa. Como
e modelagem de sistemas, cada uma apresentando diferentes resultado so obtidas a resposta ao impulso do sistema sob
propriedades [1-5]. Em [6] foi apresentado um sistema anlise e sua resposta em freqncia. Em decorrncia da
automtico para teste de alto-falantes. Embora apresente elevada robustez interferncias no-correlacionadas com o

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, BRASIL, 7-9 DE JUNHO DE 2004 9
7-9 de Junho de 2004, So Paulo, SP, Brasil

sinal de excitao (produzido artificialmente) o presente 3. O SISTEMA DESENVOLVIDO


sistema especialmente indicado para utilizao na prpria O sistema desenvolvido baseado no processador digital
linha de produo, permitindo assim, a avaliao rpida e de sinais ADSP-21061 [8] que possui uma arquitetura de 32
confivel do maior nmero possvel de dispositivos. bits, ponto flutuante e ciclo de instruo de 20ns, operando
em 40MHz. Com uma memria cache de instruo interna,
2. ALGORITMO NLMS este processador pode executar vrias instrues em um
Os filtros adaptativos so ferramentas extremamente teis nico ciclo, acarretando uma elevada velocidade de
na rea de processamento de sinais, principalmente em processamento.
aplicaes de tempo real onde pouca ou quase nenhuma Para a implementao do sistema foi utilizada a placa
informao dos sinais envolvidos conhecida a priori. Suas comercial de aquisio de sinais Sharc Ez-Kit Lite [9], que
reas de aplicao abrangem desde o cancelamento de eco e alm do processador ADSP-21061 possui um Codec com um
processamento de sinais de radar ao controle de sistemas par estreo de converso analgico-digital e porta serial de 16
eletrnicos e/ou de potncia [7]. bits para comunicao com um computador pessoal. A
O algoritmo NLMS ou LMS Normalizado uma variao programao realizada em linguagem C.
do bem conhecido algoritmo LMS. Ele aplica em sua frmula A figura 2 apresenta um diagrama em blocos simplificado
uma normalizao do erro, provocando a utilizao de passos do sistema implementado. Atravs de uma rotina de nmeros
de convergncia variveis, de acordo com a potncia do sinal pseudo-aleatrios, o sistema de processamento (processador
de entrada x(n). ADSP-21061) gera um sinal de excitao eltrico de mdia
O diagrama em blocos do algoritmo NLMS apresentado nula, varincia constante e caracterstica Gaussiana no-
T
na figura 1, onde co = c0o c1o cNo 1 o sistema a ser correlacionada. Este sinal primeiramente amplificado por
um pr-amplificador baseado no circuito integrado TDA1013
identificado, c ( n ) = c0 ( n ) c1 ( n ) cN 1 ( n )
T
o vetor de (Philips Semiconductors) e logo aps por um mdulo de
coeficientes adaptativos, x(n) o sinal de excitao, d(n) o potncia comercial marca Cowatts. Finalmente, o sinal
sinal desejado, y(n) a sada do filtro adaptativo, z(n) o rudo entregue ao alto-falante que se deseja caracterizar. O sinal
externo e e(n) o sinal de erro definido por acstico produzido pelo alto-falante adquirido atravs de
um microfone de eletreto e amplificado de forma a
compatibilizar o sinal com o canal de aquisio da placa EZ-
e ( n) = d ( n) y ( n) + z ( n) (01) Kit Lite.

a sada do filtro determinada por y ( n ) = cT ( n ) x ( n ) , onde sinal de


Sistema de excitao
x ( n ) = x ( n ) x ( n 1) x ( n N + 1)
T
o vetor de Pr-amplif. 1
processamento
amostras do sinal de excitao. A equao de atualizao do
algoritmo NLMS dada por [7].

c ( n + 1) = c ( n ) + e ( n ) x ( n ) xT ( n ) x ( n ) + (02) Pr-amplif. 2
Amplificador
de potncia

onde uma constante pequena e positiva que evita overflow


ou divises por zero quando o produto xT ( n ) x ( n ) muito
pequeno ou nulo. O objetivo deste algoritmo minimizar a
potncia do sinal de erro de tal forma que aps um microfone alto-falante
determinado tempo de adaptao obtenha-se c ( n ) co , ou
seja, os coeficientes do filtro adaptativo so uma estimativa
Fig. 2. Diagrama em blocos do sistema de identificao.
do sistema sob anlise, supondo-se este linear e invariante no
tempo e que o nmero de coeficientes adaptativos seja
A figura 3 apresenta de forma detalhada o sistema
suficiente.
implementado, sob o ponto de vista de um problema de
z(n) identificao adaptativa. Verifica-se claramente que o sistema
x(n) d(n) estimado, ao final do processo de adaptao, na realidade o
co conjunto de subsistemas composto pelos amplificadores
necessrios ao condicionamento do sinal, alto-falante e
microfone de aquisio. Desta forma, o projeto do sistema
y(n) requer a correta escolha e dimensionamento dos
c(n) amplificadores, microfone e freqncia de amostragem, de
forma que sua influncia em termos de banda passante seja
desprezvel frente s caractersticas do alto-falante em
questo.
e(n)
NLMS Na figura 4 apresentado o prottipo implementado.
direita pode ser visualizado o computador responsvel pela
apresentao dos resultados e esquerda o sistema
Fig. 1. Diagrama em blocos do algoritmo NLMS.
desenvolvido. Neste, no canto superior direito podem ser

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 10
7-9 de Junho de 2004, So Paulo, SP, Brasil

visualizados o alto-falante que se deseja caracterizar e o 4. RESULTADOS EXPERIMENTAIS


microfone de aquisio. Ao centro e acima o mdulo de De forma a demonstrar a capacidade do sistema
potncia comercial e abaixo os pr-amplificadores e filtros implementado so apresentados alguns resultados
necessrios compatibilizao dos nveis de sinal entre a representativos do desempenho do sistema, realizados em
placa Ez-kit Lite e os transdutores envolvidos. direita e diferentes circunstncias.
acima encontra-se a fonte de alimentao e abaixo a placa Os parmetros utilizados foram: 150 coeficientes,
Ez-Kit Lite. freqncia de amostragem de 16 kHz, passo de convergncia
O algoritmo NLMS foi implementado em linguagem C no 0,15, sinal de excitao branco Gaussiano. O alto-falante
processador ADSP-21061 que transfere os resultados do utilizado foi do tipo woofer com potncia de 140 W.
processo de adaptao ao computador pessoal.
Ao final do procedimento de identificao, os coeficientes Coeficientes - mdia e realizaes individuais
1
do filtro adaptativo, que representam a resposta ao impulso
do alto-falante, so utilizados para a avaliar a sua resposta em 0.8
freqncia. No prottipo desenvolvido, foi utilizado o 0.6
programa MatLab para esse propsito.
0.4

0.2
Pr-amplif. Amplificador 0
1 de potncia
-0.2

-0.4

-0.6

Gerador Alto-falante Microfone


-0.8
de sinais
-1
0 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.01

Pr-amplif. Fig. 5. Resposta ao impulso do sistema analisado (150


2 + coeficientes). Em ciano as realizaes individuais e em preto
- a mdia de 50 realizaes do processo de identificao.

Filtro Coeficientes - (1) Mdia de 50 promediaes (2)-(5) uma nica realizao

adaptativo

NLMS
0

-1
Fig. 3. Diagrama em blocos detalhado do sistema. 5

3 150

100
2
50
1 0

Fig. 6. Resposta ao impulso do sistema analisado. (1) mdia


de 50 realizaes, (2-5): realizaes individuais.

Na figura 5 so apresentados os coeficientes do filtro


adaptativo aps 0,2 segundos de processamento, resultando
em 3200 iteraes do algoritmo NLMS. No eixo vertical
encontra-se a amplitude e no horizontal o tempo de
reverberao em segundos (150 coeficientes 1/16000 Hz =
0,0094 segundos). Em preto pode-se visualizar a mdia de 50
realizaes e em ciano cada uma das mesmas
individualmente. Pode-se, portanto, concluir que a
Fig. 4. Foto do sistema de identificao. variabilidade dos diferentes procedimentos de identificao
foi bastante pequena e portanto, uma nica realizao do
procedimento de adaptao suficientes para caracterizar a
resposta impulsiva do alto-falante nas condies ambientais

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 11
em altas freqncias demonstra a adequada escolha da
freqncia de amostragem para este tipo de alto-falante de
forma a evitar a ocorrncia de aliasing.

5. DISCUSSO E CONCLUSES
Nesse trabalho foram apresentadas as caractersticas
principais da implementao de um sistema adaptativo real
para aplicaes de identificao. Atravs da determinao da
resposta ao impulso do sistema analisado obtida a sua
resposta em freqncia.
O sistema caracteriza-se por um baixo custo e herda as
propriedades de velocidade, confiabilidade e robustez
x 10
8 Erro mdio quadrtico - mdia de 50 realizaes interferncias externas pertinentes ao algoritmo adaptativo
9
Normalized Least Mean Square. Embora possa ser utilizado
8 em uma ampla gama de aplicaes, encontra especial uso em
sistemas de reproduo de som, mais especificamente na
7
caracterizao de alto-falantes.
6 Em trabalhos futuros pretende-se quantificar os erros nas
estimativas obtidas em decorrncia do rudo acstico de
5
fundo e do hardware associado.
4
6. REFERNCIAS BIBLIOGRFICAS
3

2 [1] Ljung, L., System Identification Theory for the User,


segunda edio, Prentice-Hall, 1999.
1
[2] Aguirre, L.A., Introduo Identificao de Sistemas
0
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 Tcnicas Lineares e No-Lineares Aplicadas a Sistemas
segundos Reais, Editora UFMG, Belo Horizonte, 2000.
Fig. 7. Erro mdio quadrtico em funo do tempo de [3] Heinle, F., Rabenstein, R. e Stenger, A., A
adaptao. Measurement Method for the Linear and Nonlinear
Properties of Electro-Acoustic Transmission Systems,
30
Resposta em freqncia Signal Processing, volume 64, nmero 1, pginas 49-60,
1998.
20 [4] Clark, D., Precision Measurement of Loudspeaker
Parameters, J. Audio Eng. Soc., volume 45, nmero 3,
10 pginas 129-141, maro, 1997.

0
[5] Scott, J. e Kelly, J., New Method of Characterizing
Driver Linearity, J. Audio Eng. Soc., volume 44,
-10
nmero 4, pginas 258-265, abril, 1996.
[6] Pereira, L.F.A., Fernandes, D., Manzoni, A., Lima,
-20 J.C.M. e Reis, F.S., Sistema Automtico para Teste de
Auto-Falantes, XIII Congresso Chileno de Ingenieria
-30
Electrica, pginas 667-672, Santiago, Chile, novembro,
1999.
-40
2 3 4
10 10 10 [7] Haykin, S. Adaptive Filter Theory, quarta edio,
Hz
Prentice-Hall, 2002.
Fig. 8. Resposta em freqncia do sistema analisado.
[8] ADSP 2106x Sharc Users Manual, second edition,
A figura 7 apresenta o erro mdio quadrtico (avaliado Analog Devices, 1996.
como a mdia do sinal de erro e(n) ao quadrado) para as 50 [9] Ez-Kit Lite, ADSP 2106x Sharc, Reference Manual,
realizaes. Este sinal foi processado por um filtro mdia Analog Devices, 1997.
mvel de norma unitria e 20 coeficientes para facilitar a
visualizao. Como resultado pode-se notar a consistente
convergncia do processo de adaptao atravs da diminuio
da potncia do erro em funo do nmero de iteraes.
A partir da resposta ao impulso obtida pode-se, atravs da
utilizao da transformada rpida de Fourier, obter a resposta
em freqncia do alto-falante, apresentada na figura 8.
Verifica-se o comportamento passa-faixa caracterstico do
alto-falante do tipo woofer analisado. O elevado decaimento

12
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil

Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.

___________________________________
Anlise de viabilidade da aplicao de filme fino metlico em cones
e domos de alto-falantes
Hugo D Alessandro Jucoskya, Roberto Katsuhiro Yamamotoa,b, Walter Ullmannc
a
FATEC-SP, bLSI-USP, cdBW LTDA.
So Paulo, SP, Brasil
hugo_j@pop.com.br, katsu@fatecsp.br, walter_ullmann@hotmail.com

RESUMO
Realizou-se um experimento com um tweeter com domo de tecido com o objetivo de alterar sua aparncia sem
que suas propriedades sonoras fossem modificadas. Para isto, foi aplicado um filme fino de alumnio depositado por
mtodo de evaporao, para tornar o domo de tecido com aparncia de metal. Demonstrou-se a viabilidade de
melhorar a aparncia visual de alto-falantes por meio da deposio de filmes finos sem comprometimento da
qualidade de reproduo.

INTRODUO Existem diversos mtodos para tornar a quantidade de


material depositado desprezvel, ou seja, formao de filme
Muitas vezes no possvel aliar qualidade de reproduo fino. O mtodo utilizado conhecido como evaporao e
com esttica. Apesar da esttica ser, teoricamente, pouco aplicado em diversos mercados. Trata-se de uma tcnica
importante, muitas vezes decisiva na escolha de simples onde o substrato posicionado em um suporte dentro
equipamentos, principalmente no mercado de home-theater. de uma cmara de vcuo. O substrato fica a uma certa
Prova disto so os inmeros cones de alto-falantes distncia de um filamento de tungstnio, onde ficam
confeccionados em polipropileno, que fornecem a apoiados filetes de metal, normalmente o alumnio. Ao passar
possibilidade de serem transparentes ou at mesmo uma corrente atravs do filamento, provoca-se o aquecimento
multicoloridos. Porm, quando os cones so confeccionados do mesmo e, conseqentemente, o aquecimento do alumnio
com materiais como papel, cermica ou tecido (no caso de provocando sua evaporao. O vapor de alumnio tende a se
tweeters), no se torna vivel sua alterao de cor. Isto espalhar pela cmara de vcuo de forma esfrica atingindo o
porque seria necessrio adicionar, na superfcie do domo ou substrato que se deseja metalizar. O vapor de alumnio
cone, algum material que fornea um visual mais agradvel. depositado na superfcie do material, formando um filme fino
Ao realizar este procedimento, acaba-se comprometendo a com espessura varivel de acordo com os parmetros
assinatura snica do dispositivo. Isto ocorre devido a trs utilizados.
fatores principais:
adio de massa no conjunto mvel; PROCEDIMENTO EXPERIMENTAL
alterao da resistncia mecnica do cone ou domo;
diminuio ou fechamento dos poros do material; Foi realizado um experimento com um tweeter com domo
de tecido, para verificar a viabilidade da tcnica de deposio
Estes trs itens, considerados isoladamente ou em de filmes finos, pois o tweeter bastante sensvel qualquer
conjunto, acabam alterando a assinatura snica do material alterao em sua construo. Normalmente, sua fabricao
utilizado para a construo do alto-falante. Existe uma bem mais delicada e precisa, justamente devido sua
maneira de se realizar a alterao esttica sem envolver os sensibilidade fsica e tamanho reduzido. Tipicamente, sua
itens anteriores: utilizar material com massa desprezvel, freqncia de trabalho est entre 2 e 20kHz, ou seja, de todos
como um filme fino. os tipos de alto-falantes, o que possui maior abrangncia de

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 13
JUCOSKY ET AL. ANLISE DE VIAB. DA APLIC. DE FILME FINO METLICO EM CONES E DOMOS DE ALTO-FALANTES

trabalho. A utilizao deste tweeter se deve s suas Devido s limitaes de construo do alto-falante, haver
caractersticas de construo e funcionamento, ou seja, utiliza perdas de intensidade para determinadas freqncias.
uma bobina mvel e possui o domo totalmente exposto, Idealmente, a curva de intensidade (dB SPL) versus
caracterstica muito importante para a deposio de filmes freqncia (Hz) deve ser plana, ou seja, as respostas do
finos. falante devem ser de igual intensidade, independente da
O tweeter utilizado possui um domo de tecido impregnado freqncia aplicada, garantindo assim uma boa fidelidade de
com resina, dimetro de 25,4 mm, potncia mxima de 30W reproduo do sinal aplicado. Porm, muitas vezes no
e impedncia de 8. A Fig. 1 mostra a foto do tweeter possvel obter uma curva totalmente plana. Isto est
utilizado. relacionado qualidade dos materiais utilizados na
construo do alto falante, simetrias (de construo e campo
magntico fixo), posicionamento correto da bobina e
uniformidade do peso do conjunto bobina mvel e domo.
Para verificar a influncia do filme fino de alumnio
depositado na resposta do tweeter, foi realizada a medio
antes e depois do processo, obtendo-se as curvas mostradas
na Fig. 3.
Verifica-se que as curvas no so planas e restringem a
operao de trabalho do tweeter de 2 a 8kHz (regio mais
plana do grfico), embora esta regio possa ser estendida at
20kHz. Pode-se verificar tambm que a deposio de
alumnio no influenciou de forma significativa na resposta
do tweeter, porm houve uma ligeira queda em seu
desempenho, provavelmente devido a alguma deformao
provocada durante o processo de deposio.

Fig. 1 Foto do tweeter utilizado com domo de tecido. Anlise da curva de impedncia versus freqncia.
Em um alto-falante, a bobina vibra na mesma freqncia
Evaporao de alumnio. da corrente alternada que aplicada em seus terminais. Isso
O tweeter foi posicionado na evaporadora sobre um indica que haver diferentes valores de resistncia eltrica da
suporte a uma distncia aproximada de 8 cm do filamento de bobina de acordo com a variao da freqncia2. Logo, o
tungstnio, sobre o qual filetes de alumnio foram carregadas. termo resistncia no pode ser aplicado neste caso, sendo
No houve preocupao quanto espessura (estimada em substitudo pelo termo impedncia que considera o
500 nm) de alumnio a ser depositada sobre o domo, pois a impedimento da passagem da corrente eltrica alternada [1].
uniformidade seria prejudicada devido a sua esfericidade. A No alto-falante no existe apenas a impedncia eltrica da
nica preocupao foi de obter deposio sobre todo o domo bobina, mas tambm outras impedncias que variam com a
sem que houvesse danos provocados pelo calor. A presso freqncia:
obtida foi de aproximadamente 6x10-4 Pa. No foram Impedncia mecnica: envolve a dificuldade de
utilizadas mscaras durante o processo. Logo, todo o domo movimento do cone devido fora restauradora
foi recoberto com alumnio, inclusive as bordas plsticas, (complincia) da aranha e da suspenso (borda);
como pode ser visto na Fig. 2. Impedncia acstica: dificuldade de movimento devido
ao ar.
A impedncia total do alto-falante considera todos os itens
mencionados acima. Por meio da curva Impedncia versus
Freqncia mostrada na Fig. 4, pode-se verificar se a bobina
sofreu alterao aps a deposio de alumnio. Esta curva
indica que houve alteraes nas propriedades eltricas e
fsicas do tweeter, justificando a diferena entre as curvas da
Fig. 3.
Assim, atravs das curvas da Fig. 4, conclui-se que houve
perda de ganho do tweeter devido s alteraes mecnicas
que ocorreram no momento da evaporao.

Teste de aderncia.
Realizou-se um teste de aderncia do filme fino de
alumnio depositado sobre o domo, colocando-se o tweeter
Fig. 2 Foto do tweeter mostrando a aparncia prateada aps a metalizao. em funcionamento durante um certo perodo. Com a vibrao
do domo, o filme fino metlico tambm vibra, tendendo a
descolar de sua superfcie.
RESULTADOS E DISCUSSES
A curva de resposta em freqncia do tweeter foi realizada
da seguinte maneira: aplicou-se um sinal senoidal no alto-
falante com tenso eficaz de 2V (correspondente a 0,5W 2
Existem duas componentes da bobina que variam com a
RMS). Com um microfone1 a 3 cm do domo, captou-se o
freqncia: 1 componente resistiva que representa as perdas
som reproduzido pelo tweeter para cada freqncia aplicada.
originadas pelas correntes induzidas na ferragem; e 2
componente indutiva que representa a reatncia indutiva da
1
Marca: LinearX, modelo M31, Dimetro: 1/4 de polegada. bobina (parte imaginria de sua impedncia) [2].

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 14
JUCOSKY ET AL. ANLISE DE VIAB. DA APLIC. DE FILME FINO METLICO EM CONES E DOMOS DE ALTO-FALANTES

Fig. 3 Curvas de resposta em freqncia do tweeter antes e depois da deposio do filme fino de alumnio.

Fig. 4 - Curvas de impedncia versus freqncia do tweeter antes e depois da deposio do filme fino de alumnio.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 15
JUCOSKY ET AL. ANLISE DE VIAB. DA APLIC. DE FILME FINO METLICO EM CONES E DOMOS DE ALTO-FALANTES

Caso o filme fino descolasse durante o funcionamento do


tweeter, concluir-se-ia que a deposio de filmes finos sobre
tecido ou papel no fornece aderncia suficiente para
aplicaes em domos ou cones de alto-falantes.
Para realizar este teste, criou-se um rudo rosa com
freqncia limitada entre 2 e 20kHz (regio de trabalho do
tweeter) juntamente com um sinal senoidal tambm variando
de 2 a 20kHz. Desta maneira, evitou-se sons com baixas
freqncias, com grandes amplitudes, que provocariam a
queima do tweeter e dispensou o uso de divisor de
freqncia. O teste foi realizado durante 200 horas
ininterruptas e visualmente no se observou qualquer
alterao na superfcie do domo. Pode-se concluir que os
filmes finos depositados sobre domos de tweeters resistem s
vibraes mecnicas sem que descolem da superfcie.

CONCLUSO
Foi possvel verificar a viabilidade da deposio de filmes
finos de alumnio para aplicao em alto-falantes, com o
objetivo de proteo e melhoria esttica.
Aplicaes de filmes finos de qualquer espcie, desde que
apresentem massa desprezvel, sobre domos de tweeters no
influenciam de maneira significativa o som reproduzido.
O teste de aderncia mostrou que o filme fino de alumnio
depositado por evaporao possui aderncia necessria para
trabalhar mesmo em altas freqncias.
Trata-se de um excelente resultado principalmente para
mercados de alta fidelidade de reproduo sonora.
Um estudo mais detalhado, envolvendo-se variaes de
espessura, rugosidade e materiais utilizados, pode fornecer
dados mais precisos. Variando-se o tipo de material, pode-se
obter cores prateadas (ex.: alumnio) ou douradas (ex.: nitreto
de titnio).

AGRADECIMENTOS
Ao Prof. Dr. Luis da Silva Zambom da FATEC-SP / LSI-
USP pelo auxlio prestado no processo de evaporao.

CRDITOS DAS FOTOS


Carlos E. B. Nascimento

REFERNCIAS BIBLIOGRFICAS
[1] Selenium Alto-falantes; Para que serve o Alto-Falante?
O que som, intensidade, tom, timbre?,
www.selenium.com.br.
[2] V. Dickason; H. Sette, Caixas acsticas e alto-
falantes Quinta edio Ed. H. Sheldon Captulo 0
pgs.: 1-8.
[3] J. C. Fernandes: Acstica e Rudos; 2002; Unesp
Bauru.
[4] S. Wolf and R.N. Tauber, Silicon Fabrication for the
VLSI Era, Volume 1 - Silicon Processing, Lattice Press,
1986 p. 161-195.
[5] Antologia hi-fi estreo - Edies Monitor - 1. edio
1960 pgs.: 99-108.
[6] Nova Eletrnica - Editora Tcnica Eletrnica LTDA.
Edies: 2, 3, 4, 5, 6, 7, 10, 11 (maro de 1977 a janeiro
de 1978). Matria: "Curso de udio".
[7] G. C. Johnston; Measurement of the lowest resonance
frequency of loudspeaker cones; AES19-1992 (1998);
(ALMA TM-100).
[8] V. E. P. Lazzarini: Elementos de Acstica;
Universidade Estadual de Londrina; julho de 1998.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 16
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil

Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.

___________________________________
Impermeabilizao de cones de papel de alto-falantes com plasma de
CF4/H2

Hugo D Alessandro Jucoskya, Roberto Katsuhiro Yamamotoa,b


a
FATEC-SP, bLSI-USP
So Paulo, SP, Brasil
hugo_j@pop.com.br, katsu@fatecsp.br

RESUMO
Visando obter proteo hidrofbica e, conseqentemente, um aumento da vida til de cones de papel de alto-
falantes, realizou-se experimentos com polimerizao com plasma de CF4/H2. A maior vantagem do uso desta
tcnica a possibilidade de fornecer a proteo impermeabilizante sem que o peso final do cone seja alterado de
maneira significativa, no comprometendo o desempenho do alto-falante.

INTRODUO No processo de deposio por plasma, o filme fino


polimrico ser depositado em ambos os lados do cone. Por
A adsoro de produtos na superfcie do cone de um alto- ser um processo com rigoroso controle, possvel obter
falante um dos fatores que podem reduzir sua vida til, pois deposio mnima na superfcie do cone. Portanto, pode-se
o acmulo de umidade e poeira em sua superfcie pode considerar que o peso mdio final ser inferior ao processo
provocar a degradao do material. manual (deposio lquida por exemplo) ou industrial
O objetivo deste trabalho consiste em depositar filmes (deposio por jato de spray ou colagem de material) de
finos polimricos em cones de alto-falantes de papel, por impermeabilizao, melhorando sua performance ao mesmo
meio do plasma de CF4/H2, como um meio de obter proteo tempo em que garante uma proteo igual ou superior aos
hidrofbica, ou seja, impermeabilizao dos cones de papel, mtodos citados.
de maneira a aumentar a sua durabilidade ou a vida til. Estes H dois fatores que devem ser levados em considerao: a
primeiros testes apresentam apenas este objetivo, pois a aderncia do filme fino depositado na superfcie e a
tcnica de deposio por plasma em papel pouco conhecida uniformidade de deposio.
na literatura. Estes testes fornecero dados que podem A aderncia importante uma vez que, os alto-falantes
viabilizar, no futuro, estudos tmbricos (variao na resposta podem vibrar milhares de vezes por segundo, podendo soltar
de freqncia por exemplo). A tcnica permite a deposio o filme fino depositado.
de diversos materiais sobre a superfcie (de polmeros a Por se tratar de um substrato no plano, a uniformidade
metais), permitindo desta maneira, expandir ainda mais as deve ser tal que haja material depositado em toda a superfcie
pesquisas futuras. Os cones utilizados no experimento so de do cone para garantir a proteo total.
alto-falantes de bobina mvel (eletrodinmicos), que so os Uma das tcnicas de deposio de filmes finos o PECVD
mais utilizados atualmente. O objetivo obter uma (Plasma Enhanced Chemical Vapor Deposition) que uma
impermeabilizao total do cone (com boa aderncia do deposio qumica em fase vapor assistida por plasma. Sua
material) e com menor quantidade de material possvel maior vantagem manter o substrato em baixa temperatura
depositado. Isto importante para manter o peso [1]. Neste trabalho, o processo foi realizado em um
praticamente inalterado sem prejudicar o desempenho do equipamento de corroso do tipo RIE (Reactive Ion Etching).
alto-falante.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 17
JUCOSKY E YAMAMOTO IMPERMEABILIZAO DE CONES DE PAPEL DE ALTO-FALANTES COM PLASMA DE CF4/H2

Funcionamento da tcnica PECVD. presso de trabalho: relacionada com a quantidade de


O plasma gerado dentro de um ambiente de baixa presso molculas de gs existente na cmara;
(uma cmara de vcuo), atravs da aplicao de uma tenso fluxo de gases: relacionado com a quantidade de
de RF de 13,56 MHz de freqncia. Eltrons livres ganham molculas de gases reagentes injetada na cmara;
energia suficiente (devido ao campo eltrico) e colidem com potncia de RF: relacionada com a taxa de ionizao dos
as molculas do gs inserido, causando sua dissociao e gases e conseqentemente na formao de produtos;
ionizao, formando o plasma. Os radicais so adsorvidos na proporo dos gases de processo: no caso deste
superfcie da amostra, que est sujeita ao bombardeamento trabalho, a proporo entre o CF4 e o H2;
de ons, promovendo reorganizao e reaes com outras tempo de processo: relacionado com a quantidade de
espcies adsorvidas, estabelecendo novas ligaes qumicas, filme fino formado.
formando um filme fino. Os radicais formados no plasma so Deve-se, portanto, encontrar os melhores parmetros de
altamente reativos e os filmes obtidos, em geral, no so processo que forneam os melhores resultados. A medida do
estequiomtricos pois os mecanismos envolvidos na ngulo de contato qualificar esses parmetros e que est
deposio so bastante complexos [2]. relacionada com a tenso superficial do material em relao
Neste trabalho, foram utilizados trs gases: CF4, H2 e O2. soluo empregada (gua destilada) [5]. Quanto menor for o
O oxignio foi utilizado apenas para limpeza da cmara, aps ngulo de contato, menor ser a tenso superficial, portanto
cada processo, para remover o polmero depositado nas menor a aderncia da soluo ao substrato [6,7].
paredes da cmara, de modo a manter a reprodutibilidade do
processo. Os gases CF4 e H2 quando combinados em
ambiente de plasma, tendem a formar compostos polimricos
que formaro o filme fino sobre as amostras [3]. Deve-se
encontrar a concentrao correta dos gases (inclusive fluxo) gota dgua
que combinado com outros fatores (presso, potncia, tempo, a (ngulo de contato)
etc.) realizam a polimerizao da superfcie. O polmero
obtido com plasma de CF4/H2 do tipo teflon [2,4]. substrato (cone de alto-falante de papel)
Fig. 2 Mtodo de obteno do ngulo de contato.
PROCEDIMENTO EXPERIMENTAL
O cone de papel foi cortado em pequenos retngulos de
O plasma de CF4/H2 foi gerado em um reator de placas aproximadamente 2,5 x 3,5 cm2 para serem colocados em
paralelas com configurao RIE (Fig. 1), com gerador de RF porta-amostras de plstico (molduras plsticas utilizadas para
de 13,56 MHz. A distncia entre os eletrodos de 5,0 cm e o projeo de diapositivos de 35 mm), como mostra a Fig. 3.
catodo de cobre recoberto com alumnio possui dimetro de Para cada processo, uma amostra foi colocada
15,0 cm. Os gases de processo so inseridos pela parte horizontalmente no centro do catodo. Algumas amostras
superior da cmara atravs de um distribuidor do tipo foram colocadas perpendicularmente ao catodo, de modo a
chuveiro com dimetro de 15,0 cm. O sistema de vcuo verificar a deposio de polmero fora da regio da bainha do
constitudo por uma bomba mecnica e uma roots. A presso plasma.
de trabalho foi de 10 a 300 mTorr, com potncia de 50 e As amostras foram pesadas antes e depois do processo por
100W e fluxo total dos gases de 20 sccm. meio de uma microbalana, para verificar a variao da
massa do papel ocorrida no processo de polimerizao.
Cmara de Entrada Entrada
Processos de gases de gases

Janela

Eletrodo (porta-amostras)

Fig. 3 Porta amostra com pedao de papel de cone. As fotos da esquerda e


da direita correspondem s amostras antes e depois da polimerizao,
respectivamente. O amarelamento devido deposio de polmero na
Sistema Sistema superfcie.
de vcuo de vcuo
~
Gerador de RF RESULTADOS E DISCUSSES
Fig. 1 - Representao esquemtica do reator de plasma utilizado. Embora o cone de papel no apresentasse alterao visual
devido a sua colorao escura, verificou-se que ocorreu
Para avaliar a hidrofobizao do cone de papel foi utilizada impermeabilizao da superfcie em ambos os lados. Apesar
a tcnica de medio do ngulo de contato, que consiste em do fluxo de gases estar direcionado apenas sua face
medir o ngulo que uma gota dgua forma sobre uma superior, os reagentes se deslocaram por baixo da amostra e
superfcie, como mostra a Fig. 2. O processo de formaram o filme fino polimrico nas costas da amostra. Isto
impermeabilizao por plasma bastante complexo, indica que, se a tcnica for aplicada em um processo
existindo uma janela de processo que fornece uma taxa de industrial, ser necessrio apenas um processo para
deposio maior em tempo menor. Vrios parmetros podem impermeabilizar todo o cone.
ser controlados, entre eles temos:

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 18
JUCOSKY E YAMAMOTO IMPERMEABILIZAO DE CONES DE PAPEL DE ALTO-FALANTES COM PLASMA DE CF4/H2

Na amostra deixada perpendicularmente ao catodo, 200


tambm, ocorreu a polimerizao, comprovando que, 180
independentemente do ngulo, ocorre a deposio de 160

ngulo de contato (graus)


polmero. Esse resultado garante que um cone inteiro pode 140

ser impermeabilizado de uma s vez. 120

100
80
Variao de massa.
60

Foram processadas duas amostras de cones, com diferentes 40

tamanhos e sem a utilizao de molduras plsticas, com o 20


0
objetivo de verificar a variao de massa das amostras no 50 100 150 200 250 300 350 400 450 500
processo de polimerizao, que estaria relacionada ao Presso (mTorr)
desempenho do alto-falante. Os resultados obtidos so
mostrados na Tabela 1. Fig. 5 ngulo de contato em funo da presso no processo de
polimerizao (35% H2, 20sccm, 50W, 10min).
Tabela 1 Massas das amostras antes e aps o processo.

aps 5 min O menor ngulo de contato (melhor resultado) ocorre para


Amostra antes do em vcuo aps a presso de 100mTorr. Apesar da presso de 300mTorr
processo (50mTorr) polimerizao oferecer um valor de ngulo de contato menor, ela no
oferece impermeabilizao das costas das amostras, sendo
1 0,3373g 0,3259g 0,3190g portanto, desconsiderada. Para presso de 400mTorr, a
2 0,3445g 0,3310g 0,3282g amostra processada absorveu gua tanto na face superior,
quanto inferior.
Observa-se que as amostras perdem massa aps ficarem Pr-tratamento com plasma de oxignio.
em ambiente de baixa presso devido perda de umidade do
papel (3% apenas) e que, aps a polimerizao h ligeira Algumas amostras passaram por um pr-tratamento com
perda de massa (2%), ao contrrio do que se esperava. plasma de oxignio (10 sccm, 50W e 100mTorr) para depois
Esta perda de massa ocorre devido a reduo da seguirem para o processo de polimerizao (35% H2, 20
quantidade de gua no material, causada pelo aumento da sccm, 50W e 100mTorr). Isto forneceu os melhores
presso de vapor em um ambiente de baixa presso. Ou seja, resultados quando se realizou a medio do ngulo de
quanto menor for a presso de um ambiente, maior a contato (31,3). Porm, verificou-se que o papel absorvia a
proporo de gua evaporada. gua aps algum tempo, apesar de seu ngulo de contato ser
um dos melhores obtidos. Ao se realizar uma anlise
Efeito da proporo de CF4 e H2. microscpica nas amostras, verificou-se que o plasma de
oxignio corroa todo o material entre as fibras do papel,
Para obter a proporo de CF4 e H2 que resultasse na variando de acordo com o tempo de processo: quanto maior o
melhor impermeabilizao do papel, realizou-se processos tempo de processo, maior a corroso. Isto bem
com variao desta relao. Fixou-se a potncia em 50W, o caracterizado na literatura, onde o plasma de oxignio
fluxo total em 20sccm, a presso em 100mTorr [8] e a utilizado para corroso de materiais orgnicos, pois reage
concentrao de H2 em CF4 foi variada entre 25% e 45%, com as molculas de carbono do material formando CO2 que
com tempo de processo de 10 min. Os resultados obtidos removido da cmara pelo equipamento de vcuo.
esto mostrados na Fig. 4. Observa-se que o melhor processo
ocorre para 35% de H2 e 65% de CF4, pois o ngulo de CONCLUSO
contato de 57,5 o menor de todos.
Os resultados demonstram que possvel realizar a
impermeabilizao dos cones de alto-falantes de papel com
85
plasma de CF4/H2. Isto abre portas para novos estudos,
ngulo de contato (graus)

80
relacionando, futuramente, diferentes materiais, texturas e
75 espessuras para estudos sonoros (variao na resposta de
70 freqncia do cone antes e depois do tratamento, por
65 exemplo). A polimerizao ocorre em todos os pontos do
60 papel, apresentando a possibilidade de se realizar o processo
em vrios cones ao mesmo tempo com alterao no
55
significativa da massa do cone. Isto importante pois
50
minimiza os agentes externos no momento da qualificao
25 30 35 40 45
sonora, pois praticamente no haver alteraes no peso ou
H2 (% Vol)
inrcia do cone. Alm disso, apresenta sua importncia para
Fig. 4 ngulo de contato em funo da porcentagem em volume de H2 em uma possvel realizao deste processo em um ambiente
CF4 no processo de polimerizao (100mTorr, 20sccm, 50W, 10 min.). industrial. Para pesquisas futuras, envolvendo qualificao
sonora, recomenda-se utilizar domos de tweeters, pois so
mais sensveis variaes em sua construo fsica. Assim,
Efeito da presso. garante-se maior confiabilidade nos estudos envolvendo
Fixando a proporo de 35% de H2 e 65% de CF4, a filmes finos com udio.
potncia em 50W, o fluxo total em 20sccm e o tempo de O melhor processo foi obtido nas condies de 35% de H2,
processo em 10 min., foram realizados experimentos 65% de CF4, 100W de potncia, 100mTorr de presso e
variando-se a presso. A Fig. 5 mostra os resultados obtidos. 20sccm de fluxo total.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 19
JUCOSKY E YAMAMOTO IMPERMEABILIZAO DE CONES DE PAPEL DE ALTO-FALANTES COM PLASMA DE CF4/H2

REFERNCIAS BIBLIOGRFICAS
[1] S. Wolf and R.N. Tauber, Silicon Fabrication for the
VLSI Era, Volume 1 - Silicon Processing, Lattice Press,
1986 p. 161-195.
[2] A. Bogaerts, E. Neyts , R. Gijbels , J. Mullen; "Gas
discharge plasmas and their applications";
Spectrochimica Acta Part B 57 (2002) 609658.
[3] E. J. Winder, K. K. Gleason; Growth and
characterization of fluorocarbon thin films grown from
trifluoromethane (CHF3) using pulsed-plasma enhanced
CVD; Insulating Biomaterials NO1-NS-62350,
Quarterly Progress Report 11; April-June 1999.
[4] E. Horanyi, Engineering Physics, University of Colorado,
Boulder; P. Griffin, A. Agah, Electrical Engineering,
Stanford University; Teflon coatings for Biochips.
[5] P. M. Nogueira; Estudo da viabilidade da utilizao de
filmes de carbono tipo diamante como camada de
revestimento interno em dutos de transporte de petrleo;
Bol. tc. PETROBRS, Rio de Janeiro, 45 (2): abr./jun.,
2002.
[6] A. Sklodowska, M. Wozniak, R. Matakowska; The
method of contact angle measurements and estimation of
work of adhesion in bioleaching of metals Biol. Proc.
Online 1(3), 114-121; Vol. 1 No. 3 April 29, 1999
www.biologicalprocedures.com.
[7] J. H. Choi, E. S. Lee , H. K. Baik, S. Lee, K. M. Song, M.
K. Hwang , C. S. Huh; Surface modification of natural
leather using low-pressure parallel plate plasma; Surface
and Coatings Technology 171 (2003) 257263.
[8] R. K. Yamamoto, F. R. de Almeida, H. S. Maciel;
Caracterizao de filmes de polmero formado sobre o
silcio exposto ao plasma de CF4/H2; Anais do 9
CBECIMAT Laboratrio de Sistemas Integrveis,
Escola Politcnica da Universidade de So Paulo.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 20
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7 - 9 de Junho de 2004, So Paulo, SP

Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil.

___________________________________
Estado da Arte da Classificao de Sinais de udio

Jayme Garcia Arnal Barbedo, Amauri Lopes


Departamento de Comunicaes - FEEC - UNICAMP
C.P. 6101, CEP: 13.083-970, Campinas - SP - Brasil, Tel: (19) 3788-3703;
jgab, amauri@decom.fee.unicamp.br

RESUMO
Este artigo apresenta uma compilao dos principais trabalhos desenvolvidos na rea de classificao de sinais
de udio. So apresentadas algumas das tcnicas mais conhecidas, bem como suas vantagens e pontos fracos.
So sugeridas alternativas com potencial para superar alguns dos problemas enfrentados, visando fornecer
subsdios para futuros projetos de pesquisa.

1. INTRODUO Os primeiros trabalhos relevantes na rea foram publicados


Com o avano da tecnologia da informao, a quantidade em 1996 [1, 2], e desde ento vem crescendo o nmero de
de dados gerada, armazenada e distribuda vem crescendo pesquisadores envolvidos com o tema. Apesar disso,
rapidamente. Essa nova realidade provoca uma demanda resultados satisfatrios s tm sido alcanados para
imediata por ferramentas capazes de tornar a manipulao aplicaes muito especficas e restritas. As pesquisas que
desses dados mais simples e rpida. Nesse contexto, um novo tentaram produzir classificadores mais gerais e robustos,
campo de pesquisa, a Classificao de Sinais de udio capazes de enfrentar uma maior gama de situaes, se
(CSA), foi inaugurado. A CSA consiste na extrao de depararam com dificuldades maiores que aquelas
parmetros capazes de fornecer o mximo de informao a inicialmente previstas. Nesses casos, a taxa de acerto
respeito de um sinal sonoro, e no uso de tais parmetros para raramente atinge 60% [3].
classificar o sinal de acordo com algum critrio pr- A seguir ser apresentada uma breve descrio das
estabelecido. Este um campo de pesquisa amplo, composto principais tcnicas e estratgias utilizadas na classificao de
por diversas sub-reas, a maior parte das quais ainda pouco udio, bem como a bibliografia bsica concernente a cada
exploradas. Portanto, ainda so muitas as lacunas a serem uma delas. O artigo est dividido da seguinte maneira: a
preenchidas, o que representa uma tima oportunidade para o Seo 2 apresenta as taxonomias (mtodos de classificao)
desenvolvimento de novas tecnologias relevantes no apenas mais comumente adotadas; a Seo 3 apresenta alguns dos
na esfera acadmica, mas tambm na esfera comercial. parmetros utilizados na extrao de informao dos sinais
Inmeras aplicaes podem se beneficiar diretamente de que se deseja classificar; a Seo 4 apresenta alguns dos mais
avanos alcanados em CSA, dentre as quais pode-se citar a mtodos de classificao mais utilizados, cuja funo
criao de aparelhos auditivos seletivos, transcrio combinar os parmetros extrados de modo a resultar numa
automtica de msica ou texto, remoo de rudo, sistemas classificao confivel; a Seo 5 apresenta os resultados
especialistas de diagnstico remoto, reconhecimento de voz e alcanados at agora pelas principais pesquisas na rea e as
locutor, identificao de contedo de mdia, equalizao perspectivas para pesquisas futuras; a Seo 6 faz uma
automtica de sinais musicais de acordo com o contedo, anlise crtica das estratgias propostas na literatura e sugere
busca rpida em bancos de dados, entre outras. Muitas dessas alternativas para que alguns dos problemas sejam superados;
aplicaes tm demanda imediata. por fim, a Seo 7 apresenta as concluses.

21
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO

2. TAXONOMIA rudo. Este procedimento til sobretudo em sistemas para


A taxonomia a maneira como se deseja classificar identificao de locutor e/ou segmentao de sinais de voz de
determinado conjunto de elementos. Ela pode ser composta acordo com diferentes locutores. Este tipo de classificao
de diversos nveis hierrquicos, onde os nveis mais baixos normalmente est inserido num contexto mais amplo, como
representam classificaes mais especficas e restritas. No pode ser visto em [3, 12]. Este tpico tambm abordado em
caso dos seres vivos, por exemplo, a classificao hierrquica trabalhos que no se inserem no sistema hierrquico
comea, no seu nvel mais elevado, com os reinos, descendo convencional, como ser visto mais adiante.
para filo, classe, ordem, famlia, espcie e sub-espcie. Na No caso de sinais de msica, a taxonomia varia
maior parte das vezes, muito mais fcil distinguir entre um consideravelmente, havendo desde divises muito simples
animal e uma planta, os quais pertencem a diferentes reinos, [13], onde h uma classificao em apenas trs categorias, at
do que distinguir, por exemplo, entre duas sub-espcies de taxonomias complexas, envolvendo grande nmero de classes
morcegos. e nveis hierrquicos [3, 14]. claro que quanto mais
O mesmo fenmeno ocorre para sinais de udio. Em geral, complexo o sistema de classificao, maior o desafio, de
o primeiro nvel hierrquico considerado neste tipo de modo que a taxa de acertos tende a diminuir. Contudo,
classificao faz a distino entre voz, msica e rudo. Cada apenas esses sistemas complexos tm aplicabilidade no
uma dessas classes possui peculiaridades que, se devidamente mundo real. As taxonomias mais simples servem apenas ao
exploradas, permitem que elas sejam eficientemente propsito de acumular conhecimento para o desenvolvimento
diferenciadas. Apesar disso, mesmo neste nvel hierrquico de sistemas mais gerais e robustos. A maior parte das
existem situaes que representam verdadeiros desafios para pesquisas atuais apresenta classificaes com grau
os classificadores desenvolvidos. Um exemplo disso so intermedirio de sofisticao [15, 16].
msicas que muitas vezes contm mais caractersticas de fala A Figura 1 mostra uma possvel estrutura taxonmica, neste
que de msica, como o caso do estilo musical conhecido caso usando quatro nveis hierrquicos e dezesseis possveis
como rap. No sentido oposto, tem-se o caso de sinais de voz classificaes finais para os sinais [14].
que contm caractersticas normalmente associadas msica, Um grande nmero de pesquisas tem se voltado para a
como o recital de uma poesia ou uma leitura dramtica. Esses classificao de sinais monofnicos, os quais so constitudos
problemas vm sendo especificamente abordados por alguns por apenas uma fonte acstica, seja ela um instrumento
grupos de pesquisa [4, 5]. musical individual, a voz de uma pessoa, o som de algum
Na maior parte dos trabalhos, esta primeira diviso animal, uma sirene, uma exploso, ou quaisquer outros
apenas o ponto de partida para outros nveis de classificao efeitos sonoros. Este tipo de classificao tem aplicao
com os mais diversos propsitos. Contudo, esta etapa tem, direta na identificao do tipo de contedo de transmisses de
por si s, algumas aplicaes importantes. Como exemplos, rdio e televiso. Algumas pesquisas abordam apenas
pode-se citar o monitoramento do contedo de rdios FM, instrumentos musicais [17, 18], enquanto outras abordam
codificao seletiva de voz e msica e desativao de uma grande variedade de efeitos [1, 19-27]. Alm da
reconhecedores de voz em trechos no constitudos por voz aplicao acima citada, este tipo de pesquisa uma boa fonte
[6]. Outros trabalhos que concentraram o foco neste nvel de de idias para o desenvolvimento de classificadores mais
classificao incluem estudos para classificao diretamente avanados.
no domnio codificado [7], bem como estudos visando Outra rea que vem se beneficiando das pesquisas em CSA
fornecer requisitos para futuras pesquisas [8-11] (as o desenvolvimento de aparelhos auditivos mais avanados,
referncias [10] e [11] tiveram grande influncia sobre nos quais eventos auditivos do dia-a-dia so identificados e
trabalhos posteriores). classificados. Essa informao usada pelo aparelho para
Na segunda camada hierrquica de classificao, os sinais decidir quais faixas de freqncia devem ser amplificadas ou
j rotulados como voz ou udio so divididos em sub- atenuadas [28, 29].
categorias. No primeiro caso, a diviso se limita a identificar A seo a seguir apresenta alguns dos parmetros extrados
vozes masculinas e femininas e, algumas vezes, voz com dos sinais de udio.
udio

Voz Msica Rudo

Voz Voz Voz com Rudo Clssica No-Clssica


Masculina Feminina

Msica de Cmara Msica Orquestrada Rock Pop/Eletrnica Jazz/Blues

Msica de Msica Quarteto Outros Msica Orquestra Orquestra Rock Rock Tecno/ Rap/ Pop
Cmara com Solo de Cordas Sinfnica com Coro com Pesado Leve Dance Hip-Hop
Piano Solista

Figura 1 Exemplo de estrutura taxonmica

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 22
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO

3. EXTRAO DE PARMETROS todo o espectro. A largura de faixa usada em [1, 12, 15, 17,
A primeira etapa em qualquer tcnica de classificao de 30].
sinais a extrao de parmetros capazes de fornecer o
mximo de informao a respeito dos sinais que se deseja 3.6. Fluxo Espectral
classificar. As pesquisas na rea tm gerado uma grande O fluxo espectral definido como a diferena quadrtica
quantidade de parmetros descritores dos sinais, dentre os entre os espectros de potncia de quadros consecutivos do
quais selecionou-se os mais utilizados para uma descrio sinal, de modo a caracterizar as mudanas no formato do
resumida, como ser visto a seguir. No sero fornecidos espectro. Em geral, sinais de voz apresentam mudanas mais
detalhes matemticos devido s limitaes de espao. Todos drsticas que sinais de msica, devido alternncia entre
os parmetros descritos a seguir so instantneos, o que fonemas surdos e sonoros. Assim, o fluxo espectral
significa que so extrados aps a diviso dos sinais em normalmente assume valores mais elevados para voz. Este
quadros, a fim de se observar o comportamento dessas parmetro foi adotado em [3, 9, 10, 14].
grandezas ao longo do tempo. O tamanho dos quadros varia
de acordo com a pesquisa, mas raramente ultrapassa 100 ms. 3.7. Proporo de Quadros com Baixa Energia
Este parmetro mede a proporo de quadros cuja potncia
3.1. Centride Espectral RMS menor que metade da potncia RMS mdia ao longo
O centride espectral vem sendo usado com sucesso em um de um quadro de 1 segundo. Normalmente, sinais de voz
grande nmero de trabalhos [1, 3, 12, 14, 15, 17, 30]. Ele possuem uma maior proporo de quadros de baixa energia
representa o centro de gravidade da distribuio espectral de que sinais de msica, situao em que esta varivel assume
potncia dos sinais. Altos valores para o centride indicam valores mais elevados. Este parmetro foi adotado em [3, 9,
texturas mais brilhantes, com uma maior amplitude dos 10].
componentes de alta freqncia. Sinais de msica, por serem
espectralmente ricos, normalmente tm um valor de centride 3.8. Sonoridade
mais elevado que voz. Este parmetro busca modelar a percepo humana em
relao sonoridade do sinal a ser classificado. Normalmente
3.2. Taxa de Cruzamentos por Zero as formulaes utilizadas nos mtodos de classificao de
Este parmetro foi adotado em [2, 3, 6, 9, 10, 11, 14, 15, udio so muito simples, consistindo basicamente no clculo
24]. Um cruzamento por zero ocorre quando as amplitudes de do nvel RMS de cada quadro do sinal. Obviamente, estas
amostras temporais sucessivas tm sinais opostos. Em formulaes no so suficientes para modelar de maneira
essncia, a taxa de cruzamentos por zero fornece uma precisa a percepo humana, mas fornecem estimativas
estimativa das propriedades espectrais dos sinais de udio. Na suficientemente confiveis para o propsito de classificao.
diferenciao entre sinais de voz e msica, comum a Esta uma grandeza muito til na identificao do gnero
utilizao da varincia desta grandeza como parmetro. musical, e usada em [1, 14, 15].

3.3. Coeficientes Cepstrais 3.9. Harmonicidade


, juntamente com o centride e o nmero de cruzamentos Normalmente, a msica possui um grau de harmonicidade
por zero, o tipo de parmetro mais usado [3, 10, 11, 14-16, maior que os demais sinais. Esta grandeza tambm til para
22, 23, 30]. As medidas cepstrais fornecem informao a diferenciar gneros musicais. Este parmetro foi adotado em
respeito do formato do espectro. O termo cepstro usado [1, 12, 14, 17].
para designar a transformada de Fourier inversa do logaritmo
do espectro de potncia de um sinal. Em muitos casos, os 3.10. Ponto de Roll-Off
prprios coeficientes cepstrais so usados como parmetros, Este valor mede a freqncia abaixo da qual se encontra
mas comum a criao de variveis derivadas, como o 95% da potncia total do sinal. Sinais de msica, devido a
cepstro residual, o qual obtido comparando-se a verso sons percursivos, transientes de ataque, etc., tm mais energia
concentrada nas altas freqncias que sinais de voz. Portanto,
original do cepstro do sinal analisado com uma verso
este parmetro apresenta valores mais elevados em sinais de
suavizada.
msica. O ponto de rolloff foi usado em [3, 10, 14, 15].
3.4. Pitch
3.5. Outros
A ANSI (American National Standards Institute)
Pesquisas indicam que muitas vezes as estatsticas de
estabelece que pitch o atributo auditivo de acordo com o segunda ordem so mais eficientes em caracterizar as
qual os sons podem ser ordenados, em uma escala de diferenas entre voz e msica que os prprios parmetros que
freqncia, de baixo a alto. Este parmetro perceptual est as originam [3, 15]. Assim, alm dos parmetros descritos,
intimamente ligado ao conceito de freqncia fundamental, suas varincias muitas vezes fornecem informao valiosa
que uma grandeza fsica absoluta. Apenas sinais peridicos, para uma classificao mais precisa dos sinais.
como msica e voz, produzem a sensao de pitch. Esta A lista de parmetros usados para extrair informao dos
grandeza usada sobretudo para identificar sinais de voz, os sinais inclui ainda a taxa de silncio [12], mtrica de ritmo [3,
quais possuem um valor de pitch caracterstico. Esta 7], energia de modulao a 4 Hz [8, 10], entropia da
abordagem usada em [1, 11, 12, 15, 30]. modulao [8], energia das sub-bandas [15, 30], etc. Apesar
de usados em menor escala, estes parmetros possuem
3.5. Largura de Faixa caractersticas que podem ser teis em muitas aplicaes.
Este parmetro representa a largura da faixa de freqncia
em Hz que o sinal ocupa. Sinais de voz, em geral, possuem o 4. MTODOS DE CLASSIFICAO
espectro concentrado nas freqncias de 100 Hz a 7 kHz, Os mtodos de classificao tm como funo bsica
enquanto a maior parte dos sinais de msica est combinar a informao contida nos parmetros extrados de
compreendida entre 15 Hz e 16 kHz [12]. Sinais de rudo modo a produzir uma classificao confivel para o sinal
geralmente possuem componentes espalhados ao longo de analisado. Como no caso dos parmetros, as pesquisas tm

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 23
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO

gerado um grande nmero de diferentes tcnicas de Este no um classificador simples de ser implementado,
classificao. A seguir so apresentadas as tcnicas mais mas possui diversas caractersticas desejveis, como a
usadas. Novamente, os detalhes matemticos sero omitidos capacidade de controlar a complexidade da aprendizagem,
devido s limitaes de espao. independente da dimenso do problema. Esse mtodo foi
analisado em [13, 17, 22].
4.1. K Vizinhos mais Prximos
O primeiro passo na implementao deste tipo de 4.5. Discriminador Binrio Simples
classificador a construo de um dicionrio de vetores Este tipo de classificao realizado atravs da diviso
contendo valores paramtricos que representem as categorias sucessiva dos sinais em dois grupos. A deciso entre um ou
nas quais se deseja classificar os sinais. Assim, cada classe outro grupo tomada de acordo com os parmetros
ser representada por um determinado nmero de vetores, os considerados em cada diviso. Por exemplo, os sinais de
quais contm valores de parmetros tipicamente encontrados udio podem, numa primeira diviso, ser classificados em
para a classe em questo. Quanto ao processo de voz e silncio, tendo como base os valores das varincias do
classificao, o vetor de parmetros extrado do sinal centride espectral e do nmero de cruzamentos por zero.
comparado com os vetores presentes no dicionrio. Nessa Numa segunda diviso, os sinais de voz podem ser
comparao, utiliza-se uma medida de distncia (geralmente classificados em masculinos ou femininos, de acordo com os
euclidiana) para determinar os k vetores do dicionrio mais valores de pitch, e os de msica em populares ou clssicos, de
prximos do vetor de parmetros do sinal a ser classificado. acordo com a harmonicidade. As msicas populares, por sua
Por fim, o sinal classificado de acordo com a classe que vez, podem ser classificadas em agitadas ou calmas, e assim
mais vezes est representada entre os k vetores determinados sucessivamente. Este tipo de classificador muito simples,
na etapa anterior. Este um classificador muito usado [6, 9, ideal para ser implementado em tempo real. Contudo, ele no
10, 13, 17, 18], principalmente devido facilidade de apropriado para a realizao de classificaes muito
implementao. Por outro lado, ele possui a desvantagem de sofisticadas. Seu desempenho foi testado em [7, 8, 24].
exigir que se armazene um grande nmero de vetores de
treinamento, resultando em um grande nmero de 4.6. Outros
computaes. Tal fato torna seu uso desaconselhvel em Existem muitos outros sistemas de classificao alm dos
aplicaes que precisem operar em tempo real. acima descritos. Dentre eles, pode-se citar o classificador
Gaussiano Quadrtico [6, 15], classificao nebulosa [4, 5],
4.2. Modelos de Mistura Gaussiana distncia euclidiana simples [1], etc. A escolha do
Os modelos de mistura Gaussiana (MMG) tm sido usados classificador a ser utilizado depende da aplicao pretendida,
com sucesso em muitos problemas de classificao de udio bem como das preferncias pessoais do projetista.
[3,10,11,16,18]. A tcnica usada para modelar as diferentes
classes e gneros de udio como uma funo densidade de 5. ESTGIO DE DESENVOLVIMENTO DA CSA
probabilidade (FDP), usando uma combinao ponderada de Ao se fazer uma anlise da qualidade dos resultados
FDPs Gaussianas (misturas). Os parmetros dos MMG so alcanados na rea de CSA, deve-se tomar o cuidado de
ajustados de acordo com um conjunto de treinamento. Esse dividir os trabalhos de acordo com o grau de dificuldade da
um processo iterativo, e a tcnica utilizada para esse fim
problemtica abordada. Obviamente, pesquisas abordando
conhecida como mtodo de Maximizao de Expectativa
simplesmente a distino entre sinais de voz e msica tm
[31]. Aps o treinamento, os MMGs resultantes so usados
muito mais facilidade de alcanar resultados satisfatrios que
para determinar as probabilidades de um vetor de parmetros
pertencer a cada uma das classes. O maior valor de aquelas que se propem a fazer classificaes mais
probabilidade identifica a classe qual pertence o sinal. complexas. Alm disso, algumas pesquisas trabalham com a
limitao de desenvolver estratgias que possam ser
4.3. Modelos Ocultos de Markov implementadas em tempo real, o que reduz
Os modelos ocultos de Markov so muito usados na significativamente a flexibilidade do projeto. Assim, a
segmentao de sinais de udio em diferentes eventos complexidade dos desafios enfrentados em cada pesquisa
acsticos. Esses modelos so autmatos probabilsticos de varia significativamente, tornando praticamente impossvel
estado finito com uma sada, e consistem de trs uma comparao direta entre elas. O que se pretende nesta
componentes bsicos: um estado inicial de distribuio, uma seo fornecer uma viso geral do estgio de
matriz de transio de estado e uma funo densidade de desenvolvimento das pesquisas na rea, revelando assim
observao. A sada do modelo constituda por uma quais desafios j foram vencidos e quais ainda esto por ser
seqncia de estados e um valor de verossimilhana que resolvidos.
mede a probabilidade que cada observao (vetor de Como comentado anteriormente, os resultados alcanados
parmetros) tem de pertencer a cada modelo. Como no caso na distino entre voz e msica tm sido bastante
do MMG, o modelo que resulta na maior probabilidade satisfatrios. A taxa de acertos mdia neste tipo de aplicao
revela a classe qual pertence o sinal. Esta abordagem freqentemente alcana valores superiores a 95% [3, 7].
adotada em [19, 21, 25]. Excees ocorrem para casos em que h uma preocupao
maior com a execuo em tempo real, onde a taxa de acertos
4.4. Mquinas de Vetores Suporte (Support Vector pode cair para valores prximos a 80% [12]. O grande
Machines) desafio neste nvel de classificao identificar corretamente
Este tipo de classificador foi desenvolvido recentemente sinais cuja estrutura mescla caractersticas tanto de voz como
como uma abordagem alternativa para o problema da de msica, como o caso de gneros musicais como o rap e a
aprendizagem. Seu objetivo encontrar o hiperplano que declamao de textos poticos. Alguns trabalhos propem
melhor separa observaes pertencentes a diferentes classes que se criem classificaes intermedirias entre msica e voz.
num espao multidimensional. A teoria no garante que o Esse o caso de [4, 5], onde o autor usa tcnicas de lgica
melhor hiperplano possa ser sempre encontrado mas, na nebulosa (fuzzy) para realizar uma classificao relativa, do
prtica, uma soluo heurstica pode sempre ser alcanada. tipo 30% voz e 70% msica. Contudo, este tipo de

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 24
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO

estratgia ainda necessita de muitos ajustes at que atinja a 6.2. Parmetros


maturidade. Um dos principais problemas encontrados nas estratgias
Dentre as classificaes realizadas no segundo nvel desenvolvidas at agora o fato delas se basearem na
hierrquico, a mais simples a diviso em voz masculina e extrao de parmetros de baixo nvel. Tal fato ocorre tanto
feminina. O ndice de acertos para este tipo de classificao por questes de facilidade de implementao, quanto pelo
tambm bastante elevado, muitas vezes alcanando valores compromisso que algumas pesquisas tm de desenvolver
prximos a 98% [3]. As estratgias utilizadas para este fim tcnicas passveis de serem implementadas em tempo real.
esto bem estabelecidas. Muitas das pesquisas neste nvel de Isso limita o sucesso a taxonomias muito pequenas (at 5
classificao incluem, alm da distino entre vozes classes) e discriminao de gneros bastante distintos
masculinas e femininas, a identificao de outros eventos (como msica clssica e tecno). Contudo, especialmente em
sonoros monofnicos, como sons produzidos por animais, por classificaes mais detalhadas, h a necessidade de se extrair
fenmenos meteorolgicos, pela interao entre os seres parmetros de nvel mais elevado [32].
humanos e o ambiente, etc. Apesar de representar um desafio Os sistemas de classificao automtica de sinais de udio
maior, este tipo de classificao facilitado pelo fato dos buscam reproduzir a maneira como ouvintes humanos
sinais monofnicos, em geral, apresentarem uma estrutura processam e classificam os eventos auditivos que chegam a
simples e previsvel. Como resultado, os ndices de acerto seus ouvidos. Assim, pode-se inferir que uma das possveis
freqentemente ultrapassam os 90% [3, 12]. estratgias para se extrair parmetros de alto nvel submeter
Uma tarefa muito mais complicada a classificao de os sinais a processamentos que modelem alguns fenmenos
sinais de msica. Esse tipo de sinal , em geral, polifnico, o auditivos importantes, como mascaramento e limiar de
que significa que ele constitudo por um grande nmero de audibilidade. O conjunto de tais processamentos recebe o
diferentes fontes sonoras simultneas. Sua complexidade nome de modelos psico-acsticos. Os parmetros extrados a
torna difcil a distino entre os diferentes gneros musicais. partir desses sinais perceptualmente modificados seriam uma
Como descrito na Seo 2, a complexidade da classificao fonte de informao muito mais confivel.
de sinais de msica varia muito entre as pesquisas realizadas. Outras alternativas em estudo para a extrao de
Alguns trabalhos adotam taxonomias muito simples [13]; parmetros de boa qualidade incluem a anlise de ritmo da
nesses casos, o objetivo principal acumular conhecimento msica e a busca por estratgias alternativas para a
decomposio tempo-freqncia dos sinais.
para o futuro desenvolvimento de estratgias mais
complexas. Outras pesquisas adotam uma taxonomia
6.3. Estratgias de Classificao
complexa [3, 14], j visando o desenvolvimento de
Como comentado na Seo 4, pode-se encontrar na
ferramentas que venham atender demanda por novas literatura diversas estratgias de classificao. As tcnicas
tecnologias ocasionada pela evoluo da tecnologia da tradicionalmente usadas para este fim podem ser divididas
informao. Nesses casos, o ndice de sucesso ainda baixo, em dois tipos: 1) aquelas que usam abordagens muito simples
raramente atingindo 60%. Como se pode observar, ainda h a fim de possibilitar a execuo em tempo real, em
muito a ser feito at que esta se torne uma tecnologia detrimento da qualidade; 2) aquelas que usam abordagens
consolidada. mais sofisticadas, as quais resultam em melhores resultados
mas no podem ser implementadas em tempo real.
6. ANLISE CRTICA E SUGESTES Uma alternativa com potencial de substituir com vantagem
A seguir ser apresentada uma anlise crtica das as tcnicas clssicas a classificao atravs das redes de
estratgias comumente utilizadas, alm de se propor solues Kohonen. Essa abordagem, usada com sucesso em pesquisas
para alguns de seus principais problemas. anteriores [33, 34], fornece resultados de boa qualidade
aliados a um esforo computacional comparativamente
6.1. Taxonomia pequeno. As novas estratgias de classificao a serem
A classificao taxonmica adotada em cada pesquisa desenvolvidas no futuro devero adotar a estratgia de aliar
fortemente subjetiva. Esta afirmao particularmente bons resultados a uma baixa complexidade computacional.
verdadeira para msica. Neste caso, no existe um consenso
na maneira como os sinais devem ser classificados. Isto gera 6.3. CONCLUSES
uma grande confuso de semntica e um grande volume de Este artigo apresentou o estado da arte da classificao de
redundncia dentro das prprias estruturas taxonmicas. sinais de udio. Foram apresentadas diferentes estratgias
Esses fatos tornam claro que desenvolver uma taxonomia relacionadas taxonomia, extrao de parmetros e mtodos
apropriada e eficiente no uma tarefa trivial. A tentativa de de classificao usados nesta rea de pesquisa. As falhas
concernentes a essas estratgias foram identificadas e
se criar uma estrutura taxonmica universal um desafio
alternativas com potencial de superar alguns dos problemas
ainda maior. Apesar das dificuldades, um mtodo de
foram propostas.
classificao de sinais de udio realmente eficiente depender
A classificao de sinais de udio um campo de pesquisa
do sucesso de tal empreitada. Hoje, existem pesquisas em franca expanso. Por estar nos estgios iniciais de
voltadas exclusivamente para o desenvolvimento de tcnicas desenvolvimento, a CSA uma rea estimulante e ainda
capazes de padronizar a maneira como os sinais so repleta de desafios a serem vencidos.
classificados [32].
Um meio de evitar alguns dos problemas relacionados a REFERNCIAS BIBLIOGRFICAS
este tpico desenvolver uma taxonomia com diversos nveis
hierrquicos, ou seja, as categorias so sucessivamente [1] E. Wold , T. Blum , D. Keislar and J. Wheaton,
divididas em sub-categorias. Este procedimento confere uma Content-Based Classification, Search, and Retrieval of
boa flexibilidade estrutura taxonmica, pois facilita a Audio, IEEE MultiMedia, vol. 3, no. 3, pp. 27-36,
insero de novos gneros musicais medida que o contexto September 1996.
musical evolui, alm de permitir que modificaes sejam [2] J. Saunders, Real-Time Discrimination of Broadcast
facilmente introduzidas. Speech/Music, Proceedings of the IEEE Intern. Conf.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 25
BARBEDO E LOPES ESTADO DA ARTE DA CLASSIFICAO DE SINAIS DE UDIO

on Acoustics, Speech, and Signal Processing, vol. 2, [18] G. Peeters and X. Rodet, Automatically selecting
1996, pp 993-996. signal descriptors for Sound Classification, ICMC
[3] G. Tzanetakis and P. Cook, Musical Genre 2002, Goteborg, Sweden, September 2002.
Classification of Audio Signals, IEEE Transactions on [19] M. Casey, General sound classification and similarity
Speech and Audio Processing, vol. 10, no. 5, July 2002. in MPEG-7, Organized Sound, vol. 6, no. 2, pp. 153-
[4] D. B. Gerhard, A human vocal utterance corpus for 164, Aug. 2001.
perceptual and acoustic analysis of speech, singing and [20] Y.-C. Cho, S. Choi and S.-Y. Bang, Non-negative
intermediate vocalizations, Journal of the Acoustical component parts of sound for classification, Proc.
Society of America, vol. 112, no. 5, p. 2246, November IEEE Int. Symp. Signal Processing and Information
2002. Technology, Darmstadt, Germany, December 14-17,
[5] D. B. Gerhard, Computationally measurable differences 2003.
between speech and song, PhD Thesis, Computing [21] H.-G. Kim, E. Berdahl and T. Sikora, Study of
Science, Simon Fraser University, Burnaby, Canada, MPEG-7 Sound Classification and Retrieval, 5th
April 2003. International ITG Conference on Source and Channel
[6] K. El-Maleh, M. Klein, G. Petrucci and P. Kabal, Coding, Erlangen, Germany, January 2004.
"Speech/Music Discrimination for Multimedia [22] D. Guo and S.Z. Li, Content-based Audio
Applications", Proc. IEEE Int. Conf. Acoustics, Speech, Classification and Retrieval by Support Vector
Signal Processing (Istanbul), pp. 2445-2448, June Machines. IEEE Trans. on Neural Networks. Vol.14,
2000. No.1, pp.209-215. January 2003.
[7] R. Jarina, N. O'Connor, and S. Marlow, Rhythm [23] J. Foote, Content-Based Retrieval of Music and
Detection for Speech-Music Discrimination in MPEG Audio, in C.-C. J. Kuo et al., editor, Multimedia
Compressed Domain, Proc. of the IEEE 14th Storage and Archiving Systems II, Proc. of SPIE, Vol.
International Conference on Digital Signal Processing 3229, pp. 138-147, 1997.
2002, Santorini, Greece, July 2002, pp. 129-132 [24] T. Zhang and C.-C. J. Kuo, Audio content analysis for
[8] J. Pinquier, J.-L. Rouas and R. Andr-Obrecht, Robust online audiovisual data segmentation and
speech / music classification in audio documents, classification, IEEE Transactions on Speech and
Proceedings of the International Conference on Spoken Audio Processing, vol. 3, no. 4, pp. 441-457, 2001.
Language Processing (ICSLP'2002), Denver, USA, [25] A. A. Alatan, A. N. Akansu and W. Wolf, Multi-
September 2002. modal Dialogue Scene Detection Using Hidden Markov
[9] L. Lu, H.-J. Zhang and Hao Jiang Content Analysis Models for Content-based Multimedia Indexing,
for Audio Classification and Segmentation, IEEE Kluwer Acad., Int. Journal on Multimedia Tools and
Transactions on Speech and Audio Processing, vol. 10, Applications, vol. 14, pp. 137151, 2001.
no. 7, pp. 504-516, October 2002. [26] N. Dimitrova, Multimedia Content Analysis and
[10] E. Scheirer and M. Slaney: Construction and Indexing for Filtering and Retrieval Applications,
Evaluation of a Robust Multifeature Speech/Music Special Issue on Multimedia Technologies and
Discriminator, Proceedings of ICASSP97, pp. 1331- Informing Systems, Part I, vol. 2, no. 4, pp. 87-100,
1334, April 1997, Munich, Germany. 1999.
[11] M. J. Carey, E. S. Parris and H. Lloyd-Thomas, A [27] K. Minami, A. Akutsu, H. Hamada and Y. Tonomura,
comparison of features for speech, music Video Handling with Music and Speech Detection,
discrimination, Proceedings of IEEE International IEEE MultiMedia, vol. 5, no. 3, pp.17-25, July 1998.
Conference on Acoustics, Speech, and Signal [28] V. Peltonen, J. Tuomi, A. Klapuri, J. Huopaniemi and
Processing, pp. 149152, April 1999. T. Sorsa, Computational auditory scene recognition,
[12] Lu, G.J. and T. Hankinson, A Technique Towards Proceedings of ICASSP '02, Florida, USA, May 2002.
Automatic Audio Classification and Retrieval, Proc. [29] M. C. Bchler, Algorithms for Sound Classification in
IEEE Intl. Conf. on Signal Processing, vol. 2, pp. 1142- Hearing Instruments, Ph.D. Thesis, Zurich,
-1145, 1998. Switzerland, 2002.
[13] H. Deshpande, R. Singh, and U. Nam. Classification [30] S. Z. Li, Content-based classification and retrieval of
of music signals in the visual domain, Proceedings of audio using the nearest feature line method, IEEE
the COST-G6 Conference on Digital Audio Effects, Transactions on Speech and Audio Processing, vol. 8,
Limerick, Ireland, December 2001. pp. 619625, 2000.
[14] J. J. Burred and A. Lerch, Hierarchical Approach to [31] L. R. Rabiner, Fundamentals of Speech Recognition,
Automatic Musical Genre Classification, Proceedings PTR Prentice-Hall Inc., New Jersey, 1993.
of the 6th International Conference on Digital Audio [32] J.-J. Aucouturier and F. Pachet, Representing Musical
Effects DAFX03, London, UK, September 2003. Genre: A State of the Art, Journal of New Music
[15] M. F. McKinney, Features for Audio and Music Research, vol. 32, no. 1, pp. 8393, 2003.
Classification, Proceedings of ISMIR, Baltimore, [33] J. G. A. Barbedo, A. Lopes, A New Cognitive Model
USA, 2003. for Objective Assessment of Audio Quality, submitted
[16] D. Pye, Content-based methods for the management of to the Journal of Audio Engineering Society, March
digital music, In ICASSP, vol. IV, pages 2437-2440, 2004.
2000. [34] J. G. A. Barbedo, A. Lopes, Strategies to Increase the
[17] G. Agostini, M. Longari and E. Pollastri, Musical Applicability of Methods for Objective Assessment of
Instrument Timbres Classification with Spectral Audio Quality, to be presented at 116th AES
Features, EURASIP Journal on Applied Signal Convention, Berlin, May 2004.
Processing, no. 1, pp. 1-11, 2003.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004 26

Sociedade de Engenharia de Audio
Artigo de Convenc
ao
Apresentado na VIII Convenc
ao Nacional
7 - 9 de Junho de 2004, S
ao Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edicoes, correco
es e consideraco
es feitas pelo comit
e t
ecnico
deste evento. Outros artigos podem ser adquiridos atrav es da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaco es sobre a seca
o brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. N
ao e permitida a reproduca
o total ou parcial deste artigo sem autorizaca
o expressa da AES Brasil.

Interpolac
ao de Sinais de Audio Usando Polin
omios do Par de Linhas
Espectrais
Paulo A. A. Esquef1
1
Helsinki Univ. of Technology, Lab. of Acoustics and Audio Signal Processing, P.O.Box 3000,
FIN-02015 HUT, Espoo, Finland
paulo.esquef@hut.fi

RESUMO
Esse artigo aborda a interpolacao de falhas longas em sinais de audio atraves de tecnicas basedas em
modelos autorregressivos (AR). Demonstra-se que a utilizacao de modelos AR modificados, baseados
na soma ponderada dos polin omios do par de linhas espectrais (PPLE), produz melhores resultados
perceptivos do que o emprego de modelos convencionais de mesma ordem.

1 INTRODUC
AO to a ser reconstrudo. Isso se deve, principalmente, a `
minimizaca o do erro de modelagem, empregada na es-
A reconstruca o de amostras perdidas em sinais de timacao das amostras perdidas. Considerando uma si-
a
udio e uma tarefa comumente necess aria em aplicaco
es tuacao limite em que o erro e nulo, o sinal interpolado
de a udio. Exemplos de perda de sinal s ao encontra- depender a basicamente da resposta impulsiva do modelo
dos em situaco es como erros em uma transmiss ao digi- AR. Assim, para que a interpolaca o funcione, e preciso
tal [1] e reproducao de matrizes degradadas de gravacoes que o decaimento da resposta impulsiva do modelo seja
historicas [2]. lenta o suficiente para preencher a falha. Para mode-
A modelagem autorregressiva (AR) encontra utilidade los cujos p olos se situem afastados da borda do crculo
em v arias aplicacoes no processamento de sinais de fala unit ario e, logo, possuam respostas impulsivas de decai-
e m usica. Exemplos tpicos s ao a codificaca
o por pre- mento r apido, o efeito de atenuacao energetica se torna
dica
o linear [3], a deteca
o de erros [4] e a reconstruca
o crtico.
de sinais de a udio [5, 6]. No u ltimo caso, interpolado- Uma opca o simples para se contornar esse problema
res AR s ao adequados para reconstruir fragmentos muito consiste em aumentar a ordem do modelo AR, visto que
curtos de sinais. Isso se deve, basicamente, ao fato de isso tende a produzir modelos com p olos mais proximos
a suposicao de estacionariedade ser valida somente para da circunferencia unit aria. Outras soluco
es incluem a
trechos curtos, i.e., aproximadamente 20 ms, de sinal. imposica o de um limite inferior para a minimizaca o do
Na interpolaca o de falhas longas, o desempenho de erro de modelagem [7, 8].
interpoladores AR e fraco, uma vez que a energia do Para fragmentos t ao longos quanto o limite de estaci-
sinal interpolado decai em direca o ao meio do segmen- onariedade de tempo curto e recomend avel a utilizaca
o

27
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE

= 0,5 construdo a partir de P (z) e Q(z) atraves da relaca


o
P ( z)
A(z) = 21 [P (z) + Q(z)]. A equivalencia entre A(z) e a
x (n) A ( z) e (n) x (n) e (n) soma ponderada de P (z) e Q(z) e ilustrada na Fig. 1.
Q ( z)
1
3 SOMA PONDERADA DE PPLES

Figura 1: Equivalencia entre A(z) e os PPLEs. Um esquema de predica o linear baseado na soma pon-
derada dos PPLEs foi proposto em [13]. O filtro de
an
alise e definido como
de dois modelos AR: um estimado a partir do segmento
que imediatamente precede a falha e outro a partir do D(z, ) = P (z) + (1 )Q(z), (1)
segmento que imediatamente a sucede [9]. Abordagem
similar foi tambem proposta em [10, 11, 12]. onde, como antes, P (z) e Q(z) s ao, respectivamente, os
O interpolador investigado nesse trabalho e baseado PPLEs simetrico e assimetrico associados a A(z). O peso
na proposicao descrita em [10, 11, 12]. Aqui, entretanto, e um ganho de valor real. Como visto na Seca o 2 e na
ao inves de se utilizarem modelos AR convencionais, mo- Fig. 1, para = 0,5 a equivalencia D(z, = 0,5) = A(z)
delos AR modificados s ao empregados. A modificaca o e verdadeira. Deve-se notar que, para 6= 0,5, D(z, )
consiste em computar os PPLEs associados ao modelo tem ordem p + 1, enquanto A(z) tem ordem p.
AR convencionalmente estimado e obter um modelo AR Para = 1 e = 0, o preditor modificado D(z, )
modificado atraves da soma ponderada daqueles [13]. O se reduz a P (z) e Q(z), respectivamente. Logo, os p olos
modelo modificado e, ent ao, usado diretamente no algo- de 1/D(z, ) est ao localizados na circunferencia unitaria.
ritmo de interpolaca o. Alem disso, mostra-se em [13] que 1/D(z, ) e est avel se
A vantagem dessa proposta reside na possibilidade de, ] 0, 1 [ . Por simplicidade, o modelo AR 1/D(z, )
atraves do ajuste de um u nico parametro, se realocar sera chamado, daqui em diante, de modelo modificado.
os polos do modelo modificado mais proximamente da A figura 2 mostra o lugar-das-razes de 1/D(z, ) em
circunferencia unit aria. Isso resulta num benefcio cla- funca
o do peso , para um modelo AR sintetico de quar-
ro ao problema de interpolaca o. Um efeito colateral da ta ordem. Uma inspeca o visual da Fig. 2 revela que
modificacao proposta e que as freq uencias dos polos re- escolher perto de 1 faz com que os a ngulos dos polos
alocados se tornam polarizadas em relaca o aos valores de 1/D(z, ) permanecam (em baixas freq uencias) mais
originais. Conseq uentemente, distorco es podem ser per- proximos dos a ngulos do modelo AR original do que no
cebidas nas porco es de sinal reconstrudas (ver mais de- caso de se adotar pr oximo de 0. Ademais, adotar = 0
talhes na Secao 5). Apesar disso, o emprego dos modelos implica um p olo em DC, o que pode ser problem atico em
AR modificados produz resultados superiores aos obtidos aplicacoes de sntese, enquanto que = 1 implica um
com o uso de modelos convencionais de mesma ordem. polo em z = 1.
Este artigo e organizado como se segue. A Seca o 2 Dado o arrazoado anterior, e plausvel esperar-se que
define os polin omios do par de linhas espectrais e reve a adoca o de tendendo a 1 seja mais vantajosa que es-
suas propriedades. A Seca o 3 ilustra as propriedades dos colher perto de 0, como recurso para mover os p olos
modelos modificados. O metodo de interpolaca o utiliza- do modelo modificado mais para perto da circunferencia
do e descrito na Seca o 4. Os resultados experimentais unitaria. Alternativamente, pode-se pensar em compu-
s
ao apresentados na Seca o 5 e avaliados subjetivamente tar as razes de A(z) e artificialmente aumentar seus
na Secao 6. As conclus oes s
ao apresentadas na Seca o 7. m odulos (raios). Entretanto, o c alculo das razes de po-
linomios de alta ordem, alem de ser computacionalmente
custoso, e sujeito a erros numericos. Ao contr ario, o cus-
2 POLINOMIOS DO PAR DE LINHAS ESPECTRAIS
to computacional para se computar o modelo modificado
e de apenas p multiplicaco es e p adico
es por modelo, ou
Suponha a resposta de um filtroP de predica o linear de
seja, e negligvel se comparado ao custo da estimaca o do
p-esima ordem como A(z) = 1 pk=1 a(k)z k , onde a()
modelo convencional.
representam os coeficientes do filtro na sua forma direta.
A funca o de transferencia do filtro de sntese 1/A(z) e
garantidamente est avel se A(z) possuir fase mnima. 4
METODO DE INTERPOLAC MODIFICADO
AO
A ideia por tr
as dos PPLEs e representar o polin omio
A(z) por meio de dois outros polin omios cujos zeros se Os modelos AR modificados podem ser utilizados em
encontram exatamente sobre a circunferencia unit aria. qualquer interpolador baseado em modelagem AR, e.g.,
O mapeamento envolvido e dado por P (z) = A(z) + o interpolador AR por criterio de mnimos quadrados
z (p+1) A(z 1 ) e Q(z) = A(z) z (p+1) A(z 1 ), onde descrito em [6]. Como o presente trabalho lida com a in-
P (z) e Q(z) s ao as asssim chamados polin omios do par terpolaca
o de falhas t
ao longas quanto o m
aximo tempo
de linhas espectrais [14]. Ademais, A(z) pode ser re- de estacionariedade que se pode assumir em fragmentos

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 2

28
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE

p = 50

Amplitude
1 1
0
1
0,5 0 1000 2000 3000 4000 5000 6000
Parte Imaginria Tempo (amostras)
p = 500

Amplitude
1
0 0
1
0 1000 2000 3000 4000 5000 6000
0,5 Tempo (amostras)
p = 1000

Amplitude
1
0
1
1
1 0,5 0 0,5 1 0 1000 2000 3000 4000 5000 6000
Parte Real Tempo (amostras)

Figura 2: Lugar-das-razes de 1/D(z, ) em funcao Figura 3: Desempenho do metodo de interpolacao


de 0 1, para um modelo AR sintetico de para diversos valores de ordem de modelo. A falha
quarta ordem. Os smbolos , e indicam a esta presente entre as amostras 2001 e 4000. O si-
localizacao dos p
olos para = 0,5, = 0 e = 1, nal original na regiao da falha e mostrado em linha
respectivamente. pontilhada.

de sinais de audio, o esquema de interpolaca


o propos- 5.1 Estudo de Caso: tom grave de piano
to em [11] sera ligeiramente modificado e utilizado nos Este estudo de caso se refere a um tom grave de piano
experimentos. com freq uencia fundamental f0 50 Hz, tocado forte.
Supondo uma falha de G amostras entre dois segmen- Sinais desse tipo apresentam centenas de parciais e, por-
tos de N amostras cada um, os passos do metodo modi- tanto, suas modelagens por processos AR requerem o
ficado de interpolaca
o s
ao os seguintes: emprego de ordens altas. A adoca o de ordens insuficien-
1. Estime um modelo AR a partir do segmento de N tes n ao s
o negligencia alguns modos de resson ancia, mas
amostras que precede a falha e calcule o modelo mo- tambem tende a alargar a banda das resson ancias mo-
dificado usando perto de 1. A estimaca o do mo- deladas. Em outras palavras, os p olos associados a essas
delo AR e aqui realizada pelo metodo de Burg [15]. resson ancias nao est ao t
ao proximos da circunferencia
unit aria quanto deveriam estar.
2. Extrapole para a frente o sinal atraves falha por Como mencionado na Seca o 1, a localizaca
o dos polos
meio da excitaca
o do modelo modificado, como des- do modelo AR tem papel crucial no processo de interpo-
crito em [12]. laca
o de falhas longas. Para exemplificar o efeito da esco-
3. Repita os dois passos anteriores para o segmento lha da ordem do modelo, uma falha de 2000 amostras (@
que sucede a falha. Aqui, objetiva-se uma extrapo- 44,1 kHz de freq uencia de amostragem) e artificialmen-
laca
o para tr
as. Para isso, basta aplicar revers
oes te criada no sinal de teste, comecando aproximadamente
temporais nos segmentos envolvidos. 5000 amostras depois do ataque da nota. A comparaca o
entre os resultados de interpolaca o para v arios valores
4. Emende as duas seq
uencias extrapoladas atraves do
de ordem de modelo e mostrada na Fig. 3. Dos resulta-
esquema de janelamento1 descrito em [11].
dos para esse sinal de teste, observa-se que ordens mais
baixas que 500 s ao insuficientes para reconstruir o si-
5 RESULTADOS EXPERIMENTAIS nal adequadamente. Entretanto, a adoca o de p = 1000
aparentemente e suficiente para esse exemplo.
O prop osito desta secao e comparar o desempenho do Agora, os modelos convencionais s ao substitudos por
metodo de interpolaca o proposto sob diversas configu- seus respectivos modelos modificados. A ordem2 dos mo-
raco
es dos parametros de processamento. Primeiramen- delos e fixada em p = 150 e {0,5, 0,8, 0,99}. Os re-
te, ilustra-se o efeito de desvanecimento da energia do sultados do processo de interpolaca o sao mostrados na
sinal interpolado e o papel da escolha da ordem do mo- Fig. 4. Nota-se que a adoca o de pr oximo de 1 parece
delo AR nessa quest ao. Em seguida, demonstram-se os melhorar o desempenho da intepolaca o, no que diz res-
benefcios da utilizaca
o do modelo modificado dentro do peito a ` preservaca
o da energia do sinal reconstrudo ao
metodo de interpolaca o. longo da falha.
1 O parametro de roll-off foi ajustado em 3 em todas as 2 O valor de p se refere a
` ordem do modelo convencional.
simulaco
es aqui apresentadas. A ordem do modelo modificado e, em geral, p + 1.

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 3

29
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE

p = 150, = 0,5 treitas do que as obtidas com a configuraca o p = 150 e


Amplitude
1
0 = 0,5. Entretanto, e evidente que a estrutura intrin-
1 cada do espectro do sinal original n ao e bem modelada
0 1000 2000 3000 4000 5000 6000 atraves de modelos AR de ordem baixa.
Tempo (amostras)
Em relacao a
`s freq
uencias de ressonancia, aquelas do
p = 150, = 0,8
Amplitude

1 sinal interpolado usando-se a configuraca o p = 150 e


0 = 0,99 mostram visualmente uma correlaca o relati-
1 vamente alta com as resson ancias do sinal original. A
0 1000 2000 3000 4000 5000 6000
Tempo (amostras) Fig. 6 ilustra melhor esse fato. Apesar disso, e possvel
p = 150, = 0,99 observar desvios em algumas freq uencias de resson ancia.
Amplitude

1
Por exemplo, a resson ancia proeminente que ocorre no
0
sinal original em torno de 1500 Hz aparece um pouco aci-
1
0 1000 2000 3000 4000 5000 6000 ma no sinal interpolado. H a que se considerar, tambem,
Tempo (amostras) que os desvios nas freq uencias de resson ancia sao mais
acentuados em altas freq uencias. Logo, e plausvel espe-
Figura 4: Desempenho do metodo de interpolacao cular que a qualidade dos sinais interpolados possa ser
proposto para ordem de modelo p = 150 e varios aceit
avel perceptualmente, apesar de possveis distorco es
valores de . A falha e localizada entre as amostras espurias.
2001 e 4000. O sinal original e mostrado em linha
pontilhada.

Magnitude (dB)
Original
50

100
Os resultados anteriores contam a favor da utilizaca o 0 500 1000 1500 2000 2500 3000
Freqncia (Hz)
3500 4000 4500 5000

dos modelos modificados no metodo de interpolaca o in- Magnitude (dB)

vestigado, uma vez que, com as mesmas ordens de mo- p = 150 = 0,5
50
delo, o uso dos modelos modificados produz melhores
resultados, pelo menos visualmente. Ademais, o custo 100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
computacional extra necess ario ao c alculo dos modelos Freqncia (Hz)
modificados e mnimo, se comparado a `queles relaciona-
Magnitude (dB)

dos com a estimaca o dos modelos convencionais e o pro- p = 150 = 0,99


50
cedimento de extrapolaca o.
O efeito colateral do uso dos modelos modificados re- 100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
side no desvio observado nas suas freq uencias de res- Freqncia (Hz)
sonancia, em relaca
o a`s frequencias do modelo original.
Magnitude (dB)

p = 1000 = 0,5
Apesar disso, freq uencias de resson ancia ligeiramente 50
desviadas ser ao provavelmente excitadas com um nvel
de energia similar ao das freq uencias originais. Essa e a 100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
razao pela qual o metodo de interpolaca o ainda funcio- Freqncia (Hz)
na. Freq uencias de ressonancias fortemente polarizadas
ser
ao provavelmente excitadas a baixos nveis de ener- Figura 5: Detalhe (ate 5 kHz) do espectro do sinal
gia. Logo a contribuica o destas na forma de distorco es original e de sinais reconstrudos.
audveis no sinal reconstrudo pode ser menos crtica do
que aquela causada por freq uencias de ressonancia ligei-
ramente desviadas.
A Fig. 5 confronta os espectros do sinal original na
Magnitude (dB)

20 Original e interpolado ( p = 150 = 0,99 )


regiao da falha com os espectros dos sinais recons- 40
60
trudos, dadas as configuraco es de processamento indi- 80
cadas. Nota-se que o espectro do sinal original tem um 100
120
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
numero substancial de resson ancias. Freqncia (Hz)
O espectro do sinal interpolado com p = 150 e = 0,5
revela que somente as resson ancias mais proeminentes
Figura 6: Detalhe (ate 5 kHz) dos espectros do sinal
foram modeladas. Alem disso, suas bandas parecem mais
largas do que as originais.
original e do sinal reconstrudo usando-se a confi-
Por outro lado, a configuraca o p = 150 e = 0,99 guracao = 0,99 e p = 150. O espectro do sinal
produz um sinal com um n umero maior de resson ancias interpolado e mostrado com uma compensacao de
proeminentes. Tais resson ancias tem bandas mais es- -30 dB para melhor visualizacao.

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 4

30
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE

6 DESEMPENHO QUALITATIVO
Tabela 1: Parametros usados nas simulacoes.
Essa seca
o e dedicada a
` avalica
o subjetiva do metodo
de interpolaca
o usando modelos modificados. Os sinais Parametro Valor
de teste utilizados, assim como as configuracoes de pro- Extensao da falha G = 2000 amostras
cessamento empregadas, s ao descritos a seguir. Periodicidade das falhas 50000 amostras
Ordem (AR convencional) p {150, 300, 500, 1000}
6.1 Sinais de teste Estimaca
o AR Burg, N = 2000 amostras
Nesse trabalho, por questoes de praticidade, decidiu- Ordem (AR modificado) p = 150
se avaliar o desempenho do metodo de interpolaca o em Pesos nos PPLEs [0,5, 1,0]
quatro sinais de teste. Segue-se uma breve descrica
o des-
ses sinais.

1. Piano: um tom de piano (f0 50Hz) tocado forte;


6.3 Avaliac
ao Subjetiva
2. Pop: um excerto de 14 s de m
usica pop finlandesa;
3. Classico: um fragmento de 13 s de m
usica orques- A avaliacao subjetiva foi realizada atraves de testes
tral; informais de audica o. Quanto aos resultados relativos
aos sinais de referencia (usando modelos AR convenci-
4. Canto: um segmento de 20 s de canto a capella. onais), observou-se que, como j a se poderia antecipar,
a qualidade da restauraca o aumenta com a ordem dos
6.2 Configurac ao de processamento modelos AR, dentro da faixa investigada. Para todos os
Os experimentos consistem em criar falhas peri odicas sinais de teste, a restauraca
o usando modelos convenci-
nos sinais de teste e aplicar o procedimento de interpo- onais com ordem p = 150 j a produz certa melhora na
laca
o para cada uma delas, usando, para cada sinal de qualidade perceptual, haja vista que as transico es nas
teste, diversas configuraco es de parametros de proces- bordas das falhas s ao suavizadas. Entretanto, ainda e
samento. Os sinais reconstrudos s ao ent
ao submetidos clara a presenca das falhas.
a
` apreciaca o de ouvintes que julgaram a qualidade dos Quanto a avaliacao dos resultados obtidos atraves da
resultados. utilizaca
o dos modelos modificados, a impress ao geral
O tamanho das falhas e fixado em 2000 amostras (@ e de que a percepca o de melhorias qualitativas ocorre
44,1 kHz), o que corresponde a uma duraca o de aproxi- mais claramente para valores de bem pr oximos de 1.
madamente 45 ms. Essa escolha exige sobremaneira do Para todos os sinais de teste utilizados, e para p = 150,
procedimento de interpolaca o, uma vez que a duraca o os resultados de interpolaca o obtidos com = 1 foram
das falhas est a no limite maximo acima do qual a esta- julgados como de qualidade superior aos correspondentes
cionariedade n ao pode mais ser assumida em sinais de obtidos com = 0,5, i.e., via modelos convencionais.
a
udio. O avanco entre uma falha e a ocorrencia sub- Isso a despeito da ocorrencia de algumas distorco es nos
sequente e de 50000 amostras. Isso garante n ao so a sinais restaurados usando modelos modificados. Essas
existencia de amostras suficientes antes e depois da fa- distorcoes aparecem como uma qualidade mais sintetica
lha para estimar os modelos AR, mas tambem que o e mec anica em certas falhas preenchidas.
interpolador ser a avaliado sob diferentes caractersticas O grau de melhora perceptiva varia de acordo com
espectro-temporais dos sinais de teste. o sinal de teste. Por exemplo, para o sinal Piano, o
A ideia aqui e manter baixa a ordem dos mode- procedimento de interpolaca o usando p = 150 e = 1
los AR de modo que o resultado da interpolaca o se- produz um resultado que soa perceptivamente similar ao
ja insatisfat orio quando usando modelos convencionais. obtido com p = 500 e = 0,5. Conclus oes semelhantes
Mantendo-se baixa a ordem, objetiva-se, ent ao, veri- foram tiradas com relaca o ao sinal Cl
assico.
ficar se ocorrem melhoras de desempenho devido ao J
a para os sinais Pop e Canto, as restauraco es ob-
uso dos modelos modificados. Nesse contexto, pare- tidas usando p = 150 e = 1 soam similares a `quelas
ce razo avel adotar arbitrariamente p = 150 para a or- produzidas com p = 1000 e = 0,5. Vale notar, entre-
dem dos modelos modificados. A investigaca o, entao, tanto, que os sinais Pop e Canto exigem mais do proce-
fica focalizada no efeito do par ametro nos resulta- dimento de interpolaca o, por serem menos estacion arios
dos. Os valores adotados para na investigaca o s ao do que os sinais Piano e Cl assico. Assim, para aqueles,
{0,5, 0,8, 0,9, 0,99, 1}. mesmo usando ordens altas para os modelos AR, como
A ttulo de referencias para comparacoes subjetivas, p = 1000, os resultados de restauraca o soam, em geral,
vers oes restauradas dos sinais de teste corrompidos fo- inferiores qualitativamente a estes, quando comparados
ram obtidas usando-se tambem modelos convencionais aos originais.
com ordens p {150, 300, 500, 1000}. Os par ametros de Pelos resultados supracitados, pode-se concluir que
processamento usados nas simulaco es s
ao resumidos na a utilizacao de modelos AR modificados ou, mais pre-
Tabela 1. cisamente, a substituica o de modelos AR convenci-

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 5

31
ESQUEF DE AUDIO
INTERPOLACAO COM PPLE

onais por seus correspondentes polin omios simetricos [5] A. J. E. M. Janssen, R. N. J. Veldhuis, and L. B. Vri-
de linhas espectrais, dentro do procedimento de in- es, Adaptive Interpolation of Discrete-Time Sig-
terpolaca
o investigado, oferece um melhor balanco en- nals That Can Be Modeled as Autoregressive Pro-
tre o custo computacional do metodo de interpo- cesses, IEEE Trans. Signal Processing, vol. ASSP-
laca
o e seu desempenho qualitativo. Exemplos dos 34, pp. 317330, Apr. 1986.
sinais processados podem ser encontrados no URL: [6] S. J. Godsill and P. J. W. Rayner, Digital Audio
http://www.acoustics.hut.fi/esquef/aesbrasil/. Restoration A Statistical Model Based Approach,
ch. 5. London, UK: Springer-Verlag, 1998.
7 CONCLUSOES
[7] P. J. W. Rayner and S. J. Godsill, The Detection
Esse artigo apresentou uma aplicaca o dos polin omios and Correction of Artefacts in Degraded Gramopho-
do par de linhas espectrais associado a um modelo au- ne Recordings, in Proc. IEEE ASSP Workshop
torregressivo ao problema de reconstruca o de sinais de Applications Signal Processing Audio Acoustics,
a
udio em falhas de longa duraca o. A modificacao pro- pp. 151152, Oct. 1991.
posta no metodo de interpolaca o investigado consistiu na [8] M. Niedzwiecki, Statistical Reconstruction of Mul-
substituicao de modelos AR estimados convencionalmen- tivariate Time Series, IEEE Trans. Signal Proces-
te por uma soma ponderada de seus polin omios do par sing, vol. 41, pp. 451457, Jan. 1993.
de linhas espectrais associados. A localizaca o dos p
olos
[9] W. Etter, Restoration of a Discrete-Time Signal
desses modelos modificados pode ser controlada atraves
Segment by Interpolation Based on the Left-Sided
de um u nico parametro de peso.
and Right-Sided Autoregressive Parameters, IEEE
Foram realizados experimentos em um conjunto de
Trans. Signal Processing, vol. 44, pp. 11241135,
quatro sinais de teste, degradados artificialmente e re-
May 1996.
construdos atraves do metodo proposto, sob diversas
configuracoes dos parametros de processamento. A ava- [10] I. Kauppinen, J. Kauppinen, and P. Saarinen, A
liaca
o dos resultados obtidos, tanto visual como auditiva, Method for Long Extrapolation of Audio Signals,
revelou que adotar o par ametro de peso igual a 1 favore- J. Audio Eng. Soc., vol. 49, pp. 11671180, Dec.
ce o desempenho qualitativo do metodo de interpolaca o. 2001.
Essa escolha equivale a ` utilizaca
o do polin
omio simetrico [11] I. Kauppinen and J. Kauppinen, Reconstruction
de linhas espectrais, cujos p olos se encontram exatamen- Method for Missing or Damaged Long Portions in
te na circunferencia unitaria. Audio Signal, J. Audio Eng. Soc., vol. 50, pp. 594
Avaliaco
es subjetivas atraves de testes de audica o 602, July/Aug. 2002.
mostraram que, apesar de introduzir algumas distorco es
audveis no sinais reconstrudos, a modificaca o proposta [12] I. Kauppinen and K. Roth, Audio Sig-
implica sinais restaurados com qualidade subjetiva supe- nal Extrapolation Theory and Applicati-
rior aos obtidos atraves do metodo original, com mesma ons, in Proc. 5th Int. Conf. on Digital Au-
ordem (baixa) de modelo. Como a modificaca o propos- dio Effects, (Hamburg, Germany), pp. 105
ta requer um custo computacional desprezvel, e possvel 110, Sept. 2002. URL: http://www.unibw-
argumentar que a mesma melhora o metodo de interpo- hamburg.de/EWEB/ANT/dafx2002/papers.html.
laca
o, em termos de um melhor balanco entre complexi- [13] P. Alku and T. B ackstr
om, All-pole Modeling Te-
dade computacional e desempenho qualitativo. chnique based on the Weighted Sum of the LSP
Polynomials, in Proc. IEEE Int. Conf. on Acous-

REFERENCIAS tics, Speech and Signal Processing (ICASSP 2002),
[1] N. S. Jayant and S. Christensen, Effects of vol. 1, (Orlando, Florida, USA), pp. 665668, May
Packet Losses in Waveform Coded Speech and 2002.
Improvements Due to an Odd-Even Sample- [14] F. K. Soong and B. W. Juang, Line Spectrum Pair
Interpolation Procedure, IEEE Trans. Communi- (LSP) and Speech Data Compression, in Proc. Int.
cations, vol. CAM-29, pp. 101109, Feb. 1981. Conf. Acoust., Speech, Audio Signal Procesing, (San
[2] P. Wilson, Record Contamination: Causes and Cu- Diego, CA), pp. 1.10.11.10.4, 1984.
re, J. Audio Eng. Soc., vol. 13, pp. 166176, Apr. [15] M. H. Hayes, Statistical Signal Processing and Mo-
1965. deling, ch. 6. John Wiley & Sons, Inc., 1996.
[3] J. Makhoul, Linear Prediction: A Tutorial Revi-
ew, Proc. IEEE, vol. 63, no. 4, pp. 561580, 1975.
[4] S. V. Vaseghi and P. J. W. Rayner, Detection and
Suppression of Impulsive Noise in Speech Communi-
cation Systems, IEE Proceedings, vol. 137, pp. 38
46, Feb. 1990.

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 6

32

Sociedade de Engenharia de Audio
Artigo de Convenc
ao
Apresentado na VIII Convenc
ao Nacional
7 - 9 de Junho de 2004, S
ao Paulo, SP, Brasil
Este artigo foi reproduzido do original entregue pelo autor, sem edicoes, correco
es e consideraco
es feitas pelo comit
e t
ecnico
deste evento. Outros artigos podem ser adquiridos atrav es da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaco es sobre a seca
o brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. N
ao e permitida a reproduca
o total ou parcial deste artigo sem autorizaca
o expressa da AES Brasil.

Interpolac
ao Bilinear Generalizada de HRTFs para Gerac
ao de Som
Tridimensional
Fabio P. Freeland1 , Luiz W. P. Biscainho1 , Paulo S. R. Diniz1
1
LPS PEE/COPPE & DEL/Poli, UFRJ
freeland@lps.ufrj.br

RESUMO
A geracao de som tridimensional em fones de ouvido pode ser feita por interpolacao de Funcoes de Trans-
ferencia Relativas a` Cabeca (HRTFs). Nesse trabalho, explicita-se a forma de calculo dos ponderadores
usados nessa interpolacao por analogia com um metodo multicanal conhecido como Variacao Gradual
da Amplitude Baseada em Vetores (VBAP). Por fim, algumas simplificacoes sao realizadas, obtendo-se
expressoes praticas para casos particulares usuais.

INTRODUC
AO o grau de fidelidade desejado na representaca o digital
Ja faz algum tempo que se comecou a pensar em uma para um sinal anal ogico e determinado pelo n umero de
forma de se recriar de maneira controlada a sensaca o de bits nela utilizados. Portanto, a qualidade fica depen-
imers ao em um ambiente virtual. J a na epoca da criaca
o dente apenas do quanto se est a disposto a gastar na
do estereo o que se pretendia era tornar o som mais en- representacao do sinal antes, durante e depois do pro-
volvente. O cinema tambem foi um grande impulsion- cessamento.
ador do aparecimento de novas tecnicas de atribuica o de Uma das aplicaco es que mais se beneficiaram desse
ambiencia ao som, j a que uma de suas caractersticas salto tecnologico foi a recriaca
o de ambiente virtual por
mais importantes para o p ublico e a diferenca entre o simuladores e ate jogos eletronicos, onde se quer o maior
ambiente da sala de cinema e o domestico; e isso se liga grau possvel de realismo. As mesmas tecnicas de pro-
nao so a
` diferenca no tamanho da tela, mas tambem a ` cessamento digital neles empregadas podem servir para
imers ao sonora no ambiente do filme. gerar efeitos especiais nas trilhas sonoras de filmes.
As tecnicas de geraca o de som tridimensional A criaca
o de um ambiente sonoro virtual tenta pro-
evoluram desde o estereo ate o som surround (que do- duzir o som que se ouviria no ambiente em quest ao, isto
mesticamente j a conta com sete canais mais o canal de e, dar noca
o de tridimensionalidade ao som. Isso corre-
graves) passando pelo som quadraf onico. A grande rev- sponde a simular as alteraco es sofridas pelo som desde
oluca
o ocorrida nessa area se deu com a possibilidade de sua emissao pela fonte ate chegar a cada um dos ouvidos.
se fazer o processamento digital dos sinais, viabilizado Deve-se notar que a mera utilizaca o de uma configuraca o
pela velocidade elevada dos processadores atuais. E com com diversos alto-falantes ao redor do ouvinte, embora
isso, surgiu um novo conceito: a qualidade controlada; produza uma sensaca o de ambientaca o, n
ao e suficiente

33
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO

para localiza-lo na cena sonora; para tal, e necess ario L2


processar convenientemente o sinal.
Existem v arios metodos diferentes para se gerar o som
tridimensional [1, 2]. Os metodos diferenciam-se n ao L1 L3
s
o pelo modo como s ao aplicados, mas tambem pelo P H2E
modo de apresentaca o do som ao ouvinte. Alguns deles
utilizam caixas ac usticas, geralmente com mais de dois HP E H3E
canais independentes, cada um relacionado com uma
r
direca
o, sendo por isso chamados de multicanal. Out- H1E
ros, chamados binaurais [3], fornecem o som de forma r
individual atraves de fones de ouvido. r
A produca o binaural do som 3D se baseia, em r
geral, em funco es de transferencia chamadas Funco es
de Transferencia Relativas a ` Cabeca (HRTFsHead-
Related Transfer Functions), previamente medidas [4].
As HRTFs descrevem as mudancas sofridas pelo som
entre a fonte emissora e cada ouvido. A filtragem de
um som monaural por um par dessas funco es recria uma Figura 1: Posicionamento baseado na variacao de
fonte virtual na posicao para a qual elas foram medidas. amplitude com 3 caixas ac
usticasouvido esquerdo.
Claro que para se posicionar a fonte virtual em qualquer
ponto, e necessario interpolar HRTFs n ao medidas. Considere-se o caso de tres canais apresentados
J
a os metodos multicanal, a princpio, n ao em- atraves de caixas acusticas direcionadas a um ouvinte
pregam esse tipo de funca o de transferencia no processa- situado a` dist
ancia r, como mostra a Fig. 1. O sinal re-
mento. Eles se valem do posicionamento de v arias caixas cebido por cada um dos ouvidos e uma combinaca o dos
acusticas em torno do ouvinte e, com uma combinaca o do sinais emitidos por cada uma das caixas, podendo ser
som emitido por um subconjunto delas, d ao a impressao descrito como
de posicionamento da fonte virtual.

X3
Neste artigo, parte-se de um metodo multicanal con-
E () =
S Si ()HiE ()
hecido como Posicionamento por Variaca o da Amplitude
i=1
(2)
Baseada em Vetores (VBAPVector-Based Amplitude
X3

SD () = Si ()HiD (),
Panning) [5] para se obter uma formulaca o para a inter-
polaca
o de HRTFs utilizadas na geraca o binaural de som i=1

3D. Deve-se ressaltar que o objetivo deste trabalho n ao onde Si () e o espectro do sinal emitido pela caixa Li,
e a comparaca o entre metodos de interpolaca o, mas sim e HiE () e HiD () s ao as funco
es de transferencia da
o detalhamento da formulaca o de um metodo particular. caixa Li aos ouvidos esquerdo e direito, respectivamente.
Inicialmente, discute-se o princpio do posicionamento Potencialmente, esta configuraca o posiciona uma fonte
de uma fonte virtual por variaca o de amplitude. A virtual em qualquer ponto P sobre o tri angulo esferico
seguir, mostra-se que a interpolaca o de HRTFs pode determinado pelas tres caixas. Um sistema de som 3D
ser descrita da mesma forma. Na seq uencia, revisa-se eficaz deve garantir que
o metodo multicanal VBAP. Ent ao, derivam-se as ex- 
SE () SE ()
pressoes que realizam a interpolaca
o de HRTFs com base (3)
no VBAP. Por fim, apresentam-se as conclus oes. SD () SD ().
Uma solucao intuitiva consiste em aplicar o sinal que
POSICIONAMENTO POR VARIAC
AO DE AMPLI- se deseja ouvir vindo do ponto P a cada uma das caixas
CANAIS
TUDE, COM TRES Li ponderado por uma constante gi [5], ou seja, Si () =
gi SP (). Nesse caso, a aproximaca
o (3) se resume a fazer
Todos os metodos de geraca o de som tridimensional

X3
tem como objetivo b asico reproduzir, fsica ou virtual-

HP E () gi HiE ()
mente, as funco
es de transferencia HP E () e HP D () i=1
(4)
que descrevem os caminhos desde uma posica o P ate
X
3


os ouvidos esquerdo e direito, respectivamente. Assim, HP D () gi HiD ().
i=1
tenta-se reproduzir o som de uma fonte virtual localizada
em P filtrando-se o som SP () por ela emitido de forma
INTERPOLAC BASEADA EM TRES
AO HRTFS
que no domnio da frequencia se tenham
Um sistema tpico de geraca
o binaural de som tridi-

SE () = SP ()HP E () mensional se baseia em um conjunto de HRTFs (Head-
(1) Related Transfer Function) medidas para um n umero
SD () = SP ()HP D ().

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 2

34
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO

3 L2
1 P
HP D L1 L3
P v2
vP
H1D 2
H3D v1 v3
r r
r H2D r r

Figura 2: Interpolacao de HRTF a partir de 3 Figura 3: VBAP com tres canais.


funcoes conhecidasouvido direito.

xP x1 x2 x3 g1
yP = y1 y2 y3 g2 (6)
finito de posico
es sobre uma esfera de raio r com o ou-
zP z1 z2 z3 g3
vinte no centro. Para se posicionar uma fonte virtual em
qualquer ponto P sobre a esfera, uma soluca o simples e onde (xi ,yi ,zi ) s
ao as coordenadas relacionadas com a
atribuir a
` HRTF para o ponto P uma combinaca o linear posica
o da caixa Li .
das HRTFs medidas para os pontos mais pr oximos de P ,
isso para cada ouvido. INTERPOLAC DE HRTFS BASEADA NO VBAP
AO
A Fig. 2 mostra um esquema de interpolaca o baseado Como foi mencionado anteriormente, a interpolaca o
em tres HRTFs conhecidas. de HRTFs pode utilizar os mesmos ponderadores cal-
Nesse caso, a aproximaca o realizada e regida pelas culados para um metodo multicanal com tres caixas
mesmas Eqs. (4), onde as funco es HP D () e HP E () ac
usticas. Aqui, propoe-se usar como base a formulacao
s
ao estimadas diretamente pela combinaca o das funcoes do VBAP.
HiD () e HiE (), com i = 1, 2, 3, respectivamente, para Considerando a geometria definida na Fig. 2, e van-
os ouvidos direito e esquerdo. Por esse motivo, tendo as tajoso escrever os vetores (x,y,z) em funca
o das coorde-
funco
es de transferencia a mesma significaca
o fsica nos nadas esfericas:
casos multicanal e binaural, espera-se que uma soluca o
x = r cos cos
para os pesos gi adequada ao caso multicanal tambem
y = r cos sen (7)
seja apropriada para o caso binaural.
z = r sen ,

METODO VBAP onde e o a
ngulo de elevaca
o relativo ao plano horizontal
A tecnica conhecida como VBAP (Vector-Based Am- que passa pelos ouvidos, e o angulo de azimute relativo
plitude Panning) [5] e um metodo multicanal para posi- ao plano vertical que corta perpendicularmente a linha
cionamento de uma fonte virtual que se baseia na de- que une os ouvidos e r e o raio da esfera.
scrica
o vetorial das posico
es dos alto-falantes e da fonte Escolhendo como referencia o ponto 1, conforme a
virtual em relacao ao ouvinte. No caso de tres canais, Fig. 4, as coordenadas angulares dos outros pontos fi-
ilustrado na Fig. 3, os coeficientes gi que satisfazem a cam iguais a
aproximaca o da Eq. (4) sao calculados atraves de
(2 , 2 ) = (1 + 2 , 1 + 2 ) (8)
X
3
(3 , 3 ) = (1 + 3 , 1 + 3 ) (9)
vP = g i vi . (5)
i=1 (P , P ) = (1 + , 1 + ). (10)

Essa equaca o descreve o vetor associado a ` posicao P


Substituindo as Eqs. (8)(10) na Eq.(7), obtem-se as
como uma combinaca o linear dos vetores vi associados
coordenadas dos pontos
a
`s posico
es das caixas Li com i = 1, 2, 3 em coorde-

nadas cartesianas. Admite-se, assim, que a mesma com- x1 r cos cos 1
binaca
o e v
alida para as funco
es de transferencia corre- y1 = r cos sen 1 (11)
spondentes. Explicitamente, z1 r sen 1

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 3

35
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO

2 Nesse caso, o n umero de operaco es necess


arias para se
obter os coeficientes e de 11 somas/subtraco es e 8 mul-



















 tiplicaco
es/divis
oes por nova posicao.
2
 



















 
















 
     1 Deve ser notado que no caso geral, as coordenadas
2


















 
   angulares dos pontos para os quais as HRTFs foram me-
.














 




 
   didas s ao quaisquer. Entretanto, na pr atica, as medi-












 P





 
  
3

















 
   das sao realizadas com pelo menos o passo de elevaca o


















 
   fixo. Nesse caso particular, pode-se fazer 2 = 0 nas


















 
   Eqs. (18), o que as torna


















 


3
g3 =


3

3 3 (19)

g2 = g3

2 2

Figura 4: Geometria para interpolacao triangular de g1 = 1 g 2 g 3 .
HRTFs. Uma simplificacao adicional ainda pode ser feita no
caso de as HRTFs serem medidas com ambos os passos,
x2 r cos(1 + 2 ) cos(1 + 2 ) de azimute e de elevaca
o, constantes, o que permite fazer
y2 = r cos(1 + 2 ) sen(1 + 2 ) (12) 3 = 0 nas Eqs. (19), o que resulta em
z2 r sen(1 + 2 )

x3 r cos(1 + 3 ) cos(1 + 3 )
g3 =

3
y3 = r cos(1 + 3 ) sen(1 + 3 ) (13)
(20)
z3 r sen(1 + 3 )
g2 =

2
xP r cos(1 + ) cos(1 + )
g1 = 1 g 2 g 3 .
yP = r cos(1 + ) sen(1 + ) . (14)
zP r sen(1 + ) Assim, quando a geometria da grade de pontos o per-
Agora, considerando que as HRTFs medidas formam mite, a complexidade do calculo dos ponderadores gi e
um conjunto denso (i.e., foram medidas para pontos consideravelmente reduzida.
bastante proximos1 ), pode-se considerar que 2 , 3 ,
CONCLUSOES
2 , 3 , e sao pequenos. Sendo sen() e
cos() 1 para 0, podem-se obter as aproximaco es Neste artigo, deduziu-se uma formulaca o para o
para as coordenadas calculo dos ponderadores usados para geraca o de som
tridimensional utilizando-se HRTFs. Chegou-se a `s equa-
x2 r(cos 1 2 sen 1 )(cos 1 2 sen 1 ) coes dos ponderadores atraves da analogia com um
y2 r(cos 1 2 sen 1 )(sen 1 + 2 cos 1 )(15) sistema multicanal baseado em tres caixas ac usticas,
z2 r(sen 1 + 2 cos 1 ) chamado de Posicionamento por Variaca o de Amplitude
Baseado em Vetores (VBAP). Os resultados bem suce-
x3 r(cos 1 3 sen 1 )(cos 1 3 sen 1 ) didos do VBAP s ao conhecidos da literatura. Como a
y3 r(cos 1 3 sen 1 )(sen 1 + 3 cos 1 )(16)
interpolaca
o de HRTFs e simplesmente uma combinaca o
z3 r(sen 1 + 3 cos 1 ) linear de funcoes de transferencia medidas para pon-

xP r(cos 1 sen 1 )(cos 1 sen 1 ) tos sobre uma esfera, a formulaca o do VBAP pode ser
yP r(cos 1 sen 1 )(sen 1 + cos 1 ) . (17) reutilizada. Ja que ambos os metodos atuam sobre o
zP r(sen 1 + cos 1 ) mesmo tipo de funca o, a expectativa e de que os resul-
tados dos dois metodos sejam equivalentes. Alem da
Por fim, substituindo-se as Eqs. (11) e (15)(17) na
formulacao para o caso geral, citaram-se dois casos par-
Eq. (6), podem-se calcular os ponderadores gi em funca
o
ticulares de menor complexidade, aplic aveis na pr
atica.
das dist
ancias angulares:
Um dos casos particulares fora anteriormente aplicado,
2 2
sem demonstraca o, pelos autores em [6] a um metodo de
g3 =


2 3 3 2 interpolaca
o eficiente de HRTFs, com sucesso.
3 3 (18)

g2 =

2 3 3 2
REFERENCIAS

g1 = 1 g 2 g 3 . [1] D. R. Begault, 3D Sound for Virtual Reality and Mul-
1 Em [4], por exemplo, tem-se algo em torno de 700 posi
timedia. Cambridge, MA: Academic Press, 1994.
coes
distribudas de forma aproximadamente uniforme sobre a es- [2] J.-M. Jot, V. Larcher, and O. Warusfel, Digital sig-
fera de refer
encia. nal processing issues in the context of binaural and

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 4

36
FREELAND ET AL. INTERPOLAC DE HRTFS PARA GERAC
AO DE SOM 3D
AO

transaural stereophony, in Proc. 98th AES Conven-


tion, (Paris, France), AES, Feb. 1995. (Preprint
3980).
[3] C. I. Cheng and G. H. Wakefield, Introduction to
head-related transfer functions (HRTFs): Represen-
tations of HRTFs in time, frequency, and space, J.
Audio Eng. Soc., vol. 49, pp. 231249, Apr. 2001.
[4] B. Gardner and K. Martin, HRTF measurements
of a KEMAR dummy-head microphone, Technical
Report 280, MIT Media Lab., Cambridge, MA, May
1994.
[5] V. Pulkki, Virtual sound source positioning using
vector base amplitude panning, J. Audio Eng. Soc.,
vol. 45, pp. 456466, Jun. 1997.
[6] F. P. Freeland, L. W. P. Biscainho, and P. S. R.
Diniz, Efficient HRTF interpolation in 3d moving
sound, in The Proceedings of The AES 22nd Inter-
national Conference, (Espoo, Finland), pp. 106114,
AES, June 2002.

VIII CONVENC NACIONAL AES BRASIL, SAO


AO PAULO, SP, BRASIL, 7 - 9 DE JUNHO DE 2004 5

37
___________________________________
Sociedade de Engenharia de udio
Artigo de Conveno
Apresentado na VIII Conveno Nacional
7-9 de Junho de 2004, So Paulo, SP, Brasil

Este artigo foi reproduzido do original entregue pelo autor, sem edies, correes e consideraes feitas pelo comit tcnico
deste evento. Outros artigos podem ser adquiridos atravs da Audio Engineering Society, 60 East 42nd Street, New York, New
York 10165-2520, USA, www.aes.org. Informaes sobre a seo brasileira podem ser obtidas em www.aesbrasil.org. Todos os
direitos reservados. No permitida a reproduo total ou parcial deste artigo sem autorizao expressa da AES Brasil

___________________________________
Controle em Tempo Real da Temperatura da Bobina
e do Deslocamento do Cone de Alto-falantes
para Operao em Alta Potncia
Constncio Bortoni, Sidnei Noceti Filho, Rosalfonso Bortoni, Rui Seara
LINSE Laboratrio de Circuitos e Processamento de Sinais
Depto. de Engenharia Eltrica, Universidade Federal de Santa Catarina
88040-900, Florianpolis, Santa Catarina, Brasil
cbortoni@linse.ufsc.br

RESUMO
Este trabalho apresenta um procedimento de medida e controle digital de temperatura da bobina e deslocamento
do cone de alto-falantes para operao em alta potncia. O controle realizado em tempo real, usando para tal
um processador de sinal digital (DSP). As informaes de temperatura da bobina e de deslocamento do cone so
obtidas pela variao da resistncia para corrente contnua (DC) da bobina e atravs da medida de acelerao do
cone, respectivamente.

1. INTRODUO tambm da capacidade de dissipao de calor do


Alto-falantes so transdutores que convertem sinais sistema. O supequecimento da bobina uma das
eltricos em ondas sonoras. Entretanto, a maior parte principais razes de danos e falhas em alto-falantes.
da energia eltrica de excitao no transformada em Uma outra causa de danos irreversveis em
energia acstica. A eficincia de converso de energia alto-falantes o deslocamento excessivo do cone,
dos alto-falantes muito baixa, tipicamente de 1 a 5% alterando as caractersticas de funcionamento ou at
para sistemas de radiao direta e de 10 a 40% para mesmo levando completa paralisao de
sistemas tipo corneta [1]. funcionamento do alto-falante.
Para se obter altos nveis de presso sonora em Em [4]-[7] so apresentados alguns procedimentos
sistemas de radiao direta, deve-se aplicar altos nveis de medida de temperatura da bobina em alto-falantes.
de potncia eltrica, visto que cerca de 95 a 99% dessa Tais abordagens no consideram a medida de
potncia transformada em calor na bobina mvel do deslocamento do cone do alto-falante. Alm do mais,
alto-falante [2], [3]. Assim, quando aplicamos um sinal as abordagens [4]-[6] no usam a informao da
eltrico em um alto-falante, mesmo que sejam temperatura para o controle de potncia no alto-falante.
respeitados todos os valores mximos especificados Em [7], o sistema de controle de temperatura
pelo fabricante, pode-se causar um dano irreversvel efetuado considerando apenas o valor de potncia
devido ao excesso de temperatura em sua bobina. Na mximo, o que nem sempre muito eficaz como
realidade, para uma operao segura sob o ponto de anteriormente mencionado. Em [8], apresentada uma
vista trmico, apenas a informao da potncia mxima abordagem que faz uso de um processador de sinal
admitida no suficiente, pois a temperatura depende digital (DSP) para a medida de temperatura, porm no

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004

38
BORTONI, ET.AL. CTRTBDCAOAP

proposto um mtodo de controle de tal temperatura. Uma vez determinada a resistncia DC da bobina,
Em [9], [10] apresentado um sistema de medio e pode-se ento calcular a temperatura fazendo uso da
controle da temperatura e do deslocamento do cone. relao entre a variao da resistncia DC da bobina e
Tal sistema relativamente complexo e de alto custo a sua temperatura [11], atravs da expresso (1).
comercial. Nessa abordagem, o sistema de controle Assim,
estima os parmetros livres do modelo eletroacstico
estendido do alto-falante, considerando a escala de R (n) 1
T ( n ) = T ( n 1)+ 1 T ( n 1) 25 + (1)
operao segura, protegendo o alto-falante de R ( n 1)
superaquecimento da bobina e de deslocamento 25

excessivo do cone.
Este trabalho prope um sistema de controle em onde T (n) caracteriza a temperatura da bobina do
tempo real no qual a potncia fornecida ao alto-falante alto-falante no instante atual; T (n 1) a temperatura
limitada tanto pela temperatura da bobina quanto pelo no instante anterior ao atual; R (n) a resistncia DC
deslocamento do cone. Dessa forma, garantido o
rendimento mximo do sistema de sonorizao sem a da bobina do alto-falante no instante atual; R(n 1) a
necessidade de uso de grandes margens de segurana, resistncia DC no instante anterior ao atual; 25 o
que um procedimento muito empregado atualmente. coeficiente de temperatura do material do fio da bobina
A principal diferena entre as abordagens discutidas a 25 C.
em [9], [10] e a proposta, neste trabalho, reside A Fig. 2 mostra a curva de variao da resistncia
principalmente na simplicidade de concepo e no DC da bobina em funo da temperatura.
custo final de implementao.
11
2. DESCRIO DO MTODO
A abordagem em questo pode ser divida em duas
10
etapas, tais como:
Resistncia DC da Bobina ()

i) determinao da temperatura da bobina e do 9


deslocamento do cone do alto-falante;
ii) controle da temperatura da bobina e do 8
deslocamento do cone do alto-falante.
Para determinar a temperatura da bobina, utilizou-se 7

a relao direta de variao entre a resistncia para


6
corrente contnua (DC) da bobina e sua variao de
temperatura [6], [8], [11]. Para obter o deslocamento 5
do cone utilizado um acelermetro. 0 50 100 150 200 250 300
Temperatura na Bobina ( 0 C)
O modo para determinar a resistncia DC da bobina
atravs da medida da tenso e da corrente nos terminais Fig. 2 Curva da resistncia DC da bobina versus temperatura para o
alto-falante modelo 18SPW1P-p.
do alto-falante em condies normais de operao,
sendo esse excitado apenas pelo sinal de udio original.
Para obter o deslocamento do cone do alto-falante
A Fig. 1 ilustra o esquema utilizado para as medidas de
ns utilizamos um acelermetro. O acelermetro deve
tenso e corrente nos terminais do alto-falante.
ser colocado preferencialmente na calota protetora da
Sinal de bobina localizada no centro do alto-falante, pois
udio necessrio, para uma correta medida, que o
acelermetro esteja perpendicular ao movimento do
objeto para qual se quer obter o deslocamento. A
V superfcie que estar em contato com o acelermetro
deve ser a mais plana possvel.
O sinal obtido atravs do acelermetro representa a
I R
acelerao do cone. Para obter o deslocamento do
cone, necessrio que esse sinal seja integrado duas
Fig. 1 Esquema para determinar a tenso e a corrente nos terminais
vezes.
do alto-falante. O controle da temperatura da bobina e do
deslocamento do cone do alto-falante realizado
A resistncia DC calculada como sendo a parte real digitalmente atravs de um DSP. Esse controle atua
da impedncia do alto-falante. Essa impedncia sobre a amplitude do sinal de udio entregue ao
obtida atravs do quociente entre a tenso e a corrente alto-falante. A Fig. 3 mostra o diagrama em blocos do
medidas. sistema proposto.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004

39
BORTONI, ET.AL. CTRTBDCAOAP

Eletrnica Selenium S. A.), como tambm a respectiva


Sinal de resistncia DC de sua bobina.
udio
Processamento
160

140

Modelo da Impedncia ( )
Conversor 120

Fig. 3 Diagrama em blocos do sistema de controle. 100


Z
No bloco Conversor feito a aquisio dos dados, 80

que so: a acelerao do cone, e a tenso e corrente nos 60


terminais do alto-falante. Aps a aquisio, esses dados 40
so digitalizados e enviados ao bloco Processamento,
20 Re
onde efetuado o clculo da temperatura da bobina e
do deslocamento do cone. O bloco Processamento 0 0 1 2 3 4
tambm realiza o controle digital. 10 10 10 10 10
Freqncia ( Hz)
2.1. Determinao da resistncia DC da bobina do Fig. 4 Curva da resistncia DC da bobina para a temperatura de 24C
alto-falante e do mdulo da impedncia do alto-falante modelo 18SPW1P-p,
Devido impossibilidade de se obter diretamente a desconsiderando sua impedncia acstica.

resistncia DC do alto-falante, por limitao do 2.2. Controle de temperatura da bobina e


conversor A/D, necessrio se fazer uma aproximao deslocamento do cone do alto-falante
deste parmetro. Considera-se ento o mdulo da O sistema de controle de temperatura da bobina e de
impedncia da bobina, para uma freqncia abaixo de deslocamento do cone do alto-falante no deve causar
10 Hz, como sendo igual sua resistncia DC. alteraes audveis s caractersticas originais do sinal
A impedncia da bobina do alto-falante, discutida em reproduzido. O resultado tem que ser perceptualmente
[6], [12], [13], modelada por aceitvel, no comprometendo a capacidade do
Z = Re + Red + jL + Z EMA , (2) alto-falante em reproduzir sinais de alta potncia.
onde A Fig. 5 ilustra o esquema bsico de controle de
temperatura da bobina e deslocamento do cone do
Red = K rm E rm , (3)
alto-falante. Nesta estrutura, G denota o ganho do
L = K xm ( E xm 1) , (4) sinal de udio controlado pela temperatura da bobina,
e T ; L representa um limitador de deslocamento do
jLces cone, x ; AD representa o conversor analgico-digital;
Z EMA = .
j Lces (5) e DA o conversor digital-analgico.
(1 Lces cmes ) +
2

res
DSP
Em (2)-(5), Re representa a resistncia DC da Sinal de
udio AD G L
bobina; Red caracteriza as perdas devido s correntes DA

induzidas no entreferro do conjunto magntico, que so x


AD
dependentes da freqncia; L a indutncia da T
bobina, dependente tambm da freqncia; Z EMA
Fig. 5 Esquema bsico do controle de temperatura da bobina e
representa a resultante das impedncias refletidas do deslocamento do cone do alto-falante.
lado mecnico e acstico para o lado eltrico do
alto-falante; K e E so coeficientes obtidos a partir O presente trabalho sugere o controle de temperatura
da medio do mdulo e do ngulo de fase da da bobina levando em considerao as caractersticas
impedncia em duas freqncias distintas. Tais do alto-falante. Tal controle efetuado atravs de uma
coeficientes so geralmente fornecidos pelo fabricante caracterstica de ganho temporal que deve ser inversa
do alto-falante. Lces representa a complincia mecnica variao da temperatura da bobina relativa ao tempo.
O controle de temperatura feito atravs do controle
da suspenso do alto-falante; Cmes representa a massa
de ganho do sinal de udio que vai ser amplificado e
mvel do diafragma, incluindo a massa de ar, nos dois enviado ao alto-falante [14].
lados do cone, variando com a freqncia; res denota a Um exemplo ilustrativo da curva de variao de
resistncia da suspenso incluindo a resistncia de temperatura da bobina com a atuao do controle de
radiao do ar nos dois lados do cone. temperatura mostrado na Fig. 6. A Fig. 7 ilustra a
A Fig. 4 mostra a curva de mdulo da impedncia de respectiva curva de ganho para o controle de
um alto-falante (modelo 18SPW1P-p, fabricado pela temperatura da Fig. 6.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004

40
BORTONI, ET.AL. CTRTBDCAOAP

250
T2 temperatura em instantes sucessivos de tempo, entre T1
e T2 , so armazenados. Tais valores so interpolados,
200
Temperatura da Bobina ( C)

gerando uma curva de variao da temperatura entre os


0

T1

150
limiares T1 e T2 . Com auxlio dessa caracterstica,
uma curva de ganho versus tempo para o controle de
100
temperatura pode ser obtida. Tal curva deve ter uma
caracterstica inversa da curva de aumento de
50
temperatura com o tempo. Ela deve ser ajustada em
0 dB para os instantes de tempo em que a temperatura
0
t1 t2 t3 est situada entre T1 e T2 , e segue a expresso (6), que
0 50 100 150 200 250 300 350 400
Tempo (s) modela a caracterstica inversa da curva de temperatura
Fig. 6 - Exemplo de curva de variao da temperatura da bobina com a funo do tempo, para os instantes referentes ao
atuao do controle de temperatura. intervalo de temperatura entre T2 e T1 .
Ta(n)
0 G (n) = 20 log , (6)
Ta(n 1)
-0,5
onde G (n) representa o ganho entre T2 e T1 , e Ta(n)
-1,0
e Ta(n 1) denotam a temperatura armazenada no
Ganho (dB)

-1,5 instante atual e anterior, respectivamente, considerando


o intervalo entre T1 e T2 .
-2,0
O controle do deslocamento do cone, como mostrado
-2,5 na Fig. 5, feito atravs de um limitador de
t2 t3 deslocamento. O limite dado como uma porcentagem
-3,0
0 50 100 150 200 250 300 350 400 do deslocamento mximo do cone, fornecido pelo
Tempo (s)
fabricante do alto-falante. Assim, o deslocamento do
Fig. 7 - Curva de ganho para o controle da temperatura.
cone est mantido dentro dos limites dado pelo
Observando a Fig. 6, verifica-se que a curva de fabricante.
variao de temperatura da bobina dependente no s Como o deslocamento do cone e a potncia entregue
da potncia aplicada como tambm do tempo. Assim, ao alto-falante so obtidos em tempo real, programa-se
para uma dada potncia constante aplicada ao que quando o deslocamento do cone for maior do que o
alto-falante, mede-se no instante t1 a temperatura da limite pr-definido, pela primeira vez, esse valor de
potncia ento armazenado. Dessa forma, quando o
bobina, que T1 . Mantida a potncia, em um segundo deslocamento do cone tender a ser maior do que tal
instante t 2 , a temperatura da bobina ser T2 , sendo limite, a potncia entregue ao alto-falante ser limitada
maior do que T1 . Considerando agora T1 e T2 como ao valor da potncia armazenada, evitando, assim, que
o alto-falante seja danificado.
limiares inferior e superior, respectivamente, pode-se
fazer atuar o controle para estes nveis de temperatura. 3. RESULTADO DE SIMULAES
Dessa forma, uma vez que seja acionado o controle de Para avaliar o funcionamento dos sistemas de
temperatura em T2 , uma reduo de temperatura se controle de temperatura da bobina e deslocamento do
inicia, decrescendo a temperatura para o nvel T1 , no cone do alto-falante, so realizadas simulaes
instante t 3 . Cessada a atuao do controle no instante considerando o uso de modelos lineares tanto para o
deslocamento do cone quanto para o modelo trmico
t 3 , o processo de aumento da temperatura reiniciado, do alto-falante [1], [13].
e um novo ciclo tem origem, conforme mostrado na Os dados usados nas simulaes so os de um
Fig. 6. As temperaturas T1 e T2 so pr-determinadas alto-falante profissional tpico. So considerados o
na fase de projeto do sistema de controle, sendo efeito do aumento da resistncia DC da bobina com a
T1 < T2 , e T2 dependente da temperatura mxima da temperatura, um deslocamento mximo do cone de
bobina. A Fig. 7 ilustra a variao de ganho (com 12 mm, e os limiares de temperatura inferior
conseqente variao de potncia), visando o controle T1 = 110 DC e superior T2 = 120 DC .
de temperatura da bobina. A Fig. 8 ilustra a atuao do sistema de controle de
A partir do instante que a temperatura da bobina temperatura da bobina e as Figs. 9 e 10, a atuao do
maior do que a temperatura T1 , os valores de sistema de controle de deslocamento do cone, ambos

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004

41
BORTONI, ET.AL. CTRTBDCAOAP

operando separadamente. A Fig. 9 mostra a potncia


entregue ao alto-falante e o correspondente
deslocamento do cone sem considerar a atuao do 200

controle, e a Fig. 10 mostra os mesmos parmetros com 150


o sistema de controle atuando.

Potncia (W)
Aps a simulao dos sistemas de controle em 100

separado, realizamos uma simulao considerando a 50

atuao simultnea de ambos os sistemas de controle


0
(Fig. 11). Assim, pode-se inferir dos resultados obtidos 200
150 200
via simulao numrica a eficcia do sistema de 100 150
Te 100
controle quando implementado com um processador de mp
o (s
)
50 50 n cia
(Hz )
0 0 Fre q
sinais digital.
(a)
140

120 0.02

Deslocamento do cone (m)


0.015
Temperatura ( 0 C)

100
0.01
80
0.005

60 0
200
150 200
40 100 150
Te 100
mp
o( 50 50 (Hz)
s) ncia
0 0 Freq
20
0 100 200 300 400 500 600
Tempo (s) (b)
(a) Fig. 9 Desconsiderando o sistema de controle para o deslocamento
90 do cone. (a) Curva da potncia entregue ao alto-falante; (b) curva do
deslocamento do cone.
85

80

75
Potncia (W)

200
70
150
65
Potncia (W)

100
60

55 50

50 0
200
45 150 200
0 100 200 300 400 500 600 100 150
Te 100
Tempo (s) mp
o( 50 (Hz)
s) 50 ncia
0 0 Freq
(b)

0 (a)

0,5
0.02
Deslocamento do cone (m)

1,0
Ganho (dB)

0.015

1,5 0.01

2,0 0.005

0
2,5 200
150 200
100 150
Te 100
3,0 mp
o( 50 50 (Hz)
0 100 200 300 400 500 600 s) ncia
0 0 Freq
Tempo (s)
(c) (b)
Fig. 8 - Atuao do sistema de controle de temperatura. (a) Curva da Fig. 10 Atuao do sistema de controle para o deslocamento do
temperatura; (b) curva da potncia entregue ao alto-falante; (c) curva cone. (a) Curva da potncia entregue ao alto-falante; (b) curva do
do ganho para o controle de temperatura. deslocamento do cone.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004

42
BORTONI, ET.AL. CTRTBDCAOAP

5. AGRADECIMENTOS
Agradecemos ao Eng. Walter Antnio Gontijo pela
0.012
ajuda referente a parte digital deste trabalho e ao
Eng. Homero Sette Silva pelas muitas discusses
Deslocamento do Cone (m)

0.01

0.008 envolvendo o presente trabalho, como tambm alguns


0.006 esclarecimentos sobre alto-falantes.
0.004

0.002 6. REFERNCIAS BIBLIOGRFICAS


0 [1] C. Zuccatti, Thermal Parameters and Power Ratings of
600
200
Loudspeakers, J Audio Eng. Soc., vol. 38, no. 1/2, pp.
400
Te 100
150 34-39, Janeiro/Fevereiro 1990.
mp 200
o( 50 (Hz) [2] D. J. Button, Heat Dissipation and Power Compression
s) ncia
0 0 Freq
in Loudspeakers, J Audio Eng. Soc., vol. 40, no. 1/2,
(a) pp. 32-41, Janeiro/Fevereiro 1992.
[3] P. J. Chapman, Thermal Simulation of Loudspeakers,
104th AES Convention, AES Preprint no. 4667, 1998.
[4] M. Buck, Measuring Loudspeakers Voicecoil
100 Temperature, 106th AES Convention, AES Preprint no.
90 4969, 1999.
80 [5] C. A. Henricksen, Heat-Transfer n Loudspeakers:
Potncia (W)

70
Analysis, Measurement, and Design, J Audio Eng.
60
Soc., vol. 35, no. 10, pp. 778-791, Outubro 1987.
50
[6] H. S. Silva, O Alto-falante em Regime de Grandes
40
Sinais, 1 SEMEA - Seminrio de Engenharia de
600 udio, Belo Horizonte, MG, CD-ROM, Junho 2002.
200
400
150 [7] G. Penkov e P. Valtchev, Overheat Protection Circuits
Te
mp
o(
200
50
100
(Hz) for Moving-Coil Loudspeakers, 90th AES Convention,
s) ncia
Freq
0 0 AES Preprint no. 3036, 1991.
(b)
[8] I. G. Behler, Measuring the Loudspeakers Impedance
During Operation for the Derivation of the Voice Coil
Temperature, 98th AES Convention, AES Preprint no.
4001, 1995.
150
[9] W. Klippel, Measurement of Large-Signal Parameters
of Electrodynamic Transducer, 107th AES Convention,
Temperatura da bobina( C)

AES Preprint no. 5008, 1999.


100
[10] W. Klippel, Nonlinear Adaptive Controller for
Loudspeakers with Current Sensor, 106th AES
50
Convention, AES Preprint no. 4864, 1999.
[11] H. S. Silva, Variao da Resistncia da Bobina Mvel
0
600 em Funo da Temperatura, 1 SEMEA - Seminrio de
400
150
200 Engenharia de udio, Belo Horizonte, MG, CD-ROM,
Te
mp 200 100 Junho 2002.
o(s 50 (Hz)
ncia
)
0 0 Freq [12] J. R. Wright, An Empirical Model for Loudspeakers
Motor Impedance, J Audio Eng. Soc., vol. 38, no. 10,
(c) pp. 749-754, Outubro 1990.
Fig. 11 Atuao simultnea de ambos os controles. (a) Curva do [13] H. S. Silva, Modelo no Linear do Alto-Falante para
deslocamento do cone; (b) curva da potncia entregue ao alto-falante; Pequenos Sinais, 1 SEMEA - Seminrio de
(c) curva da temperatura da bobina.
Engenharia de udio, Belo Horizonte, MG, CD-ROM,
Junho 2002.
4. CONCLUSES [14] P. Chapman, Complete Protection of an Active
Este artigo prope um sistema de controle de Loudspeaker, 108th AES Convention, AES Preprint no.
temperatura da bobina mvel e de deslocamento do 5112, 2000.
cone de alto-falantes para operao em sistemas de
sonorizao de alta potncia, visando uma maior
eficcia de controle e o mximo aproveitamento do
sistema. A abordagem proposta usando DSP
mostrou-se eficaz, sendo relativamente simples e de
baixo custo de implementao.

VIII CONVENO NACIONAL AES BRASIL, SO PAULO, SP, BRASIL, 7-9 DE JUNHO DE 2004

43
Projeto e produo do CD
fo n e / f a x : ( 4 8 ) 2 3 2 . 1 3 5 7
44
clicdata@clicdata.com.br

w w w. c l i c d a t a . c o m . b r

Você também pode gostar