Você está na página 1de 6

Acta Otorrinolaringol Esp 2004; 55: 282-287

INVESTIGACIN BSICA

EVALUACIN PERCEPTUAL DE LA DISFONA: CORRELACIN CON LOS PARMETROS ACSTICOS Y FIABILIDAD


F. NEZ BATALLA1, P. CORTE SANTOS2, G. SEQUEIROS SANTIAGO1, B. SEARIS GONZLEZ1, C. SUREZ NIETO1
1

SERVICIO

DE

OTORRINOLARINGOLOGA

DEL

HOSPITAL UNIVERSITARIO CENTRAL


DEL

DE

ASTURIAS. OVIEDO. 2UNIDAD

DE

FONIATRA

HOSPITAL CABUEES

DE

GIJN.

RESUMEN
l anlisis de la calidad vocal mediante la escala perceptual GRBAS tiene importancia clnica para las voces que no pueden ser estudiadas mediante la determinacin de sus parmetros acsticos tales como las vocalizaciones con fuertes subarmnicos y modulaciones y las voces caticas o aperidicas. En el presente estudio se realizaron dos experimentos: Primero, se investig la correlacin entre los parmetros acsticos y la escala

GRBAS en 107 voces patolgicas. Segundo, la coincidencia intra e interobservador del GRBAS. La severidad de la disfona se correlacion con parmetros relacionados con la voz area y con frecuencias fundamentales bajas. La presencia de subarmnicos en el espectrograma no mostr una relacin significativa con el grado de aspereza. La fiabilidad intra e interobservador del sistema GRBAS es alta.

PALABRAS CLAVE: Evaluacin perceptual de la voz. Disfona. Ronquera. Fiabilidad.

ABSTRACT
PERCEPTUAL EVALUATION OF DYSPHONIA: CORRELATION WITH ACOUSTIC PARAMETERS AND RELIABILITY
he perceptual GRBAS scale for analysis of voice quality is quite important clinically in voices that cannot be effectively analyzed with a voicing parameter method like vocalizations with strong subharmonics and modulations and in chaotic or random voices. In the present study, two experiments were performed: Firstly, GRBAS/acoustical correlations were investigated in 107 pathological voices. Secondly, the GRBAS interrater

and intrarater agreement. The severity of dysphonia was assesed better by breath related parameters and low fundamental frequencies. The presence of subharmonics in the power spectrum had not a significant relationship with the degree of roughness. A (asthenic) and S (strain) scales. The results of this study show that GRBAS test-retest reliability and intrerrater agreement is high.

KEY WORDS: Perceptual voice evaluation. Dysphonia. Hoarseness. Reliability. Correspondencia: Faustino Nez Batalla. C/ Las Mazas 40-6. 33191 Oviedo. E-mail: fnunezb@seorl.net Fecha de recepcin: 9-2-2004 Fecha de aceptacin: 30-3-2004

282

Acta Otorrinolaringol Esp 2004; 55: 282-287

ACTA OTORRINOLARINGOLGICA ESPAOLA

INTRODUCCIN
La evaluacin perceptual es fundamental para valorar la calidad de la voz, la gravedad global de los defectos y su impacto en la comunicacin del sujeto. No obstante, es uno de los temas ms controvertidos de la evaluacin vocal porque existe una pobre correlacin entre los evaluadores. En la literatura existen una variedad de escalas y los datos de fiabilidad varan de estudio a estudio. Existen mltiples factores que contribuyen a este fenmeno 1-4 : Primero, no existe una adecuada terminologa aceptada internacionalmente para la descripcin de la calidad vocal5. El mtodo que en la actualidad se est empleando de forma generalizada es el de la Sociedad Japonesa de Logopedas y Foniatras gracias a su publicacin por Hirano en su libro Clinical Examination of the Voice6. Segundo, la diferencia en las estrategias perceptuales entre observadores7. La mayora de las tareas de percepcin incluye la comparacin de la voz con estndares internos que tienen la desventaja de ser inestables y fluctuar con lo que causan variablidad en la calificacin. Tercero, la fiabilidad interobservador se influencia por aspectos metodolgicos como los tipos de escala, tipos de muestra y observador. Actualmente, la investigacin en este tema da importancia al entrenamiento y experiencia. Respecto a los efectos del entrenamiento y lengua en la percepcin de la disfona, se encontraron pequeas diferencias no significativas a favor de los observadores entrenados y no encontraron influencia de la segunda8. Otro estudio9 demostr que los observadores experimentados juzgan de forma ms consistente que los inexpertos y usan diferentes estrategias perceptuales9: los expertos consiguen menos coincidencias con otros respecto a la importancia relativa de varios aspectos de la calidad vocal. Se ha determinado que 8 horas de entrenamiento de observadores previamente inexpertos son suficientes para obtener un 80% de fiabilidad interobservador usando un sistema de calificacin perceptual de 13 dimensiones4. Con respecto a la escala GRBAS se ha demostrado que su reproductividad es alta si se seleccionan los observadores mostrando una baja variabilidad intra e interobservador y una alta variabilidad intermuestra10,11. Los parmetros acsticos que han sido correlacionados con los perceptuales del sistema GRBAS utilizando el Multidimensional Voice Program12 son el Jitter con el parmetro R, el Shimmer con el parmetro B y HNR (relacin armnico-ruido) con el parmetro G, hacen tambin mencin a otros pa-

rmetros relacionados como los subarmnicos con la dipofona y el parmetro R, el temblor y las perturbaciones a largo plazo de la F0 y la amplitud para introducir un nuevo parmetro en la escala que describe la inestabilidad (I) de la voz. En el presente trabajo se correlacionaron los parmetros del sistema GRBAS con parmetros de perturbacin a corto plazo, medidas del ruido gltico, parmetros espectrogrficos y se analiz su reproductividad comparando las puntuaciones de dos observadores.

MATERIAL Y MTODOS
Se estudiaron de forma retrospectiva un total de 107 muestras de voz correspondientes a otros tantos pacientes, 29 hombres y 78 mujeres, diagnosticados mediante videoestroboscopia de edema de Reinke. Dichas muestras de voz estn digitalizadas y se encuentran recogidas en soporte magntico. Anlisis Perceptivo de la Voz (GRBAS) Mediante la reproduccin sonora de cada muestra vocal se calific conjuntamente por dos profesionales con experiencia en patologa vocal utilizando el mtodo GRBAS calificando cada uno de los siguientes tems de 0 a 3 (0 = normal, 1 = leve , 2 = moderado, 3: severo): G (Grado), el grado global de afectacin vocal. R (Roughness, Aspereza), la calidad de la voz relacionada con la impresin de pulsos glticos irregulares, de un componente de ruido de baja frecuencia, de aspereza o vocal fry. B (Breathiness, voz area), la voz relacionada con el ruido originado por las turbulencias creadas por una glotis insuficiente. A (Astenia), la impresin auditiva de debilidad en la fonacin espontnea. Voz hipocintica o hipofuncional. S (Strain, tensin vocal), la impresin auditiva de excesivo esfuerzo, de tensin asociada con la fonacin espontnea. Este anlisis se repiti de forma independiente por los dos observadores 6 meses despus de la primera valoracin con el fin de comparar la conjunta inicial con las dos valoraciones independientes posteriores. Anlisis Acstico y Espectrogrfico La seal acstica se registr mediante el uso de la aplicacin Voice Assessment del programa Dr Speech 3.0 para Windows 95. El ordenador utilizado fue un PC compatible Pentium-100 con una memoria RAM de 16 Mb. Para la digitalizacin de

Acta Otorrinolaringol Esp 2004; 55: 282-287

283

F. NEZ BATALLA ET AL. EVALUACIN PERCEPTUAL DE LA DISFONA

la seal vocal se instal una tarjeta de sonido compatible con Windows de 16-bit de resolucin y frecuencias de registro de 44100 (Sound Blaster 16). El micrfono es unidireccional dinmico. La frecuencia de muestreo fue de 44.100 Hz y se utiliz un micrfono de alta resolucin frecuencial que se coloc a 10 cm de la boca del paciente mientras realizaba la fonacin de una vocal /e/ a intensidad y tonos cmodos en una cmara sonoamortiguada. De la emisin el ordenador capta 3 segundos. Se siguieron las recomendaciones del National Center for Voice and Speech13. Los parmetros analizados en esta fase son: La frecuencia fundamental (F0). Jitter o perturbacin en la frecuencia. Shimmer o perturbacin en la amplitud. NNE o energa de ruido normalizado5. HNR, Harmonic-to-Noise Ratio, relacin armnicoruido. La aplicacin para realizar espectrogramas se denomina Speech Analysis y dentro de ella hay que configurar en el "Spectrogram Setting" el ancho de banda adecuado para la espectrografa de banda estrecha, que es de 45 Hz, ya que por defecto configura el de 300 Hz (banda ancha). Analizamos la vocal /ae/ sostenida a un tono e intensidad confortables para el sujeto durante un perodo de 3 segundos teniendo en cuenta la clasificacin de Yanagihara, la presencia de subarmnicos y la desaparicin de armnicos en el espectro. Anlisis Estadstico de los Resultados Con el conjunto de los resultados se construy una base de datos con la aplicacin Microsoft Access del paquete Microsoft Office 2000 que posteriormente se import al programa SPSS 9.0 para Windows. Dado que se estn analizando por una parte variables dependientes y un conjunto de una o ms variables independientes cuantitativas o cualitativas, el mtodo estadstico elegido fue la regresin logstica, que consiste en obtener una funcin lineal de las variables independientes que permita clasificar a los individuos en una de las dos subpoblaciones o grupos establecidos por los valores de la variable independiente (Jitter, Shimmer, HNR, NNE, Clasificacin de Yanagihara, Subarmnicos, Falta de Armnicos). La comparacin de las puntuaciones GRBAS conjunta con las dos independientes se efectu usando las tablas de contingencia y las siguientes medidas de asociacin: La prueba Ji-cuadrado de Pearson en tablas de contingencia. Razn de verosimilitud Ji-cuadrado. El coeficiente Phi. Coeficiente de contingencia y la V de Cramer.

Tabla 1: Porcentaje de pacientes clasificado en cada grado de severidad de los parmetros perceptuales del sistema GRBAS
0 G R B A S 0,9% 4,7% 9,3% 48,6% 41,1% 1 32,7% 47,7% 44,9% 25,2% 38,3% 2 54,2% 35,5% 34,6% 23,4% 16,8% 3 12,1% 12,1% 11,2% 2,8% 3,7%

RESULTADOS
Clasificacin GRBAS: En la tabla 1 se resumen los porcentajes de pacientes que fueron clasificados en los distintos grados de severidad de las variables. Espectrografa de banda estrecha: El 43% de los pacientes fueron clasificados como grado 1 de Yanagihara, el 25,2% como grado 2, el 24,3% como grado 3 y el 7,5% como grado 4. El 39,3% present subarmnicos y el 37,4% falta de armnicos en las frecuencias altas del espectro. Regresin logstica: La significacin estadstica alcanzada en cada variable dependiente se resume en la tabla 2. 1. Variable dependiente G (Grado): Variables independientes: Jitter, Shimmer, HNR, NNE, Yanagihara, Subarm, Falta de Armnicos. El clculo de la funcin G a partir de las variables seleccionadas ser: G=0,1537NNE-0,1070HNR-0,0133FO+6,1055

Tabla 2: Significacin estadstica (p) alcanzada por cada parmetro acstico que entra en la ecuacin que predice el valor de las variables del sistema GRBAS
Jitt G R B A S 0,058 0,004 0,002 Shim HNR NNE F0 0,013 0,026 0,000 0,004 0,000 0,000 Yana Subar Falta

0,049 0,04 0,011

284

Acta Otorrinolaringol Esp 2004; 55: 282-287

ACTA OTORRINOLARINGOLGICA ESPAOLA

Tabla 3: Valores de p (Ji-cuadrado de Pearson) en el estudio que compara las puntuaciones de ambos observadores de forma conjunta con las puntuaciones de los observadores de forma individual seis meses despus
Observador 1 G conjunto vs G individual R conjunto vs R individual B conjunto vs B individual A conjunto vs A individual S conjunto vs S individual 0,000 0,000 0,000 0,000 0,002 Observador 2 0,000 0,000 0,000 0,000 0,003

significacin estadstica (p<0,05) en las pruebas de Ji-cuadrado de Pearson, Razn de verosimilitud, Coeficiente Phi, V de Cramer y Coeficiente de Contingencia en todas las comparaciones. En la tabla 3 se resumen los valores de p de Ji-cuadrado.

DISCUSIN
El National Center for Voice and Speech (www.ncvs.org) recomend que la evaluacin de la voz patolgica debe comenzar con la realizacin de un anlisis espectrogrfico para clasificarla con el fin de determinar los mtodos de estudio ms idneos para ese caso en particular. As, una voz con el suficiente grado de periodicidad (tipo 1) debera ser analizada por medio de los parmetros de perturbacin a corto plazo (jitter, shimmer, NNE y HNR). Si la voz presenta aperiodicidad, subarmnicos y roturas de voz (tipo 2) no puede ser analizada de forma fiable con los parmetros antes mencionados, una perturbacin mayor del 5% nos indica que estamos ante una voz de este tipo, que debe ser estudiada por un mtodo de clasificacin perceptual (GRBAS) y por un mtodo visual como el espectrograma. Las voces caticas (tipo 3) slo pueden ser estudiadas por el momento mediante mtodos perceptuales, en tanto no se apliquen de forma prctica las dimensiones que estudian los fenmenos caticos (dimensin fractal, exponente de Lyapunov, etc). Por tanto, la clasificacin GRBAS es un mtodo imprescindible para la valoracin de la voz patolgica, dado que es necesario aplicarla en un importante nmero de pacientes en los cuales las medidas de la perturbacin a corto plazo no son fiables o no se pueden calcular. Nuestro estudio se centr en averiguar las variables que determinan que un observador clasifique una voz en los distintos grados de severidad de la clasificacin GRBAS y su fiabilidad inter e intraobservador. La regresin logstica empleada permite crear una ecuacin en la que se representan las variables que influyen en cada parmetro. El parmetro G est definido por la ecuacin: G=0,1537NNE-0,1070HNR-0,133FO+6,1055 Las medidas acsticas de la disfona basadas en la importancia o severidad de la sustitucin de la estructura armnica por componentes de ruido tpicamente se han correlacionado muy bien con las graduaciones perceptuales. El grado de severidad de la disfona se ha correlacionado con la re-

2. Variable dependiente R (Aspereza): Variables independientes: Jitter, Shimmer, HNR, NNE, Yanagihara, Subarm, Falta de Armnicos. El clculo de la funcin R a partir de las variables seleccionadas ser: R=-0,0992HNR+0,6073Yanagihara+0,7039 3. Variable dependiente B (Voz area): Variables independientes: Jitter, Shimmer, HNR, NNE, Yanagihara, Subarm, Falta de Armnicos. El clculo de la funcin B a partir de las variables seleccionadas ser: B=-0,4016Jitter+0,3554NNE+1,7471 4. Variable dependiente A (Astenia): Variables independientes: Jitter, Shimmer, HNR, NNE, Yanagihara, Subarm, Falta de Armnicos. El clculo de la funcin A a partir de las variables seleccionadas ser: A=0,36FaltaArm+0,21Yanahihara-0,24Jitter-2,47 5. Variable dependiente S (Tensin): Variables independientes: Jitter, Shimmer, HNR, NNE, Yanagihara, Subarm, Falta de Armnicos. El clculo de la funcin S a partir de las variables seleccionadas ser: S=-0,31FaltadeArm-4,00E-03FO+1,94 Tablas de Contingencia (Comparacin entre las puntuaciones GRBAS): Se comparan las puntuaciones GRBAS obtenidas de forma conjunta por los dos observadores con las puntuaciones GRBAS obtenidas de forma independiente por cada observador 6 meses despus. Se alcanza

Acta Otorrinolaringol Esp 2004; 55: 282-287

285

F. NEZ BATALLA ET AL. EVALUACIN PERCEPTUAL DE LA DISFONA

lacin seal-ruido (HNR) por varios estudios 14,15. Sin embargo, para otros autores16 la severidad percibida de una disfona se correlaciona con el shimmer, hallazgo que no encontramos en nuestro estudio. Dado que los gneros masculino y femenino presentan un solapamiento de las frecuencias fundamentales (FO) y dado que la FO se correlaciona con la percepcin de la calidad de la voz17 se decidi incluir en la serie tanto hombres como mujeres. Kojima y Yumoto14,15 estudiando los parmetros acsticos que se correlacionan con la escala GRBAS observaron en una serie de pacientes, en los que los masculinos doblaban en nmero a los femeninos, que la HNR se correlaciona bien con la severidad de la disfona en voces con FO bajas, y que dicha correlacin podra contener un sesgo a favor de calificar en grados ms severos aquellas voces ms graves en frecuencia. En la presente serie se observa una relacin de masculino:femenino de 1:3 por lo que esta afirmacin puede descartarse, al menos en nuestro estudio. El parmetro R (Voz spera) se define por la ecuacin: Z=0,6073Yanagihara-0,0992HNR+0,7039

la presencia de subarmnicos y la percepcin de diplofona o voz spera. El parmetro B (Voz area) se define por la frmula B=0,3554NNE-0,4016Jitter+1,7471 Lo que es consistente con las observaciones de otros autores que correlacionan la calidad area de la voz con los bajos HNR combinados con menor Jitter y mayor Shimmer, quienes ya advirtieron la paradoja de encontrar, cuando se asocia a HNR un jitter bajo correlacionndose con grados mayores de severidad21. Otros autores relacionan el jitter con la severidad de la B22. La variable A (Voz astnica) se define por la ecuacin A=0,36FaltaArm+0,21Yanagihara-0,24Jitter-2,47 Donde se observa la relacin de la percepcin de la voz astnica con la mayor puntuacin en la clasificacin espectrogrfica de "falta de armnicos". El parmetro S (Voz tensa) se define por la ecuacin: S=-0,31FaltadeArm-4,00E-03FO+1,94

Se ha relacionado el jitter con la aspereza18. En el estudio de Martin21, para las voces speras el HNR es el responsable del 73% de la variacin perceptual. Eskenazi et al19 han encontrado que la HNR junto con la SFR (spectral flatness of the residue signal) predicen con xito la aspereza, en contraste con otras medidas ms especficas de perturbacin como el % jitter, el PPQ (pitch perturbation quotient) y el APQ (amplitude perturbation quotient). La SFR, representa los mismos fenmenos en el espectrograma LTAS (Long term average spectrum) en el dominio amplitud vs frecuencia que la clasificacin de Yanagihara en el espectrograma de banda estrecha o sonograma frecuencia versus tiempo. En este punto hay que resaltar la nula influencia estadstica de los subarmnicos en la percepcin de aspereza en la voz. La explicacin de este hallazgo es interesante: la energa relativa de los trazados subarmnicos determina la percepcin acstica de los mismos, mientras no se alcance una intensidad cercana a los trazados armnicos se percibir aspereza. Si la intensidad de los mismos alcanza valores cercanos a los armnicos se deja de percibir la aspereza para cambiar el tono o intensidad de la voz. Este hallazgo puede tener relacin con otras observaciones20 que se han hecho acerca de la posible independencia de

Es decir, la variable "Falta de armnicos" es inversamente proporcional a la percepcin de tensin vocal, propia de los comportamientos vocales de hiperfuncin. Con respecto a la escala GRBAS se ha demostrado que su reproductividad es alta si se seleccionan los observadores mostrando una baja variabilidad intra e interobservador y una alta variabilidad intermuestra10,11. El parmetro ms consistente es la G y los menos son la A y la S, pero todava muestran una correlacin significativa. El parmetro G parece estar determinado principalmente por el componente areo de la voz. La aspereza y la calidad area se correlacionan negativamente entre ellas 11. Los resultados del presente trabajo son compatibles con las observaciones ya descritas en la literatura que hacen referencia a la alta fiabilidad del sistema de calificacin de la disfona GRBAS que mejora sustancialmente con el entrenamiento.

CONCLUSIONES
1. La disfona que acompaa al edema de Reinke presenta seales sin una estructura peridica aparente (tipo 3) en el 7,5% de los casos. La

286

Acta Otorrinolaringol Esp 2004; 55: 282-287

ACTA OTORRINOLARINGOLGICA ESPAOLA

valoracin perceptual o psicoacstica de la voz, sistematizada de forma prctica por el mtodo GRBAS, debe ser includa siempre en el estudio de la disfona ya que en ciertas voces va a ser el nico medio fiable de evaluacin. 2. La severidad global de una voz patolgica se determina por un tono grave acompaado de turbulencias areas en forma de ruido audible.

3. La presencia de subarmnicos no siempre acompaa a la voz spera o diplofnica. 4. Los parmetros relacionados con el comportamiento vocal (A y S) se correlacionan con la distribucin de energa armnica en el espectro. 5. El sistema GRBAS tiene una buena reproductibilidad intra e interobservador.

REFERENCIAS
1.- De Bodt MS, Wuyts FL, Van de Heyning PH, Croux C. Test-rests study if the GRBAS scales: Influence of experience and professional background on perceptual rating of voice quality. Journal of Voice 1997; 11: 74-80. 2.- Kreiman J, Geratt BR, Kempster GB. Perceptual evaluation of voice quality: review, tutorial, and a framework for future research. J Speech Hear Res 1993; 36: 21-40. 3.- Blaustein S, Asher B. Reliability of perceptual voice assessment. J Commun Disord 1983; 16: 157-161. 4.- Fex S. Perceptual evaluation. J Voice 1992; 6: 155-158. 5.- Hammarberg B. Pathological voice qualities. Perceptual and acoustic characteristics of a set of swedish "reference" voices. Bull Audiophonology 1992; 8: 39-52. 6.- Hirano M. Clinical examination of the voice. New York: Springer Verlag, 1981: 81-84. 7.- Kreiman J, Geratt BR, Precoda K, Berke GS. Individual differences en voice quality perception . J Speech Hear Res 1992; 35: 512-520. 8.- Anders LC, Hollien H, Hurme P, Soninnen A, Wendler J. Perception of hoarseness by several classes of listeners. Folia Phoniatrica 1988; 40: 91-100. 9.- Kreiman J, Geratt BR, Precoda K. Listener experience and perception of voice quality. J Speech Hear Res 1990; 33: 103-115. 10.- Abe H, Yonekawa H, Ohtq F. Reproducibility of hoarse voice psychoacoustic evaluation. Jpn J Logop Phoniatr 1986; 27: 168-177. 11.- Dejonckere PH, Obbens C, de Moor GM, Wienke GH. Perceptual evaluation of dysphonia: reliability and relavance. Folia Phoniatr 1993; 45: 76-83. 12.- Dejonckere PH, Remacle M, Fresnel-Elbaz E, Woisard V, Crevier-Buchman L, Millet B. Differentiated perceptual qvaluation of pathological voice quality: reliability and correlations with acoustic measurements. 13.- Titze IR. National Center for Voice and Speech. Workshop on Acoustic Voice Analysis. Summary Statement, Denver, 1994. 14.- Kojima H, Gould W, Lambiase A, Isshiki N. Computer analysis of hoarseness. Acta Otolaryngologica 1980; 89: 547-554. 15.- Yumoto E, Sasaki Y, Okamura H. Harmonics-to-noise ratio and phychophysical measurement of the degree of hoarseness. Journal of Speech and Hearing Research 1984; 27: 2-6. 16.- Wolfe V, Fitch J, Cornell R. Acoustic correlates of dysphonia in commonly occurring voice problems. Journal of Speech and Hearing Research 1995; 38: 273-279. 17.- Wolfe V, Cornell R, Palmer P. Acoustic correlates of pathologic voice types. Journal of Speech and Hearing Research 1991; 34: 509516. 18.- Deal R, Emmanuel F. Pitch effects on vowel roughness and spectral noise. Journal of phonetics 1978; 21: 250-264. 19.- Eskenazi L, Childers DG, Hicks DM. Acoustic correlates of vocal quality. Journal of Speech and Hearing Research 1990; 33: 298-306. 20.- Cavalli L, Hirson A. Diplophonia reappraised. Journal of Voice 1999; 13: 542-556. 21.- Martin D, Fitch J, Wolfe V. Pathologic voice type and the acoustic prediction of severity. Journal of speech and Hearing Research 1995; 38: 765-771. 22.- Millet B, Dejonkere PH. What determines the differences in perceptual rating of dysphonia between experienced raters? Folia Phoniatr Logop 1998; 50: 305-310.

Acta Otorrinolaringol Esp 2004; 55: 282-287

287

Você também pode gostar