Escolar Documentos
Profissional Documentos
Cultura Documentos
I. INTRODUCCIN
Las tcnicas ms conocidas para el reconocimiento de
voz son tcnicas lineales basadas en la transformada de
Fourier. En este artculo se explora la posibilidad de hacer
reconocimiento de fonemas basandose en un mtodo no
lineal el el que se caracterizan sonidos, especficamente los
sonidos voclicos (a, e, i, o, u).
En el odo humano se realizan los procesos de recepcin
y transduccin del sonido, enviando la seal resultante por
el nervio auditivo, antes de que el cerebro permita la
percepcin del sonido. Dentro de la cclea ocurren
fenmenos fsicos, qumicos y elctricos que constituyen
un paso inicial en la percepcin del sonido. La cclea
presenta un comportamiento impredecible con un modelo
lineal, que se quiere modelar aproximadamente con la meta
de hacer reconocimiento de voz, as, se pretende que el
sistema sea tambin sensible a la frecuencia de la seales
sinusoidales en forma anloga a como la cclea responde a
stas.
II. LA CCLEA
2U
1
U
U
=
+ To( x, y )
To( x, y )
2
( x, y ) x
x y
y
t
U (t = 0) = 0
U ' (t = 0) = 0
y condiciones de frontera:
U ( x = 0, y = 0, t ) = excitacin (t )
adems, se consideraron dos casos. El primero con la tela
libre, es decir, sin ser fijada por ninguno de sus lados
teniendo como nica condicin de frontera la excitacin (en
el lado izquierdo del trapecio). El segundo caso es con la
membrana fija, es decir con condiciones de frontera iguales
a cero para los tres lados restantes.
Para solucionar la ecuacin se utiliz el mtodo de
elementos finitos del toolbox de Matlab para ecuaciones
diferenciales parciales, sobre la siguiente regin de
solucin [5], [6]:
T ( x) = x.e x
Para llegar a esta conclusin se simul la respuesta de la
membrana durante 400ms, notndose para esta tensin T,
una atenuacin para las frecuencias altas y una excitacin
mas pronunciada para las bajas al final de la membrana. A
continuacin se muestran algunas grficas de la respuesta
de la membrana, en t = 400ms.
Time=0.3999 Excitacion:sin(1000t)
20
15
30
10
20
10
-10
-5
-20
0.5
-10
0.4
4
3
0.3
0.2
1
0.1
Figura 3.a
-15
finalmente,
Time=0.3999 Excitacion:sin(10000t)
25
( x) = x
20
30
15
20
10
10
5
0
0
-10
-5
-20
-10
-30
0.5
-15
0.4
4
-20
0.3
2
0.2
-25
1
0.1
Figura 3.b
Time=0.3999 Excitacion:sin(100000t)
x 10
20
x 10
Figura 4.a
3
15
2
10
-1
0.5
0
0.4
4
3
0.3
2
0.2
-5
1
0.1
Figura 3.c
T ( x) = 28.28 x + 100
Con base en esta tensin se busc una densidad, se escogi
Figura 4.b
Membrana sostenida:
Figura 4.c
Membrana libre:
REFERENCIAS
VI. CONCLUSIONES
Este modelo de membrana arroja buenos resultados en la
diferenciacin de frecuencias de sinusoides, aunque no es
tan refinado (y por lo tanto aun no est listo) para
reconocer fonemas. Se puede decir que se logra imitar en
alguna medida el comportamiento real de la membrana
basilar, an estando lejos de sus especificaciones reales de
tensin y densidad (que son desconocidas). Es claro que la
membrana simulada responde selectivamente a diferentes
[1] http://www.bcm.tmc.edu/oto/research/cochlea/Hearing/
Fecha de consulta: 24 de Agosto de 2003, Tema general:
Cochlear Biophysics Laboratory
[2] http://psych.athabascau.ca/html/Psych402/Biotutorials/25/par
t1.html Fecha de consulta: 24 de Agosto de 2003, Tema
general: The Human Ear
[3] George, G. Somjen. (1986), Neuro Fisiologa. Buenos Aires.
ED. Panamericana.
[4] Crawford Jr., Frank S. 1971 Berkeley Physics Course v.3.
Barcelona. Reverte, S. A
[5] Burden, Richard L. 2002. Anlisis numrico. Mxico, D.F.
Thomson Learning.
[6] COMSOL AB. 2002. Partial Differential Equation Toolbox
Users Guide version 1. Natick, MA 01760-2098. The
Mathworks