Escolar Documentos
Profissional Documentos
Cultura Documentos
Junio 2009
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Sumario
Introduccin - Objetivos y alcance. Arquitectura del sistema. Fases del reconocimiento del habla. Objetivos del proyecto. Planicacin. Mdulos del sistema. Conclusiones.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Desarrollo de un sistema reconocedor de voz (a nivel local). Entrenamiento del sistema con trifonemas. Ampliacin del sistema, agregando la posibilidad de reconocer a travs del protocolo TCP/IP. Permitir que mltiples usuarios puedan emplear el mismo sistema reconocedor, con las consiguientes ventajas que ello conlleva.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Reconocimiento de voz: proceso de convertir seales acsticas capturadas por, por ejemplo un micrfono, en texto.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
Adquisicin
Sistema desde el cual se adquieren los datos de entrada al sistema reconocedor, la seal de voz. Por lo general, estos datos son adquiridos desde un micrfono. En este sistema sern adquiridos a travs de sockets. La fuente de generacin podra ser un micrfono en otro equipo, un chero de audio, . . .
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
Extraccin de caractersticas
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
Sonidos distinguibles. 34 para el espaol. Representan secuencias de senones. Modelado con cadenas ocultas de Markov.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
343 = 39304 trifonemas para el espaol. En la prctica, alrededor de 5000. Es capaz de diferenciar los sonidos segn su contexto. Muy prctico para reconocimiento continuo del habla. Aumento de la tasa de aciertos.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin Extraccin de caractersticas Reconocimiento / clasicacin probabilstica Reconocimiento mediante fonemas Reconocimiento mediante trifonemas
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Planicacin
Concepto Bsqueda de documentacin Planicacin Adquirir conocimientos sobre sistemas reconocedores del habla Elicitacin de requisitos Anlisis Diseo Implementacin
10 20 30 60
11 19 28 64
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Planicacin
RE 18.18 % 0% 0.65 %
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Adquisicin de datos
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Extraccin de caractersticas
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Extraccin de caractersticas
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Entrenamiento
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Reconocimiento
Algoritmo de Viterbi. Estructura esttica: palabras. Estructura dinmica: proceso del algoritmo.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Adquisicin de datos Extraccin de caractersticas Modelos ocultos de Markov Entrenamiento Reconocimiento Gestor de bases de datos orales Gestin de la conguracin y log Comunicaciones
Comunicaciones
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Conclusiones
Motivacin personal satisfecha: adquisicin de nuevos conocimientos. Objetivos tcnicos y metodolgicos cumplidos en mayor o menor medida.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Posibles mejoras
Implementacin para otras plataformas. Inmunidad al ruido de ambiente. Prosodia: expresar emociones. Questions revisadas por especialistas.
Introduccin - Objetivos y alcance Arquitectura del sistema Fases del reconocimiento del habla Objetivos del proyecto Planicacin Mdulos del sistema Conclusiones
Gracias!