Síntesis estadística paramétrica de voz
[thesis]
Marvin Coto Jiménez
Resumen La síntesis estadística paramétrica de voz es una técnica de producción de voces artificiales que utiliza como modelo matemático dominante los Modelos Ocultos de Markov sobre una representación paramétrica del habla. Esto permite que una voz pueda ser codificada utilizando parámetros espectrales, de frecuencia fundamental y de duración de sus unidades fonéticas, para luego entrenar los modelos matemáticos que permitan producir nuevas frases, con ventajas significativas sobre otros
more »
... imientos de síntesis de voz, tales como su mayor flexibilidad y menor requerimiento en almacenamiento. En este trabajo se presenta el desarrollo teórico, la adaptación a nivel lingüístico y computacional y una propuesta de extensiva de experimentación y evaluación de voces artificiales producidas a partir de síntesis estadística paramétrica de voz, en una variante de español latinoamericano. Para este fin se han definido una serie de contextos de implementación y se han adaptado y desarrollado aplicaciones computacionales como aportes a distintos niveles, desde la extracción de información hasta la evaluación de resultados. Esto ha permitido plantear una gran cantidad de experimentos para estudiar la influencia de diversos factores a la calidad de voces obtenidas. Los principales aportes del proyecto son: La documentación de los elementos teóricos y prácticos para la creación de voces utilizando la síntesis estadística paramétrica. De acuerdo con el estudio de referencias realizado, este documento constituye el primer aporte a la documentación de ambos aspectos. En segundo lugar la creación de programas para la extracción y análisis de parámetros y para la evaluación de resultados, además de las aplicaciones desarrolladas para probar las voces en situaciones reales. En tercer lugar la incorporación de parámetros acústicos como elementos de evaluación de voces sintetizadas, así como pruebas de significancia estadísticas entreéstos y voces originales para evaluar la calidad de los resultados. Y finalmente, se han identificadoáreas de potencial desarrollo a partir de la incorporación de métodos heurísticos y otros de inteligencia computacional para mejorar los procesos de creación de voces y su evaluación.
doi:10.24275/uami.z316q1750
fatcat:47wbutqgj5gv3huepxdjtgg22q