Evaluation of Lithuanian Text-to-Speech Synthesizers

Pijus Kasparaitis
2016 Studies About Languages  
Fizinių mokslų daktaras, Vilniaus universiteto Matematikos ir informatikos fakulteto Kompiuterijos katedros docentas, Vilniaus universitetas, Lietuva. http://dx.Kitų kalbų balso sintezė iš teksto plačiai naudojama jau kelis dešimtmečius, tuo tarpu kuriant lietuvių kalbos sintezatorius esminis proveržis įvyko tik pastaraisiais metais. Vien 2013-2015 metais pasirodė šeši nauji lietuviški sintetiniai balsai. Todėl atsirado poreikis įvertinti naujai atsiradusius lietuviško balso sintezatorius.
more » ... darbe pateikta chronologinė esamų lietuviško balso sintezatorių apžvalga, išsamiau aprašytas naujausiuose sintezatoriuose SINT.AS ir LIEPA pritaikytas vienetų parinkimo algoritmas bei vykdyta diktorių atranka, nes tai turėjo lemiamos reikšmės sintezuoto balso kokybei. Pagrindinės sintetinio balso charakteristikos yra suprantamumas ir priimtinumas, jos vertinamos pasitelkiant žmones-klausytojus ir gautus duomenis apdorojant statistiniais metodais. Taigi šiame darbe tiriami devyni naujausi lietuviški sintetiniai balsai (Regina, Edvardas, Aistė, Vladas, Laima, Marijus, Egidius, Aistis 2 ir Gintaras), bandoma įvertinti, koks iš tikrųjų sintetinių balsų suprantamumas pasiektas, palyginti sintezatorius tarpusavyje pagal įvairias charakteristikas, pateikti patarimų potencialiems sintetinio balso taikymų kūrėjams renkantis sintezatorių balsus ir galiausiai parodyti sintezatorių kūrėjams perspektyviausias tobulinimo kryptis. REIKŠMINIAI ŽODŽIAI: balso sintezė iš teksto, vienetų parinkimo metodas, sintezuoto balso suprantamumas, sintezuoto balso priimtinumas.
doi:10.5755/j01.sal.0.28.15130 fatcat:2psm6i73tvh3xh3mkcz3k7qgci