The anatomy of a Turkish speech recognition system

Cem Aksoylar, Suha Orhun Mutluergil, Hakan Erdogan
2009 2009 IEEE 17th Signal Processing and Communications Applications Conference  
Özetçe Bu bildiride geliştirdiğimiz Türkçe konuşma tanıma sisteminin yapısından bahsedeceğiz. Sistemin inşa edilişi ve daha sonra sistem üzerinde yaptığımız deneyler hakkında bilgi vereceğiz. Sistem eğitimi için SUVoice veritabanı ile METU 1.0 veritabanını birlikte kullandık. Sınırlı dağarcıklı ve geniş dağarcıklı tanıma deneyleri yaptık. Modern saklı Markov modeli tabanlı konuşma tanıma sistemlerinin Türkçe için değişik sınama koşullarındaki başarımını gösterdik. Basit sınamalarda kelime hata
more » ... ranı %1 civarında olurken geniş dağarcıklı sınamalarda daha yüksek hata oranları elde ettik. Bu çalışma Türkçe konuşma tanıma konusunda daha ileri düzeyde çalışmalara bir temel teşkil edecek ve bu konudaki bilgi birikimine katkıda bulunacaktır. Abstract In this paper, we present a Turkish speech recognition system we have developed. We will be giving information about the building of our system and tests we conducted on it. SUVoice voice database, along with METU 1.0, was used in the training of our acoustic models. We performed limited vocabulary and large vocabulary recognition tests. We have shown the performance of modern hidden Markov model based systems for Turkish speech recognition. For simple tasks, we can obtain 1% word error rate, whereas for large vocabulary tests the error rate is higher. This work will constitute a basis for more advanced future works in Turkish speech recognition and contribute to the accumulated knowledge in the field. 978-1-4244-4436-6/09/$25.00 ©2009 IEEE
doi:10.1109/siu.2009.5136445 fatcat:24bi55dazbhklcbp6njsxcdtka