Determination of Bahasa Melayu Word List From Friday Sermon Transcripts Using PHP and MySQL

Mokhtar Harun, Muhammad 'Aasim Asyafi'ie Ahmad, Siti Zaleha Abdul Hamid, Fareha Abdul Rahman, Puspa Inayat Khalid
2013 Jurnal Teknologi  
Almost all of the speech intelligibility (SI) assessors today are from the West. The words used in the development of these SI assessors are mainly English. However, recent finding has found that word components that contribute to intelligibility of speech is different from one language to another. The purpose of this study is to determine Bahasa Melayu (BM) word list from Friday sermon transcripts. The project was undertaken by deriving BM words spoken during 52 Friday sermons read in mosques
more » ... ns read in mosques in Wilayah Persekutuan Kuala Lumpur. PHP is the programming language used to compute the frequency of words appears in the Friday sermon transcripts. These words were then stored into a database. The database used is MySQL. It has been found that the highest number of repeated word is 2509. The list is then truncated so that the numbers of repeated words range from 52 to 2509 times. The frequency of Bahasa Melayu words used in Friday sermons is an initial and important inventory that can be used in the development of SI assessor using BM words. Abstrak Hampir semua penilaian kejelasan ucapan (SI) berasal dari negara-negara Barat. Perkataan-perkataan yang digunakan untuk membuat penilaian SI selalunya berdasarkan bahasa Inggeris. Walaubagaimana pun, penemuan baru telah mendapati bahawa komponen perkataan yang menyumbang kepada kejelasan bersuara adalah berbeza dari satu bahasa kepada bahasa yang lain. Tujuan kajian ini adalah untuk menentukan perkataan-perkataan Bahasa Melayu (BM) daripada transkrip khutbah Jumaat. Projek ini telah dijalankan dengan memperolehi perkataan-perkataan yang dibaca semasa 52 khutbah-khutbah Jumaat dalam masjidmasjid di Wilayah Persekutuan Kuala Lumpur. Bilangan ulangan perkataan dalam khutbah telah dikira dengan menggunakan kod PHP dan disimpan dalam pangkalan data MySQL. Jumlah tertinggi ulangan perkataan adalah 2509. Senarai ini kemudian dikecilkan supaya bilangan perkataan berulang adalah antara 52-2509 kali. Kekerapan perkataan Bahasa Melayu yang digunakan dalam khutbah-khutbah Jumaat adalah inventori awal penting yang boleh digunakan dalam pembangunan penilai SI yang menggunakan perkataan BM.
doi:10.11113/jt.v64.2071 fatcat:egczmvtwzbgq7pzwkzo4hzvgyu