Klasifikasi Teks Bahasa Bali dengan Metode Information Gain dan Naive Bayes Classifier

Ida Bagus Gede Widnyana Putra, Made Sudarma, I Nyoman Satya Kumara
2016 Majalah Ilmiah Teknologi Elektro  
Increasing availability of Balinese language text documents making the process of finding or classifying information in Balinese text documents is becoming increasingly difficult. Manual classification is inefficient in view of the increase in the number of Balinese written documents. On this paper, application that can classify Balinese text into various document class is presented. The application is developed using Naive Bayes classifier (NBC) method and feature selection using Information
more » ... in (IG) technique. Application is tested using cross validation method. The results shows that average accuracy of 10 fold cross validation is 95.22%. Intisari-Ketersediaan dokumen teks bahasa Bali yang meningkat jumlahnya membuat proses pencarian informasi pada dokumen teks berbahasa Bali menjadi semakin sulit. Mengklasifikasikanya secara manual menjadi tidak efisien mengingat peningkatan jumlah dokumen yang semakin banyak. Pada penelitian ini dikembangkan sebuah aplikasi yang dapat mengklasifikasikan teks bahasa Bali ke dalam kategori yang ditentukan. Aplikasi ini menggunakan metode Naive Bayes Classifier (NBC) dan metode Information Gain(IG) untuk seleksi fitur. Aplikasi ini diuji dengan teknik cross validation. Hasilnya adalah nilai rata-rata akurasi dari 10 fold cross validation sebesar 95,22%. Kata Kunci-information gain, naive bayes classifier, text mining, cross validation
doi:10.24843/mite.1502.12 fatcat:24rw3io57vbffhipzr3twjltaq