PENERAPAN ALGORITMA TEXTRANK UNTUK AUTOMATIC SUMMARIZATION PADA DOKUMEN BERBAHASA INDONESIA

Eris, Viny Christanti M, Jeanny Pragantha
2017 Jurnal Ilmu Teknik dan Komputer   unpublished
Automatic Summarization adalah sistem yang digunakan untuk meringkas dokumen secara otomatis. Ada beberapa algoritma untuk membangun sistem tersebut, dalam penelitian ini Automatic Summarization dibangun menggunakan algoritma TextRank. TextRank adalah algoritma peringkat berbasis grafik untuk memproses teks. TextRank menghasilkan ekstraksi kalimat sebagai ringkasan. Salah satu kelebihan dari algoritma ini, tidak diperlukannya pelatihan menggunakan data training pada algoritma yang digunakan.
more » ... umusan dilakukan pada tahap berikut: preprocessing, hitung nilai kesamaan konten yang tumpang tindih, hitung nilai TextRank pada setiap kalimat, dan buat grafik. Hasilnya adalah teks ringkasan yang informatif. Automatic Summarization diuji dengan Q & A Evaluation yang diberikan kepada beberapa responden. Pengujian menunjukkan bahwa, algoritma ini mampu memberikan ringkasan dengan konten informatif hingga 82,48% untuk teks ringkasan 50% dan konten informatif 93,76% untuk teks ringkasan yang dirangkum 75%. PENDAHULUAN Kebutuhan akan informasi di saat ini merupakan suatu kebutuhan yang sangat penting untuk semua orang. Kebutuhan akan informasi tersebut dapat diperoleh dari berbagai media, seperti halnya media digital. Media digital dapat berupa artikel, blog, maupun situs-situs berita yang berisi informasi seperti dokumen (teks). Untuk dapat mengetahui informasi penting dari suatu dokumen, pembaca harus meluangkan banyak waktu. Oleh sebab itu, jika dokumen tersebut dapat diringkas oleh suatu sistem tanpa menghilangkan informasi yang penting maka pembaca dapat menghemat waktu. Karena pembaca dapat memahami dan mengetahui informasi penting dari dokumen tersebut tanpa harus membaca isi dokumen secara keseluruhan (Pratama, 2016). Meringkas dokumen secara manual oleh manusia, membutuhkan banyak biaya dan waktu apabila dokumen tersebut banyak dan panjang sehingga diperlukan sistem peringkas otomatis (automatic summarization) untuk mengatasi banyaknya biaya dan waktu tersebut (Aristoteles, 2013). Sistem peringkas otomatis yang dirancang harus efisien terhadap waktu dan efektif terhadap ketepatan penyajian informasi. Ada beberapa metoda dan algortima yang dapat menghasilkan sistem tersebut. Pada penelitian ini akan dibuat sistem peringkas dokumen otomatis yang menggunakan algoritma TextRank sebagai metodenya dan juga dibuat berbasis website sehingga dapat digunakan oleh siapa saja yang memerlukannya. TextRank merupakan graph-based ranking algorithm (graf dengan model pemeringkatan) untuk pemrosesan teks(Mihalcea, R., & Tarau, P., 2004). TextRank yang digunakan pada sistem ini adalah metode yang menghasilkan ekstraksi berupa kalimat (TextRank for Sentence Extraction). TextRank sangatlah fleksibel karena dapat digunakan pada berbagai bahasa tanpa mengubah algoritmanya. Hal ini dikarenakan TextRank tidak memerlukan data training untuk proses pengelolahan dokumen (Mihalcea, R., & Tarau, P., 2004).
fatcat:bxoym7czcnbrxns3hqjqzlb7je