Deteksi Bot Spammer Pada Twitter Menggunakan Smith Waterman Similarity Dan Time Interval Entropy

Imam Syafii, Arief Setyanto, Suwanto Raharjo
2018 Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi)  
Twitter merupakan media sosial yang berinteraksi melalui postingan tweet yang berbasis teks 140 karakter termasuk foto, video dan hyperlink. Tweet spam berisi pesan membahayakan yang dikirim secara terus-menerus. Selain mengganggu juga membahayakan bagi yang menerima, diperburuk dengan penggunaan bot yang secara otomatis dan cepat menyebarkan pesan spam yang dapat menyebabkan kerusakan data. Penelitian ini bertujuan mendeteksi bot spam dengan memanfaatkan kemiripan tweets menggunakan Smith
more » ... man dan Interval waktu posting. Data tweets dikumpulkan menggunakan library scrap di python berupa id, text, time, link, berdasarkan dataset berlabel yang telah tersedia. Data tersebut dilakukan tahapan text preprocessing untuk membersihkan teks kemudian dilakukan perhitungan. Hasil perhitungan dari kedua metode similarity dan interval waktu posting kemudian diklasifikasi dengan k-Neaset Neighbour dengan dataset sebelumnya yang telah berlabel untuk mendapatkan hasil prediksi bot spam atau legitimate. Hasil percobaan klasifikasi dengan beberapa kombinasi k untuk mendeteksi bot spam dengan kriteria similarity dan interval entropy diperoleh hasil terbaik k=3 Neirest Neighbour dan 10 fold Cross Validation dengan nilai prediksi deteksi accuracy sebesar 80%, precission 84% dan recall 84%.
doi:10.29207/resti.v2i3.549 fatcat:xwlvnv7rxvgljpdeudwlnkxzxa