Bot accounts Ensemble Classification on Twitter

Κωνσταντίνος Ανδρέα Γεωργίου
2021
Σε αυτήν τη νέα εποχή της ταχείας ανταλλαγής πληροφοριών και της τεχνολογικής καινοτομίας, τα κοινωνικά μέσα διαδραματίζουν εξέχοντα ρόλο. Η άμεση μετάδοση πληροφοριών είναι δελεαστική και οι άνθρωποι μπορούν ελεύθερα να εκφραστούν. Ανά τα χρόνια, έχουν προκύψει διάφορες πλατφόρμες κοινωνικών μέσων που εστιάζουν σε διαφορετικές πτυχές της ζωής. Η απλή προσέγγισή τους για τη συλλογή δεδομένων και τη διευκόλυνση των χρηστών να συμμετέχουν σε αυτά, διευκόλυνε την αύξηση λογαριασμών που ελέγχονται
more » ... πό τον άνθρωπο ή από υπολογιστή, οι οποίοι συχνά διαδίδουν ζημιώδες περιεχόμενο, διχόνοια και αμφισβητήσιμες απόψεις. Αυτοί οι λογαριασμοί είναι γνωστοί ως bots και αποτελούν μεγάλη απειλή για τα κοινωνικά μέσα. Ιδιαίτερα στο Twitter, όπου η ανταλλαγή απόψεων είναι διαδεδομένη, τα bot έχουν εισβάλει πολύ στις ροές του, αποσταθεροποιώντας ευαίσθητα θέματα (π.χ. εκλογικές εκστρατείες). Για να αντισταθεί στην αυξανόμενη απειλή τους, η επιστημονική κοινότητα έχει κατασκευάσει μεθοδολογίες για την αντιμετώπιση αυτών των λογαριασμών. Ενώ οι πρόσφατες ερευνητικές δουλείες και οι ανοιχτές υπηρεσίες έχουν κάνει σημαντική δουλειά στην απλή ανίχνευση λογαριασμών bot και ανθρώπου ή στην εστίαση σε έναν συγκεκριμένο τύπο bots (π.χ. spam bots, social bots) έχει δοθεί περιορισμένη προσοχή στην ανίχνευση πολλαπλών τύπων bot, σε ένα σύστημα ανίχνευσης πολλαπλών κλάσεων. Επιπλέον, λίγες μεθοδολογίες αξιολογούν τα χαρακτηριστικά που χρησιμοποιούνται για τις προβλέψεις, τη σημασία τους στις αντίστοιχες αποφάσεις των ταξινομητών ή την εκμετάλλευση των τεχνικών επεξήγησης για μοντέλα μαύρου κουτιού και την εξέταση των αποφάσεών τους. Αυτή η διατριβή αντιμετωπίζει το ανοιχτό πρόβλημα της ανίχνευσης bot πολλαπλών κλάσεων χρησιμοποιώντας αναγνωρισμένες μεθοδολογίες Μηχανικής Μάθησης με κατάλληλες προσαρμογές. Πιο συγκεκριμένα, δημιουργούμε ένα εκτεταμένο σύνολο δεδομένων λογαριασμών του Twitter και των αντίστοιχων tweets τους και τους αναθέτουμε σε πολλές προκαθορισμένες κατηγορίες bot. Παρουσιάζουμε επίσης μερικές νέες κατηγορίες bot, που προηγου [...]
doi:10.26262/heal.auth.ir.329750 fatcat:7lfs34td4zf6va7lsycs6jb4oe