Analysis of clustering algorithms of scientific papers using summarisation via neural networks
Аналіз алгоритмів кластеризації для наукових статей на основі підсумовування за допомогою нейронних мереж

M. Bevza
2021 Science and Education a New Dimension  
Анотація. Вступ. Ріст кількості інформації доступної в мережі інтернет є експоненційним. Фільтрування кісної інформації від неякісної стає дедалі важчим. Пошук інформації з надійних джерел є важливим завданням. Одне з високоякісних джеред інформаціїце наукові дослідження. Метою роботи є побудова системи, яка може кластеризувати наукові статті, враховуючи її семантичні властивості, та порівняти алгоритми кластеризації для цієї задачі. Результати. Проаналізовано структуру наукових статей та
more » ... ено особливості, які слід враховувати під час кластеризації статей за їх текстовими семантичними властивостями. Описано процес побудови кластерів. Характеристики текстової частини контенту попередньо сформовано за допомогою нейронної мережі BERT. Розроблено систему, яка опрацьовує текстову частину наукової статті і будує кластеризацію. Аналіз роботи розробленої системи показав переваги і недоліки методів кластеризації. Висновки. Використання розробленої системи, яка на вхід отримує характеристики текстової частини наукової статті, дає змогу комплексно оцінити зв'язок наукових статей один між іншим, а також інтерпретувати ці зв'язки. Ключові слова: штучний інтелект, оброблення природної мови, кластеризація.
doi:10.31174/send-nt2021-255ix32-07 fatcat:er6xgzgvyzemfb23szxcof3mv4