Informative feature selection in software identification task

K.I. Salakhutdinova, I.S. Lebedev, I.E. Krivtsova
2018 Naučno-tehničeskij Vestnik Informacionnyh Tehnologij, Mehaniki i Optiki  
Аннотация Постановка задачи. Необходимость снижения роста числа уязвимостей системы, вызываемого установкой несанкционированного программного обеспечения на средства вычислительной техники, требует разработки способа автоматизации процесса аудита носителей информации. В работе предложен подход к выявлению информативности ассемблерных команд. Исследовано влияние выбора признака для формирования унифицированных сигнатур программ на результаты идентификации. Метод. Для расчета информативности
more » ... нен метод Шеннона, позволяющий определить информативность признака для произвольного числа классов объектов, не зависящий от объема выборок наблюдаемых признаков. Идентификация elf-файлов основана на применении статистического критерия однородности хи-квадрат. Основные результаты. Получены количественные характеристики информативности для 118 ассемблерных команд. Проведен анализ результатов эксперимента по идентификации исполняемых файлов с использованием 10 различных признаков для формирования сигнатур программ. Сравнение выполнено с помощью критерия однородности хи-квадрат на уровнях значимости p = 0,05 и p = 0,01. Практическая значимость. Обнаружена важность использования того или иного признака в задаче по формированию сигнатур программ, а также возможность рассмотрения нескольких сигнатур исполняемых файлов в единой связке для создания итоговой оценки принадлежности к известной программе. Ключевые слова идентификация исполняемых файлов, elf-файлы, информативность признака, хи-квадрат критерий, информационная безопасность
doi:10.17586/2226-1494-2018-18-2-278-285 fatcat:kmmgpvb5qndrboty33ecfnqbma