Clustering of handwritten digits by Kohonen neural network
Кластеризация рукописных цифр нейронной сетью Кохонена

Дина Сергеевна Латыпова, Дмитрий Николаевич Тумаков, Aleksandr Mikhailovich Elizarov
2022 Program systems theory and applications  
Проведена кластеризация рукописных цифр по шестидесяти тысячам изображений, содержащихся в обучающей выборке базы данных MNIST. Для кластеризации использована нейронная сеть Кохонена. Для каждой рукописной цифры определено оптимальное количество кластеров (не более 50). При определении расстояния между объектами (изображениями рукописных цифр) использована евклидова норма. Проверка правильности построения кластеров проведена по данным из тестовой выборки базы MNIST. Тестовая выборка содержит
more » ... ять тысяч изображений. Сделан вывод о том, что изображения из тестовой выборки принадлежат кластеру <<правильной цифры>> с вероятностью более 90%. Для каждой цифры вычислена F-мера для оценки кластеров. Наилучшие значения F-меры получены для цифр 0 и 1 (F-среднее значение равно 0,974). Наихудшие значения получены для цифры 9 (F-среднее значение равно 0,903). Также проведён кластерный анализ, который позволил сделать выводы о возможных ошибках в распознавании нейронной сетью Кохонена. Построены пересечения кластеров для изображений рукописных цифр. Приведены примеры пересечений кластеров, а также показаны примеры изображений, которые распознаны нейронной сетью неверно.
doi:10.25209/2079-3316-2022-13-3-225-239 fatcat:phyr2wks75gclocygnyf5ml2tq