MISSING IMPUTATION ALGORITHMS FOR CREDIT SCORING PROBLEMS
СПОСОБЫ РАБОТЫ С ПРОПУЩЕННЫМИ ДАННЫМИ ДЛЯ ЗАДАЧ КРЕДИТНОГО СКОРИНГА

V.A. Arkhipov
2020 Bulletin of the Altai Academy of Economics and law  
Ключевые слова: моделирование, кредитный скоринг, машинное обучение, пропуски в данных, бинарная классификация. Одной из важных проблем, возникающих в ходе построения моделей кредитного скоринга, является необходимость работать с пропусками в данных. Пропущенные наблюдения могут иметь очевидную экономическую природу, либо не иметь ее вовсе и быть вызванными техническими ошибками в системах хранения данных. В связи с этим возникает необходимость восстанавливать пропущенные значения таким
more » ... чтобы максимизировать целевую метрику качества -коэффициент Джини. Основной интерес представляет способ восстановления пропущенных значений на основе генеративных состязательных сетей, предложенный в работе Gain: Missing data imputation using generative adversarial nets, так как предлагает принципиально новый алгоритм восстановления пропущенных значений по сравнению с традиционно используемыми в индустрии.
doi:10.17513/vaael.1157 fatcat:nouc7imw7zarrervf7bue4ecvq