Разработка веб-сервиса скоринговой модели на основе аналитической платформы deductor enterprise
Объект исследования: процесс обмена данными между внешним приложением и аналитическим сервером Deductor с целью классификации новых клиентов, обратившихся за кредитом.
Результаты, полученные лично автором: разработана скоринговая модель и веб-сервис для классификации новых клиентов, обратившихся за кредитом.
В последнее время наблюдается интенсивный рост рынка кредитования. При выдаче кредита банк интересует способность клиентов полностью и в срок рассчитаться по своим долговым обязательствам. Именно задаче выбора кредитоспособных заемщиков и служат скоринговые модели. Заметной тенденцией в сфере интеллектуального анализа является получение применимых на практике результатов и использование их для принятия оперативных решений.
В качестве исходных данных для обучения и тестирования скоринговой модели были выбраны данные задачи «Кредитный скоринг» ML Boot Camp. Выбранный алгоритм классификации – логистическая регрессия, которая является одним из статистических методов классификации с использованием линейного дискриминанта Фишера. В аналитической платформе Deductor Studio разработан сценарий, состоящий из предварительной обработки данных, модуля логистической регрессии и постобработка, включая анализ качества созданных сценариев. Но для того, чтобы использовать скоринговую модель, необходимо обеспечить обмен данными между аналитическим сервером Deductor (DAS) и клиентским приложением.
Сервисы скоринга в режиме реального времени принимают факты о бизнес-сущности (в данной задаче о клиенте) и совместно с моделью углубленного анализа данных используют эту информацию для выдачи оценки. Для осуществления автоматической отправки данных в аналитическое приложение и приема обработанных данных обратно в какую-либо информационную систему или приложение предназначен Deductor Integration Server (DIS). Аналитический сервер взаимодействует с внешними системами по сервис-ориентированному протоколу Simple Object Access Protocol. DIS является модулем MS Internet Information Services.
Функционирование веб-сервиса осуществляется с помощью вспомогательных файлов, таких как:
· xsd-схема, представляющая собой спецификацию, по которой осуществляется импорт и экспорт данных, содержащихся в xml-файле;
· xml-файлы с примером исходных данных для импорта и сгенерированными данными экспорта;
· xml-описание сценария, описание хранилища данных, а также схемы, задействованные в импорте и экспорте сценария.
В результате создания веб-приложения и настройки конфигурации становится возможным обратиться к url-адресу сервиса и получить wsdl-описание. На рис. представлено wsdl-описание для разработанного веб-сервиса скоринговой модели.
С помощью стороннего приложения осуществляется получение описания входных переменных. Результаты логистической регрессии:
· Выходная переменная логического типа, представляющая собой окончательное решение.
· Расчетная переменная вещественного типа: вероятность наступления положительного события.
· Расчетная переменная вещественного типа: балл наступления события.
Рис. Wsdl-описание разработанного сервиса Deductor
Сервисы скоринга в режиме реального времени используют данные и модели углубленного анализа данных для немедленного вычисления результатов. Разработанный веб-сервис позволяет осуществлять обмен данными между сторонним приложением и сервером Deductor посредством HTTP/HTTPS и не требует от внешней стороны использования какой-либо определенной технологии, кроме наличия SOAP-интерфейса для обмена данными.
Использование веб-сервиса ускоряет получение заключения о кредитоспособности клиента и делает процесс анализа персональных данных максимально простым и удобным. В случае доработки или полной замены алгоритма классификации не требуется вносить существенных изменений в работу веб-сервиса.
Материал поступил в редколлегию 20.04.2017
УДК 004.9
А.Д. Бушмелев
Научный руководитель: заведующий кафедрой «Информатика и программное обеспечение», к.т.н., доцент А.Г. Подвесовский