Нейросетевой подход к созданию интеллектуальных компьютерных технологий и систем
В настоящее время биоэлектроника является новейшей отраслью науки и техники, изучающей принципы и методы обработки информации живыми организмами с целью создания высокопроизводительных и надежных интеллектуальных информационных технологий. Одним из направлений бионического подхода к созданию информационных систем и технологий являются интеллектуальные информационные технологии, основанные на использовании нейронных сетей.
Нейронные сети – обобщенное название групп алгоритмов, которые умеют обучаться на примерах, извлекая скрытые закономерности из потока данных. Компьютерные технологии, получившие название нейросетевых, работают по аналогии с принципами строения и функционирования нейронов головного мозга человека и позволяют решать чрезвычайно широкий круг задач: распознавание человеческой речи и абстрактных образов, классификацию состояний сложных систем, управление технологическими процессами и финансовыми потоками, решение аналитических, исследовательских, прогнозных задач, связанных с обширными информационными потоками. Являясь мощным технологическим инструментом, нейросетевые технологии облегчают специалисту процесс принятия важных и неочевидных решений в условиях неопределенности, дефицита времени и ограниченных информационных ресурсов.
С середины 1980-х гг. нейронные сети начали использоваться на Западе преимущественно в финансовых и военных приложениях. Однако, несмотря на успех, инструмент оказался слишком сложным и дорогостоящим. Ситуация изменилась в начале 1990-х гг., когда на рынке появилось новое поколение нейросетевых технологий – мощных, недорогих, простых в использовании. Одним из лидеров рынка стал нейросетевой пакет Brain Maker американской фирмы California Scientific Software. Разработанный по заказу военных пакет был адаптирован для бизнес-приложений и с 1990 г. удерживает лидерство среди самых продаваемых нейросетевых пакетов США.
Свой путь на российский рынок нейронные сети начали с финансово-кредитной сферы, где заинтересованные в совершенствовании аналитической работы банки стали интенсивно включать нейронные сетевые технологии в состав финансовых приложений. В настоящее время пользователями Brain Marker Pro стали уже более 200 банков и торговых компаний, а также аналитические учреждения верхних эшелонов власти.
Отличительной чертой нейронных сетей является их способность менять свое поведение (обучаться) в зависимости от изменения внешней среды, извлекая скрытые закономерности из потока данных. При этом алгоритмы обучения не требуют каких-либо предварительных знаний о существующих в предметной области взаимосвязях – необходимо только подобрать достаточное число примеров, описывающих поведение моделируемой системы в прошлом. Основанная на нейросетях технология не предъявляет повышенных требований к точности входных данных как на этапе обучения, так и при ее использовании (после настройки и обучения), например, при распознавании симптомов приближения критических ситуаций, для краткосрочных, а иногда и долгосрочных прогнозов. Таким образом, нейросетевая технология обладает двумя чрезвычайно полезными свойствами:
- способностью обучаться на конкретном множестве примеров;
- умением стабильно распознавать, прогнозировать новые ситуации с высокой степенью точности, причем в условиях внешних помех, например, появления противоречивых или неполных значений в потоках информации. Взяв за основу работу мозга, нейросетевые технологии включили в себя и ряд биологических терминов, понятий, параметров, а метод получил название генетического алгоритма.
При использовании нейросетевой технологии работа строится в несколько этапов. Рассмотрим их содержание и важнейшие процедуры,
Первым этапом является четкое определение проблемы, т.е. того, что пользователь-аналитик собирается получить от нейросетевой технологии на выходе. Это может быть некоторый вектор, характеризующий систему или процесс. Например, кривая доходности ГКО; цена отсечения первичного аукциона; показатель целесообразности реструктуризации инвестиционного портфеля, точки перелома тренда и т.п.
Вторым этапом является определение и подготовка исходных данных для реализации нейросетевой технологии. При этом отбирается вся необходимая, адекватно и полно описывающая процесс информация. Для наиболее успешного решения проблемы формирования наборов информации для последующего прогнозирования ситуаций рекомендуется привлекать хорошо знающих данную конкретную область специалистов.
Сложность выполнения второго этапа заключается в том, что должен быть соблюден баланс между стремлением увеличить количество входных параметров и вероятностью получить плохо обучаемую сеть, которая может исказить ожидаемые прогнозы. Дело в том, что число дней ретроспективы и прогноза, которые зависят от свойств исследуемых данных, сильно влияют на точность прогноза. Поэтому выбор несоответственно большого числа дней для прогноза или их малого числа ретроспективы может привести к тому, что сеть будет не в состоянии обучаться.
Ввод данных в систему, подготовку данных, создание файлов для тренировки и тестирования можно считать самостоятельным третьим этапом. Основной целью работы на этом этапе является формирование необходимого набора ситуаций, с которыми придется работать аналитику, а затем распределение исходных данных по этим ситуациям. При этом нейросетевая технология автоматически реализует задачу классификации, в основе которой лежит нечеткая логика (fuzzy logic). В качестве входных параметров могут быть использованы искусственно созданные характеристики системы, в частности, для фондового рынка это могут быть различные индикаторы технического анализа. На этапе подготовки данных анализируется степень их информационной насыщенности, для чего выявляется степень влияния конкретного параметра на прогнозируемую величину.
Выбор типа нейросетевой технологии и метода ее обучения можно выделить в самостоятельный этап. Наиболее трудоемким процессом является настройка нейросети на обучающую выборку данных, ибо здесь определяется оптимальное количество параметров, свойств исследуемых данных, оптимальное число дней ретроспективы и прогноза. Хорошо продуманные способы задания тестовых множеств в сочетании с несколькими вариантами обучающих алгоритмов и заданием различных критериев остановки обучения предоставляют широкие возможности для экспериментов.
Облегчает процесс работы и то, что все современные нейросетевые технологии содержат ту или иную систему конвертеров, позволяющих пользоваться данными, подготовленными в популярных исходных форматах: в частности, можно импортировать в ППП, реализующий нейросетевую технологию, текстовые файлы и таблицы, подготовленные в Excel. Современные нейросетевые продукты позволяют работать как с числовыми, так и с текстовыми данными, т.е. преобразовывать набор символов (слово, фраза) в уникальный набор чисел. Правила для обучения нейросети могут задаваться посредством их ввода в готовом виде, а также в виде чисел, требующих дополнительных преобразований данных. Причем эти ограничивающие и разрешающие правила и условия могут задаваться в процессе решения задачи.
Последними этапами можно считать проведение тестирования нейросети и ее запуск для получения прогноза. Работоспособность первоначально обученных сетей проводится на тестовой выборке данных. По результатам тестов отбираются наиболее перспективные варианты. При этом руководствуются тем, что точность и надежность прогноза прежде всего зависят от типа прогнозируемой величины, состояния, в котором находится система (стационарное, вблизи критической точки и т.п.), типа системы (управляемая она извне или замкнутая). Например, наиболее точен и надежен прогноз локального изменения тренда в стационарном состоянии рынка.
Если результаты тестирования не удовлетворяют, то просматривают набор входных данных, изменяют некоторые учебные программы или перестраивают сеть.
После завершения полного цикла решения задачи возможны два пути: пользоваться в дальнейшей работе созданной системой, что вполне приемлемо для одного специалиста, решающего определенный круг задач, или создать для каждой задачи независимые приложения в виде отдельного файла, который может использоваться другими программами. В этом случае полученный вариант нейросетевой технологии представляет собой упакованную нейросеть с описанными функциями передачи данных команд управления.
Гибкость и мощность нейронных сетей открывают перед ними практически неограниченные возможности применения, особенно в качестве аналитических инструментов в таких плохо формализуемых и многокритериальных областях, как анализ финансовой и банковской деятельности. Любая задача, связанная с использованием финансовых средств на валютном рынке или рынке ценных бумаг, сопряжена с риском и требует тщательного анализа и прогноза. Точность прогноза, устойчиво достигаемая нейросетевыми технологиями при решении реальных задач, уже превысила 95 %. Поэтому количество примеров успешного применения нейросетевых программных продуктов стремительно растет.
Среди перспективных направлений использования нейросетевых технологий можно назвать создание компьютерных моделей поведения клиента для оценки риска или перспективности работы с конкретными клиентами. Например, можно проанализировать прежние сделки и на этой основе оценить вероятность того, согласится ли конкретный клиент на то или иное предложение.
* Куправа Т.А. Самоучитель Ассуss 97/2000. СПб. : Наука и техника, 2001. С. 9.
* Савицкий Н.И. Технологии организации, хранения и обработки данных : учеб. пособие / Н.И. Савикий. М. : ИНФРА-М, 2001. С. 56–58, 39–44.
* Костров, А.В. Уроки информационного менеджмента. Практикум : учеб. пособие. М. : Финансы и статистика, 2005. С. 265–273.
* Костров А.В. Уроки информационного менеджмента. Практикум : учеб. пособие. М. : Финансы и статистика, 2005. C. 267.
* Костров А.В. Уроки информационного менеджмента. Практикум : учеб. пособие. М. : Финансы и статистика, 2005. С. 270.
* Титоренко Г.А. Информационные технологии управления : учеб. пособие для вузов / под ред. Г.А. Титоренко. 2-е изд., доп. М. : ЮНИТИ, 2003. С. 38–45.
* Саак А.Э., Пахомов Е.В., Тюшняков В.Н. Информационные технологии управления [Текст] : учеб. пособие для вузов. 2-е изд., доп. СПб. : Питер, 2008. С.154.
* Черкасов Ю.М. Информационные технологии управления : учеб. пособие. М. : ИНФРА-М, 2001. С. 146.
* Оперирует простыми высказываниями, расчлененными на субъект (нечто, лежащее в основе) и предикат (нечто, утверждаемое о субъекте) и отображающее наличие (отсутствие) у субъекта некоторого признака.
* Саак А.Э., Пахомов Е.В., Тюшняков В.Н. Информационные технологии управления. СПб. : Питер, 2008.