Методы аппроксимации экспериментальных данных

В настоящее время задача аппроксимации является актуальной темой практически для каждого технического исследования. От выбора вида аппроксимации в существенной мере зависят количественные характеристики и качественные свойства описания изучаемых объектов.

Под аппроксимацией понимается замена одних математических объектов другими, в том или ином смысле близким к исходным. В данном случае широкое понятие аппроксимации будет использоваться в узком смысле – как «восстановление функциональной зависимости по экспериментальным данным». Проведение какого-либо эксперимента является частью задачи моделирования, ставящей целью использование построенной модели для практического применения (выполнения расчетов различных устройств, установок) или для дальнейшего развития какой-либо теории естественных наук. [5].

Классификация моделей аппроксимации

Моделью аппроксимации называют такую модель, которую используют для нахождения аппроксимирующей зависимости или для построения прогнозной модели. Каждому виду модели соответствуют определенные алгоритмы аппроксимации:

1. Регрессионный метод.

2. Метод экстраполяции.

3. Нейросетевой метод.

Регрессионный метод

Регрессионный анализ - это метод моделирования данных и исследования их свойств. Данные состоят из пар значений зависимой переменной (переменной отклика) и независимой переменной (объясняющей переменной). Регрессионная модель есть функция независимой переменной и параметров с добавленной случайной переменной. Параметры модели настраиваются таким образом, что модель наилучшим образом приближает данные. Критерием качества приближения (целевой функцией) обычно является среднеквадратичная ошибка: сумма квадратов разности значений модели и зависимой переменной для всех значений независимой переменной в качестве аргумента. Регрессионный анализ — раздел математической статистики и машинного обучения. Предполагается, что зависимая переменная есть сумма значений некоторой модели и случайной величины. Регрессионный анализ используется для прогноза и выявления скрытых взаимосвязей в данных.

Недостатки регрессионного анализа: модели, имеющие слишком малую сложность, могут оказаться неточными, а модели, имеющие избыточную сложность, могут оказаться переобученными [6].

Метод экстраполяции

Экстраполяция – это такой тип аппроксимации, при котором функции аппроксимируются вне заданного интервала, а не между заданными значениями [7].

Иными словами, экстраполяция - это приближённое определение значений функции f(x) в точках x, лежащих вне отрезка [x0, xn], по её значениям в точках x0<x1<...<xn.

При формировании прогнозов с помощью экстраполяции обычно исходят из статистически складывающихся тенденций изменения тех или иных количественных характеристик объекта. Экстраполируются оценочные функциональные системные и структурные характеристики. Экстраполяционные методы являются одними из самых распространенных и наиболее разработанных среди всей совокупности методов прогнозирования.

С помощью этих методов экстраполируются количественные параметры больших систем, количественные характеристики экономического, научного, производственного потенциала, данные о результативности научно-технического прогресса, характеристики соотношения отдельных подсистем, блоков, элементов в системе показателей сложных систем и др.

Однако степень реальности такого рода прогнозов и соответственно мера доверия к ним в значительной мере обусловливаются аргументированностью выбора пределов экстраполяции и стабильностью соответствия "измерителей" по отношению к сущности рассматриваемого явления. Следует обратить внимание на то, что сложные объекты, как правило, не могут быть охарактеризованы одним параметром. В связи с этим можно сделать некоторое представление о последовательности действий при статистическом анализе тенденций и экстраполировании, которое состоит в следующем:

- во-первых, должно быть четкое определение задачи, выдвижение гипотез о возможном развитии прогнозируемого объекта, обсуждение факторов, стимулирующих и препятствующих развитию данного объекта, определение необходимой экстраполяции и её допустимой дальности;

- во-вторых, выбор системы параметров, унификация различных единиц измерения, относящихся к каждому параметру в отдельности;

- в-третьих, сбор и систематизация данных. Перед сведением их в соответствующие таблицы еще раз проверяется однородность данных и их сопоставимость: одни данные относятся к серийным изделиям, а другие могут характеризовать лишь конструируемые объекты;

- в-четвертых, когда вышеперечисленные требования выполнены, задача состоит в том, чтобы в ходе статистического анализа и непосредственной экстраполяции данных выявить тенденции или симптомы изменения изучаемых величин. В экстраполяционных прогнозах особо важным является не столько предсказание конкретных значений изучаемого объекта или параметра в таком-то году, сколько своевременное фиксирование объективно намечающихся сдвигов, лежащих в зародыше назревающих тенденций.

Достоинства:

- простота сбора информации и расчетов;

- возможность осуществить адаптивный прогноз, учитывающий новую информацию.

Недостатки:

- при большом периоде упреждения — недостоверность прогнозных данных;

- не учитываются уже происшедшие изменения условий прогнозного фона;

-_______нет возможности предсказать результат при нестабильности, изменчивости условий в будущем [8].

Нейросетевая модель

Искусственная нейронная сеть (ИНС, нейронная сеть) - это набор нейронов, соединенных между собой. Как правило, передаточные функции всех нейронов в нейронной сети фиксированы, а веса являются параметрами нейронной сети и могут изменяться. Некоторые входы нейронов помечены как внешние входы нейронной сети, а некоторые выходы - как внешние выходы нейронной сети. Подавая любые числа на входы нейронной сети, мы получаем какой-то набор чисел на выходах нейронной сети. Таким образом, работа нейронной сети состоит в преобразовании входного вектора в выходной вектор, причем это преобразование задается весами нейронной сети [9].

Практически любую задачу можно свести к задаче, решаемой нейронной сетью.

Нейросетевая модель ориентирована на то, чтобы уметь по текущему и нескольким предыдущим векторам состояния объекта предсказывать его следующие состояния. Нейронная сеть способна запомнить, а затем воспроизвести динамическое поведение объекта в ситуациях, которые ей известны.  

Да, нейросетевые модели динамических объектов могут быть настолько точными, что нейроконтроллер, синтезированный с использованием нейроэмулятора, оказывается способным управлять самим объектом без каких-либо дополнительных настроек.  

Внешняя структура нейросетевой модели полностью определяется регрессором и набором параметров, значение которых необходимо прогнозировать, т.е. число входов (число нейронов во входном слое МНС) определяется количеством элементов регрессора, число выходов (число нейронов в выходном слое) определяется количеством прогнозируемых величин.  

В случае использования нейросетевых моделей значительную роль играет не только выбор регрессора, но и задание внутренней структуры НС - числа скрытых слоев и количества нейронов в каждом скрытом слое.

Непосредственно процессу создания нейросетевой модели предшествует процедура сбора, анализа и обработки исходных данных с целью наиболее адекватного представления моделируемого процесса.

Первым этапом построения нейросетевой модели является тщательный отбор входных данных, влияющих на ожидаемый результат. Из исходной информации необходимо исключить все сведения, не относящиеся к исследуемой проблеме. В то же время следует располагать достаточным количеством примеров для обучения ИНС.

Следует отметить, что нейросетевые модели, все-таки, сильно отличаются от того, что обычно понимают под математической моделью. Не зря поэтому их называют эмуляторами, они имитируют динамические характеристики объекта и не более того.

Незначительные изменения внутренней структуры нейросетевой модели, как правило, не оказывают существенного влияния на ее качество, тогда выбор глубины регрессии, т.е. числа отсчетов сигналов в предыдущие моменты времени, играет решающую роль.  

Способности нейронной сети к прогнозированию напрямую следуют из её способности к обобщению и выделению скрытых зависимостей между входными и выходными данными. После обучения сеть способна предсказать будущее значение некой последовательности на основе нескольких предыдущих значений и (или) каких-то существующих в настоящий момент факторов. Следует отметить, что прогнозирование возможно только тогда, когда предыдущие изменения действительно в какой-то степени предопределяют будущие.

Используя же даже самую простую нейросетевую архитектуру (персептрон с одним скрытым слоем) и базу данных легко получить работающую систему прогнозирования.

Отсюда следует первый недостаток такой архитектуры - когда база данных о продажах, или других величинах, которые мы прогнозируем велика, сеть станет слишком большой и будет медленно работать. С этим можно бороться предварительной кластеризацией базы данных.

Второй недостаток таких сетей особенно заметен в задачах бизнес прогнозирования - они совсем не способны "продлевать" тренд. Поэтому такие сети можно использовать только в случаях, когда рынок устойчивый, либо, после декомпозиции данных, тренд прогнозировать другими архитектурами нейронных сетей, или любыми классическими методами.

Оказывается, что после многократного предъявления примеров веса нейронной сети стабилизируются, причем нейронная сеть дает правильные ответы на все (или почти все) примеры из базы данных. В таком случае говорят, что "нейронная сеть выучила все примеры", "нейронная сеть обучена", или "нейронная сеть натренирована". В программных реализациях можно видеть, что в процессе обучения величина ошибки (сумма квадратов ошибок по всем выходам) постепенно уменьшается. Когда величина ошибки достигает нуля или приемлемого малого уровня, тренировку останавливают, а полученную нейронную сеть считают натренированной и готовой к применению на новых данных.

Важно отметить, что вся информация, которую нейронная сеть имеет о задаче, содержится в наборе примеров. Поэтому качество обучения нейронной сети напрямую зависит от количества примеров в обучающей выборке, а также от того, насколько полно эти примеры описывают данную задачу. Так, например, бессмысленно использовать нейронную сеть для предсказания финансового кризиса, если в обучающей выборке кризисов не представлено. Считается, что для полноценной тренировки нейронной сети требуется хотя бы несколько десятков (а лучше сотен) примеров.

Oбучение нейронных сетей - сложный и наукоемкий процесс. Алгоритмы обучения нейронных сетей имеют различные параметры и настройки, для управления которыми требуется понимание их влияния.

Рассмотрев все три алгоритма аппроксимации, для разработки прогнозной модели качества приборов была выбрана нейросетевая зависимость, так как расчеты основанные на нейросетях оказались наиболее точными [10].

Наши рекомендации