Модели процессов на основе метода группового учета аргумента (МГУА)
МГУА относят к методам моделирования на основе индуктивной самоорганизации моделей по экспериментальным данным [62, 63]. При этом вместо традиционного дедуктивного подхода «от общих закономерностей функционирования объекта – к конкретной математической модели» применяется индуктивный подход «от конкретных данных наблюдений – к общей модели». То есть исследователь по имеющейся выборке наблюдений выдвигает гипотезу о возможном классе моделей, описывающих данный объект, и на основе критерия выбора определяет с помощью компьютера наилучшую модель для объекта в этом классе.
МГУА можно рассматривать также как метод построения моделей по экспериментальным данным в условиях неопределенности модели. Полученные при этом модели оптимальной сложности отображают закономерности функционирования исследуемого объекта (процесса), информация о которых неявно содержится в имеющейся выборке данных. В МГУА для построения моделей применяются принципы автоматической генерации вариантов моделей, неокончательных решений и последовательной селекции лучших моделей по внешним критериям. Работа этого критерия основана на делении выборки на части так, что оценивание параметров модели и проверка качества модели выполняются по разным подвыборкам. Это деление на подвыборки позволяет лучше учесть априорную неопределенность при подборе модели.
В условиях МГУА математическая модель тренда графика электрической нагрузки может представлять собой некое уравнение регрессии, полученное на основе экспериментальных данных, например, по МНК. При этом вид уравнения регрессии (линейное или какое-либо нелинейное) выбирается исходя из чисто субъективных представлений исследователя о форме моделируемой зависимости, сложившихся под воздействием теоретических предположений, либо по виду корреляционных зависимостей.
Для автоматизации определения вида уравнения регрессии (математической модели) используют принципы теории самоорганизации или селекции, в частности, алгоритм селекции математических моделей, который зачастую и называют метод группового учета аргументов (Group Method of Data Handling (GMDH))[19, 62].
Определение вида уравнения регрессии представляет собой классическую задачу выделения тренда оптимальной сложности, и оно может осуществляться по комбинаторному алгоритму МГУА [62]. Применение этого алгоритма в случае моделирования электропотребления оправдано, так как число перебираемых моделей претендентов невелико, а полный их перебор не позволяет пропустить оптимального решения. Например, исходная частная модель принимается линейной:
,
где – выходная величина или потребляемая мощность; t – независимая переменная, для которой определяется величина корреляционного отношения.
Далее по определенному правилу осуществляется усложнение частных полиномиальных моделей, причем максимальная степень полинома может быть принята любой, но не ниже третьей:
.
Так, в последнем случае при полном переборе число сравниваемых моделей будет равно семи [19,62]:
Точки предыстории, по которым осуществляется выбор модели тренда оптимальной сложности, разбивают на обучающую и проверочную последовательности. Это разбиение целесообразно осуществлять по величине их дисперсии относительно среднего значения. При таком способе разбиения предыстории для определения коэффициентов модели используют более удаленные точки от среднего значения, а проверочную последовательность составляют из точек, имеющих меньшую дисперсию.
Для каждой частной модели определяют величину критерия селекции, в качестве которого служит критерий регулярности или остаточная ошибка на точках проверочной последовательности. Моделью тренда оптимальной сложности считают ту частную модель, для которой величина критерия селекции минимальна. Коэффициенты полученной математической модели затем следует адаптировать ко всей предыстории.
Подобранная таким образом математическая модель представляет собой искомую теоретическую регрессионную зависимость , наиболее приближенную к предельной, так как она является наилучшим описанием предыстории, на которой определялась величина теоретического корреляционного отношения.
В настоящее время МГУА в общем виде может рассматриваться как распространение индуктивных самоорганизующихся методов к решению комплексных практических задач. Эти задачи решаются МГУА путем обработки выборки данных наблюдений. Цель состоит в получении математической модели объекта (процесса) (задачи идентификации и распознавания состояния) или описании процессов, которые будут иметь место в объекте в будущем (задачи прогноза процесса). МГУА решает эти задачи, опираясь на процедуру многомерной оптимизации:
,
где G – множество рассматриваемых моделей; CR – критерий качества модели g из этого набора (критерий селекции); P - заданное число переменных модели; S – заданный порядок или сложность модели; z2 – остаточная составляющая или погрешность модели; T – заданное число отсчетов процесса необходимых для выполнения идентификации; V – заданный тип модельной функции. Для определенной модельной функции изменение числа переменных соответствует определенному типу образцовой структуры. Т.е. в этом случае критерий качества может быть упрощен и записан в виде
.
Метод основан на процедуре перебора моделей, т.е. последовательном испытании усложняемых моделей, выбираемых из набора моделирующих кандидатов в соответствии с данным критерием. Большинство МГУА алгоритмов использует полиномиальные моделирующие функции. Общая взаимосвязь при этом между входными переменными модели и выходными может быть выражена функциональным рядом Вольтерра, дискретный аналог которого – многочлен Колмогорова – Габора [62]:
где – вектор входных переменных модели МГУА; – весовые коэффициенты модели.
Элементами входного вектора X могут быть независимые переменные, функциональные формы или конечные дифференциальные слагаемые. При этом в качестве нелинейных модельных функций могут использоваться разностные, вероятностные, гармонические, логистические и другие функции. МГУА позволяет находить одновременно как структуру модели, так и непосредственно зависимость выходной величины моделируемой системы от значений наиболее сильно влияющих на нее входных сигналов системы.
Самоорганизующееся моделирование может описываться с использованием статистических обучаемых нейронных сетей с активными нейронами [63], которые являются сетями математических функций и воспроизводят сложные нелинейные зависимости в компактной форме и эффективно. Такие сети разбивают задачу на отдельные, более простые части (декомпозиция задачи), и затем, на основе автоматического применения усовершенствованных регрессионных методов, позволяют решать каждую из этих более простых задач на основе принципов самоорганизации.
Недостатки применения МГУА при моделировании графиков нагрузки:
- отсутствие четких математических алгоритмов выбора множеств моделирующих функций под имеющуюся выборку измеренных входных и выходных величин, выбор осуществляется интуитивно исследователем;
- метод не реализует концепцию многомерного моделирования графиков нагрузки, изложенную выше, что затрудняет моделирование изменчивости формы графиков нагрузки;
- получаемая модель не является оптимальной (минимальной) по сложности и порядку из-за практически спонтанного выбора множеств моделируемых функций.