Модель многомерной (векторной) регрессии
Многомерный процесс РDj может представляться моделью многомерной (векторной) авторегрессии (векторная AR-модель) [1, 15, 32, 67]:
, (3.28)
где – n-мерные векторы реализации процесса для момента времени ; g – порядок векторной авторегрессии; – квадратная матрица коэффициентов авторегрессии размером n на n; – n-мерный центрированный случайный вектор погрешности (“белый шум”):
;
Для учета воздействия внешних факторов на координаты n-мерного вектора в модели (3.28) вводят дополнительно регрессионные составляющие (векторная ARX-модель) [1, 4, 14, 15]:
, (3.29)
где – матрица коэффициентов регрессии размером n на l ; – l-мерный вектор значений внешних влияющих факторов в(j-i) момент времени; q – порядок векторной регрессии.
Выражение (3.29) можно записать в блочно-матричном виде и затем упростить его запись:
. (3.30)
Выбор метода оценки блочной матрицы параметров модели (3.30) (метода идентификации) в значительной мере определяется имеющейся априорной информацией о моделируемом процессе работы радиоэлектронной системы и влияющих на него факторов. В настоящее время наиболее широко используются следующие методы оценки параметров модели многомерной регрессии [5, 9, 14, 15]:
- метод байесовских оценок параметров, который применяется, когда априори известно многомерное вероятностное описание и в виде априорного распределения вероятностей , семейства условных распределений ;
- метод максимального правдоподобия, который используется, если отсутствует информация о плотности вероятностей , а априори известна лишь условная плотность ;
- метод наименьших квадратов, который не требует никакой дополнительной априорной информации о процессе, кроме непосредственно выборок реализаций самого процесса и влияющих факторов.
Сущность метода байесовских оценок определяется формулой [9, 14, 15]:
,
где – безусловная плотность распределения вероятностей наблюдений . Таким образом, вычисляют апостериорную многомерную плотность условного распределения вероятностей параметров относительно результатов наблюдения процесса . Далее определяют наиболее вероятные значения параметров , например, по формуле
,
которые и рассматривают как найденные параметры модели. По мере прихода новой информации уточняются априорные плотности вероятности и, следовательно, уточняются параметры модели.
Байесовский подход используют при прогнозировании тридцатиминутной заявленной мощности предприятий [7]. Он позволяет учесть как результат прогнозирования, получаемый с помощью современных математических методов, так и субъективную информацию специалиста, определяющую «степень веры» в полученный результат относительно параметров модели . Большая уверенность в величине ведет к выбору распределения с меньшей дисперсией, иначе – с большей.
В методе максимального правдоподобия неизвестную величину заменяют постоянной величиной, тем самым, считая, что любое значение параметров равновероятное. В результате формулы метода Байеса преобразуются к виду [9, 14, 15]:
.
Таким образом, для отыскания наилучшей оценки параметров модели максимизируется условная плотность вероятностей , что равнозначно минимизации в силу монотонности логарифмической функции критерия качества
.
Оптимальная оценка при этом определяется как решение уравнения
.
Логарифм от апостериорной плотности вероятностей называют функцией правдоподобия, а последнее уравнение называют уравнением правдоподобия.
Основным недостатком методов байесовских оценок и максимального правдоподобия является необходимость получения и использования сложных условных многомерных плотностей вероятности , которые трудно получить и сложно использовать. Эти подходы используют в случае одномерных моделей, типа временных рядов, когда плотности вероятностей преобразуются в одномерные и набор оцениваемых параметров модели преобразуется из матрицы в вектор.
Метод наименьших квадратов не требует априорной информации о плотностях распределения параметров и моделируемого процесса , а определение параметров модели осуществляется на основе минимизации критерия качества
,
где M[…] – знак среднего значения (математического ожидания) по переменной j; – евклидова норма вектора; – разность действительного и прогнозного значения процесса, полученного с помощью модели.
В векторной форме рассмотренный критерий качества записывают как положительно определенную квадратичную форму:
,
где – положительно определенная весовая матрица, зачастую в качестве используют матрицу , где – корреляционная матрица помехи .
Можно показать [1, 9], что минимум критерия обеспечивается, когда параметры определяются выражением
. (3.31)
Если при этом , то оценку параметров называют марковской [9, 15].
Модель векторной регрессии в полной мере реализует концепцию многомерного моделирования электропотребления. В общем случае моделирование многомерных процессов электропотребления осуществляют так [1, 12]: выделяют многомерную детерминированную изменяющуюся составляющую (тренд) РSj и многомерный ряд случайных остатков РDj из общего многомерного процесса Pj. Многомерный ряд случайных остатков РDj моделируют с использованием методов многомерной векторной регрессии [12, 15, 32]. Однако следует отметить особенности, сильно затрудняющие использование векторной регрессии.
Рассмотренный метод (3.31) определения параметров модели (3.29), (3.30) на основе МНК в общем случае подразумевает решение следующих вопросов: оценка порядков регрессионной g и авторегрессионной q частей модели (3.29), используя предысторию изменения процесса; оценка параметров модели и как элементов матриц Аi, Bi или φ. Порядки модели g и q определяются, например, путем последовательных испытаний моделей с возрастающим порядком [1, 15, 64], при этом на каждом испытании определяются соответствующие матрицы коэффициентов Аi и Bi. Оценивание же параметров модели Аi и Bi связано, как правило, с решением плохо обусловленных систем линейных уравнений, что требует специальных процедур идентификации и ведет к значительному усложнению расчетов [1, 15], применение классических процедур идентификации [26] при этом затруднено. Последнее обстоятельство зачастую связано с мультиколлинеарностью исходных данных, используемых при построении модели векторной регрессии.
При идентификации авторегрессионной составляющей модели необходимо выполнение условия стационарности описываемого многомерного процесса , что не всегда возможно достичь. Использование конечных разностей (как в ARIMA-модели) для многомерного процесса также затруднено и не исследовано.
Кроме того, при вычислении матриц коэффициентов Аi и Bi необходимо использование блочных матриц достаточно больших размеров, что в свою очередь также сказывается на времени идентификации и ведет к увеличению ошибок округления, а следовательно, и ошибки идентификации [1, 80].