Использование априорной информации
На практике неизвестный объект редко бывает "черным ящиком". В большинстве случаев имеется априорная информация о свойствах объекта, которая следует из физических, технических, технологических и других условий. Эта информация существенно сужает область поисков неизвестных параметров. Например, если заранее известно, что объект устойчив (а применительно к технологическим процессам это почти всегда так), то параметры могут лежать только в определенной области устойчивости. То же самое относится и к входным переменным. Обычно из опыта эксплуатации конкретного объекта известно, что коэффициенты усиления по входным переменным ограничены в каких-то пределах.
*****
Если используется какая-либо известная процедура идентификации, например МНК, в результате которой по экспериментальным данным о входах и выходе объекта получены оценки его параметров, то можно проверить соответствие оценок априорным ограничениям. Т.е. проверка производится после идентификации.
Принципиально другой подход учета априорных ограничений при идентификации по вероятностному критерию. Схема работы алгоритма идентификации, учитывающего априорную информацию об объекте, показана на рисунке 1. Сначала множество экспериментальных данных, полученных в пространстве входов и выходов - "Блок исходных данных", преобразуется в "Блок независимых строк". Это принципиальное преобразование, поскольку все дальнейшие процедуры, используемые алгоритмом, возможны только с независимыми строками. Затем по приведенному выше алгоритму осуществляется переход из пространства входов-выходов во множество Мр оценок параметров, хранящееся в блоке "Все возможные модели". Каждая строка этого блока содержит параметры одной модели, построенной по s-мерному блоку данных. С использованием априорной информации об области изменения параметров множество Мр преобразуетсяво множество Мр0, содержащееся в блоке "Модели, удовлетворяющие априорным условиям".
Рисунок 1Схема работы алгоритма идентификации, учитывающего априорные условия
Используя множество Мр0, можно построить плотности вероятности оценок параметров, а затем по максимуму плотности определить сами параметры. Здесь, правда, возникают вычислительные трудности, существенные даже для современных вычислительных машин. Проблема состоит в том, что для получения точных оценок по плотности вероятности, необходимо уменьшать интервалы при построении последней. А это приводит к требованию резкого увеличения числа данных. Чтобы обойти эту трудность, рассмотрим другой подход.
Множество Мр по количеству элементов, как правило, существенно больше множества Мx. Поэтому может оказаться (а на практике и оказывается), что множества Мр и Мр0 используют все элементы множества Мx, но в разных сочетаниях. Поэтому обратный переход из пространства отобранных оценок Мр0 в пространство входов и выходов, чтобы провести идентификацию на "хороших данных", не тривиален.
Такой обратный переход возможен, если учесть, что при построении множеств Мр и Мр0, используются элементы одного и того же множества Мx, но с разной вероятностью. Основная идея обратного возвращения в пространство входов и выходов состоит в том, чтобы выделить из пространства Мx только те элементы, которые с большой вероятностью использовались для построения множества Мр0. Для этого в блоке "Частота использования строк блока независимых строк" строится оценка плотности вероятности использованных строк Р (N). Затем в блоке "Блок независимых строк" оставляются только те строки, оценка вероятности которых была наибольшей. В результате получим множество Мx0, элементы которого с большой вероятностью используются для построения множества Мр0, удовлетворяющего априорным условиям.
Предложенная процедура идентификации подробно рассмотрена в приводимом ниже примере.
Пример.
А) исходные данные.
В качестве примера рассмотрим процедуру идентификации линейного динамического объекта с передаточной функцией
параметры которой и необходимо определить.
Априорная информация об объекте состоит в том, что заранее известно, что объект устойчив.
***************************
Схема измерения приведена на рисунке 2, где часть, недоступная измерению, обведена пунктиром.
Рисунок 2 Блок-схема идентифицируемого объекта (пунктиром обведена часть недоступная для измерений)
На этой схеме х - вход объекта, и - "истинный" выход, ε – помеха измерения выхода, у - измеримый выход объекта. Этой схеме соответствует система уравнений
Очевидно, между параметрами передаточной функции (2.13) и разностного уравнения (2.14) выполняются соотношения
Без потери общности можно положить а0 равным 1.
Априорная информация об устойчивости объекта накладывает определенные ограничения на параметры объекта (2.13). Характеристическое уравнение этого объекта имеет вид
По критерию Шура-Кона [16] объект устойчив, если положительны определители, составленные из коэффициентов его характеристического уравнения (2.17),
Структура объекта, заданная передаточной функцией (2.13), априорная информация об устойчивости объекта, приводящая к неравенствам (2.18) и (2.19), и экспериментальные данные, приведенные на рисунке 3, составляют набор данных для идентификации. На рисунке 3 тонкой линией показаны значения входа x, а толстой – измеренного выхода у.
Рисунок 3 График исходных данных (тонкая линия - вход x, толстая - измеримый выход у)
Б) преобразование исходных данных.
Исходные данные, содержащиеся в графике на рисунке 3, преобразуются в таблицу 1 с независимыми строками. Независимость понимается в том смысле, что выход у(п) в каждой строке зависит только от переменных, содержащихся в этой же строке, т.е. от . Это преобразование принципиально, поскольку только после него возможно отбирать из всего массива исходных данных произвольный набор строк для идентификации. В нашем примере таблица содержит 40 строк.
Таблица 1 Исходные данные
По этим данным можно построить с помощью МНК оценки параметров и, если они удовлетворяют условиям устойчивости, ограничиться этим. Для нашего примера это дает оценки
Коэффициент корреляции между фактическим выходом и прогнозом по такой модели будет равен R = 0,82.
Предлагаемая процедура позволяет получить существенно более точные оценки параметров. Перейдем к ее рассмотрению на нашем примере.
В) переход в пространство параметров.
Следующий шаг состоит в переходе в пространство параметров. Для этого из таблицы 1 выбирается 3 (по числу неизвестных параметров А, В и С) произвольных строки, по ним с помощью МНК вычисляются оценки. Эти оценки, а также номера строк из таблицы 1, которые были использованы для их получения, заносятся в специальную таблицу. Оценки строятся для всех возможных трехстрочных сочетаний из таблицы 1. Для нашего примера число таких сочетаний будет равно = 9880.
Таблица 2 представляет собой фрагмент этой громадной таблицы из 9880 строк.
Таблица 2 Все возможные оценки параметров, полученные по трехстрочным блокам таблицы исходных данных
№ | А | В | С | №1 | № 2 | №3 |
0,71 | -0,53 | 0,98 | ||||
0,72 | -0,51 | 1,01 | ||||
0,72 | -0,50 | 1,03 | ||||
0,71 | -0,52 | 0,99 | ||||
0,71 | -0,52 | 0,99 | ||||
0,76 | -0,42 | 1,19 | ||||
0,72 | -0,50 | 1,02 | ||||
0,71 | -0,53 | 0,98 | ||||
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
-0,42 | 1,19 | 0,19 | ||||
-0,49 | 1,19 | 0,33 | ||||
-0,43 | 1,26 | 0,10 | ||||
0,55 | -4,90 | 43,37 | ||||
-1,98 | 2,28 | -5,66 | ||||
-0,13 | -0,64 | 8,32 | ||||
-0,41 | 1,13 | 0,66 |
Г) учет априорных условий.
По сути, было построено 9880 моделей. Не все эти модели удовлетворяют условиям устойчивости, заданным априорно. Удалим из таблицы 2 строки, соответствующие неустойчивым моделям. Такими моделями являются модели, параметры которых не удовлетворяют критерию. В результате таблица существенно сократится, и вместо 9880 строк получим таблицу, содержащую всего 5971 строку.
Таблица 3 представляет собой фрагмент таблицы, содержащей только оценки, удовлетворяющие условиям устойчивости.
Таблица 3 Оценки, удовлетворяющие условиям устойчивости
0,710941 | -0,52593 | 0,983424 | ||||
0,717994 | -0,511 | 1,011602 | ||||
0,721906 | -0,50273 | 1,027228 | ||||
0,713484 | -0,52055 | 0,993582 | ||||
0,712483 | -0,52267 | 0,989584 | ||||
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
… | … | … | … | … | … | … |
-0,32405 | 0,579248 | 4,545635 | ||||
0,661361 | -0,48318 | 1,051092 | ||||
-0,17263 | -0,36611 | 2,416046 | ||||
-0,24644 | 0,094702 | 2,243421 | ||||
-0,8315 | 0,467141 | 3,011866 | ||||
-0,38336 | 0,949606 | 1,923161 | ||||
-0,18586 | 0,961276 | 1,574252 | ||||
-0,36346 | 0,82535 | 1,96971 | ||||
-0,25786 | 0,166017 | 1,656654 | ||||
-0,95053 | 0,655217 | 2,112974 | ||||
-0,12807 | -0,64433 | 8,32407 |
В таблице 2 для вычисления оценок все строки таблицы 1 использовались одинаковое число раз - по 741 раз каждая. В таблице 3 частота использования строк существенно неравномерна.
Выброшенные строки таблицы 2 соответствовали плохим оценкам. Вместе с плохими оценками выбрасывались и номера строк таблицы 1 исходных данных, использованных для их вычисления. Таким образом, реже используемые в таблице 3 строки исходных данных из таблицы 1 соответствуют тем данным, которые использовались для вычисления оценок не удовлетворяющим условиям устойчивости.
Таблица 4 Исходные данные, наиболее часто используемые для получения оценок, удовлетворяющих условиям устойчивости
Вычисленные по данным табл. 4 с помощью МНК оценки равны
Д) сравнение точностей
Поскольку пример модельный, то известны точные значения параметров объекта. Они равны
А = 0,7000; В = -0,5000; С = 1,0000.
Полученные с помощью предлагаемого алгоритма оценки, учитывающие априорную информациюоб устойчивости, равны
т.е. точность оценок будет равна соответственно 0,8; 0,7 и 0,6%. Оценки получены с использованием 19 строк таблицы исходных данных.
Обычный МНК, использующий все 40 строк таблицы исходных данных, но не учитывающий априорной информации об устойчивости объекта, дает оценки
что соответствует точности определения параметров объекта 24, 31 и 9%.
Алгоритм,учитывающий априорную информацию об устойчивости объекта, дает точность оценок параметров более чем на порядок выше.
Предлагаемая процедура использования априорной информации о неизвестных параметрах при идентификации объекта непосредственно в пространстве параметров позволяет повысить точность оценок. Особенно эффективно использование предлагаемой процедуры, когда помеха содержит большие, но редкие выбросы.
Пример на простоту реализации.
Условием наиболее высокой эффективности спектрально-корреляционного анализа случайных процессов является обоснованный выбор подходящего базиса разложения.
Методы спектрального анализа непрерывных (аналоговых) сигналов в базисе тригонометрических функций Фурье имеют строгую теорию и получили достаточно широкое распространение. Но несмотря на использование способов вычисления дискретных спектров с помощью алгоритмов быстрого преобразования Фурье, получение спектральных характеристик представляет собой весьма сложную задачу из-за необходимости устранения искажений (эффектов размывания энергии в боковые лепестки и наложения частот). Поэтому большой интерес представляют методы спектральной обработки сигналов в базисах кусочно-ступенчатых функций Уолша и Хаара, которые более приспособлены к цифровым преобразованиям.
В противоположность гармоническим функциям, содержащим в общем случае три параметра: амплитуду, частоту и начальную фазу, базисные функции Уолша описываются четырьмя параметрами: амплитудой А, номером функции v, интервалом задания (временной базой) Т и сдвигом t:
Для функций Хаара используется еще и номер группы m, в которую объединяют функции с одинаковой длительностью:
Наличие дополнительного параметра Т (или N = T/Δt при дискретном представлении интервала) в описании базисных функций Уолша и Хаара приводит к принципиальным отличиям от базиса Фурье.
Каждая из этих матриц может быть факторизована, и, следовательно, разложения в указанных базисах имеют алгоритм быстрого преобразования.
Быстрое преобразование Фурье
Матрица дискретного преобразования Фурье имеет вид:
где
.
Коэффициенты разложения сигнала имеют вид: .
Применяя обратное преобразование Фурье, получаем аппроксимированное представление сигнала где B(m,l)=W-lm.
Для сокращения числа операций целесообразно применять БПФ, представленный в матричной форме. Матрица преобразований имеет вид
, (1)
где In - единичная матрица размером (n ´ n), ÄAj=A1ÄA2Ä…An – кронекеровское произведение, ÄAi=A1ÄA2Ä…An – прямая сумма.
,
где , N = 2n – число отсчетов.
На основе формулы (1) для n = 4 получаем спектр:
(2)
где ; .
i = 2,4,6,8 j = 1,3,5,7
Результаты представлены FKP с двоично-инверсными номерами.
Пример представления спектра с двоично-инверсными номерами дан в таблице 1.
Таблица 1
Номер | Двоичное представление | Двоичная инверсия (считывание в обратном порядке) | Двоично-инверсный номер |
0 0 | 0 0 | ||
0 1 | 1 0 | ||
1 0 | 0 1 | ||
1 1 | 1 1 |
4.2. Быстрое преобразование Уолша
Функции Уолша обладают интересными свойствами, привлекающими к ним все большее внимание. Они принимают всего два значения {+1 или -1} и потому удобны для вычислений на ЭВМ. Существует различное упорядочение функций Уолша .Рассмотрим одну из возможных систем функций Уолша – систему Уолша-Адамара. Элементарная матрица Адамара, состоящая из одного элемента (N=1), имеет вид H1=[1]. Для N=2 элементами матрицы Адамара будут элементарные матрицы ( H1): . Для N = 4 элементами матрицы Адамара будут матрицы ( H2):
.
Для N=2n имеем .
Дискретное преобразование Уолша, как и дискретное преобразование Фурье, представляется в матричной форме:
FY=HN*S/N; S= (HN)T*FY.
Здесь FY-коэффициенты спектрального разложения по функциям Уолша, S-дискретные временные отсчеты сигнала.
Быстрое преобразование Уолша (БПУ) можно получить из формулы для БПФ (10),исключив фазосдвигающие составляющие.
Матрица преобразований упрощается и имеет вид:
.
Коэффициенты спектрального разложения по функциям Уолша имеют прямую последовательность в отличие от БПФ, имеющей последовательность с двоично-инверсными номерами.
4.3. Быстрое преобразование Хаара
Преобразование Хаара основывается на использовании ортогональной матрицы Хаара. Приведем пример матрицы Хаара четвертого порядка: и матрицы Хаара восьмого порядка:
-1 | -1 | -1 | -1 | |||||||
21/2 | 21/2 | -21/2 | -21/2 | 0 | 0 | 0 | 0 | |||
21/2 | 21/2 | -21/2 | -21/2 | |||||||
-2 | ||||||||||
-2 | ||||||||||
-2 | ||||||||||
-2 | ||||||||||
Для записи алгоритма БПХ введем следующие обозначения матриц:
U02=[1 1]; U12=[1 -1];
I2= ;
,
где Å, ∑ - знаки прямой суммы.
.
Таким образом, матрица Хаара представлена в виде произведения «n» слабо заполненных матриц.
Быстрое преобразование Хаара - самое быстрое из используемых ортогональных функций.
Дискретное преобразование Хаара, как и дискретное преобразование Фурье, представляется в матричной форме:
;
.
.
Здесь использовано правило для транспонирования произведения матриц: [M1*M2*M3]Т=[М3Т*М2Т*М1Т].
Коэффициенты спектрального разложения по функциям Хаара имеют прямую последовательность в отличие от БПФ, имеющей последовательность с двоично-инверсными номерами.
************.
И так мы рассмотрели
требования к аналитическому описанию цифровых информационных массивов:
-обеспечение заданной точности описания возможно более простым аналитическим
выражением; простота реализации на цифровых ЭВМ;
-возможность выполнения процедур
в автоматическом режиме (по коэффициентам расчет характеристик);
-адаптивность алгоритмов аналитического описания к
особенностям каждого сигнала (изменение масштаба);
-унифицированность структуры описания независимо от
природы и особенностей сигнала (спектральный анализ);
- возможность реализации метода в условиях отсутствия
априорной информации о сигнале (метод двух измерений масштаба).
Выполнение сформулированных требований при аналитическом описании
информационных сообщений, заданных цифровыми массивами или непрерывными
кривыми, полученными в эксперименте, позволит в полной мере воспользоваться
преимуществами аналитических преобразований при решении задач обработки данных в
системах управления, навигации и распознавания образов. Учет вышесказанного
приводит к необходимости выбора подходящего метода описания и возможности
применения адаптивных процедур для достижения заданной точности наиболее простым
аналитическим выражением. Основной теоретической задачей в данном случае является
задача приближения (аппроксимации) функций, заданных числовыми массивами или
кривыми. Ее решение позволяет исследоватькачественные свойства и числовые
параметры исследуемых объектов путем аналитического описания соответствующих
характеристик и их последующего изучения.
Аналитический вывод формул в соответствии с
задачами обработки.
Ввод полученных формул в ПЗУ ЭВМ.
Создание банка
формул обработки.
Банк формул содержит:
1. Основные операции математического
анализа.
2. Получение статистических оценок
(корреляционный анализ).
3. Уравнение параметрической
идентификации и диагностики
исследуемых объектов.
4. Решение некоторых видов интегральных
уравнений.
5. Аналитическое описание одномерных,
плоских и пространственных кривых.
Принцип вейвлет-преобразования.(АОИ)
Гармонические базисные функции преобразования Фурье предельно локализованы в частотной области и не локализованы во временной (определены во всем временном интервале от -¥ до ¥). Их противоположностью являются импульсные базисные функции типа импульсов Кронекера, которые предельно локализованы во временной области и "размыты" по всему частотному диапазону.
Вейвлеты по локализации в этих двух представлениях можно рассматривать как функции, занимающие промежуточное положение между гармоническими и импульсными функциями. Они должны быть локализованными как во временной, так и в частотной области представления. Однако при проектировании таких функций мы неминуемо столкнемся с принципом неопределенности, связывающим эффективные значения длительности функций и ширины их спектра. Чем точнее мы будем осуществлять локализацию временного положения функции, тем шире будет становиться ее спектр, и наоборот, что наглядно видно на рис.
Вейвлетный базис пространства L2(R), R(-¥, ¥), целесообразно конструировать из финитных функций, принадлежащих этому же пространству, которые должны стремиться к нулю на бесконечности. Чем быстрее эти функции стремятся к нулю, тем удобнее использовать их в качестве базиса преобразования при анализе реальных сигналов. Допустим, что такой функцией является psi - функция y(t), равная нулю за пределами некоторого конечного интервала и имеющая нулевое среднее значение по интервалу задания. Последнее необходимо для задания локализации спектра вейвлета в частотной области. На основе этой функции сконструируем базис в пространстве L2(R) с помощью масштабных преобразований независимой переменной.
Функция изменения частотной независимой переменной в спектральном представлении сигналов отображается во временном представлении растяжением/сжатием сигнала. Для вейвлетного базиса это можно выполнить функцией типа y(t) => y(amt), a = const, m = 0, 1, … , M, т.е. путем линейной операции растяжения/сжатия, обеспечивающей самоподобие функции на разных масштабах представления. Однако локальность функции y(t) на временной оси требует дополнительной независимой переменной последовательных сдвигов функции y(t) вдоль оси, типа y(t) => y(t+k), для перекрытия всей числовой оси пространства R(-¥, ¥). C учетом обеих условий одновременно структура базисной функции может быть принята следующей:
y(t) => y(amt+k).
Для упрощения дальнейших выкладок значения переменных m и k примем целочисленными. При приведении функции к единичной норме, получаем:
ymk(t) = am/2 y(amt+k).
Если для семейства функций ymk(t) выполняется условие ортогональности:
áynk(t), ylm(t)ñ = ynk(t)·y*lm(t) dt =dnl·dkm,
то семейство ymk(t) можно использовать в качестве ортонормированного базиса пространства L2(R). Произвольную функцию этого пространства можно разложить в ряд по базису ymk(t):
s(t) = Smk ymk(t),
где коэффициенты Smk – проекции сигнала на новый ортогональный базис функций, как и в преобразовании Фурье, определяются скалярным произведением
Smk = ás(t), ymk(t)ñ = s(t) ymk(t) dt,
при этом ряд равномерно сходиться:
||s(t) – Smk ymk(t),|| = 0.
При выполнении этих условий базисная функция преобразования y(t) называется ортогональным вейвлетом.
Модификация.
Пусть задан ортонормированный вейвлет-базис . Тогда любая функция полностью характеризуется ее вейвлет коэффициентами
, (1)
(2)
и может быть восстановлена по формуле
. (3)
Пример реального наблюдаемого сигнала из работы